ComputerSa impormasyon nga teknolohiya

Encode "Unicode": kinaiya coding nga sumbanan

Ang matag Internet user sa usa ka pagsulay sa sa sa sa sa usa o sa uban nga mga sa function sa labing menos makausa nakita sa screen nga gisulat sa Latin nga mga sulat sa pulong nga "Unicode." Unsa kini, kamo makakat-on pinaagi sa pagbasa niini nga artikulo.

kahulugan

Encode "Unicode" - kinaiya pag-encode nga sumbanan. Kini gisugyot sa Unicode Inc. non-profit nga organisasyon sa 1991. Ang sumbanan mao ang gidisenyo aron sa pagdala sa tingub sa mga kinadak-ang posible nga gidaghanon sa mga lain-laing mga matang sa mga karakter diha sa usa ka dokumento. Page, diin gitukod sa ibabaw sa basehan niini, mahimo naglakip sa mga sulat ug mga karakter gikan sa lain-laing mga pinulongan (gikan sa Russian nga ngadto sa Korean) ug sa matematika mga ilhanan. Sa kini nga kaso, ang tanan nga mga karakter diha sa kinaiya set nga gipakita nga walay bisan unsa nga mga problema.

Ang mga hinungdan alang sa paglalang sa

Sa higayon nga sa ibabaw sa usa ka panahon, sa wala pa ang dagway sa usa ka sistema "Unicode" encode ang pinili nga base sa gusto sa mga tagsulat sa dokumento. Tungod niini, sa kanunay sa pagbasa sa usa ka dokumento, kini mao ang gikinahanglan nga sa paggamit sa lain-laing mga lamesa. Usahay kini mao ang gikinahanglan aron sa pagbuhat sa pipila ka mga higayon, nga sa hilabihan gayud makapalisod sa kinabuhi sa mga average user. Sama sa nahisgotan na, ang solusyon sa problema niini sa 1991 gidapit sa Unicode Inc. usa ka non-profit nga organisasyon aron sa paghalad sa usa ka bag-o nga matang sa kinaiya pag-encode. Kini gidisenyo sa combine karaan ug usa ka matang sa mga sumbanan. "Unicode" - usa ka pag-encode nga ozvolila makab-ot ang unthinkable sa panahon: sa paghimo sa usa ka himan nga nagsuporta sa usa ka dako nga gidaghanon sa mga karakter. Ang resulta milabaw sa daghan nga mga gilauman - may mga dokumento nga dungan nga naglangkob sa duha Iningles ug Ruso nga teksto, Latin, ug sa matematika nga mga ekspresyon.

Apan sa paglalang sa usa ka hiniusa nga coding nag-una sa panginahanglan sa pagsulbad sa usa ka gidaghanon sa mga problema nga mitungha tungod sa dako nga matang sa mga sukdanan sa anaa na nga niadtong panahona. Ang labing komon nga kanila:

  • Elvish sinulat, o "kapuslanan";
  • ang mga limitasyon sa kinaiya set;
  • problema pagbag-o sa codings;
  • duplication bunyaganan.

Gamay nga kasaysayan excursus

Hunahunaa nga ang nataran ika-80 nga. Computer hardware dili kaayo komon ug adunay usa ka matang sa lain-laing gikan sa karon. Samtang ang matag OS mao ang talagsaon ug inulay piho nga mga panginahanglan sa matag enthusiast ni. Gikinahanglan alang sa pagbinayloay sa impormasyon nga nakabig ngadto sa usa ka dugang nga rework sa tanang butang. Naningkamot sa pagbasa sa usa ka dokumento nga gibuhat sa laing operating system, nga sagad pagpakita sa usa ka lain nga mga hugpong sa mga karakter, ug ang duwa magsugod uban sa pag-encode. Kini dili sa kanunay sa pagbuhat niini sa madali, ug usahay gikinahanglan nga dokumento Dili sa pag-abli sa unom ka bulan, ug bisan sa ulahi. Ang mga tawo nga sa kanunay magbinayloay impormasyon, sa paghimo sa alang sa ilang kaugalingon sa usa ka lamesa pagkakabig. Ug unya pagtrabaho sa kanila nagpadayag sa usa ka makapaikag nga mga detalye: ang panginahanglan sa paghimo kanila sa duha ka mga direksyon, "gikan sa akong sa imong" ngadto ug nganhi. Himoa Banal inversion Computing machine dili makahimo, kay kini diha sa tuo nga kolum sa tinubdan, ug sa wala - ang resulta, apan dili vice versa. Kon ikaw makakita sa panginahanglan sa paggamit sa bisan unsa nga espesyal nga mga karakter diha sa dokumento, sila nga dugang pa una, ug unya sa lain, ug sa pagpasabut sa mga partner kon unsay iyang kinahanglan nga buhaton niini nga mga karakter wala mahimong usa ka "kapuslanan." Ug himoa nga dili kalimtan nga sa matag-encode nga sa pag-ugmad o pagpatuman sa ilang kaugalingong mga tulonghaan, nga nagpaingon ngadto sa paglalang sa usa ka dako nga gidaghanon sa mga doble sa OS.

Hunahunaa sa dugang nga ang mga tulonghaan sa pahina, imong tan-awa ang 10 ka book nga managsamang Times New Roman uban sa usa ka gamay nga mubo nga sulat: kay UTF-8, UTF-16, ANSI, UCS-2. Karon kamo makasabut nga ang pagpalambo sa universal nga mga sukdanan mao ang gikinahanglan?

"Ang founding mga amahan sa mga tiglalang sa"

Ang sinugdanan sa mga binuhat sa Unicode nga makita diha sa 1987 sa diha nga Joe Becker gikan sa Xerox, uban sa Lee Collins ug Mark Davis gikan sa Apple nagsugod research sa kapatagan sa praktikal nga paglalang sa usa ka universal set kinaiya. Sa Agosto 1988, Dzho Bekker gipatik sa usa ka draft proposal alang sa paglalang sa 16-gamay nga multi-lingual internasyonal nga coding system.

Pipila ka bulan sa ulahi Unicode nagtrabaho grupo gipalapdan nga naglakip Ken nanaghoy ug Mike Kernegana gikan sa RLG, Glenn Rayt sa Sun Microsystems ug sa pipila sa ubang mga espesyalista, makaabag sa pagkompleto sa buhat ibabaw sa mga preliminary pagtukod sa usa ka komon nga coding nga sumbanan.

kinatibuk-ang paghulagway

Ang Unicode base sa konsepto sa simbolo. Ubos kahulugan niini nga nagtumong sa usa ka abstract panghitabo nga anaa sa usa ka partikular nga matang sa pagsulat ug nakaamgo pinaagi sa usa ka grapemo (sa ilang mga "portraits"). Ang matag kinaiya nga gihatag diha sa "Unicode" talagsaon nga code nga iya sa usa ka partikular nga sumbanan yunit. Eg grapemo B mao usab sa Iningles ug Ruso alpabeto, apan kini katumbas sa Unicode 2 lain-laing mga karakter. Sila mao ang mga subject sa pagkakabig sa lowercase, t. E., matag usa sa nga naghulagway sa mga yawe database, usa ka hugpong sa mga kabtangan ug sa bug-os nga ngalan.

Kaayohan sa Unicode

Gikan sa ubang mga katalirongan encode "Unicode" Adunay usa ka dakong stock sa mga ilhanan alang sa "encryption" karakter. Ang kamatuoran nga ang iyang mga gisundan may 8 mga tipik, nga gisuportahan sa 28 karakter, apan ang bag-ong disenyo na 216 karakter, nga mao ang usa ka higante nga lakang sa unahan. Kini nagtugot encode hapit sa tanan nga mga kasamtangan ug komon nga alpabeto.

Uban sa anhi sa "Unicode" dili na kinahanglan sa paggamit sa usa ka lamesa pagkakabig: ingon sa usa ka sumbanan nga kini lang nga napapas sa panginahanglan alang kanila. Sa susama, sila nangalusno ngadto sa kalimot, ug "kapuslanan" - sa usa ka sumbanan nagbuhat kanila nga imposible, ingon man usab sa pagmando sa gawas sa panginahanglan sa paghimo sa duplicate tulonghaan.

pagpalambo sa Unicode

Siyempre, pag-uswag mao ang dili sa dapit, ug sukad sa unang presentasyon miagi sa 25 ka tuig. Apan, charset "Unicode" katig-a nagabantay posisyon niini sa kalibutan. Sa daghang mga paagi kini nga nahimong posible pasalamat ngadto sa kamatuoran nga kini nahimong sayon sa pag-implementar ug mikaylap, nga giila developers sa proprietary (gibayad) ug open source software.

Kita kinahanglan nga dili motuo nga karon atong makita sa sama nga code "Unicode" ingon sa ikaupat nga bahin sa usa ka siglo ang milabay. Sa higayon nga, kini gipulihan pinaagi sa bersyon 5.h.h, ug ang gidaghanon sa mga timaan simbolo nga misaka ngadto sa 231. Sa sa posibilidad sa paggamit sa usa ka mas dako nga kilid marka midumili sa pagpadayon pa gihapon sa suporta alang sa Unicode-16 (pag-encode, diin ang maximum nga kantidad sa ilang limitado nga gidaghanon 216). Sukad sa pagsugod niini, ug sa version 2.0.0 "Ang Unicode Standard" nga misaka ang gidaghanon sa mga karakter nga kini naglakip sa hapit diha sa 2 nga mga panahon. oportunidad ug padayon nga pagtubo sa mga umaabot nga mga tuig. Kay version 4.0.0 na adunay usa ka panginahanglan aron sa pagdugang sa sumbanan sa iyang kaugalingon, ug nga gibuhat. Ingon sa usa ka resulta, "Unicode" nakakaplag sa dagway sa nga kita nasayud nga kini karon.

Unsa pa ang sa Unicode?

Dugang pa sa mga halapad nga, kanunay updated sa gidaghanon sa mga karakter, "Unicode" -Encoding teksto impormasyon mao ang lain nga mapuslanon kinaiya. Kini mao ang gitawag nga normalisasyon. Kay sa linukot nga basahon pinaagi sa bug-os nga kinaiya dokumento pinaagi sa kinaiya, ug ipuli ang imahen sa lamesa sulat, sa paggamit sa usa sa mga kasamtangan nga normalization algorithms. Unsa kini?

Inay sa usik-usik sa mga kahinguhaan sa computer sa usa ka regular check sa sa mao gihapon nga kinaiya, nga mahimong susama sa lain-laing mga alpabeto, sa paggamit sa usa ka espesyal nga algorithm. kini nagtugot kaninyo sa paghimo sa usa ka susama nga mga simbolo lain nga kolum lookup lamesa ug sa paggamit na sa kanila, dili sa ug sa ibabaw sa pag-usab sa recheck sa tanan nga mga data.

Ang maong mga algorithms mapalambo ug gipatuman upat. Ang matag pagkakabig mahitabo pinaagi sa hugot nga tino nga baruganan, lahi sa uban nga mga, mao nga sa pagtawag sa bisan unsa nga usa kanila dili mao ang labing maayo nga mahimo. Ang matag gidisenyo alang sa piho nga mga panginahanglan, napatik ug malampuson nga gigamit.

pagsabwag sumbanan

Sa 25 ka tuig sa iyang kasaysayan-encode "Unicode" akong nadawat tingali ang labing kaylap sa kalibotan. Ubos sumbanan niini nga adjust ingon nga mga programa ug web-mga panid. Ang gilapdon sa aplikasyon mahimong nagpakita nga Unicode karon gigamit sa labaw pa kay sa 60% sa mga kapanguhaan sa Internet.

Karon, kamo nasayud, sa diha nga ang "Unicode" sumbanan nagpakita. Unsa kini, kamo usab mahibalo ug makahimo sa pagpasalamat sa hingpit nga kahulugan sa sa pagmugna, gihimo pinaagi sa usa ka grupo sa mga eksperto Unicode Inc. Labaw pa kay sa 25 ka tuig na ang milabay.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ceb.birmiss.com. Theme powered by WordPress.