Liige : Kasutajanimi |Registreerimine |Laadi teadmisi
Otsing
Unicode'i [Modifikatsioon ]
Unicode on arvutite tööstuse standard järjekindlaks kodeerimiseks, esitamiseks ja teksti käsitlemiseks, mida väljendatakse enamikus maailma kirjutussüsteemides. Uusim versioon sisaldab 139755 tähemärki sisaldavat repertuaari, mis hõlmab 139 kaasaegset ja ajaloolist skripti, samuti mitut sümbolikomplekti. Unicode standardit peetakse koos ISO / IEC 10646-ga ja mõlemad on kodeeritava koodi jaoks identsed.Unicode standard koosneb visuaalsete viidete koodikaartide komplektist, kodeerimismeetodist ja standardsete märgistikoodide komplektist, võrdlusandmete failide komplektist ja mitmetest seotud elementidest, näiteks iseloomuomadustest, normaliseerimise, lagunemise ja võrdlemise eeskirjadest , renderdamine ja kahesuunaline kuvarjärjekord (õigesti vasakpoolsete skriptide, näiteks araabia ja heebrea keeles ja vasakult paremale skriptid) sisaldava teksti õigeks kuvamiseks. Alates 2017. aasta juunist on uusim versioon Unicode 10.0. Standardit haldab Unicode konsortsium.Unicode edukus ühendatud koodikettides on viinud selle laialdase ja valdava kasutamiseni arvutitarkvara rahvusvaheliseks muutmiseks ja lokaliseerimiseks. Standard on rakendatud paljude hiljutiste tehnoloogiate, sealhulgas kaasaegsete operatsioonisüsteemide, XML, Java (ja muude programmide keeles) ja NET Framework.Unicode'i saab rakendada erinevate märgiandmetega. Unicode standard määratleb UTF-8, UTF-16 ja UTF-32 ning kasutatakse mitut muud kodeeringut. Kõige sagedamini kasutatavad kodeeringud on UTF-16 prekursor UTF-8, UTF-16 ja UCS-2.UTF-8, mille veebisaidid domineerivad (üle 90%), kasutab ühe esimese baiti esimese 128 koodipunkti jaoks ja kuni 4 baiti teiste märkide jaoks. Esimesed 128 Unicode koodipunkti on ASCII tähemärgid; nii et ASCII-tekst on UTF-8 tekst.UCS-2 kasutab lihtsalt iga kahe märgi jaoks kahte baiti (16 bitti), kuid saab kodeerida ainult 65,536 koodipunkti, nn Basic Multi-Language Plane (BMP). Kõigil 1714112 koodpunktil on võimalik 17 lennukit ja siiani on määratletud üle 120 000 koodipunkti, on paljud Unicode'i märgid UCS-2 kättesaamatus kohas. Seetõttu on UCS-2 aegunud, kuigi tarkvaras on seda veel laialt kasutusel. UTF-16 laiendab UCS-2, kasutades sama 16-bitise kodeeringu kui UCS-2 põhiliste mitmekeelse lennukiga ja 4-baidist kodeeringut teiste lennukite jaoks. Kui see ei sisalda reserveeritud vahemikus U 0D800-U 0DFFF koodipunkti, on UCS-2 tekst kehtiv UTF-16 tekst.UTF-32 (mida nimetatakse ka UCS-4-le) kasutab nelja baiti iga märk. Sarnaselt UCS-2-le on fikseeritud baitide arv ühe tunnuse kohta, hõlbustades märgi indekseerimist; kuid erinevalt UCS-2-st saab UTF-32 kodeerida kõiki Unicode koodipunkte. Kuid kuna iga tähemärk kasutab nelja baiti, võtab UTF-32 palju rohkem ruumi kui teised kodeeringud ja seda ei kasutata laialdaselt..
[Universaalne kodeeritud märgikomplekt]
1.Päritolu ja areng
1.1.Ajalugu
1.2.Arhitektuur ja terminoloogia
1.2.1.Koodipunktid ja plokid
1.2.2.Üldise kategooria vara
1.2.3.Abstract tähemärgid
1.3.Unicode konsortsium
1.4.Versioonid
1.5.Skriptid on kaetud
2.Mapping ja kodeeringud
2.1.Unicode'i transformatsiooni vorm ja universaalne kodeeritud märgikomplekt
2.2.Valmistatud versus kombineeritud tähemärki
2.3.Ligatuurid
2.4.Standardiseeritud alamhulgad
3.Vastuvõtmine
3.1.Operatsioonisüsteemid
3.2.Sisestusmeetodid
3.3.E-post
3.4.võrk
3.5.Fondid
3.6.Newlines
4.Küsimused
4.1.Filosoofiline ja terviklik kriitika
4.2.Pärandmärkide komplektide kaardistamine
4.3.Indic skriptid
4.4.Tähemärkide kombineerimine
4.5.Anomaaliad
[Täiendava Rohkem Sisu ]


Autoriõigus @2018 Lxjkh