Član : Prijavite se |Registrirajte se |Upload znanja
Tražiti
Unicode [Izmijeniti ]
Unicode je računarski industrijski standard za dosljedno kodiranje, zastupljenost i rukovanje tekstom izraženim u većini svjetskih pisanih sistema. Najnovija verzija sadrži repertoar od 136.755 karaktera koji pokrivaju 139 modernih i istorijskih scenarija, kao i više skupova simbola. Unicode Standard se održava zajedno sa ISO / IEC 10646, i oboje su identični za kod-za-kod.Unicode Standard se sastoji od skupa grafičkih šifara za vizuelnu referencu, metoda kodiranja i skupa standardnih kodova karaktera, skup referentnih datoteka sa podacima i više srodnih stavki, kao što su karakteristike karaktera, pravila za normalizaciju, raspadanje, sravnjenje , rendering i dvosmerni redosled prikaza (za ispravno prikazivanje teksta koji sadrže skripte od desne na lijevo, kao što su arapski i hebrejski i skripti odozdo-desno). Od juna 2017, najnovija verzija je Unicode 10.0. Standard održava Unicode Consortium.Uspješnost Unicode na ujedinjenjima skupova znakova dovela je do njegove široko rasprostranjene i dominantne upotrebe u internacionalizaciji i lokalizaciji računarskog softvera. Standard je implementiran u mnogim najnovijim tehnologijama, uključujući moderne operativne sisteme, XML, Java (i druge programske jezike) i NET Framework.Unicode se može implementirati različitim kodovima karaktera. Unicode standard definiše UTF-8, UTF-16 i UTF-32, a nekoliko drugih kodova je u upotrebi. Najčešće korišćena enkodiranja su UTF-8, UTF-16 i UCS-2, prekursor UTF-16.UTF-8, koji uglavnom koriste web stranice (preko 90%), koristi jedan bajt za prvih 128 kodnih tačaka i do 4 bajta za druge znakove. Prvih 128 Unicode kodnih tačaka su ASCII znaci; tako da je ASCII tekst UTF-8 tekst.UCS-2 jednostavno koristi dva bita (16 bita) za svaki karakter, ali može kodirati samo prvih 65.536 kodnih tačaka, tzv. Basic Multilingual Plane (BMP). Sa 1114,112 kodnih tačaka na 17 aviona koje su moguće i sa preko 120,000 definisanih kodnih tačaka, mnogi Unicode karakteri su van dometa UCS-2. Dakle, UCS-2 je zastareo, iako se i dalje koristi u softveru. UTF-16 proširuje UCS-2, koristeći iste 16-bitne kodiranje kao UCS-2 za Basic višejezičnu ploču, i 4-bajtno kodiranje za druge avione. Sve dok ne sadrži tačke kodova u rezerviranom opsegu U 0D800-U 0DFFF, tekst UCS-2 je važeći UTF-16 tekst.UTF-32 (takođe nazvan UCS-4) koristi četiri bajta za svaki karakter. Kao i UCS-2, broj bajtova po karakteru je fiksiran, olakšavajući indeksiranje znakova; ali za razliku od UCS-2, UTF-32 može da kodira sve Unicode kôdne tačke. Međutim, pošto svaki karakter koristi četiri bajta, UTF-32 zauzima značajno više prostora od drugih enkodiranja i nije široko korišten..
[Univerzalni kodirani skup znakova]
1.Poreklo i razvoj
1.1.istorija
1.2.Arhitektura i terminologija
1.2.1.Planovi i blokovi kodne točke
1.2.2.Opšta kategorija nekretnine
1.2.3.Sažetak karaktera
1.3.Unicode Consortium
1.4.Verzije
1.5.Skripte pokrivene
2.Mapiranje i kodiranje
2.1.Format Unicode Transformation i univerzalni kodirani karakterski znak
2.2.Gotovim nasuprot kompozitnim likovima
2.3.Ligature
2.4.Standardizovani podskupovi
3.Usvajanje
3.1.Operativni sistemi
3.2.Metode unosa
3.3.Email
3.4.Web
3.5.Fontovi
3.6.Newlines
4.Problemi
4.1.Filozofska i potpunost kritika
4.2.Mapiranje sa setovima znakova za stare
4.3.Indijske skripte
4.4.Kombinovanje znakova
4.5.Anomalije
[Upload Više Sadržaj ]


Autorsko pravo @2018 Lxjkh