Medlem : Innlogging |Registrering |Last opp kunnskap
Søk
Unicode
1.Opprinnelse og utvikling
1.1.Historie
1.2.Arkitektur og terminologi
1.2.1.Kodeplaner og blokker
1.2.2.Generelt Kategori eiendom
1.2.3.Abstrakte tegn
1.3.Unicode Consortium
1.4.versjoner
1.5.Skript dekket
2.Kartlegging og koding
2.1.Unicode Transformation Format og Universal Coded Character Set
2.2.Ferdige versus kompositte tegn
2.3.Ligaturer
2.4.Standardiserte delsett
3.Adopsjon
3.1.Operativsystemer
3.2.Inngangsmetoder
3.3.e-post
3.4.web
3.5.fonter
3.6.linjeskift
4.Problemer
4.1.Filosofisk og fullstendighetskritikk
4.2.Mapping til eldre tegnsett [Modifisering ]
Unicode ble utformet for å gi kode-punkt-for-kod-punkt-rundreformatkonvertering til og fra eventuelle eksisterende tegnkodinger, slik at tekstfiler i eldre tegnsett kan konverteres til Unicode og deretter tilbake og få tilbake samme fil, uten å bruke kontekstavhengig tolkning. Det har betydd at inkonsekvent arvarkitekturer, for eksempel å kombinere diakritiske og forkomponerte tegn, begge eksisterer i Unicode, og gir mer enn én metode for å representere litt tekst. Dette er mest uttalt i de tre forskjellige kodingsformene for koreansk Hangul. Siden versjon 3.0 kan ikke alle forhåndsdefinerte tegn som kan representeres av en kombinere sekvens av eksisterende tegn, ikke lenger legges til standarden for å bevare interoperabilitet mellom programvare ved hjelp av forskjellige versjoner av Unicode.Injeksjonsmappings må oppgis mellom tegn i eksisterende eldre tegnsett og tegn i Unicode for å lette konvertering til Unicode og tillate interoperabilitet med eldre programvare. Mangel på konsistens i ulike mappings mellom tidligere japanske kodinger, som Shift-JIS eller EUC-JP og Unicode, førte til omformingsmatcher for omformet formatkonverter, spesielt kartlegging av karakteren JIS X 0208 '~' (1-33, WAVE DASH) , mye brukt i eldre database data, til enten U FF5E ~ FULLWIDTH TILDE (i Microsoft Windows) eller U 301C ~ WAVE DASH (andre leverandører).Noen japanske dataprogrammerere protesterte mot Unicode fordi det krever at de separerer bruken av U 005C \ REVERSE SOLIDUS (backslash) og U 00A5 ¥ YEN SIGN, som ble kartlagt til 0x5C i JIS X 0201, og det finnes mye arvskode med dette bruk. (Denne kodingen erstatter også tilde '~' 0x7E med makron '¯', nå 0xAF.) Separasjonen av disse tegnene finnes i ISO 8859-1, fra lenge før Unicode.
4.3.Indikate skript
4.4.Kombinerer tegn
4.5.anomalies
[Last opp Mer Innhold ]


Copyright @2018 Lxjkh