Unicode ble utformet for å gi kode-punkt-for-kod-punkt-rundreformatkonvertering til og fra eventuelle eksisterende tegnkodinger, slik at tekstfiler i eldre tegnsett kan konverteres til Unicode og deretter tilbake og få tilbake samme fil, uten å bruke kontekstavhengig tolkning. Det har betydd at inkonsekvent arvarkitekturer, for eksempel å kombinere diakritiske og forkomponerte tegn, begge eksisterer i Unicode, og gir mer enn én metode for å representere litt tekst. Dette er mest uttalt i de tre forskjellige kodingsformene for koreansk Hangul. Siden versjon 3.0 kan ikke alle forhåndsdefinerte tegn som kan representeres av en kombinere sekvens av eksisterende tegn, ikke lenger legges til standarden for å bevare interoperabilitet mellom programvare ved hjelp av forskjellige versjoner av Unicode.Injeksjonsmappings må oppgis mellom tegn i eksisterende eldre tegnsett og tegn i Unicode for å lette konvertering til Unicode og tillate interoperabilitet med eldre programvare. Mangel på konsistens i ulike mappings mellom tidligere japanske kodinger, som Shift-JIS eller EUC-JP og Unicode, førte til omformingsmatcher for omformet formatkonverter, spesielt kartlegging av karakteren JIS X 0208 '~' (1-33, WAVE DASH) , mye brukt i eldre database data, til enten U FF5E ~ FULLWIDTH TILDE (i Microsoft Windows) eller U 301C ~ WAVE DASH (andre leverandører).Noen japanske dataprogrammerere protesterte mot Unicode fordi det krever at de separerer bruken av U 005C \ REVERSE SOLIDUS (backslash) og U 00A5 ¥ YEN SIGN, som ble kartlagt til 0x5C i JIS X 0201, og det finnes mye arvskode med dette bruk. (Denne kodingen erstatter også tilde '~' 0x7E med makron '¯', nå 0xAF.) Separasjonen av disse tegnene finnes i ISO 8859-1, fra lenge før Unicode.
|