सदस्य : लॉगिन |पंजीकरण |अपलोड ज्ञान
खोज
यूनिकोड समकक्षता [संशोधन ]
यूनिकोड समतुल्य यूनिकोड वर्ण एन्कोडिंग मानक द्वारा विनिर्देश है कि कोड बिंदुओं के कुछ अनुक्रम अनिवार्य रूप से एक ही चरित्र का प्रतिनिधित्व करते हैं। यह सुविधा मानक में प्रस्तुत की गई थी ताकि पूर्ववर्ती मानक वर्ण सेट के साथ संगतता की अनुमति मिल सके, जिसमें अक्सर समान या समान वर्ण शामिल होते थे।
यूनिकोड दो ऐसे विचार, कैननिकल समकक्षता और संगतता प्रदान करता है। संहितात्मक रूप से समकक्ष रूप से परिभाषित कोड पॉइंट अनुक्रमों को मुद्रित या प्रदर्शित होने पर समान उपस्थिति और अर्थ माना जाता है। उदाहरण के लिए, यू 0303 (लैटिन लोअरकेस "एन") के बाद कोड बिंदु यू 0303 (संयोजन टिल्ड "◌") को यूनिकोड द्वारा परिभाषित किया गया है जो एकल कोड बिंदु यू 00 एफ 1 (लोअरकेस अक्षर "के बराबर समकक्ष है। "स्पेनिश वर्णमाला का)। इसलिए, उन अनुक्रमों को उसी तरीके से प्रदर्शित किया जाना चाहिए, जैसे वर्णमाला नाम या खोज जैसे अनुप्रयोगों द्वारा उसी तरह व्यवहार किया जाना चाहिए, और एक-दूसरे के लिए प्रतिस्थापित किया जा सकता है। इसी प्रकार, प्रत्येक हंगुल सिलेबल ब्लॉक जिसे एकल वर्ण के रूप में एन्कोड किया गया हो, समकक्ष रूप से एक प्रमुख संयोजन जमो के संयोजन के रूप में एन्कोड किया जा सकता है, जो एक ज्वार से जुड़ा स्वर है, और यदि उपयुक्त हो, तो पीछे की ओर जाम वाला एक जाम।
अनुक्रमों के रूप में परिभाषित अनुक्रमों को संभावित रूप से अलग-अलग उपस्थिति माना जाता है, लेकिन कुछ संदर्भों में भी यही अर्थ है। इस प्रकार, उदाहरण के लिए, कोड पॉइंट यू एफबी 00 (टाइपोग्राफिक लिगरेचर "एफएफ") को संगत होने के लिए परिभाषित किया गया है- लेकिन अनुक्रमिक रूप से अनुक्रमिक यू 0066 यू 0066 (दो लैटिन "एफ" अक्षरों) के बराबर नहीं है। कुछ अनुप्रयोगों (जैसे सॉर्टिंग और अनुक्रमण) में संगत अनुक्रमों का इलाज किया जा सकता है, लेकिन दूसरों में नहीं; और कुछ स्थितियों में एक दूसरे के लिए प्रतिस्थापित किया जा सकता है, लेकिन दूसरों में नहीं। अनुक्रमिक रूप से समकक्ष अनुक्रम भी संगत हैं, लेकिन विपरीत जरूरी नहीं है।
मानक यूनिकोड सामान्यीकरण नामक एक टेक्स्ट सामान्यीकरण प्रक्रिया को भी परिभाषित करता है, जो अक्षरों के समकक्ष अनुक्रमों को प्रतिस्थापित करता है ताकि समकक्ष किसी भी दो ग्रंथों को कोड बिंदुओं के समान अनुक्रम में घटा दिया जा सके, जिसे सामान्य पाठ का सामान्य रूप या सामान्य रूप कहा जाता है। दो समकक्ष धारणाओं में से प्रत्येक के लिए, यूनिकोड दो सामान्य रूपों को परिभाषित करता है, एक पूरी तरह से तैयार किया जाता है (जहां भी कई कोड बिंदुओं को एकल बिंदुओं द्वारा प्रतिस्थापित किया जाता है), और एक पूरी तरह से विघटित होता है (जहां एकल बिंदु एकाधिक में विभाजित होते हैं)। इन चार सामान्य रूपों में से प्रत्येक को पाठ प्रसंस्करण में उपयोग किया जा सकता है।
[चरित्र: कंप्यूटिंग][संहिता बिंदु][लैटिन वर्णमाला][Ñ][हंगुल व्यंजन और स्वर तालिकाएं][टाइपोग्राफिक लैगचर]
1.समकक्ष के स्रोत
1.1.चरित्र नकल
1.2.संयोजन और precomposed पात्रों
1.2.1.उदाहरण
1.3.टाइपोग्राफ़िकल गैर-बातचीत
1.4.टाइपोग्राफिक सम्मेलन
2.मानकीकरण
2.1.सामान्य रूप
2.2.कैननिकल ऑर्डरिंग
3.सामान्यीकरण मतभेदों के कारण त्रुटियां
[अपलोड अधिक अंतर्वस्तु ]


सर्वाधिकार @2018 Lxjkh