தரவு என்டர்போர்டி தரவு ஒரு சீரற்ற மூல மூலம் தயாரிக்கப்படும் சராசரி அளவு வரையறுக்கப்படுகிறது. ஒவ்வொரு தரவு மதிப்பிற்கும் தொடர்புடைய தகவல் என்ட்ரோபியின் அளவானது, மதிப்பிற்கான நிகழ்தகவு வெகுஜன செயல்பாட்டின் எதிர்மறையான லோகரிதம் ஆகும். இதனால், தரவு மூலத்தில் குறைந்த-நிகழ்தகவு மதிப்பு (அதாவது, குறைந்த நிகழ்தகவு நிகழும் நிகழ்வை ஏற்படுத்தும் போது) கொண்டிருக்கும் போது, மூல தரவின் உயர்-நிகழ்தகவு மதிப்பைக் கொண்டிருக்கும் போது நிகழ்வு "தகவல்" ("ஆச்சரியம்") கொண்டிருக்கிறது. இந்த வழியில் வரையறுக்கப்பட்ட ஒவ்வொரு நிகழ்வின் தகவல்களின் அளவானது, எதிர்பார்த்த மதிப்பை தகவல் என்ட்ரோபி என்ற ஒரு சீரற்ற மாறியாக மாறும். பொதுவாக, என்ட்ரோபி என்பது சீர்குலைவு அல்லது நிச்சயமற்ற தன்மையைக் குறிக்கிறது, மேலும் தகவல் கோட்பாட்டில் பயன்படுத்தப்படும் என்ட்ரோபியின் வரையறை புள்ளிவிவர வெப்பமானியலில் பயன்படுத்தப்படும் வரையறைக்கு ஒத்ததாக இருக்கிறது. தகவல் கையொப்பம் என்ற கருத்தாக்கத்தை 1948 ஆம் ஆண்டில் "A Mathematical Theory of Communication" என்ற தனது கட்டுரையில் க்ளூட் ஷானன் அறிமுகப்படுத்தினார். தகவல் தொடர்புக் கோட்பாட்டின் ஒரு பகுதியை அடிப்படையாகக் கொண்ட ஷானன் வெளிப்படுத்தியுள்ளபடி, தரவுத் தகவல்தொடர்பு முறையின் அடிப்படை மாதிரி மூன்று கூறுகள், ஒரு தரவுத் தரவு, ஒரு சேனல் மற்றும் ஒரு ரிசீவர் ஆகியவற்றைக் கொண்டுள்ளது. தகவல்தொடர்பு "என்பது, ஆதாரத்தால் உருவாக்கப்பட்ட தரவு என்னவென்றால், அது சேனலின் மூலம் பெறப்படும் சமிக்ஞை அடிப்படையிலானது. ஒரு மூலத்தால் தயாரிக்கப்படும் தரவின் இழப்பற்ற சுருக்க குறியீட்டு முறையின் குறுகிய சாத்தியமான சராசரியின் நீளத்தின் மீது என்ட்ரோபி ஒரு முழுமையான வரம்பை வழங்குகிறது, மற்றும் மூலத்தின் என்ட்ரோபி என்பது சேனலின் சேனலின் திறனைக் காட்டிலும் குறைவாக இருந்தால், ஆதாரத்தால் உருவாக்கப்பட்ட தரவு நம்பகத் தன்மை பெறுபவருக்கு (குறைந்தபட்சம் கோட்பாட்டின்படி, தகவல்கள் மற்றும் தகவல் பரிமாற்றத்திற்கு எடுத்துக் கொள்ள வேண்டிய நேரத்தின் அளவை வழங்குவதற்கு தேவையான அமைப்பின் சிக்கல் போன்ற சில நடைமுறை பரிசீலனைகளை புறக்கணிக்கலாம்). தகவல் என்ட்ரோபி பொதுவாக பிட்கள் ("shannons" அல்லது "shannons" என்று அழைக்கப்படுகிறது) அல்லது சில நேரங்களில் "இயற்கை அலகுகள்" (nats) அல்லது தசம இலக்கங்கள் ("dits", "bans", அல்லது "hartleys") என்று அளவிடப்படுகிறது. அளவீட்டின் அலகு என்ட்ரோபினை வரையறுக்கப் பயன்படும் மடக்கையை அடிப்படையாகக் கொண்டது. நிகழ்தகவு பரவலுக்கான மடக்கை எண்டொரோபியின் ஒரு அளவாக பயன்படுகிறது, ஏனெனில் அது சுயாதீனமான ஆதாரங்களுக்கான சேர்க்கை ஆகும். உதாரணமாக, ஒரு நியாயமான நாணயத்தின் டாபஸின் என்ட்ரோபி 1 பிட் ஆகும், மேலும் எம் டாசஸின் என்ட்ரோபி m பிட்கள் ஆகும். ஒரு நேர்மறையான பிரதிநிதித்துவத்தில், n 2 என்பது ஒரு சக்தியாக இருந்தால், n மதிப்பில் ஒன்றை எடுத்துக் கொள்ளக்கூடிய ஒரு மாறினைக் குறிக்க log2 (n) பிட்கள் தேவைப்படுகிறது. இந்த மதிப்புகள் சமமாக சாத்தியமானால், எண்ட்ரோபி (பிட்களில்) இந்த எண்ணிற்கு சமமாக இருக்கும். மதிப்புகள் ஒன்றில் மற்றவர்களை விட அதிகமாக நிகழக்கூடியதாக இருப்பின், இந்த மதிப்பு ஏற்படக்கூடிய ஒரு கவனிப்பு சில குறைவான பொதுவான விளைவு ஏற்பட்டிருந்தால் விட குறைவாக தகவல் கொடுக்கும். எதிர்மறையாக, அரிதாக நிகழ்வுகள் அதிகமான தகவல்களைக் கொண்டிருக்கும். குறைவான நிகழ்தகவு நிகழ்வுகள் மிகவும் அரிதாகவே நிகழும் என்பதால், நிகர விளைவு என்னவென்றால், ஒரே சமமாக விநியோகிக்கப்படாத தரவுகளால் பெறப்பட்ட என்ட்ரோபி (சராசரியான தகவலுக்கான சிந்தனை) எப்பொழுதும் log2 (n) க்கு சமமாகவோ அல்லது சமமாகவோ இருக்கும். ஒரு விளைவு நிச்சயம் ஏற்படும் போது என்ட்ரோபி பூஜ்ஜியமாகும். ஆதாரத் தரவின் ஒரு நிகழ்தகவு விநியோகம் அறியப்பட்டால், என்ட்ரோபி இந்த கருத்தாய்வுகளை அளவிடுகின்றது. அனுசரிக்கப்படும் நிகழ்வுகளின் பொருள் (செய்திகளின் பொருள்) எண்டிரோபியின் வரையறைக்கு பொருந்தாது. ஒரு குறிப்பிட்ட நிகழ்வைக் கவனிப்பதற்கான நிகழ்தகவை மட்டுமே என்ட்ரோபி கணக்கில் எடுத்துக்கொள்கிறது, எனவே அது மறைந்திருக்கும் தகவல்களின் அடிப்படையான நிகழ்தகவு விநியோகம் பற்றிய தகவல் அல்ல, நிகழ்வுகளின் பொருள் அல்ல. [கிளாட் ஷானன்][தரவு சுருக்கம்] |