எண் முறைகள் | கணினி அறிவியல் - நினைவகத்தில் எழுத்துருக்களின் பிரதியீடுகள் | 11th Computer Science : Chapter 2 : Number Systems
நினைவகத்தில்
எழுத்துருக்களின் பிரதியீடுகள் (Representing Characters in Memory)
அறிமுகத்தில்
குறிப்பிட்டது போல, ஒரு கணிப்பொறிக்கு தரப்படும் தரவுகள் அனைத்தும்,
கணிப்பொறி புரிந்துகொள்ளும் எண் வடிவில் (Numerical form) இருக்க வேண்டும்.
பொதுவாக கணிப்பொறியில், 26 ஆங்கில
பெரிய எழுத்துக்கள் (Uppercase), 26 சிறிய எழுத்துக்கள் (Lowercase),
10 எண் குறிகள் (0 முதல் 9 வரை), 7 நிறுத்தற்குறிகள் மேலும் 20 முதல் 40 இதர குறியீடுகள் பயன்படுத்தப்படுகிறது. இவை
அனைத்தையும் "குறியுரு தொகுதி" (Character
Set) எனலாம். அனைத்து குறியுரு தொகுதிகளும், கணிப்பொறியில்
எண்களாக மட்டுமே குறிப்பிடப்பட வேண்டும்.
குறியுரு தொகுதியில் உள்ள
அனைத்து குறிகளுக்கும் ஒரு பொதுவான குறியீட்டு முறை (Encoding System) தேவைப்படுகிறது. எனவே பல்வேறு குறியீட்டு முறைகள் உருவாக்கப்பட்டது. அவை,
• BCD - Binary Coded
Decimal
• EBCDIC - Extended
Binary Coded Decimal Interchange Code
• ASCII - American
Standard Code for Information Interchange
• Unicode
• ISCII - Indian Standard
Code for Information
Interchange
1. Binary Coded
Decimal (BCD)
இந்த குறியீட்டு முறை
தற்போது வழக்கில் இல்லை. இந்த முறை 26 பிட் குறியீட்டு முறையாகும். அதாவது,
26 = 64 எழுத்துருக்கள் மட்டுமே இந்த முறையில் கையாள
முடியும்.
2. தகவல்
பரிமாற்றத்திற்கான அமெரிக்க தரநிலை குறியீடு முறை. American Standard Code
for Information Interchange (ASCII)
மிகவும் பிரபலமான இது, அமெரிக்க
ஐக்கிய நாட்டின் (USA) அங்கீகாரம் பெற்ற ஒரு குறியீட்டு
முறையாகும். பெரும்பாலான கணிப்பொறிகளில் இந்த
பயன்படுத்தப்படுகிறது. இந்த குறியீட்டு முறை ஆங்கில மொழி எழுத்துருக்களை மட்டுமே
கையாளும் திறன் கொண்டவை என்பதை நினைவில் கொள்க. இது 27 பிட் அளவுக்கு எழுத்துருக்களைக் கையாளும் திறன் பெற்றது. அதாவது, 27
= 128 எழுத்துருக்களை இந்த முறையில் குறியீடு செய்ய முடியும். இந்த
முறையில் ஒவ்வொரு எழுத்துருவுக்கும் ஒரு குறிப்பிட்ட எண் வழங்கப்பட்டுள்ளது
(பிற்சேர்க்கை காண்க).
ASCII-8 என்ற
புதிய பதிப்பு, 28 பிட் முறையில் 256 எழுத்துருக்களைக் கையாளும் திறன் பெற்றது. இந்த முறையில்
எழுத்துருக்களுக்கு 0 முதல் 255 வரை
குறியீட்டு எண்கள் வழங்கப்பட்டுள்ளது.
ஆங்கில பெரிய எழுத்துரு Aக்கு
நிகரான ASCII குறியீட்டு எண் 65. இதற்கு
நிகரான 7பிட் ASCIIயின் இருநிலை
மதிப்பு 1000001 ஆகும். ASCII-8ன்
இருநிலை மதிப்பு 01000001.
3. Extended Binary
Coded Decimal Interchange Code (EBCDIC)
ASCII குறியீட்டு
முறையைப் போன்றே இதுவும் 8 பிட் குறியீட்டு முறையாகும். இந்த
குறியீட்டு முறை IBM (International Business Machine) நிறுவனத்தால்
உருவாக்கப்பட்டது. அந்த நிறுவனத்தின் கணிப்பொறிகளில் தகவல் பரிமாற்றத்திற்கு இந்த
முறை பயன்படுத்தப்படுகிறது. இந்த முறையில் 256 எழுத்துருக்களைக்
கையாள முடியும். ASCII முறையில் குறியீடு செய்யப்பட்ட தரவுகளை,
இந்த முறையில் இயங்கும் கணிப்பொறிகளில்
பயன்படுத்த வேண்டுமெனில், தரவுகளின் குறியீட்டை ASCII முறையிலிருந்து
EBCDIC முறைக்கு மாற்ற வேண்டும். அதே போல, EBCDIC முறையில் குறியிடப்பட்ட தரவுகளை, ASCIIயில் இயங்கும்
கணிப்பொறிக்கு மாற்ற குறியீட்டு முறையை மாற்ற வேண்டும்.
4. தகவல்
பரிமாற்றத்திற்கான இந்திய தரநிலை குறியீடு முறை Indian Standard Code for
Information Interchange (ISCII)
இந்திய மொழிகளின் பல்வேறு
எழுத்துருக்களை மட்டும் கையாளும் நோக்கில் வடிவமைக்கப்பட்ட ஓர் முறை ISCII ஆகும்.
இதுவும் 8 பிட் குறியீட்டு முறையாகும். எனவே, இந்த முறையில் 256 எழுத்துருக்களைக் கையாள முடியும்.
இந்திய அரசின் மின்ன ணு துறையின் (Department of Electronics) 1986-88 ஆண்டுவாக்கில் இந்த முறை உருவாக்கப்பட்டு, இந்திய
தரநிர்ணயக் குழுமத்தால், (Bureau of Indian Standards - BIS) ஏற்றுக்கொள்ளப்பட்டுள்ளது. தற்போது இந்த குறியீட்டு முறை யுனிகோட்
குறியீட்டு முறையில் இணைந்துவிட்டது.
5. யுனிகோட்
(Unicode)
அனைத்து நவீன
கணிப்பொறிகள் மற்றும் தொலை தொடர்பு சாதனங்களில் பரவலாக பயன்படுத்தப்படும் ஓர்
முக்கிய குறியீட்டு முறை யுனிகோட் ஆகும். ASCII குறியீட்டு முறைக்கு பிறகு மிகப்பிரபலமான ஓர்
முறை தான் யுனிகோட் குறியீட்டு முறையாகும்.
ASCII குறியீட்டு
முறை 8பிட் அளவில், 256 எழுத்துருக்களுக்கு
மட்டுமே குறியிட முடியும். எனவே ASCII முறையில் ஆங்கிலம்
மற்றும் ஐரோப்பிய மொழிகளை மட்டுமே கையாள முடிந்தது. உலகில் உள்ள மற்ற மொழிகளைக்
கையாளும் திறன் ASCII குறியீட்டு முறைக்கு இருக்கவில்லை.
குறிப்பாக, நமது இந்திய மொழிகளான தமிழ், மலையாளம், தெலுங்கு, கன்னடம்
போன்றவற்றை ASCIIயில் கையாள முடியாத நிலை இருந்தது.
எனவே, உலகின்
அனைத்து மொழிகளுக்கும் ஒரே குறியீட்டு முறையை ஏற்படுத்தும் நோக்கில்
உருவாக்கப்பட்டது “யுனிகோட்” குறியீட்டு
முறை ஆகும். இது 16 பிட் முறையில் 65536 எழுத்துருக்களைக் கையாளும் திறன் பெற்றது. யுனிகோட் குறியீட்டு முறை,
பதினாறு நிலை எண் முறையில் குறியிடப்படுகின்றது. தமிழ், தெலுங்கு, மலையாளம் மற்றும் கன்னடத்தின் யுனிகோட்
குறியீட்டு அட்டவணை 2.6ல் கொடுக்கப்பட்டுள்ளது.
பிற்சேர்க்கை
தகவல் பரிமாற்றத்திற்கான
அமெரிக்க தரநிலை குறியீடு முறை
American Standard Code
for Information Interchange (ASCII)
(சில
குறிப்பிட்ட எழுத்துருக்கள் மட்டும்)
ஆங்கில எழுத்துக்கள் (Alphabets)