วันศุกร์ที่ 11 เมษายน พ.ศ. 2557

รหัสแทนข้อมูลในคอมพิวเตอร์ (Computer's Code)


เลข 0 และ ในระบบฐานสองแต่ละตัว เรียกว่าบิต (bit) ย่อมาจากคำว่า Binary Digit บิตเป็นหน่วยเล็กที่สุดในการเก็บข้อมูลด้วยคอมพิวเตอร์ แต่เนื่องจากบิตเดียวไม่สามารถเก็บข้อมูลตัวเลข ตัวอักษร และสัญลักษณ์พิเศษต่าง ๆ ได้ครบ ดังนั้นจึงต้องรวมบิตหลายบิตเข้าเป็นกลุ่มเรียกว่าไบต์ (byte) แต่ละไบต์จะแทนอักขระหนึ่งตัว โดยปกติแล้วใช้แปดบิตรวมกันเป็นหนึ่งไบต์ ในการผลิตเครื่องคอมพิวเตอร์จะต้องคำนึงถึงรหัสที่ใช้แทนข้อมูล ความจุของหน่วยความจำและความจุของที่เก็บข้อมูลสำรองในคอมพิวเตอร์ ซึ่งหน่วยของความจุที่เก็บข้อมูลจะมีหน่วยเป็นหน่วยของไบต์ และหากมีความจุสูงก็อาจใช้หน่วยความจุเป็นกิโลไบต์ (Kilobyte) โดยหนึ่งกิโลไบต์มีค่าเป็น 1,024 ไบต์ ใช้สัญลักษณ์ KB หรือ K แทน (บางครั้งอาจใช้ค่าประมาณ 1 กิโลไบต์ ประมาณ 1,000 ไบต์) ดังนั้นถ้าหน่วยความจำขนาด 640 กิโลไบต์ จะเก็บข้อมูลได้ 640 x 1,024 หรือ 655,360 ไบต์ นอกจากนี้ยังมีหน่วยความจุเป็นเมกะไบต์ (Megabyte)ซึ่งมีค่าเป็น 1,024 x1,024 หรือ 1,048,576 ไบต์ ใช้สัญลักษณ์ MB หรือ M แทน (บางครั้งอาจใช้ค่าประมาณ 1 เมกะไบต์ ประมาณ 1,000,000 ไบต์ หรือหนึ่งล้านไบต์)

ชนิดของรหัสแทนข้อมูล
ระบบจำนวนที่ใช้ในทางคอมพิวเตอร์ ประกอบด้วย
ระบบเลขฐานสอง (Binary Number System) ประกอบด้วยตัวเลข 0 และ 1
ระบบเลขฐานแปด (Octal Number System) ประกอบด้วยตัวเลข 0 – 7
ระบบเลขฐานสิบ (Decimal Number System) ประกอบด้วยตัวเลข 0 – 9
ระบบเลขฐานสิบหก (Hexadecimal Number System) ประกอบด้วยตัว เลข 0-9 และ A – F

ในทางทฤษฎีแล้วผู้ใช้สามารถกำหนดรหัสแทนอักขระใด ๆ ได้เองจากกลุ่มของเลขฐานสอง 8 บิต แต่ในความเป็นจริงนั้นทำไม่ได้ เพราะหากทำเช่นนั้นอาจเกิดปัญหาระหว่างเครื่องสองเครื่องที่ใช้รหัสต่างกัน เปรียบเทียบได้กับคนสองคนคุยกันคนละภาษา ดังนั้นจึงควรมีการกำหนดรหัสแทนข้อมูลที่เป็นสากล เพื่อให้เครื่องคอมพิวเตอร์ต่าง ๆ สามารถสื่อสารกันได้ รหัสแทนข้อมูลที่นิยมใช้กันในปัจจุบัน คือ

รหัส EBCDIC (Extended Binary Code Decimal Interchange Code)
รหัสเอบซีโคด พัฒนาโดยบริษัทไอบีเอ็มใช้แทนข้อมูลที่แตกต่างกันได้ทั้งหมด 2 หรือ 256 ชนิด การเก็บข้อมูลโดยใช้รหัสเอบซีดิกจะแบ่งรหัสออกเป็นสองส่วน คือโซนบิต (Zone bits) ซึ่งอยู่ทางด้านซ้ายมีจำนวน 4 บิตและนิวเมอริกบิต (Numeric bits)ในอีก 4 บิตที่เหลือ

รหัส ASCII (American Standard Code for Information Interchange)
รหัสแอสกี เป็นรหัสที่นิยมใช้กันมาก จนสามมารถนับได้ว่าเป็นรหัสมาตรฐานที่ใช้ใน การสื่อสารข้อมูล ( Data Communications) ซึ่งจำเป็นต้องใช้รหัสการแทนข้อมูลเป็นระบบเดียวกัน เพื่อให้สามารถรับ - ส่งข้อมูลได้ในความหมายเดียวกัน รหัสแอสกีใช้เลขฐานสอง 8 หลักแทนข้อมูลหนึ่งตัวเช่นเดียวกับรหัสเอบซีดิค นั่นคือ 1 ไบต์มีความยาวเท่ากับ 8 บิต รวมทั้งมีการแบ่งรหัสออกเป็นสองส่วน คือ โซนบิตและนิวเมอริกบิตเช่นเดียวกัน
โปรแกรมประยุกต์บางโปรแกรมได้มีการเปลี่ยนแปลงการแทนข้อมูลด้วยรหัส ACSII ให้ต่างไปจากมาตรฐาน โดยรหัสการจัดรูปแบบตัวอักษร (formatiing) ให้เป็นตัวหนาหรือตัวเอียง เป็นต้น ทำให้โปรแกรมอื่น ๆ ไม่สามารถอ่านข้อมูลที่ถูกสร้างขึ้นจากโปรแกรมประเภทนี้ได้ เพราะมีการกำหนดรหัสแทนข้อมูลไม่ตรงกัน





รหัส UniCode
เป็นรหัสแบบใหม่ล่าสุด ถูกสร้างขึ้นมาเนื่องจากรหัสขนาด 8 บิตซึ่งมีรูปแบบเพียง 256 รูปแบบ ไม่สามารถแทนภาษาเขียนแบบต่าง ๆ ในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ เช่น ภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว
UniCode จะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่งเพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไป รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ ในปัจจุบันระบบ UniCode มีใช้ในระบบปฏิบัติการ Window NT ระบบปฏิบัติการ UNIX บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCode ในภาษา JAVA ด้วย

แหล่งที่มา :

ไม่มีความคิดเห็น:

แสดงความคิดเห็น