เลข 0 และ 1 ในระบบฐานสองแต่ละตัว เรียกว่าบิต (bit)
ย่อมาจากคำว่า Binary Digit บิตเป็นหน่วยเล็กที่สุดในการเก็บข้อมูลด้วยคอมพิวเตอร์
แต่เนื่องจากบิตเดียวไม่สามารถเก็บข้อมูลตัวเลข ตัวอักษร และสัญลักษณ์พิเศษต่าง ๆ
ได้ครบ ดังนั้นจึงต้องรวมบิตหลายบิตเข้าเป็นกลุ่มเรียกว่าไบต์ (byte) แต่ละไบต์จะแทนอักขระหนึ่งตัว โดยปกติแล้วใช้แปดบิตรวมกันเป็นหนึ่งไบต์
ในการผลิตเครื่องคอมพิวเตอร์จะต้องคำนึงถึงรหัสที่ใช้แทนข้อมูล
ความจุของหน่วยความจำและความจุของที่เก็บข้อมูลสำรองในคอมพิวเตอร์
ซึ่งหน่วยของความจุที่เก็บข้อมูลจะมีหน่วยเป็นหน่วยของไบต์
และหากมีความจุสูงก็อาจใช้หน่วยความจุเป็นกิโลไบต์ (Kilobyte) โดยหนึ่งกิโลไบต์มีค่าเป็น 1,024 ไบต์ ใช้สัญลักษณ์ KB หรือ K แทน (บางครั้งอาจใช้ค่าประมาณ 1 กิโลไบต์
ประมาณ 1,000 ไบต์) ดังนั้นถ้าหน่วยความจำขนาด 640 กิโลไบต์
จะเก็บข้อมูลได้ 640 x 1,024 หรือ 655,360 ไบต์ นอกจากนี้ยังมีหน่วยความจุเป็นเมกะไบต์ (Megabyte)ซึ่งมีค่าเป็น 1,024
x1,024 หรือ 1,048,576 ไบต์
ใช้สัญลักษณ์ MB หรือ M แทน (บางครั้งอาจใช้ค่าประมาณ 1 เมกะไบต์
ประมาณ 1,000,000 ไบต์ หรือหนึ่งล้านไบต์)
ชนิดของรหัสแทนข้อมูล
ระบบจำนวนที่ใช้ในทางคอมพิวเตอร์
ประกอบด้วย
ระบบเลขฐานสอง (Binary Number System) ประกอบด้วยตัวเลข 0 และ 1
ระบบเลขฐานแปด (Octal Number System) ประกอบด้วยตัวเลข 0 – 7
ระบบเลขฐานสิบ (Decimal Number System) ประกอบด้วยตัวเลข 0 – 9
ระบบเลขฐานสิบหก (Hexadecimal Number System) ประกอบด้วยตัว เลข 0-9 และ A – F
ในทางทฤษฎีแล้วผู้ใช้สามารถกำหนดรหัสแทนอักขระใด
ๆ ได้เองจากกลุ่มของเลขฐานสอง 8 บิต
แต่ในความเป็นจริงนั้นทำไม่ได้
เพราะหากทำเช่นนั้นอาจเกิดปัญหาระหว่างเครื่องสองเครื่องที่ใช้รหัสต่างกัน
เปรียบเทียบได้กับคนสองคนคุยกันคนละภาษา ดังนั้นจึงควรมีการกำหนดรหัสแทนข้อมูลที่เป็นสากล
เพื่อให้เครื่องคอมพิวเตอร์ต่าง ๆ สามารถสื่อสารกันได้
รหัสแทนข้อมูลที่นิยมใช้กันในปัจจุบัน คือ
รหัส EBCDIC
(Extended Binary Code Decimal Interchange Code)
รหัสเอบซีโคด
พัฒนาโดยบริษัทไอบีเอ็มใช้แทนข้อมูลที่แตกต่างกันได้ทั้งหมด 2 หรือ 256 ชนิด
การเก็บข้อมูลโดยใช้รหัสเอบซีดิกจะแบ่งรหัสออกเป็นสองส่วน คือโซนบิต (Zone bits) ซึ่งอยู่ทางด้านซ้ายมีจำนวน 4 บิตและนิวเมอริกบิต (Numeric bits)ในอีก 4 บิตที่เหลือ
รหัส ASCII
(American Standard Code for Information Interchange)
รหัสแอสกี เป็นรหัสที่นิยมใช้กันมาก
จนสามมารถนับได้ว่าเป็นรหัสมาตรฐานที่ใช้ใน การสื่อสารข้อมูล ( Data Communications) ซึ่งจำเป็นต้องใช้รหัสการแทนข้อมูลเป็นระบบเดียวกัน
เพื่อให้สามารถรับ - ส่งข้อมูลได้ในความหมายเดียวกัน รหัสแอสกีใช้เลขฐานสอง 8 หลักแทนข้อมูลหนึ่งตัวเช่นเดียวกับรหัสเอบซีดิค นั่นคือ 1 ไบต์มีความยาวเท่ากับ 8 บิต
รวมทั้งมีการแบ่งรหัสออกเป็นสองส่วน คือ โซนบิตและนิวเมอริกบิตเช่นเดียวกัน
โปรแกรมประยุกต์บางโปรแกรมได้มีการเปลี่ยนแปลงการแทนข้อมูลด้วยรหัส
ACSII ให้ต่างไปจากมาตรฐาน
โดยรหัสการจัดรูปแบบตัวอักษร (formatiing) ให้เป็นตัวหนาหรือตัวเอียง
เป็นต้น ทำให้โปรแกรมอื่น ๆ
ไม่สามารถอ่านข้อมูลที่ถูกสร้างขึ้นจากโปรแกรมประเภทนี้ได้
เพราะมีการกำหนดรหัสแทนข้อมูลไม่ตรงกัน
รหัส UniCode
เป็นรหัสแบบใหม่ล่าสุด
ถูกสร้างขึ้นมาเนื่องจากรหัสขนาด 8
บิตซึ่งมีรูปแบบเพียง 256 รูปแบบ
ไม่สามารถแทนภาษาเขียนแบบต่าง ๆ ในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ เช่น
ภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว
UniCode จะเป็นระบบรหัสที่เป็น
16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว
ซึ่งเพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไป
รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ ในปัจจุบันระบบ UniCode มีใช้ในระบบปฏิบัติการ Window NT ระบบปฏิบัติการ UNIX
บางรุ่น
รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCode ในภาษา JAVA ด้วย
แหล่งที่มา :
ไม่มีความคิดเห็น:
แสดงความคิดเห็น