字元編碼
關於字元之編碼法 / 維基百科,自由的 encyclopedia
字元編碼(英語:Character encoding)、字碼、字集碼是把字元集中的字元為指定集合中某一對象(例如:位元模式、自然數序列、八位元或者電脈衝),以便文字在電腦中儲存和通過通訊網路的傳遞。有時,為強調其所使用的方式而使用其他術語,譬如:為說明「電腦系統『內部』 處理文字資料所使用的字元編碼」時,會使用內碼。為「不同電腦系統之間,為了『交換』資料所採用的字元編碼」時,會使用交換碼。
此條目需要補充更多來源。 (2014年2月6日) |
常見的例子包括將拉丁字母表編碼成摩斯電碼和ASCII。其中,ASCII將字母、數字和其它符號編號,並用7位元的二進位來表示這個整數。通常會額外使用一個擴充的位元,以便於以1個位元組的方式儲存。
在電腦技術發展的早期,如ASCII(1963年)和EBCDIC(1964年)這樣的字元集逐漸成為標準。但這些字元集的局限很快就變得明顯,於是人們開發了許多方法來擴充它們。對於支援包括東亞CJK字元家族在內的寫作系統的要求能支援更大量的字元,並且需要一種系統而不是臨時的方法實現這些字元的編碼。