Thó-lūn:Pian-bé

From Wikipedia, the free encyclopedia

Remove ads

編碼

編碼是字的集合佮另外一个集合的對應,另外這个集合定定是數字,嘛有可能是電子信號,比論講,, 摩斯(Morse)碼是一種拉丁字佮電報機的對應; ASCII共英語用的拉丁字、數字佮一寡符號對應到整數佮這个整數的七位元(bit)二進位表示。

電腦


欲用電腦來處理文字,需要對這个文字做編碼,編碼的過程佇概念上會使拆做兩部份,第一部份是共這个文字系統的基本單位(會使是字、字圖佮字母(grapheme))對應到一个整數。

  • 字 --> 整數
  • 字圖--> 整數
  • 字母--> 整數

第二部份是共這个整數對應到一个適合電腦處理的二進位數字,上簡單的是用這个數的二進位表示,較複雜的是共這个整數對應到一个已上(無一定愛固定幾个) 的=二進位數字。

  • 整數 --> 整數的二進位表示
  • 整數 --> 一个以上的二進位數字

編碼列單


  • ASCII
  • EBCDIC
  • ISO 8859:
    • ISO 8859-1, ISO 8859-2, ISO 8859-3, ISO 8859-4, ISO 8859-5, ISO 8859-6, ISO 8859-7, ISO 8859-8, ISO 8859-9, ISO 8859-10, ISO 8859-11, ISO 8859-13, ISO 8859-14, ISO 8859-15, ISO 8859-16
  • Windows character sets:
    • Windows-1251, Windows-1252, Windows-1258
  • KOI8-R, KOI8-U
  • ISCII
  • VISCII
  • Big-5
  • GB:
    • GB2312
    • GB18030
  • ISO 2022
  • Unicode (And subsets thereof, such as the 16-bit 'Basic Multilingual Plane'). See UTF-8
  • Taiwanese Package
Remove ads
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads