中文標準交換碼

CNS 11643
別名	中文標準交換碼
語言	繁體中文
標準	CNS 11643
分類	ISO 2022、雙位元組字元集、中日韓統一表意文字
編碼格式	EUC-TW (所有字面); ISO-2022-CN-EXT (字面1–7); ISO-2022-CN (字面1和字面2);
其他相關編碼	大五碼、中文資訊交換碼
	閱; 論; 編;

中文標準交換碼（Chinese Standard Interchange Code，簡稱CSIC），是中華民國國家標準11643號，簡稱CNS 11643，舊名通用漢字標準交換碼（Chinese Ideographic Standard Code for Information Interchange，簡稱CISCII），是中華民國政府為中文資訊處理制定的字元編碼方案，與許多學術圖書館系統採用的中文資訊交換碼同屬於中文交換碼。中文標準交換碼基於ISO 2022定義，和ASCII相容，其EUC版本為EUC-TW。

簡介

1980年9月，行政院國家科學委員會集合編碼專家、學者在溪頭舉行會議，建立國家中文資訊標準交換碼的編碼原則，並報請行政院核定。隔年，行政院函令國科會、教育部、中央標準局及主計處電子處理資料中心組成專案作業小組，推動編碼工作。經多次會商，於1983年10月底完成「通用漢字標準交換碼」的試用版，試行二年。試用期滿後，國科會與主計處電資中心邀集相關單位與業者組成技術小組，檢討試用結果，並根據檢討結果修訂編碼原則予以重編。1986年8月4日由經濟部中央標準局（後改名為標準檢驗局）正式公佈，取名「通用漢字標準交換碼」，其內容包括第一字面、第二字面共13,051字^[1]。

1980年代萬「碼」奔騰，業界使用各種不同的字符編碼，如大五碼、王安碼、IBM 5550碼、公會碼、電信碼^[2]、倚天碼等；CNS11643與大五碼字數相同（大五碼有13,053字，但有兩個重碼）。藉由此國家標準交換碼的公布與使用，做為各種不同內碼間的橋梁，使得不同的內碼也可以互相溝通和交換，資料可共享。

為因應各界對擴大中文字元集的需求，中央標準局於1990年委託資訊工業策進會進行擴編。CNS 11643於1992年使用至第七字面，共48,027字，並更名為「中文標準交換碼」。2003年，標準檢驗局委託中文數位化技術推廣基金會再次擴編，於2004年推出新版的CNS11643，將編碼空間由原先規定的十六字面增加到八十字面，並使用至第十五字面。2014年，使用第十七、十九字面。2021年，使用第二十四字面^[3]^[4]。

「CNS11643中文交換碼全字庫」為1999年時，由主計處電資中心委託中文數位化技術推廣基金會建置，用以解決中文碼查詢、轉碼與缺字問題。為配合2012年的行政院組織改造，全字庫改由研考會辦理，自2014年又由繼承研考會業務的國家發展委員會管理。2022年8月27日數位發展部成立後，網站管理機構調整為數位部^[5]。全字庫目前已收納10萬8,800多個文字及符號。若扣除第八和第九字面中的非漢字字元以及第一字面中的符號、注音、部首、漢字構件等字元，以有倉頡碼屬性的字來計算，大約有9萬6,600多個漢字^[6]^[7]。

版本

年份	標準名稱	更改
1983	CNS11643-1983	通用漢字標準交換碼試用版推出，包括13,053字及441個符號，12月推出的大五碼，字集與字序與交換碼試用版完全相同，僅字碼定義不同。
1986	CNS11643-1986	通用漢字標準交換碼正式版發行，包括13,051個字（刪除2個重複字，調整20個字順序）與441個符號，其餘均與試用版相同。
1988	CNS11643-1986	增加第十四字面使用者加字區交換碼，共增加6,148字。
1989	CNS11643-1986	再增加第十四字面使用者加字區交換碼，共增加157字。
1992	CNS11643-1992	擴充第3至7字面，增加部首和數字符號，並更換名稱為中文標準交換碼，總共包括48,027個字與684個符號。
2002	CNS14649	國際標準ISO 10646／Unicode的中文版「CNS 14649廣用多八位元編碼字元集」推出，包括中、日、韓、越等20,902個漢字，及全球使用的字元。
2004	CNS11643-2004	編碼架構擴充至八十字面。
2008	CNS11643-2008	擴充版發行，增加了戶政用字與異體字等。

編碼格式

CNS 11643遵循ISO/IEC 2022所規定的七位元94個圖形字元（英語：Graphic character）多位元組延伸編碼格式^[4]，以2個位元組 (byte)為中文碼編碼單位，以十六進位制之文數字表示，並且避開控制碼所在的範圍。字面字集之排列，大抵以使用頻率為次序，第一字面以常用字為主，第二字面以次常用字為主，第三字面以部分罕用字及較常用異體字為主，其後的字面大多以罕用字、異體字、教育部閩客語用字及戶政、役政、地政等機關用字為主。在每一字面中，依先筆畫後部首排列順序來編訂字碼（每一字面均以文字筆畫總數為第一次序，筆劃數同則按照部首為次序，部首同再按照筆順為次序）^[8]。

CNS 11643採用多字面編碼結構，並藉助ISO/IEC 2022所規定的逸出順序（escape sequence）和調用控制符切換字面。因此，同樣的正規字元碼在CNS 11643的不同字面會代表不同的漢字（例如：第1字面字元碼454A為中文字「日」，而第2字面的454A是中文字「碇」）。CNS 11643在新版中規定了延伸字元碼，作為任一字元的唯一字元碼。中文標準交換碼延伸字元碼是在正規字元碼前，附加該字元所屬字面的字面指示碼^[4]。

終結字元

目前 CNS11643 的1~7 字面之終結字元（最後字元、最終位元組） [F] 已獲國際標準組織 ISO 正式登記為 47 至 4D ，亦可使用於字集之指定^[8]^[9]。依據ISO 237之規定，各國的國家標準若要成為國際間之中文資訊交換標準，必須向國際標準組織申請註冊，並由國際標準組織正式公佈，如此全球各國即可依國際標準公佈之終結字元進行資料交換。

CNS 11643-1992所包括的七個字面，每個字面均分別向ISO秘書處歐洲計算機製造商協會申請相對應之終結字元。經由資訊工業策進會之協助申請，1993年2月1日CNS 11643第一、第二字面正式獲得終結字元：47和48，1994年3月25日CNS 11643第三至第七字面也正式獲得終結字元：49 - 4D。

CNS字面	CNS暫用終結字元	ISO正式終結字元
第一字面	30	47
第二字面	31	48
第三字面	32	49
第四字面	33	4A
第五字面	34	4B
第六字面	35	4C
第七字面	36	4D

與大五碼關係

大五碼為資訊工業策進會與臺灣十三家資訊業者簽約，共同為「五大軟體專案」所設計的中文字符編碼。該字符編碼於1983年12月推出，共收錄13,053個漢字（有兩字重複編碼，故實際上只有13,051個字）、408個符號、33個控制字元^[13]，其字元的範圍與順序都和1983年10月推出的「通用漢字標準交換碼」試用版相同，但碼位不同。「通用漢字標準交換碼」在1986年推出正式版，刪除試用版的2個重複編碼字，調整了20個字的順序。

大五碼後來成為繁體中文社群最常用的電腦漢字字集標準，然而所涵蓋的字數不敷實際需求，造成廠商各自增刪，衍生成多種不同版本。2003年中文數位化技術推廣基金會接受經濟部標準檢驗局委託，召集國內業者代表、專家和學者，就大五碼字元表的原始版本和業界主要版本予以重整，稱為Big5-2003^[14]。重整後的版本，去除了重複編碼，並新增7個中文字，以及370個符號，包括30個數字符號、24個部首、14個罕用符號、268個日本假名，以及34個表格符號^[13]。其成果最後收錄至CNS 11643的附錄之中^[15]。

比較

中央標準局所公佈的《通用漢字標準交換碼》（後更名為《中文標準交換碼》，CNS11643）與1984年發布的業界事實標準五大碼 (Big5) 有些許共同之處：兩者都使用國字標準字體表為基礎，但是《中文標準交換碼》所定義的碼位更符合國字標準字體表所選定的字形。國字標準字體表本身並未定義字形的碼位，而是依賴於其他標準將字形賦予碼位。

其中，五大碼與現在的《中文標準交換碼》有部分收字差異：

五大碼與《中文標準交換碼》(CNS11643)的差異^[16]
國字	字表序號^[17]	CNS11643	Big5收錄異體	備註
U+5F5E彞	A01266	1-7641	C255，U+5F5D彝
U+53C4叄	B00287	3-3455		五大碼未收錄
U+564D噍	B00439	3-4B43		五大碼未收錄
U+36B7㚷	B00635	3-2847		五大碼未收錄
U+5B0E嬎	B00715	3-4B5F	E955，U+5B14嬔	CNS11643 第二字面 2-565F 疑似誤收 U+5B14嬔字，但是顯示為無點的 U+5B0E嬎
U+5C14爾	B00760	3-223F		五大碼未收錄
U+3BA3㮣	B01783	3-4167		五大碼未收錄
U+7934礴	B03027	2-662B	F2A1，U+7921礡	疑似 Unicode 統合時錯誤對應到統合漢字 U+7921礡上
U+7DF5緵	B03452	3-4E2B	EDDB，U+7E4C繌	CNS11643 第二字面 2-5E48 疑似誤收 U+7E4C繌字
U+9638阸	B05531	4-2833		五大碼未收錄
U+9C0C鰌	B05989	3-5D76		五大碼未收錄

參看

資料來源

^ 余保倫. 與文字共舞－中文數位化發展簡介 (PDF). 中華民國統計資訊網. [2022-12-16]. （原始內容存檔 (PDF)於2022-12-16）.
^ 陳冠州. 電信碼. 國家教育研究院樂詞網. 1995-12 [2024-04-29]. （原始內容存檔於2024-04-29）.
^ 存档副本. [2015-03-28]. （原始內容存檔於2015-04-02）.
^ ^4.0 ^4.1 ^4.2 曾士熊. 認識中文字元碼：十、中文標準交換碼（CNS 11643）. [2022-12-16]. （原始內容存檔於2022-05-28）.
^ 全字庫中文標準交換碼. 全字庫介紹. [2022-12-16]. （原始內容存檔於2022-12-16）.
^ 全字庫現況. [2022-12-16]. （原始內容存檔於2023-01-27）.
^ 全字庫中文標準交換碼 - 中文碼現況. [2022-12-17]. （原始內容存檔於2022-12-17）. 現有字數：現行全字庫中，戶政與地政部分用字經檢查為認同字，因而刪除該碼位資料，但仍保留該碼位的位置，現有字數即去除這些被認同掉的字碼，所計算得到的總字數……全字庫第八字面和第九字面所儲存的是拼音文字，所以沒有注音、倉頡等屬性資料碼位個數
^ ^8.0 ^8.1 認識全字庫＞中文碼介紹. [2022-12-17]. （原始內容存檔於2021-05-14）.
^ 附錄1﹕中文字碼處理說明 (PDF). [2022-12-17]. （原始內容存檔 (PDF)於2022-12-17）.
^ 存档副本. [2021-12-12]. （原始內容存檔於2022-07-14）.
^ 存档副本. [2021-12-12]. （原始內容存檔於2022-07-14）.
^ 存档副本. [2021-12-12]. （原始內容存檔於2022-07-10）.
^ ^13.0 ^13.1 曾士熊. 認識中文字元碼：九、Big5和Big5E. [2022-12-17]. （原始內容存檔於2022-05-28）.
^ 認識全字庫＞中文碼介紹. [2022-12-17]. （原始內容存檔於2021-05-14）.
^ 謝東翰. 預覽「Big5 2003」. [2022-12-17]. （原始內容存檔於2022-12-17）.
^ 次常用國字標準字體表 - 字嗨！. zi-hi.com. [2023-04-25]. （原始內容存檔於2021-05-14）.
^ 國家教育研究院. 教育部异体字字典. [2021-05-14]. （原始內容存檔於2021-05-15）（中文（臺灣））.

外部連結

CNS11643中文標準交換碼全字庫（頁面存檔備份，存於網際網路檔案館）
CNS11643中文標準交換碼全字庫資料集（頁面存檔備份，存於網際網路檔案館）
CNS 11643與Unicode對照表（頁面存檔備份，存於網際網路檔案館）
曾士熊：認識中文字元碼 - 中文標準交換碼（CNS 11643）（頁面存檔備份，存於網際網路檔案館）
依據各平面顯示所有字符的PDF（舊資料）

[余保倫-1] 余保倫. 與文字共舞－中文數位化發展簡介 (PDF). 中華民國統計資訊網. [2022-12-16]. （原始內容存檔 (PDF)於2022-12-16）.

[2] 陳冠州. 電信碼. 國家教育研究院樂詞網. 1995-12 [2024-04-29]. （原始內容存檔於2024-04-29）.

[3] 存档副本. [2015-03-28]. （原始內容存檔於2015-04-02）.

[曾士熊-CNS-4] 4.0 ^4.1 ^4.2 曾士熊. 認識中文字元碼：十、中文標準交換碼（CNS 11643）. [2022-12-16]. （原始內容存檔於2022-05-28）.

[5] 全字庫中文標準交換碼. 全字庫介紹. [2022-12-16]. （原始內容存檔於2022-12-16）.

[全字庫現況-6] 全字庫現況. [2022-12-16]. （原始內容存檔於2023-01-27）.

[7] 全字庫中文標準交換碼 - 中文碼現況. [2022-12-17]. （原始內容存檔於2022-12-17）. 現有字數：現行全字庫中，戶政與地政部分用字經檢查為認同字，因而刪除該碼位資料，但仍保留該碼位的位置，現有字數即去除這些被認同掉的字碼，所計算得到的總字數……全字庫第八字面和第九字面所儲存的是拼音文字，所以沒有注音、倉頡等屬性資料碼位個數

[CNS11643-8] 8.0 ^8.1 認識全字庫＞中文碼介紹. [2022-12-17]. （原始內容存檔於2021-05-14）.

[9] 附錄1﹕中文字碼處理說明 (PDF). [2022-12-17]. （原始內容存檔 (PDF)於2022-12-17）.

[10] 存档副本. [2021-12-12]. （原始內容存檔於2022-07-14）.

[11] 存档副本. [2021-12-12]. （原始內容存檔於2022-07-14）.

[12] 存档副本. [2021-12-12]. （原始內容存檔於2022-07-10）.

[Big5-13] 13.0 ^13.1 曾士熊. 認識中文字元碼：九、Big5和Big5E. [2022-12-17]. （原始內容存檔於2022-05-28）.

[14] 認識全字庫＞中文碼介紹. [2022-12-17]. （原始內容存檔於2021-05-14）.

[15] 謝東翰. 預覽「Big5 2003」. [2022-12-17]. （原始內容存檔於2022-12-17）.

[16] 次常用國字標準字體表 - 字嗨！. zi-hi.com. [2023-04-25]. （原始內容存檔於2021-05-14）.

[17] 國家教育研究院. 教育部异体字字典. [2021-05-14]. （原始內容存檔於2021-05-15）（中文（臺灣））.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

閱論編字元編碼
早期電信	電報電碼（英語：Telegraph code）庫克與惠斯通（英語：Cooke and Wheatstone telegraph）摩斯非拉丁字母（英語：Morse code for non-Latin alphabets）日文（英語：Wabun code）中文西里爾字母（英語：Russian Morse code）韓文（英語：SKATS）博多與莫瑞 Fieldata（英語：Fieldata） ASCII ISO/IEC 646 BCDIC（英語：BCD (character encoding)）電傳文訊（英語：Teletex）與電傳視訊（英語：Videotex）／電視資訊 T.51/ISO/IEC 6937（英語：T.51/ISO/IEC 6937） ITU T.61（英語：ITU T.61） ITU T.101（英語：Videotex character set）世界系統電傳文訊（英語：World System Teletext）字元集（英語：Teletext character set）
ISO/IEC 8859	現行 -1（西歐語言） -2（中歐語言） -3（馬爾他文／世界文） -4（北歐語言） -5（西里爾字母） -6（阿拉伯文） -7（希臘文） -8（希伯來文） -9（土耳其文） -10（北日耳曼語支） -11（泰文） -13（波羅的語族） -14（凱爾特語族） -15（新西歐語言） -16（羅馬尼亞文）廢止 -12（梵文）提議 KOI-8西里爾字母（英語：ISO-IR-111）薩米文（英語：ISO-IR-197）改編威爾斯文（英語：ISO-IR-182）巴倫支西里爾字母（英語：ISO-IR-200）愛沙尼亞文（英語：Code page 922）烏克蘭西里爾字母（英語：Code page 1124）
書目	MARC-8（英語：MARC-8） ANSEL（英語：ANSEL）中文資訊交換碼 ISO 5426（英語：ISO 5426） ISO 5427（英語：ISO 5427） ISO 5428（英語：ISO 5428） ISO 6438 ISO 6862（英語：ISO 6862）
國家標準	ArmSCII BraSCII（英語：BraSCII）中文標準交換碼 DIN 66003（英語：DIN 66003） ELOT 927（英語：ELOT 927） GOST 10859（英語：GOST 10859） GB 2312 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212（英語：JIS X 0212） JIS X 0213（英語：JIS X 0213） KOI-7（英語：KOI-7） KPS 9566 KS X 1001 KS X 1002（英語：KS X 1002） LST 1564（英語：LST 1564） LST 1590-4（英語：LST 1590-4） PASCII Shift JIS SI 960（英語：SI 960） TIS-620（英語：Thai Industrial Standard 620-2533） TSCII VISCII（英語：VISCII） VSCII YUSCII（英語：YUSCII）
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367（英語：ISO/IEC 10367） EUC ISO-IR-165
macOS代碼頁	亞美尼亞文（英語：Mac OS Armenian）阿拉伯文巴倫支西里爾字母（英語：Mac OS Barents Cyrillic）凱爾特語族（英語：Mac OS Celtic）中歐語言克羅埃西亞文（英語：Mac OS Croatian encoding）西里爾字母（英語：Mac OS Cyrillic encoding）梵文波斯文（英語：MacFarsi encoding）字體X（英語：Macintosh Font X encoding）蓋爾文（英語：Mac OS Gaelic）喬治亞文（英語：Mac OS Georgian）希臘文（英語：MacGreek encoding）古吉拉特文（英語：Mac OS Gujarati）古木基文（英語：Mac OS Gurmukhi）希伯來文（英語：Mac OS Hebrew）冰島文（英語：Mac OS Icelandic encoding）因紐特文（英語：Mac OS Inuit）鍵盤（英語：Mac OS Keyboard encoding）拉丁文（英語：Macintosh Latin encoding）馬爾他文／世界文（英語：Mac OS Maltese/Esperanto encoding）歐甘字母（英語：Mac OS Ogham）羅曼語族羅馬尼亞文（英語：Mac OS Romanian encoding）薩米文（英語：Mac OS Sámi）土耳其文（英語：Mac OS Turkish encoding）土耳其西里爾字母（英語：Mac OS Turkic Cyrillic）烏克蘭文（英語：Mac OS Ukrainian encoding） VT100（英語：VT100 encoding）
DOS代碼頁	437 668（英語：Code page 668） 708（英語：Code page 708） 720（英語：Code page 720） 737（英語：Code page 737） 770（英語：Code page 770） 773（英語：Code page 773） 775（英語：Code page 775） 776（英語：Code page 776） 777（英語：Code page 777） 778（英語：Code page 778） 850（英語：Code page 850） 851（英語：Code page 851） 852（英語：Code page 852） 853（英語：Code page 853） 855（英語：Code page 855） 856（英語：Code page 856） 857（英語：Code page 857） 858（英語：Code page 858） 859（英語：Code page 859） 860（英語：Code page 860） 861（英語：Code page 861） 862（英語：Code page 862） 863（英語：Code page 863） 864（英語：Code page 864） 865（英語：Code page 865） 866（英語：Code page 866） 867（英語：Code page 867） 868（英語：Code page 868） 869（英語：Code page 869） 897（英語：Code page 897） 899（英語：Code page 899） 903（英語：Code page 903） 904（英語：Code page 904） 932（英語：Code page 932 (IBM)） 936（英語：Code page 936 (IBM)） 942（英語：Code page 942） 949（英語：Code page 949 (IBM)） 950 951（英語：Code page 951） 1040（英語：Code page 1040） 1042（英語：Code page 1042） 1043（英語：Code page 1043） 1046（英語：Code page 1046） 1098（英語：Code page 1098） 1115（英語：Code page 1115） 1116（英語：Code page 1116） 1117（英語：Code page 1117） 1118（英語：Code page 1118） 1127（英語：Code page 1127） 3846（英語：Code page 3846） ABICOMP（英語：ABICOMP character set） CS Indic（英語：CS Indic character set） CSX Indic（英語：CSX Indic character set） CSX+ Indic（英語：CSX+ Indic character set） CWI-2（英語：CWI-2）伊朗系統（英語：Iran System encoding）卡梅尼茨（英語：Kamenický encoding）馬索維亞（英語：Mazovia encoding） MIK（英語：MIK (character set)）
IBM AIX代碼頁	895（英語：Code page 895） 896（英語：Code page 896） 912（英語：Code page 912） 915（英語：Code page 915） 921（英語：Code page 921） 922（英語：Code page 922） 1006（英語：Code page 1006） 1008（英語：Code page 1008） 1009（英語：Code page 1009） 1010（英語：Code page 1010） 1012（英語：Code page 1012） 1013（英語：Code page 1013） 1014（英語：Code page 1014） 1015（英語：Code page 1015） 1016（英語：Code page 1016） 1017（英語：Code page 1017） 1018（英語：Code page 1018） 1019（英語：Code page 1019） 1124（英語：Code page 1124） 1133（英語：Code page 1133）
Microsoft Windows代碼頁（英語：Windows code page）	CER-GS（英語：CER-GS） 932（英語：Code page 932 (Microsoft Windows)） 936 GBK 950 1169（英語：Code page 1169） Extended Latin-8（英語：Extended Latin-8） 1250（英語：Windows-1250） 1251（英語：Windows-1251） 1252 1253（英語：Windows-1253） 1254（英語：Windows-1254） 1255（英語：Windows-1255） 1256（英語：Windows-1256） 1257（英語：Windows-1257） 1258（英語：Windows-1258） 1270（英語：Windows-1270）西里爾字母+芬蘭文（英語：Windows Cyrillic + Finnish）西里爾字母+法文（英語：Windows Cyrillic + French）西里爾字母+德文（英語：Windows Cyrillic + German）希臘語變音符號（英語：Windows Polytonic Greek）
EBCDIC代碼頁	37（英語：Code page 37） EBCDIC中的日文（英語：Japanese language in EBCDIC） DKOI（英語：DKOI）
DEC終端機（VTx（英語：VT220））	MCS（英語：Multinational Character Set） NRCS（英語：National Replacement Character Set）加拿大法文（英語：Code page 1020）瑞士文（英語：Code page 1021）西班牙文（英語：Code page 1023）英國英文（英語：Code page 1101）荷蘭文（英語：Code page 1102）芬蘭文（英語：Code page 1103）法文（英語：Code page 1104）挪威文／丹麥文（英語：Code page 1105）瑞典文（英語：Code page 1106）挪威文／丹麥文（替代）（英語：Code page 1107） 8位元希臘文（英語：Code page 1287） 8位元土耳其文（英語：Code page 1288） SI 960（英語：SI 960）希伯來文（英語：DEC Hebrew）特殊圖形（英語：DEC Special Graphics）技術（英語：DEC Technical Character Set）
特定平臺	1057（英語：Code page 1057） Acorn（英語：RISC OS character set） Adobe標準（英語：PostScript Standard Encoding） Adobe Latin 1（英語：PostScript Latin 1 Encoding） Amstrad CPC（英語：Amstrad CPC character set） Apple II（英語：Apple II character set）雅達利資訊交換標準碼（英語：ATASCII）雅達利ST（英語：Atari ST character set） BICS（英語：Bitstream International Character Set）卡西歐計算機（英語：Casio calculator character sets） CDC（英語：CDC display code） Compucolor II（英語：Compucolor II character set） CP/M+（英語：Amstrad CP/M Plus character set） DEC RADIX 50（英語：DEC RADIX 50） DEC MCS（英語：Multinational Character Set）/NRCS（英語：National Replacement Character Set） DG國際（英語：DG International） Fieldata（英語：Fieldata） GEM（英語：GEM character set） GSM 03.38（英語：GSM 03.38） HP Roman（英語：HP Roman） HP FOCAL（英語：FOCAL character set） HP RPL（英語：RPL character set） SQUOZE（英語：SQUOZE） LICS（英語：Lotus International Character Set） LMBCS（英語：Lotus Multi-Byte Character Set） MSX（英語：MSX character set） NEC APC（英語：NEC APC character set） NeXT（英語：NeXT character set） PETSCII（英語：PETSCII） SEGA SC-3000（英語：Sega SC-3000 character set）夏普計算機（英語：Sharp pocket computer character sets）夏普MZ（英語：Sharp MZ character set）辛克萊QL（英語：Sinclair QL character set）符號電傳文訊（英語：Teletext character set）德州儀器計算機（英語：TI calculator character sets） TRS-80（英語：TRS-80 character set）文圖拉國際（英語：Ventura International） WISCII（英語：Wang International Standard Code for Information Interchange） XCCS（英語：Xerox Character Code Standard） ZX80（英語：ZX80 character set） ZX81（英語：ZX81 character set） ZX Spectrum（英語：ZX Spectrum character set）
Unicode及通用字符集	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC（英語：UTF-EBCDIC） GB 18030 BOCU-1 CESU-8 SCSU TACE16（英語：Tamil All Character Encoding） Unicode編碼比較（英語：Comparison of Unicode encodings）
TeX排版系統	科克（英語：Cork encoding） LY1（英語：LY1 encoding） OML（英語：OML encoding） OMS（英語：OMS encoding） OT1（英語：OT1 encoding）
其他代碼頁	ABICOMP（英語：ABICOMP character set） ASMO 449（英語：ASMO 449）大五碼 APL符號數位編碼（英語：Digital encoding of APL symbols） ISO-IR-68（英語：ISO-IR-68） ARIB STD-B24 HZ（英語：HZ (character encoding)） IEC-P27-1（英語：IEC-P27-1） INIS 7位元（英語：INIS character set） INIS-8（英語：8位元） ISO-IR-169（英語：ISO-IR-169） ISO 2033（英語：ISO 2033） KOI -R -RU（英語：KOI8-RU） -U 今昔文字鏡 SEASCII（英語：Stanford Extended ASCII） Stanford/ITS（英語：Stanford/ITS character set） TRON（英語：TRON (encoding)）統合韓文代碼（英語：Unified Hangul Code）
控制字符	摩斯電碼專用代碼（英語：Prosigns for Morse code） C0與C1控制字符 ISO/IEC 6429 JIS X 0211（英語：JIS X 0211） Unicode控制字符空白字元
相關條目	CCSID（英語：CCSID） HTML字符編碼字符集探測中日韓統一表意文字硬體代碼頁（英語：Hardware code page）磁性墨水字元識別碼（英語：Magnetic ink character recognition）亂碼中文亂碼可變寬度編碼
字元集

簡介

版本

編碼格式

終結字元

最新版本

與大五碼關係

比較

參看

資料來源

外部連結