字符集编码标识符,数字表示字符编码

发布时间 2016-09-10

关于ANSI编码:这是一种延伸编码方案而非特定编码,不同语种对它的定义都不同,例如简体中文ANSI代表GBK编码,繁体中文ANSI代表BIG5编码,日文中ANSI代表Shift_JIS编码……因此在不同语种的计算机之间传输文本应该采用UTF-8等Unicode编码,不要采用ANSI编码,否则可能导致乱码。

-----------------------------

以数字编号标识字符集编码,全部选项如下:

标识符 名称 备注
37 IBM037 IBM EBCDIC(美国 - 加拿大)
437 IBM437 OEM 美国
500 IBM500 IBM EBCDIC(国际)
708 ASMO-708 阿拉伯字符 (ASMO 708)
720 DOS-720 阿拉伯字符 (DOS)
737 ibm737 希腊字符 (DOS)
775 ibm775 波罗的海字符 (DOS)
850 ibm850 西欧字符 (DOS)
852 ibm852 中欧字符 (DOS)
855 IBM855 OEM 西里尔语
857 ibm857 土耳其字符 (DOS)
858 IBM00858 OEM 多语言拉丁语 I
860 IBM860 葡萄牙语 (DOS)
861 ibm861 冰岛语 (DOS)
862 DOS-862 希伯来字符 (DOS)
863 IBM863 加拿大法语 (DOS)
864 IBM864 阿拉伯字符 (864)
865 IBM865 北欧字符 (DOS)
866 cp866 西里尔字符 (DOS)
869 ibm869 现代希腊字符 (DOS)
870 IBM870 IBM EBCDIC(多语言拉丁语 2)
874 windows-874 泰语 (Windows)
875 cp875 IBM EBCDIC(现代希腊语)
932 shift_jis 日语 (Shift-JIS)
936 GBK 简体中文 (GBK)
949 ks_c_5601-1987 朝鲜语
950 big5 繁体中文 (Big5)
1026 IBM1026 IBM EBCDIC(土耳其拉丁语 5)
1047 IBM01047 IBM 拉丁语 1
1140 IBM01140 IBM EBCDIC(美国 - 加拿大 - 欧洲)
1141 IBM01141 IBM EBCDIC(德国 - 欧洲)
1142 IBM01142 IBM EBCDIC(丹麦 - 挪威 - 欧洲)
1143 IBM01143 IBM EBCDIC(芬兰 - 瑞典 - 欧洲)
1144 IBM01144 IBM EBCDIC(意大利 - 欧洲)
1145 IBM01145 IBM EBCDIC(西班牙 - 欧洲)
1146 IBM01146 IBM EBCDIC(英国 - 欧洲)
1147 IBM01147 IBM EBCDIC(法国 - 欧洲)
1148 IBM01148 IBM EBCDIC(国际 - 欧洲)
1149 IBM01149 IBM EBCDIC(冰岛语 - 欧洲)
1200 utf-16 Unicode (UTF-16)
1201 unicodeFFFE Unicode (Big-Endian)
1250 windows-1250 中欧字符 (Windows)
1251 windows-1251 西里尔字符 (Windows)
1252 Windows-1252 西欧字符 (Windows)
1253 windows-1253 希腊字符 (Windows)
1254 windows-1254 土耳其字符 (Windows)
1255 windows-1255 希伯来字符 (Windows)
1256 windows-1256 阿拉伯字符 (Windows)
1257 windows-1257 波罗的海字符 (Windows)
1258 windows-1258 越南字符 (Windows)
1361 Johab 朝鲜语 (Johab)
10000 macintosh 西欧字符 (Mac)
10001 x-mac-japanese 日语 (Mac)
10002 x-mac-chinesetrad 繁体中文 (Mac)
10003 x-mac-korean 朝鲜语 (Mac)
10004 x-mac-arabic 阿拉伯字符 (Mac)
10005 x-mac-hebrew 希伯来字符 (Mac)
10006 x-mac-greek 希腊字符 (Mac)
10007 x-mac-cyrillic 西里尔字符 (Mac)
10008 x-mac-chinesesimp 简体中文 (Mac)
10010 x-mac-romanian 罗马尼亚语 (Mac)
10017 x-mac-ukrainian 乌克兰语 (Mac)
10021 x-mac-thai 泰语 (Mac)
10029 x-mac-ce 中欧字符 (Mac)
10079 x-mac-icelandic 冰岛语 (Mac)
10081 x-mac-turkish 土耳其字符 (Mac)
10082 x-mac-croatian 克罗地亚语 (Mac)
12000 utf-32 Unicode (UTF-32)
12001 utf-32BE Unicode (UTF-32 Big-Endian)
20000 x-Chinese-CNS 繁体中文 (CNS)
20001 x-cp20001 TCA 台湾
20002 x-Chinese-Eten 繁体中文 (Eten)
20003 x-cp20003 IBM5550 台湾
20004 x-cp20004 TeleText 台湾
20005 x-cp20005 Wang 台湾
20105 x-IA5 西欧字符 (IA5)
20106 x-IA5-German 德语 (IA5)
20107 x-IA5-Swedish 瑞典语 (IA5)
20108 x-IA5-Norwegian 挪威语 (IA5)
20127 us-ascii US-ASCII
20261 x-cp20261 T.61
20269 x-cp20269 ISO-6937
20273 IBM273 IBM EBCDIC(德国)
20277 IBM277 IBM EBCDIC(丹麦 - 挪威)
20278 IBM278 IBM EBCDIC(芬兰 - 瑞典)
20280 IBM280 IBM EBCDIC(意大利)
20284 IBM284 IBM EBCDIC(西班牙)
20285 IBM285 IBM EBCDIC(英国)
20290 IBM290 IBM EBCDIC(日语片假名)
20297 IBM297 IBM EBCDIC(法国)
20420 IBM420 IBM EBCDIC(阿拉伯语)
20423 IBM423 IBM EBCDIC(希腊语)
20424 IBM424 IBM EBCDIC(希伯来语)
20833 x-EBCDIC-KoreanExtended IBM EBCDIC(朝鲜语扩展)
20838 IBM-Thai IBM EBCDIC(泰语)
20866 koi8-r 西里尔字符 (KOI8-R)
20871 IBM871 IBM EBCDIC(冰岛语)
20880 IBM880 IBM EBCDIC(西里尔俄语)
20905 IBM905 IBM EBCDIC(土耳其语)
20924 IBM00924 IBM 拉丁语 1
20932 EUC-JP 日语(JIS 0208-1990 和 0212-1990)
20936 x-cp20936 简体中文 (GB2312-80)
20949 x-cp20949 朝鲜语 Wansung
21025 cp1025 IBM EBCDIC(西里尔 塞尔维亚 - 保加利亚)
21866 koi8-u 西里尔字符 (KOI8-U)
28591 iso-8859-1 西欧字符 (ISO)
28592 iso-8859-2 中欧字符 (ISO)
28593 iso-8859-3 拉丁语 3 (ISO)
28594 iso-8859-4 波罗的海字符 (ISO)
28595 iso-8859-5 西里尔字符 (ISO)
28596 iso-8859-6 阿拉伯字符 (ISO)
28597 iso-8859-7 希腊字符 (ISO)
28598 iso-8859-8 希伯来字符 (ISO-Visual)
28599 iso-8859-9 土耳其字符 (ISO)
28603 iso-8859-13 爱沙尼亚语 (ISO)
28605 iso-8859-15 拉丁语 9 (ISO)
29001 x-Europa 欧罗巴
38598 iso-8859-8-i 希伯来字符 (ISO-Logical)
50220 iso-2022-jp 日语 (JIS)
50221 csISO2022JP 日语(JIS- 允许 1 字节假名)
50222 iso-2022-jp 日语(JIS- 允许 1 字节假名 - SO/SI)
50225 iso-2022-kr 朝鲜语 (ISO)
50227 x-cp50227 简体中文 (ISO-2022)
51932 euc-jp 日语 (EUC)
51936 EUC-CN 简体中文 (EUC)
51949 euc-kr 朝鲜语 (EUC)
52936 hz-gb-2312 简体中文 (HZ)
54936 GB18030 简体中文 (GB18030)
57002 x-iscii-de ISCII 梵文
57003 x-iscii-be ISCII 孟加拉语
57004 x-iscii-ta ISCII 泰米尔语
57005 x-iscii-te ISCII 泰卢固语
57006 x-iscii-as ISCII 阿萨姆语
57007 x-iscii-or ISCII 奥里雅语
57008 x-iscii-ka ISCII 卡纳达语
57009 x-iscii-ma ISCII 马拉雅拉姆字符
57010 x-iscii-gu ISCII 古吉拉特字符
57011 x-iscii-pa ISCII 旁遮普字符
65000 utf-7 Unicode (UTF-7)
65001 utf-8 Unicode (UTF-8)

上表中,中文常用编码标识符是936(现为GBK编码,以前为GB2312编码)、54936(GB18030编码)、65001(UTF-8编码)。

QQXIUZI.CN 千千秀字