信息交换用汉字编码字符集

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《信息交换用汉字编码字符集--基本集》—即国家标准 GB2312-80

从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩瀚文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有3000多个汉字的累计使用频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。

1980年颁布了《信息交换用汉字编码字符集—基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。以前我国大陆的各种中文DOS版本、Windows3.1 /3.2版本,装入的字库都是国标一二级字库。

《GB2312-80》对 7445 个图形字符作了二进制数编码,这些图形字符是:

6763 个汉字,字体为简化字,分成两级。第一级汉字 3755 个,按拼音排序,约占近代文献汉字累计使用频度 99.9% 左右;二级汉字 3008 个,按部首、笔画排序。一、二级汉字约占累计使用频度 99.99% 以上。

202 个一般符号。其中包括 1.~20.,(1)~(20),①~⑩,(-)~(+) 等。

22 个数字。其中 0~9 共 10 个,Ⅰ~Ⅻ 共 12 个。

52 个拉丁字母。其中大写字母A~Z 26 个,小写字母a~z 26 个。

169 个日文假名。其中平假名 83 个,片假名 86 个。

48 个希腊字母。其中大写字母Α~Ω24 个,小写字母α~ω24 个。

66 个俄文字母。其中大写字母А~Я33 个,小写字母а~я 33 个。

26 个汉语拼音符号,包括带声调符号和其它符号的字母。

37 个汉语注音字母,ㄅ~ㄥ。

GB2312简体中文编码表

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F

A1A0 、。· ˉ ˇ ¨ 〃々—~‖ … ‘ ’

A1B0 “ ” 〔〕〈〉《》「」『』〖〗【】

A1C0 ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠

A1D0 ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵

A1E0 ∴ ♂ ♀ ° ′ ″ ℃ $¤ ¢£‰ § № ☆ ★

A1F0 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F

A2C0 ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾A2D0 ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ ④ ⑤ ⑥ ⑦

㈠㈡㈢㈣㈤㈥㈦㈧㈨㈩

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F A3A0 !"#¥%&'()*+,-./A3B0 0123456789:;<=>?A3C0 @ABCDEFGHIJKLMNOA3D0 PQRSTUVWXYZ[\]^_A3E0 `abcdefghijklmnoA3F0 pqrstuvwxyz{|} ̄

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F A4A0 ぁあぃいぅうぇえぉおかがきぎくA4B0 ぐけげこごさざしじすずせぜそぞたA4C0 だちぢっつづてでとどなにぬねのはA4D0 ばぱひびぴふぶぷへべぺほぼぽまみA4E0 むめもゃやゅゆょよらりるれろゎわ

A4F0 ゐゑをん

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F A5A0 ァアィイゥウェエォオカガキギクA5B0 グケゲコゴサザシジスズセゼソゾタA5C0 ダチヂッツヅテデトドナニヌネノハA5D0 バパヒビピフブプヘベペホボポマミA5E0 ムメモャヤュユョヨラリルレロヮワ

A5F0 ヰヱヲンヴヵヶ

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F A6A0 ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟ

A6B0 ΠΡΣΤΥΦΧΨΩ

αβγδεζηθικλμνξοA6D0 πρστυφχψω

A6E0 ︵︶︹︺︿﹀︽︾﹁﹂﹃﹄︻︼

A6F0 ︷︸︱︳︴

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F A7A0 АБВГДЕЁЖЗИЙКЛМНA7B0 ОПРСТУФХЦЧШЩЪЫЬЭ

A7C0 ЮЯ

абвгдеёжзийклмнA7E0 опрстуфхцчшщъыьэ

A7F0 юя

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F A8A0 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ

A8B0 ò ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê

A8C0 ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏA8D0 ㄐㄑㄒㄓㄔㄕㄖㄗㄘㄙㄚㄛㄜㄝㄞㄟ

A8E0 ㄠㄡㄢㄣㄤㄥㄦㄧㄨㄩ

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F

A9B0 ┌ ┍ ┎ ┏ ┐ ┑ ┒ ┓ └ ┕ ┖ ┗ ┘ ┙ ┚ ┛A9C0 ├ ┝ ┞ ┟ ┠ ┡ ┢ ┣ ┤ ┥ ┦ ┧ ┨ ┩ ┪ ┫A9D0 ┬ ┭ ┮ ┯ ┰ ┱ ┲ ┳ ┴ ┵ ┶ ┷ ┸ ┹ ┺ ┻A9E0 ┼ ┽ ┾ ┿ ╀ ╁ ╂ ╃ ╄ ╅ ╆ ╇ ╈ ╉ ╊ ╋

A9F0

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F

ACA0

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F

相关文档
最新文档