西文字符的编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、西文字符的编码
1.西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。
2.字符的编码:字符集中每一个字符各有一个代码,即字符的二进制表示,称为该字符的编码。
3.字符代码表:字符集中不同字符的编码互相区别,构成该字符集的代码表。
4.字符集和码
1)美国标准信息交换码( ):使用个二进位对字符进行编码(叫做标准码),称为标准。
2)基本的字符集共有个字符,个可打印字符(常用字母、数字、标点符号等)个控制字符,特殊字
符的码空格()、()、()、()
●数字,字母的码是连续的,对应大小写字母码相差。
●不同类型的码的十进制数值由小到大:数字、大写字母、小写字母
3)汉字的编码(一)
●汉字编码
A.第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉
语拼音等共个(统称为图形符号)
B.第二部分:一级常用汉字,共个,按汉语拼音排列
C.第三部分:二级常用字,共个,按偏旁部首排列
✓区位码:国标字符集构成一个二维平面,它分成行、列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用个字节来表示{如:“大”字的区号,位号,区位码是用个字节表示为:}
4)国标交换码:
●问题:信息通信中,汉字的区位码与通信使用的控制码(~)发生冲突。解决方案:为了避免
汉字区位码与通信控制码的冲突,规定,每个汉字的区号和位号必须分别加上()得到国标交换码。
5)机内码:
●问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,它