信息技术 信息交换用汉字编码字符 集基本集的

合集下载

GB2312GB_13000_GBKGB18030介绍讲解

GB2312GB_13000_GBKGB18030介绍讲解

1、GB2312、GB 13000、GBK、GB18030 介绍GB 2312:又称为GB 2312-80,是一个简体中文字符集的中国国家标准,于1980年由中国国家标准总局发布,1981年5月1日实施,全称为《信息交换用汉字编码字符集基本集》,规定了6763个汉字和682个非汉字图形。

GB 13000:为了便于多个文种的同时处理,国际标准化组织下属编码字符集工作组研制了新的编码字符集标准,ISO/IEC 10646。

该标准第一次颁布是在1993年,当时只颁布了其第一部分,即ISO/IEC 10646.1: 1993,我国相应的国家标准是GB 13000.1-93《信息技术通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面》。

制定这个标准的目的是对世界上的所有文字统一编码,以实现世界上所有文字在计算机上的统一处理。

GBK:随着信息技术在各行业应用的深入,GB 2312 收录汉字数量不足的缺点已经初步显露出来。

例如:"镕"字现在是高频率使用字,而GB 2312 却没有为它编码,因而,政府、新闻、出版、印刷等行业和部门在使用中感到十分不便。

1995年,全世界大多数的PC 操作系统都实现了16/32 位。

GB 13000.1 的实现出现了一线曙光。

一方面为了对GB 2312 进行扩充,一方面顺应当时技术的发展向GB 13000.1 推进,同时兼顾当时最广泛采用GB 2312 内码系统。

原电子部和原国家技术监督局联合颁布了指导性技术文件《汉字内码扩展规范》1.0版,即GBK 。

在GBK的内码系统中,GB 2312 汉字所在码位保持不便,这样,保证了GBK 对GB 2312 的完全兼容。

同时,GBK 内码与GB 13000.1 代码一一对应,为GBK 向GB 13000.1 的转换提供了解决办法。

微软对GB 2312 的扩展,也就是CP936 字码表(Code Page 936)的扩展(原来的CP936 和GB 2312-80 一模一样),最初出现于Windows 95 简体中文版中。

仿宋_gb2312

仿宋_gb2312

仿宋_GB2312是一种电脑字体,公文标准字体之一。

仿宋是字体名称,GB2312是字符编码名称,属简体中文编码的一种,简体中文自1980年代以来通常使用中华人民共和国国家标准总局公布的GB 2312,以及其后继的GBK和GB18030中文编码。

近年来随着Unicode跨语言编码集的出现,也被广泛使用,所以通常说的仿宋就基本上是仿宋_GB2312了。

一、名称简体中文系统环境支持国标 GB2312、GB18030 和 Unicode (UTF-8) 编码。

它们在系统中设置的locale(亦指语言别)名称为:1.国标 GB2312: zh_CNhp15CN2.国标 GB18030: zh_CNgb180303.Unicode (UTF-8): zh_CNutf8二、编码字节1.国标 GB2312 编码 (zh_CNhp15CN)国标 GB2312 是基于 1980 年发布的《信息交换用汉字编码字符集基本集》,是中文信息处理的中国国家标准,是强制执行的中文编码。

国标码共收录 6763 个简体汉字、682 个符号,其中汉字部分:一级字 3755 个,以拼音排序,二级字 3008 个,以偏旁部首排序。

该标准的制定和应用为规范、推动中文信息化进程起了很大作用。

该标准用双字节表示一个汉字:高字节A1-F7(其中字符区 A1-F9,汉字区 B0-F7)低字节 A1-FE2.国标 GB18030 编码 (zh_CNgb18030)国标 GB18030 基于 2000 年 3 月发布的《信息技术信息交换用汉字编码字符集基本集的扩充》,是最新推出的中国国家强制执行中文信息处理标准编码。

该标准涵盖了单字节、双字节、四字节的字符和汉字,共计约 28,000 多个。

三、如何设置打开WORD文档,温截选中文档里的文字。

单击字体,倘段下拉选择仿宋GB2312,如果没有这种字体,可以从网上下载安装。

选中文字设置为仿宋GB2312字体。

《计算机应用基础》练习题

《计算机应用基础》练习题

《计算机应用基础》练习题一,选择题1,计算机中存贮信息的最小单位是.A.字节B.ByteC.字D.Bit2,世界上第一台实现存储程序控制功能的计算机.A ENIACB EDV AC C EDSACD UNIV AC-I3,世界上第一台按存储程序控制功能设计的计算机 .A ENIACB EDV AC C EDSACD UNIV AC-I4,ASCII码是对进行编码的一种方案,它是的缩写.A,字符B,汉字C,图形符号D,声音E,余3码F,十进制数的二进制编码G,格雷码H,美国标准信息交换代码5,微机存储器容量的单位是.A, 位B,字节C,字D,bit6,微型计算机属于计算机.A 第一代B 第二代C 第三代D 第四代7,在计算机应用领域里, 是其最广泛的应用方面.A,过程控制B,科学计算C,数据处理D,计算机辅助系统8, 计算机软件一般可分为系统软件和应用软件两大类,其中系统软件的核心是.A,软件工具B,操作系统C,语言处理程序D,诊断程序9, 某编码方案用10位二进制数进行编码,最多可编个码.A,1000 B,10 C,1024 D,25610,在计算机技术中采用二进制,其主要原因是.A.由计算机电路所采用的器件决定,计算机采用了具有两种稳定状态的二值电路B.二进制数运算最简单C.二进制数表示简单,学习容易D.最早设计计算机的人随意决定的11,在下列不同进制的四个数中,数值最小的一个数是.A,(10011101)2 B,(158)10 C,(177)8 D,(A6)1612,地址是内存储器各存储单元的编号,现有一个32KB的存储器,用十六进制表示它的地址码,则地址码应从0000H到H.A.32767B. 8000C. 7FFFD. 8EEE13, 十进制数10000转换为等值的十六进制数是.A,271H B,23420H C,9C40H D,2710H14, 二进制数1010101.1转换为等值的八进制数是.A,125.1 B,125.4 C,524.1 D,55.415,计数制中使用的数码个数被称为.A. 基数B. 尾数C. 阶码D. 位权16,若要用二进制数表示100个字符,则需要个位.bA,6 B,7 C,10 D,100017,十进制数8000转换为等值的八进制数是.A,571(O) B,57100(O) C,175(O) D,17500(O)18,能进行逻辑操作的部件是.A,寄存器B,累加器C,控制器D,运算器19,用Windows 95 自带的画图程序建立的文件,其默认扩展名是.A,TXT B,DOC C,XLS D,BMP20,下列各种数制的数中,最小的数是.A.(1101011)2B.(45)10C.(74)8D.(3A)1621,在Excel 97中,公式"=SUM(B3:D5 C2:E3)"的含义是: .A,=B3+D6+C2+E3 B ,=C3+D3C,=B3+B4+B5+C3+C4+C5+D3+D4+D5+C2+D2+E2+E3D,=B3+B4+B5+C4+C5+D4+D5+C2+C3+D2+E2+E322,在Word 97中,要改变行间距,则应选择.A,"插入"菜单中的"分隔符" B,"格式"菜单中的"字体"C,"格式"菜单中的"段落" D,"视图"菜单中的"缩放"23,中文Windows 95中,在对显示器的设定中不具有的功能是.A,可设置计算机的开机口令B,可设定显示器分辨率C,可设定桌面墙纸D,可设置计算机的节能控制24,Word 97 中,文档保存默认的扩展名是.A,TXT B,RTF C,DOC D,EXE25, 某编码方案用8位二进制数对颜色进行编码,最多可表示种颜色.A,1000 B,10 C,1024 D,25626,地址是内存储器各存储单元的编号,现有一个4096个存储地址,用十六进制表示边它的地址范围是.A.0000H~FFFFHB.FFFH~1000HC. FFFH~FFFFHD. 000H~FFFH27,Word 97 中,图文框.A,文字环绕方式只有两种B,文字环绕方式多于两种C,可创建水印D,可与文字叠放28,一旦断电,数据就会丢失的存储器是.A,ROM B,RAM C,硬盘D,软盘29,2001年起所有的汉字系统都将统一到字符集上.A,GB18030-2000《信息技术,信息交换用汉字编码字符集基本集的扩充》B,GB2312-80《信息交换用汉字编码字符集基本集》C,GB2311-1990《信息处理七位和八位编码字符集代码扩充技术》D,GBK汉字集30,Word 97 中,文本框.A,文字环绕方式只有两种B,文字环绕方式多于两种C,随着框内文本内容的增多而增大文本框D,不可与文字叠放32, Windows95/98的系统工具中,磁盘碎片整理程序的功能是.A,把不连续的文件变成连续存储,从而提高磁盘读写速度B,把磁盘上的文件进行压缩存储,从而提高磁盘利用率C,诊断和修复各种磁盘上的存储错误D,把磁盘上的碎片文件删除掉33,在同一张软盘上,Windows 95中.A,允许同一文件夹中的文件同名,也允许不同文件夹中的文件同名B,不允许同一文件夹中的文件以及不同文件夹中的文件同名C,允许同一文件夹中的文件同名,不允许不同文件夹中的文件同名D,不允许同一文件夹中的文件同名,允许不同文件夹中的文件同名34,在Excel 97中,公式"=SUM(B2,C2:E3)"的含义是: .A,=B2+C2+C3+D2+D3+E2+E3 B,=B2+C2+E3C,=B2+C2+C3+E2+E3 D,=B2+C2+C3+D2+D335,一个汉字的机内码在计算机内占个二进制位,一个1616的汉字字形码在计算机内占个字节.A,2 B,16 C,32 D,6436,在Excel 97中,公式"=SUM(C2,E3:F4)"的含义是: .A,=C2+E3+E4+F3+F4 B,=C2+E3 C,=C2+E3+F4 D,=C2+F437, 一个3232点阵的汉字字形码在计算机内占个字节.A,32 B,72 C,128 D,102438, 某编码方案用10位二进制数对字符进行编码,最多可表示个字符.A,1024 B,10 C,128 D,25639,不能在Windows 95或DOS操作系统下可直接执行的程序文件名其扩展名是 . A,EXE B,BAT C,DOC D,COM40,计算机病毒的特点是.A,传染性,潜伏性,安全性B,传染性,潜伏性,破坏性C,传染性,破坏性,易读性D,传染性,安全性,易读性41,软盘的存取速度比硬盘.A,无法比较B,一样快C,慢的多D,差不多42,Windows 95提供了长文件名命名方法,一个文件名的长度最多可达到个字符(不包括最后自动加入的空字符).A,128 B,256 C,8 D,25543,有关创建文件夹的正确说法是.A,不能在桌面上创建文件夹B,无法在软盘中创建文件夹C,在文档的"另存为"对话框中也可创建文件夹D,无法在资源管理器的浏览窗口中新建文件夹44,Windows操作系统可同时运行个应用程序.A. 1B. 2C. 3D.多45,根据文件命名规则,下列字符串中合法文件名是.A,ADC*. FNT B,#ASK%. SBCC,CON. BAT D,SAQ/. TXT46,Windows 95自带的记事本,缺省打开的文件的扩展名是.A,TXT B,DOC C,WPS D,BMP47,下列设备中,不能作为输出设备的是.A, 鼠标器B, 磁盘驱动器C, 打印机D,显示器48,中文Windows 95中,按键,可在各种汉字输入方式之间切换.A,Ctrl+Space B,Shift+SpaceC,Alt+space D,Ctrl+Shift49,在下面四句话中,最能准确反映计算机主要功能的是.A,计算机可以代替人的脑力劳动B,计算机可以存储大量的信息C,计算机是一种信息处理机D,计算机可以实现高速运算50,在Excel 97中,A5单元格的值是A3单元格值与A4单元格值之和的负数,则公式可写为.A, A3+A4 B,A3A4 C,= A3+A4 D,A3+A451, 汉字输入法中是无重码的.A,五笔字型B,智能ABC C,区位码D,全拼输入法52,计算机在工作状态下想重新启动,可采用热启动,即可同时按下键(在Windows95下是关闭正在运行的程序).A,Ctrl+Alt+Break B,Ctrl+Alt+DelC,Ctrl+Break D,Ctrl+Shift+Del53,下列关于"快捷方式"的说法中,错误的是.A,可以使用快捷方式作为打开程序的捷径B,快捷方式的图标可以更改C,可以在桌面上创建打印机的快捷方式D,无法给文件夹创建快捷方式54, 操作系统是一种对计算机进行控制和管理的系统软件.A.硬件B.资源C.软件D.文件56,存储器的容量1GB是表示.A,1024 B,1024K C,1024KB D,1024MB58,在Windows 95/98中用鼠标选定不连续文件的操作是.A,单击第一个文件,然后单击另一个文件B,双击第一个文件,然后双击另一个文件C,单击第一个文件,然后按住Shift键单击另一个文件D,单击第一个文件,然后按住Ctrl键单击另一个文件59,Windows 95,98应用程序中的某一菜单的某条命令被选中后,该菜单又出现了一个子菜单,则该命令.A,后跟"" B,前有"√"C,呈暗淡显示D,后跟三角形符号60,在"任务栏属性"对话框中."开始菜单程序"选项卡中可以设置的项目有.A,删除"开始"菜单B,自定义桌面背景C,清除"文档"菜单的内容D,清除"回收站"61,在Excel 97 中,可以同时复制选定的数张工作表,方法是选定一份工作表,按下Ctrl 键,沿标签拖动到新位置,松开鼠标左键,如果选定的工作表并不相邻,那么复制的工作表.A,仍会一起被插入到新位置B,不能一起被插入到新位置C,只有一张工作表被插入到新位置D,出现错误信息62,在Word 97编辑过程中,欲把整个文本中的"计算机"都删除,最简单的方法是使用"编辑"菜单中的命令.A,清除B,撤消C,剪切D,替换63,在Word文档中要设置"页边距",则应该使用.A,"文件"菜单中的"页面设置"命令B,"文件"菜单中的"版心设置"命令C,"格式"菜单中的"段落"命令D,"格式"菜单中的"字体"命令64,在Excel 97 表格中,在对数据清单分类汇总前,必须做的操作是.A,排序B,筛选C,合并计算D,指定单元格65,在输入到Excel 97单元格中的公式中输入了未定义的名字,则在单元格中显示的出错信息是.A,# B,# NAME C,#NUM ! D,#REF !66, 计算机能直接执行的程序是.A,汇编语言程序B,机器语言程序C,BASIC程序D,C语言67,在Excel 97中,若对某工作表重新命名,可采用.A,单击工作表标签B,双击工作表标签C,单击表格标题栏D,双击表格标题栏68,WINDOWS95/98自带的文字编辑程序:记事本,缺省打开的文件的扩展名是. A,TXT B,DOC C,WPS D,BMP69,在Excel 97中,公式"COUNT(C2:E3)"的含义是: .A,计算区域C2:E3内数值的和B,计算区域C2:E3内数值的个数C,计算区域C2:E3内字符个数D,计算区域C2:E3内数值为0的个数70,根据文件命名规则,下列字符串中是合法文件名的是.A,AB*.FNT B,AS-F@!.C2M C,PRN.PRG D,CD .TXT71,关于CPU,以下说法错误的是.A,CPU是中央处理器的英文简称B,CPU是电脑的核心部件C,CPU是运算器和控制器的合称D,CPU由运算器和内存组成72,在Windows中,剪贴板的功能是剪切,复制或粘贴信息,只要在Windows界面,剪切板一直处于状态.A,关闭B,激活C,不可知D,取消73,要运行一个程序文件,则它必须被装人到中.A.RAMB.ROMC.CD-ROMD.EPROM74,在Word 97 中,有关"样式"命令,以下说法中正确的是.A,"样式"只适用于文字,不适用于段落B,"样式"命令在"工具"菜单中C,"样式"命令在"格式"菜单中D,"样式"命令只适用于纯英文文档75,应用软件时指.A,所有能够使用的软件B,能被各应用单位共同使用的某种软件C,所有微机上都应使用的基本软件D,专门为某一应用目的而编制的软件76,Windows 95用来和用户进行信息交换的是.A,菜单B,工具栏C,对话框D,应用程序77,Windows 95 中生成启动盘是在对话框中选择"启动盘"标签,单击"创建启动盘"按钮即可创建启动盘.A,"添加/删除程序属性" B,"系统" C,"资源管理器" D, "设备"78,下面列出的计算机病毒传播途径,不正确的是.A,使用来路不明的软件B,通过借用他人的软盘C,机器使用时间过长D,通过网络传输79,操作系统是一种对进行控制和管理的系统软件A.全部硬件资源B.计算机所有资源C.全部软件资源D.应用程序80,在下列有关回收站的说法中,正确的是.A,扔进回收站中的文件,仍可再恢复B,无法恢复进入回收站的单个文件C,无法恢复进入回收站的多个文件D,如果删除的是文件夹,"回收站"窗口只显示文件夹名81,在Excel中,单元格地址是指.A,每个单元格B,每个单元格的大小C,单元格所在的工作表D,单元格在工作表中的位置82,Internet的前身是美国国防部资助建成的网.A,ARPA B,Intranet C,UNIX D,TCP/IP83,"自动图文集"与"自动更正"不同之处在于.A,"自动图文集"与"自动更正"在操作和功能上均相同B,"自动图文集"能自动产生图文,"自动更正"限于自动校正C,"自动更正"需要得到用户的确定后才可执行某命令,"自动图文集"则不必D,"自动图文集"用"F3"键激活,"自动更正"用Space 键激活84,标准ASCII 码在计算机中的表示方法准确的描述是.A,使用8位二进制数,最高位一位为1B,使用8位二进制数,最低位一位为0C,使用8位二进制数,最高位一位为0D,使用8位二进制数,最低位一位为185,在Windows中,按______键可以切换中,英文输入.A,Ctrl+Enter B,Ctrl+Space C,Ctrl+Shift D,Shift+Space86,在Word 97 文档中,要把多处同样的错误一次更正,正确的方法是.A,用插入光标逐字查找,先删除错误文字,再输入正确文字B,使用"编辑"菜单中的"替换"命令C,使用"撤消"菜单中的"恢复"命令D,使用"定位"命令87,用鼠标左键单击选定一个文件或文件夹后拖曳到位于与源盘不同盘的目标盘或目标文件夹时实现了文件或文件夹的.A,移动B,复制C,剪切D,删除88,中央处理器是由组成的.A,内存储器和控制器B,内存储器和运算器C, 内存储器,控制器和运算器D,控制器和运算器89,计算机网络的最主要的功能是.A,平衡负载B,网络计算C,资源共享D,信息传输90,TCP/IP 是.A,网络名B,网络协议C,网络应用D,网络服务91,要使用外存储器中的信息,应先将其调入.A,控制器B,运算器C,微处理器D,内存储器92,在Excel 97工作表中,A5单元格的值小于60,则A3单元格为"不及格",否则为"及格",则A3单元格的公式可写为.A,= A5 60 B,=IF (A5<60,"不及格","及格")C,= A3 D,=IF (A5<60,"及格","不及格")93,操作系统是的接口.A,高级语言和机器语言B,CPU和外部设备C,用户与计算机D,指令和计算94,将模拟信号转换成数字化的电子信号再送上通信线路.这个处理过程称为.A,调制B,解调C,压缩D,解压缩95,下述哪个不属于浏览器.A,Netscape B,Internet Explorer C,Opera D,Outlook Express96,PowerPoint 97 中改变正在编辑的演示文稿模板的方法是.A,"格式"菜单下的"应用设计模板"命令B,"工具"菜单下的"版式"命令C,"幻灯片放映"菜单下的"自定义动画"命令D,"格式"菜单下的"幻灯片版式"命令97,下列设备中,既可作为输入设备又可作为输出设备的是.A,鼠标器B,键盘C,打印机D,调制解调器98,下面不属于顶级域名类型的是.A,com B,fuc C,gov D,net99,汉字机内码在计算机中的表示方法的描述是.A,使用二个字节,每个字节最高位一位为1B,使用二个字节,每个字节最低位一位为0C,使用二个字节,每个字节最高位一位为0D,使用二个字节,每个字节最低位一位为1100,计算机的运算速度单位MIPS指的是.A,1百万条程序/秒B,1百万条命令/秒C,百万条指令/秒D,1百万个字节/秒101,个人用户访问Internet 最常用的方式是.A,公共电话网B,名录服务C,索引服务D,交互式服务102,在Excel97中,下面的输入,能直接显示产生1/5数据的输入方法是.A,1/5 B,0 1/5 C,0.2 D,2/10103,CPU直接访问的存储器是.A,内存B,磁盘C,光盘D,硬盘104,Internet上占比例最大的服务项目之一是.A,E-Mail B,Gopher C,Telnet D,W AIS105,一台完整的微型机是由存储器,输入设备,输出设备和组成.A,硬盘B,软盘C,键盘D,中央处理器106,GB2312-80《信息交换用汉字编码字符集基本集》纸收集了6763 个汉字.在Windows95/98下,正确的说法是.A,可以处理的汉字个数只有6763 个B,可以处理的汉字个数可达2万多个C,有些生僻的字是不能输入的D,繁体字是不能输入的107,PowerPoint中在当前打开的演示文档上设计基本动画是在.A,"幻灯片放映"菜单中的"自定义动画"B,"幻灯片放映"菜单中的"预设动画"C,"幻灯片放映"菜单中的"基本动画"D,"幻灯片放映"菜单中的"动作设置"108,选出不是上网方式的选项.A,ICP B,ISDN C,DDN D,拨号上网109,Windows95/98是单用户多任务的图形界面操作系统,而DOS是操作系统. A,单用户单任务的字符界面B,多用户单任务的字符界面C,单用户多任务的字符界面D,多用户多任务的字符界面二,判断题1,字长是衡量计算机精度和运算速度的主要技术指标.2,Word 97 中宏是一段定义好的操作,它可以是一段程序代码,也可以是一连串的操作命令.3, Windows 95中回收站实际上是一个特殊的文件夹 .4,存储地址是存储器存储单元的编号,CPU要存取某个存储单元的信息,一定要知道这个存储单元的地址,并通过地址线中的地址信号去找到这个地址单元.5,ROM中存储的信息断电即消失.6,计算机只要安装了防毒,杀毒软件,上网浏览就不会感染病毒.7,Windows95回收站中的文件不占有硬盘空间.8,Windows 95/98的记事本和写字板都不能插入图片.9,Windows 95应用程序中的某一菜单的某条命令后跟三角形符号,该命令被选中将出现一个对话框.10,计算机中能进行逻辑操作的部件是控制器.11,Word 文档中绘图层一般在文本层之下.12,在Excel 97表格中,单元格的数据填充不一定在相邻的单元格中进行.13,Word 97 中能打印不连续的若干页,但不能只打印某段文本或图片.14,在Excel 97表格中,在对数据清单分类汇总前,必须做的操作是排序.15,在Windows 95 中有两种窗口:应用程序窗口和文档窗口,它们都有各自的菜单栏,所以可以用各自的命令进行操作.16,Windows95/98中,回收站是一个文件夹.17,Word97 中段落标记不仅标明一个段落的结束,同时还带有一个段落的格式编排. 18,Windows 95 中剪贴板是硬盘中一个临时存放信息的特殊区域.19,在Windows 95 中,欲打开最近使用的文档,可以单击"开始"按钮,然后指向文档. 20,Word 文档中不能插入声音和影片.21,调制是将计算机输出的数字信号转变成一串不同频率的模拟信号,通过电话线传输出去.22,Windows 95 自带的写字板能编辑打印各种文件,它能进行图文混排.23,Windows95/98中,"开始"按钮的位置和大小不能改变.24,计算机中用来表示内存储容量大小的最基本单位是位.25,Windows 95 提供直接电缆连接网络驱动程序,在两台计算机的串行口或并行口之间连接电缆,就可以建立一个简单的双机对等网.26,Word 97 中的图文框能与文字进行叠放.27,Excel 97 中单元格引用中,单元格地址不会随位移的方向与大小而改变的称为相对引用.28,Windows 95/98 中的"回收站"主要用来存放从软盘上删除的对象,如文件,文件夹,或快捷方式等.29,文本文件中可以插入图片.30,在Windows 95/98中,将鼠标指针指向菜单栏,拖动鼠标能移动窗口位置.31,在Windows 95 中任务栏的位置和大小是可以由用户改变的.32,Windows 95 自带的记事本能编辑打印各种文件,它能进行图文混排.33,Windows 95 对等网上,所有打印机,CD-ROM驱动器,硬盘驱动器,软盘驱动器都能共享.34,在Windows 95 具有即插即用功能,所以只要把打印机连上即可打印文件.35,在Windows 95/98中打开某个文件是将该文件从磁盘上调入CPU.36,Word 97 可以把正在编辑的Word文档保存为纯文本文件.39,在Internet上,每一个电子邮件用户所拥有的电子邮件地址称为E-mail地址,它具有如下统一格式: 用户名@主机域名40,PrintScreen与Alt+PrintScreen 命令都是把当前屏幕的内容送到剪贴板上.41,Word 97 中宏录制器能录制文档正文中的鼠标操作和键盘操作.42,对象嵌入是把源文档的信息移动或复制到目标文档中,作为目标文档的一部分.43,TCP/IP是Internet使用的一种网络协议,这是全世界认可的事实上的网络互联标准.45,Windows 95/98是一个多用户多任务的操作系统.46,在多用户使用的情况下,每个用户可以有不同的桌面背景.47,Windows 95/98 操作系统的TrueType字体是不可以缩小和放大的.48,Word 97 中删除段落标记也就删除了段落的格式.49,在资源管理器中删除的文件或文件夹都可以通过回收站进行恢复.51,Windows 95自带的文字编辑程序:记事本,缺省打开的文件的扩展名是DOC52,Excel 97 中的公式输入到单元格中后,单元格中会显示出计算的结果.54,Excel 97 中单元格引用中,单元格地址会随位移的方向与大小而改变的称为绝对引用.55,在Word 97 中,可在标尺上直接对文档进行段落首行缩进操作.56,在Windows 95/98下的一个文件夹名为My Docunemts,它由一个DOS 名为MYDOCU~1, 可在其DOS方式下使用.57,在Windows 95的资源管理器中不能查看磁盘的剩余空间.58,汇编语言和机器语言都属于低级语言,但不一定都能被计算机直接识别执行.59,在Word97 中,将鼠标指针指向标题栏,拖动鼠标能改变窗口大小.60,在Excel 97 工作表中,若在单元格C1中存储一公式A$4,将其复制到H3单元格后,公式仍为A$4.61,Word 97 的表格大小是没有限制的.62,Windows 95各应用程序间复制信息是通过剪帖板完成的.63,Word 97 中能实现一次打印多个文档.64,Word 97 中,利用图文框和文本框都可以实现对象的随意定位,移动和缩放.65,Excel 97 中新建的工作簿里都只有三张工作表.66,万维网(WWW)是一种广域网.67,在Windows 95 中,一个文件只能由一种程序打开.68,PowerPoint 97 提供的设计模板只包含预定义的各种格式,不包含实际文本内容.69,在Word 97 中,建立交叉引用的项目必须在同一个文件中.70,Excel 97 中单元格中输入公式后,显示出以"#"开头的信息,则表示公式有错.71,在Word 97 中,要在每一页中放置相同的水印,必须放在页眉和页脚中.72,Word 97 中可以方便地将文本转换为表格,但反之不行.73,Windows 95 操作系统具有即插即用功能,只要将硬件安装在计算机上即能使用.75,Word 97 中的图文框随着框内文本内容的增多而增大.76,Excel 97 中单元格中可输入公式,但单元格正真存储的是其计算结果.77,Word 97 可以把正在编辑的Word文档保存为纯文本文件,它没有特殊的内部格式,具有通用性.78,Windows 95自带的各种汉字输入方法中,无重码的汉字输入方法是ASCII码.79,在Windows95的桌面上能打开多个窗口,活动窗口必定是处在最前面的窗口.81,Word 97 可以把正在编辑的Word文档保存为Wed页格式的文件.83,在Windows95中,删除桌面的快捷方式,它所指向的项目也同时被删除.84,屏幕保护程序只是一种装饰,不能减小屏幕损耗和保障系统安全.85,Excel 97 可以把正在编辑的工作簿保存为文本文件.86,Excel 97 中的工作簿是工作表的集合.87,Word 文档中文本层是用户在处理文档时所使用的层.88,双击注册了文件类型的文档,能够启动相应的应用程序并同时将改文件打开.89,Excel 97 中的工作簿是工作表的集合,一个工作簿文件的工作表的数量是没有限制的.90,Word 97中使用首字下沉功能后,下沉后的字实际也变为一个图文框.92,对Excel 97 的工作表中的数据可以建立图表,图表一定存放在同一张工作表中. 93,Windows 95 中回收站用来保存磁盘上删除的对象.94,PowerPoint 97 提供的内容模板只包含预定义的各种格式,不包含实际文本内容.但提供建议内容和演播方式.96,Excel97 提供了许多内部函数,不允许用户自定义函数.98,FTP 是在Internet 上进行文件传输的一种协议.100,在Internet 上的计算机必须拥有一个唯一的IP地址.101,对Excel 97 中数据清单中的记录进行排序只能进行升序排列.102,PowerPoint在放映幻灯片时,必须从第一张幻灯片开始放映.103,Word 97 中的文本框随着框内文本内容的增多而增大.104,在Excel 97 中,"跨列居中"与合并单元格然后再居中是一样的.105,用户没有登录到Internet 上,不能发送和接收邮件.106,计算机要运行某个程序都必须将其调入RAM中才能运行.107,Excel 97 中分类汇总后的数据清单不能再恢复原工作表的记录.108,Word 97 中的文本框能与文字进行叠放.109,操作系统是一种对所有硬件进行控制和管理的系统软件.110,决定计算机计算精度的主要技术指标是计算机的存储容量.三,填空题1,存储程序是指把和存入中,这是计算机能够自动,连续工作的先决条件.2,用2424点阵的汉字字模存储汉字,每个汉字需字节.8836个汉字需要存储容量MB.3,计算机的工作过程实际上是周而复始地, 的过程.4,正确的打字指法应将左手食指放在键上方,右手食指放在键上方.5,计算机系统中的硬件主要包括, , , , 五大部分.6,计算机病毒是一种计算机系统正常运行为目的的软件.7,计算机病毒的主要特点是传染性, , , .8,计算机总线可分为三种总线, 总线, 总线.9,设有3K个存储地址,那么使用十六进制地址的范围是000 H到H .10, 十进制数145,875转换成二进制数,其值为;转换成十六进制数,其值为.11,Word 文档中插入图形时,图形与图形文件之间可以是链接关系,这样可Word文档的文件长度,12,用户刚输入的信息在保存以前,它存放在中,为防止断电后丢失,应在关机前将信息保存到中.13,著名数学家冯诺依曼(von Neumann)提出了和的概念.。

信息交换用汉字编码字符集

信息交换用汉字编码字符集

《信息交换用汉字编码字符集--基本集》—即国家标准 GB2312-80从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩瀚文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有3000多个汉字的累计使用频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。

1980年颁布了《信息交换用汉字编码字符集—基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。

以前我国大陆的各种中文DOS版本、Windows3.1 /3.2版本,装入的字库都是国标一二级字库。

《GB2312-80》对 7445 个图形字符作了二进制数编码,这些图形字符是:6763 个汉字,字体为简化字,分成两级。

第一级汉字 3755 个,按拼音排序,约占近代文献汉字累计使用频度 99.9% 左右;二级汉字 3008 个,按部首、笔画排序。

一、二级汉字约占累计使用频度 99.99% 以上。

202 个一般符号。

其中包括 1.~20.,(1)~(20),①~⑩,(-)~(+) 等。

22 个数字。

其中 0~9 共 10 个,Ⅰ~Ⅻ 共 12 个。

52 个拉丁字母。

其中大写字母A~Z 26 个,小写字母a~z 26 个。

169 个日文假名。

其中平假名 83 个,片假名 86 个。

48 个希腊字母。

其中大写字母Α~Ω24 个,小写字母α~ω24 个。

66 个俄文字母。

其中大写字母А~Я33 个,小写字母а~я 33 个。

信息交换用汉字编码字符集[指南]

信息交换用汉字编码字符集[指南]

信息交换用汉字编码字符集《信息交换用汉字编码字符集》是由我国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。

它是计算机可以识别的编码,适用于汉字处理、汉字通信等系统之间的信息交换。

基本集共收入汉字6763个和非汉字图形字符682个。

整个字符集分成94个区,每区有94个位。

每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。

这个码是唯一的,不会有重码字。

把换算成十六进制的区位码加上2020H,就得到国标码。

国标码加上8080H,就得到常用的计算机机内码。

1995年又颁布了《汉字编码扩展规范》(GBK)。

GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20902字。

信息交换用汉字编码字符集和汉字输入编码之间的关系是,根据不同的汉字输入方法,通过必要的设备向计算机输入汉字的编码,计算机接收之后,先转换成信息交换用汉字编码字符,这时计算机就可以识别并进行处理;汉字输出是先把机内码转成汉字编码,再发送到输出设备。

GB 2312GB 2312或GB 2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集•基本集》,又称为GB0,由中国国家标准总局发布,1981年5 月1日实施。

GB2312编码通行于中国大陆;新加坡等地也采用此编码。

中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。

GB 2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。

《大学计算机基础教程》习题参考答案

《大学计算机基础教程》习题参考答案

《大学计算机基础教程》习题参考答案习题一一、选择题1.从第一台计算机诞生到现在的50多年中,按计算机采用的电子器件来划分,计算机的发展经历了()个阶段。

A) 4 B) 6 C) 7 D) 32.在软件方面,第一代计算机主要使用()。

A) 机器语言 B) 高级程序设计语言C) 数据库管理系统 D) BASIC和FORTRAN3.一个完整的计算机系统通常应包括()。

A) 系统软件和应用软件 B) 计算机及其外部设备C) 硬件系统和软件系统 D) 系统硬件和系统软件4.计算机辅助教学的英文缩写是()。

A) CAD B) CAI C) CAM D) CAT5.在《信息交换用汉字编码字符集基本集》中,共包含()。

个汉字和图形符号。

A) 6763 B) 12000 C) 682 D) 74456.计算机的存储系统通常包括()。

A) 内存储器和外存储器 B) 软盘和硬盘 C) ROM和RAM D) 内存和硬盘7.在计算机内部,计算机能够直接执行的程序语言是()。

A) 汇编语言 B) C++语言 C) 机器语言 D) 高级语言8.主要决定微机性能的是()。

A) CPU B) 耗电量 C) 质量 D) 价格9.下列四条叙述中,正确的一条是()。

A) 操作系统是一种重要的应用软件B) 外存中的信息可直接被CPU处理C) 用机器语言编写的程序可以由计算机直接执行D) 电源关闭后,ROM中的信息立即丢失10.在微型计算机中,I/O设备的含义是()。

A) 输入设备 B) 输出设备 C) 输入输出设备 D) 控制设备11.所谓应用软件,指的是()。

A) 所有能够使用的工具软件 B) 能被各应用单位共同使用的某种特殊软件C) 专门为某一应用目的而编制的软件 D) 所有微机上都应使用的基本软件12.微型计算机的发展是以()技术为特征标志。

A) 存储器 B) 操作系统 C) 微处理器 D) 显示器和键盘13.微型计算机的总线一般由()组成。

江苏师范大学 计算机应用 课程单元04答案

江苏师范大学  计算机应用  课程单元04答案

课程单元04单选题(共25题,每题4分)1 .从本质上说,汉字国标码属于______码。

2 .存储一副未经压缩的640×480像素黑白位图图像,所占的磁盘空间约为______。

3 .一个汉字的十六进制国标码是“6F08”,则该汉字的二字节十六进制内码是______。

4 .以下选项中哪种不是汉字的输入码?5 .下列选项中,______不是多媒体技术的特征。

6 .在标准的汉字编码表中有94行、______列。

7 .在计算机中,使用8位ASCII码表示字符的二进制代码,其十六进制值小于______。

8 .按对应的ASCII值来比较,正确的是______。

9 .多媒体技术中的媒体是指______,如数字、文字、声音、图形和图像等。

10 .汉字国标码把汉字分为______等级。

11 .GB2312编码的一个汉字和ASCII编码的一个英文字母在微型机中存储时所占字节数的比值为______。

12 .模拟音频处理需要经过______、量化、编码的过程才能转化为数字音频。

13 .数字、声音、图像、图形和______属于信息载体。

14 .下列属于多媒体操作系统的是______。

15 .用WINDOWS中的“录音机”软件录制声音文件,是将声音模拟信号_____。

16 .在国标GB212-80信息交换用汉字编码字符集(基本集)中,使用频率较高的常用汉字为一级汉字,它是按______顺序排列的。

17 .存储800个24×24点阵的汉字字形所需的存储容量是_____KB。

18 .以44.1KHZ对某声音进行采样,量化位数为16,声道为双声道连续采样20秒,则该音频需要占据的存储容量约为______。

19 .用拼音法输入汉字“国”,拼音是“guo”。

那么,“国”的汉字内码占用字节的个数是______。

20 .汉字系统中的汉字字库里存放的是汉字的______。

•A.21 .英文字母“A”的十六进制ASCII码值比英文字母“a”的十六进制ASCII码值______。

GB2312GB_13000_GBKGB18030 介绍

GB2312GB_13000_GBKGB18030 介绍

1、GB2312、GB 13000、GBK、GB18030 介绍GB 2312:又称为GB 2312-80,是一个简体中文字符集的中国国家标准,于1980年由中国国家标准总局发布,1981年5月1日实施,全称为《信息交换用汉字编码字符集基本集》,规定了6763个汉字和682个非汉字图形。

GB 13000:为了便于多个文种的同时处理,国际标准化组织下属编码字符集工作组研制了新的编码字符集标准,ISO/IEC 10646。

该标准第一次颁布是在1993年,当时只颁布了其第一部分,即ISO/IEC 10646.1: 1993,我国相应的国家标准是GB 13000.1-93《信息技术通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面》。

制定这个标准的目的是对世界上的所有文字统一编码,以实现世界上所有文字在计算机上的统一处理。

GBK:随着信息技术在各行业应用的深入,GB 2312 收录汉字数量不足的缺点已经初步显露出来。

例如:"镕"字现在是高频率使用字,而GB 2312 却没有为它编码,因而,政府、新闻、出版、印刷等行业和部门在使用中感到十分不便。

1995年,全世界大多数的PC 操作系统都实现了16/32 位。

GB 13000.1 的实现出现了一线曙光。

一方面为了对GB 2312 进行扩充,一方面顺应当时技术的发展向GB 13000.1 推进,同时兼顾当时最广泛采用GB 2312 内码系统。

原电子部和原国家技术监督局联合颁布了指导性技术文件《汉字内码扩展规范》1.0版,即GBK 。

在GBK的内码系统中,GB 2312 汉字所在码位保持不便,这样,保证了GBK 对GB 2312 的完全兼容。

同时,GBK 内码与GB 13000.1 代码一一对应,为GBK 向GB 13000.1 的转换提供了解决办法。

微软对GB 2312 的扩展,也就是CP936 字码表(Code Page 936)的扩展(原来的CP936 和GB 2312-80 一模一样),最初出现于Windows 95 简体中文版中。

gat 751-2008视频图像文字标注规范

gat 751-2008视频图像文字标注规范

视频图像文字标注规范1 范围本标准规定了视频会议系统和视频监控系统所使用的图像及利用这些系统(或其它方式)采集到的图片进行文字标注的内容和方法。

本标准适用于公安机关视频会议和监控系统的图像、图片的信息标注。

2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。

凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。

凡是不注日期的引用文件,其最新版本适用于本标准。

GB/T 2260 中华人民共和国行政区划代码3 术语和定义文字:包括中外文、少数民族文字,数字、字母、符号。

视频会议:采用视频技术,通过视频、频音传输,完成远程可见会议。

图像:指视频监控系统、视频会议系统中的动态视频和从动态视频中抓取到的单帧画面。

4 标注的字符标注时,一般不采用图片镶嵌方式标注,除个别确无法用中文标注的情况外,应采用16×16点阵简体中文汉字(字符集采用GB 18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》)和数字、字母、符号标注。

汉字要求字体为标准宋体,正方形,无空心、下划线、粗体等修饰,颜色为白色。

字符标注要求100%透明,即除了组成字符的点线图案外,字符空白处能正常显示原图像、图片的信息。

标注用汉字标准大小为图像或图片长和宽中较短边的1/15,要求误差不超过文字标准大小的1/20;小号汉字大小为标准汉字大小的2/3。

半角符号高度与汉字一致,宽度为汉字的一半,字间距为0。

未特别注明时,标注内容均采用上述标准汉字尺寸。

5 标注的内容标注内容主要包括图像产生的地理位置信息和图像生成设备的技术属性信息及时间信息等。

5.1地点信息用于标识图像产生地的本地信息,即在辖区内的当地称谓。

地点信息应不多于16个字符。

在视频会议系统中,如果辖区内存在多个视频会议室或桌面视频会议终端时,需要标注各会议室或桌面终端的位置。

中职计算机题库各章题目汇总:第一章计算机基础知识04

中职计算机题库各章题目汇总:第一章计算机基础知识04

中职计算机题库各章题目汇总120、下列各不同进制的四个无符号数中,最小的数是。

A)二进制数11011001 B)八进制数37C)十进制数75 D)十六进制数2A121、下列各无符号十进制数中,能用八位二进制表示的是。

A)296 B)333 C)256 D)199122、微型计算机能处理的最小数据单位是。

A)ASCII码字符 B)字节C)字符串 D)比特(二进制位)123、微机中1K字节表示的二进制位数是。

A)1000 B)8*1000 C)1024 D)8*1024124、下列字符中,ASCII码值最小的是。

A)a B)A C)x D)Y125、存储400个24×24点阵汉字字形所需的存储容量是。

A)255KB B)75KB C)37.5KB D)28.125KB 126、存放10个16×16点阵的汉字字模,需占存储空间为。

A)64B B)128B C)320B D)1KB127、下列字符中,其ASCII码值最在的是。

(1999年下)A)9 B)D C)a D)y128、在计算机领域中,通常用英文单词“BYTE”来表示。

A)字 B)字长 C)二进制位 D)字节129、微型计算机中使用最普遍的字符编码是。

A)EBCDIC码 B)国标码 C)BCD码 D)ASCII码130、下列四条叙述中,正确的一条是 .A)字节通常用英文单词“bit”来表示B)目前广泛使用的Pentium机其字长为五个字节C)计算机存储器中将八个相邻的二进制位作为一个单位,这种单位称为字节D)微型计算机的字长并不一定是字节的倍数131、存储容量1GB等于。

A)1024B B)1024KB C)1024MB D)128MB132、下列字节符中ASCII码值最小的是。

A)A B)a C)k D) M133、存储一个32×32点阵汉字字型信息的字节数是。

A)64B B)128B C)256B D)512B134、微型计算机中存储数据的最小单位是。

关于GB18030汉字编码标准集

关于GB18030汉字编码标准集

关于GB18030汉字编码标准集 2001/07/26 赛迪网-中国计算机报林宁清华大学经济管理硕士,信息产业部电子工业标准化研究所副所长,全国信息技术标准化技术委员会副秘书长,承担多项国家级项目的标准化工作,并曾出版多本著述。

国家标准GB18030-2000《信息交换用汉字编码字符集基本集的扩充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是未来我国计算机系统必须遵循的基础性标准之一。

为保证该标准顺利贯彻执行,国家质监总局将在9月1日起首先对影响广泛的计算机操作系统进行执法检查,凡不符合该标准的产品,视为不合格产品。

为此,全国信息技术标准化技术委员会将根据有关标准和规范,组织对市场上主要的操作系统产品进行标准符合性检测。

检测要求及标准的制定1.须经检测的产品范围GB18030是信息产品必须遵循的基础性标准,考虑到一些客观实际,采取从基础抓起,分步实施的策略。

本次对必须经检测产品的范围规定如下:●个人计算机操作系统产品须经标准符合性测试,其他产品暂不做要求;●凡是在GB 18030发布日期(2000年3月17日)前正式发布或出厂的产品,视为历史性产品,不在GB 18030的监督检查范围之内;●在2000年3月17日后对历史性产品的更新版本或升级版本作为新产品对待;●凡是在GB 18030实施过渡期间(即2000年3月17日至2001年8月31日)正式发布或出厂的产品,应符合GB 18030相关要求。

不符合标准要求的产品应采用补救措施,以达到符合标准的相关要求。

补救措施应得到全国信息技术标准化技术委员会的认可;●凡是在GB 18030过渡期(即2001年8月31日)后正式发布或出厂的产品,必须符合GB 18030相关要求。

2.关于标准符合性测试为了配合GB 18030的实施,信息处理产品标准符合性检测中心(设在信息产业部电子工业标准化研究所)开展了GB 18030各项测试的准备工作,并且对国内外多个产品进行了测试。

银行信息系统生僻字问题探究

银行信息系统生僻字问题探究

《金融发展研究》第2期DOI :10.19647/ki.37-1462/f.2021.02.011银行信息系统生僻字问题探究马征(中国人民银行济南分行,山东济南250021)一、信息系统字符集情况介绍(一)字符集概述字符是各种文字和符号的总称,包括各国文字、标点符号、图形符号、数字等。

字符集(Character set )是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,目前汉字字符集主要有:《信息交换用汉字编码字符集基本集》(GB2312-1980),《汉字内码扩展规范》(GBK ),《信息技术信息交换用汉字编码字符集基本集的扩充》(GB18030-2000),《信息技术中文编码字符集》(GB18030-2005),《信息技术通用多八位编码字符集(UCS )》(GB13000-2010)。

国外软件系统考虑跨语言、跨平台处理需求,常用的字符集为Unicode ,在操作系统、应用程序中广泛应用。

从执行效力看,Unicode 与GBK 为行业性规范,GB2312-1980、GB13000-2010为国家推荐性标准,GB18030-2000和GB18030-2005为国家强制性标准。

GB18030-2005现已代替GB18030-2000,其与GB18030-2000相同部分为强制性。

从兼容、支持角度看,GB18030-2005能够与GB2312-1980完全兼容,与GBK 基本兼容,支持Unicode 4.0的全部统一汉字。

GB13000-2010等同于国际标准化组织(ISO )发布的通用多八位编码字符集(ISO/IEC 10646:2003)和多语言软件制造商联盟发布的统一码(Unicode 4.0)。

详细信息见表1。

(二)银行字符集采用情况以某省城市商业银行和农联社的487个信息系统为样本,统计其所涉操作系统、数据库、对外接口及应用(包括中间件、报文传输、源代码)字符集情况。

从统计结果看,操作系统、数据库、对外接口及应用采用的字符集主要是Unicode 、GBK ,少数为GB2312、GB18030,且支持GB18030的全部为Linux 平台,行业性规范成为应用主流,国家标准反而应用较少,详细情况见表2。

编码字符集标准及分类研究_谢谦

编码字符集标准及分类研究_谢谦

中 文 信 息 学 报第20卷第5期 J OURNAL OF CH I NESE I NF OR MATI O N P ROCESSI NG V ol.20N o.5文章编号:1003-0077(2006)05-0083-08编码字符集标准及分类研究谢 谦1,2,芮建武1,吴 健1(1.中国科学院软件研究所开放系统与中文信息处理中心,北京 100080;2.河南大学计算机与信息工程学院,河南开封 475001)摘要:编码字符集标准是计算机处理文字信息的基础,本文提出了编码字符集三元组抽象,对现有编码字符集标准进行了简单回顾和总结,深入剖析了影响巨大的ISO2022标准及其派生标准,对ISO2022编码机制应用于多语言环境的局限性进行了探讨,阐明了使用通用编码字符集UCS的必要性,并对其进行了分析。

探讨了现有编码分类方法存在的问题,引入了一种对编码字符集以及实现方法进行分类的新方法,使用该方法对现有标准进行了归类;最后对汉字字符集相关的国家标准进行了分析评介。

关键词:计算机应用;中文信息处理;编码字符集中图分类号:TP391 文献标识码:AResearch on Coded Character Set Standards and C lassificationX I E Q ian1,2,RU I Jian-wu1,W U Jian1(1.Open Syste m and Ch i nes e Infor m ati on Processi ng Cen ter,Institute of Soft w are,C h i nes e A cade m y of S ci en ces,B eiji ng100080,Ch i na;2.S chool of Compu t er and In for m ation Engineeri ng,H enan Un i versity,Kaifeng,H enan475001,Ch ina)Ab strac t:Coded character se t standa rd are t he base s of t he co m puter t ex t infor m ati on processing.In t his pape r,a3-turples m ode l is proposed t o descibe the coded character se.t The ex isting code standards are reviewed and su mma-rized.A nd t he ISO2022and it's deriv i ng standards are ana l y zed in de tail;incl uding the li m ita tion o f u tilizi ng IS O 2022in m ultili ngua l env iron m en.t N ecessit y o f foundi ng UCS(U niversa lCha racter Se t)is present ed,a long w it h an outline ana l y sis o f UCS.A ft e r eva l uating current c l assifica tion m e t hods o f coded character set standa rds,a new m eth-od is produced w ith applica tion i n ca talogu i ng existing standa rds.W e c l o se ou r paper w ith a brief ana l ysis of i m po r-tan t Chinese na tiona l st andards on Han character se.tK ey word s:compu t e r applicati on;Ch i nese inf o r m ati on processing;coded character se t计算机应用从单纯的科学计算转向信息处理,是引发二十世纪信息革命的里程碑事件,而支撑这一转变的重要基础就是字符编码;通过制定字符编码标准,在人能理解的文字信息与计算机内部表达之间建立了一个基本的沟通桥梁,直到今天,基于文字的交互途径仍然是最主要的人机界面。

中文编码字符集标准大全

中文编码字符集标准大全

中文编码字符集标准大全国家标准代码,简称国标码,是中华人民共和国的中文常用汉字编码集,亦为新加坡采用。

现时中华人民共和国官方强制使用GB 18030标准,但较旧的计算机仍然使用GB 2312。

较常见的国家汉字标准代码列表:GB 2312-80信息交换用汉字编码字符集基本集(又称 GB 或 GB0)GB 13000.1-93信息技术通用多八位编码字符集(UCS)第一部分(相当于 ISO 10646-1:1993 中文版)GB 18030-2005信息技术中文编码字符集---GB 2312或GB 2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集·基本集》,又称为GB0,由中国国家标准总局发布,1981年5 月1日实施。

GB2312编码通行于中国大陆;新加坡等地也采用此编码。

中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。

GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。

对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致了后来GBK及GB 18030汉字字符集的出现。

--GB 13000,中华人民共和国国家标准的国家标准代码之一,全称 GB 13000.1-93《信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》。

此标准等同采用国际标准化组织 ISO/IEC 10646.1:1993《信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》。

GB 13000的字符集包含20,902个汉字。

--GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。

word2003练习题

word2003练习题

WORD 2003练习题一、判断题T1. 在汉字系统中,我国国标汉字一律是按拼音顺序排列的。

T2. 在Windows中,只要选择汉字输入法中的“输入中文符号”,则在“中文半角”状态下也可输出如顿号、引号、句号等全角的中文标点符号。

F3. 输入汉字的编码方法有很多种,输入计算机后,都按各自的编码方法存储在计算机内部,所以在计算机内部处理汉字信息相当复杂。

T4. 在用Word 2003编辑文本时,若要删除文本区中某段文本的内容,可先选取该段文本,再按Delete键。

f5. 在Word 2003中,建立交叉引用的项目必须在同一个主控文档中。

T6. 用Word 2003制作的表格大小有限制,一般表格的大小不能超过一页。

F7. 在Word 2003中编辑文稿,要产生文绕图的效果,只能在图文框中进行。

T8. 在Word2003中,使用“查找”命令查找的内容,可以是文本和格式,也可以是它们的任意组合。

T9. 删除选定的文本内容时,Delete键和退格键的功能相同。

T10. Word 2003中的“样式”,实际上是一系列预置的排版命令,使用样式的目的是为了确保所编辑的文稿格式编排具有一致性。

T11. 为了使用户在编排文档版面格式时节省时间和减少工作量,Word2003提供了许多“模板”,所谓“模板”就是文章、图形和格式编排的框架或样板。

T12. Word 2003中的“宏”是一系列Word命令的集合,可利用宏录制器创建宏,宏录制器不能录制文档正文中的鼠标操作,只能录制键盘操作,但可用鼠标操作来选择命令和选择选项。

F13. 在Word 2003中,把表格加上实线,只能把表格变虚线,通过“格式”菜单中的“边框与底纹”进行。

F14. 要在每一页中放置相同的水印,必须放在页眉和页脚中。

T15. Word2003文档可以保存为“纯文本”类型。

T16. 在Word 2003中隐藏的文字,屏幕中仍然可以显示,但打印时不输出。

什么是GB18030-2000

什么是GB18030-2000

什么是GB18030-2000
2000年3月,国家信息产业部和质量技术监督局在北京联合发布了《信息技术和信息交换用汉字编码字符集、基本集的扩充》,国家标准号为:GB18030-2000,收录了27000
多个汉字,还收录了藏、蒙、维等主要少数民族的文字,该标准于2000年12月31日强制执行。

GB18030-2000 作为 GBK for Unicode 3.0 的更新而诞生,并且作为GB2312-80《信息交换用汉字编码字符集基本集》的扩展,向下兼容 GBK 和 GB2312-80标准。

GB18030 编码是一二四字节变长编码:一字节部分从 0x0~0x7F 与ASCII 编码兼容。

二字节部分,首字节从 0x81~0xFE,尾字节从0x40~0x7E 以及0x80~0xFE,与 GBK标准基本兼容。

四字节部分,第一字节从 0x81~0xFE,第二字节从 0x30~0x39,第三和第四字节的范围和前两个字节分别相同。

四字节部分覆盖了从 0x0080 开始,除去二字节部分已经覆盖的所有Unicode 3.0码位。

也就是说, GB18030 编码在码位空间上做到了与Unicode 标准一一对应,包含了CJK + CJK扩展A的全部汉字。

GB18030是我国继GB2312-80和GB13000-1993之后最重要的汉字编码标准,是未来我国计算机系统必须遵循的基础性标准之一。

编码空间超过150万个码位,为彻底解决邮政、户政、金融、地理信息系统等迫切需要的人名、地名用字问题提供了解决方案,也为汉字研究、古籍整理等领域提供了统一的信息平台基础。

国家标准《信息交换用汉字编码字符集·第二辅助集》和《信息交换用汉字编码字符集·第四辅助集》的研制

国家标准《信息交换用汉字编码字符集·第二辅助集》和《信息交换用汉字编码字符集·第四辅助集》的研制

国家标准《信息交换用汉字编码字符集第二辅助集》和《信息交换用汉字编码字符集第四辅助集》的研制
高景成;魏励;傅永和
【期刊名称】《语文建设》
【年(卷),期】1987(000)001
【摘要】<正> 国家标准《信息交换用汉字编码字符集·基本集》已于1981年5月发布实施。

《基本集》规定了汉字信息交换用的基本图形字符及其二进制编码,收汉字6763个。

它适用于一般汉字处理、汉字通信等系统之间的信息交换。

随着我国汉字信息处理技术的发展,计算机的应用范围不断扩大,使用汉字字数较多的部门迫切需要在《基本集》的基础上继续制定信息交换用汉字编码字符集各辅助集的国家标准。

计算机系统的研制厂商也提出同样要求,以便根据有关标准进一
【总页数】4页(P31-33,59)
【作者】高景成;魏励;傅永和
【作者单位】
【正文语种】中文
【中图分类】TP3
【相关文献】
1.一种国家标准汉字编码字符集的新型结构设计 [J], 晏章军
2.对国际《信息交换用汉字编码字符集—基本集》中汉字区位排列次序的研讨与修[J], 任宏图
3.建立"信息交换用古汉字编码字符集"的必要性及可行性 [J], 周晓文;李国英
4.一种基于《信息交换用藏文编码字符集》国际、国家标准的藏文Windows平台的实现方案 [J], 尼玛扎西;拥错;次仁罗布
5.《信息交换用汉字编码字符集》简介 [J], 陈耀星
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ICS 35.040 L71
中华人民共和国国家标准
GB 18030— 2000
信息技术 信息交换用汉字编码字符 集 基本集的扩充
Information technology — Chinese ideograms coded character set for information interchange — Extension for the basic set (报批稿)
1
2
3
4
GB 18030—2000
4.4
保留区 reserved zone 本标准中留作未来国际标准规定的区域。
5
字汇
本标准收录的字符分别以单字节、双字节和四字节编码。 5.1 单字节部分 本标准中,单字节的部分收录了 GB 11383 的 0x00 到 0x7F 全部 128 个字符及单字节编 码的欧元符号。 5.2 双字节部分 本标准中,双字节的部分收录内容如下: GB 13000.1 的全部 CJK 统一汉字字符。 GB 13000.1 的 CJK 兼容区挑选出来的 21 个汉字。 GB 13000.1 中收录而 GB 2312 未收录的我国台湾地区使用的图形字符 139 个。 GB 13000.1 收录的其它字符 31 个。 GB 2312 中的非汉字符号。 GB 12345 的竖排标点符号 19 个。 GB 2312 未收录的 10 个小写罗马数字。 GB 2312 未收录的带音调的汉语拼音字母 5 个以及ɑ 和ɡ 。 汉字数字“〇” 。 表意文字描述符 13 个。 增补汉字和部首/构件 80 个。 双字节编码的欧元符号。 5.3 四字节部分 本标准的四字节的部分,收录了上述双字节字符之外的,包括 CJK 统一汉字扩充 A 在 内的 GB 13000.1 中的全部字符。 总体结构 本标准中,采用单字节、双字节和四字节三种方式对字符编码。本标准中的任何一 个字节均由八位二进制位串组成, 任何一个八位的值均由 0x00 至 0xFF 的十六进制记数法表 示。 单字节部分采用 GB 11383 的编码结构与规则,使用 0x00 至 0x80 码位。双字节部 分采用两个八位二进制位串表示一个字符,其首字节码位从 0x81 至 0xFE,尾字节码位分别 是 0x40 至 0x7E 和 0x80 至 0xFE。四字节部分采用 GB 11383 未采用的 0x30 到 0x39 作为对 双字节编码扩充的后缀,这样扩充的四字节编码,其范围为 0x81308130 到 0xFE39FE39。见 表 1 及图 1。 6
0x81 0x81 第 三 字 节 0xFE 0x30 0x39 第四字节 第 三 字 节
0xFE 0x30 第四字节
0x39
第一、二字节 结构
第三、四字节 结构
四字节总体 结构
图1
总体结构图
4
GB 18030—2000
7 字符的排列顺序 7.1 单字节部分字符的排列顺序 本标准中单字节部分所有字符按照 GB 11383 中相应字符的顺序排列,单字节编码的欧 元符号置于 0x80 位置,对应于 GB 13000.1 的 0x20AC 位置。见图 2。 7.2 双字节部分字符的排列顺序 本标准双字节部分的字符排列顺序见附录 A。 7.3 四字节部分字符的排列顺序 自 0x81308130 至 0x8439FE39 共 50400 个码位, 对应本标准双字节部分未包括的所 有 GB 13000.1 的字符,按照 GB 13000.1 相应字符的顺序排列,剩余码位保留。 自 0x85308130 至 0x8539FE39 共 12600 个码位, 为本标准的保留区, 留待未来字符 扩展使用。 自 0x86308130 至 0x8F39FE39 共 126000 个码位,为本标准的保留区,留待未来汉 字字符扩展使用。 自 0x90308130 至 0xE339FE39 共 1058400 个码位,用于对应 GB 13000 的 16 个辅助 平面,字符排列顺序完全遵照 GB 13000 的 16 个辅助平面的相应码位顺序依次排列,剩余码 位保留。 自 0xE4308130 至 0xFC39FE39 共 315000 个码位,为本标准的保留区,留待未来标 准扩展使用。 自 0xFD308130 至 0xFE39FE39 共 25200 个码位,为用户自定义区。 8 码位分配 8.1 单字节部分的码位分配 本标准中, 单字节的部分的码位分配见 GB 11383。 单字节编码欧元符号置于 0x80 位置。 见图 2。
1 GB 18030 — 2000
范围 本标准作为 GB 2311 体系的编码字符标准,规定了信息交换用的图形字符及其二进制 编码的十六进制表示。 本标准适用于图形字符信息的处理、交换、存储、传输、显现、输入和输出。 引用标准 下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时, 所示版本均为有效。 所有标准都会被修订, 使用本标准的各方应探讨使用下列标准最新版本 的可能性。 GB 2311—1990 信息处理 七位和八位编码字符集 代码扩充技术(eqv ISO 2022:1986) GB 2312 —1980 信息交换用汉字编码字符集 基本集 GB 11383—1989 信息处理 信息交换用八位代码结构和编码规则(idt ISO 4873: 1986) GB 12345 —1990 信息交换用汉字编码字符集 辅助集 GB 13000.1—1993 信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基 本多文种平面(idt ISO/IEC 10646.1-1993 ) 原则 本标准向下与国家标准 GB 2312 信息处理交换码所对应的事实上的内码标准兼容。 本标准在字汇上支持 GB 13000.1 的全部中、日、韩(CJK)统一汉字字符和全部 CJK 统一汉字扩充 A 的字符。 定义 本标准采用下列定义。 4.1 字汇 repertoire 用编码字符集表示的一个指定的字符集合。 4.2 字符 character 供组织、控制或表示数据用的元素集合中的一个元素。 4.3 编码字符 coded character 字符及其编码表示。 国家质量技术监督局 2000-03-XX 批准 2000-XX-XX实施
2000-03-17 发布
2000-03-17 实施
国 家 质 量 技 术 监 督 局 发布
GB 18030-2000


本标准作为 GB 2311 体系的字符编码标准,规定了信息交换用的基本图形字符及其二进 制编码的十六进制表示。 本标准适用于图形字符信息的处理、交换、存储、传输、显现、输入和输出。 本标准是对 GB 2312 的扩充。 本标准具体规定了图形字符的单字节编码和双字节编码,并对四字节编码体系结构做出 了规定。 本标准的附录 A、附录 B、附录 C 和附录 D 是标准的附录。 本标准从生效之日期起,同时代替原国家技术监督局标准化司和原电子工业部科技与质 量监督司联合以技监标函[1995]229 号文发布和实施的技术规范指导性文件《汉字内码扩展 规范(GBK) 》1.0 版。 本标准由中华人民共和国信息产业部提出。 本标准由信息产业部电子工业标准化研究所归口。 本标准起草单位:信息产业部电子工业标准化研究所、北京大学计算机技术研究所、北 大方正集团、北京方正新天地信息网络科技有限责任公司、四通集团公司、中科院软件所、 长城软件公司、四通利方公司、中软总公司、金山软件公司、联想公司。 本标准主要起草人:陈堃銶、黄疆、胡万进、张建国、陈壮。
p q r s t u v w x y z { | } ~

o DEL 单字节区码位图
8.2
双字节部分的码位分配 本标准中,双字节的部分的码位安排分为 0x8140 至 0xFE7E 和 0x8180 至 0xFEFE 两部 分,共 23940 个码位。见图 3 及表 2。
6
GB 18030—2000
SP ! " # ꎤ % & ' ( ) * ESC + ´ . /
0 1 2 3 4 5 6 7 8 9 : ; < = > ?
@ A B C D E F G H I J K L M N O
P Q R S T U V W X Y Z [ \ ] ^ _ 图2
` a b c d e f g h i j k l m n
码位空间 0x00~0x80
四字节字符的编码自第四个字节开始,编码码位为 0x30 至 0x39;其次是第三个字节, 编码码位为 0x81 至 0xFE;再次是第二个字节,编码码位为 0x30 至 0x39;最后是第一个字 节,编码码位为 0x81 至 0xFE。即, 0x81308130 至 0x81308139 ; 0x81308230 至 0x81308239 ; …… 0x8130FE30 至 0x8130FE39 ; 0x81318130 至 0x81318139 ; …… 0x8131FE30 至 0x8131FE39 ; …… 0x82308130 至 0x82308139 ; …… 0x8230FE30 至 0x8230FE39 ; …… 0xFE308130 至 0xFE308139 ; …… 0xFE39FE30 至 0xFE39FE39 。
5
GB 18030—2000
b4 b3 b2 b1
b8 b7 b6 b5
0 0 0 0 00
0 0 0 1 01
0 0 1 0 02
0 0 1 1 03
0 1 0 0 04
0 1 0 1 05
0 1 1 0 06
0 1 1 1 07
1 0 0 0 08
1 0 0 1 09
1 0 1 0 10
1 0 1 1 11
中华人民共和国国家标准
信息技术 信息交换用汉字编码字符集 基本集的扩充
Information technology — Chinese ideograms coded character set for information interchange — Extension for the basic set
相关文档
最新文档