多媒体技术与培训课件制作技术(复训)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多媒体技术与培训课件制作技术

多媒体课件素材,大致可以分为文本、图形、图像、音频(声音)、视频、动画等几种主要形式。

第一章文本素材的获取与处理

一、常见文本文件的格式

目前流行的文字处理软件种类繁多,不同的软件生成的文件格式各不相同。当使用不同的文本编辑软件编辑文本时,系统通常会采用默认的文本文件格式来保存文档。如字处理软件MicroSoft Word XP/2003的默认文档格式为DOC ,当然该软件还支持另外一些流行的文本文件格式。如TXT 、RTF等等。下面是比较流行的文本文件格式:

1.TXT格式:是纯ASCII码文本文件,纯文本文件除了换行和回车外,不包括任何格式化的信息,即文件里没有任何有关文字字体、大小、颜色、位置等格式化信息。

2.WRI格式: 是Windows系统下的写字板应用程序所支持的文件格式。

3.DOC格式:是Microsoft Word字处理软件所使用的默认文件格式,其中可以包含不同的字符格式和段落格式。

4.RTF格式:是Rich Text Format文件格式,是一种可以包含文字、图片和热字(超文本)等多种媒体的文档。

5.WPS格式:是金山中文字处理软件的格式,其中包含特有的换行和排版信息,称为格式化文本,通常只在WPS编辑软件中使用。

二、文字素材的采集

文本信息输入、采集的方法主要有以下几类:

1.键盘输入方法

键盘输入文本的优点是方便快捷,易修改并且不需附加录入设备,缺点是由于使用键盘输入文字通常需要理解和记忆对应的中文输入法的编码规则,因此输入速度较难提高。

2.语音输入方法

语音输入法,是将声音通过话筒输入计算机后直接转换成文字的一种输入方法。利用语音识别技术,计算机能迅速、自然地把读入计算机的声音信息转换成计算机中的文本。

3.联机手写识别输入

手写输入法是一种用特制的感应书写笔,在与计算机接口相连的手写板上书写文字来完成文本输入的方法。它符合人们用笔写字的习惯,只要将手写板接入计算机,在手写板上按平常的习惯写字,电脑就能将其识别显示出来。

4.扫描仪+OCR识别输入法

在实际办公中,如果需要进行大量文字录入,如书稿,资料等,仍用手工录入,无疑会浪费许多时间,用扫描转换的方法,可以大大加快文字录入速度,提高工作效率。利用OCR 技术,我们可以把需要的教材、文件、资料等进行扫描转换,生成电子文档,更便于保存。

OCR是光学字符识别技术的英文缩写。扫描仪+OCR识别输入就是将印刷品类纸张上的文字以图像的方式扫描到计算机中,再用OCR软件将图像中的文字识别出来,并转换为文本格式的文件。它要求把要输入的文稿首先通过扫描仪转化为图像后才能识别,所以,扫描仪是OCR技术中必须的配置。如果被扫描的原稿印刷质量越高,识别的准确率就越高,一般最好是印刷体的文字,比如图书、杂志等,如果原稿的纸张较薄,那么有可能在扫描时纸张背面的图形、文字也透射过来,干扰最后的识别效果。需要注意的是,扫描仪本身并没有文字识别功能,它只能将文稿扫描到计算机中后以图片的方式保存,文字识别则由OCR软件处理完成。

三、OCR 文字识别过程

扫描仪+OCR 识别输入法能将纸介文件转换为电子文档,通常需要经过文稿扫描、版面处理、文字识别、文字编辑几个阶段。下面以中晶科技的扫描仪Microtek ScanMaker 4100和尚书七号OCR 识别软件为例,构建一个扫描、文字识别系统。利用该系统扫描文字图像并将文字图像转换为电子文档的操作过程是:

① 按照扫描仪的说明书,将计算机和扫描仪连接好,并安装相应的驱动程序、图像扫描程序Microtek ScanWizard 5 和尚书七号OCR 软件。

② 双击Windows 桌面上的“尚书七号OCR ”快捷方式图标,启动尚书七号OCR 程序,如图1-1所示,与其它高档品牌的扫描仪一样, Microtek ScanMaker 4100扫描仪在其配置

的图像扫描程序Microtek ScanWizard 5

中,本身也包含了直接对文字稿件的OCR 识别功能,但由于文档识别率较低,因此采用了与扫描仪匹配的第三方OCR 文字识别软件。

③ 打开菜单栏上〖文件〗菜单,执行“选择扫描仪…”命令,打开图1-2所示的“选择来源”对话框,选定对应扫描仪型号的驱动程序选项。再选择〖文件〗菜单,执行“系统配置…”命令,打开图2-3所示的“设置系统参数”对话框,并在获取新图像面板上选择识别语言为“中文简体”,按下【确定】按钮,配置完成。注意:选择的识别语言要根据被识别的文字图像上的文字内容而定,如果为纯英文,则应选择英文识别。

④ 将要扫描的印刷体文字稿件平放在扫描仪玻璃上。在放置扫描原稿时,被扫描的文字材料一定要摆放在扫描起始线正中,并且文稿的一角应对齐基点,以最大限度地减小由于

文字识别工作区 文件

管理

工具栏

单栏 文字识别工作区 1-1尚书七号OCR 系统窗口 图1-2扫描图像的来源

图2-3设置系统参数

图1-4扫描程序Microtek ScanWizard 5的主窗口 光学透镜导致的失真,这样有助于后面提高OCR 软件识别率。同时还要注意扫描仪玻璃的洁净和保护其不受损害。

⑤ 单击尚书OCR 程序窗口中工具栏上的“扫描”按钮【】,启动扫描程序Microtek ScanWizard5 ,在图1-4所示的“设置”面板中,依次设定扫描分辨率为300dpi 、扫描图像色彩模式为黑白二色、阀值可设定其范围在80~130之间,阀值稍有变化会影响OCR 的识别结果。应该注意:分辨率的设置是文字识别的重要前提,但不是扫描分辨率设得越高识别正确率就越高。通常,

要求设置分辨率的大

小和文字大小成反比

关系。1、2、3号字

的文章段,推荐使用

200dpi ;4、小4、5

号字的文章段,推荐

使用300dpi ;文字原

稿的扫描识别,设置

扫描分辨率时千万不

要超过扫描仪的光学

分辨率,不然会得不

偿失。

为了便于后面识

别文本图像,建议最

好不要大量采用灰

度、彩色扫描模式扫

描文件,因为彩色图像

文件占用大量的内存和

CPU ,操作速度会很慢;而且背景图案会影响处理效果。

⑥ 单击扫描程序窗口中工具栏上的【预览】按钮,扫描仪开始工作。屏幕上扫描程序窗口的图像显示区将显示出纸介文稿上的文字图像,单击其工具栏上的“选区”按钮【】,并通过拖曳鼠标,在文字图像中框选出要扫描的文字图像区域,如图1-4所示。然后点击工具栏上的【预扫】按钮,执行图像的预扫描。

在对原稿扫描时,如果选用了灰度或RGB 彩色模式,为了提高文字识别率,可调整原图像的亮度、对比度,使扫描文件黑白分明;调整原图像暗调和高光,丰富原图像的亮度层次,使扫描图像更加清晰。调整扫描参数的具体操作是:

♦ 在Microtek ScanWizard 5程序窗口中,单击设置面板中的按钮【】,进行扫描图像的亮度和对比度值的设置。在进行正式识别前,先观察扫描得到的图像中文字质量如何,如果图像存在黑点或黑斑时或文字线条很粗很黑,分不清笔画时,说明亮度值太小了,应该增加亮度值;如果文字线条凹凸不平,有断线甚至图像中汉字轮廓严重残缺时,说明亮度值太大了,应减小亮度值;

♦ 单击设置面板中的“亮度/对比度”按钮【】,可选择不同的色阶分布通道,通过拖动色阶滑块对扫描图像的亮度层次进行调整。

⑦ 在设定了合适的扫描参数并对原图像作了相关的调整后,即可正式执行扫描操作,单击【扫描】按钮,扫描仪立即开始驱动,并显示扫描进程,扫描得到的文字图像将直接传送到尚书七号OCR 系统的图像处理界面窗口中。

⑧ 单击尚书七号OCR 程序窗口工具栏上的缩放按钮【

】和【】,可以调整图像处

相关文档
最新文档