文字识别软件说明

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

汉王OCR 6.0 特别版

•运行环境：Win9X/Win2000/WinXP/Win2003/

•软件语言：简体中文

•软件类型：国产软件 - 图文处理 - OCR 识别

•授权方式：免费软件

•软件大小：45.47 MB

•推荐星级：

•更新时间：2006-10-12 13:58:30

•官方主页：Home Page

在最近几年中，OCR识别技术随着扫描仪的普及得到了飞速的发展，扫描、识别软件的性能不断强大并向智能化不断升级发展。

OCR是英文Optical Character Recognition的缩写，意思为光学字符识别，通称为文字识别，它的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息，利用各种模式识别算法分析文字形态特征，判断出汉字的标准编码，并按通用格式存储在文本文件中，由此可以看出，OCR实际上是让计算机认字，实现文字自动输入。它是一种快捷、省力、高效的文字输入方法。

汉王OCR 是针对机关单位、企业及有文字录入需求的个人用户，在日常的工作中，快速的对书刊、报纸、公文、宣传页等印刷稿件中内容进行录入的应用需求而推出的。本产品集成了汉王科技顶尖的文字识别技术，对印刷文稿录入的识别率高达99.5%，能够识别百余种印刷字体和各种中英繁表图混排格式的文本，。是理想的文字、表格、图像录入系统。

这样一来，就不用再手工输入大量的资料了，只要扫进去，像那种抓英文的工具一样，让软件自动地转成WORD文档。即可将图片变成可编辑的文挡格式。这是目前破解最完美的汉王OCR软件。

尚书7号OCR文字识别系统完全版Shocr7.0

•运行环境：Win9X/Win2000/WinXP/Win2003/

•软件语言：简体中文

•软件类型：国产软件 - 图文处理 - OCR 识别

•授权方式：免费软件

•软件大小：44.41 MB

•推荐星级：

•更新时间：2006-10-12 14:45:21

•官方主页：Home Page

本软件系统是应用OCR（Optical Character Recognition）技术，为满足书籍、报刊杂志、报

表票据、公文档案等录入需求而设计的软件系统。目前，许多信息资料需要转化成电子文档以

便于各种应用及管理，但因信息数字化处理的方式落后，不但费时费力，而且资金耗费巨大，

造成了大量文档资料的积压，因此急需一种快速高效的软件系统来满足这种海量录入需求。本

软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻

印、大量资料电子化的软件系统。

●识别字符

简体字符集：国标GB2312-80的全部一、二级汉字6800多个。

纯英文字符集。

简繁字集：除了简体汉字外，还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。

●识别字体种类

能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体，并支持多种字体混排

。

●识别字号

初号小六号字体。

●表格识别

可以自动判断、拆分、识别和还原各种通用型印刷体表格。

●可支持繁体WINDOWS系统

首先，尚书七号开始将整个OCR的过程，明确化了，通过程序的菜单，我们就能够知道整个OCR

的过程，主要分为：“文件”、“编辑”、“识别”、“输出”等步骤。

在文件菜单中，您可以调用扫描仪，或者选择将已经扫描好的图像文件打开。得到图像文件后

，用户开始的工作，就是“编辑“菜单里面所提示的：图像页面的处理，其中包括图像页的倾

斜校正（提供自动和手动实现方法），旋转等功能。

处理完毕后，就可以进入“识别过程”，该过程关键的是“版面分析”，现在尚书七号的自动

版面分析功能很强，面对报纸杂志等复杂情况的版面，也是分析的正确率很高。不再需要我们

在尚书六号里面那样的建议手工划识别范围。也正是这点，大大降低了使用者的工作量。为了

方便，“识别”菜单下，也提供了用户自己在自动版面分析后，通过修改识别范围框的属性，

来决定需要识别否的功能（默认的情况下，图象属性的栏目是不用识别的。当然，如果用户还

是习惯原来尚书六号那样，自己来设定识别区域，只要直接用鼠标划框就可以了。接下来，用

户就可以直接选择“开始识别”的按钮了，等待识别的结果。

清华紫光文通TH-OCR 9.0 光盘完全特别版

•运行环境：Win9X/Win2000/WinXP/Win2003/

•软件语言：简体中文

•软件类型：国产软件 - 图文处理 - OCR 识别

•授权方式：免费软件

•软件大小：72.83 MB

•推荐星级：

•更新时间：2006-10-12 20:34:41

•官方主页：Home Page

把破解补丁放到安装目录下，运行破解补丁，确定，OK！

TH-OCR简介

TH-OCR是清华大学自1985年就开始研发的，TH是TsingHua（清华）的缩写，TH-OCR代表北京清华紫光文通信息技术有限公司开发的OCR软件。在国家“863”计划支持下，持续了十多年的科研成果，从1.0版本开始已经升级到现在的9.0版本。独家真正实现了汉英混排同时识别，在国际上首次突破了OCR产品只能处理汉字或英文单一文字的局限性，新增了东方文字（简繁汉、日文、韩文）识别功能，对日文和韩文与英文混排文档的识别水平甚至超过日本和韩国对本国文字的识别水平，在国内、外产生了重大的影响，并连续3年被中国软件行业协会评为优秀软件产品，成为汉字输入技术的一座里程碑。TH-OCR9.0版本已应用到了包括电子政务、电子出版物、报社、银行、邮政、税务、图书馆等多个领域，成为国内OCR市场的先锋。

本届两会代表的所有提案全部采用了我国自主知识产权的世界识别领域领先产品——清华紫光文通的TH-OCR9.0进行录入识别，它以准确的识别率、优异的识别速度博得了两会工作人员的交口称赞。而清华TH-OCR技术在两会上的成功应用更论证了我国也完全有实力拥有自己的卓越技术。

TH-OCR的突出特点：

◇汉英双语同时混排，识别率最高，居世界领先水平。

◇可以识别黑白、灰度、彩色图像，可以读取多种图像格式。

◇首创对识别结果进行电子文档版面复原功能，所见即所得。

◇首创日文、韩文、日英混排、韩英混排识别功能，识别率98%以上。

TH-OCR的六大优势：

1. 是唯一可以识别２万多汉字的多体文字识别系统，汉字识别国内最优。

2. 汉字和英文混排、日文和英文混排、韩文和英文混排同时识别。

3. 汉字识别率最高。清华紫光文通TH-OCR经过"863"智能专家组对数十万字的指标评测和中国软件评测中