视频数据存储、检索、提取关键信息过程中必备的技术

相关主题

TEL:

2014年

一、文通视频文字识别开发包简介 (3)

二、与传统的OCR识别技术性能对比 (3)

三、舆情监控、信息安全领域的使用 (4)

四、文通视频文字识别SDK支持的开发语言 (5)

五、使用场景介绍： (5)

“源于清华服务全球”的国内顶尖OCR图文识别技术，针对视频文件里面的文字字符以及复杂背景图片的文字字符进行计算识别！

摘要：通过对视频文件里的字幕提取，达到视频文件的分类归档存储的用途；通过对网络图片里面的文字提取、监测、分析，达到舆情监控、预防谣言的进一步发展！

关键词：视频识别视频文字识别视频字幕识别字幕识别新闻字幕识别新闻关键词识别图片文字识别舆情监控信息安全网络舆情监控谣言图片监控 OCR系统集成

“源于清华，服务全球”。

文通视频文字识别SDK，是一套可二次集成开发的工具包，是北京文通科技有限公司针对视频文字专门开发的识别引擎，解决了目前市面上OCR产品对于媒体资源管理体系中新闻字幕识别、电影字幕识别，电视剧字幕识别，娱乐节目字幕识别等无法识别的问题。

一、文通视频文字识别SDK具有强大的文字定位功能，可以

精确定位到视频中的文字位置。定位后，再对所定位文字进行识别。

◎支持TIFF、JPEG、PNG、BMP格式图像的读取；

◎可以对视频图像字幕进行自动版面分析；

◎能识别纯英文、简繁体中文视频图像，后续会加入少数民族语言识别；

◎支持对内存中的图像进行识别；

◎能够获取识别字符在原文中的位置和大小信息；

◎支持对指定区域的识别；

◎支持对长微博图片的文字内容识别；

二、固有的、传统的OCR识别技术产品，因为视频的文字与背景的对比度、颜色、明暗等多种因素的混淆，造成普通OCR识别算法不

好或者根本无法识别，而文通视频文字识别SDK却可以有很大的改善，主要得益于清华大学新研发的计算方法来识别。这是文通视频文字识别SDK区别于一般OCR产品的地方，也是它的优势所在。

◎视频识别：集成进媒资管理系统或者其他媒体管理系统，对要管理的视频文件进行OCR识别，并把识别结果与视频关键帧相对应，这样就能实现视频的检索与利用。

三、对于舆情监控、舆情监测、信息安全等领域，也有行业内顶尖的性能。例如：分辨率较低的网页视频截图识别，网页截图识别，广告截图识别，微博截图识别等，对比其他的OCR软件，拥有非常大的优势。

◎图片识别：集成进舆情系统和维稳系统后，针对收集到的大量图片进行识别，将识别出的文字结果对比相应的监控词库字典表，例如：敏感词汇、反恐词汇等。

应用方式：集群服务器网络监控

（以上类型的图样识别率99%）

四、TH-OCR 文通视频文字识别SDK支持的开发语言VC，VB，DEPHI等。

五、客户案例：

目前在以下两个行业领域应用比较广泛：

① 媒体资产管理领域系统集成

爱奇艺，奇虎360等

② 舆情监控、广告监测领域系统集成

中国科学院信息工程研究院、河南拓普计算机网络工程有限公司、广州汇智通信技术有限公司、武汉绿网科技等。

③CCTV-13 新闻关键信息识别提取，进而推送数据给信息管理系统

④应用于电视台新闻节目、娱乐节目、电影字幕等文字识别需求

⑤应用于网页截屏的识别

以上是网页截图原件，以下是识别DEMO的识别结果截图（真实测试结果，识别率没有达到100%实属正常）: