“慧眼”识别世界

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

“慧眼”识别世界
作者:周春雪,王军
来源:《科学中国人》 2009年第10期
人类对世界的认知,归根到底来自外在的符号与内在的思维。

那么怎样联接这两个世界呢?需要通过对感知信号的分析这些信号以图像、视频,声音等形式存在着,被称为是模式。

对这
些模式的识别有助于人们实现获取外部环境知识并与环境进行交互的目的。

这就涉及到了一个
研究领域——模式识别。

这,是一个崭新的认知领域。

模式识别( Pattern Recognition)是人类的一项基本智能通过对表征事物或现象的各种形式(数值文字和逻辑关系的)的信息进行处理和分析以对事物或现象进行描述辨认、分类和解
释是信息科学和人工智能的重要组成部分。

为了揭秘这个陌生的新世界今天我们走访了一位在
这一领域默默耕耘了多年的科技工作者从他那里更详细地了解模式识别的意义与作用。

他就是
中国科学院自动化研究所模式识别国家重点实验室副主任——刘成林研究员。

他有一双可以识
别特殊世界的“慧眼”。

一位治学严谨的老师
我是加拿大Concordia大学Centrefor Pattern Recognition and Machine In-
tettigence的一名博士生。

今年5月份有幸来到中国科学院自动化研究所模式识别国家重点实
验室开展学术交流在刘成林教授指导的科研小组进行访问和学习。

在访问期间刘老师严谨的
治学态度和渊博的专业知识给我留下了深刻印象。

其实,早在我读硕士期间就开始接触刘威林
老师的文章,并且对其阐述的问题印象深刻。

他的论文无论是在理论还是在实践上,都具有很
高的创新性和实用性。

而此次访问中最大的感受就是刘老师对学生、学术的认真态度以及实验
室里活跃的学术气氛都给人一种富有朝气,活泼进取的感受。

实验室工作人员和同学们的热心
帮助更让我感激不已;从大事到小事他们都认真对待,让我时刻有一种家的感觉。

刚来实验室
不久的访问学生何春雷这样为我们介绍自己的新老师。

走进刘成林的办公室我们看到办公集上的“手写体”样张,这就是他平时做得最多的事情:研究中文手写体的识别他告诉本刊记者最近他的研究课题组对“HITMW手写文本库”作了文本
行的标记工作并已经免费公开而且与此相关的核心技术也已经发表在一期业内知名的学术杂志《Pattern Recognition》上。

同时他的课题组收集了一个新的大规模手写体样本库,即将向
学术界公开。

刘成林一边说着一边向我们展示他的研究成果。

从学生的评价,从他对研究工作的那一份热爱与认真劲儿我们看到了一位勤勤恳恳躬耕于
模式识别领域的学者.刘威林今年只有42岁,在他面前的路还很宽阔。

他对我们说:模式识别是一个应用前景很广泛的领域。

我的研究成果主要包括在手写字符识别的图像归一化、特征提取、分类器设计、手写字符串的切分与识别.手写文档分割等方面。

研制的文字识别算法已经
应用在日本的邮政分拣机表格处理系统等产品中尤其是用于邮政分拣的日文手写地址识别系统
是该领域第一个成功的案例。

在此之前的日本邮政分拣机只能识别邮政编码和印刷地址而不能
识别手写地址。

这一研究成果成功的解决了这一难题。


近年来刘成林的很多成果引起了业界的关注其中重要的研究项目包括中科院百人计划项目
1项国家自然科学基金项目3项国际合作项目3项。

而当下刘成林做的最重要的一件事情就是
积极努力地推进研究成果的转化和应用
严谨是一位师者必备的品德在刘成林那里,记者分明感到一种兢兢业业淡泊如水般的感情
对研究的热爱全部浓缩在了那一份严谨与认真之中。

一片海阔天高的领地
1 989年刘成林本科毕业于武汉大学无线电信息工程系获理学学士学位后继续深造,于1 992年获北京工业大学电路与系统专业工学硕士学位后又在1 995年获中国科学院自动化研究
所模式识别与智能控制专业工学博士学位。

之后刘成林先后在韩国科学技术院(KAIST)和日本东京农工大学从事博士后研究工作1 999年至2004年他在日立中央研究所先后任研究员和主任研究员从事的也是模式识别的相关研究2005年1月刘成林回国入选中国科学院“百人计划”(引进海外杰出人才计划),任中国科学院自动化研究所模式识别国家重点实验室研究员、副
主任至今。

按照刘成林的理解,他一路走来,感觉模式识别是一个很有发展前景和研究潜力的
领域这对于一个科研工作者的科研生涯来说是一笔难得的财富。

刘成林的研究方向为模式识别、图像处理,机器学习及在文字识别中的应用。

在手写文字
识别领域他已经取得了国际领先的研究成果,并因此还获得了2005年国际模式识别协会主办的国际文档分析与识别会议青年科学家奖(IAPR/CDAR Young Invesiigator Award)。

在国际期刊《IEEE Tran s on Patiern Analysisand Machine Inie…gence》和《PatlernRecognition》等以及一些相关的国际学术会议上发表论文90余篇。

2004年刘成林当选美国电气电子工程师学
会高级会员(IEEE Senior Member), 2006年开始担任国际期刊《Pattern Recognition》
的编委2008年开始担任国际期刊《lmage andVision Compuiing》的编委。

2008年获得国家杰
出青年科学基金。

从2005年开始刘成林完成的主要项目是中科院“百人计划”。

并取得了丰硕的成果。

他在模式分类和手写文档分析方面开展研究工作对于有些类别部分重叠而又不需要完全分开的模式
分类问题,提出一种部分判别学习方法通过修改已有的判别学习准则(如MSE.MCE,one-versus-all SVM等)强化不同合并类之间的区分弱化重叠类之间的区分,有效降低了合并类
的分类错误率。

在联机手写文档分析方面提出了一种基于马尔科夫随机场( MRF)的笔划分类方
法和一种充分利用时域和空间域信息的文字行分割方法能够正确分割任意方向的文字行。

在字
符串识别方面,提出了利用几何上下文提高字符切分和识别精度的方法。

为了更好地融台字符
识别置信度和上下文信息提出了基于条件随机场(CRF)的字符串识别方法有效地克服了条件独立假设和置信度估计不准确的问题并能自动学习最优权值系数。

而在脱机手写汉字识别方面提出
一种结合图像坐标变换的梯度方向特征提取方法有效地克服非线性归一化和伪二维归一化带来
的形变从而提高识别精度。

提出了一种基于线性判别分析(LDA)的复合距离方法用来区分手写汉字中的相似字。

针对手写文字行具有倾斜弯曲.行间距不明显等特点提出了一种基于测度学习
的最小生成树聚类算法在无约束中文手写文档图像上取碍了98.02%的文字行分割正确率。

刘成林带领着研究组在手写文档分析方面进行的工作系统而深入在国际学术界有较大影响。

比如在2009年国际文档分析与识别会议(ICDAR)上,研究组投稿的6篇论文全部被接收其中5
篇为口头报告(口头报告论文接收率20%)。

除了以上的方法和算法研究他们已收集一个大规模
的联机和脱机手写字符及连续书写文本的数据库.待标注完成后可供学术界交流研制新的方法
并开发实用的手写文档识别系统,
一次难忘的获奖经历
2005年在国际模式识别协会主办的国际文档分析与识别会议上刘成林获得了IAPR/ICDAR Young InvestigatorAward(青年科学家奖)。

这次获奖经历不仅让世界模式识别领域知道了
中国模式识别研究的实力还给刘成林带来了更大的动力。

国际文档分析与识别会议(ICDAR)1 9 91年以来每两年举行一届最近几年的举办中每一届
的参加者都在300到400人之间。

青年科学家奖自2007年设立以来每次授予1到2人(40岁以
下)。

这个奖引用刘成林的成绩如下ICDAR YoungScientist Award for his ourstanding research ln Handwritien Kanji Character Rec-ognition and its impact on industrial
在手写文字识别的归一化特征提取分类器设计手写字符串识别等方面提出和实现了一系列
有效的方法有效地提高了手写文字识别和字符串识别的性能C提高精度降低计算复杂度)这是
当时获奖时主要的成就在归一化方面我提出了长宽比自适应归一化的思想基于函数拟合的非线
性归一化和伪二维归一化方法.在特征提取方面提出了具有良好不变性的外围结构特征提取方
法和连续的归一化协同特征提取方法在分类器方面设计了判别学习二次分类器和类特征多项式
分类器分类精度高于最好的人工神经网络。

我还改进和完善了基于置信度估计的多分类器融合
方法,在字符串识别方面通过设计排斥非字符的分类器,明显提高了字符切分和字符串分类的
正确率。

刘成林拿着当时获得的奖杯向本刊记者讲道。

当时刘成林所研制的文字识别算法被应用于日立制作所的多种信息产品,包括邮政分拣机,表格处理系统.智能ATM机、移动电话等。

2000年和2001年他分别获得日立制作所技术开发
三等奖和一等奖。

2002年刘成林在《IEEE TransPAMI》上发表的“关于日文手写地址识别的成果”是国际上该领域首次成功的应用并被《IEEE Spectrum》杂志2003年第2期摘录国际著名
学者Ching YSuen称该文为手写地址识别领域的‘历史性论文。

2005年前刘成林在国际刊物和
学术会议上发表论文50多篇包括模式识别领域的顶级刊物《IEEE TransPAMI》和《Pattern Recognition》上以第一作者发表的论文10篇。

一个充满机会与挑战的时代
我在国外时经常听人议论科研成果的意义。

他们认为如果一项成果解决了一个重要的理论
问题或提出一个非常有效的方法这样的成果在学术上有重要价值。

如果一项成果解决了一个应
用问题如实现一个高性能的应用系统,得到了实际应用或即将得到应用那么这项成果的价值
同样是非凡的。

反之如果一项科研工作在理论或应用方面的影响都不突出即使发表的文章再多
也没有太大意义。

十几年前国内学术界提出“顶天立地”的说法即在理论上要顶天在应用上要
立地,意思是一样的。

在谈到刘成林获得2008年国家杰出青年科技基金的事情时说。

国家杰出青年科学基金的评审看重研究者在理论上或应用上的突出贡献,如果发表论文很
多但却没有一篇有重大影响C受到正面评价或产生实际应用)其作者也难以获得杰出青年科学
基金2004年以前国内学者发表的高水平论文还不太多杰出青年科学基金的评审比较注重串请人的论文发表情况(论文的档次和数量)。

近年来随着高水平论文的增多以及国家对科学技术的
应用越来越重视,杰出青年科学基金的评审也越来越重视申请人在应用方面的贡献以及潜在应
用价值。

其实,刘成林在日常生活中对青年人才的培养也实践了这种重视威果价值的理念,他
在人才培养上认为模式识别领域的人才应该注重三个方面的培养:基础知识实践能力敬业精神。

在基础知识方面,只有注重深度与广度的结合通过围绕自己的研究课题,对局部领域(如文字
识别)的专业知识研究状况和有关方法深入掌握同时对相关领域(如与文字识别相关的图像处
理计算机视觉模式识别.机器学习等)的主要方法和进展要有一个全面了解。

实践能力体现在灵活运用专业知识解决实际问题的能力、动手实验能力在实验中发现问题和分析问题的能力.总
结和写作能力等。

而导师对学生兴趣的培养并在工作中严格要求也是一个很重要的促进因素、
在这种人才观念的影响下,刘成林与研究组里的科技工作者一起在模式识别的领地里披荆
斩棘开拓创新。

目前研究组拥有2名副研究员1名博士后10名博士生和5名硕士生。

他们与刘成林一起在模式识别国家重点实验室这块试验田书写着一代科技工作者的不朽梦想书写着
“慧眼”识别外部世界的一段传奇。

相关文档
最新文档