模式识别国家重点实验室开放课题基金[003]
模式识别国家重点实验室(中科院自动化研究所)
本文由renlian111贡献 doc文档可能在WAP端浏览体验不佳。
建议您优先选择TXT,或下载源文件到本机查看。
模式识别国家重点实验室 简介 模式识别国家重点实验室,于 1984 年由国家计委批准筹建, 1987 年通过国家验收并正式对外开放.依托于中国科学院自动化研究 所.实验室第一任主任是现任国家科技部副部长的马颂德研究员,现 任主任为谭铁牛研究员.实验室现有固定人员 22 人,平均年龄 37.8 岁,科研骨干均具有博士学位.实验室流动人员包括博士后,在读博 士生与硕士生,高级访问学者及客座研究人员.实验室计划发展规模 为固定人员 25-30 人,流动人员 100 人左右. 实验室以"面向世界,面向未来,开展前瞻性的基础研究;立足国内, 面对现实,推进定向性的应用研究与技术开发"为发展战略,追求个人事 业与集体事业共同协调发展,力争成为具有国际水准的科学研究,技术 创新和高科技人才培养基地. 实验室目前的主要研究方向为模式识别,计算机视觉,图像处理与 图形学,口语信息处理,自然语言处理以及模式识别应用与系统等. 实验室目前承担了三十余项科研项目,其中包括国家重点基础研究 规划"973"项目(图象,语音,自然语言理解与知识发掘),国家基金 委重大,重点项目,国家杰出青年科学基金项目,国家攻关项目,国 家高技术计划"863"项目,国家基金委面上项目及国际合作项目等. 实验室成员每年在国内外重要的学术期刊和国际学术会议上发表 论文百余篇,其中不少发表在国际权威刊物与国际重要会议上,如 IEEE 汇刊(PAMI 等),International Journal of Computer Vision, Pattern Recognition, Image and Vision Computing, Automatica, EuroSpeech, ICSLP, ICASSP, ICCV, ICPR, ACCV 等. 近年来,实验室已获准和申请发明专利 26 项,获国家科技进步二 等奖 1 项,中科院自然科学二等奖 2 项,其它部委级三等奖 3 项,国 际发明金奖与世界知识产权专项奖各 1 项. 实验室在开展国际国内学术交流与合作方面,有着优良的传统. 实验室借各种机会,积极组织学术交流,每年一批在美国,法国,德 国,日本,英国,新加坡等地工作的优秀中国留学生,定期到实验室 从事短期客座研究,来自美国,加拿大,英国,法国,日本等二十多 个国家或地区的知名学者到实验室做学术报告达几十人次.实验室通 过中科院自动化所和法国国立信息与自动化研究院(INRIA)成立了 "中法信息,自动化与应用数学联合实验室",与香港科技大学成立 了信息技术联合实验室.实验室成员积极参与国内外学术组织的工 作,担任许多国内外学术期刊的主编,副主编或编委,以及国际重要 学术会议的大会主席或程序委员会委员等. 实验室十分重视与高新技术企业的交流与合作,希望通过与社会 资源的有效组合,促进成果转化,为我国的经济建设和社会发展服 务! 研究方向与目标 人类具有很强的模式识别能力.通过视觉信息识别文字,图片和周围的环 境,通过听觉信息识别与理解语言.模式识别能力是人类智能的重要组成部 分.从信息处理的角度搞清它的机理,研究它的计算理论与算法,以使计算机 来实现人的视觉,听觉等模式识别能力,是人类在基础理论与应用研究中面临 最重大的挑战之一.用计算机实现模式的自动识别,是开发智能机器的一个最 关键的突破口(如果机器不能自动感知与识别周围环境,机器智能也就无从谈 起!).它的成功应用将大大推动人工智能系统的发展,拓广计算机与各种自 动机器的应用范围. 随着数字化和网络通讯技术的飞速发展,"信息过载"(Information Overload) 已 成为日益严重的问题.如何用智能化的手段处理和识别网上的海量信息(包括 文字,图像,语音等)已成为当前信息技术领域所面临的一个巨大挑战.解决 这个问题,使普通百姓能方便地获取所需信息,将互联网上丰富的信息资源转 换为发展知识经济的宝贵财富,是我国在推进国民经济和社会信息化进程中的 一个重大需求. 特别是从国家信息安全的战略高度出发,研究有害网络信息过 滤和有用信息检索中的智能信息处理与识别技术已成为当务之急. 与此同时,要进一步普及计算机的应用,加速信息技术向全社会的渗透,消除所 谓的"数字鸿沟",就必须研究友好适人化的人机交互技术,以克服传统的人机 交互手段的弊端,提高计算机和信息系统的友善性和好用性.人机交互技术的 发展将支持用户通过各种手持式设备,传统 PC 终端和固定电话等形式来安全可 靠地检索各种媒体信息.美国微软公司比尔.盖茨认为人类计算的未来就是要让 比尔. 比尔 计算机会看,会听,会说,会思考("The future of computing is to make 计算机会看,会听,会说,会思考 computers see,hear,speak and think."?Bill Gates).1999 年,美国总统 信息技术顾问委员会 PITAC(President 抯 Information Technology Advisory Committee)在其提交给联邦政府关于"面向未来的信息技术研究" (Information Technology Research: Investing in Our Future)的咨询报告 中,建议联邦政府将人机界面和交互技术的基础研究作为优先资助的重点,并 强调模式识别和感知等方面的基础研究将极大地改善人类与机器之间的交互 模式识别和感知等方面的基础研究将极大地改善人类与机器之间的交互 ("Fundamental research in human sensory-motor systems, perception, attention, pattern recognition and decision-making has the potential recognition, to make dramatic improvements in the interaction of people and machines."- PITAC).因此,模式识别不仅是一个有重大科学意义的研究领 模式识别不仅是一个有重大科学意义的研究领 也是网络数字化时代诸多实际应用中需要突破的一项重大关键技术. 域,也是网络数字化时代诸多实际应用中需要突破的一项重大关键技术. 针对上述的重大科学和技术前沿问题,围绕我国国民经济,社会发展和国防安 全的战略需求,结合已有的基础和学科优势,本着"有所为,有所不为"的指 导思想,实验室自成立以来始终将研究方向聚焦在模式识别领域的几个有限目 标上. 实验室的研究方向为模式识别基础理论,图像处理与计算机视觉, 实验室的研究方向为模式识别基础理论,图像处理与计算机视觉,语音与语言 信息处理. 信息处理. 模式识别基础理论的研究是开展模式识别其它方向研究的基础,此方向主要研 模式识别基础理论 究内容包括脑功能成像数据分析,计算视觉理论与模型,选择性注意与主动视 觉,图像与语音识别的认知机理,机器学习与分类器设计等. 图像处理与计算机视觉是两个紧密相联的问题,有着广泛的应用领域和前景. 图像处理与计算机视觉 实验室在此方向的主要研究内容有医学图像处理,遥感图像处理,图像水印, 基于内容的图像与视频检索,三维视觉和物体识别,运动分析与理解以及生特 征识别. 语音与语言信息处理是改善人机界面和交互方式的重要手段,是推进国民经济 语音与语言信息处理 和社会信息化,实现不同语种之间的全球自由通讯的重大关键技术.实验室在 此方向的主要研究内容包括大词汇量非特定人连续语音识别,高鲁棒性语音识 别,分布式与嵌入式语音识别,口语翻译以及中文语言处理. 实验室的研究目标是在上述三个方向提出创新的理论与算法,攻克关键技术, 实验室的研究目标是在上述三个方向提出创新的理论与算法,攻克关键技术, 积累基础性数据资源,集成实用的或接近实用的原型示范系统, 积累基础性数据资源,集成实用的或接近实用的原型示范系统,并努力实现技 术转移,促进我国信息技术产业的发展. 术转移,促进我国信息技术产业的发展. 实验室的总体发展目标是"面向国家战略需求,瞄准国际学科前沿,开展模式 识别领域的基础和应用基础研究,建设国家一流的国家重点实验室,使其成为 国内外著名的科学研究,技术创新和人才培养基地,为我国信息高科技的发展 提供知识,技术与人才储备" . 在研项目 序 项目名称 号 1 图像理解与图像库检索 2 口语翻译导向的高性能语音识别和理解的研究 负责人 项目来源 谭铁牛 973 计划 徐波 973 计划 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 基于空间数据融合的区域规划决策支持系统 普林特 不变性知觉信息表达的计算理论与计算机实验 谭铁牛 模糊 PID 控制器的系统化研究 胡包钢 视觉信息的群体动态时空编码和选择性注意机制 马颂德 视觉监控 谭铁牛 基于计算机视觉的三维动画 田英利 汉语话语翻译关键技术的研究 黄泰翼 几何基元提取与参数空间分解法 胡占义 单株植物生长的计算机建模与三维可视化仿真 胡包钢 虚拟现实中基于基因图象的建模和绘制 胡占义 中法联合实验室项目 胡包钢 基于卫星图象处理方法的环境监测及水灾估计的应用 马颂德 植物生长过程及其构造形态的随机功能与交互式 胡包钢 数字博物馆景物的几何,光度模型建立 王向东 对话系统的可移植性问题 徐波 CSTAR-III 框架下中法口语翻译研究 徐波 水灾分析和决策支持的数据融合 蒲林特 水灾分析和决策支持的数据融合-应用 马颂德 汉语会话系统 徐波 中文非特定人数字语音识别 徐波 口语语料处理 宗成庆 基于计算机三维景象重构和可视化 胡占义 Pepole modeling 谭铁牛 生态系统优化决策支持系统 蒲林特 基于 C-STAR III 多语种框架的中法口语翻译系统设计 宗成庆 与实践 人脑选择性注意和计算机主动视觉的跨学科研究 胡占义 语音网络服务器 王阳生 生物特征信息处理与识别 谭铁牛 运动图象理解与基于内容的信息检索 卢汉清 移动互联环境下的语音识别 徐波 医用虚拟内窥镜系统 卢汉清 LAMOST 天体光谱自动识别系统的预研 胡占义 能听会说的机器人 李成荣 弹上惯测组合自主导北时间序列分析与误差模式识别 台宪青 IC 卡用指纹识别算法 蒋田仔 交通场景的视觉监控 胡卫明 几何特征提取与参数空间分析法 李泉林 语音导航 GIS/GPS 集成系统研究及其在 PDA 上的实现 刘文举 强杂波背景中红外弱小目标探测与识别关键技术 唐明 863 计划 国家自然科学基金 国家自然科学基金 国家自然科学基金 国家杰出青年基金 国家自然科学基金 国家自然科学基金 国家自然科学基金 国家自然科学基金 国家自然科学基金 国际合作 国际重大项目 国际合作 国际合作 国际合作 国际合作 国际合作 国际合作 国际合作 国际合作 国际合作 国际合作 国际合作 国际合作 国际合作 院创新重大项目 省部委项目 院创新方向项目 院创新方向项目 院创新方向项目 横向合作 横向合作 横向合作 横向合作 横向合作 院其它项目 院其它项目 院其它项目 其它项目 42 43 44 45 46 基于图象序列的机器人工作环境重建 天体光谱数据自动分类和识别 动态场景的视觉监控技术 面向多国语言的电视语音自动翻译技术研究 医学成像与计算 胡占义 胡占义 胡卫明 宗成庆 蒋田仔 院其它项目 院其它项目 院其它项目 院其它项目 院"百人计划" 姓名 马颂德(主任) 黄熙涛(协主任) 谭铁牛 蒋田仔 张钹 李德毅 袁保宗 贾云得 李子青 陈霖 冯志伟 罗述谦 查红彬 陈武凡 徐波 王珏 任福继 Anil Jain Alex Waibel 权龙 庄炳湟 学术委员会 职称 E-mail 地址 masongde@yahoo.com.cn 研究员 huang@ifp.uiuc.edu 教授 tnt@nlpr.ia.ac.cn 研究员 Tianzi.jiang@nlpr.ia.ac.cn 研究员 dcszb@mail.tsinghua.edu.cn 教授 leedeyi@nlsde.buaa.edu.cn 教授 bzyuan@center.njtu.edu.cn 教授 jiayunde@bit.edu.cn 教授 szli@microsoft.com 教授 lchen@cogsci.ibt.ac.cn 研究员 zwfengde@public.bta.net.cn 教授 cumsz@public.bta.net.cn 教授 zha@cis.pku.edu.cn 教授 chenwf@fimmu.com 教授 Bo.xu@nlpr.ia.ac.cn 研究员 Jue.wang@mail.ia.ac.cn 研究员 ren@is.tokushima-u.ac.jp 教授 jain@cse.msu.edu 教授 waibel@cs.cmu.edu 教授 quan@cs.ust.hk 教授 juang@ece.gatech.edu 教授 工作人员 E-Mail tnt@nlpr.ia.ac.cn xubo@nlpr.ia.ac.cn huzy@nlpr.ia.ac.cn luhq@nlpr.ia.ac.cn jiangtz@nlpr.ia.ac.cn hubg@nlpr.ia.ac.cn fcwu@nlpr.ia.ac.cn szli@nlpr.ia.ac.cn 姓名 谭铁牛 徐波 胡占义 卢汉清 蒋田仔 胡包钢 吴福朝 李子青 职称 研究员 研究员 研究员 研究员 研究员 研究员 研究员 研究员 电话 62545671 62616623 62616540 82614465 82614469 62647318 62542944 82626787 杨青 刘成林 刘文举 宗成庆 胡卫明 王蕴红 普琳特 陶建华 吴毅红 唐明 臧玉峰 张晓鹏 潘春洪 侯新文 陈志义 朱朝喆 范勇 刘青山 赵微 连国臻 马丽霞 研究员 研究员 副研究员 副研究员 副研究员 副研究员 副研究员 副研究员 副研究员 副研究员 副研究员 副研究员 副研究员 副研究员 工程师 助理研究员 助理研究员 助理研究员 工程师 工程师 秘书 qyang@nlpr.ia.ac.cn liucl@nlpr.ia.ac.cn lwj@nlpr.ia.ac.cn cqzong@nlpr.ia.ac.cn wmhu@nlpr.ia.ac.cn wangyh@nlpr.ia.ac.cn prinet@nlpr.ia.ac.cn jhtao@nlpr.ia.ac.cn yhwu@nlpr.ia.ac.cn tangm@nlpr.ia.ac.cn yfzang@nlpr.ia.ac.cn xpzhang@nlpr.ia.ac.cn chpan@nlpr.ia.ac.cn xwhou@nlpr.ia.ac.cn zychen@nlpr.ia.ac.cn czzhu@nlpr.ia.ac.cn yfan@nlpr.ia.ac.cn qsliu@nlpr.ia.ac.cn zhao@nlpr.ia.ac.cn gzlian@nlpr.ia.ac.cn lxma@nlpr.ia.ac.cn 82614505 82614505 62542944 62542944 62542944 82614523 62542946 62527720 62555513 82629803 62542943 62555513 62659278 62542971 62545671 62545671 62545671 Tieniu Tan Professor National Lab of Pattern Recognition Email: tnt@nlpr.ia.ac.cn Phone: 86-10-82614515 Fax: 86-10-62551993 Tieniu Tan graduated with a BSc from Xi'an Jiaotong University in 1984, and obtained his MSc (in 1986) and PhD (in 1989) degrees from Imperial College of Science,Technology and Medicine, London, UK. Prior to his return to China in 1998, He worked at the University of Reading, UK as Research Fellow, Senior Research Fellow and Lecturer. He currently serve as the President of the Institute of Automation as well as the Director of the NLPR. He lead the Intelligent Recognition & Digital Security Group of the NLPR. His current research focuses on the visual surveillance and monitoring of dynamic scenes (for example, the detection and recognition of abnormal behaviors or other specific events), personal identification based on multiple biometric features such as face, iris, fingerprint, handwriting and gait, and watermarking of digital multimedia data such as digital static images and digital video. He also have research projects on image and video databases, invariant visual perception and mobilerobot navigation (especially for intelligent wheelchairs). Selected Publications 1. Y. Zhu, T. N. Tan and Y. Wang, Font Recognition Based on Global Texture Analysis,IEEE Tans. Pattern Analysis and Machine Intelligence, Oct. 2001. 2. J. G. Wang and T. N. Tan, A New Face Detection Method Based on Shape Information,Pattern Recognition Letters, vol.21, pp463-471. 2000. 3. T.N.Tan and K.D.Baker,Efficient Image Gradient-Based Vehicle Localisation, IEEE Trans. Image Processing, vol.9, no.8, pp.1343-1356, August 2000. 4. H. E. S. Said, T. N. Tan and K. D. Baker, Writer Identification Based on Handwriting, Pattern Recognition , vol.33, no.1, 2000, pp.133-148. 5. S. J. Maybank and T. N. Tan, Introduction to Special Section on Visual Surveillance, Inter. J. Computer Vision, vol.37, no.2, June 2000. Professional Activities 1. SPIE International Symposium on Multi-spectral Image Processing and Pattern Recognition,22-24 October 2001,Wuhan,China(Program Committee Member) 2. The 2nd IEEE Inter. Workshop on Performance Evaluation of Tracking and Surveillance,December2001,USA (Program Committee Member) 3. The Perceptive User Interfaces Workshop(PUI'2001),November15-16,2001,Orlando, USA (Program Committee Member) 4. The 3rd Inernational Conference on Cognitive Sciences(ICCS2001),27-31 August 2001,Beijing,China (Program Committee Co-chair) 5. The 6th International Conference for Young Computer Scientists(ICYCS'2001), 23-25 October 2001,Hangzhou,China(Member of Steering Committee) 6. Associate Editor, Pattern Recognition(1997-),Pergamon/Elsevier 7. Asia Editor,Image and Vision Computing(1998-),Elsevier 8. Member of Editorial Board,International Journal of Image and Graphics(2000-), World Scientific 9. Member of Editorial Board, International Journal of Information Technology and Decision Making(2001-),World Scientific. 10. Associate Editor, IEEE Transactions on Pattern Analysis and Machine Intelligence (2002-) Research Mission Conduct quality research in the broad field of Pattern Recognition Establish a center of excellence in scientific research, technological innovation and postgraduate training Promote technology transfer and international collaboration Research Directions NLPR's research directions include: Computer and Robot Vision Image Processing and Graphics Natural Language Processing Pattern Recognition Pattern Recognition Applications and Systems Spoken Language Processing Selected Publications Shape Recvery From a Color Image for Non-Lambertian Surfaces, Yingli 1 Tian, H.T.Tsui, J.Opt.Soc .Am.A . 14(2):397-404,1997 Model-Independent Object Orientation Determination, Tieniu Tan, K. D. 2 Baker, G. D. Sullivan, IEEE Trans. Robotics and Automation, 13(4):602606,1997 Noise Robustness of Texture Features, Tieniu Tan, Image and Vision 3 Computing 15(11):115-118,1997 A Tabu Search Method for Geometric Primitive Extraction, Qifa Ke, 4 Tianzi Jiang, Songde Ma, Pattern Recognition Letters 19(14):14431452,1997 Dyadic Scale Space, Ge Cong, Songde Ma, Pattern Recognition 5 30(2):339-352,1997 The United Adaptive Learning Algorithm for The Link Weights and Shape Parameter in Rbfn for Pattern Recognition, Deshuan Huang, Inter. 6 Journal of Pattern Recognition and Artificial Intelligence 11(6):873888,1997 A New Eigenstructure Method for Sinusoidal Signal Retrieval in A Broad 7 Band Noise - Estimation and Pattern Recognition, Baogang Hu, Gosine, R.G., IEEE Transactions on Signal Processing 45(12):3073-3083,1997 Performance Prediction of the Hough Transform, Zhanyi Hu, Songde Ma, 8 Journal of Computer Science and Technology 12(1):49-57,1997 Contour Matching Using Wavelet Transform and Multigrid Methods, 9 Tianzi Jiang, Songde Ma, Journal of Computer Science and Technology 12(6):564-570,1997 A Parallel Information-Based Complexity Approa-ch to Visual Surface 10 Recog-nition, Tianzi Jiang, International J. Computer and Mathematics 68(3-4):165-177,1998 Derivative Computation by Multiscale Filters, Songde Ma, Bingcheng Li, 11 Image and Vision Computing 16:43-53,1998 Robust Epipolar Geometry Estimation From Two Uncalibrated Images, 12 Jinxiang Chai , Songde Ma, Pattern Recognition Letter 19(9),1998 Multi-Agent Visual Surveillance of Dynamic Scenes, P.Remagnino, 13 Tieniu Tan, A.D.Worrall K.D.Baker, Image and Vision Computing 16(8):529-532,1998 Model-Based Localization and Recognition of Road Vehicles, Tieniu 14 Tan, G. D. Sullivan, K. D. Baker, Int. J. Computer Vision 27(1):525,1998 From Image Quadrilaterals to Bilateral Symmetric Trapezia, Tieniu Tan, 15 Pattern Recognition 31(8):1117,1998 Locating and Recognising Road Vehicles, Tieniu Tan, Optical 16 Engineering 37(1):202-207,1998 Application of Fuzzy Classification Technique in Computer Grading of 17 Fish Product, Baogang Hu, Gosine, R.G., Cao L.X 等, IEEE Transactions on Fuzzy Systems 6(1): 144-152,1998 Efficient Rotation Invariant Texture Features for Content-Based Image 18 Retrieval, Tieniu Tan, S.R.Fountain, Pattern Recognition 31(11):17251732, 1998 Rotation Invariant Texture Features and Their Use in Automatic Script 19 Identification, Tieniu Tan, IEEE Transactions on Pattern Analysis and Machine Intelligence 20(7):751-756,1998 Corner Enhancement in Curvature Scale Space, Ge Cong, Songde Ma, 20 Pattern Recognition 31(10):1491-1501,1998 A List-Processing Approach to Compute Voronoi Diagrams and the Euclidean Distance Transform, weiguang Guan, Songde Ma, IEEE 21 Transactions on Pattern Analysis and Machine Intelligence 20(7):757761,1998 Local Interaction Fields and Adaptive Regularizers for Surface 22 Reconstruction and Images Relaxation, ZhiyongYang , Songde Ma, Network: Comput. Neural Syst 9:19-37,1998 The Average Case Complexity of the Shift-Invariant Problem, T.Z.Jiang, 23 ArthurG.Werschulz, Approx. Theory & its Appl. 14(1):1-7,1998 The Worst Case Complexity of the Fredholm Equation with Non-Periodic 24 Free Term and Noise Information, T.Z.Jiang, Numer. Funct. Anal. and Optimiz 19(3&4):329-343,1998 Probabilistic Analysis of Galerkin-like Methods for the Fredholm 25 Equation, T.Z.Jiang, Journal of Computational Mathematics 16(5):445456,1998 On Multivariate Approximation by Mejer-Konig-Zeller Type 26 Polynomials, T.Z.Jiang, Southwest Journal of Pure and Applied Mathematics (7):1-8,1998 Deformable Registration of Digital Images, Weiguang Guan, Xie Lin , 27 Songde Ma, Journal of Computer Science and Technology 13(3):246260,1998 A New Definition of the Hough Transform, Zhanyi Hu, Wei Wang, Yi 28 Yang , Songde Ma, Journal of Computer Science and Technology 13(5): 385-392, 1998 Analysis on Attribute Reduction Strategies of Rough Set, J.Wang, 29 D.Q.Miao, Journal of Computer Science and Technology 13(2):189193,1998 New Methodology for Analytical and Optimal Design of Fuzzy PID 30 Controllers, B.-G. Hu, G.K.I. Mann, R.G. Gosine, IEEE Transactions on Fuzzy Systems 7: 521-539, 1999 Analysis of Direct Action Fuzzy PID Controller Structures, G.K.I. Mann, 31 B.-G. Hu, R.G Gosine, IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics 29(3): 371-388,1999 A Tabu Search Approach to Optimal Structuring Element Extraction for 32 MST-Based Shapes Description, Tianzi Jiang, International J. Computer Mathematics 71:437-4451999 The Worst Case Complexity of The Fredholm Equation with Periodic 33 Free Term and Noisy Information, Tianzi Jiang, International J. Computer Mathematics 73(1-2):1-14,1999 The Worst Case Complexity of The Fredholm Equation with Periodic 33 Free Term and Noisy Information, Tianzi Jiang, International J. Computer 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 Mathematics Matching Using Schwarz Integrals, QingYang , Songde Ma, Pattern Recognition 6: 1039-1047,1999 Intrinsic Multiscale Representation Using Optical Flow in the ScaleSpace, Qing Yang, Songde Ma, IEEE Trans. on Image Processing 3: 444447, 1999 Conditional Stochastic Decompositions in the M/M/c Queue with Server Vacations, Naishuo Tian, quanlin Li, Jinhua Cao, Stochastic Models 15(2):367 ̄378,1999 Geometric Primitive Extraction by the Combination of Tabu Search and Subpixel Accuracy, T. Jiang, J. Computer Science and Technology, 14(1):74-80,1999 An Inherent Probabilistic Aspect of the Hough Transform, ZhanyiHu, Changjiang Yang, Yi Yang , Songde Ma, Journal of Computer Science and Technology 14(1):44-48,1999 Bayesian Learning, Global Competition and Unsupervised Image Segmentation, Guodong Guo, SongDe MA, Pattern Recognition Letter 21:107-116,2000 A Generalization of 2-Periodic Trigonometric Interpolation, Tianzi Jiang, Southwest Journal of Pure and Applied Mathematics 5(1):74-81,2000 Medical Image Reconstruction Using a Multi-objective Gentic Local Search Algorithm, Xiaodong Li, Tianzi Jiang, David J., International Journal of Computer Mathematics 74:301-314,2000 Introduction to Special Section on Visual Surveillance, S.J.Maybank, T.N.Tan, Inter. J. Computer Vision 37(2):173,2000 Efficient Image Gradient-Based Vehicle Localisation, T. N. Tan, K. D. Baker, IEEE Trans. Image Processing, 9(8):1343-1356,2000 Personal Indentification Based on Handwriting, H.E.S.Said, T.N.Tan , K.D.Baker, Pattern Recognition 33(1):149-159,2000 A New Face Detection Method Based on Shape Information, J.G.Wang T.N.Tan, Pattern Recognition Letters 21(6-7):463-471,2000 Embedding Image Watermarks in DC Components, Jiwu Huang, Yun Q. Shi, Yi Shi, IEEE Trans. on Circuits and Systems for Video Technology 10(6): 974-979,2000 Automated Identification of Symmetry in CBED Patterns: A Genetic Approach, G.B. HU, L.-M. Peng, Q.F. Yu, H.Q. LU, Ultramicroscopy 84:47-56,2000 Model-based Adaptive Enhancement of Far Infrared Image Sequences, Ming Tang, Songde Ma, Jing Xiao, Pattern Recognition Letters 21:827835,2001 General Scheme of Region Competition Based on Scale Space, Ming Tang, Songde Ma, IEEE Transactions on Pattern Recognition and Machine Intelligence 23(12):1366-1378,2001 Font Recognition Based on Global Texture Analysis, Y. Zhu, T. Tan, Y. Wang, IEEE Tans. Pattern Analysis and Machine Intelligence 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 23(10):1192-1200,2001 Spatio-temporal Segmentation for video surveillance, H. Z. Sun, T. N. Tan, Electronics Letters 37(1):20-21,2001 A Discrete Trigonometric Interpolation Method, Tianzi Jiang D.J. Evans, International Journal of Computer Mathematics 78(3-4):13-22,2001 Cell Image Segmentation with Kernel-Based Dynamic Clustering and an Ellipsoidal Cell Shape Model, Faguo Yang , Tianzi Jiang, Journal of Biomedical Informatics 34(2):67-73,2001 Pixon-Based Image Denoising with Markov Random Fields, Qing Lu, Tianzi Jiang, Pattern Recognition 34(10):2029-2039,2001 Image Restoration by Combining Local Genetic Algorithm with Adaptive Pre-conditioning, Tianzi Jiang , D. J. Evans, International Journal of Computer Mathematics 76(3):279-295,2001 An Evolutionary Tabu Saerch Approach to Optimal Structuring Element Extraction for MST-Based Shapes Description, Tianzi Jiang, International Journal of Computer Mathematics, 76(3):307-315,2001 Time-domain Based Design and Analysis of New PID Tuning Rules, Mann, G.K.I., Hu, B.-G., Gosine, R.G., IEE Proceedings - Control Theory and Applications 148(3):251- 262,2001 Two-level tuning of fuzzy PID controllers, Mann, G.K.I., Hu, B.-G. , Gosine, R.G, IEEE Transactions on Systems Man, and Cybernetics Part B: Cybernetics 3(2):263-269,2001 A systematic study of fuzzy PID controllers? Function-based evaluation approach, Hu, B.-G., Mann, G.K.I., Gosine, R.G., IEEE Transactions on Fuzzy Systems 7(5): 699-712,2001 Robot Self-Location by Line Correspondences, Zhanyi Hu, Chen Lei, H.T. Tsui, Journal of Computer Science and Technology 16(2):97113,2001 A SVD-Based Watermarking Scheme for Protecting Rightful Ownership, R. Z. Liu and T. N. Tan,, IEEE Trans.on Multimedia Volume: 4 Issue: 1, pp.121-128,March 2002. Brief Review of Invariant Texture Analysis Methods, Jianguo Zhang and Tieniu Tan, Pattern Recognition Vol.35, No.3, pp.735-744, 2002. A Note on the Number of Solutions of the Non-Coplanar P4P Problem, Z. Y. HU and F. C. WU, IEEE-Trans. PAMI, Vol.24, No.4, pp.550-555, 2002 Visual Vehicle Tracking Algorithm, Jianguang Lou, Tieniu Tan and Weiming Hu, Electronic letters Vol.38 No.18, 2002. Mosaic Representations of Video Sequences based on Slice Image Analysis, Saolei Feng, Hanqing Lu and Songde Ma,, Pattern Recognition Letter Vol.23.pp.513-521, 2002. Head tracking Using Shape and adaptive color histogram, Qingshan Liu, Songed Ma and Hanqing Lu, Journal of Computer Science and Technology Vol.6, 2002 A Neural Network Approach to Shape from Shading, Tianzi Jiang, Bing 69 70 71 72 73 Liu, Yingli Lu and David J. Evans, International Journal of Computer Mathematics Vol. 80, No. 5/6, pp.1-6, 2002. A?Comparative Study of Global Optimization Approaches to MEG Source Localization, Tianzi Jiang, An Luo, Xiaodong Li and Frithjof Kruggel, International Journal of Computer Mathematics Vol. 80, No. 3/4, pp.1-20, 2002. An Evolutionary Tabu Search for Cell Image Segmentation, Tianzi Jiang and Faguo Yang, IEEE Transactions on Systems, Man and Cybernetics Part B, Cybernetics Vol. 32, No.5, pp. 675-678, 2002. On the Accelerated Richardson Method (ARM) for Solving Positive Definite Linear Systems, David J. Evans, Yong Fan and Tianzi Jiang, Neural, Parallel & Scientific Computations Vol. 10, No. 2, 2002. The Parallel Genetic Algorithm for Electromagnetic Inverse Scattering of a Conductor, Yong Fan, Tianzi Jiang and David J. Evans, International Journal of Computer Mathematics Vol. 79, No. 5, pp. 573-586, 2002. Volumetric Segmentation of the Ventricles From Brain MRI Using Parallel Genetic Algorithm, Yong Fan, Tianzi Jiang and David J. Evans, IEEE Transactions on Medical Imaging Vol. 21, No.8, pp.904-909, 2002. 面向口语翻译的汉语语句改写方法, 宗成庆, 张玉洁, 山本和英, 坂本 74 仁, 白井谕, Journal of Chinese Language and computing Vol.12, No.1, pp63-67, 2002. Chairman Songde MA Professor Professor Co-Chairman Thomas S Huang Members Tieniu TAN Tianzi JIANG Bo ZHANG Deyi LI Baozong YUAN Yunde JIA Ziqing LI Lin CHEN Zhiwei FENG Shuqian LUO Hongbin Zha Wufan CHEN Bo XU Jue WANG Professor Professor Professor Professor Professor Professor Professor Professor Professor Professor Professor Professor Professor Professor Fuji REN Anil Jain Alex Waibel Long QUAN Binghuang ZHUANG Professor Professor Professor Professor Professor Director Tieniu Tan Deputy Directors Tianzi Jiang Hanqing Lu Bo Xu Researchers Zhanyi Hu Chengqing Zong Weimin Hu Jianhua Tao Xiaopeng Zhang Baogang Hu Ziqing Li Yunhong Wang Yihong Wu Chunhong Pan Fuchao Wu Qing Yang Veronique Prinet Yufeng Zang Qingshan Liu Wenju Liu Chenglin Liu Ming Tang Xinwen Hou Caozhe Zhu Technician Zhiyi Chen Secretaries Guozhen Lian Wei Zhao Lixia Ma Post-Doctors Xing Zhao Chunhong Pan Zhigang Zhan Ruizhen Zhao Gexian Hou Yihong Wu Xiangdong Wang1。
模式识别国家重点实验室
模式识别国家重点实验室
佚名
【期刊名称】《实验室研究与探索》
【年(卷),期】1993(000)001
【摘要】模式识别国家重点实验室是我国第一批建成、对外开放的国家重点实验室之一,依托于中国科学院自动化研究所,于1984年创建,1987年建成。
实验室的研究工作相对独立进行。
实行主任负责、学术委员会评审制,自主地开展研究和学术活动。
实验室主任为自动化所马颂德教授(法国国家博士);
【总页数】5页(P98-101,109)
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1."慧眼"识别世界——记中国科学院自动化研究所模式识别国家重点实验室刘成林研究员
2.仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用
3.“以人为本”:新一代生物识别核心理念--专访国际模式识别学会第一副主席、模式识别国家重点实验室主任谭铁牛研究员
4.面向世界面向未来——模式识别国家重点实验室
5.我国虹膜识别技术取得新进展——访中国科学院自动化研究所模式识别国家重点实验室孙哲南博士
因版权原因,仅展示原文概要,查看原文内容请购买。
心电 T 波电交替检测算法综述
中
国
生
物
医
学
工
程
学
报
29 卷
得到的能量谱图计 算 T 波 交 替 率, 以此来判断是否 存在 TWA 现象 。 由于不同 形 态 的 T 波 波 形 可 能 具 有 同 样 的 能 量, 因此能量谱法的 缺 点 是 不 能 有 效 地 反 映 波 形 形 同 时 也 对 TWA 现 象 的 非 稳 态 特 征 态变化的 情 形, 无法有效识别 。 针对能 量 谱 方 法 不 能 有 效 地 反 映 波 形 形 态 变 Smith 等 人 提 出 了 一 种 改 进 的 方 法:谱 分 化的缺点, 析法( SM ) 有 谱, P j = FFT ( x i, j) ( i = 1, 2, …, m APS = 1 ≤ j ≤ n)
图1 Fig. 1
TWA 示意图
究
[ 5]
, 使得针 对 体 表 心 电 图 上 微 伏 级 TWA 的 进 一
TWA Diagram
步研究成 为 可 能 。 从 此 之 后, 无 论 是 在 TWA 病 理 TWA 临 床 价 值, 成因 、 还 是 在 TWA 检 测 算 法 方 面,
doi : 10. 3969 / j. issn. 02588021 . 2010 . 03. 021 0126 ,修回日期: 201003 25 收稿日期: 2010 基金项目:模式识别国家重点实验室开放课题基金资助 * 通讯作者 。 E-mail : shelihuang@ ise. neu. edu. cn
[ 2]
。1948 年, 在 Kaher 和 Schwartz 的研究中, 首
[ 3] 次报道 TWA 的出 现 与 猝 死 有 一 定 的 关 系 。 1950
基于CS和神经网络的传感器网络模式识别研究
摘
要 :当前 , 传感器 网络快速地发 展 , 其节点不断增多 , 需要传 输和储存 的数 据量也就不断增大 , 同时现
有传感器节点尺寸与复杂度 限制 了传感器 网络 的数据存储 、 数据 的计算速度及频宽 。针对此类 问题 , 将压 缩感知技术应用于传感器网络 , 对传感器 网络中传 输的数据进 行压缩 , 降低传输数 据量 , 然后 在接收端 重 构数据 , 将该数据样本作为 B P网络 的输入进行识别 。实 验证 明 : 该方法 可 以提高 网络数据存储能力 和带 宽利用率 。 关键词 :压缩感知 ; 传感器 网络 ; P神经网络 B
.
pol s cmpesdsnigtcnlg sapi esrntok ,a st nm td i sno e ok r r e , rse e s h ooyi pl dt sno e rs dt r s ie n e sr t rsa bm o n e e o w a a t nw e
收 稿 日期 :0 1 o _6 2 1 _ 12
I ]任意信号 都可 以表示为 ,
基金项 目: 国家 自 然科学基金资助项 目( 0 70 4 国家重点实验室开放课题项 目( FJ09 5 6 8 12 ); K J 0 1) 2
第l 2期
龚
静, : 等 基于 c s和神经 网络 的传感器 网络模式识别研究
2, 9 即采样 、 存 及 传 递 的数 据 量 还 不 到原 始 数 据量 的 储
式中
C为很 小 的系数 。那 么 , 就要 设计 一个 平稳 的且 与
不相关的 M × N维 的观测矩 阵 J, P 对 进行观测 , D投 将
电力视觉技术的概念、研究现状与展望
第36卷第1期电力科学与工程V ol. 36, No. 1 2020年1月Electric Power Science and Engineering Jan., 2020 doi: 10.3969/j.ISSN.1672-0792.2020.01.001电力视觉技术的概念、研究现状与展望赵振兵a,张薇a,翟永杰b,赵文清b,张珂a,孔英会a,戚银城a (华北电力大学a. 电气与电子工程学院;b. 控制与计算机工程学院,河北保定071003)摘要:随着我国新一代电力系统建设的快速发展,发输变电设备作为电力系统的重要组成部分,实现其缺陷的智能检测与分析变得愈发重要。
紧跟国家新一代人工智能的步伐,与当今较热的计算机视觉相结合,提出电力视觉技术的概念,分析其研究对象和难点问题,在电力系统、计算机视觉和人工智能等领域之间建立了桥梁,并系统地总结了电力视觉技术在发电、输电和变电3大场景中的研究现状。
最后从泛在电力物联网、少样本或零样本学习、生成式对抗网络、电力知识图谱和视觉推理等方面来分析电力视觉技术及其应用的未来发展趋势。
关键词:电力视觉;新一代电力系统;机器学习;模式识别;图像处理中图分类号:TN911.73;TM726 文献标识码:A 文章编号:1672-0792(2020)01-0001-08 Concept, Research Status and Prospect of Electric PowerVision TechnologyZHAO Zhenbing a, ZHANG Wei a, ZHAI Yongjie b, ZHAO Wenqing b, ZHANG Ke a,KONG Yinghui a, QI Yincheng a(a. School of Electrical and Electronic Engineering; b. School of Control and Computer Engineering,North China Electric Power University, Baoding 071003, China)Abstract: With the rapid development of China's new generation power system construction, power generation, transmission and transformer equipments are an important part of the power system, and intelligent detection and analysis of their defects has become increasingly important. Keeping pace with China's new generation of artificial intelligence and combining with today's hot computer vision, this收稿日期:2019-12-06基金项目:国家自然科学基金项目(61871182,61773160);北京市自然科学基金项目(4192055);河北省自然科学基金项目(F2017502016);中央高校基本科研业务费专项资金项目(2018MS095,2018MS094);模式识别国家重点实验室开放课题基金项目(201900051);国家留学基金项目(201906735011)作者简介:赵振兵(1979—),男,博士,副教授,主要研究方向为电力视觉;张薇(1995—),女,硕士研究生,主要研究方向为图像检测与深度学习;翟永杰(1972—),男,博士,教授,主要研究方向为模式识别与电力视觉;赵文清(1973—),女,博士,教授,主要研究方向为数据挖掘与电力视觉;张珂(1980—),男,博士,副教授,主要研究方向为计算机视觉;孔英会(1965—),女,博士,教授,主要研究方向为计算机视觉;戚银城(1968—),男,博士,教授,主要研究方向为电力系统通信与信息处理。
文本特征提取的研究进展
DOI:10.13878/j.cnki.jnuist.2019.06.008曾明睿1㊀袁梦奇1㊀邵曦1㊀鲍秉坤1㊀徐常胜1,2文本特征提取的研究进展摘要文本理解是人工智能的一个重要分支,其技术推动了人与计算机之间在自然语言上的有效交互.为了让计算机准确地理解和感知文本数据,文本特征提取是最为基础和关键的步骤之一.基于此,本文介绍文本特征提取研究的发展历史,以及近年来主流特征提取的方法,并对未来的研究方向进行展望.首先,介绍语义最底层的词级表示;接着,总结在词级表示基础上衍生出的句级表示上的研究进展;随后,介绍比词级表示和句级表示更高层的篇分析;最后,通过文本特征提取的一个典型应用 问答系统的介绍,阐述文本特征提取的最新方法和技术在问答系统上的应用,并对未来的研究方向做了展望.关键词自然语言处理;文本特征提取;问答系统中图分类号TP391 1文献标志码A收稿日期2019⁃10⁃15资助项目国家自然科学基金(61572503,61872424,6193000388,61872199);南京邮电大学高层次人才启动基金(NY218001);模式识别国家重点实验室开放课题(201900015)作者简介曾明睿,男,硕士生,主要研究方向为多媒体计算.894606932@qq.com鲍秉坤(通信作者),女,博士,教授,博士生导师,主要研究方向为多媒体计算和计算机视觉.bingkunbao@njupt.edu.cn1南京邮电大学通信与信息工程学院,南京,2100442中国科学院自动化研究所模式识别国家重点实验室,北京,1001900 引言㊀㊀互联网技术的高速发展,以及硬件产品的不断更新换代,使得网络上的数据呈现出 爆炸式 的增长态势.特别是作为信息主要载体的文本数据,一方面数量迅速增长,另一方面其表现形式和结构也变得复杂多样,为文本理解带来了巨大的挑战.文本理解的核心是将文本数据通过数学运算转换为计算机可以感知和分析的信号,并根据任务的不同,对其进行自动处理以反馈结果.在文本理解中,最基础和最关键的步骤之一就是文本特征提取.文本特征提取是为文本数据集寻找一个具有判别力的特征空间,并将所有的文本数据映射到这一空间上,以抽取有代表性的㊁鲁棒的特征表示向量.互联网上涌现的海量文本数据,既带来了丰富的语料资源,同时也使文本感知㊁分析和处理面临了巨大的挑战.首先,每个用户都可以产生和传播数据,而其中文本的占比又最大,这导致了文本语料规模的迅速增长,因此 大数据 是面临的第一个挑战;其次,在大数据的背后隐藏了大量重复且无意义的数据,这些数据良莠不齐,价值密度低,因此 大噪声 是面临的第二个挑战;最后,数据存在于各种各样的平台中,其类型包括了结构化数据㊁半结构化数据和非结构化数据等,因此 结构复杂 是面临的第三个挑战.近年来,许多学者针对新环境下文本数据的这三个挑战,在文本特征提取上提出了大量有效的方法和技术.本文将对这些研究成果进行归纳和总结,为该方向的研究人员快速了解文本特征提取提供参考.依据语义单元的大小,本文首先介绍词上的特征提取方法和技术,包括利用上下文信息和外部知识引入;随后介绍比词级更高一层的句级特征表示,主要基于词级表示的方法,通过引入词和词之间的关联,对句子进行更高层语义的理解;再次,对语篇表示的研究成果进行总结,主要关注语篇关系挖掘的方法和技术.最后,介绍文本特征提取在问答系统上的典型应用,将结合双向Transformer的编码表示㊁注意力模型和卷积神经网络的方法展开阐述.新时代背景下所面临的大数据㊁大噪声和结构复杂三个挑战,也是词级表示㊁句级表示㊁语篇表示和问答系统需要解决的难点,因此本文在文献总结的过程中将侧重这三个方面详细阐述相关的应对方法和解决方案.本文第1章到第3章将依次详细阐述在对于词级表示㊁句级表示和语篇关系三层语义做特征提取时所采用的技术,并对每层语义级㊀㊀㊀㊀再次细分做介绍.第4章是对文本特征提取方法进行结合和实际在问答系统的应用.最后,展望了文本特征提取的未来研究方向并对全文进行总结.1㊀词级表示词作为文本中最基础的单位,是构成句子和语篇的最小元素.对词的特征提取通常称为词级表示,但在文本中,不管是英文单词还是中文词汇的数量都是非常庞大的,仅仅对这些词进行顺序编码,不仅人力花费高昂,还难以揭示词与词之间的语义关系,因此对词级进行语义距离可度量的向量化表示是非常必要的.具体来说,在给定某一语义度量准则下,将每个词或词组投影为高维的向量,这些向量形成的空间称为词级的向量空间,以此将非结构化的文本转化为了可处理的结构化形式.然而这种工作是属于预训练的范畴的,当我们把词级表示应用到实际问题的时候,无须从零开始训练一个新的模型,这为后面的训练大大节省了时间.目前关于词的预训练方法,可以分为两条思路:利用上下文相关信息和外部知识关系的结合.1 1㊀利用上下文相关信息在自然语言中,很多单词有着多种含义,而其真实含义是根据所在的上下文语境来决定的.因此在设计词的特征提取模型时,需要引入上下文相关信息,以消除一词多义的影响.根据模型种类的不同,基于上下文信息的词级表示方法可以分为基于LSTM模型和基于Transformer模型两类.基于LSTM模型这类方法,是针对于传统方法(如word2vec等)忽略词的上下文关系,无法建模词的一词多义的缺陷所提出的.具体实现是通过将整句的单词,输入进LSTM神经网络中,通过LSTM建模目标词和句子里其他单词的上下文的语义关联,来获得融合其他单词信息的词级表征.根据融合单词与目标词的位置不同,这类词级表示的方法可以分为两类:前向融合[1](图1)和双向融合[2](图2).前向融合只考虑目标词之前的词对其产生的语义影响,如图1所示,对 into 进行词级表示,将 into 之前的单词 problems ㊁ turning 等依次输入至LSTM模型中,根据单词与目标词的远近,进行有选择的记忆存储和遗忘,并将记忆信息融合至 into 的词级表示中.很显然,不仅 into 之前的单词对其有语义影响,其之后的单词 banking ㊁ crises ㊁ as 等也会有影响,因此学者又在前向融合的基础上,考虑目标词之后的词,提出双向融合的方法(图2).具体而言,建模由两个LSTM构成的Bi⁃LSTM模型,分别从前往后和从后往前对单词进行输入,以融合目标词前后的所有单词的语义.基于Bi⁃LSTM模型,Melamud等[2]改进了基于word2vec的CBOW图,提出con⁃text2vec.其中,基于word2vec的CBOW图计算窗口内所有词嵌入的平均值(图3),而context2vec是基于Bi⁃LSTM融合目标词的上下文(图4).为了建模更为复杂的上下文语义关系,Peters等[3]提出了ELMo(EmbeddingsfromLanguageModels)模型,这是一种深度语境化词表示方法,由两层Bi⁃LSTM组成的语言模型内部状态函数生成的词向量,通过Bi⁃LSTM连接的语言模型将每个输入字上方堆叠的向量的线性组合以组合表示多样的文字特征,表示更加丰富的语义.相比于基于LSTM模型的方法,Transformer模型不仅不需要通过循环来并行处理句中的单词,还能结合上下文的信息,因此在处理长语句时,效率较高.Radford等[4]最先基于Transformer提出了OpenAIGPT,该模型克服了LSTM的短期预测能力,通过捕捉长距离的语言结构,来学习一个通用表示.2018图1㊀前向融合[1]Fig 1㊀Forwardconvergence[1]图2㊀双向融合[2]Fig 2㊀Bi⁃directionconvergence[2]707学报(自然科学版),2019,11(6):706⁃715JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition),2019,11(6):706⁃715图3㊀CBOW模型[2]Fig 3㊀CBOWmodel[2]图4㊀Context2vec模型Fig 4㊀Context2vecmodel年,Devlin等[5]提出了基于深度双向Transformer的BERT(BidirectionalEncoderRepresentationfromTransformer)模型,与OpenAIGPT单方向的预训练模型不同的是,BERT提出了一种遮蔽语言模型图5㊀遮蔽语言模型[5]Fig 5㊀Masklanguagemodel[5](MaskLanguageModel)来训练出上下文的特征(图5),它通过遮蔽一个单词,训练一个深度双向Trans⁃former模型,从单词的左右两个方向来预测遮蔽单词.2019年,Dai等[6]通过引入相对位置编码和片段循环机制对Transformer模型进行改进,提出Trans⁃former⁃XL模型,循环机制在每处理完一个片段之后都会将输出保留在隐藏层中以便后面循环,建立长期的依赖关系.而相对位置编码则是通过对隐藏状态的相对位置进行编码,克服了不同片段编码可能导致编码一样的问题.两种方法的融合解决了由于固定上下文的长度所带来的无法获取超出定义长度的依赖关系的问题.1 2㊀外部知识的引入传统的词级表示方法在情感分类㊁文本分类等任务上取得了令人满意的结果,但当处理稀疏词汇时,由于词汇出现的频率较低,无法对其抽取得到准确的语义,甚至容易受到噪声的干扰.因此,学者们提出通过加入维基百科等其他语料库,引入外部的知识,以获得更为准确的词级表示.如何将外部语料库有效地引入到目标语料库中,生成融合外部知识的词嵌入,是目前这部分工作面临的挑战.2017年,Cao等[7]建模文本和知识库之间的关联,以解决多义词引起的歧义的问题.Sarma等[8]分别在目标语料库上训练一个通用词嵌入和在外部语料库上训练一个外来词嵌入,然后对两组嵌入使用线性CCA[9]或非线性CCA[10],沿着最大相关的方向投射,再取平均值,最终得到引入外部知识的词级特征表示.Xu等[11]将通用词嵌入和外来词嵌入的双重嵌入机制与CNN网络结合,让CNN网络决定两种嵌入中可用信息的比重,从而使文本特征提取更加高效㊁简单.相较于BERT的MaskLanguageModel无法对显式语义单元进行建模,百度的Paddle发布了知识增强的预训练模型ERNIE[12](EnhancedLanguageRepresentationwithInformativeEntities),该模型通过将知识图谱在编码输入至预训练模型,从而有效地挖掘了图谱中实体间关系,最终增强了模型语义表示能力.例如在图6中, 哈尔滨 作为一个整体被抹去时,则需要通过更长的依赖性来预测学习,而ERNIE可以通过先验知识 黑龙江的省会 预测表示出遮掩词 哈尔滨 .2㊀句级表示仅依靠词级表示,无法获得对文本的准确理解,807曾明睿,等.文本特征提取的研究进展.ZENGMingrui,etal.Researchprogressontextfeatureextraction.图6㊀ERNIE的学习Fig 6㊀LearntbyERNIE需要考虑词和词之间的关联对语义的影响,因此句子级表示的研究就应运而生了.句级表示方法最常用的是句子嵌入,具体来说是用向量来表示自然语言中的语句,使其携带句子中的语义信息.句子嵌入方法可分为基于词向量的线性组合和基于深度学习两类方法.图7㊀SiameseCBOW网络结构[14]Fig 7㊀SiameseCBOWnetworkstructure[14]2 1㊀基于词向量的线性组合把句子中所有词的词嵌入取平均值是一种非常成功和高效的获得句子嵌入的方法[13].具体来说,是将句子中每个词嵌入相加除以句中词数得到的向量值作为句嵌入.这一方法的缺陷在于忽略了句中词的权重和顺序.Kenter等[14]基于word2vec中的CBOW提出了SiameseCBOW(图7),与CBOW有着相同的原理,只不过该模型是将句中的词向量先做平均值处理表征句向量,然后通过周围的句子对目标句子进行预测来学习词嵌入以便达到优化的目的,最后对优化之后的词嵌入做平均值处理形成句向量.Arora等[15]仅计算句子中词向量的加权平均,然后删除第一个向量上的平均投影,权重的计算来自于作者提出的SIF,即一个词的权重:w=aa+p(w),其中,a为参数,p(w)为预测词的词频.这样的加权方案具有十分不错的鲁棒性:使用从不同语料库得出的单词频率不会损害性能并且a的取值很广,可以让结果达到最佳.2 2㊀基于深度学习的句级表示近年来,随着深度学习在文本领域的广泛应用,越来越多的学者在句级表示上尝试引入深度学习模型,以建模词与词之间的复杂关系.目前基于深度学习的方法主要基于循环神经网络㊁卷积神经网络和encoder⁃decoder.在基于循环神经网络方面,Zhang等[16]提出sentence⁃stateLSTM,每次循环都对所有单词语义特征的隐藏状态进行建模,而不再是一次一个单词输入.将整个句子看成一个状态,这个状态是由各个词的子状态和一个整体的句子层状态组成.在每次循环时,单词的隐藏状态都能捕捉到越来越大的n⁃gram信息,并与句子状态进行信息交换.最终,循环得到一句话的表示.卷积神经网络方法在图像处理上已经取得了非常不错的效果,要求输入值是一个固定的图像分辨率.近年来,学者也在尝试将卷积神经网络应用在自然处理上,但是输入的文本或者句子长度不固定会907学报(自然科学版),2019,11(6):706⁃715JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition),2019,11(6):706⁃715造成多余的卷积结果丢失,从而对模型结果产生影响.Kim[17]先将词表示变成矩阵,然后通过一个仅有一层卷积层的简单CNN,对其进行Max⁃overtimepoo⁃ling,最后经过全连接层得到句向量.Santos等[18]让词嵌入和字符嵌入通过卷积神经网络联合表示形成句向量,其创新之处在于利用两层卷积层去提取词和句中的相关特征.第一层提取句子级的特征,第二层获取每个单词字符周围生成的局部特征用最大化的方式将其组合,最终生成一个固定大小的向量.在encoder⁃decoder方面,句级表示主要是将词级表示中的word2vec模型推广到句子上.Kiros等[19]提出了Skip⁃ThoughtVectors,通过大量连续的语料库训练出一个encoder⁃decoder模型,将多个词向量编码成句向量,并同时用一个句子来预测上下文另一个的句子.模型如图8,模型中是用一个三元组(si-1,si,si+1)表示连续的三句话,将来自连续语库si编码重建前一句si-1和后一句si+1.图中未连接的箭头连接到编码器输出,颜色指示了共享参数的组件.受到BOW编码思想的启发,Hill等[20]提出了对数线性语句模型 FastSent,将一个连续句子的三元组(si-1,si,si+1),对于中间的句子si进行编码,编码方式是将si中的词向量求和即ðwɪsisi,这种方法没有考虑句中的词序,因此使得FastSent的训练速度大幅提升.根据实验用Skip⁃ThoughtVectors[19]和FastSent两种模型训练得到参数的数据如表1所示,图8㊀Skip⁃ThoughtVectors模型[19]Fig 8㊀Skip⁃ThoughtVectorsmodel[19]其中∗表示在GPU上进行训练.表1㊀两种模型参数比较[20]Table1㊀Parametercomparisonbetweentwomodels[20]句向量维度/维词向量维度/维训练时间/hSkip⁃ThoughtVectors4800620336∗FastSent1001002㊀注:∗表示在GPU上进行训练.3㊀语篇分析事实上,句子之间也会存在着复杂的逻辑关系,因此需要引入语篇分析挖掘来进一步理解文本.语篇分析又称篇章分析,是通过对文本内部实体关系的挖掘和理解,对语篇整体进行分析,从而获得整个文档的高层语义.本章将分别介绍语篇分析中文本关系和隐式语篇表示嵌入两部分的研究.文本关系抽取需要深入理解语篇内所有实体之间的关系,由此学习到的文本关系嵌入可以用来扩充现有的关系提取模型,并能显著地提高它们的性能.Xu等[21]通过卷积神经网络从实体间最短依赖路径学习更稳健的关系表示文本关系.但是这一方法需要依赖大量的标注句子作为训练集生成嵌入模型.Su等[22]提出GloRE,通过定义句子依赖图中两个实体的最短路径去改进关系提取,同时将文本关系和知识库关系的全局共现统计来学习文本关系的嵌入.可是由于手工标注的训练集太少,这一方面仅适用于小规模的训练数据的关系提取.2019年,Chen等[23]将GloRE方法与可以从缺少标签的数据中提取关系的远程监督方法[24]相结合进一步应用于大规模㊁领域无关的数据,目的是学习通用文本关系嵌入.作为语篇分析另一重要分支,隐式语篇分析是在没有显式连接词的情况下提取关系,这很难从输入句子对的表面特征派生出来,所以需要从文本语义理解的角度中去寻找关系.近几年不少学者已经提出了基于神经网络的方法或高级表示的模型:CNN[25]㊁注意神经张量网络[26]㊁记忆网络(memorynetwork)[27]和RNN[28]等.还有一些方法考虑到了上下文段落和段落间相关性[29].但是对于机器来说,如何更好地理解文本成为了隐式语篇关系识别研究前进的障碍.因此,Bai等[30]通过字词和ELMo[2]的增强嵌入和深度剩余双注意力编码器,让表示更加丰富和深入模型结构(图9).017曾明睿,等.文本特征提取的研究进展.ZENGMingrui,etal.Researchprogressontextfeatureextraction.图9㊀增强嵌入和深度剩余双注意力编码器[30]Fig 9㊀Enhancedembeddinganddeepremainingdualattentionencoder[30]4㊀文本特征提取结合实际的应用问答系统是文本特征提取的一个典型应用,任务是能够准确地理解用户用自然语言提出的问题,并通过检索语料库㊁知识图谱或问答知识库返回简洁㊁准确的答案.相较于搜索引擎,问答系统能够根据已有语料库学习问答知识,进而更有效地满足用户的信息需求.将文本特征提取的技术应用在问答系统中可以很好地帮助计算机理解人类语言的重点,同时在提高训练速度㊁检索答案质量等方面都会有很好的表现.在问答系统领域方面,有效的提取问句的意图识别和填槽可以为快速准确匹配出答案和使其更加人性化奠定基础.表2显示了一个用户查询的意图分类和填槽的实例.表2㊀用户查询的意图分类和填槽的实例Table2㊀Anexampleofintentionclassificationandslotfillingofuserquery今天南京天气怎么样?意图查询天气信息槽具体查询哪里的天气?哪一天的天气?Chen等[31]将之前BERT[5]扩展到一个联合意图分类和槽填充模型.基于第一个特殊token的隐藏状态h1的意图被表示为yi=softmax(Wihi+bi),而对于槽填充模型,将会提供除去第一个token的最终隐藏状态:h2, ,hT进入Softmax层,对槽填充标签进行分类.当两个任务联合训练时,使目标函数pyi,ys|x()=p(yi|x)ᵑNn=1pysn|x()最大化.经过在Snips和ATIS数据集上测试的结果如表3,可以看出基于BERT的意图分类和槽填充在准确率方面相较于其他方法都取得了最好的结果.表3㊀不同测试集上的实验结果[31]Table3㊀Experimentalresultsondifferenttestsets[31]%SnipsATIS意图分类槽填充意图分类槽填充RNN⁃LSTM96 987 392 694 3Atten⁃Bi⁃LSTM96 787 891 194 2Slot⁃Gated97 088 894 195 2JointBert98 697 097 596 1此外,对于问题的理解对于问答系统来说也是117学报(自然科学版),2019,11(6):706⁃715JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition),2019,11(6):706⁃715十分重要的.Dong等[32]介绍了多列卷积神经网络,模型不依赖于手工特征和规则,通过共享相同的词向量来表示问题单词,使用不同列的网络来提取答案类型㊁关系和上下文信息.同时,也会在知识库中共同学习实体和关系的低维嵌入.使用问题⁃答案组合对模型进行训练,以对候选答案进行排序.如图10不同网络列获取得问题表示.2017年,Seo等[33]提出BIDAF(BidirectionalAt⁃tentionFlowforMachineComprehension)双向注意力矩阵来计算上下文的每个字与查询问题之间的相关性,从而建立查询感知的上下文表示.然而这种模型却不能像人类一样对候选答案进行反思,因此Gong等[34]将BIDAF扩展成RuminatingReader使其能够进行第二遍阅读和推理,通过门控机制让第一遍和第二遍阅读的内容进行融合(模型框架如图11),在选择答案的时候能够有效地使用上下文并更好地权衡答案.5 展望本文根据语义层面的由低到高依次总结了词㊁句和篇章三个层次上文本特征提取方法的研究进展.近年来,学者们注意到图作为一种特殊的数据结构,能够面对一组对象和对象之间的联系进行建模.由于这一强大的优点,把基于图神经网络的方法用于机器学习的方向越来越受人追捧.同时,现在数据平台的多样性使得数据结构变得极为复杂,给文本特征提取带来了不小的挑战,而图神经网络作为一种可以在图结构上运行的神经网络,能够保存图形嵌入中的全局结构信息,因此在处理具有丰富关系结构的任务时可以得到很好的效果.所以,利用图神经网络来应对结构复杂的文本信息也成为了一个新的研究方向.在问答系统方面,生成的回答也更加人性化,因此,在未来的文本特征提取中,应该建立新的文本特征表示模型,并结合领域知识快速定位用户的兴趣反馈,以达到更加流畅的使用感受.图10㊀使用不同列网络获得的问题表示来查询最近的上下文[32]Fig 10㊀Usingquestionrepresentationsobtainedbydifferentcolumnnetworkstoquerythenearestneighbors[32]217曾明睿,等.文本特征提取的研究进展.ZENGMingrui,etal.Researchprogressontextfeatureextraction.图11㊀反思器模型结构[34]Fig 11㊀ModelstructureofRuminatingReader[34]参考文献References[1]㊀HochreiterS,SchmidhuberJ.Longshort⁃termmemory[J].NeuralComputation,1997,9(8):1735⁃1780[2]㊀MelamudO,GoldbergerJ,DaganI.Context2vec:learninggenericcontextembeddingwithbidirectionalLSTM[C]ʊProceedingsofthe20thSIGNLLConferenceonCom⁃putationalNaturalLanguageLearning,2016:51⁃61[3]㊀PetersME,NeumannM,IyyerM,etal.Deepcontextual⁃izedwordrepresentations[J].arXivPreprint,2018,arXiv:1802.05365[4]㊀RadfordA,NarasimhanK,SalimansT,etal.Improvinglanguageunderstandingbygenerativepre⁃training[EB/OL].[2019⁃10⁃12].https:ʊs3⁃us⁃west⁃2.amazonaws.com/openai⁃assets/researchcovers/languageunsupervis⁃ed/languageunderstandingpaper.pdf,2018[5]㊀DevlinJ,ChangMW,LeeK,etal.Bert:pre⁃trainingofdeepbidirectionaltransformersforlanguageunderstanding[J].arXivPreprint,2018,arXiv:1810.04805[6]㊀DaiZ,YangZ,YangY,etal.Transformer⁃xl:attentivelanguagemodelsbeyondafixed⁃lengthcontext[J].arXivPreprint,2019,arXiv:1901.02860[7]㊀CaoYX,HuangLF,JiH,etal.Bridgetextandknowledgebylearningmulti⁃prototypeentitymentionem⁃317学报(自然科学版),2019,11(6):706⁃715JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition),2019,11(6):706⁃715bedding[C]ʊProceedingsofthe55thAnnualMeetingoftheAssociationforComputationalLinguistics(Volume1:LongPapers),2017:1623⁃1633[8]㊀SarmaPK,LiangY,SetharesWA.Domainadaptedwordembeddingsforimprovedsentimentclassification[J].arXivPreprint,2018,arXiv:1805.04576[9]㊀HotellingH.Relationsbetweentwosetsofvariates[J].Biometrika,1936,28(3/4):321.[10]㊀HardoonDR,SzedmakS,Shawe⁃TaylorJ.Canonicalcor⁃relationanalysis:anoverviewwithapplicationtolearningmethods[J].NeuralComputation,2004,16(12):2639⁃2664[11]㊀XuH,LiuB,ShuL,etal.DoubleembeddingsandCNN⁃basedsequencelabelingforaspectextraction[J].arXivPreprint,2018,arXiv:1805.04601[12]㊀ZhangZ,HanX,LiuZ,etal.ERNIE:enhancedlanguagerepresentationwithinformativeentities[J].arXivPreprint,2019,arXiv:1905.07129[13]㊀FaruquiM,DodgeJ,JauharSK,etal.Retrofittingwordvectorstosemanticlexicons[J].arXivPreprint,2014,arXiv:1411.4166[14]㊀KenterT,BorisovA,DeRijkeM.SiameseCBOW:optimi⁃zingwordembeddingsforsentencerepresentations[J].arXivPreprint,2016,arXiv:1606.04640[15]㊀AroraS,LiangY,MaT.Asimplebuttough⁃to⁃beatbase⁃lineforsentenceembeddings[C]ʊInternationalConfer⁃enceonLearningRepresentations,2017[16]㊀ZhangY,LiuQ,SongL.Sentence⁃stateLSTMfortextrepresentation[J].arXivPreprint,2018,arXiv:1805.02474[17]㊀KimY.Convolutionalneuralnetworksforsentenceclassi⁃fication[J].arXivPreprint,2014,arXiv:1408.5882[18]㊀DosSantosC,GattiM.Deepconvolutionalneuralnetworksforsentimentanalysisofshorttexts[C]ʊPro⁃ceedingsofCOLING2014,the25thInternationalConfer⁃enceonComputationalLinguistics:TechnicalPapers,2014:69⁃78[19]㊀KirosR,ZhuY,SalakhutdinovRR,etal.Skip⁃thoughtvectors[C]ʊAdvancesinNeuralInformationProcessingSystems,2015:3294⁃3302.[20]㊀HillF,ChoK,KorhonenA.Learningdistributedrepresen⁃tationsofsentencesfromunlabelleddata[J].arXivPre⁃print,2016,arXiv:1602.03483[21]㊀XuK,FengYS,HuangSF,etal.Semanticrelationclas⁃sificationviaconvolutionalneuralnetworkswithsimplenegativesampling[J].arXivPreprint,2015,arXiv:1506.07650[22]㊀SuY,LiuHL,YavuzS,etal.Globalrelationembeddingforrelationextraction[J].arXivPreprint,2017,arXiv:1704.05958[23]㊀ChenZY,ZhaHW,LiuHL,etal.Globaltextualrelationembeddingforrelationalunderstanding[J].arXivPreprint,2019,arXiv:1906.00550[24]㊀MintzM,BillsS,SnowR,etal.Distantsupervisionforre⁃lationextractionwithoutlabeleddata[C]ʊProceedingsoftheJointConferenceofthe47thAnnualMeetingoftheACLandthe4thInternationalJointConferenceonNaturalLanguageProcessingoftheAFNLP:Volume2⁃ACL⁃IJCNLP,2009:1003⁃1011[25]㊀QinLH,ZhangZS,ZhaoH.Astackinggatedneuralar⁃chitectureforimplicitdiscourserelationclassification[C]ʊProceedingsofthe2016ConferenceonEmpiricalMethodsinNaturalLanguageProcessing,2016:2263⁃2270[26]㊀GuoFY,HeRF,JinD,etal.Implicitdiscourserelationrecognitionusingneuraltensornetworkwithinteractiveattentionandsparselearning[C]ʊProceedingsofthe27thInternationalConferenceonComputationalLinguis⁃tics,2018:547⁃558[27]㊀JiaYY,YeY,FengYS,etal.Modelingdiscoursecohe⁃sionfordiscourseparsingviamemorynetwork[C]ʊPro⁃ceedingsofthe56thAnnualMeetingoftheAssociationforComputationalLinguistics(Volume2:ShortPapers),2018:438⁃443[28]㊀JiYF,EisensteinJ.Onevectorisnotenough:entity⁃aug⁃menteddistributedsemanticsfordiscourserelations[J].TransactionsoftheAssociationforComputationalLin⁃guistics,2015,3:329⁃344[29]㊀DaiZY,HuangRH.Improvingimplicitdiscourserelationclassificationbymodelinginter⁃dependenciesofdiscourseunitsinaparagraph[J].arXivPreprint,2018,arXiv:1804.05918[30]㊀BaiHX,ZhaoH.Deepenhancedrepresentationforimplicitdiscourserelationrecognition[J].arXivPreprint,2018,arXiv:1807.05154[31]㊀ChenQ,ZhuoZ,WangW.BERTforjointintentclassifi⁃cationandslotfilling[J].arXivPreprint,2019,arXiv:1902.10909[32]㊀DongL,WeiFR,ZhouM,etal.Questionansweringoverfreebasewithmulti⁃columnconvolutionalneuralnetworks[C]ʊProceedingsofthe53rdAnnualMeetingoftheAssociationforComputationalLinguisticsandthe7thIn⁃ternationalJointConferenceonNaturalLanguagePro⁃cessing(Volume1:LongPapers),2015:260⁃269[33]㊀SeoM,KembhaviA,FarhadiA,etal.Bidirectionalattentionflowformachinecomprehension[J].arXivPre⁃print,2016,arXiv:1611.01603[34]㊀GongYC,BowmanSR.Ruminatingreader:reasoningwithgatedmulti⁃hopattention[J].arXivPreprint,2017,arXiv:1704.07415417曾明睿,等.文本特征提取的研究进展.ZENGMingrui,etal.Researchprogressontextfeatureextraction.ResearchprogressontextfeatureextractionZENGMingrui1㊀YUANMengqi1㊀SHAOXi1㊀BAOBingkun1㊀XUChangsheng1,21Schoolofcommunicationandinformationengineering,NanjingUniversityofPostsandTelecommunications,Nanjing㊀2100442InstituteofAutomation,ChineseAcademyofSciencesInstituteofAutomation,ChineseAcademyofSciences,Beijing㊀100190Abstract㊀Textunderstandingisanimportantresearchbranchinartificialintelligence,whichavailstheeffectiveinteractionbetweenhumanandcomputerwithnaturallanguage.Textfeatureextractionisoneofthebasicandkeystepsforcomputerstounderstandandperceivethetextualdata.Inthispaper,weintroducethedevelopmenthistoryoftextfeatureextractionandthemainstreamfeatureextractionmethodsinrecentyears,andprospectsthefuturere⁃searchdirectionsoftextfeatureextraction.Thethreesemantichierarchies,namelywordrepresentation,sentencerep⁃resentationanddiscourserelationshipminingareelaborated,thenacaseisgiventoshowthetypicalapplicationoftextfeatureextractiononquestionansweringsystem.Keywords㊀naturallanguageprocessing;textfeatureextraction;questionansweringsystem517学报(自然科学版),2019,11(6):706⁃715JournalofNanjingUniversityofInformationScienceandTechnology(NaturalScienceEdition),2019,11(6):706⁃715。
基于神经网络的遥感图像分类
收稿日期:2000-10-18基金项目:模式识别国家重点实验室开放课题基金项目作者简介:毛建旭(1974—),男,江西安义人,现为湖南大学电气与信息工程学院博士生,主要研究方向为人工智能、遥感图像处理与分析、计算机视觉检测、计算机应用等。
文章编号:1000-8829(2001)05-0029-02基于神经网络的遥感图像分类Remote Sensing Image Cla ssification Ba sed on Neural Network(湖南大学电气与信息工程学院,湖南长沙 410082) 毛建旭,王耀南摘要:针对传统的遥感图像分类方法分类精度低的缺点,提出了一种基于神经网络的分类方法。
实验结果表明,这种基于神经网络的分类器经过训练后,可应用于遥感图像的分类,其分类精度明显高于传统的最大似然分类法。
关键词:遥感;图像分类;神经网络中图分类号:TP753文献标识码:AAbstract :The main drawback of traditional rem ote sensing image classification methods is its low precision.A neural netw ork 2based rem ote sensing image classification technique has been presented.Experimental results show that the neu 2ral netw ork classification system can be used in rem ote sens 2ing image classification ,and its classification precision is superior to that of the conventional maximum 2likelihood.K ey w ords :rem ote sensing ;image classification ;neural net 2w ork 遥感图像的计算机分类,是模式识别技术在遥感技术领域的具体应用[1]。
基于光学变换和经典置乱变换的图像复合加密方法
1 基 于 光 学 变换 的 图像 加 密 原理
基 于 光 学 变换 的双 随机 相位 加 密数 据 的 实部 、
维普资讯
2o 0 8年 5月 第1 3卷 第 3期
西
安
邮
电
学
院
学
报
Ma 0 8 y2 0
Vo .3 No 3 11 .
J OURNAL OFXIAN UNI ’ VERS TY OFP T AND TEL I OS ECOMMUNI ATI C ONS
虚部或相位信息都可直接用来恢复原数据或者图像 信息 , 同于光学 全息 原理 。 等 与光学 全息相 对应 , 此 以 z ( Y) 在 ‘ , 表示要 加 o 密 的数 字 图像 , 一个 随机 位相 函数 与 u ( Y) 用 o x, 相 乘 随机 位相 函数用 a , )= e (,) ( Y i 表示 , , m 优( ) 为随机位相 , 二者 的乘积为 ( )则 , , v x, ( Y)= z ( , a , )= ‘ y) ( Y o z ( Y)i(, ‘ , e o m ) () 1 它相当于光学全息中物光波前。 ( ) 对 1 式进行傅里 叶变换 :
乱加 密方 法, 最后将 这三大类加密方法进行组合 实现 图像 复合加 密。实验结果表 明, 本文方法具有更强的安全性 。
关 键 词 : 字 图像 加 密 ; 随 机 相 位 加 密 ; nod变换 ; 沌 加 密 数 双 Ar l 混 中 图 分 类 号 : P 9 T 31 文献标识码 : A 文 章 编 号 :0 7 2 42 0 ) 3 0 5 4 10 —3 6 (0 8 0 —0 8 —0
多孔介质球向渗流的渗透率分形模型
4(
2-Df )
λmax
根据孔隙率的定义,一个代表性单元面积为:
(
)
πD λ2max
λmin
A0 = Ap/Φ = ( f ) 1-
4 2-Df Φ
λmax
[
(
]
)
2-Df
].
(
4)
由哈根 - 泊松方程可以 得 到 牛 顿 流 体 通 过 水
力直径为 Dh 、横 截 面 为 任 意 形 状 单 根 毛 细 管 的 体
领域有重大的研究意义 .目前有诸多文献利用分形
理论的方法研究了流体在多孔介质中的流动特性,
取得了一定的 研 究 进 展
.员 美 娟
[
1
G
6]
[
7]
基于毛细管
模型,研究了牛顿流体在分形多孔介质中的平面径
向流和平面平行流,分别得出了平面径向流和平面
存在着圆形毛细 管、矩 形 毛 细 管、三 角 形 毛 细 管 甚
域,越来越多地引 起 了 广 大 科 研 工 作 者 的 关 注 .渗
状 .在自然界中大 部 分 多 孔 介 质 孔 隙 形 状 多 样 化,
数之一,该参数对 于 油 田、地 下 水 资 源 等 工 程 应 用
至非规则形状的毛细管 .本文主要工作是基于分形
透率是表征流体在 多 孔 介 质 中 输 运 特 性 的 重 要 参
ITY(
Na
t.Sc
i.)
DOI:
10.
19603/
cnk
i.
1000
G
1190.
2020.
01.
008
j.
文章编号:1000
G
1190(
2019国家自然科学基金委信息学部的学科名称及代码
F01 电子学与信息系统F0101 信息论F0102 信息系统F0103通信理论与系统F0104通信网络F0105移动通信F0106 空天通信F0107 水域通信F0108 多媒体通信F0109 光通信F0110 量子通信与量子信息处理F0111 信号理论与信号处理F0112雷达原理与雷达信号F0113 信息获取与处理F0114 探测与成像F0115 图像处理F0116图像表征与显示F0117 多媒体信息处理F0118 电路与系统F0119电磁场F0120电磁波F0121 微波光电子F0122物理电子学F0123 敏感电子学与传感器F0124生物电子学与生物信息处理F0125 医学信息检测与处理F02 计算机科学F0201计算机科学的基础理论F0202 计算机软件F0203计算机体系结构F0204计算机硬件技术F0205 计算机应用技术F0206 信息安全F0207计算机网络F03 自动化F0301控制理论与技术F0302控制系统F0303系统建模与仿真技术F0304系统工程理论与技术F0305生物系统分析与调控F0306检测技术及装置F0307导航、制导与控制F0308智能制造自动化理论与技术F0309机器人学与机器人技术F0310人工智能驱动的自动化F04 半导体科学与信息器件F0401 半导体材料F0402集成电路设计F0403 半导体光电子器件F0404 半导体电子器件与集成F0405 半导体物理F0406 集成电路器件、制造与封装F0407微纳机电器件与控制系统F0408 新型信息器件F05 光学与光电子学F0501光学信息获取、显示与处理F0502 光子与光电子器件F0503 传输与交换光子学F0504红外与太赫兹物理及技术F0505 非线性光学与梁子光学F0506 激光 F0507 光谱技术F0508 应用光学F0509 光学和光电子材料F0510 空间光学F0511 大气、海洋与环境光学F0512 生物、医学光学与光子学F0514 能源与照明光子学F0514 维纳光子学F0515 光子集成技术与器件F0506 交叉学科中的光学问题F06 人工智能F0601 人工智能基础F0602 机器学习F0603机器感知与模式识别F0604 自然语言处理F0605知识表示与处理F0606智能系统与应用F0607人知与神经科学启发的人工智能F07 交叉学科中的信息科学F0701 教育信息科学与技术F0702信息与数学交叉问题国家自然科学基金委信息学部的学科名称及代码F01 电子学与信息系统F0101信息理论与信息系统F010101信息论F010102信源编码与信道编码F010103通信网络与通信系统安全F010104网络服务理论与技术F010105信息系统建模与仿真F010106认知无线电F0102通信理论与系统F010201网络通信理论与技术F010202无线通信理论与技术F010203空天通信理论与技术F010204多媒体通信理论与技术F010205光、量子通信理论与系统F010206计算机通信理论与系统F0103信号理论与信号处理F010301多维信号处理F010302声信号分析与处理F010303雷达原理与技术F010304雷达信号处理F010305自适应信号处理F010306人工神经网络F0104信息处理方法与技术F010401图像处理F010402图像理解与识别F010403 多媒体信息处理F010404探测与成像系统F010405信息检测与估计F010406 智能信息处理F010407视觉信息获取与处理F010408遥感信息获取与处理F010409网络信息获取与处理F010410传感信息提取与处理F0105电路与系统F010501电路设计理论与技术F010502电路故障检测理论与技术F010503电路网络理论F010504高性能电路F010505非线性电路系统理论与应用F010506功能集成电路与系统F010507功率电子技术与系统F010508射频技术与系统F010509电路与系统可靠性F0106电磁场与波F010601电磁场理论F010602计算电磁学F010603散射与逆散射F010604电波传播F010605天线理论与技术F010606毫米波与亚毫米波技术F010607微波集成电路与元器件F010608太赫兹电子技术F010609微波光子学F010610电磁兼容F010611瞬态电磁场理论与应用F010612新型介质电磁特性与应用F0107物理电子学F010701真空电子学F010702量子、等离子体电子学F010703超导电子学F010704相对论电子学F010705纳电子学F010706表面和薄膜电子学F010707新型电磁材料与器件基础研究F010708分子电子学F010709有机、无机电子学F0108生物电子学与生物信息处理F010801电磁场生物效应F010802生物电磁信号检测与分析F010803生物分子信息检测与识别F010804生物细胞信号提取与分析F010805生物信息处理与分析F010806生物系统信息网络与分析F010807生物系统功能建模与仿真F010808仿生信息处理方法与技术F010809系统生物学理论与技术F010810医学信息检测方法与技术F0109敏感电子学与传感器F010901机械传感机理与信息检测F010902气体、液体信息传感机理与检测F010903压电、光电信息传感机理与检测F010904生物信息传感机理与检测F010905微纳米传感器原理与集成F010906多功能传感器与综合技术F010907新型敏感材料特性与器件F010908新型传感器理论与技术F010909传感信息融合与处理F02计算机科学F0201计算机科学的基础理论理论计算机科学F020102新型计算模型F020103计算机编码理论F020104算法及其复杂性F020105容错计算F020106形式化方法F020107机器智能基础理论与方法F0202计算机软件F020201软件理论与软件方法学F020202软件工程F020203程序设计语言及支撑环境F020204数据库理论与系统F020205系统软件F020206并行与分布式软件F020207实时与嵌入式软件F020208可信软件F0203计算机体系结构F020301计算机系统建模与模拟F020302计算机系统设计与性能评测F020303计算机系统安全与评估F020304并行与分布式处理F020305高性能计算与超级计算机新型计算系统F020307计算系统可靠性F020308嵌入式系统F0204计算机硬件技术F020401测试与诊断技术F020402数字电路功能设计与工具F020403大容量存储设备与系统F020404输入输出设备与系统F020405高速数据传输技术F0205计算机应用技术F020501计算机图形学F020502计算机图像与视频处理F020503多媒体与虚拟现实技术F020504生物信息计算F020505科学工程计算与可视化F020506人机界面技术F020507计算机辅助技术F020508模式识别理论及应用F020509人工智能应用F020510信息系统技术F020511信息检索与评价F020512知识发现与知识工程新应用领域中的基础研究F0206自然语言理解与机器翻译F020601计算语言学F020602语法分析F020603汉语及汉字信息处理F020604少数民族语言文字信息处理F020605机器翻译理论方法与技术F020606自然语言处理相关技术F0207信息安全F020701密码学F020702安全体系结构与协议F020703信息隐藏F020704信息对抗F020705信息系统安全F0208计算机网络F020801计算机网络体系结构F020802计算机网络通信协议F020803网络资源共享与管理F020804网络服务质量F020805网络安全F020806网络环境下的协同技术F020807网络行为学与网络生态学移动网络计算F020809传感网络协议与计算F03自动化F0301控制理论与方法F030101线性与非线性系统控制F030102过程与运动体控制F030103网络化系统分析与控制F030104离散事件动态系统控制F030105混杂与多模态切换系统控制F030106时滞系统控制F030107随机与不确定系统控制F030108分布参数系统控制F030109采样与离散系统控制F030110递阶与分布式系统控制F030111量子与微纳系统控制F030112生物生态系统的调节与控制F030113最优控制F030114自适应与学习控制F030115鲁棒与预测控制F030116智能与自主控制F030117故障诊断与容错控制F030118系统建模、分析与综合F030119系统辨识与状态估计F030120系统仿真与评估F030121控制系统计算机辅助分析与设计F0302系统科学与系统工程F030201系统科学理论与方法F030202系统工程理论与方法F030203复杂系统及复杂网络理论与方法F030204系统生物学中的复杂性分析与建模F030205生物生态系统分析与计算机模拟F030206社会经济系统分析与计算机模拟F030207管理与决策支持系统的理论与技术F030208管控一体化系统F030209智能交通系统F030210先进制造与产品设计F030211系统安全与防护F030212系统优化与调度F030213系统可靠性理论F0303导航、制导与传感技术F030301导航、制导与测控F030302被控量检测及传感器技术F030303生物信息检测及传感器技术F030304微弱信息检测与微纳传感器技术F030305多相流检测及传感器技术F030306软测量理论与方法F030307传感器网络与多源信息融合F030308多传感器集成系统F0304模式识别F030401模式识别基础F030402特征提取与选择F030403图像分析与理解F030404语音识别、合成与理解F030405文字识别F030406生物特征识别F030407生物分子识别F030408目标识别与跟踪F030409网络信息识别与理解F030410机器视觉F030411模式识别系统及应用F0305人工智能与知识工程F030501人工智能基础F030502知识的表示、发现与获取F030503本体论与知识库F030504数据挖掘与机器学习F030505逻辑、推理与问题求解F030506神经网络基础及应用F030507进化算法及应用F030508智能Agent的理论与方法F030509自然语言理解与生成F030510智能搜索理论与算法F030511人机交互与人机系统F030512智能系统及应用F0306机器人学及机器人技术F030601机器人环境感知与路径规划F030602机器人导航、定位与控制F030603智能与自主机器人F030604微型机器人与特种机器人F030605仿生与动物型机器人F030606多机器人系统与协调控制F0307认知科学及智能信息处理F030701知觉与注意信息的表达和整合F030702学习与记忆过程的信息处理F030703感知、思维与语言模型F030704基于脑成像技术的认知功能F030705基于认知机理的计算模型及应用F030706脑机接口技术及应用F030707群体智能的演化与自适应F04半导体科学与信息器件F0401半导体晶体与薄膜材料F040101半导体晶体材料F040102非晶、多晶和微纳晶半导体材料F040103薄膜半导体材料F040104半导体异质结构和低维结构材料F040105SOI材料F040106半导体材料工艺设备的设计与研究F040107有机/无机半导体复合材料F040108有机/聚合物半导体材料F0402集成电路设计与测试F040201系统芯片SoC设计方法与IP复用技术F040202模拟/混合、射频集成电路设计F040203超深亚微米集成电路低功耗设计F040204集成电路设计自动化理论与CAD技术F040205纳米尺度CMOS集成电路设计理论F040206系统芯片SoC的验证与测试理论F040207MEMS/MCM/生物芯片建模与模拟F0403半导体光电子器件F040301半导体发光器件F040302半导体激光器半导体光探测器F040304光集成和光电子集成F040305半导体成像与显示器件F040306半导体光伏材料与太阳电池F040307基于柔性衬底的光电子器件与集成F040308新型半导体光电子器件F040309光电子器件封装与测试F0404半导体电子器件F040401半导体传感器F040402半导体微波器件与集成F040403半导体功率器件与集成F040404半导体能量粒子探测器F040405半导体电子器件工艺及封装技术F040406薄膜电子器件与集成F040407新型半导体电子器件F0405半导体物理F040501半导体材料物理F040502半导体器件物理F040503半导体表面与界面物理F040504半导体中杂质与缺陷物理F040505半导体输运过程与半导体能谱F040506半导体低维结构物理半导体光电子学F040508自旋学物理F040509半导体中新的物理问题F0406集成电路制造与封装F040601集成电路制造中的工艺技术与相关材料F040602GeSi/Si、SOI和应变Si等新结构集成电路F040603抗辐射集成电路F040604集成电路的可靠性与可制造性F040605芯片制造专用设备研制中的关键技术F040606先进封装技术与系统封装F040607纳米电子器件及其集成技术F0407半导体微纳机电器件与系统F040701微纳机电系统模型、设计与EDAF040702微纳机电系统工艺、封装、测试及可靠性F040703微纳机电器件F040704RF/微波微纳机电器件与系统F040705微纳光机电器件与系统F040706芯片微全分析系统F0408新型信息器件F040801纳米结构信息器件与纳电子技术F040802基于分子结构的信息器件F040803量子器件与自旋器件超导信息器件F040805新原理信息器件F05光学和光电子学F0501光学信息获取与处理F050101光学计算和光学逻辑F050102光学信号处理与人工视觉F050103光存贮材料、器件及技术F050104光全息与数字全息技术F050105光学成像、图像分析与处理F050106光电子显示材料、器件及技术F0502光子与光电子器件F050201有源器件F050202无源器件F050203功能集成器件F050204有机/聚合物光电子器件与光子器件F050205光探测材料与器件F050206紫外光电材料与器件F050207光子晶体及器件F050208光纤放大器与激光器F050209发光器件与光源F050210微纳光电子器件与光量子器件F050211光波导器件F050212新型光电子器件F0503传输与交换光子学F050301导波光学与光信息传输F050302光通信与光网络关键技术与器件F050303自由空间光传播与通信关键技术F050304光学与光纤传感材料、器件及技术F050305光纤材料及特种光纤F050306测试技术F050307光开关、光互连与光交换F0504红外物理与技术F050401红外物理F050402红外辐射与物质相互作用F050403红外探测、传输与发射F050404红外探测材料与器件F050405红外成像光谱和信息识别F050406红外技术新应用F050407红外遥感和红外空间技术F050408太赫兹波技术及应用F0505非线性光学与量子光学F050501非线性光学效应及应用F050502光学频率变换F050503光量子计算、保密通讯与信息处理F050504光学孤子与非线性传播F050505强场与相对论的非线性光学F0506激光F050601激光物理F050602激光与物质相互作用F050603超快光子学与超快过程F050604固体激光器件F050605气体、准分子激光F050606自由电子激光与X射线激光F050607新型激光器件F050608激光技术及应用F0507光谱技术F050701新型光谱分析法与设备F050702光谱诊断技术F050703超快光谱技术F0508应用光学F050801光学CAD与虚拟光学F050802薄膜光学F050803先进光学仪器F050804先进光学制造与检测F050805微小光学器件与系统F050806光度学与色度学F050807自适应光学及二元光学F050808光学测量中的标准问题F050809制造技术中的光学问题F0509光学和光电子材料F050901激光材料F050902非线性光学材料F050903功能光学材料F050904有机/无机光学复合材料F050905分子基光电子材料F050906新光学材料F0510空间光学F051001空间光学遥感方法与成像仿真F051002空间目标光学探测与识别F051003深冷空间光学系统与深冷系统技术F051004空间激光应用技术F051005光学相控阵F0511大气与海洋光学F051101大气光学F051102激光遥感与探测F051103水色信息获取与处理F051104水下目标、海底光学探测与信息处理F051105精品文档海洋光学F0512生物、医学光子学F051201光学标记、探针与光学功能成像F051202单分子操控与显微成像技术F051203生命系统的光学效应及机理F051204光与生物组织相互作用F051205生物组织光谱技术及成像F051206新型医学光学诊疗方法与仪器F0513交叉学科中的光学问题.。
语音合成技术研究
Tero Sec r utn 中系统 阐述 了语音产生 的理论 , ho eh o co) yfp Pd i 推
动 了语音合成技术 的发展 。 线性预测编码 (P ) L c 分析 最有效 堤 的语音分析技术之一 , 利用该技术可对语音产生模型的参数进 行准确估计 。L C合成 技术本质上是一种 时间波形 的编码技 P
式的会说话装置。自 1 9世纪 出现了电子合成器后 , 语音合成研
究得到飞速发展四 。
13 ,贝尔实验室 HD de 制作 的第 1 电子合成器 9 9年 uly 个 V D R在美 国纽约的博览会上展 出。 OE 它是利用共振峰原理 制 作 的语音合成器 , 能产生连续的语音。语音学研究结果表明 , 决 定语音感知的声学特征主要是语音的共振 峰。音色各异的语音 具有 不同的共 振峰模式 , 因此 , 以每个共振峰频 率及其 带宽作
还可对声源作出各种选择和调整 , 模拟不同的嗓音 。 2 O世纪 8 O年代末 , u lsE和 C apn e Mohi e hret r i F提出基于 时域波形修改的语音合成算法 P O A11 S L S L -。P O A技术着眼于 70 1 对 语音信号超 时段特征 的控 制 , 如基频 、 时长 、 音强等 , 而这些
和探索多媒体技术与课程的整合,对于发展学生的信息素养、
培养学生 的创新精神和实践能力有着十分 重要的现实意义鳓 。
[周丽. 国中小学“ 2 1 我 基于网络应用 的研究 性学 习” 理想与现实的思考
叨. 网络科技时代 ,0 69 4 7 20, : . -
多媒体技 术走 进课堂是时代发展 的必然结果 。我们 要大胆实
参数对于语音 的 韵律控制及修改至关重要 。因此 ,S L P O A技术
李 树 涛 (博导) - 湖南大学研究生招生办公室
王麒云专业资料
2003.1 1 ) Key Project of Science and Technology, Hunan University, China (2002.1-
Funded Research Projects:
Open Projects Program of National Laboratory of Pattern Recognition (2009.1-2011.12, Principle Investigator)
Key Project of Chinese Ministry of Education (2009.1-2012.12, Principle Investigator)
2005年1月-2005年12月 视觉听觉信息处理国家重点实验室项目(负责) 2005年1月-2007年12月 国家自然科学基金项目(负责) 2004年1月-2006年12月 湖南大学育英计划资助项目(负责) 2003年1月-2004年12月 湖南省优秀博士论文基金(负责) 2003年1月-2004年12月 湖南省自然科学基金(负责) 2002年11月-2003年11月 欧盟第五框架项目(主研) 2002年1月-2003年12月 湖南大学科研基金重点项目(负责) 2001年5月-2001年10月 香港RGC项目(主研)
National Natural Science Foundation of China (2005.1-2007.12, Principle Investigator)
Opening Project of National Laboratory on Machine Perception, Peking University, China (2005.1-2005.12, Principle Investigator)
基于画作线条结构分解的高清古画修复
第30卷 第9期 计算机辅助设计与图形学学报Vol.30 No.9 2018年9月Journal of Computer-Aided Design & Computer GraphicsSep. 2018收稿日期: 2017-08-17; 修回日期: 2018-05-14. 基金项目: 国家自然科学基金(61771026, 61379096); 北京市自然科学基金(4152006); 模式识别国家重点实验室开放课题基金. 马 伟(1980—), 女, 博士, 副教授, 硕士生导师, CCF 会员, 主要研究方向为计算机视觉、图像处理; 龙晴晴(1995—), 女, 在校学生, 主要研究方向为计算机视觉、图像处理; 秦 悦(1992—), 女, 硕士研究生, 主要研究方向为计算机视觉、图像处理; 徐士彪(1986—), 男, 博士, 副研究员, CCF 会员, 主要研究方向为计算机视觉与图形学; 张晓鹏(1963—), 男, 博士, 研究员, 博士生导师, CCF 会员, 论文通讯作者, 主要研究方向为计算机图形学、虚拟现实.基于画作线条结构分解的高清古画修复马 伟1), 龙晴晴1), 秦 悦1), 徐士彪2), 张晓鹏2)*1) (北京工业大学信息学部 北京 100124)2)(中国科学院自动化研究所模式识别国家重点实验室 北京 100190) (xiaopeng.zhang@)摘 要: 高清中国古画包含纹路纵横的画布和线条交错的画作内容, 画面结构复杂. 为了实现自然的古画修复效果, 提出一种交互式引导的分解式修复方法. 首先分离画作内容和画布. 之后, 结合张量投票算法和用户交互线索对画作线条分解并逐条修复. 同时采用基于样例的修复方法填补画布. 最后整合修复后的画作内容和画布. 以多幅中国古画高清图像为实验数据验证该方法, 并与Laplacian 修复等方法进行修复效果的主观和量化比较. 实验结果表明, 该方法修复的区域与周边衔接更加自然.关键词: 高清古画修复; 线条分解; 张量投票; 中国古画修复 中图法分类号: TP391.41 DOI: 10.3724/SP.J.1089.2018.16841Repairing High-Definition Ancient Paintings Based on Decomposition of CurvesMa Wei 1), Long Qingqing 1), Qin Yue 1), Xu Shibiao 2), and Zhang Xiaopeng 2)*1) (Faculty of Information Technology, Beijing University of Technology, Beijing 100124)2)(National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences, Beijing 100190)Abstract: High-definition ancient paintings have complex structures composed of interlaced drawing curves and distinct canvas textures. Aiming at restoring high-definition ancient Chinese paintings naturally, this paper presented an interactive repairing method based on decomposition of drawing curves. First, a painting was parsed into contents and canvases. Next, our method decomposed the contents into individual curves and repaired the curves one by one, based on Tensor Voting and limited user assistance. In the meanwhile, we adopted an exemplar-based method to restore canvases. At last, we merged the repaired contents and canvases. Taking multiple high-definition images of ancient Chinese paintings as experimental data, we val-idated the proposed method and compared its results with those obtained by state-of-the-art methods, e.g. Laplacian inpainting, subjectively and quantitatively. Experimental results show that the proposed method performs better in natural completion of high-definition ancient Chinese paintings.Key words: repairing of high-definition ancient painting; decomposition of curves; tensor voting; repairing of ancient Chinese painting中国古画对研究和传承中国古代文化与艺术具有重要意义. 古画在保存或展示过程中容易造成物理损伤, 传统物理修复方法容易对文物造成二次损伤, 而数字修复技术可避开此问题[1-2]. 随着第9期马伟, 等: 基于画作线条结构分解的高清古画修复 1653摄影技术的不断发展, 采用专用设备已可获得古画的高清晰数字图像[3-4]. 此类高清晰数字图像为古画的保存、展示和修复带来新的途径和挑战. 本文拟研究此类高清晰古画数据的数字修复方法. 高清古画通常由具备较规则纹路的画布和线条结构明显的画作内容组成. 现有修复方法通常将图像视作一个单层进行修复[1-2], 难以同时有效地修复高清古画中差异较大的画布和内容部分. 此外, 古画中线条交错复杂, 容易在修复过程中互相干扰, 进一步导致现有方法[5-6]难以奏效.鉴于此, 针对高清晰中国古画, 本文提出一种基于画作结构分解的数字修复方法. 首先, 根据中国古画特点, 设计算法分离画作内容和画布; 然后, 对画作内容中的不同线条进行分离, 有效地克服不同线条之间的干扰; 并引入张量投票算法[7-8]对线条进行描述和修复. 考虑单纯依靠算法修复[5-6]结果不可控且难以满足古画美学要求, 将用户纳入方法框架之中, 允许用户通过简单交互对线条修复过程进行智能引导. 在去除内容后的画布层上, 引入基于样例的图像修复方法[5]修复画布纹理; 最后, 有机地叠加画布和内容层的修复结果, 进而生成最终效果. 通过在多幅包含不同内容的古画图像上的实验证明: 与现有各类方法相比, 本文方法在修复高清古画方面性能更佳.1 相关工作依据与本文方法思路和核心步骤的相关性, 从3个方面介绍相关工作, 包括线条结构修复、纹理修复和分层图像修复.1.1线条结构修复张量投票算法可有效地对线条结构进行表达和延伸[7-8]. 例如, Jia等[8]采用张量投票算法针对彩色照片进行修复, 能够有效地应对结构可预测性较强的场景. 然而, 古画画布与画作内容特性不同但彼此融合, 画作线条相互交错、结构复杂, 导致上述方法难以适用. 本文在画布和画作内容分层以及线条分解的基础上, 引入张量投票算法[8]修复局部结构, 可有效地解决上述问题. 交互式图像修复方法[6,9]在线条结构修复方面优势明显, 例如, Sun等[6]在基于样例的框架中, 通过交互式画线的方式限定搜索面片的目标范围, 填补缺失的线条结构. 受整体框架所限, 现有交互式修复方法仅能应对结构较简单的场景. 但是, 用户交互对于结构修复结果的可控性对本文具有重要的启发意义. 采用深度学习对图像结构部分进行修复的方法[10]需要大量训练数据集, 而中国古画类型多样, 不同时代甚至同时代不同画家作画风格迥异, 导致同一类型素材稀缺, 难以使用深度学习.1.2纹理修复针对纹理进行修复的方法较为丰富, 包括纹理合成[11]、基于偏微分方程扩散的方法[12], 以及基于样例的方法[6]等. 纹理合成方法通过复制图像块并无缝缝合的方式生成更大的纹理图[11]. 受限于输入的图像块, 此类方法得到的结果结构重复性强, 并不适用于修复画作线条等对象. 古画画布纹路虽较为规则, 但历经时间洗礼, 不同区域画布表观变化较大, 采用纹理合成的方法难以生成自然效果. 偏微分方程扩散的方法[12]通过对缺失部分周围的已知数据逐步扩散实现填补, 往往只适用于修复图像划痕等小区域破损. 基于样例的方法根据与待填补区域周边的相似性, 从其他位置寻找面片进行填补[6,13], 能够有效地应对大面积区域缺失; 然而, 现有方法容易在填补区域引入伪结构[6,13].本文在修复画布时采用基于样例的方法, 与现有同类方法不同, 本文并非将图像当做一个整体进行修复, 而是在分层后的画布层上实施基于样例的填补, 可有效地解决上述伪结构问题.1.3分层图像修复将古画内容和画布分离并处理的思想在现有古画复原工作中已有所体现. 例如, Guo等[14]通过先增强后分割的方法将场景剥离纸质画布. 张加万等[15]利用多光谱方法实现场景层和画布的分离; 之后, 将提取出的场景层进行颜色增强等调整工作, 并与新的画布结合, 实现古画去旧. 然而, 与本文不同, 上述工作的目标是古画复原, 即古画去旧和色彩原貌恢复, 且该类技术所处理对象为普通清晰度古画数字图像[14]或多光谱图像[15], 而本文以高清古画图像为处理对象.对不同类型对象进行区分并分别处理的思想在自然场景数字图像的修复方面被广泛采用. 此类工作多采用变分[16-18]和稀疏表示[19]等方法针对图像中的结构和纹理部分进行分离; 之后, 对这2部分做分别修复后合并. 相比整体处理的方法, 结构和纹理的分别处理能够显著提升修补效果[19-20]. 例如, Bertalmio等[20]利用全变分方法将2部分分离后, 通过传递线性结构到目标区域实现结构部分修复[21], 利用纹理合成技术[11]实现纹理缺失部分1654计算机辅助设计与图形学学报 第30卷的填充; 最后, 将修复后的2层叠合作为最终结果. Elad 等[19]利用稀疏表示将图像分成结构和纹理部分, 并在统一的框架下完成图像填补和图像分解. 上述分层修复工作对本文方法思路有重要启发作用; 然而, 上述方法主要针对自然场景的普通清晰度照片, 难以用于结构和纹理更加复杂的高清晰古画.2 本文方法本文方法流程如图1所示. 给定一幅古画图像及用户指示的待修复区域, 首先通过基于最大差异颜色通道的古画分层方法分离出画布和画作内容2层; 然后, 对这2层分别进行修复. 本文提出交互式引导的、基于线条分解和张量投票算法的线条结构修复方法, 补充缺失画作内容; 在画布层, 引入基于样例的方法, 迭代式修复破损区域; 最后, 采用消融策略融合画布层和内容层的修复结果. 画布和内容层修复是本文核心, 古画分层为预处理步骤.2.1 基于最大差异颜色通道的古画分层本文古画分层方法包括阈值分割和小区域过滤2个步骤. 鉴于中国古画画布与画作内容颜色区分较明显, 本文以颜色为线索进行画作内容与画布的分层. 给定一幅待修复古画图像, 首先对比画布和画作内容的R, G, B 三通道, 选择差异最大的通道, 并依据该通道数据进行阈值分割, 从而将输入图像分成画作内容和画布2层. 然而, 由于长期氧化等原因, 古画画布中也有颜色较深的小颗粒, 在如图2a 所示高清图像中尤为明显; 此类颗粒容易被上述分割过程错分为内容部分. 因此, 本文对阈值分割得到的画作内容做进一步过滤, 去除小面积连通区域(定义小连通区域为小于12像素的连通域), 并将其归为画布部分.图2给出一个分层实例, 其中图2a 为原画图像, 该图最大差异通道为R 通道; 依据R 通道实施阈值分割, 得到如图2b 所示结果; 去除小连通区域后得到画作内容, 从原画中去除内容部分后得到画布, 图2c 和图2d 所示分别为所提取出的画作内容和画布, 可以看出, 画作内容和画布分离较为干净.由于古画年代久远, 全图颜色发生非均匀变化, 单纯依靠颜色阈值难以实现精准分层. 具体体现为分层得到的画作内容出现轻微线条断裂或图1 本文方法框架a. 原画图像b. 阈值分割后结果c. 所提取内容d. 分离出的画布图2 古画分层处理第9期马伟, 等: 基于画作线条结构分解的高清古画修复 1655存在少量伪内容干扰, 如图2c所示. 本文古画修复框架中的后续步骤包括交互式引导和线条分解式修复, 能够有效地克服上述线条断裂和伪内容干扰对修复结果的影响.2.2基于线条分解的交互式画作内容修复如图3a所示, 由于画作内容复杂、线条杂乱, 若直接进行修复, 不同线条之间容易相互干扰, 影响修复效果. 另外, 古画线条流畅自由, 完全交由算法修复, 难以生成与原画相符的艺术效果. 为解决上述问题, 本文在分层基础上, 提出基于分解的、交互式引导的线条结构修复方法. 首先, 对画作内容进行分解; 之后, 在用户引导下, 引入张量投票算法逐条修复线条.a. 画作内容b. 分解后效果图3 画作内容分解2.2.1 画作内容分解鉴于图像中不同线条往往属于不同的连通区域, 采用连通区域标记算法分解画作内容. 本文采用2遍扫描法进行连通区域分析[22].图3b给出对图3a所示画作内容分解后的实际效果, 其中不同颜色表示不同连通区域. 由于分层时线条出现轻微断裂, 导致分解结果看上去偏零碎, 即同一线条被分成多个不同部分; 可通过区域特性分析和相邻区域整合得到更为完整化的分解结果. 但是, 本文画作内容修复方法对于线条分解的核心要求在于摒除杂乱线条之间的干扰, 对于分解完整性并无要求. 从后续结果也可看出, 零碎的分解结果不会影响修复结果; 且交叉线条容易被分为同一部分. 由于后续采用张量投票算法进行修复, 能够对线条走向进行正确判断和延伸, 此情况也不会影响修复过程.2.2.2 基于张量投票的交互式线条修复张量投票算法已被广泛应用于线条结构修复, 其修复效果显著[7-8]. 张量投票算法对点和线条结构进行表达, 形成相应的场, 并且不同线条之间的场可相互叠加影响, 从而达到线条结构提取、断裂线条延伸的效果. 图4a所示为包含多条线条的图像, 图4b所示为对每条线条进行张量投票后形成的场的融合效果, 图4c所示为在融合后的场中提取的线条. 可以看出, 通过张量投票算法可实现线条的延伸和修补.a. 线条图像b.张量投票场 c.延伸后的线条图4 张量投票算法对线条结构的表达和延伸古画线条流畅、连贯, 从图4c可以看出现有自动修复算法如本文所采用的张量投票所得到的线条修复结果通常过于死板, 缺乏美感且难以保证完整性. 为了克服自动修复方法的上述问题, 本文在前述线条自动延伸过程中融入交互式引导, 以保证修复后线条的美感和完整性.图5a中两侧线条为已有线条, 中间部分为用户手绘线条, 通过张量投票算法融合2类线条实现修复. 图5b所示为图5a中2类线条共同形成的张量场, 图5c所示为基于张量场实施线条结构抽取后得到的修复结果. 从该例可看出, 简单一笔输入能够完整化原断裂线条; 但是, 连接部分瑕疵明显, 衔接处不够光滑. 如图5d所示, 本文方法允许用户多次进行涂抹式输入. 每次接收用户输入后, 计算如图5e所示张量场; 并基于该张量场提取线条得到如图5f所示修复结果, 可以看出, 二次交互后得到的线条更加流畅图5a所示画线交互和图5d所示涂抹式交互均可通过简单的鼠标操作实现. 综上, 所提出的交互式引导的线条迭代修复操作简单, 且能够保证修复效果的流畅和完整性.a. 1次交互b.a图张量场 c.1次交互修复结果d. 2次交互e.d图张量场 f.2次交互修复结果图5 交互式引导的线条修复在张量投票算法[8]中, 可调节的输入参数σ表示修复曲线的光滑度. 对不同类型线条如直线和曲线进行修复, 需要选择不同的σ. 为了减少1656计算机辅助设计与图形学学报 第30卷每次修复不同类型线条时调参的困难, 本文从用户输入中提取线条类型线索, 实现自适应参数选择. 首先, 采用Hough 直线检测算法[23]判断用户输入线条是否为直线, 若为直线, σ取值较大(本文实验设置σ=15). 若没有检测到直线, 则认为用户输入线条为曲线. 本文采用椭圆参数化用户输入线条, 即采用最小二乘法拟合曲线得到每条输入曲线对应椭圆的长、短半轴, 两者长度分别记为i a 和i b . 待修复线条的光滑度σ定义为11=+mt ji i ji j a a b b σκδ==∑∑.其中, i i a /b 为长短轴长度的比率. 比率值越大, 光滑度σ越高, 则待修复线条的弯曲度越低; m 为图像中已有线条的数量. 已有线条可通过分析用户输入线条的位置、长度和走向, 从第2.2.1节的分解结果中自动选择, 也可以通过简单的交互式点选确定; t 为用户手绘线条的数量. 由于画作中已有线条和用户手绘引导线条在修复过程中起到的重要程度不同, 采用κ和δ平衡二者作用, 其值根据用户需求选定.画作内容部分并非全部都是线条(如图2a 的帽子部分). 如缺损区域包含非线条类型内容, 则采用与第2.3节画布修复同样的方法进行填补.2.3 基于样例的画布纹理迭代式修复鉴于基于样例的方法[5,13]在修复大面积破损区域方面的优势, 本文引入该方法修复画布层. 此类方法通过在源区域中搜索匹配对应块, 迭代式填补待修复的目标区域. 通常取除待修复部分之外的所有区域为源区域. 如图6a 所示为图像和带修补区域(纯色部分), 传统方法[5]通常将纯色区域之外的部分视作源区域. 该类方法容易在待修补区域生成如图6c 所示错乱的伪结构.与传统方法不同, 本文在分层的基础上, 去除画作内容部分, 只保留画布部分. 然后, 将余留画布部分作为源区域, 如图6b 所示, 采用基于样例的方法迭代式修补画布, 可摒除画作内容的干扰. 图6d 为本文方法的画布修复结果, 可以看出, 在修复古画画布时, 本文在分层基础上实施基于样例的方法, 能够有效地避免生成伪结构.2.4 基于消融技术的修复效果叠合在完成古画内容和画布修复之后, 对2层进行合并. 古画多在绢布、纸上用笔墨上色, 笔墨晕染与画布融合, 真实效果如图7c 所示. 在合并时, 如果单纯将修复后的内容置于修复后的画布上, 合a. 原画和待修补区域b. 本文源搜索区域c. 传统方法修复结果d. 本文画布修复结果图6 画布纹理修复a. 直接叠加b. 消融叠加c. 实例1d. 增旧前线条e. 增旧后线条f. 实例2图7 画布与内容的叠合成效果僵硬, 如图7a 所示. 本文将修复后的内容部分与画布纹理层进行消融式图像叠合, 即以一定比例融合内容和画布纹理(本文取融合比例为0.5), 让画布透出内容层, 提升修补效果的真实感, 结果如图7b 所示.古画年代久远, 由于和空气接触时间过长导致笔触和画布分界线不清晰, 如图7f 所示. 对于此类古画, 如果单纯把修复后的线条与画布进行消融叠加, 线条和画布的边缘衔接处略显突兀, 如图7b 所示. 针对此类情况, 采用高斯滤波对线条边缘进行平滑[22] (本文选取大小为7×7的高斯核). 为了使得修复并叠合后的效果更具古画的沧桑感, 将上述高斯滤波实施范围从边缘处扩展至整个线条. 图7d 和7e 给出了增旧前后的线条对比效果图,第9期马伟, 等: 基于画作线条结构分解的高清古画修复 1657可以看出, 针对线条进行滤波操作能够达到一定的增旧效果.3实验结果本文收集了数张画作内容不同、破损情况不同的超高清古画图像作为实验数据, 对本文方法进行效果和效率方面的验证. 在此之前, 首先验证直接影响本文方法效果的古画分层预处理过程.3.1古画分层实验本文对比了3种可用图像分层方法, 包括图像分解方法[17]、基于离散傅里叶快速变换(fast Fou-rier transformation, FFT)的图像滤波方法[23], 以及边缘提取方法[24].图8给出了4种方法针对2个不同古画区域提取的画布内容, 可以看出, 图像分解方法[17]提取的古画结构部分模糊, 且容易将原本较为精细的2条相邻线条合并为同一根线条; FFT方法[23]得到的画作内容掺杂过多的画布纹理; 边缘提取方法[24]只能提取出线条边缘, 并不能将有宽度的古画线条提取出来; 本文专为高清晰古画设计的分层方法效果最佳.3.2古画修复实验修复实验数据集由7幅不同画作内容的古画图像组成, 包括旌旗、赶驴、树枝、船身、人物、水纹和拉绳, 如表1和表2所示. 其中, 前4幅存在真实损伤, 后3幅为假定损伤, 在此情况下存在真值便于量化分析修复结果.本节在上述数据集上, 通过与现有方法对比, 证明本文方法在古画修复方面的独特优势. 所选对比方法包括基于样例的修复方法[5], 基于扩散(curvature-driven diffusions, CDD) 的修复方法[12]、基于快速行进(fast marching method, FMM) 的修复方法[25]和Laplacian方法[26]. 所选用的修复效果衡量方式包括主观评价和量化评价. 前者从主观效果上对不同方法的修复效果进行评判, 后者针对具有真值的人物图、水纹图以及拉绳图从PSNR[27]和SSIM[28] 2个方面进行不同方法修复效果的对比. PSNR从像素层面的颜色相似度加以度量[27], SSIM衡量结构方面的一致性[28]. 为了更细致地度量结构一致性, 本文采用文献[28]中的滑动窗口方式, 计算每个窗口中的SSIM, 用所有窗口的平均SSIM进行相似度评价; 滑动窗口设为9×9像素大小.a. 原图b. 图像分解方法c. FFT提取高频信息d. 图像边缘提取方法e. 本文分层结果图8 古画分层对比实验1658 计算机辅助设计与图形学学报第30卷表1真实破损图像修复效果对比输入图和方法旌旗赶驴树枝船身待修复图像待修复区域基于样例的方法CDD方法FMM方法Laplacian方法本文方法第9期马伟, 等: 基于画作线条结构分解的高清古画修复 1659表2非真实破损图像修复效果对比输入图和方法人物水纹拉绳待修复图像待修复区域基于样例的方法CDD方法FMM方法Laplacian方法本文方法1660 计算机辅助设计与图形学学报第30卷不同方法的修复效果对比如表1和表2所示. 其中, 赶驴图像的损伤主要位于画布上; 树枝图的内容最为繁杂; 由于待修复部位周边连贯性最差, 人物图像的修复最有挑战性.从表1和表2可看出, 基于样例的方法[5]修复画布区域效果尚可(如赶驴图), 但在修复结构时容易带来伪结构(如人物图). 基于扩散的方法[12]和FMM方法[25]难以应对较大破损区域(如人物图和拉绳图). Laplacian方法[26]在线条结构缺失较多时(如人物图), 难以奏效. 得益于专为古画修复设计和实现的理论框架及关键步骤, 本文方法在修复高清晰古画中, 不论是修复结构单纯的画布(如赶驴图), 复杂的树枝图, 还是线条走向难分辨的区域(如人物图), 效果均显著优于其他方法.表3和表4分别给出了不同方法针对人物图、水纹图和拉绳图进行修复后的PSNR和SSIM量化评价值. 从表3和表4中可以看出, 本文方法在所有图上的SSIM值显著高于其他方法, 在除水纹图之外的其他图上的PSNR值显著高于其他方法. 注意: 本文方法在水纹图上的PSNR值虽略低于基于样例的方法, 但是, 由于PSNR不能描述结构修复效果, 即便结构错乱, 其值也可能较大, 具体参见针对水纹图的修复效果. 综上, 不管从主观还是量化评价结果看, 相比现有方法, 本文方法更适用于高清古画修复.表3不同方法修复结果的PSNR值dB 方法人物水纹拉绳基于样例[6]10.8924 23.6967 23.2912 CDD[12] 5.8986 11.63046.9657 FMM[24] 11.1573 22.8928 23.7773 Laplacian[25] 10.5378 23.6214 23.7607本文11.2668 23.4056 24.2297 表4不同方法修复结果的SSIM值方法人物水纹拉绳基于样例[6]0.0436 0.2708 0.1909 CDD[12] 0.0053 0.0644 0.0797 FMM[24] 0.0375 0.1489 0.1698 Laplacian[25] 0.0001 0.0896 0.1614本文0.0877 0.3075 0.3560 在画作内容修复时, 允许交互使得本文方法结果更为可控, 线条流畅. 尤其是在处理画作内容缺失加大时, 从对人物图的修复结果可以看出本文方法优势明显. 由于依托线条分解和张量投票算法, 本文涉及交互方式简单易操作, 只需用鼠标勾勒或涂抹线条即可; 如果采用手写笔进行交互, 操作将会更加方便.表5给出了本文方法在修复7幅图像时所涉及的交互量, 即用户输入线条笔数的统计. 从表5可以看出, 本文在修复古画破损区域时, 涉及交互量有限; 在修复人物画时, 仅需要5笔输入即可得到与画家原作相仿的修复效果. 每一次交互之后, 均可得到实时的结果反馈, 用户体验良好. 针对每幅图像缺损区域的修复均可在几分钟内完成.表5交互量统计旌旗赶驴树枝船身人物水纹拉绳交互量(笔数)6 0 11 5 5 5 2 4结语本文给出了一种基于图像语义分层解析的高清古画交互式修复方法. 针对高清中国古画特点分离画作内容和画布. 针对画作线条, 在分解的基础上, 采用张量投票算法, 在用户引导下进行修复; 针对画布层, 以去除内容后的余留画布作为源区域, 实施基于样例的图像修复过程进行填补. 最后通过半透明叠合方式将修复好的内容和画布整合, 得到完整的古画修复结果. 实验证明, 相比现有方法, 本文方法在修复高清古画时效果更好.未来工作将集中在以下2个方面. 首先, 本文方法需通过用户指出待修复部分. 但是, 中国古画多为大画幅长卷或竖轴, 逐个查找并标记待修复区域较为费力. 未来考虑引入模式分类方法实现古画待修复区域的自动检测. 另外, 本文方法采用用户交互引导修复过程, 未来考虑引入机器学习方法, 通过内容迁移和画家作画特点学习提升修复过程的智能化程度.参考文献(References):[1] Garg S, Sahoo G. Virtual restoration of old digital paintings[J].International Journal of Computer Science and Engineering,2013, 2(3): 35-46[2] Guo F, Tang J, Peng H. Image recovery for ancient Chinesepaintings[J]. International Journal of Signal Processing, ImageProcessing and Pattern Recognition, 2013, 6(5): 165-178。
结合注意力机制的相对GAN螺栓图像生成
基于状态和行为描述的情感分类方法
的分类扩展 为多类的文本分类 。随着对该领域研究 的成熟 ,
收稿 日 :2 1-83 期 0 1 —0 0
Em i huh . m itm — a :sosa 1 l n i @g a. lo
18 4
计
算
机
工
程
2l 0 2年 4月 2 0日
() 2情感行为 的描述 :不带有 明显情感词 或者评价词 的句 子 ,主 要包括人 的某 些行为或者物 的某 些行 为 。与其他客观
的 一 个基 本 问题 。本 文分 别 使 用 乘 法规 则 和 元 学 习方 法 Sakn tc ig方法 来进行 融合 。
5 实验结果与分析
51 实验设置 . 本 文分 别从 中文情 感 挖掘 语料 (t :w w. acfrm. ht / w s rhou p/ e
ogc/ no g oc ru—e thm) 卓 越 网 (t :w . ea r. t sn b /op ssni t 和 na . ht / wwAr p/ Z nc/上收集 了酒店、美容和箱包领 域的语料 ,其 中,酒店 O. ) n 领域的语料来 自中文情感挖掘语料 ,其他 2个来 自卓越 网。
[ ywo d ]Chn s fr ainpo es g sni n n ls ;u e ie ann ; xmu e t p ; lsie s n Ke r s ieeno t rcsi ;e t i m o n met ayi spr sdl rig ma i m nr y cas ru i a s v e o i f f o DOI 1 . 6 /i n10 —4 82 1 .8 4 : 03 9js .003 2 .0 20 . 8 9 .s 0
句 不同的是 ,虽然不 带有 情感词或者评价词 ,但 是能够 间接 的表达 出某些情感 ,此类描述 理 解 以 下 定义 : () 1基于 情感状态 的描述 1表达 人的情感 的句子 : ) E :这家酒 店令 我很失望。 1
CCFADL
中国计算机学会《学科前沿讲习班》The CCF A dvanced D isciplines L ectures第21期主题面向互联网的自然语言处理技术——理论、方法与应用问题研究2011年8月27日-8月31日北京随着互联网的快速发展,面向互联网的数据挖掘和跨语言信息处理成为学术界和产业界关注的热点——互联网以海量、半结构化、互动、动态更新为基本特征的信息表现形式及其人机交互模式与关系网络为数据挖掘和自然语言处理提供了新的研究平台与数据支持;另一方面,以技术创新为主要驱动力之一的互联网产业已经成为中文信息技术的相关理论与技术的重要应用领域之一。
例如,百度有60%的应用需要NLP技术的支持。
本期CCF学科前沿讲习班将围绕面向互联网的自然语言处理相关理论、技术与应用,邀请学术界和工业界的著名专家、学者系统讲授最新学术理论与应用创新课程,面向有志于从事数据挖掘、自然语言处理基础研究和相关互联网技术研发的青年学者和学生提供一周(5天)学习、交流,让参加者全面了解并掌握该领域的主要研究内容,把握研究热点和前沿,提高学术水平和研究实践能力。
讲习班采用小班授课方式(50人),中文讲解,利于答疑解惑。
同时提供申报中文信息技术开放课题的机会。
学术主任赵东岩北京大学研究员;李涓子清华大学教授协办单位清华大学、微软亚洲研究院(MSRA)、中文信息技术专委会特邀讲者及报告主题互联网自然语言处理的基础理论(一)报告主题:机器学习与信息检索特邀讲者:李航微软亚洲研究院主任研究员互联网自然语言处理的基础理论(二)报告主题:自然语言处理与信息抽取特邀讲者:赵军中科院自动化所研究员互联网自然语言处理技术与平台报告主题:互联网自然语言处理技术特邀讲者:周明微软亚洲研究院主任研究员互联网自然语言处理技术与应用(一)报告主题:互联网语义挖掘与智能计算特邀讲者:林钦佑微软亚洲研究院主任研究员互联网自然语言处理技术与应用(二)报告主题:复述研究及其应用特邀讲者:王海峰百度高级科学家注册费:(含资料和5天的午餐)1、7月31日前报名并缴费:会员(或研究生)900元,非会员1200元2、8月10日前缴费:会员(或研究生)1000元,非会员1380元3、8月26日缴费(含当天缴费):会员1200元,非会员1560元优惠办法:1、同一单位一次有5人报名者,可免交1人的注册费(当天不办理此项业务,缴费额度见上标准)2、2010年参加过讲习班学员可在原缴费标准基础上降低100元。
面向世界 面向未来
面向世界面向未来作者:暂无来源:《科学中国人》 2019年第8期模式识别国家重点实验室于1984年由原国家计委批准筹建,1987年通过国家验收并正式对外开放。
依托于中国科学院自动化研究所。
实验室现有固定人员103人,45岁以下年轻人约占80%,中国科学院“百人计划”引进人才10人,国家杰出青年基金获得者7人。
实验室流动人员568人,包括博士后20人、博士研究生210人、硕士研究生167人、项目聘用人员、高级访问学者、客座研究人员等,形成了一个以年轻学术带头人为核心、以青年科研骨干为主体和以高素质的研究生队伍为主力的研究梯队。
立足国家需求,开展创新研究实验室的定位和目标是:面向国际学科前沿,面向国家战略需求,面向国民经济主战场,开展模式识别领域的基础和应用基础研究,建设国际一流的科研团队,打造具有广泛影响力的模式识别领域国家公共研究平台,使其成为国内外著名的科学研究、技术创新和人才培养基地,推动和引领模式识别学科的发展,为我国信息技术等战略新兴产业发展提供知识、技术与人才储备。
实验室以模式识别基础理论、图像处理与计算机视觉及语音语言信息处理为主要研究方向,研究人类模式识别的机理及有效的计算方法,为开发智能系统提供关键技术,为探求人类智力的本质提供科学依据。
1.模式识别基础理论是开展模式识别及其相关研究的基础,主要研究模式识别中的共性基础理论与方法,包括模式识别的认知机理与计算模型、模式分类与机器学习、模式描述与结构理解等。
2.图像处理与计算机视觉主要研究视觉模式的分析与理解,有着广泛的应用领域和前景。
主要研究内容包括三维视觉和场景分析、物体检测与识别、视频分析与语义理解、医学影像分析、生物特征图像识别、遥感图像分析、文档图像分析、多媒体计算等。
3.语音与语言信息处理主要研究听觉模式的分析与理解,是改善人机通信和交互方式、有效利用网络内容资源的重要手段,是实现不同语种之间的全球自由通信的重大关键技术。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
会议/差旅/国际合作与交流费
5
出版/文献/信息传播/知识产权事务费
6
专家咨询费
7
劳务费
合计
(万元)
五.申请人所在单位学术主管部门意见:
单位公章
年 月 日
申请人签名:
六.重庆市电磁兼容工程技术研究中心意见
中心主任签名:
年月日
工作简历
近期主要学术成就:(发表论文、从事过的研究项目、获奖和专著)(限10项)
二.申 请 课 题
课题名称
课题开展时间
课题国内外现状综述:
三.研究任务
1.主要研究内容、研究重点
2.预期成果
3.创新之处
4.技术路线与方法
四.申请经费及预算1
试验材料费
2
仪器设备费
3
重庆市电磁兼容工程技术研究中心
开放课题申请书
课题名称
:
申 请 人 姓 名
:
国 籍
:
职 称
:
学 历
:
申请人所在单位
:
课题起止年限
:
申请人通讯地址
:
邮 政 编 码
:
联 系 电 话
:
E - Mail
:
重庆市电磁兼容工程技术研究中心
二〇一九年 制
一.申 请 人 简 历
姓名
性别
年龄
身份证号码
学习简历(大学以上)