知识工程-深度学习-应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机视觉——姿态估计
正确快速地识别和理解图像中人的 姿 态 动 作。
人们会提前选定出比较重要的几个人体关节(比如肩膀、肘部、脖子等),然后用一个固定维数 (比如7维和11维)的坐标向量来表示这个动作,每一维都表示图中人物的重要关节所在的具
体坐标。
计算机视觉——图像分割
它的目的是把图像中各种不同物体给用不同颜色分割出来。
应用——语音识别
语音识别(Automatic Speech Recognition, ASR)是一种让计算机能够自动地识别语音中所携带
信息的技术。一般在语音研究领域,语音识别特指将语音中的内容转换成文本。
语音识别——语音识别历史
1952年,贝尔实验室发明的Audrey孤立英文数字识别系统实现了十个数字的识别
最后根据已有的字典,对词组序列进行解码,得到最后可能的文本表示。
语音识别——系统架构
训练数据包括语音数据和其对应的
文本数据, 从原始语音中提取的特 征以及语句对应的标注用于有监督
的声学模型训练,训练文本用于语
言模型建模,在训练得到声学模型 和语言模型以后,结合解码器搜索
算法,可以对输入语音特征得出识
自然语言处理——研究内容
语言教学(Language teaching):借助计算机辅助教学工具,进行语言教学 、操练和辅导等。 应用:语言学习等 文字识别(Character recognition):通过计算机系统对印刷体或手写体等 文字进行自动识别,将其转换成计算机可以处理的电子文本。 应用:文字输入、识别等
第十二章 应用
应用——计算机视觉
计算机视觉是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量等。
计算机视觉的应用广泛:复现人类的视觉能力,创造全新的视觉能力。
图像分类 图像检测 姿态估计 图像分割 人脸识别 从视频中可视物体的振动识别相应的声波
计算机视觉——图像分类
自然语言处理——研究内容
文字编辑和自动校对(Automatic proofreading):对文字拼写、用词、甚 至语法、文档格式等进行自动检查、校对和编排。 应用:排版、印刷和书籍编撰等 信息过滤(Information filtering):通过计算机系统自动识别和过滤那些满 足特定条件的文档信息。 应用:网络有害信息过滤、信息安全等
自然语言处理——理解
机器能够理解人的语言吗?


很难,但是没有证据表明不行
什么是“理解” – 结构主义:机器的理解机制与人相同
wk.baidu.com
• 问题在于谁也说不清自己理解语言的步骤
– 功能主义:机器的表现与人相同 • 图灵测试:如果通过自然语言的问答,一个人无法识别和他对话的 是人还是机器,那么就应该承认机器具有智能
1960s,动态时间规整(DTW)及动态规划(DP)算法被提出,有效解决了语音模板与语音实例的对
齐问题
1970s, 语音领域应用广泛的隐马尔科夫模型(HMM)被提出,标志着语音识别开始由简单的基于
模版匹配方法逐渐向统计概率模型体系转变
1980-2000, 基于HMM的语音识别系统趋于完善,GMM-HMM和ANN-HMM的出现 2000至今,DNN-HMM逐渐发展成熟。在识别测试中,DNN-HMM的识别错误率比GMMHMM低了1/3
自然语言处理——研究内容
问答系统(Question-answering system):通过计算机系统对人提出的问 题的理解,利用自动推理等手段,在有关知识资源中自动求解答案并做出相应 的回答。问答技术有时与语音技术和多模态输入/输出技术,以及人机交互技术 等相结合,构成人机对话系统(man-computer dialogue system)。 应用:人机对话系统、信息检索等
图像分类问题是通过对图像的分析,将图像划归为若干个类别中的某一种,主要强调对图像整
体的语义进行判定。
AlexNet卷积神经网络
计算机视觉——图像检测
物体检测需要确定每个物体的位置和类别,在分类图像的同时把物体用矩形框给圈起来。
方法:首先采用非深度学习的方法提出候选区域,利用深度卷积网络从候选区域提取特征, 然后利用支持向量机等线性分类器基于特征将区域分为物体和背景。
语音识别——系统架构
语音识别系统的主要组成包括特征提取、语言模型、声学模型以及解码器四大模块
特征提取工作将声音信号从时域转换到频域,为声学模型提供合适的特征向量;
声学模型中再根据声学特性计算每一个特征向量在声学特征上的得分,通过对语音数
据进行训练获得,输入是特征向量,输出为音素信息; 语言模型则根据语言学相关的理论,计算该声音信号对应可能词组序列的概率;
别结果。
应用——自然语言处理
用机器处理人类语言的理论和技术 研究在人与人交际中以及人与计算机交际中的语言问题的一门学科。NLP要研制表示语言能力和
语言应用的模型,建立计算框架来实现这样的语言模型,提出相应的方法来不断完善这样的模型,
并根据语言模型设计各种实用系统,以及对这些系统的评测技术。 --Bill Manaris, 《从人机交互的角度看自然语言处理》
自然语言处理——理解
自然语言处理——研究内容
机器翻译(Machine translation, MT):实现一种语言到另一种语言的自动 翻译。 应用:文献翻译、网页翻译和辅助浏览等。 自动文摘(Automatic summarization / Automatic abstracting): 将原文档的主要内容或某方面的信息自动提取出来,并形成原文档的摘要或缩 写。 应用:电子图书管理、情报获取等
categorization / classification) 或信息分类(Information categorization / classification),其目的就是利用计算机系统对大量的文档按照一定的分类标准(例如,根据 主题或内容划分等)实现自动归类。
应用:图书管理、内容管理、信息监控等
自然语言处理——研究内容
信息检索(Information retrieval):信息检索也称情报检索,就是利用计算机系统从大量
文档中找到符合用户需要的相关信息。 面向多语言的信息检索叫做跨语言信息检索
代表系统:Google: 百度:
文档分类(Document categorization):文档分类也叫文本自动分类(Text
相关文档
最新文档