深度学习的发展以及应用

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

文章编号：1007-1423（2019）17-0046-05DOI：10.3969/j.issn.1007-1423.2019.17.010

深度学习的发展以及应用

陈仲为

（武汉科技大学计算机科学与技术学院，武汉430070）

摘要：

深度学习是模仿人脑神经元结构而建立的一个人工神经系统，能够通过多个网络分层逐级处理外界输入信息，具有强大的自我学习能力。深度学习被广泛运用于各个领域之中，如人机博弈、语音识别、图像识别、自然语言处理等，都取得相当不错的成果。通过对深度学习过去的发展以及现在的应用进行简要介绍，希望能有更多人关注和了解深度学习。

关键词：

机器学习；人机大战；深度学习；语音识别；图像识别；自然语言处理

0引言

近几年随着科技的迅猛发展，人工智能行业发展火热，被越来越多的人所关注。因而科幻电影如雨后春笋般涌现出来，让观众大饱眼福。现实生活中的人机大战也为各大媒体争相报道：2016年3月，AlphaGo 以4:1击败韩国围棋天王李世石；2017年5月，加强版的AlphaGo又以3:0的完美战绩击败人类最强棋手柯洁。AlphaGo能够在如此短的时间内变得这么强大的秘密在于深度学习算法。

深度学习隶属于机器学习，是机器学习领域里一个相当重要的分支，了解机器学习的原理有助于我们更好的去了解深度学习。机器学习是人工智能领域当中的一个分支，当人们谈及人工智能的时候，往往都绕不开机器学习。显然，机器学习研究的是如何能够让机器像人一样独立自主地学习某种事物。简单来说，就是通过算法，让机器从大量的样本数据中发现某种规律，然后来识别新的样本或者对未来作出一定的预测。

1机器学习的发展阶段

第一阶段，机器学习将研究的侧重点放在非符号的神经元模型上。主要的目标是研制出一个通用的学习系统，即神经网络或自组织系统。

第二阶段为20世纪70年代中期至80年代后期，机器学习主要侧重符号学习的研究，即以离散符号的推理为基础，运用已有知识，来对未知作出预测。

第三阶段从20世纪80年代后期开始一直到今天[1]。一方面，关于传统符号学习的各种方法已经全面发展并且趋近完善，应用的领域不断扩大，达到一个鼎盛时期；同时由于发现用隐单元来计算和学习的非线性函数方法，从而克服了早期神经元模型只能解决线性问题的局限性；计算机硬件的飞速发展和处理器运行速度的提高以及并行计算机的普及使得演化计算的研究突飞猛进，在机器学习的各个领域都取得了不错的成果。连接学习和符号学习这两个学派争奇斗艳，显示出各自的魅力。另一方面，越来越多的人开始重视对机器学习基础理论的研究，从1988年起，美、德、日等国连续召开计算学习理论的学术会议，相关的学术论文也经常出现在关于机器学习的杂志上。因此，在这一阶段，机器学习的研究进入了一个全面化、系统化的时期。

2机器学习的分类

大体上来说，机器学习算法可以划分为有监督学

习、无监督学习和增强学习三种形式[2]。

在有监督学习中，训练机器的目标是让机器建立起从输入到输出一一对应的模型，训练时，机器的每一次输出都会与事先准备好的正确输出进行比对并做出相应调整。例如，我们要训练机器来识别各种水果的图像，则需要使用大量已经人工标注好的各种水果图像来对机器进行训练，得到一个模型，然后机器就可以用这个模型来对未知类型的水果进行识别判断。

无监督学习则没有指导者进行指导，因此只有输入数据过程而没有输出比对过程。训练机器的目标是对输入数据进行分析从而得到数据的某些知识，其典型代表是聚类。例如，我们要对1000封电子邮件进行分类，我们并没有事先定义好分类，也没有已经训练好的模型。机器通过聚类算法自己完成对1000封电子邮件的分类，保证同一类型邮件是同一个主题的，不同类型的邮件是不一样的。

增强学习是一类比较特殊的机器学习算法。在一些应用中，机器需要输出的是一个个动作所组成的序列而不是单个结果。排除在序列之外的某个动作并没有什么意义，只有这些动作所组成的序列能够完成给定的目标才是有意义的，即策略更加重要。所以机器在执行的过程中也就不存在某个最好的动作。如果该动作最终能够完成目标，即是某个策略的组成部分，那么该动作就是好的。在这种情况下，机器就应当能够评估策略的好坏程度，并且从以前所学习到的好的动作序列中获得提示，从而选择成功率更高的策略来执行。

3人机大战背后的算法

在人机大战中大放异彩的AlphaGo背后的算法便是深度学习算法。深度学习是机器学习领域的一个重

要分支，因为在训练机器时不需要人为进行指导，所以属于无监督学习。受到大脑神经元结构的启发，深度学习算法通过构造一个人工神经网络来模仿人脑的神经结构，并希望能够像人脑一样学习和处理相关事物。具体来说，该核心算法由两种深度神经网络构成：“决策网络”（Policy Network）和“价值网络”（Value Net⁃

work）。

“价值网络”的作用是根据棋盘上白子和黑子的位置来作出评价，从而减少搜索的深度：AI机器每走一步便会根据场上的局势来推算出自己获胜的概率，而不需要搜索所有结束棋局的路径。当某些方法使得局面明显不利于自己时，机器便会直接放弃这些路线，从而减少算法搜索的深度。

“决策网络”的作用是预测下一步，来减少搜索的宽度：根据“价值网络”的反馈信息，AI机器不必给每一步相同的重视程度，主动放弃一些明显的“坏棋步”而将注意力更多的放在那些有前景的“好棋步”上，将搜索范围缩小至自己最有可能获胜的那些棋步。

AlphaGo利用这两个工具来分析棋局，判断每种下子策略的获胜概率，从而选择获胜概率更高的棋步。除此之外，AlphaGo还利用增强学习来让AI机器和自己对弈。通过和自己进行大量的对弈训练，AlphaGo能够学会自己发现新的策略，从而提高“决策网络”的效率。

4深度学习算法的基本网络框架

目前基于深度学习算法的网络框架很多，但大抵都是基于以下四个基本网络框架：无监督预训练网络、卷积神经网络、循环神经网络和递归神经网络。

无监督预训练网络[3]：使用无监督学习算法来训练深度神经网络，

即先训练网络的第一个隐藏层而封锁图1机器学习发展的时间轴