深度学习技术介绍 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

什么是深度学习
深度学习是机器学习中表征学习方法的一类。一个观测值（例如一幅图像）可以使用多种方式来表示，而某些特定的表示方法可以让机器学习算法更加容易进行学习。表征学习的目标是寻求更好的表示方法并建立更好的模型来学习这些表示方法；
通俗来讲，机器学习是一种算法框架，通过此算法框架，需要让机器具有类似人类的智慧，学会认识世界的一种方式；
自然语言处理
在语音识别中，“语言模型”的集成是至关重要的，而且提供一语言模型的最好方法仍然是从实例数据的大型一语料库中学习。机器学习在自然语言处理(natural language processing)方面的应用与日俱增。垃圾邮件过滤就是一种应用，其中垃圾邮件的制造者为一方，过滤者为另一方，一直都在寻找越来越精巧的方法以便超越对方，也许最吸引人的是机器翻译(machine translation)，经历了数十年手工编写翻译规则的研究之后，最近人们认识到最有希望的
生物测定学
生物则定学(biometrics)使用人的生理和行为特征来识别或认证人的身份，需要集成来自不同形态的输人。生理特征的例子是面部图像、指纹、虹膜和手掌；行为特征的例子是签字的力度、嗓音、步态和击键。与通常的鉴别过程( 照片、印刷签名或门令)相反，会有许多不同的(不相关的) 输人，伪造(欺骗)更困难并且系统更准确，不会对用户太不方便。机器学习既用于针对这些不同形态而构建不同的识别器，也考虑这些不同数据源的可靠性，用于组合它们
机器学习的额外用途
从数据中学习规则也为知识抽取(knowledge extraction)提供了可能性。规则是一种解释数据的简单模型，而观察该模型我们能得到潜在数据处理的解释。例如，一旦我们学会了区分低风险客户和高风险客户的判别式，我们就拥有了关于低风险客户特性的知识。然后，我们就能够利用这些知识，通过比如广告等方式，更有效地争取那些潜在的低风险客户。
什么是感知器(perceptron)
···
最简单的分离器设计
训练感知器
感知器定义了一个超平面，而神经网络感知器事不过是实现超平面的一种方法。给定数据样本，权重可以离线计算，并且将其带入后，感知器就可以用来计算输出的值。
在训练神经网络时，若果未提供全部样本，而是逐个提供实例，则我们通常使用在线学习，并且在每个实例之后更新网络参数，让给网络缓慢的及时调整。这是目前比较常见的一种训练方式。
具体应用-语音识别
在语音识别(speech recognition) ,输人是语音，类是可以读出的词汇。这里要学习的是从语音信号到某种语言的词汇的关联性。由于年龄、性别或口音方面的差异，相同词汇的读音不同，这使得语音识别问题相当困难。语音识另的另一个特点是其输入信号是时态的，词汇作为音素的序列实时读出，而且有些词汇的读音会较长一些。
对于在线学习，不需要全部样本而是需要单个实例上的误
后向传播算法(back propagation,1986)
这是在训练多层感知器时提出的一个概念。训练多层感知器与训练感知器是一样的。唯一区别是现在
的输出是输入的非线性函数，这要归咎于隐藏单元中的非线性偏倚函数。在对于多层感知器，计算梯度时误差就向传回到输出一样，所以创造了这个术语。
为什么说机器学习是一个古老的 19学89科年，计算机已经可以学习识别人类讲话，并且用到了神经网络学习方法和隐马尔科夫模型学习方法； 1989年，机器学习方法已经被用于训练计算机控制车辆，实现无人驾驶； 1995年，决策树学习算法已经被NASA用来分类天体； 1995年，计算机已经可以通过学习，在博弈类游戏中击败人类。人工神经网络的研究历史和数字计算机一样长。1943年，
和机器学习相关的学科
人工智能贝叶斯方法计算复杂性理论控制论信息论哲学心理学和神经生物学统计学
理解人脑处理信息的过程
根据Marr(1982)年理论，理解一个信息处理系统，具有三个被称为分析层面的内容：计算理论(computational theory)对应计算目标和任务的抽象定义。表示和算法(representation and algorithm)是关于输人和输出如何表示和从输入到输出变换的算法说明。硬件实现(hardware implementation)是系统的实物物理实现。
机器学习还可以进行压缩(compression)。用规则拟合数据
案例-ALVINN系统
ALVINN系统是ANN学习的一个典型实例，这个系统使用一个学习到的ANN以正常速度在高速公路上驾驶汽车。ANN 的输入是一个30*32像素的网格，像素的亮度来自于一个安装在车辆上的前向摄像头。ANN的输出是车辆行进的方向。这个ANN通过模仿驾驶时的操纵命令进行训练，持续约5分钟。ALVINN用学到的网络在高速公路上以70英里的时速成功行驶了90英里。
具体应用-人脸识别
对于人脸识别(face recognition) 。输入是人脸图像，类是需要识别的人，并且学习程序应当学习人脸图像与身份之间的关联性。人脸会有更多的类，输入图像也更大一些，并且人脸是三维的，不同的姿势和光线等都会导致图像的显著变化。
具体应用-医学诊断
对于医学诊断(medical diagnosis)。输人是关于患者的信息，而类是疾病。输入包括患者的年龄、性别、既往病史、目前症状等。当然，患者可能还没有做过某些检查，因此这些输入将会缺失。检查需要时间，还可能要花很多钱，而目、也许还会给患者带来不便。因此，除非我们确信检查将提供有价值的信息，否则我们将不对患者进行检查。在医学诊断的情况下，错误的诊断结果可能会导致我们采取错误的治疗或根本不进行治疗。在不能确信诊断结果的
为人类提供“大数据+简单模型”的实现方式。
深度学习的实际应用类型
语音识别图像识别自然语言处理
纠正一个错误
论点：机器学习是要制造一个超级大脑，能够具有人类一样的智慧。这是一个非常典wenku.baidu.com的错误。机器学习是一个古老的计算机学科，而深度学习正是机器学习的一个狭窄领域，并非新生事物。持此观点的人一般都是对此学科一知半解的人。在工程上，深度学习的目的不是理解人脑的本质，也不是需要制造一个类人的生命体，而是构建有用的机器。神经网络