深度学习入门理论简介ppt

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

在研究中可以发现，如果在原有的特征中加入这些自动学习得到的特征可以大大提高精确度，甚至在分类问题中比目前最好的分类算法效果还要好！
18
AutoEncoder自动编码器
• AutoEncoder存在的一些变体：
• a）Sparse AutoEncoder稀疏自动编码器 • b）Denoising AutoEncoders降噪自动编码器
20
Sparse Coding稀疏编码
21
Sparse Coding稀疏编码
• Sparse coding分为两个部分：
1）Training阶段：
给定一系列的样本图片[x1, x 2, …]，我们需要学习得到一组基[Φ 1, Φ 2, …]，也就是字典。
训练过程就是一个重复迭代的过程，交替更改a和Φ使得下面这个目标函数最小。
15
AutoEncoder自动编码器
• 2）通过编码器产生特征，然后训练下一层。这样逐层训练：
将第一层输出的code当成第二层的输入信号，同样最小化重构误差，就会得到第二层的参数，并且得到第二层输出的code，也就是原输入信息的第二个表达了。其他层就用同样的方法炮制。
16
AutoEncoder自动编码器
13
深度学习的常用模型
• 1、AutoEncoder自动编码器
• 自动编码器就是一种尽可能复现输入信号的神经网络。具体过程简单的说明如下：
• 1）给定无标签数据，用非监督学习学习特征：
14
ຫໍສະໝຸດ Baidu
AutoEncoder自动编码器
通过调整encoder和decoder的参数，使得重构误差最小，这时候我们就得到了输入input信号的第一个表示了，也就是编码code了。因为是无标签数据，所以误差的来源就是直接重构后与原输入相比得到。
19
深度学习的常用模型
• 2、Sparse Coding稀疏编码
• 将一个信号表示为一组基的线性组合，而且要求只需要较少的几个基就可以将信号表示出来。
• 稀疏编码算法是一种无监督学习方法，它用来寻找一组 “超完备”基向量来更高效地表示样本数据。
目标函数： Min |I – O| + u*(|a1| + |a2| + … + |an |)
7
关于特征
3、结构性特征表示
小块的图形可以由基本edge构成，更结构化，更复杂的，具有概念性的图形如何表示呢？
8
关于特征
在不同对象上做训练时，所得的边缘基底是非常相似的，但对象部分和模型就会完全不同了。
9
关于特征
4、需要有多少个特征
我们知道需要层次的特征构建，由浅入深，但每一层该有多少个特征呢？
深度学习入门理论
1
主要内容
1
人脑视觉机理
2
关于特征
3
深度学习思想
4
训练过程
5
常用模型
2
人脑视觉机理
人的视觉系统的信息处理是分级的，神经-中枢-大脑的工作过程是一个不断迭代、不断抽象的过程。
3
目前我们通过机器学习去解决这些问题的思路都是这样的（以视觉感知为例）：
4
关于特征
特征是机器学习系统的原材料。如果数据被很好的表达成了特征，通常线性模型就能达到满意的精度。
• 4、Deep Belief Networks深信度网络 • 5、Convolutional Neural Networks卷积神经
网络
24
25
手段，“特征学习”是目的。
11
深度学习训练过程
• 1）使用自下上升非监督学习
从底层开始，一层一层的往顶层训练，采用无标定数据（有标定数据也可）分层训练各层参数。
• 2）自顶向下的监督学习
就是通过带标签的数据去训练，误差自顶向下传输，对网络进行微调，基于第一步得到的各层参数进一步微调整个多层模型的参数，这一步是一个有监督训练过程
22
Sparse Coding稀疏编码
• 2）Coding阶段：
给定一个新的图片x，由上面得到的字典，通过解一个LASSO问题得到稀疏向量a。这个稀疏向量就是这个输入向量x的一个稀疏表达了。
23
深度学习的常用模型
• 3、Restricted Boltzmann Machine (RBM)限制波尔兹曼机
10
深度学习思想
•
对堆叠多个层，也就是
说这一层的输出作为下一层
的输入。通过这种方式，并
且使得输入与输出的差别尽
可能地小，就可以实现对输
入信息进行分级表达了。
•
深度学习的实质，是通
过构建具有很多隐层的机器
学习模型和海量的训练数据，
来学习更有用的特征，从而
最终提升分类或预测的准确
性。因此，“深度模型”是
对于特征，我们需要考虑四个方面： • 1、特征表示的粒度 • 2、初级（浅层）特征表示 • 3、结构性特征表示 • 4、需要有多少个特征
5
关于特征
1、特征表示的粒度
学习算法在一个什么粒度上的特征表示，才有能发挥作用？
6
关于特征
2、初级（浅层）特征表示
像素级的特征表示方法没有作用，那怎样的表示才有用呢？
• 3）有监督微调：到这里，这个AutoEncoder还不能用来分类数据，可
以在AutoEncoder的最顶的编码层添加一个分类器，然后通过标准的多层神经网络的监督训练方法（梯度下降法）去训练。
微调分为两种，一个是只调整分类器（黑色部分）：
17
AutoEncoder自动编码器
• 另一种：通过有标签样本，微调整个系统：