卷积神经网络纯净版课件
合集下载
深度学习与卷积神经网络基础理论与实例分析ppt课件
1.概述与背景
1.1 人工智能、机器学习、深度学习、数据挖掘之间的关系
数据挖掘
深度学习 机器学习
人工智能
1.2 神经网络兴衰史
1.概述与背景
第一次兴起(1958年):感知机,由于 没有引入非线性,不能求解异或问题。
第二次兴起(1986年):将BP(Back Propagation)神经网络的提出。
深度(Depth) 深度就是卷积操作中用到的滤波 器个数。这里对图片用了两个不 同的滤波器,从而产生了两个特 征映射。你可以认为这两个特征 映射也是堆叠的2d矩阵,所以这 里特征映射的“深度”就是2。
3.2 基本单元-----非线性(激励层)
3.卷积神经网络-CNN
激活函数一般用于卷积层和全连接层之后 激活函数是深度网络非线性的主要来源
Top Layer: the neurons respond to highly complex, abstract concepts that we would identify as different animals
输出: The network predicts what the object most likely is, based on its training
Sigmoid 梯度消失问题
ReLU
解决梯度消失问题 收敛速度非常快 神经元死亡问题
3.2 基本单元-----池化层
3.卷积神经网络-CNN
空间池化,也叫亚采样或下采样降低了每个特征映射的维度,但是保留了最重要的信息。
空间池化可以有很多种形式:最大(Max),平均(Average),求和(Sum)等等。最大池化成效最好。
目录
人脑视觉机理
01
与特征表示
1.1 人工智能、机器学习、深度学习、数据挖掘之间的关系
数据挖掘
深度学习 机器学习
人工智能
1.2 神经网络兴衰史
1.概述与背景
第一次兴起(1958年):感知机,由于 没有引入非线性,不能求解异或问题。
第二次兴起(1986年):将BP(Back Propagation)神经网络的提出。
深度(Depth) 深度就是卷积操作中用到的滤波 器个数。这里对图片用了两个不 同的滤波器,从而产生了两个特 征映射。你可以认为这两个特征 映射也是堆叠的2d矩阵,所以这 里特征映射的“深度”就是2。
3.2 基本单元-----非线性(激励层)
3.卷积神经网络-CNN
激活函数一般用于卷积层和全连接层之后 激活函数是深度网络非线性的主要来源
Top Layer: the neurons respond to highly complex, abstract concepts that we would identify as different animals
输出: The network predicts what the object most likely is, based on its training
Sigmoid 梯度消失问题
ReLU
解决梯度消失问题 收敛速度非常快 神经元死亡问题
3.2 基本单元-----池化层
3.卷积神经网络-CNN
空间池化,也叫亚采样或下采样降低了每个特征映射的维度,但是保留了最重要的信息。
空间池化可以有很多种形式:最大(Max),平均(Average),求和(Sum)等等。最大池化成效最好。
目录
人脑视觉机理
01
与特征表示
CNN(卷积神经网络) ppt课件
为了处理一维序列数据,便有了循环神经网络,以及基于循环神经网络 优化而来的lstm,attention机制等.
目录
Contents
2. 卷积神经网络
2.1. 卷积神经网络和深度学习的历史 2.2. 卷积神经网络的设计和原理 2.3. 卷积神经网络的神经科学基础
CNN处理图像
卷积神经网络的计算效率提升,参数量:10^12 -> 10^6
卷积神经网络池化有最大池化(max_pool)和平均池化(avg_pool),顾名 思义,最大池化取区域内最大值,平均池化取区域内平均值.其它池化包 括L 2 范数以及依靠据中心像素距离的加权平均池化.
CNN池化过程
CNN 特性-池化
为什么要池化?
1.减少参数的量,提高计算效率. 2.最大池化能显著增强局部特征,平均池化可减少噪声.
深度学习以及卷积神经网络的适用需要大量的有效训练数据,过去的互联网时代为 深度学习提供了大量的训练数据,同时随着几十年来硬件技术的发展,为利用和计算 大量数据提供了条件.所以,近年来,每一次模型算法的更新,都取得了良好的效果, 为深度学习这把火炬增添了燃料.
卷积神经网络和深度学习的历史
卷积神经网络提供了一种方法来专业化神经网络,以处理具有清楚的网 络结构的数据,以及将这样的模型放大到非常大的尺寸(加深层数).这种方法 在二维图像拓扑上的应用是最成功的.同时,卷积神经网络比全连接网络计 算效率更高,使用他们运行多个实验并调整它们的实现和超参数更容易,更 大的网络也更容易训练.
CNN特性-权值共享和多卷积核
卷积神经网络之所以计算效率高,对特征提取的效果好,主要是由于卷 积神经网络具有以下三个特性:权值共享,多卷积核,池化.
权值共享
请在这里输入论文答辩
目录
Contents
2. 卷积神经网络
2.1. 卷积神经网络和深度学习的历史 2.2. 卷积神经网络的设计和原理 2.3. 卷积神经网络的神经科学基础
CNN处理图像
卷积神经网络的计算效率提升,参数量:10^12 -> 10^6
卷积神经网络池化有最大池化(max_pool)和平均池化(avg_pool),顾名 思义,最大池化取区域内最大值,平均池化取区域内平均值.其它池化包 括L 2 范数以及依靠据中心像素距离的加权平均池化.
CNN池化过程
CNN 特性-池化
为什么要池化?
1.减少参数的量,提高计算效率. 2.最大池化能显著增强局部特征,平均池化可减少噪声.
深度学习以及卷积神经网络的适用需要大量的有效训练数据,过去的互联网时代为 深度学习提供了大量的训练数据,同时随着几十年来硬件技术的发展,为利用和计算 大量数据提供了条件.所以,近年来,每一次模型算法的更新,都取得了良好的效果, 为深度学习这把火炬增添了燃料.
卷积神经网络和深度学习的历史
卷积神经网络提供了一种方法来专业化神经网络,以处理具有清楚的网 络结构的数据,以及将这样的模型放大到非常大的尺寸(加深层数).这种方法 在二维图像拓扑上的应用是最成功的.同时,卷积神经网络比全连接网络计 算效率更高,使用他们运行多个实验并调整它们的实现和超参数更容易,更 大的网络也更容易训练.
CNN特性-权值共享和多卷积核
卷积神经网络之所以计算效率高,对特征提取的效果好,主要是由于卷 积神经网络具有以下三个特性:权值共享,多卷积核,池化.
权值共享
请在这里输入论文答辩
第六章卷积神经网络
池化层(下采样)
池化操作将语义上相似的特征合并起来,常取对应区域的最大值、平均值
图6-5 最大池化示意图
6.3训练卷积神经网络
数据增强
数据增强就是通过某些图像处理的方法扩充现有的训练样本
常用的方法有: 几何变换:
镜像翻转,随机切割,旋转缩放等 像素变换:
调整亮度、对比度,添加噪声等
6.3训练卷积神经网络
(3)
6.3训练卷积神经网络
模型调优
随机梯度下降(SGD)算法,每次在全部样本集中随机选择一个数据样本进行参数更新。
(4)
w为权值,η为学习率,el为样本xl的实际输出与真实样本(期望输出) 之间的误差,L为样本总数。
6.3训练卷积神经网络
模型调优
小批量梯度下降(MBGD)算法将训练样本随机分为划分为大小为m的mini-batch,每一次迭代计 算mini-batch的梯度来对参数进行更新。
计算量巨大
解决办法
局部感受野 + 权值共享 + 下采样
6.2 卷积神经网络结构
局部感受野及权值共享
图6-2 全连接(左)与局部连接(右)
感受野:每个神经元其实只需对上一层图像的局部区域进行感知,而不需要对全局图像进行感知 权值共享:使与图像进行局部连接的所有神经元使用同一组参数
6.2 卷积神经网络结构
CNN
现 代 雏 形 1989年
训 练 深 层 2006年
大 规 模 数 据 识 别 2012年
现今
6.2 卷积神经网络结构
早期典型CNN结构
图6-1 卷积神经网络的典型结构
特征提取
输入层 卷积层
CNN
池化层
分类器
6.2 卷积神经网络结构
池化操作将语义上相似的特征合并起来,常取对应区域的最大值、平均值
图6-5 最大池化示意图
6.3训练卷积神经网络
数据增强
数据增强就是通过某些图像处理的方法扩充现有的训练样本
常用的方法有: 几何变换:
镜像翻转,随机切割,旋转缩放等 像素变换:
调整亮度、对比度,添加噪声等
6.3训练卷积神经网络
(3)
6.3训练卷积神经网络
模型调优
随机梯度下降(SGD)算法,每次在全部样本集中随机选择一个数据样本进行参数更新。
(4)
w为权值,η为学习率,el为样本xl的实际输出与真实样本(期望输出) 之间的误差,L为样本总数。
6.3训练卷积神经网络
模型调优
小批量梯度下降(MBGD)算法将训练样本随机分为划分为大小为m的mini-batch,每一次迭代计 算mini-batch的梯度来对参数进行更新。
计算量巨大
解决办法
局部感受野 + 权值共享 + 下采样
6.2 卷积神经网络结构
局部感受野及权值共享
图6-2 全连接(左)与局部连接(右)
感受野:每个神经元其实只需对上一层图像的局部区域进行感知,而不需要对全局图像进行感知 权值共享:使与图像进行局部连接的所有神经元使用同一组参数
6.2 卷积神经网络结构
CNN
现 代 雏 形 1989年
训 练 深 层 2006年
大 规 模 数 据 识 别 2012年
现今
6.2 卷积神经网络结构
早期典型CNN结构
图6-1 卷积神经网络的典型结构
特征提取
输入层 卷积层
CNN
池化层
分类器
6.2 卷积神经网络结构
卷积神经网络纯净版ppt课件
5. C5层是一个卷积层,有120个特征图。每个单元与S4层的全部16个单元的5*5邻域 相连,故C5特征图的大小为1*1:这构成了S4和C5之间的全连接。之所以仍将C5 标示为卷积层而非全连接层,是因为如果LeNet-5的输入变大,而其他的保持不 变,那么此时特征图的维数就会比1*1大。C5层有48120个可训练连接。
5
完整最新ppt
Convolutional Neural Networks
反向传播算法(Back Propagation)
• 反向传播算法是计算多层复合函数的所有变量的偏导数的利器,上面梯度下降的例子中就是求梯度, 简单的理解就是链式法则
根据链式法则,我们求e对a的偏导和e对d的偏导是如下所示:
可以看出,它们都求了e对c的偏导。对于权值动则数万的深度模型 中的神经网络,这样的冗余所导致的计算量是相当大的 BP算法则机智地避开了这种冗余,BP算法是反向(自上往下)来求偏 导的。
14
完整最新ppt
LeNet-5
3. 根据对前面C1层同样的理解,我们很容易得到C3层的大小为10x10. 只不过,C3层的变成了16个 10x10网络,有16个卷积核。 如果S2层只有1个平面,那么由S2层得到C3就和由输入层得到C1层是完 全一样的。但是,S2层由多层,那么,只需要按照一定的顺利组合这些层就可以了。具体的组合规 则,在 LeNet-5 系统中给出了下面的表格:
什么是池化?
• 池化层主要的作用是下采样,通过去掉Feature Map 中不重要的样本,进一步减少参数数量。
• 池化的方法很多,最常用的是Max Pooling。Max Pooling实际上就是在n*n的样本中取最大值,作为采 样后的样本值。右图是2*2 max
卷积神经网络ppt课件
6. F6层有84个单元(之所以选这个数字的原因来自于输出层的设计),与C5层 全相连。有10164个可训练参数。如同经典神经网络,F6层计算输入向量 和权重向量之间的点积,再加上一个偏置。然后将其传递给sigmoid函数 产生节点的输出。
16
LetNet-5
比特面编码:将一个灰度图像为8 bit/像素中每个像素的第j个比特抽取出来,就得到一个称为比特平面的二值 图像,于是图像完全可以用一组共8个比特平面来表示,对灰度图像的编码转为对比特平面的二值化方块编码。 为此,将每个比特面分为不重叠的m×n个元素的子块。
23
池化层的误差传递
大部分池化层没有需要训练的参数,只需要将误差传递。以Max Pooling为 例
Layer l-1
Layer l
24
池化层的误差传递
5. C5层是一个卷积层,有120个特征图。每个单元与S4层的全部16个单元的5*5邻 域相连,故C5特征图的大小为1*1:这构成了S4和C5之间的全连接。之所以仍 将C5标示为卷积层而非全连接层,是因为如果LeNet-5的输入变大,而其他的 保持不变,那么此时特征图的维数就会比1*1大。C5层有48120个可训练连接。
17
卷积层的训练
layer l-1
L-1
层
?
的
误
差
L-1
层 的
输 出
layer l
L
层 的 误 差
L
层 的 输 入
18
卷积层的误差传播
19
卷积层的误差传播
20
卷积层的误差传播
卷积操作 21
卷积层filter权重梯度的计算
22
卷积层filter权重梯度的计算
16
LetNet-5
比特面编码:将一个灰度图像为8 bit/像素中每个像素的第j个比特抽取出来,就得到一个称为比特平面的二值 图像,于是图像完全可以用一组共8个比特平面来表示,对灰度图像的编码转为对比特平面的二值化方块编码。 为此,将每个比特面分为不重叠的m×n个元素的子块。
23
池化层的误差传递
大部分池化层没有需要训练的参数,只需要将误差传递。以Max Pooling为 例
Layer l-1
Layer l
24
池化层的误差传递
5. C5层是一个卷积层,有120个特征图。每个单元与S4层的全部16个单元的5*5邻 域相连,故C5特征图的大小为1*1:这构成了S4和C5之间的全连接。之所以仍 将C5标示为卷积层而非全连接层,是因为如果LeNet-5的输入变大,而其他的 保持不变,那么此时特征图的维数就会比1*1大。C5层有48120个可训练连接。
17
卷积层的训练
layer l-1
L-1
层
?
的
误
差
L-1
层 的
输 出
layer l
L
层 的 误 差
L
层 的 输 入
18
卷积层的误差传播
19
卷积层的误差传播
20
卷积层的误差传播
卷积操作 21
卷积层filter权重梯度的计算
22
卷积层filter权重梯度的计算
[课件]卷积神经网络CNNPPT
23
1998年LeNet——数字/字符识别
LeNet-5
Feature
map
a set of units whose weighs are constrained to be identical.
24
1998年LeNet——数字/字符识别
例如:C3层参数个数
(3*6+4*9+6*1)*25
33
VGG Net (2014)
K. Simonyan, A. Zisserman. Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556, 2014
34
140948422014sparseinteractions有限连接kernel比输入小连接数少很多学习难度小计算复杂度低sparseinteractions有限稀疏连接局部连接连接数少很多计算复杂度低层级感受野生物启发parametersharing参数共享tiedweights进一步极大的缩减参数数量equivariantrepresentations等变性配合pooling可以获得平移不变性三个步骤卷积突触前激活net非线性激活detectorpoolinglayer的两种定义复杂定义简单定义pooling10定义没有需要学习的参数replacescertainlocationsummarystatisticnearbyoutputs种类maxpoolingweightedaveragepoolingwhypooling
30
AlexNet for ImageNet
深度的重要性
CNN(卷积神经网络) ppt课件
Notes: 式1:
神经网络的结点计算
前向计算:
反向传播:
神经网络梯度传播(链式法则)
Notes:
目录
Contents
2. 卷积神经网络
2.1. 卷积神经网络和深度学习的历史 2.2. 卷积神经网络的设计和原理 2.3. 卷积神经网络的神经科学基础
卷积神经网络和深度学习的历史
卷积神经网络在深度学习的历史中发挥了重要作用.它们是将研究大脑获得的深 刻理解成功应用于机器学习应用的关键例子,也是第一个表现良好的深度模型之 一.是第一个解决重要商业应用的神经网络,并且仍然是当今深度学习应用的前沿.
目录
Contents
3. CNN实现(tensorflow)
3.1.主流CNN模型介绍 3.2.使用tensorflow实现CNN 3.3.使用tensorflow实现其它模型
使用tensorflow搭建CNN
TensorFlow™ 是一个采用数据流图,用于数值计算的开源软件库。节点 在图中表示数学操作,图中的线则表示在节点间相互联系的多维数据数组, 即张量(tensor)。
深度学习以及卷积神经网络的适用需要大量的有效训练数据,过去的互联网时代为 深度学习提供了大量的训练数据,同时随着几十年来硬件技术的发展,为利用和计算 大量数据提供了条件.所以,近年来,每一次模型算法的更新,都取得了良好的效果, 为深度学习这把火炬增添了燃料.
卷积神经网络和深度学习的历史
卷积神经网络提供了一种方法来专业化神经网络,以处理具有清楚的网 络结构的数据,以及将这样的模型放大到非常大的尺寸(加深层数).这种方法 在二维图像拓扑上的应用是最成功的.同时,卷积神经网络比全连接网络计 算效率更高,使用他们运行多个实验并调整它们的实现和超参数更容易,更 大的网络也更容易训练.
神经网络的结点计算
前向计算:
反向传播:
神经网络梯度传播(链式法则)
Notes:
目录
Contents
2. 卷积神经网络
2.1. 卷积神经网络和深度学习的历史 2.2. 卷积神经网络的设计和原理 2.3. 卷积神经网络的神经科学基础
卷积神经网络和深度学习的历史
卷积神经网络在深度学习的历史中发挥了重要作用.它们是将研究大脑获得的深 刻理解成功应用于机器学习应用的关键例子,也是第一个表现良好的深度模型之 一.是第一个解决重要商业应用的神经网络,并且仍然是当今深度学习应用的前沿.
目录
Contents
3. CNN实现(tensorflow)
3.1.主流CNN模型介绍 3.2.使用tensorflow实现CNN 3.3.使用tensorflow实现其它模型
使用tensorflow搭建CNN
TensorFlow™ 是一个采用数据流图,用于数值计算的开源软件库。节点 在图中表示数学操作,图中的线则表示在节点间相互联系的多维数据数组, 即张量(tensor)。
深度学习以及卷积神经网络的适用需要大量的有效训练数据,过去的互联网时代为 深度学习提供了大量的训练数据,同时随着几十年来硬件技术的发展,为利用和计算 大量数据提供了条件.所以,近年来,每一次模型算法的更新,都取得了良好的效果, 为深度学习这把火炬增添了燃料.
卷积神经网络和深度学习的历史
卷积神经网络提供了一种方法来专业化神经网络,以处理具有清楚的网 络结构的数据,以及将这样的模型放大到非常大的尺寸(加深层数).这种方法 在二维图像拓扑上的应用是最成功的.同时,卷积神经网络比全连接网络计 算效率更高,使用他们运行多个实验并调整它们的实现和超参数更容易,更 大的网络也更容易训练.
卷积神经网络(纯净版)ppt课件
Convolutional Neural Networks 卷积神经网络
1
Contents
• 机器学习,神经网络,深度学习之间的关系 • 什么是神经网络 • 梯度下降算法 • 反向传播算法 • 神经网络的训练 • 什么是卷积 • 什么是池化 • LeNet-5 • 其它的工作
2
Convolutional Neural Networks
5
Convolutional Neural Networks
反向传播算法(Back Propagation)
• 反向传播算法是计算多层复合函数的所有变量的偏导数的利器,上面梯度下降的例子中就是求梯度, 简单的理解就是链式法则
根据链式法则,我们求e对a的偏导和e对d的偏导是如下所示:
可以看出,它们都求了e对c的偏导。对于权值动则数万的深度模型 中的神经网络,这样的冗余所导致的计算量是相当大的 BP算法则机智地避开了这种冗余,BP算法是反向(自上往下)来求偏 导的。
• 神经元:
,
• 每个连接都有一个权值
4
图1.一个全连接的神经网络
Convolutional Neural Networks
梯度下降算法
• 梯度下降算法是用来求函数最小值的算法 • 每次沿着梯度的反方向,即函数值下降最快的方向,去
修改值,就能走到函数的最小值附近(之所以是最小值 附近而不是最小值那个点,是因为我们每次移动的步长 不会那么恰到好处,有可能最后一次迭代走远了越过了 最小值那个点)
什么是卷积?
右图展示了卷积的过程,和信号处理的卷积有所区别 卷积降低了网络模型的复杂度(对于很难学习的深层 结构来说,这是非常重要的),减少了权值的数量 黄色部分是卷积核
11
Convolutional Neural Networks
1
Contents
• 机器学习,神经网络,深度学习之间的关系 • 什么是神经网络 • 梯度下降算法 • 反向传播算法 • 神经网络的训练 • 什么是卷积 • 什么是池化 • LeNet-5 • 其它的工作
2
Convolutional Neural Networks
5
Convolutional Neural Networks
反向传播算法(Back Propagation)
• 反向传播算法是计算多层复合函数的所有变量的偏导数的利器,上面梯度下降的例子中就是求梯度, 简单的理解就是链式法则
根据链式法则,我们求e对a的偏导和e对d的偏导是如下所示:
可以看出,它们都求了e对c的偏导。对于权值动则数万的深度模型 中的神经网络,这样的冗余所导致的计算量是相当大的 BP算法则机智地避开了这种冗余,BP算法是反向(自上往下)来求偏 导的。
• 神经元:
,
• 每个连接都有一个权值
4
图1.一个全连接的神经网络
Convolutional Neural Networks
梯度下降算法
• 梯度下降算法是用来求函数最小值的算法 • 每次沿着梯度的反方向,即函数值下降最快的方向,去
修改值,就能走到函数的最小值附近(之所以是最小值 附近而不是最小值那个点,是因为我们每次移动的步长 不会那么恰到好处,有可能最后一次迭代走远了越过了 最小值那个点)
什么是卷积?
右图展示了卷积的过程,和信号处理的卷积有所区别 卷积降低了网络模型的复杂度(对于很难学习的深层 结构来说,这是非常重要的),减少了权值的数量 黄色部分是卷积核
11
Convolutional Neural Networks
卷积神经网络PPT课件
15
多层感知器预测
将光栅化后的向量连接到多层感知器
16
CNN参数更新
17
多层感知器层
• 残差定义 • 使用多层感知器的参数估计方法,得到其最低的一个隐层 s 的残差向量 • δs 。 • 现在需要将这个残差传播到光栅化层 r ,光栅化的时候并没有对向量的
值做修改,因此其激活函数为恒等函数,其导数为单位向量。
6
隐层输出层
可以视为级联在隐层上的一个感知器。若为二分类,则常用 LogisticRegression;若为多分类,则常用Softmax Regression。
7
核心!权值、偏置估计(结论如下,推导见“卷积神经网络全面 解析”)
• 残差定义:
假设有层 p, q, r ,分别有 l, m, n 个节点,
对网络权值的训练,可以使感知器对一组输人矢量的响应达到元素为0或1 的目标输出,从而实现对输人矢量分类的目的。
3
单层感知器作用范围
• 感知器是一个简单的二类分类的线性分类模型,要求我们的样本是线性可 分的。
4
多层感知器
多层感知器的思路是,尽管原始数据是非线性可分的,但是可以通过某种方 法将其映射到一个线性可分的高维空间中,从而使用线性分类器完成分类。 图1中,从X到O这几层,正展示了多层感知器的一个典型结构,即输入层隐 层输出层。
20
• 对权值和偏置的更新:
卷积层
• 其中,rot180 是将一个矩阵旋转180度; Oq'是连接到该卷积层前的池化 层的输出。
•
21
卷积层的残差反传?
22
整体思路
• 以层为单位,分别实现卷积层、池化层、光栅化层、MLP隐层、分类层这 五个层的类。其中每个类都有output和backpropagate这两个方法。
多层感知器预测
将光栅化后的向量连接到多层感知器
16
CNN参数更新
17
多层感知器层
• 残差定义 • 使用多层感知器的参数估计方法,得到其最低的一个隐层 s 的残差向量 • δs 。 • 现在需要将这个残差传播到光栅化层 r ,光栅化的时候并没有对向量的
值做修改,因此其激活函数为恒等函数,其导数为单位向量。
6
隐层输出层
可以视为级联在隐层上的一个感知器。若为二分类,则常用 LogisticRegression;若为多分类,则常用Softmax Regression。
7
核心!权值、偏置估计(结论如下,推导见“卷积神经网络全面 解析”)
• 残差定义:
假设有层 p, q, r ,分别有 l, m, n 个节点,
对网络权值的训练,可以使感知器对一组输人矢量的响应达到元素为0或1 的目标输出,从而实现对输人矢量分类的目的。
3
单层感知器作用范围
• 感知器是一个简单的二类分类的线性分类模型,要求我们的样本是线性可 分的。
4
多层感知器
多层感知器的思路是,尽管原始数据是非线性可分的,但是可以通过某种方 法将其映射到一个线性可分的高维空间中,从而使用线性分类器完成分类。 图1中,从X到O这几层,正展示了多层感知器的一个典型结构,即输入层隐 层输出层。
20
• 对权值和偏置的更新:
卷积层
• 其中,rot180 是将一个矩阵旋转180度; Oq'是连接到该卷积层前的池化 层的输出。
•
21
卷积层的残差反传?
22
整体思路
• 以层为单位,分别实现卷积层、池化层、光栅化层、MLP隐层、分类层这 五个层的类。其中每个类都有output和backpropagate这两个方法。
卷积神经网络ppt课件
Convolutional Neural Networks 卷积神经网络
ppt课件.
1
Contents
机器学习,神经网络,深度学习之间的关系 什么是神经网络 梯度下降算法 反向传播算法 神经网络的训练 什么是卷积 什么是池化 LeNet-5 其它的工作
ppt课件.
2
Convolutional Neural Networks
ppt课件.
6
Convolutional Neural Networks
梯度下降算法+反向传播算法
ppt课件.
7
Convolutional Neural Networks
ppt课件.
8
Convolutional Neural Networks
ppt课件.
9
Convolutional Neural Networks
ppt课件.
10
Convolutional Neural Networks
什么是卷积?
右图展示了卷积的过程,和信号处理的卷积有所区别
卷积降低了网络模型的复杂度(对于很难学习的深层 结构来说,这是非常重要的),减少了权值的数量
黄色部分是卷积核
ppt课件.
11
Convolutional Neural Networks
图1.一个全连接的神经网络
ppt课件.
4
Convolutional Neural Networks
梯度下降算法
• 梯度下降算法是用来求函数最小值的算法
• 每次沿着梯度的反方向,即函数值下降最快的方向,去 修改值,就能走到函数的最小值附近(之所以是最小值 附近而不是最小值那个点,是因为我们每次移动的步长 不会那么恰到好处,有可能最后一次迭代走远了越过了 最小值那个点)
ppt课件.
1
Contents
机器学习,神经网络,深度学习之间的关系 什么是神经网络 梯度下降算法 反向传播算法 神经网络的训练 什么是卷积 什么是池化 LeNet-5 其它的工作
ppt课件.
2
Convolutional Neural Networks
ppt课件.
6
Convolutional Neural Networks
梯度下降算法+反向传播算法
ppt课件.
7
Convolutional Neural Networks
ppt课件.
8
Convolutional Neural Networks
ppt课件.
9
Convolutional Neural Networks
ppt课件.
10
Convolutional Neural Networks
什么是卷积?
右图展示了卷积的过程,和信号处理的卷积有所区别
卷积降低了网络模型的复杂度(对于很难学习的深层 结构来说,这是非常重要的),减少了权值的数量
黄色部分是卷积核
ppt课件.
11
Convolutional Neural Networks
图1.一个全连接的神经网络
ppt课件.
4
Convolutional Neural Networks
梯度下降算法
• 梯度下降算法是用来求函数最小值的算法
• 每次沿着梯度的反方向,即函数值下降最快的方向,去 修改值,就能走到函数的最小值附近(之所以是最小值 附近而不是最小值那个点,是因为我们每次移动的步长 不会那么恰到好处,有可能最后一次迭代走远了越过了 最小值那个点)
卷积神经网络报告ppt课件
需要注意的是S1到C2的的连接,C2层的 每个神经元只是部分与S1层的神经元连接, 而传统的BP网络中每个神经元会与上一层 的所有神经元进行连接。
单击此处辑内容
单击添加标题,建议您在展示时采 用微软雅黑体
单击此处编辑内容
单击添加标题,建议您在展示时采 用微软雅黑字体
3
卷积的过程
左边是被卷积图片的像素显示,其中的数 字代表每个像素点的像素值。中间的小图 片就是卷积核,卷积核会从图片的左上角 开始从左到右从上到下的进行卷积操作, 每一次的卷积操作如右图所示:卷积核里 的每个值与其对应位置的图片像素值相乘, 再将所有相乘的结果求和就得到了结果。
7
CNN网络的执行过程
右图展示了Input图片经过卷基层的过程,该卷 基层有六个神经元,每个神经元有一个卷积核。
单击此处辑内容
单击添加标题,建议您在展示时采 用微软雅黑体
单击此处编辑内容
单击添加标题,建议您在展示时采 用微软雅黑字体
8
CNN网络的执行过程
单击此处辑内容
单击添加标题,建议您在展示时采 用微软雅黑体
单击此处辑内容
单击添加标题,建议您在展示时采 用微软雅黑体
单击此处编辑内容
单击添加标题,建议您在展示时采 用微软雅黑字体
5
池化的过程
一般经过卷积操作后生成的图像尺寸还是 太大,为了减少网络计算的复杂度,需要 把卷及操作后的图片进行缩小,也就是进 行池化(Pooling)。池化字面理解就是把 图片分成一个个池子,常用的池化有最大 池化和平均池化,右图展示的是最大池化, 把图片分为了四个2*2的池子,选取每个 池子中的最大值作为结果。平均池化就是 取每个池子的平均值作为结果。右图中经 过池化图片尺寸就缩减为原图的一半。
单击此处辑内容
单击添加标题,建议您在展示时采 用微软雅黑体
单击此处编辑内容
单击添加标题,建议您在展示时采 用微软雅黑字体
3
卷积的过程
左边是被卷积图片的像素显示,其中的数 字代表每个像素点的像素值。中间的小图 片就是卷积核,卷积核会从图片的左上角 开始从左到右从上到下的进行卷积操作, 每一次的卷积操作如右图所示:卷积核里 的每个值与其对应位置的图片像素值相乘, 再将所有相乘的结果求和就得到了结果。
7
CNN网络的执行过程
右图展示了Input图片经过卷基层的过程,该卷 基层有六个神经元,每个神经元有一个卷积核。
单击此处辑内容
单击添加标题,建议您在展示时采 用微软雅黑体
单击此处编辑内容
单击添加标题,建议您在展示时采 用微软雅黑字体
8
CNN网络的执行过程
单击此处辑内容
单击添加标题,建议您在展示时采 用微软雅黑体
单击此处辑内容
单击添加标题,建议您在展示时采 用微软雅黑体
单击此处编辑内容
单击添加标题,建议您在展示时采 用微软雅黑字体
5
池化的过程
一般经过卷积操作后生成的图像尺寸还是 太大,为了减少网络计算的复杂度,需要 把卷及操作后的图片进行缩小,也就是进 行池化(Pooling)。池化字面理解就是把 图片分成一个个池子,常用的池化有最大 池化和平均池化,右图展示的是最大池化, 把图片分为了四个2*2的池子,选取每个 池子中的最大值作为结果。平均池化就是 取每个池子的平均值作为结果。右图中经 过池化图片尺寸就缩减为原图的一半。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
反向传播算法(Back Propagation)
• 反向传播算法是计算多层复合函数的所有变量的偏导数的利器,上面梯度下降的例子中就是求梯度, 简单的理解就是链式法则
根据链式法则,我们求e对a的偏导和e对d的偏导是如下所示:
5. C5层是一个卷积层,有120个特征图。每个单元与S4层的全部16个单元的5*5邻域 相连,故C5特征图的大小为1*1:这构成了S4和C5之间的全连接。之所以仍将C5 标示为卷积层而非全连接层,是因为如果LeNet-5的输入变大,而其他的保持不 变,那么此时特征图的维数就会比1*1大。C5层有48120个可训练连接。
Contents
• 机器学习,神经网络,深度学习之间的关系 • 什么是神经网络 • 梯度下降算法 • 反向传播算法 • 神经网络的训练 • 什么是卷积 • 什么是池化 • LeNet-5 • 其它的工作
1 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
• 神经元:
,
• 每个连接都有一个权值
3 2/19/2021
卷积神经网络纯净版
图1.一个全连接的神经网络
Convolutional Neural Networks
梯度下降算法
• 梯度下降算法是用来求函数最小值的算法
• 每次沿着梯度的反方向,即函数值下降最快的方向,去 修改值,就能走到函数的最小值附近(之所以是最小值 附近而不是最小值那个点,是因为我们每次移动的步长 不会那么恰到好处,有可能最后一次迭代走远了越过了 最小值那个点)
layer l-1
LБайду номын сангаас1
层 的 误 差
L-1
层 的 输 出
17 2/19/2021
6 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
•
7 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
•
8 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
6. F6层有84个单元(之所以选这个数字的原因来自于输出层的设计),与C5层 全相连。有10164个可训练参数。如同经典神经网络,F6层计算输入向量 和权重向量之间的点积,再加上一个偏置。然后将其传递给sigmoid函数产
生节点的输出。
15 2/19/2021
卷积神经网络纯净版
LetNet-5
•
11 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
LeNet-5
12 2/19/2021
卷积神经网络纯净版
LeNet-5
1. 输入图像是32x32的大小,卷积核的大小是5x5的,由于不考虑对图像 的边界进行拓展,则卷积核将有28x28个不同的位置,也就是C1层的大 小是28x28。这里设定有6个不同的C1层,每一个C1层内的权值是相同的。 2. S2层是一个下采样层,即池化层。在斯坦福关于深度学习的教程中, 这个过程叫做Pool 。但在LeNet-5系统,下采样层比较复杂,由4个点下 采样的加权平均为1个点,,因为这4个加权系数也需要学习得到,这显 然增加了模型的复杂度。
13 2/19/2021
卷积神经网络纯净版
LeNet-5
3. 根据对前面C1层同样的理解,我们很容易得到C3层的大小为10x10. 只不过,C3层的变成了16个 10x10网络,有16个卷积核。 如果S2层只有1个平面,那么由S2层得到C3就和由输入层得到C1层是完 全一样的。但是,S2层由多层,那么,只需要按照一定的顺利组合这些层就可以了。具体的组合规 则,在 LeNet-5 系统中给出了下面的表格:
机器学习,神经网络, 深度学习之间的关系
2 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
什么是神经网络?
• 人工神经网络(Artificial neural network, ANN),简称 神经网络(NN)
• 神经网络其实就是按照一定规则连接起来的多个神经 元
可以看出,它们都求了e对c的偏导。对于权值动则数万的深度模型 中的神经网络,这样的冗余所导致的计算量是相当大的 BP算法则机智地避开了这种冗余,BP算法是反向(自上往下)来求偏 导的。
5 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
梯度下降算法+反向传播算法
•
9 2/19/2021
卷积神经网络纯净版
Convolutional Neural Networks
什么是卷积?
右图展示了卷积的过程,和信号处理的卷积有所区别 卷积降低了网络模型的复杂度(对于很难学习的深层 结构来说,这是非常重要的),减少了权值的数量 黄色部分是卷积核
10 2/19/2021
卷积神经网络纯净版
C3层feature map
S2层feature map
简单的说,例如对于C3层第0张特征图,其每一个节点与S2层的第0张特征图,第1张特征图,第2张 特征图,总共3个5x5个节点相连接。后面依次类推,C3层每一张特征映射图的权值是相同的
14 2/19/2021
卷积神经网络纯净版
LeNet-5
4. S4 层是在C3层基础上下采样,前面已述。
比特面编码:将一个灰度图像为8 bit/像素中每个像素的第j个比特抽取出来,就得到一个称为比特平面的二值 图像,于是图像完全可以用一组共8个比特平面来表示,对灰度图像的编码转为对比特平面的二值化方块编码。 为此,将每个比特面分为不重叠的m×n个元素的子块。
16 2/19/2021
卷积神经网络纯净版
卷积层的训练
Convolutional Neural Networks
什么是池化?
• 池化层主要的作用是下采样,通过去掉Feature Map 中不重要的样本,进一步减少参数数量。
• 池化的方法很多,最常用的是Max Pooling。Max Pooling实际上就是在n*n的样本中取最大值,作为采 样后的样本值。右图是2*2 max