深度学习报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电子科技大学
实验报告(实验)课程名称深度学习
学生姓名:李寒雪学号:************* 指导教师:***
一、实验名称:基于MINST数据的CNN设计
二、网络设计
网络设计如上图所示:分为特征提取子网络和分类子网络,特征提取子网络分为卷积和池化部分,MNIST数据是28×28的矩阵,选择卷积函数为20个9×9的滤波器,即图中的W1(20×9×9),于是可以将原来的一个输入数据(28×28)降解为20个特征矩阵(20×20),接下来这20个特征矩阵各自经过ReLU激活函数后作为进入池化层的输入,池化层采用2×2的平均池化,那么池化层的输出20个10×10的特征矩阵,再讲它们reshape为2000×1的列向量作为分类子网络的输入;分类子网络采用单隐层,因此包含两个隐层矩阵参数W3
(100×2000)和W4(10×100),隐层采用ReLU激活方便误差反向传播时计算更新参数,因为是多分类问题,输出层采用softmax激活函数。
三、训练方法
对真实数据标记与模型预测标记之间的误差目标函数最小化,利用梯度下降算法更新参数,在模型隐层和卷积池化层的参数利用误差反向传播算法计算它们的更新值。对所有MNIST训练数据输入一遍,每次输入更新一次模型参数,最后利用更新好的模型参数在所有测试数据上进行准确率计算。关键更新过程和验证过程如下:
1、模型向前计算预测标记过程:
2、模型向后误差传播参数更新过程:
四、实验结果(含运行界面截图):
1、运行实验代码:实验平台(1.6 GHz Intel Core i5\ macOS\ 4GB\ MatlabR2016b)
实验运行正确率为97.66%,10000个测试数据分类错误的有234个,运行时间约为7min。
2、实验结果分析:
我们把分类错误的234个28×28的数据矩阵保存在同目录下F_X.mat 文件中,把这234个数据对应的正确的分类标记保存在F_D.mat文件中,把模型对着234个数据预测的错误的分类标记保存在F_Y。mat中,对比分析探究本实验模型分类错误的原因。
分类错误的234个数据样本加上它们对应的真实标记(左上)和预测标记(左下)如下图所示:
六、总结及体会:
在网络设计上是否可以设计更多更复杂的网络隐层使模型使正确率更高,可以多尝试别的卷积矩阵大小,可以使用批量算法和动量算法加快训练时间。