激活函数在卷积神经网络中的对比研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算 机系 统应 用 ISSN 1003.3254.CODEN CSAOBN Computer Systems&Applications,2018,27(7):43-49[doi:10.15888 ̄.cnki.csa.006463] @中 国科学 院软 件研 究所 版权 所 有.
E—mail:csa@iscas.ac.cn
引用格 式:田娟,李英 祥,李 彤岩.激活 函数在卷 积神经 网络 中的对 比研 究.计算 机系 统应用,2018,27(7):43-49.http://www-c_S-a.org.cn/1003-
3254/6463.html
C ontrastive Study of A ctivation Function in Convolutional N eural Nຫໍສະໝຸດ Baiduetw ork
模型 时只是根据标 准算法或改进算法直接搭建,而对算 法本身及影响模型性能 的因素不甚了解,致使在许多应用 中 或 多或少存 在盲 目套用现象.通过研究深度神经 网络 ,选 择其 中的重要影 响因素激 活函数进行深入研究.首先,分析 了激 活函数如 何影响深度 神经 网络 ;接 着对激 活函数 的发展现状 及不 同激 活函数 的原理性 能进 行 了分 析总结:最 后 ,基于 Caffe框 架用 CNN 对 Mnist数据集进 行分类识别 实验,对 5种 常用 激活函数进行综合 分析 比较,为设计深 度神 经网络模型时选用激活 函数提供参考. 关键 词:卷积神经网络;激活 函数 ;Caffe;梯度 下降法;网络性 能
http://ww w .C—S·a.org.cn Tel:+86.10.6266104l
激 活 函数在卷积神经 网络 中的对 比研究①
田 娟,李英祥,李彤岩
(成 都 信 息 工 程 大 学 通 信 工 程 学 院 ,成 都 610225) 通讯作者:田 娟,E-mail:1849336438@qq.com 摘 要 :近年,深度学 习的快速发展致使越来越 多的人从事相关 的研 究工作 .但 是,许多研究者在搭建深度神经 网络
1 引 言
近年,深度 学习 在计算机视 觉、语音识别 、 自然 语 言处 理、图形图像识别 等领 域的运用备受关注.与 浅层 神经 网络相 比,深度 神经 网络层 数 的增 加 意味着 其 学到 的特征越 紧密,表达 能力也 越强 .但 是,训练 的
层数越 多,训练也就越 困难,主 要是 因为在反 向传播算 法 中残 差会 随着 网络传 播 的深度递 减,使得 底层 网络 因为 残差 过小而 无法 得到有 效训练 或无 法训 练.残 差 的衰减 与 网络模 型 中激 活函数 (activation function)的 选用 密切 相关,更 好 的激 活 函数可 以抑制残 差在 网络
TIAN Juan,LI Ying—Xiang,LI Tong-Y an
(School ofCommunication Engineering,Chengdu University ofInformation Technology,Chengdu 610225,China) Abstract:In recent years,the rapid development of deep learning has led more and m ore people to engage in related research w ork.How ever,m any researchers construct deep neural netw ork m odels based on standard algorithm s or im proved algorithm s,but do not understand the algorithm itself and the factors that affect the perform ance of the m odel, resulting in more or less blind application in m any applications.By studying the deep neural network,the activation function of the im portant influencing factors was studied.First,the activation function is analyzed to influence the depth neural network.Then,the developm ent of activation function and the principle and performance of different activation fu nctions are analyzed and sum m arized.Finally,based on the Caffe fram ew ork,the CNN is used to classify and identify M N IST data sets.Five kinds of com m only used activation functions are analyzed and compared com prehensively to provide a reference for the selection of activation function in the design of deep neural netw ork m ode1. K ey w ords:convolutional neural netw ork;activation fu nction;Caffe;gradient m ethod;netw ork perform ance
相关文档
最新文档