基于卷积神经网络的图像识别研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第14期

2018年7月No.14July,2018

1 算法原理

卷积神经网络的卷积层最重要部分为卷积核[1-2]。卷积核不仅能够使各神经元间连接变少,还可以降低过拟合误

差[3]。

子采样过程就是池化过程。进行卷积过程是将卷积核与预测试图像进行卷积,子采样能够简化网络模型,降低网络模型复杂程度,从而缩减参数。

在图像识别时,首先需要对输入图像初始化,然后将初始化后图像进行卷积和采样,前向反馈到全连接层,通过变换、即可计算进入输出层面,最终通过特征增强效果和逻辑之间的线性回归判断是否符合图像识别期望效果,往复循环,每循环一次就迭代一次,进而对图像进行识别。流程如图1所示。

图1 卷积神经网络模型流程

2 卷积神经网络

卷积神经网络主要包括3个层次[4],它由输入层、隐藏

层、输出层共同建立卷积神经网络模型结构。2.1 卷积层

卷积层的作用是提取特征[2]。卷积层的神经元之间进行

局部连接,为不完全连接[5]。

卷积层计算方法公式如下。()r

array M a λ+

其中λ为激活函数,array 是灰度图像矩阵,

M 表示卷积核, 表示卷积,

a 表示偏置值大小。G x 方向和G y 方向卷积核。

本文卷积神经网络模型中设定的卷积核分为水平方向和竖直方向。卷积层中卷积核通过卷积可降低图像边缘模糊程度,使其更为清晰,效果更好、更为显著。经过S 型函数激活处理之后,进行归一化后图像灰度值具有层次感,易于突出目标区域,便于进一步处理。2.2 全连接层

该层主要对信息进行整理与合并,全连接层的输入是卷积层和池化层的输出。在视觉特征中,距离最近点颜色等特征最为相似,像素同理。全连接如图2所示。

图2 全连接

3 实验结果与分析

本文采用数据集库是MSRA 数据集,该数据集共包含1 000张图片。实验环境为Matlab2015a 实验环境,Windows 7以上系统和无线局域网络。本文从MSRA 数据集中选取其中一张进行效果分析。卷积神经网络模型识别效果如图3所示。

作者简介:谢慧芳(1994— ),女,河南郑州人,本科生;研究方向:通信工程。

谢慧芳,刘艺航,王 梓,王迎港

(河南师范大学,河南 新乡 453007)

摘 要:为降低图像识别误识率,文章采用卷积神经网络结构对图像进行识别研究。首先,对输入图像进行初始化;然后,初

始化后的图像经卷积层与该层中卷积核进行卷积,对图像进行特征提取,提取的图像特征经过池化层进行特征压缩,得到图像最主要、最具代表性的点;最后,通过全连接层对特征进行综合,多次迭代,层层压缩,进而对图像进行识别,输出所识别图像。与原始算法相比,该网络构造可以提高图像识别准确性,大大降低误识率。实验结果表明,利用该网络模型识别图像误识率低至16.19%。关键词:卷积神经网络;卷积核;特征提取;特征压缩无线互联科技

Wireless Internet Technology

基于卷积神经网络的图像识别研究

第14期2018年7月

No.14July,

2018

(a )

原图像

(b )识别效果

图3 卷积神经网络识别效果

误识率是描述图像识别过程中对整个样本中所有图像识别错误概率。该网络模型算法和原始算法误识率对比,如表1所示。

由表1可知,随着迭代次数逐渐增加时,两种算法误识率都有较大程度降低,但本文算法误识率明显比原始算法低。经100次迭代与更新后,原始算法误识率降至20.00%,卷积神经网络模型即本文算法误识率降至16.19%。

无线互联科技·网络地带

表1 误识率对比

迭代次数/次

原始算法/%本文算法/%188.0679.45225.3422.18322.1220.054

21.5618.74520.9517.24678︙︙100

20.0620.0420.01︙︙20.00

16.5116.2316.21︙︙16.19

4 结语

本文首先输入原始图像,然后对输入图像进行初始化,卷积层的卷积核对初始化的图像进行卷积,提取图像中最具代表性特征点;接着提取图像特征进入池化层后池化层会对图像特征点进行归类压缩,提取最具代表性的图像特征,从而对图像进行识别,最后输出识别图像。实验结果显示,本文算法即利用卷积神经网络结构对图像进行识别能大大降低图像误识率,且本文算法误识率低至16.19%。图像识别在生活中应用非常广泛,应用领域也很广。相信在未来几年或几十年,图像识别将会引领时代主流,成为人工智能的重要研究方向。

[参考文献]

[1]DAMIEN V ,BERNARD H ,DAVID B.Iterative reconstruction for transmission tomography on GPU using Nvidia CUDA [J].Journal of University Tsinghua (Science and Technology ),2010(1):11-16.

[2]SEO J J ,KIM H I ,RO Y M.Pose-robust and discriminative feature representation by multi-task deep learning for multi-view face recognition[C].Miami :IEEE International Symposium on Multimedia ,2015:166-171.

[3]DEHAO C ,WENGUANG C ,ZHENG ,et al.CUDA-Zero :a framework for porting shared memory GPU applications to multi-GPUs[J]. Science China (Information Sciences ),2012(3):663-676.

[4]刘尚旺,段德全,崔艳萌,等.二次定位车牌分割及识别方法[J].河南师范大学学报(自然科学版),2016(4):151-156. [5]姜辉,张博,连晓新,等.基于ANN 的模拟空气击穿电压预测方法研究[J].电网与清洁能源,2014(9):5-11.

Research on image recognition based on convolution neural network

Xie Huifang, Liu Yihang, Wang Zi , Wang Yinggang (Henan Normal University, Xinxiang 453007, China )

Abstract:

In order to reduce the false recognition rate of image recognition, this paper uses convolution neural network structure to identify the image. First, the input image is initialized; then, the initialized layer of the image is convoluted with the convolution kernel in the layer, and the feature extraction is carried out. The extracted image features are compressed by the pool layer to get the most representative and most representative feature points of the image. The features of the extracted layer are integrated through the full link layer, iterated repeatedly, compressed layer by layer, and then the image is identified and the identified image is output. Compared with the original algorithm, the network structure can improve the accuracy of image recognition and greatly reduce the false recognition rate. The experimental results show that the false recognition rate of the image recognition system using this network model is as low as 16.19%.Key words:

convolution neural network; convolution kernel; feature extraction; feature compression

相关文档
最新文档