基于深度学习的图像识别技术的研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2019年第7期

信息与电脑

China Computer & Communication 人工智能与识别技术基于深度学习的图像识别技术的研究

丁旭甫 王宏生

(沈阳工业大学,辽宁 沈阳 110870)

摘 要:随着科技的蓬勃发展,人工智能逐渐应用于图像处理领域。传统图像处理与识别以人为提取特征为手段,但大量特征提取给图像识别造成了一定困扰,由此引进了深度学习图像识别技术。相比于传统方法,深度学习能够提供基于学习的特征表示,在自动特征提取和分割识别准确率方面具有良好表现。基于此,针对深度学习的图像识别技术进行综述,并总结了讨论内容。

关键词:深度学习;图像识别技术;卷积神经网络

中图分类号:TP391.41 文献标识码:A 文章编号:1003-9767(2019)07-124-02

Research on Image Recognition Technology Based on Deep Learning

Ding Xufu, Wang Hongsheng

(Shenyang University of Technology, Shenyang Liaoning 110870, China)Abstract: With the vigorous development of science and technology, artificial intelligence is gradually applied to image processing. Traditional image processing and recognition uses human-made feature extraction as a means, but a large number of feature extraction has caused some problems to image recognition, thus introducing depth learning image recognition technology. Compared with traditional methods, in-depth learning can provide learning-based feature representation, and has good performance in automatic feature extraction and segmentation recognition accuracy. Based on this, the image recognition technology of depth learning

is summarized, and the discussion content is summarized.Key words: deep learning; image recognition technology; convolutional neural network

0 引言近年来,随着数字图像处理的不断发展,图像识别成为当下研究者的重点研究方向之一。图像识别技术已被广泛应用于医学、军事、工业和农业领域,其中,医学图像、生物特征图像、手写数字图像和车牌图像成为了研究热点与难点。机器学习与深度学习是当下主要的两类图像识别方法,但机

器学习图像识别方法存在特征提取量大,精确度不高等问题,由此引入了深度学习,以改进网络模型。深度学习架构由多层非线性运算单元组成,是利用深度神经网络在大量数据中进行特征提取、特征分类的一种自动学习过程。其中,学习到的高阶表示中包含低阶信息,最终实现图像分类与识别[1]。本文系统综述了基于深度学习的图像识别技术的最新研究进展。1 图像识别图像识别指利用机器学习、深度学习等技术方法,对图像进行预处理、特征提取分析、特征分类等处理,识别图像

中特定的一个或多个目标、物体。图像识别技术可以满足用户在不同场景下的视觉应用需求,主要包括移动互联网图像检索与挖掘、军事公安刑侦图像比对、智能机器视觉等领域。2 深度学习概述

2.1 深度学习内涵

机器学习是在模型训练过程中找到一个函数,通过特定输入得到特定输出,但此类函数有很多,需要利用深度学习训练模型进行试错,寻找具有泛化能力的函数。深度学习的结构为含有多个隐层的多层感知器,通过组合低层特征形成更加抽象的高层特征,并以数据的分布式特征表示[2]。2.2 深度学习网络结构

深度学习在图像处理领域的主要网络结构包括深度神经

网络(DNN )、深度信念网络(DBN )和卷积神经网络(CNN )。作者简介:丁旭甫(1993—),女,内蒙古包头人,硕士研究生在读。研究方向:智能信息处理。

2019年第7期信息与电脑

China Computer & Communication 人工智能与识别技术

2.2.1 深度神经网络(DNN )深度神经网络由许多基本神经元构成,神经元之间通过权重连接,由输入层、隐含层、输出层构成基本的网络模型。其使用反向传播算法训练模型,采用梯度下降法更新全连接网络结构中的权重。广义上,深度神经网络是深度学习的总称[3]。2.2.2 深度信念网络(DBN )深度信念网络采用无监督方法,堆积多个受限的玻尔兹曼机,以达到训练目的。它是一个可以对训练数据进行深层表达的图形模型[3]。Hinton 等人提出非监督贪心逐层训练算法和多层自动编码器深层结构[4],改进深度置信网络,优化深层结构。2.2.3 卷积神经网络(CNN )卷积神经网络由一个或多个卷积层、池化层、全连接层组成。卷积层由多个特征平面组成,每个特征平面由具有相同连接权重的多个神经元构成。它可以采用反向传播算法进行训练,使图像具有更好的识别效果。卷积形式为: 11

M

l l l l j jm m m h W h b −==∗+∑ (1)其中,h l j 是第l 卷积层输出的第j 个特征图,h m l -1(m =1,…,M )是第l-1卷积层输出的第m 个特征图;W l jm 是连接第l-1卷积层输出的第m 个特征图的卷积核;b l 是第l 层卷积层的偏置[5]。3 实际应用3.1 手写体字符识别手写体字符识别最早应用于人工智能领域,K 近邻(KNN )、K-MEANS 、贝叶斯等机器学习算法,在MNIST 数据集上进行试验与应用。但是,基于卷积神经网络的深度学习方法可得到更好的效果。MNIST 数据集由0~9的10个28×28像素的阿拉伯数字手写体图片组成,进行归一化、去噪、滤波等预处理操作过后,建立模型,对图片中的手写数字进行特征提取,并采取适当的分类模型进行分类,达到识别的目的[6]。3.2 生物特征识别目前,指纹、虹膜、人脸等生物特征识别成为深度学习研究领域的热门话题。人工设置生物特征较为繁琐,调试出最优结果较为困难。陈虹旭等人采用深度学习中的卷积神经网络识别正常指纹、困难指纹(指纹图像缺失、破损)和虹膜,提取感兴趣区域并进行归一化,进而提高指纹及虹膜识别的准确率[7-8]。Nair 等人利用Rectified 线性修正单元组成的深度神经网络结构,将深度学习应用于人脸识别,提高了精度[9]。特定情况下,单一特征识别具有局限性,孙文辉将单一特征进行融合[10],提出基于深度学习的多生物特征研究,基于堆栈极限深度学习,构建深度神经网络模型。 3.3 医学图像识别

随着计算机辅助诊断系统的出现,细胞、器官肿瘤等医学图像与人工智能诊断的结合愈发越密切。Mohamed 等人基于所在机构收集了乳腺X 线图像,构建并训练了1个CNN

模型,用于准确快速分类乳腺密度,从而明确乳腺癌的发生

几率。该模型分类的AUC 达到了0.988 2。Yann LeCun 教授利用CAMELYON 系列挑战赛提供的数据,构造并评估了GoogLeNet 、AlexNet 、VGG16和FaceNet 等4个较为主流的深度学习模型,并使用测试图像检测训练完成的模型,发现模型的AUC 均达到了0.995,表明深度学习技术可显著提

高病理诊断的准确性。

4 结 语基于深度学习的图像识别技术广泛应用于诸多领域,取得了显著效果,在生产和生活中发挥了关键作用。卷积神经网络改进是当下的重点研究方向之一,深度学习目前还有待深入研究。目前,针对不同类型图像的模型与算法,合理利用深度学习方法提高图像识别精度,是各个领域的研究难点。参考文献[1]刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014,31(7):1921-1942.

[2]孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算

机应用研究,2012,29(8):2806-2810.

[3]彭伟.深度强化学习[M].北京:中国水利水电出版社,2018:71-74.[4]Salakhutdinov R,Hinton G.Semantic Hashing[J].International Journal of Approximate Reasoning,2009, 50(7):969-978.[5]李书清.卷积神经网络模型分析[J].无线互联科技, 2018,15(19):41-43.[6]李卫.深度学习在图像识别中的研究及应用[D].武汉:

武汉理工大学,2014:64.

[7]陈虹旭,李晓坤,郑永亮,袁烺,邵娜,杨磊,刘磊.基于深度学习的指纹识别方法研究[J].智能计算机与应用,2018, 8(03):64-69.[8]陈虹旭,李晓坤,郑永亮,等.基于深度学习的虹膜识别方法研究[J].智能计算机与应用,2018,8(2):108-115.[9]Hinton G E.Rectified Linear Units Improve Restricted Boltzmann Machines Vinod Nair[C].// International Conference on International Conference on Machine Learning,2010.[10]孙文辉.多生物特征图像深度学习建模与识别研究[D].天津:天津科技大学,2018:56.

相关文档
最新文档