基于Caffe深度学习的图像识别
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主要成果(二):训练VGGNet模型
VGGNet:16~19层深的深度卷积神经网络
训练过程
loss
随着迭代次数变化损失函数 loss的变化 采用SSD网络,重点研究参数配置(Python 完成)
训练效果评估
损失函数loss的变化
L( z, c, l , g )
25
20
1 (Lconf ( z, c) Lloc ( z, l , g ))15 N
10
5
0 0 20 40 60 80 100 120 140 160
迭代次数
主要成果(三):实现目标识别和位置计算
目标识别核心步骤:
1.采用Python代码运行Caffe网络实现目标检测
2.对检测结果分析并计算距离和位置
检测效果评估
指标
目标识别准确度 位置计算精度 单次检测时间
数值
70%以上 2cm(1.5米以内) 520ms
4X Tesla K80(3.7)
569.1
加速效果
指标 CPU
CPU-only
109.93 0 200 400 600 800 1000 1200 1400
每秒训练次数
两台设备目标检测性能比较
联想PC机 Intel酷睿i74500U Jetson TX1 ARM A57
运行内存
GPU GPU计算能力 检测单次目标平均时间 实时检测的最高帧率
题 目:基于GPU的智能图像识别 操作流程及效果
图像识别的 广泛应用
研究背景
ห้องสมุดไป่ตู้
深度学习的 发展
GPU通用计算 的普及
更准确、更高效、更快速 的图像识别算法
研究内容概述
深度学习框架 Caffe 基于GPU平台
模型训练
目标检测
位置计算
GPU加速
加速效果验证
样本图片
制作VOC数据集
训练VGGNet模型
主要工作流程
目标检测
GPU加速和验证
计算距离、位置
可视化输出
主要成果(一):制作VOC数据集
VOC:一种专用于图像识别和分类的标准化的数据格式 制作VOC数据集步骤: 1.对原始照片统一规则命名、统一大小(shell脚本完成) 2.使用labeImg工具标记目标区域,生成XML标签 3.分割数据集,主要分训练文件和测试文件(Python完成)
4G
GeForce GT 730M 3.0 865ms 2.7
4G
NVIDIA MaxweⅡ 5.3 523ms 4.5
展望
增加样本数量和迭代次数,改进算法,实现更高的精度
研究多方面的GPU加速的方案,实现更快的计算速度
主要影响因素
训练样本数量和迭代次数 GPU 计算能力
主要成果(四):GPU加速效果分析和验证
GPU有多个处理器
并行计算
图像批处理
并行计算
并行计算
加速
GPU型号(计算能力)
4X Tesla P100(6.0)
不同型号(计算能力)GPU在训练中的表现
1230.63
4X Tesla M40(5.2)
849.03