【CN110070050A】目标检测方法及系统【专利】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910332633.5
(22)申请日 2019.04.24
(71)申请人 厦门美图之家科技有限公司
地址 361000 福建省厦门市火炬高新区软
件园华讯楼C区B1F-089
(72)发明人 张毓峰 余清洲 苏晋展 许清泉
张伟
(74)专利代理机构 北京超凡宏宇专利代理事务
所(特殊普通合伙) 11463
代理人 杨奇松
(51)Int.Cl.
G06K 9/00(2006.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
目标检测方法及系统
(57)摘要
本公开提供一种目标检测方法及系统,涉及
检测技术领域。
本公开中的目标检测方法包括:
获得针对待检测目标进行拍摄得到的实时视频
流,对实时视频流中每隔设定帧的图像进行检
测,得到待检测目标的最新位置,将当前帧图像
转换为灰度图之后,对灰度图进行图像分析,计
算待检测目标相较于上一帧图像位置移动的像
素点数量,并使用光流金字塔计算当前帧图像转
换得到的灰度图和上一帧图像转换得到的灰度
图中待检测目标位置移动的每个像素点的位移,
从而根据计算得到的待检测目标位置移动的每
个像素点的位移分析得到待检测目标在当前帧
图像的移动偏移,基于移动偏移对卷积神经网络
的检测规则进行修正,
提高了目标检测效率。
权利要求书4页 说明书13页 附图3页CN 110070050 A 2019.07.30
C N 110070050
A
1.一种目标检测方法,其特征在于,包括:
获得针对待检测目标进行拍摄得到的实时视频流;
使用预存的卷积神经网络对所述实时视频流中每隔设定帧的图像进行检测,得到待检测目标的最新位置;
将当前帧图像转换为灰度图,其中,所述当前帧图像为所述实时视频流中当前被所述卷积神经网络进行检测以确定所述待检测目标的最新位置的图像;
对所述灰度图进行图像分析,计算所述待检测目标相较于上一帧图像位置移动的像素点数量;
使用光流金字塔计算所述当前帧图像转换得到的灰度图和上一帧图像转换得到的灰度图中所述待检测目标位置移动的每个像素点的位移;
根据计算得到的所述待检测目标位置移动的每个像素点的位移分析得到所述待检测目标在所述当前帧图像的移动偏移,基于所述移动偏移对所述卷积神经网络的检测规则进行修正。
2.根据权利要求1所述的目标检测方法,其特征在于,所述方法还包括构建所述卷积神经网络的步骤,该步骤包括:
将设定尺寸的三通道图像作为输入,堆叠多个Block结构,得到待训练的网络结构;其中,每个所述Block结构包括卷积运算Conv、批归一化BN、比例缩放和位移Scale、线性整流函数Relu和深度卷积Deepwise操作;
采用随机梯度下降法,基于最小化损失函数训练所述网络结构,得到检测模型;
去掉所述检测模型中的批归一化BN、比例缩放和位移Scale操作之后,将检测模型进行合并移植,得到用以进行位置检测的卷积神经网络。
3.根据权利要求2所述的目标检测方法,其特征在于,堆叠的多个Block结构为16个;每个所述Block结构至少由卷积运算Conv、批归一化BN、比例缩放和位移Scale、线性整流函数Relu、深度卷积Deepwise、批归一化BN、比例缩放和位移Scale、线性整流函数Relu操作依次组成;
16个所述Block的卷积的通道数分别为16、16、32、32、96、96、96、96、128、128、128、128、160、160、160、160、160、160、160、160、160、160、160、160、320、320、128、160、96、128、96、128,所述深度卷积Deepwise操作的分组数等于所述深度卷积Deepwise操作的通道数;
在Block13至Block16分别接两个卷积层,该两个卷积层包括用来得到目标位置的目标位置卷积层和用来得到目标类别的目标类别卷积层,其中,目标位置卷积层通道上的每个像素点的值对应一个预先定义好的位置信息,通过像素点对应通道的输出的回归值用预测框回归出目标位置;目标类别卷积层通道上的每个像素点的值代表该目标像素点对应位置的类别概率,不同通道代表不同的类别。
4.根据权利要求3所述的目标检测方法,其特征在于,损失函数根据以下公式计算得
到:
其中,L loc (x ,l ,g)为位置损失,L conf (x ,c)为分类损失,α=0.8,位置损失L loc (x ,l ,g)根据以下公式计算得到:
权 利 要 求 书1/4页2CN 110070050 A。