开题报告--监控系统中的行人检测算法的实现
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在算法实现过程中,如何提取HOG特征是关键。计算HOG特征大致可以分为如下图3 所示的五个步骤。
图3HOG特征提取流程图
HOG特征具体计算过程 如下
假设用 表示一幅图像, 表示图像在像素点 处的灰度值。
(1)像素点 处的水平梯度 和垂直梯度
(2)Leabharlann Baidu算梯度强度 和梯度方向
=
=
(3)将每个ROI图像分割成若干个单元(cell),如Dalal等人提出的HOG特征是针对16×16 像素大小的block,每个block又平均分为4个cell,即每个cell的大小为8×8 像素。每个cell的特征是其内部8×8个像素的特征向量之和。
2)HOG特征
HOG特征是在被称为单元(cell)和块(block)的网格内进行密集计算得到的,其中有若干像素组成一个单元,若干相邻的单元组成一个块 。HOG特征描述了图像局部区域的梯度强度和梯度方向的分布情况,该分布情况能对局部对象外观和形状进行很好的表征,适合于行人检测中肢体的外形变化和自由移动。
目前,清华大学、浙江大学、上海交通大学计算机实验室以及中国科学院自动化研究所等是国内在行人检测研究上比较著名的高校或研究机构。而且,中国科学院自动化研究所的生物识别与安全技术研究中心开发的人脸识别系统已经投入使用(2008年北京奥运会和2010年上海世博会等重大活动)。浙江大学人工智能研究所采用了单目视觉的方法 ,中科院的李和平、胡占义等提出基于监督学习的异常检测和行为建模算法 。国外著名的智能监控系统有IBM的智能监控系统和以色列的IOImage
二、研究的基本内容,拟解决的主要问题:
监控系统的行人检测算法的实现主要包括运动目标检测和运动目标识别两个关键技术,在运动目标检测阶段可以采用帧差法,目标识别阶段可以采用基于HOG特征的行人识别。
1)帧差法
帧差法是指通过当前帧与背景图像相减得到的帧或连续的两帧图像的差值得到
中间帧运动对象的轮廓。通过该方法可以获得ROI(感兴趣区域)区域,进一步缩小检测区域。
3)OpenCV
监控系统中行人检测算法的实现使用OpenCV开发工具,OpenCV提供了大量的图像处理方面的常用函数,而且是免费开源的,支持多种操作系统。但是OpenCV并不支持所有的视频编码格式。
三、研究步骤、方法及措施:
研究开始时,首先要学习视频和行人的基本特性,了解OpenCV。接下来要查找文献,了解现在行人检测技术的发展,翻译文献,做出开题报告。然后确定算法流程,学习OpenCV工具。接着利用OpenCV工具实现行人检测算。最后,撰写论文,验收成果并答辩。
OpenCV是著名的开源的计算机视觉的函数库,由大量的C函数和C++类构成作为接口,实现了图像处理和计算机视觉方面的很多通用算法。而且OpenCV中的机器学习函数库实现了机器学习研究领域中比较常见、应用较为广泛的学习方法,包括了贝叶斯分类器、K邻近算法、支持向量机、决策树、Adaboost算法以及神经网路算法,基本上覆盖了机器学习领域中的主流算法。因此,使用OpenCV能够较灵活的实现行人检测。
运动目标检测是指通过比较视频图像中像素点的变化判断是否有运动物体,并通过图像处理技术将运动目标分割出来。运动目标的检测是运动目标识别的前提和保障,目前主要有光流法和帧差法(包括对称帧差法和背景减除法)。运动目标识别是对运动目标检测阶段获得的运动目标进行处理,识别出其是行人还是其他的物体。目前主要有基于运动的方法、基于模板匹配的方法、基于统计学习方法[3]等。
(4)计算每个单元格的方向直方图
假设将 在[ ]区间划分为 个均匀的区间(bin), 表示像素点在第 个梯度方向的幅度大小,则:
= 其中
那么,像素点 处的梯度特征就可以用一个N维向量 表示。
(5)归一化直方图的每一块(block)
假设每一个block内有 个cell,为了消除光照等影响,对block内的cell进行归一化:
开题报告--监控系统中的行人检测算法的实现
毕业设计(论文)开题报告
题目
监控系统中的行人检测算法的实现
学院
通信工程
专业
信息对抗技术
姓名
班级
学号
指导教师
一、综述本课题国内外研究动态,说明选题的依据和意义
科学技术的快速发展,在给人带来利益和便利的同时,也给人带来了安全隐患。如为保护某些具有较高的经济价值或技术优势的核心技术及机密而设立的禁区,交通工具的快速行驶等都会给人们带来安全隐患。因此,监控系统(特别是智能监控系统)越来越受到人们的重视。纵观各种影响社会安全稳定的事件,给人们带来严重损失的除不可控因素(地震、火山喷发等)外,主要是人的行为。因此,在监控系统中实现行人检测将可以避免巨大的人身、经济等损失,也成为了国内外研究的热点。
本文拟采用的流程如下图2所示。
图2行人检测流程图
视频输入是将通过摄像机或相机等硬件设备采集到的图像视频信息作为信号输入行人检测系统中。预处理包括图像编解码、图像处理、图像分割等,该阶段的目的是将感兴趣区域ROI分割出来,作为下一步HOG特征提取的输入信号。图像分割又分为静态的图像分割和运动的图像分割,前者适合使用背景减除帧差法,后者适合连续帧帧差法。HOG特征提取部分是将感兴趣区域重新编码,输出特征向量作为HOG特征,其主要思想是用梯度方向分布来表示行人形状和直立垂直特性。行人识别阶段是从其它目标中区分出行人,主要通过行人特定的特征匹配方法,或通过一般的分类方法,例如支持向量机、神经网络等来决定ROIs中是否包含行人。因支持向量机、神经网络等方法具有一定的难度,因此本文选用了基于HOG特征的行人识别。
公司推出的智能监控系统。另外,卡耐基梅隆大学开发的NabLab.10系统已经应用于汽车的检测系统。虽然国内的监控系统行业近些年发展较快,但是和国外相比仍有一定的差距。
监控系统中行人检测技术研究至今,比较成熟的算法主要有Leibe等人基于“局部特性的编码”进行的行人检测、Oliver等人利用边缘图像来对不同的形状模型进行匹配(ASM)和Dalal与Triggs提出的基于梯度直方图HOG+支持向量机SVM的行人检测算法等。而在所有的行人检测技术,基本都包括了运动目标检测和运动目标识别两个关键技术。
图3HOG特征提取流程图
HOG特征具体计算过程 如下
假设用 表示一幅图像, 表示图像在像素点 处的灰度值。
(1)像素点 处的水平梯度 和垂直梯度
(2)Leabharlann Baidu算梯度强度 和梯度方向
=
=
(3)将每个ROI图像分割成若干个单元(cell),如Dalal等人提出的HOG特征是针对16×16 像素大小的block,每个block又平均分为4个cell,即每个cell的大小为8×8 像素。每个cell的特征是其内部8×8个像素的特征向量之和。
2)HOG特征
HOG特征是在被称为单元(cell)和块(block)的网格内进行密集计算得到的,其中有若干像素组成一个单元,若干相邻的单元组成一个块 。HOG特征描述了图像局部区域的梯度强度和梯度方向的分布情况,该分布情况能对局部对象外观和形状进行很好的表征,适合于行人检测中肢体的外形变化和自由移动。
目前,清华大学、浙江大学、上海交通大学计算机实验室以及中国科学院自动化研究所等是国内在行人检测研究上比较著名的高校或研究机构。而且,中国科学院自动化研究所的生物识别与安全技术研究中心开发的人脸识别系统已经投入使用(2008年北京奥运会和2010年上海世博会等重大活动)。浙江大学人工智能研究所采用了单目视觉的方法 ,中科院的李和平、胡占义等提出基于监督学习的异常检测和行为建模算法 。国外著名的智能监控系统有IBM的智能监控系统和以色列的IOImage
二、研究的基本内容,拟解决的主要问题:
监控系统的行人检测算法的实现主要包括运动目标检测和运动目标识别两个关键技术,在运动目标检测阶段可以采用帧差法,目标识别阶段可以采用基于HOG特征的行人识别。
1)帧差法
帧差法是指通过当前帧与背景图像相减得到的帧或连续的两帧图像的差值得到
中间帧运动对象的轮廓。通过该方法可以获得ROI(感兴趣区域)区域,进一步缩小检测区域。
3)OpenCV
监控系统中行人检测算法的实现使用OpenCV开发工具,OpenCV提供了大量的图像处理方面的常用函数,而且是免费开源的,支持多种操作系统。但是OpenCV并不支持所有的视频编码格式。
三、研究步骤、方法及措施:
研究开始时,首先要学习视频和行人的基本特性,了解OpenCV。接下来要查找文献,了解现在行人检测技术的发展,翻译文献,做出开题报告。然后确定算法流程,学习OpenCV工具。接着利用OpenCV工具实现行人检测算。最后,撰写论文,验收成果并答辩。
OpenCV是著名的开源的计算机视觉的函数库,由大量的C函数和C++类构成作为接口,实现了图像处理和计算机视觉方面的很多通用算法。而且OpenCV中的机器学习函数库实现了机器学习研究领域中比较常见、应用较为广泛的学习方法,包括了贝叶斯分类器、K邻近算法、支持向量机、决策树、Adaboost算法以及神经网路算法,基本上覆盖了机器学习领域中的主流算法。因此,使用OpenCV能够较灵活的实现行人检测。
运动目标检测是指通过比较视频图像中像素点的变化判断是否有运动物体,并通过图像处理技术将运动目标分割出来。运动目标的检测是运动目标识别的前提和保障,目前主要有光流法和帧差法(包括对称帧差法和背景减除法)。运动目标识别是对运动目标检测阶段获得的运动目标进行处理,识别出其是行人还是其他的物体。目前主要有基于运动的方法、基于模板匹配的方法、基于统计学习方法[3]等。
(4)计算每个单元格的方向直方图
假设将 在[ ]区间划分为 个均匀的区间(bin), 表示像素点在第 个梯度方向的幅度大小,则:
= 其中
那么,像素点 处的梯度特征就可以用一个N维向量 表示。
(5)归一化直方图的每一块(block)
假设每一个block内有 个cell,为了消除光照等影响,对block内的cell进行归一化:
开题报告--监控系统中的行人检测算法的实现
毕业设计(论文)开题报告
题目
监控系统中的行人检测算法的实现
学院
通信工程
专业
信息对抗技术
姓名
班级
学号
指导教师
一、综述本课题国内外研究动态,说明选题的依据和意义
科学技术的快速发展,在给人带来利益和便利的同时,也给人带来了安全隐患。如为保护某些具有较高的经济价值或技术优势的核心技术及机密而设立的禁区,交通工具的快速行驶等都会给人们带来安全隐患。因此,监控系统(特别是智能监控系统)越来越受到人们的重视。纵观各种影响社会安全稳定的事件,给人们带来严重损失的除不可控因素(地震、火山喷发等)外,主要是人的行为。因此,在监控系统中实现行人检测将可以避免巨大的人身、经济等损失,也成为了国内外研究的热点。
本文拟采用的流程如下图2所示。
图2行人检测流程图
视频输入是将通过摄像机或相机等硬件设备采集到的图像视频信息作为信号输入行人检测系统中。预处理包括图像编解码、图像处理、图像分割等,该阶段的目的是将感兴趣区域ROI分割出来,作为下一步HOG特征提取的输入信号。图像分割又分为静态的图像分割和运动的图像分割,前者适合使用背景减除帧差法,后者适合连续帧帧差法。HOG特征提取部分是将感兴趣区域重新编码,输出特征向量作为HOG特征,其主要思想是用梯度方向分布来表示行人形状和直立垂直特性。行人识别阶段是从其它目标中区分出行人,主要通过行人特定的特征匹配方法,或通过一般的分类方法,例如支持向量机、神经网络等来决定ROIs中是否包含行人。因支持向量机、神经网络等方法具有一定的难度,因此本文选用了基于HOG特征的行人识别。
公司推出的智能监控系统。另外,卡耐基梅隆大学开发的NabLab.10系统已经应用于汽车的检测系统。虽然国内的监控系统行业近些年发展较快,但是和国外相比仍有一定的差距。
监控系统中行人检测技术研究至今,比较成熟的算法主要有Leibe等人基于“局部特性的编码”进行的行人检测、Oliver等人利用边缘图像来对不同的形状模型进行匹配(ASM)和Dalal与Triggs提出的基于梯度直方图HOG+支持向量机SVM的行人检测算法等。而在所有的行人检测技术,基本都包括了运动目标检测和运动目标识别两个关键技术。