meanshift算法简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
M h ( x)
i 1
n
G(
n
xi x ) w( xi ) ( xi x) h G( xi x ) w( xi ) h
i 1
这里可以看到若W(xi)=1, G(x)=1时, 就转化成了meanshift基本形式。
多维空间下的无参密度估计(以下是证明Meanshift向量Mh(x)总是向 密度增加的方向漂移): 在d维欧式空间X中,x表示该空间中的一个点, 的核函数, f(x)的概率密度函数为:
我们使用Bhattacharyya系数作为相似性函数
其值在0到1之间。 的值越大,表示两个模型越相似,在 当前帧中不同的候选区域计算得到的候选模型,使得 最 大候选区域即是在本帧中目标的位置。
目标定位
为使 最大,将当前帧的目标中心先定位为前一帧中目标中的位 置 ,从这一点开始寻找最优匹配的目标,其中心为y。先计算目 标候选模型 ,对 在 处进行泰勒级数展开, Bhattachcyarya系数可近似为:
• 上面的步骤也就是不断的沿着概率密度的 梯度方向移动,同时步长不仅与梯度的大小 有关,也与该点的概率密度有关,在密度大的 地方,更接近我们要找的概率密度的峰值 ,Mean Shift算法使得移动的步长小一些;相 反,在密度小的地方,移动的步长就大一些.在 满足一定条件下,Mean Shift算法一定会漂移 到该点附近的峰值。
q
q1 , , qm
1
p y
p1 y , , pm y
T
y
1
p y
m p y q f y cos y pu y qu p y q u 1
相似性函数描述目标模型和候选模型之间的相似程度,在理想 情况下两个模型的概率分布是完全一样的。
对目标进行跟踪时,可以把图片想象成一张概率密度 图。图像输入后是一个目标图像的直方图(也可以认为是 目标图像),还一个输入是当前图像就是你要跟踪的全图, 输出大小与全图一样大,它上像素点表征着一种概率,就 是全图上这个点是目标图像一部分的概率。如果这个点越 亮,就说明这个点属于物体的概率越大。现在我们明白了 这原来是一张概率图了。当用meanshift跟踪时,输入的原 来是这样一幅图像,如此可以实现对目标的跟踪。 关键:反向投影 如果一幅图像的区域中显示 的是一种结构纹理或者一个独特的物体,那么这个区域的 直方图可以看作一个概率函数,给出的是某个像素属于该 纹理或物体的概率。所谓反向投影就是首先计算某一特征 的直方图模型,然后使用模型去寻找测试图像中存在的该 特征。
^
表示该空间中
f ( x)
i 1
n
K(
xi x ) w( xi ) h
n
hd
i 1
w( xi )
2 K ( X ) k (|| x ||) 核函数K(X)的剖面函数为k(x),且
( x) g x k K(x)的负倒数为g(x),即
其对应的核函数为 G ( X ) g (|| x ||)
Gh( x x) H i
1/ 2
G(H 1/ 2 ( xi x))
G(x)是一个单位核函数,H是一个正定dxd的对称矩阵,又称带宽矩阵。 w(xi)是采样点xi的权重
2 通常H取为正比于单位矩阵的对角阵即 H h E ; h为核函数的带宽,为一确定在系数,常用的单位核函数G(x) 如下: 分别是单位均匀核函数 和单位高斯核函数;前面公式可写为:
2
上式对x求导,得到概率密度函数的梯度函数 ▽fK(x):
2
▽ f K ( x)
i 1
n
( xi x )G (
n
xi x h w( xi )
2
) w( xi )
h d 2
i 1
2 2 h
xi x G( ) w( xi ) h i 2 n hd w( xi ) i 1
由上式可得:
M h ( x)
1 2 Δ f K ( x) h ^ 2 f G ( x)
^
该式表明用核函数G在x点得到的Meanshift向量正比于归一 化的用核函数K估计的概率密度梯度(归一化因子即分母为用 核函数G估计的x点概率密度)。 数据最密集的地方,对应于概率密度最大的地方。对概率 密度求梯度,梯度的方向就是概率密度增加的方向,从而 也就是向最密集的方向漂移。
下面我们看一下mean shift算法的步骤
mh x
给定一个初始点x,核函数G(x), 容许误差 ,Mean Shift算法 循环的执行下面三步,直至结束条件满足, •计算 mh ( x) x . •把 mh ( x) 赋给 •如果 mh ( x) x , 结束循环;若不然,循环执行
候选模型的描述
运动目标在第二帧及以后的每帧中可能包含目标的区域称为候 选区域,其中心坐标为y,也是核函数的中心坐标。该区域中的 象素用 表示。对候选区域的描述我们成为目标候 选模型,候选模型的特征值 的概率密度为:
p y pu y u 1..m
p
u 1
m
u
1
其中
Meanshift算法的概述及其应用
直观描述
感兴趣区域 质心
目的:找出最密集的区域 完全相同的桌球分布
Mean Shift 矢量
Meanshift介绍
Meanshift算法是Fukunaga于1975年提出的。直到 1995年, Yizong Cheng针对离x越近的采样点对x周围的 统计特性越有效,定义了一族核函数。同时他认为所有的 样本点重要性不同,设定了一个权重系数,扩大了 Meanshift的使用范围。其思想概括起来就是:利用概率 密度的梯度爬升来寻找局部最优。输入一个在图像的范围, 然后Meanshift算法迭代(朝着重心迭代)直到满足要求 为止。 Meanshift的基本形式为: ( x) 1 ( x x)
其中:
类似于核函数密度估计,不过多了一个权值wi。使 式最大, 就是要求 式最大,可以计算 的Mean Shift向量,这样 我们就可以得到候选区域中心 移向真实目标区域y的向量:
=
其中 值得注意的是,一般在一帧中找到目标的位置,需要Mean Shift算法从开始若干次迭代才能得到。
算法过程
(1).初始化搜索窗 (2).计算搜索窗的颜色概率分布(反向投影) (3).运行meanshift算法,获得搜索窗新的大小和位置。
对在初始帧图像中目标区域内所有的象素点,计算每个 特征值的概率,我们称为目标模型的描述。
目标区域的中心为 ,假设其中有n个象素用 特征值的个数为m个 ,则目标模型的特征值 度估计为:
q qu u 1..m
表示, 的概率密
m
q
u 1
u
1
为核函数的轮廓函数,由于遮挡或者背景的影响,目 标模型中心附近的象素比外物象素更可靠, 对中心的象素 给一个大的权值,而远离中心的象素一个小的权值 总得作用是判断目标区域中象素的值是否属于 第u个特征值。b(xi)是灰度值索引函数。属于该特征则值为1, 否则为0(pdf)。 C是一个标准化的常量系数,使得 于是我们得到了基于图像灰度特征的颜色直方图。
4
M h ( x)
1 n
i 1
n
( xi x)
平均的偏移量会指向样本点最密的方向,也 就是概率密度函数梯度方向,引入核函数和 权重系数后得到:
M h ( x ) i 1
n
Gh ( xi x ) w( x ) ( xi x ) i n
i 1
Gh ( xi x ) w( xi )
Mh
k
xiSh
i
S h 是一个半径为h的高维球区域,k表示n个样本点有k个落 入Sh中。
核函数说明
对在d维欧式空间中,x表示该空间中的一个点,
用一列向量x表示,K(x)表示该空间的核函数,其定义
为:
K ( X ) cdk (|| x ||) 2
这里:K(X) 称核函数,k(x)为非增的分段连续剖面 函数,标准化常量c,d,为正,且k(x)积分为1。
n
i 1
n
x x ( xi x)G i h
i 1
n
w( x ) i ^ 2 f ( x) M ( x) G h 2 h x x G( i ) w( xi ) h
2
以G(x)为核函数的概率密度函数
用核函数G在x点的Meanshift向量
是标准化常量
相似性函数的比较
模板区域: 候选区域: 相似性函数:
q q1 , , qm p y p1 y , , pm y
f y f p y , q ?
q
Bhattacharyya 系数
Baidu Nhomakorabea
均值漂移在目标跟踪中应用
1:目标模型叙述
2:候选目标叙述 3: 相似型函数比较 4:目标定位 5:整个算法流程
目标模型的描述
在起始帧,通过鼠标确定一个包含所有目标特征的矩形, 称为被跟踪目标的目标区域,这个目标区域也是核函数作 用的区域,区域的大小等于核函数的带宽。 对目标区域进行描述,常用的方法是按照直方图的方式 将图像像素的值域等分成k个区间,每个区间按照值域的大 小对应一个特征值。然后求出图像的像素值取每个特征值 的概率。
(4).在下一帧视频图像中重新搜索窗的大小和位置, 进行相似度匹配, 再跳转到(2)继续进行,直 到 mh ( x) x 。
Meanshift优缺点: 优点 1.算法计算量不大,在目标区域已知的情况下完全可以做到实时 跟踪 2.采用核函数直方图模型,对边缘遮挡、目标旋转、变形和背景 运动不敏感 缺点: 1.缺乏必要的模板更新 2.跟踪过程中由于窗口宽度大小保持不变,当目标尺度有所变化 时,跟踪就会失败 3.当目标速度较快时,跟踪效果不好 4.直方图特征在目标颜色特征描述方面略显匮乏,缺少空间信息 改进和调整 1.引入一定的目标位置变化的预测机制,进一步减少meanShift跟 踪的搜索时间,降低计算量 2.可以采用一定的方式来增加用于目标匹配的“特征” 3.将传统meanShift算法中的核函数固定带宽改为动态带宽