第五课均值漂移分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
真实样本点数据
非参数密度估计
概率密度函数PDF的估计
真实样本点数据
非参数密度估计 ?
概率密度函数PDF的估计
真实样本点数据
参数 密度估计
假设 : 数据点是从一个隐含的PDF中采样得出
( x-μi )2 2 i 2
PDF(x) =
c e
i i
估计
概率密度函数PDF的估计
真实样本点数据
核密度估计
边缘检测
Example
边缘检测
Example
利用曲率进行平滑的重要性
图像分割
图像分割的概念
– 在对图像的研究和应用中,人们往往仅对图像中的某些部分感 兴趣,这些部分一般称为目标或前景。 – 为了辨识和分析目标,需要将有关区域分离提取出来,在此基 础上对目标进一步利用,如进行特征提取和测量。 – 图像分割就是指把图像分成各具特性的区域,并提取出感兴趣 目标的技术和过程。
简单模态结构
复杂模态结构
聚类真实案例
特征空间: 用L*u*v 来表示 初始化 窗口中心
寻找模态
修剪后的模态
最终聚类结果
聚类真实案例
L*u*v 3维空间
聚类真实案例
2维空间 (L*u)
聚类结果
吸引区域中不是所有的 轨迹都会达到相同的模态
间断保持平滑
特征空间 : 联合域 = 空间坐标 + 颜色空间
均值漂移法 (Mean Shift)
• 算法思想:对相似度概率密度函数或者后验概率密度函数 采用直接的连续估计。 • Mean shift :均值偏移方法。采用彩色直方图作为匹配特 征。Mean Shift 跟踪算法反复不断地把数据点朝向 MeanShift 矢量方向进行移动,最终收敛到某个概率密度 函数的极值点。在Mean Shift 跟踪算法中,相似度函数用 于刻画目标模板和候选区域所对应的两个核函数直方图的 相似性,采用的是Bhattacharyya 系数。因此,这种方法 将跟踪问题转化为Mean Shift 模式匹配问题。核函数是 Mean Shift 算法的核心, 可以通过尺度空间差的局部最 大化来选择核尺度,若采用高斯差分计算尺度空间差,则 得到高斯差分Mean Shift 算法。
直观说明
感兴趣区域 质心
Mean Shift 向量
目的 : 寻找样本分布最密集的区域
直观说明
感兴趣区域 质心
Mean Shift 向量
目的 : 寻找样本分布最密集的区域
直观说明
感兴趣区域 质心
Mean Shift 向量
目的 : 寻找样本分布最密集的区域
直观说明
感兴趣区域 质心
Mean Shift 向量
计算 Mean Shift
n x g i i c n c n i 1 P(x) ki gi n x n i 1 n i 1 gi i 1
另一个核密度估计 ! 简化的 Mean Shift 计算过程: • 计算 mean shift 向量
非参数密度估计
• 直方图方法:非参数概率密度估计的最简单 方法
– 1. 把x的每个分量分成k 个等间隔小窗, ( x∈Ed ,则形成kd 个小舱) – 2. 统计落入各个小舱内的样本数qi – 3. 相应小舱的概率密度为: qi /(NV ) ( N :样本 总数,V :小舱体积)
非参数密度估计
• 参数化估计:ML方法和Bayesian估计。假设概率 密度形式已知。 • 实际中概率密度形式往往未知。 • 实际中概率密度往往是多模的,即有多个局部极大 值。 • 实际中样本维数较高,且关于高维密度函数可以表 示成一些低维密度函数乘积的假设通常也不成立。 • 非参数密度估计方法:能处理任意的概率分布,而 不必假设密度函数的形式已知。
间断保持平滑
Flat regions induce the modes !
z
y
间断保持平滑
在空间和空间 范围中窗口 大小的作用
间断保持平滑
Example
间断保持平滑
Example
边缘检测
• 边缘存在于目标与背景、目标与目标、区域与区域 之间,是图像最基本的特征之一为人们描述或识别 目标以及解释图像提供了一个重要的特征参数。 • 它蕴含了图像丰富的内在信息(如方向、阶越性质 与形状等); • 纹理特征的重要信息源和形状特征的基础; • 图像分割、图像分类、图像配准和模式识别所依赖 的重要特征。 • 如果能成功地检测出图像的边缘,图像分析、图像 识别就会方便得多,精确度也会得到提高。
关于有限数据点x1…xn的函数
Examples:
c 1 x • Epanechnikov 核函数 K E (x) 0
• 单位均匀核函数 • Normal 核函数
2
数据点Biblioteka Baidu
x 1 otherwise
c x 1 KU (x) 0 otherwise
1 2 K N (x) c exp x 2
真正的形态分析
利用窗口来细分空间
分别进行Mean shift迭代
真正的形态分析
The blue data points were traversed by the windows towards the mode
真正的形态分析
An example
窗口轨迹代表最陡的上升方向
Mean Shift 算法的优势 & 缺点
作用: 在一组样本点中寻找一个体现在样本RN中 隐含的概率密度函数 (PDF)的方法 特征空间的概率密度函数PDF • 颜色空间 • 尺度空间 非参数 • 任何你想得到的特征空间 密度估计 •…
离散 PDF 表示法 样本点 非参数 密度 梯度 估计 (Mean Shift) PDF 分析
非参数密度估计
n x - xi 2 xi g h i 1 x m ( x) 2 n x x i g h i 1
•利用 m(x) 更新核窗口
g(x) k (x)
Mean Shift 模式检测
g(x) k (x)
计算 核密度 Mean 估计 Shift
梯度
n x g i i c n c n i 1 P(x) ki gi n x n i 1 n i 1 gi i 1
g(x) k (x)
Mean Shift聚类分析与应用
张旭光
目录
• Mean Shift 原理 • Mean Shift 介绍 • 密度估计方法 • Mean Shift算法推导 • Mean shift 算法特点 • 应用 • 聚类 • 间断保持平滑 • 边缘检测 • 图像分割 • 目标跟踪
Mean Shift 原理
优势 : 缺点 :
• 应用独立的工具
• 适用于实时数据分析 • 不需要在数据集群中事先假设 轮廓(例如椭圆形) • 能够处理任意特征空间 • 只需要选择一个参数 • 和K-Means 算法不同的是, h (窗口大小) 具有物理意义
• 窗口尺寸 (由带宽决定) 是 微不足道的
• 不适当的窗口大小 导致漠视被合并, 或者产生额外的“阴影”模式 使用自适应窗口大小
边缘检测
射线传播
在医学图像中准确区分各种物体
Vessel Detection by Mean Shift Based Ray Propagation, by Tek, Comaniciu, Williams
边缘检测
射线传播
使用位移数据来指导射线传播
间断平滑
位移矢量
Vessel Detection by Mean Shift Based Ray Propagation, by Tek, Comaniciu, Williams
Mean Shift 应用
聚类
聚类 : 在 吸引区域 中的所有数据点都有相同的模式
吸引区域 : 在这个区域里,所有的轨迹导致相同的模式
Mean Shift : A robust Approach Toward Feature Space Analysis, by Comaniciu, Meer
聚类合成案例
• 直方图的例子
非参数密度估计
• 非参数概率密度估计的核心思路:
P p x d x 一个向量x落在区域R中的概率P为:
R
因此,可以通过统计概率P来估计概率密度函数p(x)
非参数密度估计
假设 : 数据点是从一个隐含的PDF中采样得出
数据点密度 意味着 PDF 值!
概率密度函数PDF的估计
目的 : 寻找样本分布最密集的区域
直观说明
感兴趣区域 质心
Mean Shift 向量
目的 : 寻找样本分布最密集的区域
直观说明
感兴趣区域 质心
Mean Shift 向量
目的 : 寻找样本分布最密集的区域
直观说明
感兴趣区域 质心
目的 : 寻找样本分布最密集的区域
What is Mean Shift ?
边缘检测
射线传播
速度公式
Ray ( s, t ) Speed ( x, y ) N t
与轮廓正交
曲率
Speed ( x, y) f disp( x, y) ( x, y)
边缘检测
原始图像 沿红线处的灰度等级 平滑处理后的灰度图
位移矢量
位移矢量求导
Speed ( x, y) f disp( x, y) ( x, y)
What happens if we reach a saddle point ?
Perturb the mode position and check if we return back
Mean Shift 更新过程: • Find all modes using the Simple Mean Shift Procedure • Prune modes by perturbing them (find saddle points and plateaus) • Prune nearby – take highest mode in the window
核密度 估计
梯度
1 n P ( x) K ( x - x i ) n i 1
不估计 PDF ! 仅仅估计梯度
利用公式:
x - xi K (x - xi ) ck h
2
得:
窗口大小
n x g i i c n c n i 1 P(x) ki gi n x n i 1 n i 1 gi i 1
图像分割
片段 = 集群,或者集群的集群 算法: • 进行滤波(间断保持平滑) • 聚集比窗口大小更接近的集群
图像数据 (片段)
Mean Shift 向量
平滑处理
分割结果
Mean Shift : A robust Approach Toward Feature Space Analysis, by Comaniciu, Meer http://www.caip.rutgers.edu/~comanici
函数形式
1 n P ( x) K ( x - x i ) n i 1
关于有限数据点x1…xn的函数
数据点
实际使用形式:
K (x) c k ( xi )
i 1
d
or
K (x) ck x
与每个维度均相关
仅与向量长度相关
核密度估计
常用核函数
1 n P ( x) K ( x - x i ) n i 1
xs xr K ( x) C k s h h kr s r
意义 : 把图像看做在空间域和灰度域上的数据点
图像数据
Mean Shift 向量
平滑结果
Mean Shift : A robust Approach Toward Feature Space Analysis, by Comaniciu, Meer
Mean Shift 算法特点
• 自动收敛速度 – mean shift 向量大小仅仅取决于 向量本身
• 中心附近的最大值,该步骤小而精 自适应 梯度上升
• 在无穷步的迭代后算法才能保证收敛 无限收敛, (因此要设定一个下限)
• 对于单位均匀核函数 (
), 在有限次迭代后算法收敛
• Normal 核函数( ) 呈现出平滑的迭代轨迹,但是迭代 速度要慢于 Uniform 核函数 ( ).