基于图像分割以及原目标检测的视觉跟踪
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P ( d )= ∑ _ P ( z ^ l d i ) P ( x j I z ) .
,
( 1 )
其中 P ( l d ) 为主题 在分割块 d 中出现的概率 ;
P ( , I z ) 为 视觉 词 汇 x j 在 特 定 主 题 中 出现 的概
率. P L S A模型图表示如图 2所示 :
一
,
Fra Baidu bibliotek
Ⅳ) 中包含某 个视 觉词 汇 的个数 ; 假设存 在 k个潜
算法是一种融合颜 色和纹理信息的分割算法 , 用于 分割 出不 规则 、 有 意义 的 区域 ; 分 水 岭变换 对梯 度 图 像进行分割时, 会出现大量的分割区域 , 用于小尺度 分割. 根据 它们 各 自的 特 点 , 分 别 调 整分 割 参 数 , 以 图1 为例 , 设定 N c u t 算法 的图像大小为 1 6 0像素 , 分割块数是 2 0 ; J S E G算法 的量化参数为 2 5 5 , 区域 增长 阈值 取为 0 . 1 4 0 . 从图1 中可以看出, 每种分割方法依赖的图像特 征不同, 分割结果各有千秋 , 但都不完美 , 但是我们认 为把这 3种 分 割结果 结 合起 来 , 共 同考 虑 , 将 会 提 取
第 6期
杨欣 , 周延 培 , 张燕 , 等: 基于 图像分割 以及原 目标 检测的视觉跟踪
4 9 7
标. 该框架避免了因某一步分割结果发生错误而导 致整个原 目标检测结果失败的现象. 1 . 1 多种分 割 算法 的选 择
在 本文 方法 中 , 原 目标是 通过 分割 来获 得 的. 但 是 获取 精确 的分 割 对 象是 很 困难 的 , 图 1中第 2列 是 图像 在不 同的分 割方 法下 的分 割结 果.
概率 潜在 语义 分析 , 该 模 型原 本 用 于 文 本 分 类 和信 息检 索 , 近几年 来 , 它 被 广 泛 应 用 于 机器 视 觉 领 域 . 它 的 目的是对分 割 区域进 行 分 析 来 发现 其 中 的“ 主
算法 ( K u l l b a c k— L e i b l e r ) 叫 进行 加权 , 得到亮度不 致 的分割块 , 如图1 . 然 后从 这 些 分 割块 中筛选 出
的候选 区域 .
1 . 2 P L S A 模型
P L S A( p r o b a b i l i t i s t i c l a t e n t s e m a n t i c a n a l y s i s ) , 即
图2 P LS A ̄型 图
接着用 E M算法计算模型的参数. E M算法是使
区域至少有一个是正确的, 我们 的每一步都是弱分 类, 虽然如此 , 数据 的叠加和相互依赖可 以不断增强 原目 标的位置信息和类别信息. 在以上 3 种分割方法下 , 可以分别获得这 3 种分 割方法 的分 割结 果 D i =( d l , d 2 , …, d M ) ( i =1 , 2 , 3 ) . 接下来 , 本文将利用 P L S A模型来提取每种分割方法
d } , 同时 由 k—m e a n s 算 法 聚类 得 到 M 个 视 觉 词 汇 { l , 2 , …, 村 ) . n ( d f , f ) 表 示某个 分割块 d ( ∈I ,
…
文献[ 5 ] 对 目前 比较流行的分割算法进行了比 较, 综合 各 种 数据 , 这里 选 择 了归 一化 分 割算 法 ( n o r m M i z e d c u t s , N c u t ) J , J S E G分割算法 和分水 岭分割算法这 3 种分割算法. N c u t 算法是一种基 于 全局 最优 的分 割算 法 , 它 的 目的在 于 提 取 图像 的 总 体印象 , 并不关注局部特征或它们在 图像数据中的 致性. 这 里 选 择 这个 方 法 进 行 大 尺 度 分 割 ; J S E G
我们选择 C A V I A R 数据库 的 1 8 0 0张图像来生成 字典 , 得 到 了大概 2 0 0个 视觉 词汇 , 有 眼睛 , 鼻子 , 嘴 巴, 头发 , 身体 , 手, 腿等. 这些视觉词汇都将被用在 实验 中. 1 . 2 . 2 P L S A模型计算 假设 1幅图像 被分 为 Ⅳ个分割块 { d 。 , d : , …,
检测 误 差 , 本 文 选 择 提 取 图像 的 S I F T( q u i c k s c a l e i n v a r i a n t f e a t u r e t r a n s f o r m) 特征 , 然后 用 k —me a n s 算 法对 提取 的 S I F T特征进 行 聚类 , 每个 聚类 中心 为一 个视 觉单 词 , 结合 B O W 进行 直 方 图视觉 词 汇 描 述.
出原 目标 , 该 方法依 据 文献 [ 8 ] 提 出 的分割 一 识别 一 再 分割 的过程 , 它 的突 出优点是不 需要假 设分 割 出的
在 主题 ( z , , …, ) , 那 么每 个分割 块 中每 个视 觉词
汇的出现都有一个潜在的主题变量 ( k = 1 , …, 后 ) 与 之相关联. 假设联合概率为 P ( , d i , ) , 对主题进行 边缘求和确定出条件概率 P ( d ) :
用极 大 似然 原则来 估计 潜 在变量 模 型参数 的标 准过 程. 它 可用 来估 算 原 目标 的主题 分 布. 这里 采 用 E M
算法获得最大条件概率 P ( I d i , 最后根据分割块与主题的对应程度 , 把每种分
割方 法 的分 割块 进 行 分 类 , 并对每个分 割块用 K L
,
( 1 )
其中 P ( l d ) 为主题 在分割块 d 中出现的概率 ;
P ( , I z ) 为 视觉 词 汇 x j 在 特 定 主 题 中 出现 的概
率. P L S A模型图表示如图 2所示 :
一
,
Fra Baidu bibliotek
Ⅳ) 中包含某 个视 觉词 汇 的个数 ; 假设存 在 k个潜
算法是一种融合颜 色和纹理信息的分割算法 , 用于 分割 出不 规则 、 有 意义 的 区域 ; 分 水 岭变换 对梯 度 图 像进行分割时, 会出现大量的分割区域 , 用于小尺度 分割. 根据 它们 各 自的 特 点 , 分 别 调 整分 割 参 数 , 以 图1 为例 , 设定 N c u t 算法 的图像大小为 1 6 0像素 , 分割块数是 2 0 ; J S E G算法 的量化参数为 2 5 5 , 区域 增长 阈值 取为 0 . 1 4 0 . 从图1 中可以看出, 每种分割方法依赖的图像特 征不同, 分割结果各有千秋 , 但都不完美 , 但是我们认 为把这 3种 分 割结果 结 合起 来 , 共 同考 虑 , 将 会 提 取
第 6期
杨欣 , 周延 培 , 张燕 , 等: 基于 图像分割 以及原 目标 检测的视觉跟踪
4 9 7
标. 该框架避免了因某一步分割结果发生错误而导 致整个原 目标检测结果失败的现象. 1 . 1 多种分 割 算法 的选 择
在 本文 方法 中 , 原 目标是 通过 分割 来获 得 的. 但 是 获取 精确 的分 割 对 象是 很 困难 的 , 图 1中第 2列 是 图像 在不 同的分 割方 法下 的分 割结 果.
概率 潜在 语义 分析 , 该 模 型原 本 用 于 文 本 分 类 和信 息检 索 , 近几年 来 , 它 被 广 泛 应 用 于 机器 视 觉 领 域 . 它 的 目的是对分 割 区域进 行 分 析 来 发现 其 中 的“ 主
算法 ( K u l l b a c k— L e i b l e r ) 叫 进行 加权 , 得到亮度不 致 的分割块 , 如图1 . 然 后从 这 些 分 割块 中筛选 出
的候选 区域 .
1 . 2 P L S A 模型
P L S A( p r o b a b i l i t i s t i c l a t e n t s e m a n t i c a n a l y s i s ) , 即
图2 P LS A ̄型 图
接着用 E M算法计算模型的参数. E M算法是使
区域至少有一个是正确的, 我们 的每一步都是弱分 类, 虽然如此 , 数据 的叠加和相互依赖可 以不断增强 原目 标的位置信息和类别信息. 在以上 3 种分割方法下 , 可以分别获得这 3 种分 割方法 的分 割结 果 D i =( d l , d 2 , …, d M ) ( i =1 , 2 , 3 ) . 接下来 , 本文将利用 P L S A模型来提取每种分割方法
d } , 同时 由 k—m e a n s 算 法 聚类 得 到 M 个 视 觉 词 汇 { l , 2 , …, 村 ) . n ( d f , f ) 表 示某个 分割块 d ( ∈I ,
…
文献[ 5 ] 对 目前 比较流行的分割算法进行了比 较, 综合 各 种 数据 , 这里 选 择 了归 一化 分 割算 法 ( n o r m M i z e d c u t s , N c u t ) J , J S E G分割算法 和分水 岭分割算法这 3 种分割算法. N c u t 算法是一种基 于 全局 最优 的分 割算 法 , 它 的 目的在 于 提 取 图像 的 总 体印象 , 并不关注局部特征或它们在 图像数据中的 致性. 这 里 选 择 这个 方 法 进 行 大 尺 度 分 割 ; J S E G
我们选择 C A V I A R 数据库 的 1 8 0 0张图像来生成 字典 , 得 到 了大概 2 0 0个 视觉 词汇 , 有 眼睛 , 鼻子 , 嘴 巴, 头发 , 身体 , 手, 腿等. 这些视觉词汇都将被用在 实验 中. 1 . 2 . 2 P L S A模型计算 假设 1幅图像 被分 为 Ⅳ个分割块 { d 。 , d : , …,
检测 误 差 , 本 文 选 择 提 取 图像 的 S I F T( q u i c k s c a l e i n v a r i a n t f e a t u r e t r a n s f o r m) 特征 , 然后 用 k —me a n s 算 法对 提取 的 S I F T特征进 行 聚类 , 每个 聚类 中心 为一 个视 觉单 词 , 结合 B O W 进行 直 方 图视觉 词 汇 描 述.
出原 目标 , 该 方法依 据 文献 [ 8 ] 提 出 的分割 一 识别 一 再 分割 的过程 , 它 的突 出优点是不 需要假 设分 割 出的
在 主题 ( z , , …, ) , 那 么每 个分割 块 中每 个视 觉词
汇的出现都有一个潜在的主题变量 ( k = 1 , …, 后 ) 与 之相关联. 假设联合概率为 P ( , d i , ) , 对主题进行 边缘求和确定出条件概率 P ( d ) :
用极 大 似然 原则来 估计 潜 在变量 模 型参数 的标 准过 程. 它 可用 来估 算 原 目标 的主题 分 布. 这里 采 用 E M
算法获得最大条件概率 P ( I d i , 最后根据分割块与主题的对应程度 , 把每种分
割方 法 的分 割块 进 行 分 类 , 并对每个分 割块用 K L