感知哈希综述 hashing

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1406
电 子 学 报
2008 年
感 感觉 知知
觉 认知
表 1 多媒体认知阶段
感 感觉内容 知 内 容 知觉内容
视听特征 模式特征
语义内容
语义特征
人类视觉系统 心理声学模型
模式识别
主观分析
及到多媒体的内容特征(属性) 研究与处理 (如某幅图像 的边缘 、轮廓 、纹理及其变换域系数间的关系等特征的 提取与操作) ,都是在感觉层面上进行的.
作(content2preserved operation) 鲁棒 , 而对内容篡改敏感 的多媒体认证方法[2] .
因此 ,必须根据多媒体区别于一般计算机数据的特 性 ,研究满足多媒体内容压缩性 、感知鲁棒性的多媒体 单向摘要算法与技术. 感知哈希 ( Perceptual Hashing) 逐 渐成为多媒体信号处理与多媒体安全及其相关领域的 研究热点.
第 7 期
牛夏牧 :感知哈希综述
1407
同的感知哈希值. (2) 感知鲁棒性 ( Robustness) : 设多媒体内容保持操作为 Ocp (·) , x’= Ocp ( x) , hx’
= PH( x’) . 则 Π x , x′∈M ; B = ( x , x′) : disp ( x , x′) < Tp 且 dis ( hx , hx′) <τ (3) ] P( B) ≈1 即 ,经过内容保持操作 , 感知内容相同的不同多媒
难 ,或者得不到 x 的有效信息.
(4) 随机性 ( Randomicity) :
H( hx) = n
(5)
其中 , n 为 hx 的比特数. 感知哈希值的熵等于其数据长
度 ,即 ,理想的感知哈希值应当是完全随机的.
(5) 传递性 ( Transitivity) :
dis ( hx , hy) < τ, dis ( hy , hz) < τ
质.
3 感知哈希函数的性质
设 x , y , z ∈M , hx , hy , hz ∈HP , hx = PH( x) , hy = PH ( y) , hz = PH( z) . dis (·, ·) 为 M 中的距离 , 而 disp ( ·, ·) 为 M 中的感知距离 ,表示两元素间的感知差异. 当元素 间的感知距离大于感知阈值 Tp 时 , 则判定两元素的感 知内容不同. P(·) 表示事件发生的概率 ,τ为判定事件 发生的判决阈值.
由多媒体数据集到多媒体感知摘要集的一类单向映射 ,
将具有相同感知内容的多媒体数字表示唯一的映射为
一段数字摘要 ,并满足感知安全性要求.
记感知哈希函数为 PH , 如式 (1) 所示 , 生成的数字
摘要称为感知哈希值wenku.baidu.com 其中 Ph 为感知数字摘要的集合.
PH∶M →HP
(1)
根据上述定义 , 感知哈希函数有着一些特殊的性
(4) 认知 ,则是在感知的基础上 ,结合记忆 、想象和 思维等信息加工过程 ,将外界刺激转换成内在的心理活 动 ,并做出反应进而支配人的行为. 是人认知某媒体中 知觉内容所表现 (或暗示) 出来的行为含义. 认知内容可 以用语义特征来描述.
根据上面的分析 ,可将各阶段所获得的信息处理结 果作如下定义 :
体数字表示仍映射为同一哈希值. (3) 单向性 (One2wayness) : H( x) 为 x 的熵. H( x| hx) 为已知 hx 时 , x 的条件
熵 ,则
Π x , hx = PH( x) ] H( x| hx) = H( x)
(4)
即 ,给定 hx 和 PH ( ·) , 根据 PH ( x) = hx 计算 x 很
多媒体信息的感知内容是人类对于客观事物的基
本感受 , 也是进行高级心理活动 , 做出反应的基础. 并
且 ,认知阶段的信息处理主要依赖于主观分析 , 已超过
目前信息技术研究的范围. 因此 , 感知内容的分析管理
和安全保护是多媒体信息处理和安全研究的基础和关
键.
感知哈希函数是基于认知心理学的信息加工理论 ,
Key words : perceptual hashing ; multimedia content ; multimedia security
1 引言
哈希函数 ( Hash Functions) 不可逆的提取原始数据 的数字摘要 (Digest) ,具有单向性 、脆弱性等特点 ,可保 证原始数据的唯一性与不可篡改性. 各种哈希函数已在 信息检索与管理 、数据认证等领域中得到了成功的应 用. 随着多媒体信息服务的不断普及和深入 ,传统哈希 函数已无法满足多媒体信息管理和保护的需求.
感知哈希函数 PH(·) 应满足以下基本性质 : (1) 抗碰撞性 (Collision Resistance) / 区分性 (Discrimi2
nation) : Π x , y ∈M ; A = ( x , y) : disp ( x , y) > Tp 且 dis ( hx , hy) < τ (2) ] P( A) ≈0 即 ,感知内容不同的多媒体数字表示不会映射为相
(3) 知觉 ,是基于感觉所获得的各种属性 ,经过分析 综合 ,并借助于知识经验等所形成的对客观事物的有意 义的整体印象. 知觉内容可以用模式特征来描述. 如某 副图像中由感觉属性所描绘和表示的对象或目标 (ob2 ject) 给人有意义的印象 (如汽车 、树木 、人物等等) . 这种 知觉内容不以拍摄该对象的角度的变化而改变 ,但感觉 内容则恰恰相反.
( Information Countermeasure Research Institute , Harbin Institute of Technology , Harbin , Heilongjiang 150001 , China)
Abstract : Perceptual hashing is a class of one way mappings from multimedia presentations to a perceptual hash value in terms of their perceptual content . It features the perceptual robustness and security. Perceptual hashing could be applied to multimedia content identification , retrieval ,authentication ,etc. On the basis of the human perceptual model , definition of perceptual hashing is proposed in this paper ,as well as the properties and the general descriptions . Its typical algorithm reviews ,application sce2 narios and benchmark are presented. The prospect of perceptual hashing algorithms and techniques is also discussed.
]
dis ( hx , hz) < τ, 当 disp ( x , z) < Tp dis ( hx , hz) > τ, 当 disp ( x , z) > Tp
即 ,感知哈希函数在感知阈值的约束下 , 具有传递
性 ,反之非然.
(6) 摘要性 (Compactness) :
在满足以上基本性质的前提下 ,感知哈希值所占的
200第8 年7 期7 月
电 子 学 报 ACTA ELECTRONICA SINICA
Vol . 36 No. July 2008
7
感知哈希综述
牛夏牧 ,焦玉华
(哈尔滨工业大学信息对抗技术研究所 ,黑龙江哈尔滨 150001)
摘 要 : 感知哈希 (Perceptual Hashing) ,是多媒体数据集到感知摘要集的一类单向映射 ,即将具有相同感知内容 的多媒体数字表示唯一地映射为一段数字摘要 ,并满足感知鲁棒性和安全性. 感知哈希为多媒体内容识别 、检索 、认证 等信息服务方式提供安全可靠的技术支撑. 本文在人类感知模型 ( Human Perceptual Model) 的基础上 ,明确了感知哈希 的定义 、性质和一般性描述. 并对目前感知哈希的典型算法 、应用模式以及评测基准等进行了综述 ,指出了感知哈希未 来的研究方向.
关键词 : 感知哈希 ; 多媒体内容 ; 多媒体安全 中图分类号 : TN919 文献标识码 : A 文章编号 : 037222112 (2008) 0721405207
An Overview of Perceptual Ha shing
NIU Xia2mu ,J IAO Yu2hua
数据容量应尽可能小.
此外 ,易于实现也是重要的性能评价指标. 只有简
单快速的感知哈希函数 ,才能满足多媒体海量数据分析
的应用需求.
4 感知哈希函数的一般性描述
图 3 为感知哈希函数的总体框架. 多媒体数字表示可以是音频 、图像 、视频 ,也可是生
物特征模版 、三维模型等存储在计算机中的数字序列. 感知特征提取以人类感知模型为基础 ,得到多媒体
(2) 感觉 ,是客观事物的个别属性通过感觉器官在 人脑中的反映. 感觉内容可用视听特征来描述. 目前 ,涉
收稿日期 :2008201223 ;修回日期 :2008203216 基金项目 :国家自然科学基金 (No. 60671064 ,60703011) ;国家 863 高技术研究发展计划 (No. 2007AA01Z458) ;高等学校博士学科专项科研基金资助 课题 ( RFDP :20070213047)
对内容保持操作的感知不变量. 分帧 、滤波等预处理 ,可 提高特征选择的准确性. 而通过与人类感知模型一致的 各种信号处理方法 , 可去除感知冗余 , 选择最具有感知 意义的特征参数. 并且 ,为了方便硬件实现 ,降低存储要 求 ,对这些特征参数还需进行量化以及编码等后处理. 准确的感知特征提取 ,是感知哈希值具有良好的感知鲁 棒性的前提.
2 感知哈希函数的定义
多媒体信息区别于一般数据的特性 ,是由人类认知 多媒体的心理过程所决定的. 根据认知心理学理论 ,该心 理过程是对多媒体信息的加工过程 ,有以下几个阶段 :感 觉输入 、知觉内容 、提取和认知辨识[3] . 如表 1 所示.
(1) 感知 ,是人类通过感觉器官获得客观事物的有 意义印象的过程 ,包括感觉和知觉.
(1) 数据集 :由多媒体信息在计算机中的数字表示 序列所构成的集合 ,记为 M ;
(2) 感觉集 :由多媒体信息的视听特征所构成的集 合 , 记为 R ;
(3) 知觉集 :由多媒体信息的模式特征所构成的集 合 , 记为 S ;
(4) 感知集 :感觉集和知觉集统称为感知集 ,记为 P; (5) 认知集 :由多媒体信息的语义特征所构成的集 合 , 记为 C.
感知阈值理论[4]指出 , 只有当客观事物所带来的刺 激超过感知阈值时 , 客观事物才能为人所感知 , 在这之 前 ,都只是相同的“数据”. 因此 ,认知过程各集合间的映 射是多对一映射 ,如图 1 所示. 差异小于感知阈值的一 类元素被映射为下一集合中的一个元素.
图 2 说明了 ,从传统的密码学意义下数据认证的哈 希函数的概念 ,引申到多媒体信息感知内容认证的感知 哈希函数 ,乃至可能的认知内容认证的认知哈希函数的 过程.
(1) 多媒体的感知冗余需要有针对性的摘要技术. 传统哈希函数仅具有数据压缩性 ,不能消除多媒体感知 内容上的冗余. 因此 ,需要根据人类感知系统特性对多 媒体信息进行感知抽象 ,在保留内容的同时 ,得到精简 的摘要[1] .
(2) 多媒体数字化表示 (Digital Presentation) 与该媒 体内容 (Multimedia Content) 之间的多对一映射特性 ,要 求内容摘要具有感知鲁棒性. 而传统哈希函数对任何数 字表示改变都是脆弱的. 因此 ,必须研究对内容保持操
相关文档
最新文档