一种基于模式噪声熵的图像来源取证算法
一种基于自训练与噪声模型的因果事件抽取方法[发明专利]
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202010397785.6(22)申请日 2020.05.12(71)申请人 哈尔滨工业大学地址 150001 黑龙江省哈尔滨市南岗区西大直街92号(72)发明人 丁效 刘挺 秦兵 廖阔 (74)专利代理机构 哈尔滨市松花江专利商标事务所 23109代理人 时起磊(51)Int.Cl.G06F 40/284(2020.01)G06N 3/04(2006.01)G06N 3/08(2006.01)(54)发明名称一种基于自训练与噪声模型的因果事件抽取方法(57)摘要一种基于自训练与噪声模型的因果事件抽取方法,本发明涉及因果事件抽取的方法。
本发明的目的是解决现有基于深度学习模型的因果事件抽取方法在有标注数据不足的领域或场景中效果有限的问题。
过程为:一、收集已标注的目标领域文本;二、计算一个向量表示;三、计算出概率最大的标签序列;四、训练三中的模型,并对二中的模型进行微调;五、得到大量自标注数据;六、为每个单词计算一个向量表示,计算单词序列生成每个可能的标签序列的概率;七、计算自标注文本中每个单词的噪声矩阵;八、得到由单词序列生成自标注标签序列的概率;九、使用一中有标注数据与五中自标注数据共同训练二、三、六、七中的整体模型。
本发明用于因果事件抽取领域。
权利要求书4页 说明书12页 附图1页CN 111651983 A 2020.09.11C N 111651983A1.一种基于自训练与噪声模型的因果事件抽取方法,其特征在于:所述方法具体过程为:步骤一、收集已标注的目标领域文本,或对目标领域的无标注文本进行标注,标注出因果事件对,标注时,采用序列标注任务的标注方法,为文本中为每个单词标记一个标签,表示该单词属于原因事件、结果事件或其他成分;步骤二、先用已有的分词工具对步骤一中有标注文本进行分词,使用一种神经网络结构为分词后有标注文本中的单词计算一个向量表示;步骤三、使用条件随机场模型,由步骤二中的向量表示计算出概率最大的标签序列;步骤四、利用步骤一中已标注的目标领域文本或对目标领域的无标注文本进行标注的文本数据训练步骤三中的条件随机场模型,并对步骤二中的模型进行微调;步骤五、搜集同领域大量无标注文本数据,先用已有的分词工具对搜集的同领域大量无标注文本数据进行分词,得到自标注文本分词后的单词序列,利用步骤四中训练好的模型对同领域大量无标注词语进行标注,得到大量自标注数据;所述步骤四中训练好的模型为步骤二中训练好的预训练词向量矩阵、神经网络模型,以及步骤三中的条件随机场模型的整体;步骤六、对步骤五中自标注文本分词后的单词序列,使用步骤四中训练好的词向量矩阵、神经网络模型为每个单词w i计算一个向量表示并使用步骤四中训练好的的条件随机场模型计算单词序列生成每个可能的标签序列的概率;步骤七、使用全连接神经网络,由步骤六中单词的向量表示计算自标注文本中每个单词的噪声矩阵;步骤八、使用另一个条件随机场计算任意标签序列经过噪声信道得到自标注标签序列的概率,并乘以步骤六中由单词序列生成任意标签序列的概率,得到考虑噪声信道情况下由单词序列生成自标注标签序列的概率;步骤九、使用步骤一中有标注数据与步骤五中自标注数据共同训练步骤二、三、六、七中的整体模型。
一种基于CFA插值系数熵的图像来源取证算法
一种基于CFA插值系数熵的图像来源取证算法【摘要】研究分析了数码相机内部的CFA插值算法,利用数字图像本身对数码相机的CFA插值系数进行估计,同时将熵理论引入其中,以插值系数熵作为特征值,使用BP神经网络作为分类器,提出了一种基于CFA插值系数熵的图像来源取证算法。
实验表明:该算法能够较准确地对不同相机来源的数字图像进行鉴别, 同时对JPEG重压缩图像的检测率也有所提高。
【关键词】数字图像取证;插值系数;熵;支持向量机Blind CFA Interpolation Detection Based on The EntropyXIE Jian PANXiao-zhong(Department of Electronic Technology Engineering University of the CAPF,Xi’an Shaanxi, 710086, China)【Abstract】The study analyzed the digital camera’s internal CFA interpolation algorithm, estimated the CFA interpolation coefficients of the digital camera by digital image itself. While the entropy theory was introduced to this paper, used entropy of interpolation coefficient as a feature and the BP neural network as a classifier, and then proposed an image source forensics algorithm based on the entropy of CFA interpolation coefficients. Experiments showed that the algorithm could identify images from different cameras more accurately, and had increased the detection rate to the re-compressed JPEG images.【Key words】Digital image forensics;Color Filter Array(CFA) interpolation;Entropy;Support Vector Machine(SVM)数字图像取证技术是直接利用数字图像数据本身进行来源认证和鉴别分析的被动盲分析技术。
基于原始传感器模式噪声的CT图像来源检测算法
DOI :10. 3969/j. issn. 1001 -0505.2016. 06.002基于原始传感器模式噪声的C T 图像来源检测算法段宇平uGouenou Coatrieux2 舒华忠1C1东南大学影像科学与技术实验室,南京210096)(2布列塔尼国立高等电信学校,法国布雷斯特29238)摘要:为了实现无先验信息情况下的C T 图像来源检测,提出了一种基于C T 扫描仪原始传感器模式噪声的来源检测算法.首先,采用由5种不同滤波器构建出的滤波器组,从C T 图像中获取5种不同类型的传感器模式噪声;然后,对每一种噪声分别进行C T 三维重建反变换,得到原始传 感器模式噪声;最后,根据原始传感器模式噪声的统计特征向量,并结合支持向量机分类器进行 分类,从而实现来源检测.实验结果表明,针对4个厂家的15种不同型号C T 扫描仪,采用所提 算法获得了较基于模式噪声的来源检测算法更高的识别精度,其平均分类精度可达94. 12% .关键词:图像来源检测;计算机断层扫描;原始传感器模式噪声;支持向量机中图分类号:TP391 文献标志码:A 文章编号:1001 -0505(2016)06-1122-04第46卷第6期 系杳大学学板(自然科学版)Vol .46 No .62016 年 11 月JOURNAL OF SOUTHEAST UNIVERSITY (Natural Science Edition) Nov . 2016CT image origin identification algorithm basedon original sensor pattern noiseDuan Yuping 1,2Gouenou Coatrieux 2Shu Huazhong 1(la b o ra to ry of Image Science and Technology , Southeast University , Nanjing 210096, China )(2TELECOM Bretagne , Brest 29238 , France )A bstract : To detect the origin of a computed tomography (CT) image without prior knowledge, anorigin identification algorithm based on the original sensor pattern noise of the CT scanner is proposed. First, 5 different sensor pattern noises are extracted from CT images by a filterbank constituted of 5 distinct filters. Then, the original sensor pattern noises are obtained by the inverse transform of three dimensional CT reconstruction for each type of noise. Finally, the statistic feature vectors of the original sensor pattern noises and the support vector machine (SVM) based classifier are combined to tackle origin identification. The experimental results show that as for 15 different CT scanners from 4 manufacturers, the proposed origin identification algorithm obtains higher identification precision compared with other existing origin identification algorithms based on pattern noises, and the average classification accuracy can reach 94. 12%.Key words : image origin identification ; computed tomography ; original sensor pattern noise ; support vector machine 随着医疗行业信息化建设的不断进步,电子病 历(E P R )系统和图像存储及通信系统(PACS) 被广泛运用于医疗服务中.医学图像数字化的普及 和发展极大地提高了医疗服务的效率,但随之而来 的医学信息安全问题也引起了人们的广泛关 注m .在数以万计的医学成像设备中,DICOM 是部 署最为广泛的医疗信息标准之一,其定义了质量能 满足临床需要的可用于数据交换的医学图像格式. 符合该标准的医学图像中包含一个存储了图像信 息的头文件m ,借助于一些医学图像处理软件(如ImageJ2x 和ezDicom 等),可以轻易地对头文件中收稿日期:2016-05-26.作者简介:段宇平(1985—),女,博士生;舒华忠(联系人),男,博士,教授,博士生导师,shu. list@. 基金项目:国家自然科学基金资助项目(61073138,61201344, 61271312, 61401085, 81101104).引用本文:段宇平,Gouenou Coatrieux,舒华忠.基于原始传感器模式噪声的C T 图像来源检测算法[J ].东南大学学报(自然科学版),2016,46(6) :1122 —1125. DOI:10.3969/j.issn.1001 -0505.2016.06.002.第6期段宇平,等:基于原始传感器模式嗓声的C T图像来源检测算法1123的内容进行恶意或非恶意的篡改.另外,医学图像 的头文件也可能会丢失,从而造成图像的可信度降 低.为了对图像进行保护,可以使用数字签名或者 嵌人数字水印[3],但是这些主动方法必须在图像 获取时进行实时操作,在实际应用中受限.因此,有 必要仅利用待检测的医学图像,对其来源进行判定 (即盲取证).现有的图像盲取证方法主要针对日常设备,如 数码相机和扫描仪等[4].根据盲取证方法的特征 选取策略,可将其分为两大类:①通过分析成像过 程中不同处理环节在图像中留下的痕迹(如CFA 插值算法[5]、去马赛克算法[6]和白平衡算法[7]等 在像素点之间留下的不同相关性),对图像的来源 进行判别.这类方法的缺点在于,难以区分同一型 号的不同成像设备以及共用同一后处理算法的设 备.②利用成像设备元器件缺陷引人的特征(如镜 头色差[8]、传感器缺陷像素[9]等信息),进行图像 来源取证.这些内在缺陷具有偶然性和唯一性,同一型号的不同设备也不尽相同,因此可将这些缺陷 视为图像的指纹信息进行来源检测.Lukas等[1°]采用了第2类盲取证方法,利用传感器模式噪声(SPN)对图像来源进行判定.Kharboutly等[11]采 用对数码相机图像来源取证的思想,将SPN应用 到医学图像中.Duan等[12]针对X线摄影图像进行 了来源取证实验,获得了较高的识别效率.为了提高C T图像来源检测的效率,本文通过 分析C T的成像原理,提出了一种基于C T成像设 备原始模式噪声的图像来源检测算法.1CT成像原理C T成像基本原理如图1所示.一束散射的X光 束穿过病人到达探测阵列并环绕一周,得到投影数 据,将其输人计算机进行三维重建,从而得到最终的 数字化C T图像,并可用于诊断、存储以及传输[13].C T图像三维重建的基本原理是将每个投影角 度下的投影数据看作该投影角度下所有像素值之 和,整个重建即为解线性方程的过程.传统滤波反 投影(FBP)算法作为主要的重建算法,一直被各大 公司广泛使用.另外,C T设备的硬件技术也提升迅 速,最新的螺旋C T探测阵列最高已达256层[14].C T图像计算机显示器存储设备x光束Bow tie滤波器平板滤波器图1 C T成像基本原理示意图2 C T噪声模型通过分析C T成像原理可知,C T设备的原始模式噪声并未直接映射到最终图像中,而是经历了重建过程.因此,参考X线摄影图像的噪声模型[12],可建立如下的C T噪声模型:Pj=Ej+KEj+Q(1)式中,巧为投影角度7下进人成像系统的X线强度 值;。
一种基于模式噪声熵的图像来源取证算法
Ke r s d gtli g ;fr n i o e s u c ;p t r o s ;e t p y wo d : i i ma e o e s ft o r e at n n ie n r y a c h e o
f r n i fi g o r e o e sc o ma e s u c
XI in,P a —h n ,L —o g E Ja AN Xio z o g IDe l n ,XI AO ly h Ha— a
( e a oao e ok&Ifr tnScryu drh hns Am dP leF r , eto l t nc E gneigC lg eAm d K yL brtr o N t r yf w nomai eui n e teC ie re o oc Dp.fEe r i, n ie n ol e ^ r e o t e w e co r e o f
第2 9卷 第 6期
21 0 2年 6 月
计 算 机 应 用 研 究
Ap l a i n Re e r h o o u e s p i to s ac fC mp t r c
Vo . 9 No 6 12 .
J n 2 1 u . 02
一
种 基 于模 式 噪声 熵 的 图像 来 源 取 证 算 法 术
P leF r , ia 10 6 i ) oi oc X ’n7 0 8 , n c e a .
Ab t a t Ai d a o e sc o ii ma e s u c ,t i p p rp o o e e e t n a p o c a e n e to y o at r sr c : me t r n i f dg t i g o r e h s a e rp s d a d t ci p r a h b s d o n r p f p t n f l a o e n ie o s .As a mp r n o o e to ii l a r n i o t t mp n n fd gt me a,b c u e i e e ti h r c s f r d cin,te e wa atr o s a c ac e a s t d f c n t e p o e s o o u t s p o h r sp t n n ie e la e n i g s B s d O .h nq e o atr is e v d i ma e . a e 1 t e u i u fp t n n o e,t i a i mei e a e h o s fi g su i g w v ltta som 3 e h s rt t d b s d t e n ie o ma e s a e e r n f r h c n
一种基于列率谱分析且噪声鲁棒的图像局部模糊检测与提取方法[发明专利]
专利名称:一种基于列率谱分析且噪声鲁棒的图像局部模糊检测与提取方法
专利类型:发明专利
发明人:梁晓,王雪玮,郭京波,韩彦军,李杰,郭文武
申请号:CN202011549937.6
申请日:20201224
公开号:CN112541913A
公开日:
20210323
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于列率谱分析且噪声鲁棒的图像局部模糊检测与提取方法,针对各种视觉传感装置获取的含有离焦、运动、抖动等模糊形式的数字图像,首先利用主动模糊方法和沃尔什变换将待测图像转换至列率域进行对比解析;并对列率谱的低列率区域进行自适应截断以消除噪声干扰;在此基础上构造并求解各像素点的局部模糊度量,得到待测图像的模糊分布;最终在快速聚类引导下采用多尺度修正生长实现局部模糊区域的提取。
该方法有效兼顾了准确性和实时性,尤其在噪声环境下显示出优越的检测性能和噪声鲁棒性,相比现有方法能够实现至少14%的精度提升和42%的误差降低,有效解决了实际计算机视觉工程中的模糊检测与提取问题。
申请人:石家庄铁道大学
地址:050043 河北省石家庄市北二环东路17号
国籍:CN
代理机构:石家庄海天知识产权代理有限公司
代理人:孟树勋
更多信息请下载全文后查看。
一种基于样本熵与EEMD的舰船辐射噪声特征提取方法
一种基于样本熵与EEMD的舰船辐射噪声特征提取方法李余兴;李亚安;陈晓;蔚婧【期刊名称】《鱼雷技术》【年(卷),期】2018(026)001【摘要】为了实现舰船辐射噪声在复杂海洋环境中的特征提取,采用样本熵对3类舰船辐射噪声(SRN)进行特征提取.针对样本熵只能在单尺度下对原信号进行分析,无法有效区分不同类别舰船,提出了一种将样本熵与集合经验模态分解(EEMD)相结合的舰船辐射噪声特征提取方法.首先对3类不同种SRN信号进行EEMD,对分解后得到的各阶固有模态函数(IMF)的样本熵进行分析,选取更具有区分度的最强IMF 样本熵作为特征参数.通过比较一定数量3类SRN的最强IMF样本熵及原SRN样本熵特征参数发现,同类舰船的特征参数基本处于同一水平,不同类型的舰船存在一定差异.试验结果表明,以SRN的最强IMF样本熵作为特征参数相比原SRN样本熵对舰船具有更好的可分性.【总页数】7页(P28-34)【作者】李余兴;李亚安;陈晓;蔚婧【作者单位】西北工业大学航海学院,陕西西安,710072;西北工业大学航海学院,陕西西安,710072;西北工业大学航海学院,陕西西安,710072;西北工业大学航海学院,陕西西安,710072【正文语种】中文【中图分类】TJ630;TN911.72;TN912.3【相关文献】1.一种新的舰船辐射噪声特征提取方法 [J], 张民;王向军;方兴2.基于EEMD的舰船辐射噪声特征提取方法研究 [J], 李余兴;李亚安;陈晓3.一种基于舰船辐射噪声起伏特性的线谱提取方法 [J], 张大伟;章新华;李前言;杨玉峰4.一种基于样本熵与EEMD的舰船辐射噪声特征提取方法 [J], 李余兴;李亚安;陈晓;蔚婧;;;;5.基于VMD和中心频率的舰船辐射噪声特征提取方法研究 [J], 李余兴;李亚安;陈晓;蔚婧因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
r b t e swi h P o usn s t teJ EG o r sin i g s h c mp e so ma e .
【 yw rsDga iae Fr s e orePt r ni ; noy Ke od] it g; o niot uc; ae o eE tp ilm e c fh s t n s r
数 字图像 盲取证 技术 主要分为图像 篡改取证和图像来源取证 数 字图像来源取证技 术是直接利 用数字 图像 数据本身 进行来源认 证和 鉴别分析 的被 动盲分 析技术 。而作 为数码相 机硬件 、 软件核 心部 分的 光学传 感器 和图像 成像算法 . 是决定数 字图像 质量和数据统计特 征的 主要 因素。 在数码相机成像过程中 . 内部的软硬件系统对原始 光源进行 了 其 系列 的加工 后 . 最终形 成原 始图像。 由于不 同数码相机在 硬件制造 及 图像 成像算 法上的差异 各 自生成图像 的数据统计特征 也有 一定 其 的差异 . 这就给图像来 源取证 带来了机会
科技信息
0科教前沿 0
S I N E&T C N L G F R A I N CE C E H O O YI O M T O N
21年 02
第3 期
一
种基于模式噪声熵的图像来源取证算法
谢 建 潘 晓 中 ( 警工 程大 学 电子 技术 系 陕 西 西安 武
70 8 ) 1 0 6
【 bt c]ie to niodgaiae or , ippr rpss e co prah ae tp tr ni . s nipr n A s atAm d r s ilm g su et s aepoo dt tnapoc s o e r y f ae o eA o at r a fe c f it c h ea ei b d n n o op tn s a m t
【 摘 要】 对数 字图像 的来源取证 , 针 本文提 出了一种基于模 式噪声熵的检 测算法。 传感器作为数码相机的重要部件 , 由于在制造过程 中的 缺 陷 . 时会 给 图 带来一种模式噪声。 成像 像 该算法利用传感器产生的模 式噪声具有唯一性这一特点 , 图 进行小波降噪并提取 图像的模 式噪 对 像 声. 利用模 式噪 声的熵值对不 同来源的 图 进行 区分。 像 实验结果表明 , 该方法对原始 图像有较 高的检 测率 , 对有损压缩 图像也有较好 的鲁棒性 。 【 关键词】 数字 图像 ; 来源取证 ; 模式噪声 ; 熵
i g sb h e to y o atr os .T e e p rme tlr s t h w h tte ag rtm s a b te fce c t h r ia ma e n g ma e y te nrp fp ten n ie h x ei na eul s o ta h loi s h ha etref in y wi te oi n i g s a d hih i h g l
Bln i d CFA n e p l t t c i n s d o I t r o a i De e to Ba e n The Ent o y on rp
X E J a P N i o—h n I in A Xa— o g z
( p rme to lcr ncTeh ooyEn ier gU ies yo eC F Xia h a x, 10 6,hn ) De at n fEeto i c n lg gn ei nvri ft AP , ’nS a n i7 0 8 C ia n t h
c mp n n fd gt lc me a e a e i f c n t e p o e s o o u to t r spat r o * e v d i ma e . s d o h n q e o a t m o o e t o i ia a r ,b c us t dee t i h r c s fpr d c in, he e i te n n i e l a e n i g s Ba e n t e u i u fp t s e n ie h s a i mei e a e h o s f i g s u i g wa e e r n f r a d ik d u a t r o s ,a a t o s ,t i rt h tc d b s d t e n ie o ma e sn v lt ta so m n p c e p p te n n ie t l s,we dit g i h d fe e t s u f si u s if r n o me o n
一
本文 引用香农在信息论 中构造 的熵 函数 . 使其描 述一个 系统的混乱程 度 与热力学 中的熵概念相反 . 中的熵 随着 系统的稳定性 的增加 本文 而增大 . 并在封 闭系统最稳定 时达到最大值 。 因此 , 在一个相对稳定的
系统 当中 . 由于不合群 的“ 异类 ” 的加入 . 熵会随之减小 。 本文利用此原 理来检测 “ 异类 ” 字图像 数 由于所选取 的 n 个原始 图像来源 于同一相 机 . 所以这些 图像 的模 式 噪声相对来说是相互 “ 合群 ” . 的 是稳定 的。如果 图像 P不是来源 于 相机 c 那么它 与原 始 图像在 一起 是不 “ 群的” 该 系统 的熵值 也会 . 合 . 随着 P的加入而减小 以统计分析待检测熵值相对于模式熵值域 的 所 分布情况 . 即可判 断出图像 P 是否是 由相机 c生成 的