基于多特征的视频关联文本关键词提取方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t e xt b a s e d o n mu l t i p l e f e a t u r e s
W ANG Wa nl i a n g,PAN Me ng
( C o l l e g e o f C o mp u t e r S c i e n c e a n d Te c h n o l o g y, Z h e j i a n g Un i v e r s i t y o f Te c h n o l o g y ,Ha n g z h 0 u 3 1 0 0 2 3 ,C h i n a )
c o nt a i ns a bun da nt r e l a t e d t e xt i n f o r ma t i o n,a wo r d we i ght c a l c ul a t i o n f o r mu1 a whi c h i s b a s e d on i mpr o ve d TF a n d mul t i p l e f e a t u r e s i s e s t a b l i s h e d The s t a t i s t i c a l c ha r a c t e r i s t i c o f c a nd i da t e wo r ds
第4 5卷 第 1期 2 0 1 7年 2 月
浙 江 工 业 大 学 学 报
J OURNAL OF Z HE J I ANG UNI VERS I TY OF TECHNOL OGY
Vo 1 . 45 N o. 1
Fe b. 2 017
基 于多 特 征 的视 频 关 联 文 本 关 键 词 提 取 方 法
点, 建 立 了基 于 改进 TF和 多特 征 的候 选词权 重计 算公 式 , 该公 式将 候选 词的 统 计特 征 与位 置权 重 动 态结 合起 来 , 并考虑候 选词 的词性 、 词跨 度 等属性 , 借 助扩展 的 同义 词词 林来提 取 关键 词 , 通 过提
取到 的 关键词 来表 述视 频 的 内容 信 息. 实验 结果表 明 : 改进 后 的 算 法 所提 取 的 关键 词 效 果 更好 , 在 准确 率和 召回率 方 面都 有 一定 的提 升 , 并且 能够很 好 的表 示视 频 的 内容 .
王万良, 潘 蒙
( 浙江工业大学 计算机科学与技术学院 , 浙江 杭州 3 1 0 0 2 3 )
摘要 : 针 对互联 网 多媒体 视 频数 量 的爆 炸 式增 长导 致快 速获取 视 频 的 内容 变得 非 常 困难 问题 , 提出
了一 种基 于多特征 的 关键词提 取 算 法 TF L — WS算 法. 通过 分析视 频 包含 丰 富的 相 关文 本信 息 的特

s ho ws t ha t t h e i mpr o ve d a l g o r i t hm of e xt r a c t i n g t he ke y wo r ds ha s a b e t t e r r e s u1 t I t ha s s o me I mp r o v e me nt i n t he pr e c i s i on a nd r e c a l l r at e s ,a nd i t c a n r e p r e s e nt t h e v i d e o c o nt e nt mu c h b e t t e r

c ont e n t o f t he v i de o i nf o r ma t i on Leabharlann Baidu a n b e e x pr e s s e d b y t he ke y wor d s

The e xp e r i me nt a 1 r e s u I t

a n d l o c a t i o n we i g h t a r e c o mb i n e d d y n a mi c a l l y i n t h i s f o r mu l a Co n s i d e r i n g t he p a r t o f s p e e c h,
关键 词 : 关键 词提 取 ; 视 频 内容 ; TF; 特 征 词 权 重 中 图分类 号 : TP 1 8 1 文 献标志 码 : A 文章 编号 : 1 0 0 6 — 4 3 0 3 ( 2 0 1 7 ) 0 1 — 0 0 1 4 — 0 5
An ke y wo r d e x t r a c t i o n a ppr o a c h f r o m v i d e o a s s o c i a t e d
Ab s t r a c t :Th e e xp l os i v e gr o wt h o f mul t i me di a v i d e o on t he I n t e r ne t l e a d s t o a c c e s s t he c on t e n t of t he v i de o mor e a nd mo r e d i f f i c u l t y,a ke y wor d e xt r a c t i on a l go r i t hm TFL— W S ba s e d on m ul t i p l e

wo r d s p a n of c a n di d a t e wo r ds ,e xp a nd e d s yn o ny m di c t i on a r y i s u s e d t o e xt r a c t ke y WOr ds So t he
f e a t ur e s i s p r o p os e d i n t hi s p a pe r

Thr o ug h a na l y z i ng t he c h a r a c t e r i s t i c s o f t he v i d e o whi c h
相关文档
最新文档