上下文敏感的多文档自动摘要生成方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
I ywo d ]mutd cmet u Ke r s l-o u n mmai t n sn iv ecnetcmpei i s r ai ;est et t o tx;o l t z o i oh xy
1 概 述
自动摘 要技术就是利 用计算机对文档进行分析 ,用简练 而有代表性的语句表示文档 的内容 _。从 15 】 J 9 8年有学者在
()ioe 3Pv tdQR分解l。该算法的实质 是根据 已经选 中的 4 J 摘要旬来调整那些还没 有被选 中的摘 要句 。根据测试集合首 先构造一个矩 阵,该矩 阵的列表示测试集合 中的句子 ,行表 示测 试集合 中的词汇 ,如果句子 包含某个词汇 i ,则矩阵的
I M7 4机器上进行第 1次摘要 至今 ,自动摘要技术 已经有 B 0
c n e t is h s mp ra ts n e c s s l ce s a s n e c n s o t x .F r tt e mo ti o t n e t n e i e e t d a e t n e i umma y n h n t e we g ft r s i h e t nc s s tt e ma l r ,a d t e h ihto m n t e s n e e i e o v r s l e y c n t n O a o p e e t her c re c e e tr s ROUGE i s d t v l a e t ep o r m . e e p rm e tl e u t h w h t h t o a o sa t s t r v n e u r n eof h s e m . S t t su e o e a u t h r g a Th x e i n a s l s o t a e me h d h s r s t a h e e o d r s ls c i v d g o e u t.
近5 O年的研究历史 。 入 2 进 0世纪 9 O年代 , 随着互联 网的迅
第, 行第 i 列就是词汇 i 的权重 ,否则为 0 。然后根据一定的
策略抽取摘要 的第 1 ,调整矩 阵的行列值 ,同时把其他各 旬
句 中 出现 的与 选 中旬 子 相 同 的词 汇 置 为 0 目的 是 再 次抽 取 ,
成绩 。
关健词 :多文档 自动摘要 ;上下文敏感 ;复杂度
Ge r to e ho orM u t. c ne a i n M t d f lido um e um m a i a i n ntS rz to o e ii et nt x fSe tv o Co e t nS V O ns l
冗余 。 选取权重最 大的句子作 为摘要句 , 已选句子 中包含 的词汇 的权重设置为接近 0的常数 ,当下次选择摘要句时 , 以避 免再 次选取 把 可 包含这些词 汇的句子 。使 用 自动摘要评测方法 R U E 对该方法进行评测 。实验结果表 明,根 据该 方法抽取 的机器摘要能够获得较高 的 O G
[ s a t n l h fte ia eu c fp p lrs s mso eeaig smmais a cne t e sie po rm sp tfr r al S Abt c]I i to nd q ay o o ua yt fgn rt u r g h e n r , o tx— n iv rga i u owad c ld S C e s t e
速发展, 自动摘要 的价值充分显示 出来 ,引起人们广泛的关
注。 自动摘要技术也不断地得到发展与完善 。多文档 自动摘 要的研 究工作最早在 2 世 纪 8 0 0年代开始 ,当时的研究工作 还 不具有普遍性 ,主要通 过多种关系对科技 文章的多文档集 合进行描述 ,科技文章的结构化统一些 ,比较好刻画 ,但 这
1 第3 6卷 第 2 期
IL6 7 3 o
No. 2l
计
算
机
工
程
21 0 0Βιβλιοθήκη Baidu l 1月
N o e be 2 1 vm r 00
Co pu e m t rEng ne r ng i ei
・ 开发研究与设计技术 ・
文 编 : 0 . 2212 06’ 2 文 标 码: 章 号 1 3 80 ) — 2 l 0 4 ( 01 5 献 识 A
(u maie est et o tx)T epo rm h s n h rceii ihcnrd c e o tn d na c xmal n e siec te S m r rSn iv C net. h rga a e aa t s c c a uet ne teu d nyma i l a diisn iv z i O o c r t wh e h c r y ts t 0h
中 分 号 T3 图 类 : P9 1
上 下 文敏 感 的 多文档 自动摘 要 生成 方 法
仇丽青 ,李伟 明
( 山东科技大学信息科学与工程学 院,山东 青岛 2 6 ) 6 5 1 O
摘
要 :针对现 有的多文档 自动摘要 生成方法中存在 的问题 , 出一种多文档 自动摘要生成方法 ,该方法能够最大限度地 减小摘 要内容 的 提
QI i i g L e mig U L- n , I i n q W —
(c o l fnomainS inea dE gneig S a d n iesyo cec n eh oo yQig a 6 5 C ia S h o o fr t ce c n n ier , h n o gUnvri f i e dT cn lg , n do2 6 hn) I o n t S n a 1 0