一种面向基因与疾病关系的文本挖掘方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Absr t tac :A e tm i i g a p o c sd sg e o u o aia l x r ci g t e r lto s i s b t e t x n n p r a h i e i n d f ra t m tc l e ta tn h eai n h p ewe n y g n s a d d s a e n h e b t e n g ne n e e y c m b n n t r ac n o d c l e e n ie s s a d t os ew e e s a d g n s b o i i g pat n m th a d bi me ia e o t l g t O o c re c e h q e . A n y tm s d v l p d f r p o e sn ag — c l e t n o o y wih C — c u r n e tc niu s d a s se i e e o e r c si g lr e s ae t x o d ts t . Th s se a xr c e e e tt s r l td t d s a e , mi e he r lto s i s ewe n aa es e y tm c n e ta tg n n i e eae o ie s s i n t e ai n h p b t e g n s a d d s a e n h e b t e n g ne n e e e e n ie s s a d t os ew e e s a d g n s,a d r n h ee n e o h ea i n hi n a k t e r lva c f t e r lto s ps b t e n g n sa d d s a e . M o e v r ew o k v s ai ai n t o sa ep o i e ra l i g t e r ・ ew e e e n ie s s r o e ,n t r iu lz to o l r v d d f nayzn h e r o lt s i e we n g n s a d d s a e n h s ewe n g ne n e e . Th x e i e t lr s l ai hpsb t e e e n ie s sa d t o e b t e e s a d g n s on ee p rm n a e ut s s o a s o e o 3. h w n F—c r f8 0% c n be a hiv d f rt e e ta t n o h ea i s psb t e e e n a c e e o h xr c i ft e r lt o on hi ewe n g n s a d die s s a d alF—c r f7 5% c n b bti e o h xr c i n o h eai n h p e we n s ae . n l s o e o 8. a e o a n d f r te e ta to f te r l t s i s b t e o ge e rt e ts ts t. Th ss se s s c e su l p id t h e e c e b u r a tc n e n sf h e tdaa e s o i y tm i u c s f ly a pl o te r s a h sa o tb e s a c r e r a d r ltd g n s n e ae e e .
第4 0卷 第 3期
21 0 0年 5月
东 南 大 学 学 报 (自然科学版 )
J R A OU HE S NI R IY ( aua S i c dtn OU N L OFS T A T U VE ST N t l ce eE io ) r n i
V o . 0 NO. 14 3
( 东南大学生物 电子学 国家重点实验室 , 南京 2 09 ) 10 6 ( 阴工 学 院计 算 机 工 程学 院 , 安 2 30 ) 淮 淮 2 0 3
摘要 :结合模 式 匹配 、 生物 医学本体 及 共现 技 术 , 计 了一种 自动抽 取基 因与疾 病 、 因与基 因 设 基
之 间关 系的文本挖 掘方 法 , 并开 发 了一个 可以处 理 海量文本 数据 的 系统. 系统 可抽取 与疾 病相 该 关 的基 因实体 , 掘基 因与疾病 、 因与基 因之 间的关 系, 量基 因与疾 病 实体 的相 关性 , 挖 基 衡 并为分 析基 因与疾病 、 因与基 因之 间的关 系提 供 了网络 可视 化 工具. 基 实验 结果 表 明 , 系统 在测 试 数据 集上抽 取基 因 与疾病 之 间的关 系可获得 8 . % 的综合测评 率 , 30 抽取 基 因与基 因之 间的关 系可获 得 7 . % 的综合测 评率. 系统 已成功 应用 于乳腺癌及 相 关基 因的研 究. 85 该
M a 01 v2 0
d i1 .9 9 ji n 10 — 5 5 2 1 . 3 0 0 o :0 3 6 / . s .0 1 0 0 .0 0 0 . 1 s
一
种 面 向基 因 与 疾 病 关 系 的 文 本 挖 掘 方 法
龚 乐君 韦有 兵 谢 建 明 袁 志栋 孙 啸
关键 词 :生 物 医学 ; 文本挖 掘 ; 系抽取 ; 关 实体 识别
中图分类号 : P 9 T 31
文 献标 志码 : A
文 章编号 : 0 1— wenku.baidu.com 5 2 1 )30 8 -5 10 0 0 ( 0 0 0 -4 60
Te tm i i g a p o c o ea i n h p e we n g n s a d d s a e x n n p r a h f r r l to s i s b t e e e n ie s s
Go gL j n' W e Yo bn X eJ n n Yu nZ io g S nXi n eu i u ig i i mig a a hd n u a o
( Sa e aoa r f o l t nc , o tesUnvrt N nig20 9 C ia ’ teK yL brt yo ee r is S uhat i sy, aj 10 6, hn ) t o Bi c o ei n (S ho f o ue n ier g Huii stt o eh ooy u i 2 0 3 C ia c ol mp t E gnei , a nI tue f c n l ,H aa 2 30 , hn ) oC r n y ni T g n