面向互联网舆情的热词分析技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用 到 TRS舆 情 监 测 系 统 的 热 点源自文库发 现 模 块 。
关 键 词 : 词 ; 名 实体 识 别 ; 热 命 热度 计 算 ; 动 权 值 ; 群 关 系 波 词
中 图 分 类 号 :TP 9 3l 文 献标 识码 :A
H o — o d D e e t o o n e n t Pu lc S ntm e t W r t c i n f r I t r e b i e i nt
r t . The t c no o s e n s c s f ly a ple t tw o d dic ve i ae e h l gy ha b e uc e s u l p id o ho r s o rng modue, w h c s a pa tofTR S pu i l i h i r blc
LIY u i .S N hu qn U Ii a
( . B in n o mainS in e&. c n lg ie st ,Be ig 1 0 01 1 ej gI fr t ce c i o Teh oo y Unv riy in 0 1 ,Chn ; j ia 2 ejn .B i g TRS I fr t nTeh oo yC . i no mai c n lg o ,Lt ,Be ig 1 0 0 o d in 1 1,Chn ) j 0 ia
Ab ta t:H otwor s a n t o k phe o e n, whih r fecs s m e o sr c — d i e w r n m no c e l t o p pulr f ei gs a d t is a a p r iu a i e a e ln n opc t a tc l r tm
面 向 互 联 网 舆 情 的 热 词 分 析 技 术
李 渝 勤 孙 丽 华 。 ,
( .北 京 信 息 科 技 大 学 , 京 10 0 ; .北 京 拓 尔 思 信 息 技 术 股 份 有 限 公 司 。 京 1 00 ) 1 北 0 11 2 北 0 11
摘 要 :热 词是 一种 网络 词 汇 现 象 , 映 了某一 特 定 时 空 范 围 内人 们 普 遍 关 注 的 问题 。该 文 对 热 词 分 析 的 两项 关 反
weg t f c u t n O c mp t o — r i h . Up t h o — r s o it n h y a e d r e r m h ifr i h l t a i s t o u o u e h two d weg t o t e h two d a s ca i ,t e r e i d f o t e d fe — o d e c f h ih a u fh two d n o — r e a in h p wa o u e r m h r cp e o O o c re c n e 0 e weg tv le o o — r .a d h two d r l t s i s c mp t d fo t e p i i l fC — c u r n e t o n
第 2 5卷
第 1期
中 文 信 息 学 报
J) ( URNAL OF CH I ESE NF(RM ATI N I ) oN PR( CESSI ) NG
Vo . 2 ,N0 1 1 5 .
21 O 1年 1月
J n ,2 1 a. o1
文 章 编 号 :1 0 — 0 7 2 1 ) 10 4 — 6 0 3 0 7 ( 0 1 0 — 0 80
键 技 术 一一 热 词 发 现 和 热 词 关联 技 术进 行 了深 入 的研 究 。在 热 词 发 现 阶 段 , 先采 用 命 名 实体 识 别技 术 和 高频 串 首 统 计 技 术 进 行 短语 串的挖 掘 , 而 采 用 基 础 权 值 和 波 动 权 值 两 项 指 标 进 行 热 度 权 值 的 计 算 。在 热 词 关 联 阶 段 , 继 按 热 词 权 值 高低 进 行 热词 类 的 划分 , 过 同 现 率 的 原 则 确 定 热 词 类之 间 的 关联 计 算 。 该 文 所 采 用 的 方 法 已经 成 功 应 通
a d s a e n t i p p r wo k y t c n l ge f o r n l zn r ic s e n p c .I h s a e ,t e e h o o is o two d a a y i g a e d s u s d,i c u i g h two d d s o e i g h n l d n o — r ic v rn
a s oca ig t c i e I heph s fwor s ov rng, fr ty,w ege m e ntt e o nd a s i tn e hnqu . n t a e o d dic e i is l tna d e iy r c gnii e h qu san ton t c ni e d sa itc e hnqu s or hi fe ue c p a e O o ti e c v to . T h n, w e a t e a i o eg a t ts ialt c i e f gh r q n y hr s t d s rng x a a i n e t ke h b ss f w iht nd
关 键 词 : 词 ; 名 实体 识 别 ; 热 命 热度 计 算 ; 动 权 值 ; 群 关 系 波 词
中 图 分 类 号 :TP 9 3l 文 献标 识码 :A
H o — o d D e e t o o n e n t Pu lc S ntm e t W r t c i n f r I t r e b i e i nt
r t . The t c no o s e n s c s f ly a ple t tw o d dic ve i ae e h l gy ha b e uc e s u l p id o ho r s o rng modue, w h c s a pa tofTR S pu i l i h i r blc
LIY u i .S N hu qn U Ii a
( . B in n o mainS in e&. c n lg ie st ,Be ig 1 0 01 1 ej gI fr t ce c i o Teh oo y Unv riy in 0 1 ,Chn ; j ia 2 ejn .B i g TRS I fr t nTeh oo yC . i no mai c n lg o ,Lt ,Be ig 1 0 0 o d in 1 1,Chn ) j 0 ia
Ab ta t:H otwor s a n t o k phe o e n, whih r fecs s m e o sr c — d i e w r n m no c e l t o p pulr f ei gs a d t is a a p r iu a i e a e ln n opc t a tc l r tm
面 向 互 联 网 舆 情 的 热 词 分 析 技 术
李 渝 勤 孙 丽 华 。 ,
( .北 京 信 息 科 技 大 学 , 京 10 0 ; .北 京 拓 尔 思 信 息 技 术 股 份 有 限 公 司 。 京 1 00 ) 1 北 0 11 2 北 0 11
摘 要 :热 词是 一种 网络 词 汇 现 象 , 映 了某一 特 定 时 空 范 围 内人 们 普 遍 关 注 的 问题 。该 文 对 热 词 分 析 的 两项 关 反
weg t f c u t n O c mp t o — r i h . Up t h o — r s o it n h y a e d r e r m h ifr i h l t a i s t o u o u e h two d weg t o t e h two d a s ca i ,t e r e i d f o t e d fe — o d e c f h ih a u fh two d n o — r e a in h p wa o u e r m h r cp e o O o c re c n e 0 e weg tv le o o — r .a d h two d r l t s i s c mp t d fo t e p i i l fC — c u r n e t o n
第 2 5卷
第 1期
中 文 信 息 学 报
J) ( URNAL OF CH I ESE NF(RM ATI N I ) oN PR( CESSI ) NG
Vo . 2 ,N0 1 1 5 .
21 O 1年 1月
J n ,2 1 a. o1
文 章 编 号 :1 0 — 0 7 2 1 ) 10 4 — 6 0 3 0 7 ( 0 1 0 — 0 80
键 技 术 一一 热 词 发 现 和 热 词 关联 技 术进 行 了深 入 的研 究 。在 热 词 发 现 阶 段 , 先采 用 命 名 实体 识 别技 术 和 高频 串 首 统 计 技 术 进 行 短语 串的挖 掘 , 而 采 用 基 础 权 值 和 波 动 权 值 两 项 指 标 进 行 热 度 权 值 的 计 算 。在 热 词 关 联 阶 段 , 继 按 热 词 权 值 高低 进 行 热词 类 的 划分 , 过 同 现 率 的 原 则 确 定 热 词 类之 间 的 关联 计 算 。 该 文 所 采 用 的 方 法 已经 成 功 应 通
a d s a e n t i p p r wo k y t c n l ge f o r n l zn r ic s e n p c .I h s a e ,t e e h o o is o two d a a y i g a e d s u s d,i c u i g h two d d s o e i g h n l d n o — r ic v rn
a s oca ig t c i e I heph s fwor s ov rng, fr ty,w ege m e ntt e o nd a s i tn e hnqu . n t a e o d dic e i is l tna d e iy r c gnii e h qu san ton t c ni e d sa itc e hnqu s or hi fe ue c p a e O o ti e c v to . T h n, w e a t e a i o eg a t ts ialt c i e f gh r q n y hr s t d s rng x a a i n e t ke h b ss f w iht nd