中文网页褒贬态度的机器评价.pptx
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二声感叹便是杨晨了,他带伤上场并奋勇顶进反超的关键一球,职业球 员的风采夺目照人。
2米019色-7-职13 业装,极富亲和力的熟悉的谢微谢笑欣赏,标志性的招手——王小丫来了。22 而似乎侧重防守的马儿在防守时也未尽心。
典型网页文本示例
赵宝刚点评当红明星 2001年05月10日09:48:15 北京晨报 邱俪华
成功
跳至该实体出现的 第一句的句首
是 出现新实体名
否 针对当前实体所属领域处理, 扫描后面的褒贬评价,跳过 任何其他实体的相关评价, 得分输出至得分向量,各具 体评价单位也加入到系统中 该实体的评价记录中
输出当前网页的全部实体谢的谢欣赏
褒贬评价得分
跳至该实体出现的 下一个位置
注:网页褒贬评价流程图
34
谢谢欣赏
23
领域补充褒贬义词集样例
词语 著作等身,桃李满门,创新 悠远、磁性、高亢 尽心、团结 出口成章、机敏、灵 四平八稳 入木三分、活生生 俊秀、俊逸、活力 感染力、理智、沉稳 最佳、绝佳、一流、不俗 楚楚动人、温婉
褒贬含义 + + + + - + + + + +
出现领域 科教 音乐 运动 媒体 媒体 影视 影视 媒体 影视 媒体
周迅:形象也好,气质也好,她是我非常欣赏的那类演员。她在《像雾像雨又像风》里演的 杜心雨,这个人物在文学上很不成功,对演员来说简直没法演,可周迅就能让她“站”起来。
徐静蕾:她的文化修养在同龄的女演员里特别突出,这给她的表演打了很好的底子。可有文 化的不一定成得了好演员,而好演员可以没文化。出于性格的原因,她表演起来很冷静,不会太 投入。再磨一段时间,相信到了火候她就能提高。
2019-7-13
谢谢欣赏
29
网页褒贬态度评价模块
数据需求 设计思想 模块设计
2019-7-13
谢谢欣赏
30
数据需求
网页表示库
网页URL地址 网页长度(按词计)
网页词串 词的词性标注串 词的HTML标记串 网页中人名列表 网页中职务列表 网页中企业或机构名列表
网页中人名—单位关系列表 网页中人名—职务关系列表
2019-7-13
谢谢欣赏
修饰内容 科教专家 嗓音 足球运动员 主持人风格 主持人风格 演员演技 演员外形 主持人风格 演员演技 主持人外形
24
褒贬评价模板搜集样例
a+的+entity Entity+n+a n+的丧失 不a 不乏n 未a
n不够 极富n 勇于v 20N19-7+-13 entity
褒贬结构要素
模板
褒+ 中0 贬- 指标*
(不 )(不 是 )(少 了 )(没 了 ) A (未能 )(未 )(没 能 )(没有 ) -1 0 0 -1
(决不 )
B
(丧失 )(缺乏 )
-1 0 × -1
C
(富有 )(善于 )(富于 )(富 ) (极富 )
+2 +1 ―2
+1
D
(不乏 )(具备 )(具有 )(有 ) +1 0 -1 +1
谢谢欣赏
27
天网知名度系统模块浏览
用户界面模块 用户注册 用户检索 指定文本内容的评价 主动推送服务 网页分析与索引模块 用户信息维护模块 网页相关度评价模块
2019-7-13
谢谢欣赏
28
中文网页褒贬态度的机器评价
引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望
2019-7-13
谢谢欣赏
32
设计思想
语言手段是基础 话题的实体有关性 针对领域标准的褒贬评价
2019-7-13
谢谢欣赏
33
2019-7-13
获得当前网页的全部 人名、词串、词性标注
串
取下一个人名 不成功
取下一个候选实体
成功
获得此人名相关的 成全功部注册实体 ,加
入该网页的实体向
量,并生成对应实 体的得分向量
李晓华把握商机和适当冒险的精神的确有其过人之处。 因此,孙楠的反抗不仅是肤浅的,而且是狭隘的。
曹颖从外表上看更显单薄、弱小。她不像倪萍身材高挑、浓眉大眼,也不 像周涛那样一副典型的中央台“国标”播音员的风韵。
周涛虽然很红,可她太四平八稳,真诚,质朴有余,而灵动,幽默不够。
我喜欢施翌,她清新自然,毫不做作,宛如一位邻家学姐在带着露珠的清 晨为你讲述一切美好的东西,让你一整天都感受到温暖和喜悦。
仅选取了每个条目中的两项信息,例如 (诚挚 +)和(草率 -),生成了褒贬 评价系统使用的褒贬义电子词典。
2019-7-13
谢谢欣赏
21
典型网页文本搜集
季老先生一生勤勉,一生谦和,著作等身,桃李满门。
她不像倪萍身材高挑、浓眉大眼,也不像周涛那样一副典型的中央台“国 标”播音员的风韵。
李保田修养全面,热爱艺术,在表演上精益求精,是影视界优秀的表演艺 术家之一。
U=A+P U=B+P U=C+P U=D+P U=A+A+P=F+P U=A+C+P=G+P U=A+D+P=H+P U=P U=P+E C=“和”|“与”|“,”|“、”|“且” P=W{+C+W2}
2019-7-13
谢谢欣赏
36
关键结构P
p结构是褒贬结构的基本组成部分
2019-7-13
谢谢欣赏
15
相关工作与工作基础
语言手段 评价规范及标准 资源准备 系统基础
2019-7-13
谢谢欣赏
16
实验考察
实验考察
语言手段
评
价
规
词
句
修
语
式
辞
手
手
手
段
段
段
范 及 标 准
2019-7-13
谢谢欣赏
17
实验考察与实验资源的对应分布
词
短语
句式
辞格
修辞标准和规 范
修辞行为,所以实验可以充分利用修辞学
的理论成果,具有理论指导基础。
2019-7-13
谢谢欣赏
13
本实验的研究内容及意义 ——创新价值
从语言学角度看,修辞涉及语言的附加意 义,这区别于概念意义。因而此项实验具 有丰富创新性研究价值。
2019-7-13
谢谢欣赏
14
中文网页褒贬态度的机器评价
引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望
楚楚动人的小丫
这姑娘脑袋灵
诚信的丧失
不心浮气燥
不乏可圈可点之处
而似乎侧重防守的马儿在防守时也 未尽心
灵活性不够
极富亲和力的熟悉的微笑
勇于开拓前进
美女曹谢谢颖欣赏
25
相关工作与工作基础
语言手段 评价规范及标准 资源准备 系统基础
2019-7-13
谢谢欣赏
26
天网知名度系统
2019-7-13
解析 机器
认知
评价
实体
语言
语言
2019-7-13
谢谢欣赏
10
引言
天网知名度系统 网页观察-机器评价视角下看中文网页类型 项目延伸-网页褒贬态度的机器评价 本实验的研究内容及意义
2019-7-13
谢谢欣赏
11
本实验的研究内容及意义 ——项目延续
符合天网知名度系统个性化网络服务的立意
2019-7-13
谢谢欣赏
31
数据需求
实体信息库
所在的领域
名字 所在工作单位 职业描述 兼职单位 社会形象 特征词 代表作
共计10类,政府,科教,文学,业界,媒体,歌星,音 乐,影视,体育,艺术 包括别名、笔名、艺名等潜在可能代表实体的名字 例如,北京大学 例如,主席、书记、教授、记者、演员 可以有多个 例如,国学大师,环保大使 用户关心的特征描述 著作名、作品名、产品名等
中文网页褒贬态度的机器评价
导师:X教授,X教授
硕士毕业生:X
2019年5月 硕士学位论文答辩
2019-7-13
谢谢欣赏
1
中文网页褒贬态度的机器评价
引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望
2019-7-13
谢谢欣赏
2
引言
天网知名度系统 网页观察-机器评价视角下看中文网页类型 项目延伸-网页褒贬态度的机器评价 本实验的研究内容及意义
2019-7-13
谢谢欣赏
3
天网知名度系统
基础:天网搜索引擎,计算语言学技术 定位:用户定制查询,个性化网络检索服务 数据:75万中文网页,近300个名人实体
2019-7-13
谢谢欣赏
4
注册实体信息库
所在的领域
名字 所在工作单位 职业描述 兼职单位 社会形象 特征词 代表作
政府,科教,文学,业界,媒体,歌星,音乐,影 视,体育,艺术(共10类)
可以利用已有的数据基础和实验平台
此项实验具有研究和实验展开的可延续性
2019-7-13
谢谢欣赏
12
本实验的研究内容及意义 ——语言基础
网络是重要的信息传播媒介。
现实网页中的褒贬态度表达往往含有明确 的目标、动机和效果期望,因此构造者会 很重视语言知识这个交流手段。
网页中的褒贬态度表达也就是一个典型的
王志文:《过把瘾》之后沉寂了一段时间。从他这两年出的两部戏可以看出,这段时间他没 浪费,磨出了更深的功力。他是一定能成艺术家的那类人。
江珊:《过把瘾》之后有五年都没接到好角色,她是个很适合演普通百姓的演员,不能太“ 贵族”了,那样看着不像她,观众也接受不了。
陆毅:千万别“吃”形象,形象早晚会“吃完”,到时就得靠功力了。如果他能不断演些富 有挑战性的角色而不是重复过去,将来走到哪里都不怕。
包括别名、笔名、艺名等潜在可能代表实体的名字 例如,北京大学 例如,主席、书记、教授、记者、演员 可以有多个 例如,国学大师,环保大使 用户关心的特征描述 著作名、作品名、产品名等
2019-7-13
谢谢欣赏
5
引言
天网知名度系统 网页观察-机器评价视角下看中文网页类型 项目延伸-网页褒贬态度的机器评价 本实验的研究内容及意义
注:考虑到褒贬评价的领域性,这里的未证褒贬
2019-7-1词3 语也是根据领域来谢分谢欣别赏 记录的。
37
中文网页褒贬态度的机器评价
引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望
识别策略是:使得由链接词语链接在一起的词序 列中不允许出现褒贬互逆,同时需要满足,仅当 词语本身具有褒贬含义,或者W本身不在褒贬词
典中但该序列中其他词语有褒贬含义,此时才形 成合法的P,同时把未在褒贬词典中出现但出现
在结构中的这个词语抽取出来,并依照此序列中
的已有褒贬含义按照一致性原则猜测,把这个未 登录词语纪录为未证褒贬词语。
2019-7-13
谢谢欣赏
6
网页观察-机器评价视角下 看中文网页类型
强文字相关的信息类网页 例如:个人简历型网页
弱文字相关的事件或事物展开型网页 例如:事件报道,节目单
2019-7-13
谢谢欣赏
7
引言
天网知名度系统 网页观察-机器评价视角下看中文网页类型 项目延伸-网页褒贬态度的机器评价 本实验的研究内容及意义
E
(的 缺失 )(的 丧失 )(不够 ) -1 -1 × -1
AA=F
(不 是 不 )(没有 不 )~
000
0
AC=G
(不 善于 )(不 富于 )~
-1 -1 +1 -1
AD= 201H9-7-13
(不 具备 )(不 具有 )~
谢谢欣赏
-1 0
0 -1
未登 录
0
-1 +1
0 -1 0 0
0
35
褒贬结构识别模板表达式
2019-7-13
谢谢欣赏
8
项目延伸-网页褒贬态度的机器评价
网页是传递信息的。 从效果上看,人们通过构建网页来传递信 息,也可以进而表达态度和传递情感—— 即,网页所包涵的褒贬态度信息。
2019ቤተ መጻሕፍቲ ባይዱ7-13
谢谢欣赏
9
网页褒贬评价关系分析图
语言
实体
认知
网页内容作者
评价
实体
评价
解读 读者
认知
构造
网页
2019-7-13
实验考察 褒义词 贬义词
固定短语 不固定短语
陈述句 感叹句 比喻等意义辞格 排比等形式辞格
主观标准
领域标准
谢谢欣赏
实验相关
基础褒贬义词典
褒贬评价结构模板
词典部分覆盖评价 形式累计
褒贬评价原则 领域补充褒贬义词集
18
相关工作与工作基础
语言手段 评价规范及标准 资源准备 系统基础
陈宝国:他是“老来瘦”,虽说添了“褶子”,可身梁还在,他是能演一辈子戏的人,看看 《大宅门》就知道。
葛优:在我的《编辑部的故事》之后也沉寂了一段时间,后来演了《活着》,又演了冯小刚
的几部贺岁剧,又火了。他是个可塑性很强的演员,虽说外形让人觉得是“演配角的命”,可别
让他逮着机会,逮着了就能火。
2019-7-13
2019-7-13
谢谢欣赏
19
资源准备
基础褒贬义词典 典型网页文本搜集 领域补充褒贬义词集 褒贬评价模板搜集
2019-7-13
谢谢欣赏
20
基础褒贬义词典
《常用褒贬义词语详解词典》
静态褒义、贬义词语,包括双音词,成语, 惯用语,以及少数谦辞、敬辞。每个词条 包括三部分内容:褒贬色彩,词性,释义, 例句等;提示,重叠形式,同义解析等; 近义,反义等。
2米019色-7-职13 业装,极富亲和力的熟悉的谢微谢笑欣赏,标志性的招手——王小丫来了。22 而似乎侧重防守的马儿在防守时也未尽心。
典型网页文本示例
赵宝刚点评当红明星 2001年05月10日09:48:15 北京晨报 邱俪华
成功
跳至该实体出现的 第一句的句首
是 出现新实体名
否 针对当前实体所属领域处理, 扫描后面的褒贬评价,跳过 任何其他实体的相关评价, 得分输出至得分向量,各具 体评价单位也加入到系统中 该实体的评价记录中
输出当前网页的全部实体谢的谢欣赏
褒贬评价得分
跳至该实体出现的 下一个位置
注:网页褒贬评价流程图
34
谢谢欣赏
23
领域补充褒贬义词集样例
词语 著作等身,桃李满门,创新 悠远、磁性、高亢 尽心、团结 出口成章、机敏、灵 四平八稳 入木三分、活生生 俊秀、俊逸、活力 感染力、理智、沉稳 最佳、绝佳、一流、不俗 楚楚动人、温婉
褒贬含义 + + + + - + + + + +
出现领域 科教 音乐 运动 媒体 媒体 影视 影视 媒体 影视 媒体
周迅:形象也好,气质也好,她是我非常欣赏的那类演员。她在《像雾像雨又像风》里演的 杜心雨,这个人物在文学上很不成功,对演员来说简直没法演,可周迅就能让她“站”起来。
徐静蕾:她的文化修养在同龄的女演员里特别突出,这给她的表演打了很好的底子。可有文 化的不一定成得了好演员,而好演员可以没文化。出于性格的原因,她表演起来很冷静,不会太 投入。再磨一段时间,相信到了火候她就能提高。
2019-7-13
谢谢欣赏
29
网页褒贬态度评价模块
数据需求 设计思想 模块设计
2019-7-13
谢谢欣赏
30
数据需求
网页表示库
网页URL地址 网页长度(按词计)
网页词串 词的词性标注串 词的HTML标记串 网页中人名列表 网页中职务列表 网页中企业或机构名列表
网页中人名—单位关系列表 网页中人名—职务关系列表
2019-7-13
谢谢欣赏
修饰内容 科教专家 嗓音 足球运动员 主持人风格 主持人风格 演员演技 演员外形 主持人风格 演员演技 主持人外形
24
褒贬评价模板搜集样例
a+的+entity Entity+n+a n+的丧失 不a 不乏n 未a
n不够 极富n 勇于v 20N19-7+-13 entity
褒贬结构要素
模板
褒+ 中0 贬- 指标*
(不 )(不 是 )(少 了 )(没 了 ) A (未能 )(未 )(没 能 )(没有 ) -1 0 0 -1
(决不 )
B
(丧失 )(缺乏 )
-1 0 × -1
C
(富有 )(善于 )(富于 )(富 ) (极富 )
+2 +1 ―2
+1
D
(不乏 )(具备 )(具有 )(有 ) +1 0 -1 +1
谢谢欣赏
27
天网知名度系统模块浏览
用户界面模块 用户注册 用户检索 指定文本内容的评价 主动推送服务 网页分析与索引模块 用户信息维护模块 网页相关度评价模块
2019-7-13
谢谢欣赏
28
中文网页褒贬态度的机器评价
引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望
2019-7-13
谢谢欣赏
32
设计思想
语言手段是基础 话题的实体有关性 针对领域标准的褒贬评价
2019-7-13
谢谢欣赏
33
2019-7-13
获得当前网页的全部 人名、词串、词性标注
串
取下一个人名 不成功
取下一个候选实体
成功
获得此人名相关的 成全功部注册实体 ,加
入该网页的实体向
量,并生成对应实 体的得分向量
李晓华把握商机和适当冒险的精神的确有其过人之处。 因此,孙楠的反抗不仅是肤浅的,而且是狭隘的。
曹颖从外表上看更显单薄、弱小。她不像倪萍身材高挑、浓眉大眼,也不 像周涛那样一副典型的中央台“国标”播音员的风韵。
周涛虽然很红,可她太四平八稳,真诚,质朴有余,而灵动,幽默不够。
我喜欢施翌,她清新自然,毫不做作,宛如一位邻家学姐在带着露珠的清 晨为你讲述一切美好的东西,让你一整天都感受到温暖和喜悦。
仅选取了每个条目中的两项信息,例如 (诚挚 +)和(草率 -),生成了褒贬 评价系统使用的褒贬义电子词典。
2019-7-13
谢谢欣赏
21
典型网页文本搜集
季老先生一生勤勉,一生谦和,著作等身,桃李满门。
她不像倪萍身材高挑、浓眉大眼,也不像周涛那样一副典型的中央台“国 标”播音员的风韵。
李保田修养全面,热爱艺术,在表演上精益求精,是影视界优秀的表演艺 术家之一。
U=A+P U=B+P U=C+P U=D+P U=A+A+P=F+P U=A+C+P=G+P U=A+D+P=H+P U=P U=P+E C=“和”|“与”|“,”|“、”|“且” P=W{+C+W2}
2019-7-13
谢谢欣赏
36
关键结构P
p结构是褒贬结构的基本组成部分
2019-7-13
谢谢欣赏
15
相关工作与工作基础
语言手段 评价规范及标准 资源准备 系统基础
2019-7-13
谢谢欣赏
16
实验考察
实验考察
语言手段
评
价
规
词
句
修
语
式
辞
手
手
手
段
段
段
范 及 标 准
2019-7-13
谢谢欣赏
17
实验考察与实验资源的对应分布
词
短语
句式
辞格
修辞标准和规 范
修辞行为,所以实验可以充分利用修辞学
的理论成果,具有理论指导基础。
2019-7-13
谢谢欣赏
13
本实验的研究内容及意义 ——创新价值
从语言学角度看,修辞涉及语言的附加意 义,这区别于概念意义。因而此项实验具 有丰富创新性研究价值。
2019-7-13
谢谢欣赏
14
中文网页褒贬态度的机器评价
引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望
楚楚动人的小丫
这姑娘脑袋灵
诚信的丧失
不心浮气燥
不乏可圈可点之处
而似乎侧重防守的马儿在防守时也 未尽心
灵活性不够
极富亲和力的熟悉的微笑
勇于开拓前进
美女曹谢谢颖欣赏
25
相关工作与工作基础
语言手段 评价规范及标准 资源准备 系统基础
2019-7-13
谢谢欣赏
26
天网知名度系统
2019-7-13
解析 机器
认知
评价
实体
语言
语言
2019-7-13
谢谢欣赏
10
引言
天网知名度系统 网页观察-机器评价视角下看中文网页类型 项目延伸-网页褒贬态度的机器评价 本实验的研究内容及意义
2019-7-13
谢谢欣赏
11
本实验的研究内容及意义 ——项目延续
符合天网知名度系统个性化网络服务的立意
2019-7-13
谢谢欣赏
31
数据需求
实体信息库
所在的领域
名字 所在工作单位 职业描述 兼职单位 社会形象 特征词 代表作
共计10类,政府,科教,文学,业界,媒体,歌星,音 乐,影视,体育,艺术 包括别名、笔名、艺名等潜在可能代表实体的名字 例如,北京大学 例如,主席、书记、教授、记者、演员 可以有多个 例如,国学大师,环保大使 用户关心的特征描述 著作名、作品名、产品名等
中文网页褒贬态度的机器评价
导师:X教授,X教授
硕士毕业生:X
2019年5月 硕士学位论文答辩
2019-7-13
谢谢欣赏
1
中文网页褒贬态度的机器评价
引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望
2019-7-13
谢谢欣赏
2
引言
天网知名度系统 网页观察-机器评价视角下看中文网页类型 项目延伸-网页褒贬态度的机器评价 本实验的研究内容及意义
2019-7-13
谢谢欣赏
3
天网知名度系统
基础:天网搜索引擎,计算语言学技术 定位:用户定制查询,个性化网络检索服务 数据:75万中文网页,近300个名人实体
2019-7-13
谢谢欣赏
4
注册实体信息库
所在的领域
名字 所在工作单位 职业描述 兼职单位 社会形象 特征词 代表作
政府,科教,文学,业界,媒体,歌星,音乐,影 视,体育,艺术(共10类)
可以利用已有的数据基础和实验平台
此项实验具有研究和实验展开的可延续性
2019-7-13
谢谢欣赏
12
本实验的研究内容及意义 ——语言基础
网络是重要的信息传播媒介。
现实网页中的褒贬态度表达往往含有明确 的目标、动机和效果期望,因此构造者会 很重视语言知识这个交流手段。
网页中的褒贬态度表达也就是一个典型的
王志文:《过把瘾》之后沉寂了一段时间。从他这两年出的两部戏可以看出,这段时间他没 浪费,磨出了更深的功力。他是一定能成艺术家的那类人。
江珊:《过把瘾》之后有五年都没接到好角色,她是个很适合演普通百姓的演员,不能太“ 贵族”了,那样看着不像她,观众也接受不了。
陆毅:千万别“吃”形象,形象早晚会“吃完”,到时就得靠功力了。如果他能不断演些富 有挑战性的角色而不是重复过去,将来走到哪里都不怕。
包括别名、笔名、艺名等潜在可能代表实体的名字 例如,北京大学 例如,主席、书记、教授、记者、演员 可以有多个 例如,国学大师,环保大使 用户关心的特征描述 著作名、作品名、产品名等
2019-7-13
谢谢欣赏
5
引言
天网知名度系统 网页观察-机器评价视角下看中文网页类型 项目延伸-网页褒贬态度的机器评价 本实验的研究内容及意义
注:考虑到褒贬评价的领域性,这里的未证褒贬
2019-7-1词3 语也是根据领域来谢分谢欣别赏 记录的。
37
中文网页褒贬态度的机器评价
引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望
识别策略是:使得由链接词语链接在一起的词序 列中不允许出现褒贬互逆,同时需要满足,仅当 词语本身具有褒贬含义,或者W本身不在褒贬词
典中但该序列中其他词语有褒贬含义,此时才形 成合法的P,同时把未在褒贬词典中出现但出现
在结构中的这个词语抽取出来,并依照此序列中
的已有褒贬含义按照一致性原则猜测,把这个未 登录词语纪录为未证褒贬词语。
2019-7-13
谢谢欣赏
6
网页观察-机器评价视角下 看中文网页类型
强文字相关的信息类网页 例如:个人简历型网页
弱文字相关的事件或事物展开型网页 例如:事件报道,节目单
2019-7-13
谢谢欣赏
7
引言
天网知名度系统 网页观察-机器评价视角下看中文网页类型 项目延伸-网页褒贬态度的机器评价 本实验的研究内容及意义
E
(的 缺失 )(的 丧失 )(不够 ) -1 -1 × -1
AA=F
(不 是 不 )(没有 不 )~
000
0
AC=G
(不 善于 )(不 富于 )~
-1 -1 +1 -1
AD= 201H9-7-13
(不 具备 )(不 具有 )~
谢谢欣赏
-1 0
0 -1
未登 录
0
-1 +1
0 -1 0 0
0
35
褒贬结构识别模板表达式
2019-7-13
谢谢欣赏
8
项目延伸-网页褒贬态度的机器评价
网页是传递信息的。 从效果上看,人们通过构建网页来传递信 息,也可以进而表达态度和传递情感—— 即,网页所包涵的褒贬态度信息。
2019ቤተ መጻሕፍቲ ባይዱ7-13
谢谢欣赏
9
网页褒贬评价关系分析图
语言
实体
认知
网页内容作者
评价
实体
评价
解读 读者
认知
构造
网页
2019-7-13
实验考察 褒义词 贬义词
固定短语 不固定短语
陈述句 感叹句 比喻等意义辞格 排比等形式辞格
主观标准
领域标准
谢谢欣赏
实验相关
基础褒贬义词典
褒贬评价结构模板
词典部分覆盖评价 形式累计
褒贬评价原则 领域补充褒贬义词集
18
相关工作与工作基础
语言手段 评价规范及标准 资源准备 系统基础
陈宝国:他是“老来瘦”,虽说添了“褶子”,可身梁还在,他是能演一辈子戏的人,看看 《大宅门》就知道。
葛优:在我的《编辑部的故事》之后也沉寂了一段时间,后来演了《活着》,又演了冯小刚
的几部贺岁剧,又火了。他是个可塑性很强的演员,虽说外形让人觉得是“演配角的命”,可别
让他逮着机会,逮着了就能火。
2019-7-13
2019-7-13
谢谢欣赏
19
资源准备
基础褒贬义词典 典型网页文本搜集 领域补充褒贬义词集 褒贬评价模板搜集
2019-7-13
谢谢欣赏
20
基础褒贬义词典
《常用褒贬义词语详解词典》
静态褒义、贬义词语,包括双音词,成语, 惯用语,以及少数谦辞、敬辞。每个词条 包括三部分内容:褒贬色彩,词性,释义, 例句等;提示,重叠形式,同义解析等; 近义,反义等。