同济大学中文信息处理期末试卷
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同济大学中文信息处理期末考试A卷
课程名称:中文信息处理专业:计算机科学与技术、信息安全
学号:姓名:成绩:
一、填空题:
1、分词单位是指汉语信息处理使用的、具有确定的语义或语法功能的基本单位,包括和少量。
2、所谓框架,是由、、和组成的抽象数据结构。
3、机械分词方法无法解决分词阶段的两大问题——
和,影响了分词的准确率。
4、对于语法分析而言,自动标注的性能采用性能来衡量较好。
5、对于齐次的马尔可夫过程而言,一旦知道了它的
和,它的统计性质,即它的任意有限维分布就完全确定了。
6、若将词的生成过程看作一个HMM,其中构成一个时齐的马尔可夫过程,而则服从多项概率分布。
7、在上下文无关(CFG)规则库中出现的符号包括:终结符和非终结符。通常地,终结符就是,非终结符就是。
8、将一个句子映射到它的的过程称为语义解释。
9、动词及其参数之间存在一组抽象的语义关系,这些关系一般称为。
10、自然语言处理是领域与领域中的一个重要研究方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
二、简答题:
1、什么是自然语言理解,什么是自然语言生成?请列举三个自然语言研究的应用领域。
2、请运用树结构形式表示下面句子的结构。
那位老人在公园散步。
3、在语义分析阶段,采用选择限制法消除歧义的基本思想是什么?
三、请描述下面句子采用逆向最小匹配分词的过程(设MAXL=4)。
他的确切地址在这里。
四、请根据下面的语法规则,给出下面句子的双向图语法分析过程。
他是好学生。
语法规则如下:(#pronoun表示pronoun是触发类)
⑴ NP ⇒#pronoun
⑵ NP ⇒#noun
⑶ NP ⇒#adj noun
⑷ VP ⇒#verb
⑸ SUBJ ⇒#NP
⑹ PRED ⇒#VP NP
⑺ S ⇒ SUBJ #PRED
五、请根据给定的语法规则、ACTION表和GOTO表,写出对下面句子进行LR语法分析的过程。
句子:He is a *.(其中*表示未登录词)
语法规则:
(1) S ⇒ NP VP
(2) S ⇒ S PP
(3) NP ⇒ *n
(4) NP ⇒ *det *n
(5) NP ⇒ NP PP
(6) PP ⇒ *prep NP
(7) VP ⇒ *v NP
state *det *n *v *prep $ NP PP VP S
0 Sh3 Sh4 2 1
1 Sh6 acc 5
2 Sh7 Sh6 9 8
3 Sh10
4 Re3 Re3 Re3
5 Re2 Re2
6 Sh3 Sh4 11
7 Sh3 Sh4 12
8 Re1 Re1
9 Re5 Re5 Re5
10 Re4 Re4 Re4
11 Re6 Re6 Sh6 Re6 9
12 Re7 sh6 Re7 9
六、句子“The dishwasher reads the article”的逻辑形式如下:(READS1 rl[AGENT
READSl选择限制如下所示:
(AGENT READSl PERSON)——AGENT必须是人。
(THEME READSl TEXTOBJ)——THEME必须是一个TEXTOBJ对象。