新版自然语言处理导论课复习提纲课件.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“自然语言处理导论”课复习提纲
上半部分(参考材料:课程讲义)
第1讲绪论:什么是自然语言处理(NLP)
1.请举例说明自然语言和人工语言有哪些差异。
2.请举例说明语言知识与自然语言处理之间的关系。
第2讲中文文本的自动分词
3.计算机对中文文本进行自动分词的困难主要有哪些?
4.请概括说明最大匹配法分词和最大概率法分词的基本思想。二者是什么关系?
5.分词质量的常用评价指标主要有哪些?
第3讲词性标注方法
6.请举例说明汉语的基本句法结构类型有哪些,各类结构的主要特点是什么。
7.请举例说明汉语的主要词类有哪些,各类词的特点是什么。
8.请概述用隐马尔可夫(HMM)模型进行词性标注的基本思想是什么。
9.请概述韦特比算法(Viterbi)的主要过程。
10.请概述基于转换的错误驱动的词性标注方法的主要思想及其处理流程。
第4讲汉语的句法结构分析(上)
11.什么是有限状态文法,上下文无关文法,两种文法的区别是什么。
12.自底向上的句法分析与自顶向下的句法分析的区别是什么。
13.Earley算法。
14.Tomita算法。Tomita算法对LR算法的主要改进是什么。
第5讲汉语的句法结构分析(下)
15.请举例说明句法结构歧义有哪些不同的类型。
16.什么是特征结构?请举例说明如何运用特征结构表达自然语言知识。
17.什么是合一运算(Unification)?请举例说明如何运用合一运算表达自然语言知识。
18.请概述如何在Earley算法中融入合一运算。
第6讲语义分析*
19.请举例说明自然语言中形式和意义之间的对应关系有哪些情况。
20.义素分析法。
21.配价分析法。
22.请举例说明如何利用语义知识来帮助消除句法结构分析中的歧义。
*不在考题范围内但属于本课程应掌握的知识内容。
下半部分
参考材料:Steven Bird, Ewan Klein and Edward Loper. 2009. Natural Language Processing with Python. O’Reilly Media.
参见教学网页中对各章节的具体说明。
特别说明,期末考试第8章第1、2、3、4节及第6章第4、5、6节不作要求。
在复习中,注意区分熟悉1、了解2等不同层次的要求。
1对涉及的NLTK包及Python语言,掌握其核心的编程技能,对琐碎的细节并不做要求。
2对涉及的NLTK包及Python语言,知道其常识的编程知识,对琐碎的细节并不做要求。