自然语言处理-河北大学网络空间安全与计算机学院

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究生课程教学大纲

《自然语言处理》

《Natural Language Processing》

36 学时; 2 学分

一、课程简介

自然语言处理是用计算机通过可计算的方法对自然语言的各级语言单位进行转换、传输、存贮、分析等加工处理的科学。是一门与语言学、计算机科学、数学、心理学、信息论等相联系的交叉性学科。

通过本课程的学习,使学生掌握自然语言处理技术的基本概念、基本原理和主要方法,了解当前国际国内语言处理技术的发展现状,掌握自然语言处理技术统计学方法,为学生从事自然语言学处理相关领域的研究与开发打下坚实的理论及工程基础。

二、预修课程及适用专业

预修课程:概率论与数理统计

适用专业:计算机科学与技术、计算机技术、软件工程、信息安全

三、课程内容及学时分配

第1章绪论(2学时)

讲授内容:

1.1什么是自然语言处理

1.2自然语言处理面临的困难

1.3学科现状

教学目标:了解自然语言处理基本概念,了解自然语言处理的关键问题。

第2章语料库与词汇知识库(4学时)

讲授内容:

2.1语料库

2.2词汇知识库

教学目标:掌握语料库研究方法

第3章 n元语法模型(4学时)

讲授内容:

3.1 n元语法的基本概念

3.2数据平滑技术

3.3开发和测试模型的数据集

3.4基于词类的n—gram模型

教学目标:使学生理解和掌握自然语言的数学模型

第4章隐马尔科夫模型(4学时)

讲授内容:

4.1马尔科夫模型

4.2隐马尔科夫模型

4.3 HMM的三个基本问题

教学目标:使学生理解用隐马尔科夫模型处理自然语言问题

第5章常用机器学习方法(4学时)

讲授内容:

5.1 决策树

5.2贝叶斯分类器

5.3支持向量机

5.4最大熵模型

5.5感知器

5.6 Boost1ng

教学目标:使学生了解机器学习方法

第6章字符编码与字频统计(4学时)

讲授内容:

6.1西文字符编码

6.2中文字符编码

6.3字符编码知识的作用

6.4字频统计

教学目标:使学生掌握字符编码知识及在自然语言处理中使用方法第7章词法分析(4学时)

讲授内容:

7.1汉语自动分词及其基本问题

7.2基本分词方法

7.3汉语自动分词系统的评价

7.4英语形态还原

7.5词性标注

教学目标:使学生理解和掌握汉语分词原理和方法。

第8章句法分析(6学时)

讲授内容:

8.1文法的表示

8.2自顶向下的句法分析

8.3自底向上的句法分析

8.4概率上下文无关文法

8.5浅层句法分析

8.6句法分析系统评测

教学目标:

第9章语义分析(4学时)

讲授内容:

9.1词义消歧

9.2语义角色标注

9.3深层语义推理

教学目标:使学生理解和掌握语义分析原理和方法。

四、教学方法及要求

课堂讲解为主,结合讨论及现场分析实验原理及结果。

五、考核办法

开卷考试(70%)结合专题报告(30%)。

六、参考书籍及阅读文献资料

[1] 王晓龙,关毅. 计算机自然语言处理. 北京:清华大学出版社,2005

[2] 陈鄞. 自然语言处理基本理论和方法哈尔滨:哈尔滨工业大学出版社,2013

[3] 江铭虎. 自然语言处理. 北京:高等教育出版社,2006

[4] 宗成庆. 统计自然语言处理. 北京:清华大学出版社, 2013

[5]Elisabete Ranchhod. 自然语言处理进展. 湖南文艺出版社,2002

[6]Lecture Notes in Artificial Intelligence.Springer Science.

/series/1244

开课单位:计算机科学与技术学院

编写人:李新福

审定人:王亮

编写日期:2015年6月3日

相关文档
最新文档