对文本智能处理技术选修课教学的思考和实践
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对文本智能处理技术选修课教学的思考和实践
摘要:针对文本智能处理技术课程的特点及实际教学状况,分析选修课教学的困境及需要达到的目标,提出教学内容应贴近前沿、形象生动,以激发学生好奇心。应用“做中学”以及“学中做”的教学方法,说明如何采用重过程、轻结果的素质评价机制。
关键词:文本智能处理技术;选修课教学;做中学;学中做;重过程轻?Y果
文章编号:1672-5913(2017)05-0096-03
中图分类号:G642
0 引言
近年来,不论在学术界还是产业界,人工智能都成了最热门的技术,研究者和创业者纷纷看好人工智能的前景。自然语言处理是人工智能方向一个很重要的分支,随着IBM研发的Waston打败人类选手,自动问答技术重新成为最热门的研究方向。目前,很多高校和研究院所在硕士阶段开设了相关课程,比如清华大学的计算语言学课程、北京大学的计算语言学及语义计算与知识检索课程、哈尔滨工业大学的统计自然语言处理和命名实体识别与信息抽取课程。东北大学自然语言处理(NLP)实验室自1980年成立至今,在自然语
言处理方向做了很多细致深入的研究工作。为了让计算机科学与技术专业学生尽早接触和了解NLP这个方向,开阔学术视野,东北大学从2006年开始在本科阶段开设文本智能处理技术选修课程。该课程是本科生自然语言处理方向的入门课程,主要涉及如何让计算机理解人类语言并进行进一步处理。课程内容涵盖自然语言处理学科的基本理论,以讲解最具挑战的问答系统为主轴,介绍文本处理的主要技术。课程的目标是通过该课程的学习,让学生掌握处理自然语言的基本理论,了解文本智能处理的常用模型和算法,初步具备从事该领域相关工作的能力。
专业选修课是必修课的重要补充,该部分教学环节的创新与突破是学生全方位发展的关键[1]。为了提高教学质量,教学团队每年进行学生问卷调查,了解学生的学习需求及对该课程教学的意见和建议。经过近10年的不断摸索,在收集整理学生建议以及分析学习效果的基础上,学校不断调整教学内容和教学方式,提高了课程的教学质量,得到学生的充分认可。
1 增加课程趣味性,激发学生好奇心
由于本门课程是选修课,学生在选择课程的时候怀着不同目的:有的是了解和喜欢这门课程的学习内容,有的仅仅为了获得学分,有的持观望态度,先上着看看。因此,如何在课程的开始抓住学生的注意力,激发学生的好奇心和学习
愿望是很重要的事情[2]。在教学过程中,教学团队非常重视第一次课的教学及效果。在第一次课上,教师将日常生活中使用的互联网应用与课程内容挂钩,比如百度后台的搜索技术、淘宝购物时的自动推荐技术、Google和搜狗拼音输入法、门户网站的新闻自动分类、垃圾邮件过滤技术等,让学生们对将要学习的技术有直观的了解。同时,挑选有趣味性的、简单易理解的、与课程相关的视频供学生观看。比如用百度的“百度更懂中文”引导学生对中文分词的认识和兴趣,用电影《超能陆战队》中大白的行动及对话引出课程的主体教学内容――自动问答系统。通过问卷调查的方式让学生们思考:制造一个这样的机器人需要哪些技术?是否能够实现?如果你设计制造一个类似的机器人,你会怎样设计?在2015年,笔者对144名选课学生进行了调查,结果见表1。该结果也用来支撑2015年自然语言处理青年学者研讨会上Panel 的主题讨论。
学生在思考的过程中,可以认识到自己欠缺哪些知识。在后期的课程教学过程中,教师讲解更有针对性,学生也知道具体的知识点和技术的实用性,做到目标清晰明确,学习热情高涨。
另外,教师在课程内容设置方面紧跟自然语言处理领域的最新研究发展方向、研究热点以及应用需求,充分激发学生的求知欲,因此课程的教学课件每年都会更新。这样,学
生不会觉得学到的东西是过时的、无用的,间接提高了学生学习的积极性。
2 “做中学”和“学中做”的教学方法
2.1 “做中学”的教学方法实践
做中学是美国教育家杜威提出的一种教育思想,侧重做,将学生的被动学习转变为主动学习[3]。课程团队结合教学内容,认真设计了每次课的讲授内容,以设计与实现面向医疗领域的自动问答系统为目标,结合知识点将庞大的系统分解为能够在一周左右完成的小任务。在需求分析、总体设计、详细设计、算法选择、系统实现和系统测试等各个环节上加强指导。
1)加强技术储备。
为了更好地实施做中学,笔者给学生增加了Linux操作
系统实验平台的讲解与指导,让学生接触不同操作系统下设计系统的不同点以及各系统的优缺点;增加了Python脚本语言的讲解与实验,该语言因其庞大的自然语言处理库而成为本方向最热门的编程语言之一;在实验平台以及编程技术储备准备好之后,给学生提供目前较好的问答系统开源工具DeepQA;通过演示与课后自行操作,让学生了解问答系统各个模块执行的结果,对该新技术有直观的了解,进而思考设计自己的问答系统。
2)提倡团队协作。
由于问答系统很庞大,一个学生在10周左右很难完成
全部内容。另一方面,为了锻炼学生的团队协作能力,采取团队形式来布置任务。在具体的系统实现过程中,要求3~5人组成一个小组完成所有的系统开发内容。
3)改进指导方式。
在课堂上主要讲解文本智能处理技术的来源方法,并分析问题;课下通过BlackBoard教学平台以及QQ群等方式,做到随时沟通和指导。由于任课教师的精力有限,不可能面面俱到,而在QQ群里大家可以看到其他学生的问题与解答,这样充分地调动了学生的积极性,也减轻了任课教师的负担。
2.2 “学中做”的教学方法实践
学中做主要以讲授为主,以做为辅[4]。理论知识算法以示例形式展示给学生。比如讲解分词技术时,提前准备一段文字发给学生,让学生根据自己头脑中的知识和对母语的本能认识,完成对文字的分词,然后将人工分词的过程总结成算法记录下来。在此过程中,授课教师会查看学生的思路,总结人工分词过程中存在的问题。通常,学生在手工分词的过程中会发现一些问题,比如分词的粒度怎么把握、机器怎么区分词的边界等。带着这些问题,教师会从基于词典的最大匹配分词讲起,直到将分词问题转换为序列标注问题,采用条件随机场来解决分词问题。这样逐步引导学生解决问题,在此基础上讲解最新的理论知识。通过这种“学中做”教学