英语作文自动评分系统研究与实现
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要求,该系统提取作文内容等一系列特征进行综合考评,使用自然语言处理、文本特征提取、
潜在语法分析等技术,实现英语作文自动评分功能。本系统可通过添加自定义的停用词词典,而扩展运用到更多的场景。
关键词:自动评分;潜在语义分析;文本特征提取
中图分类号:TP319
文献标识码:A
最早的英语作文自动评分(AutomatedEnglishScoring, 简称 AES)系统是 1966 年由美国杜克大学的 Ellis Batten
收稿日期:2018-12-17 基金项目:江苏省基础教育资源网络化工程 技术中心开放项目:英语学习智能考评关键技术研 究(项目编号:BM2013123);南京晓庄学院科研 项目:E-learning 个性化学习评价和指导关键技 术 研 究( 项 目 编 号:2016NXY46); 江 苏 省 大 学 生创新创业训练计划项目:英语作文自动评分关键 技术研究(项目编号:201711460031Y)。
Abstract:With the development of artificial intelligence technology in recent years,computer technology has been more and more applied to the field of education. The automatic scoring of English composition is also one of the aspects to achieve automatic scoring of English composition. In order to meet the requirement of automatic scoring of English compositions,the system extracts a series of features such as the content of the compositions for comprehensive evaluation,and uses natural language processing,text feature extraction,potential grammar analysis and other technologies to achieve automatic scoring of English compositions. The system can be extended to more scenarios by adding a custom dictionary of stop words.
文章编号:2096-4706(2019)04-0027-03
Research and Implementation of English Composition Automatic Scoring System
ZHANG Ruijie,SONG Wanli,LIU Qi,FAN Yuanyuan,JIANG Dairui,GE Yipeng (Nanjing Xiaozhuang University,Nanjing 211171,China)
Page 等学者开发的 PEG(Porject Essay Grader),后来 许多 AES 系统被开发、实验甚至投入商用,例如:IEA、 E-Rater、IntelliMetric、BETSY 等。其中最具代表性的有 PEG、IEA 和 E-Rater 三种 [2]。这三种系统在考评时侧重点 不同:PEG 重点比较表层语言特征,包括用词、句型、结构等; IEA 侧重考察作文内容,即浅层语义;E-Rater 在作文的表 现形式和内容意义两个方面均有考虑。国内的相关研究起步 较晚,但近几年许多学者都开始在英语作文自动评分上投入 精力与成本。目前国内也已经有一些投入使用的 AES 系统, 如句酷批改网、新东方批改网和冰果英语作文评阅系统等。 也有学者实地研究并得出结论,英语作文自动评分系统作为 大学英语辅助教学工具,可以帮助学生在写作时养成更加关 注句法运用、篇章逻辑结果等习惯,进而有效提高学生写作 和自主学习的能力 [3]。目前许多学者追求的目标就是在可预 计的未来中,能在考试场景中应用英语作文自动评分系统。 本文在调研大量文献的基础上,使用自然语言处理、文本特 征提取、潜在语法分析等技术,实现英语作文自动评分。
2019 年 2 月 25 日 第3卷 第4期
现代信息科技 Modern Information Technology
Feb.2019 Vol.3 No.4
英语作文自动评分系统研究与实现
张锐捷,宋万里,刘琪,范圆圆,姜戴锐,葛艺
(南京晓庄学院,江苏 南京 211171)
摘 要:随着近几年来人工智能技术的发展,计算机技术被越来越多地应用到教育领域,英语作文自动评分就是其中的一
1 系统设计
本系统通过预处理文本、提取文本关键字等技术先对作 文进行预处理,提取能代表作文内容的特征单词;之后将这 些特征单词应用于潜在语义模型中,获得能代表作文内容的 特征项;接着提取作文语言方面的信息,如单词正确率,语 法错误情况,句子的长度等,作为作文语言方面的特征项; 然后将这些特征共同组成代表作文写作水平的特征向量;最
Keywords:automatic scoring;latent semantic analysis;text feature extraction
0引言
计算机越来越广泛地被运用到辅助教学的场景中,在英 语助教领域也有点读机、视频教学、智能翻译等多种应用。 在英语教学过程中,听、说、读、写都是英语的基本技能, 在日常的教学、训练、考核中,写作能力是比较难培养的 [1], 也是最耗费老师精力的。写作作为一种语言输出形式,是评 价学生英语综合水平和应用能力的一个重要指标。目前国内 英语大规模考试中,如:英语高考、大学生英语四、六级考试, 都有英语作文写作的考核,但是在阅卷的时候英语作文区别 于客观题需要进行人工阅卷,人工阅卷不仅在判题时有较强 的主观性,甚至需要多人重复判一份试卷来保证结果的公正, 这会导致工作量翻倍,耗费优秀教师大量的时间和精力。英 语作文自动评分系统的开发和使用,可有效的解决上述问题。
潜在语法分析等技术,实现英语作文自动评分功能。本系统可通过添加自定义的停用词词典,而扩展运用到更多的场景。
关键词:自动评分;潜在语义分析;文本特征提取
中图分类号:TP319
文献标识码:A
最早的英语作文自动评分(AutomatedEnglishScoring, 简称 AES)系统是 1966 年由美国杜克大学的 Ellis Batten
收稿日期:2018-12-17 基金项目:江苏省基础教育资源网络化工程 技术中心开放项目:英语学习智能考评关键技术研 究(项目编号:BM2013123);南京晓庄学院科研 项目:E-learning 个性化学习评价和指导关键技 术 研 究( 项 目 编 号:2016NXY46); 江 苏 省 大 学 生创新创业训练计划项目:英语作文自动评分关键 技术研究(项目编号:201711460031Y)。
Abstract:With the development of artificial intelligence technology in recent years,computer technology has been more and more applied to the field of education. The automatic scoring of English composition is also one of the aspects to achieve automatic scoring of English composition. In order to meet the requirement of automatic scoring of English compositions,the system extracts a series of features such as the content of the compositions for comprehensive evaluation,and uses natural language processing,text feature extraction,potential grammar analysis and other technologies to achieve automatic scoring of English compositions. The system can be extended to more scenarios by adding a custom dictionary of stop words.
文章编号:2096-4706(2019)04-0027-03
Research and Implementation of English Composition Automatic Scoring System
ZHANG Ruijie,SONG Wanli,LIU Qi,FAN Yuanyuan,JIANG Dairui,GE Yipeng (Nanjing Xiaozhuang University,Nanjing 211171,China)
Page 等学者开发的 PEG(Porject Essay Grader),后来 许多 AES 系统被开发、实验甚至投入商用,例如:IEA、 E-Rater、IntelliMetric、BETSY 等。其中最具代表性的有 PEG、IEA 和 E-Rater 三种 [2]。这三种系统在考评时侧重点 不同:PEG 重点比较表层语言特征,包括用词、句型、结构等; IEA 侧重考察作文内容,即浅层语义;E-Rater 在作文的表 现形式和内容意义两个方面均有考虑。国内的相关研究起步 较晚,但近几年许多学者都开始在英语作文自动评分上投入 精力与成本。目前国内也已经有一些投入使用的 AES 系统, 如句酷批改网、新东方批改网和冰果英语作文评阅系统等。 也有学者实地研究并得出结论,英语作文自动评分系统作为 大学英语辅助教学工具,可以帮助学生在写作时养成更加关 注句法运用、篇章逻辑结果等习惯,进而有效提高学生写作 和自主学习的能力 [3]。目前许多学者追求的目标就是在可预 计的未来中,能在考试场景中应用英语作文自动评分系统。 本文在调研大量文献的基础上,使用自然语言处理、文本特 征提取、潜在语法分析等技术,实现英语作文自动评分。
2019 年 2 月 25 日 第3卷 第4期
现代信息科技 Modern Information Technology
Feb.2019 Vol.3 No.4
英语作文自动评分系统研究与实现
张锐捷,宋万里,刘琪,范圆圆,姜戴锐,葛艺
(南京晓庄学院,江苏 南京 211171)
摘 要:随着近几年来人工智能技术的发展,计算机技术被越来越多地应用到教育领域,英语作文自动评分就是其中的一
1 系统设计
本系统通过预处理文本、提取文本关键字等技术先对作 文进行预处理,提取能代表作文内容的特征单词;之后将这 些特征单词应用于潜在语义模型中,获得能代表作文内容的 特征项;接着提取作文语言方面的信息,如单词正确率,语 法错误情况,句子的长度等,作为作文语言方面的特征项; 然后将这些特征共同组成代表作文写作水平的特征向量;最
Keywords:automatic scoring;latent semantic analysis;text feature extraction
0引言
计算机越来越广泛地被运用到辅助教学的场景中,在英 语助教领域也有点读机、视频教学、智能翻译等多种应用。 在英语教学过程中,听、说、读、写都是英语的基本技能, 在日常的教学、训练、考核中,写作能力是比较难培养的 [1], 也是最耗费老师精力的。写作作为一种语言输出形式,是评 价学生英语综合水平和应用能力的一个重要指标。目前国内 英语大规模考试中,如:英语高考、大学生英语四、六级考试, 都有英语作文写作的考核,但是在阅卷的时候英语作文区别 于客观题需要进行人工阅卷,人工阅卷不仅在判题时有较强 的主观性,甚至需要多人重复判一份试卷来保证结果的公正, 这会导致工作量翻倍,耗费优秀教师大量的时间和精力。英 语作文自动评分系统的开发和使用,可有效的解决上述问题。