基于数据挖掘的研究生课堂学生全口径接收效果测算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于数据挖掘的研究生课堂学生全口径接收效果测算
作者:马晓君,刘艳,程超超等
来源:《中外企业家》 2017年第3期
马晓君,刘艳,程超超,刘亚雪,魏晓雪
(东北财经大学,辽宁大连 116025)
摘要:创新性地以“东北财经大学课堂接收效果问卷调查”中学生、教师、环境这三方
面影响因素对应的课堂客观情况答卷结果为依托,并分别利用支持向量机与文本挖掘方法进行
研究,最后将二者结果对比分析课堂接收效果影响因素。
在数据挖掘结果与文本挖掘结果中,
教师的课堂互动因素在上述两种方法的研究结果呈现出来。
说明本文的结论具有一定的参考价值。
关键词:教学效果;影响因素;支持向量机;TF-IDF
中图分类号:G642文献标志码:A文章编号:1000-8772(2017)07-0232-02
引言
随着我国高等教育招生规模的提升,高等教育的大众化已基本实现,研究生的规模也迅速
扩大,因此研究生课堂教学质量逐渐成为各大高校关注的焦点问题之一。
而课堂接收效果直接
影响研究生课堂教学质量,进而影响人才的培养。
因此,调查、了解研究生的课堂状态,深入
研究影响课堂接收效果的因素,对于提升研究生课堂质量具有十分重要的现实意义。
本文通过
调查东北财经大学研究生课堂行为,挖掘影响大学课堂效果的相关因素,归纳出其主要影响因
素并从中寻求提升大学课堂效果的可行性策略。
一、文献综述
刘华和李瑗[1]通过教学态度,教学内容,教学方法这三个指标打分情况,进而利用Microsoft决策树算法,Microsoft关联算法和Microsoft聚类分析法挖掘模型进行挖掘分析。
骆懿玲[2]基于元规则约束的关联挖掘进行课堂教学质量评价挖掘,并得出分析结果,给出建议。
邵珠艳等[3]利用灰色关联分析,对影响课堂教学效果的因素打分后进行分析。
叶勇[4]将云模
型引入到遗传算法,再用改进遗传算法对支持向量机参数进行优化,并与BP神经网络、多元线性回归模型比较,以便对课堂教学质量的模型评价效果进行评价。
袁万莲和郑诚[5]利用关联规则进行数据挖掘,得出与教学质量相关因素是教师的学历、职称以及教龄;职称为讲师、教龄
较长或者高级职称、高学历的教师教学质量较好。
张震等[6]将评价指标大致分为教学态度、教学内容、教学水平以及教师研究能力,利用关联规则进行数据挖据。
戴俊[7]以教师因素,学生因素,师生双方因素以及环境因素和考试成绩作为变量,通过主成分回归方法对影响课堂教学
效果的因素进行分析,为改进教学评价方式与提高课堂教学效果提供理论参考。
许云华等[8]设计调查问题为“您最想对课堂教学提的意见”“改进方法”“如何实现从被动学习向动吸收知
识的转变”,基于扎根理论对上述问题答案进行分析并得出分析结果。
柴志贤和邱风[9]借鉴过程—成果研究方法,在以往研究的教师职称、年龄、所教年级、课程类别这些教师背景变量的
基础上,增加教学素质、教学技能与教学责任心这三个影响因子进行分析,从而为提高高校课
堂教学效果提供一定经验指导。
二、理论
(一)支持向量机(SVM)
支持向量机是由Corinna Cortes和Vapnik等在1995年首先提出的,是一种基于统计学习原理的数据挖掘技术。
支持向量机分为支持向量回归机和支持向量分类机,本文主要应用支持
向量分类机进行数据挖掘。
支持向量机分类的核心是找到两相互平行并且间隔(margin)最大,并能将属于不同类别的样本点正确分开的边界,位于两边界中间位置并与之平行的超平面,称
之为最大边界超平面,即为最终解。
(二)TF-IDF
TF-IDF是一种判断词语在文件中重要性程度的加权统计方法。
一个词语在文件中出现的频
率越高,它对这个文件来说就越重要;这个词语在整个语言中出现的频率越高,它对这个文档
来说越不重要。
TF-IDF可以利用计算机技术在不需要人工进行干预的情况下提取文件中的关键词,并快速对词频进行统计,常被用于文本挖掘和信息检索等前言领域。
TF-IDF的主要思想是:若某个词在其他文件中很少出现,但在这一文件中出现的频率高,那么它极有可能反映了这一
文件的特性,则认为它很适合用来分类,因为它具有很好的类别区分能力。
TF-IDF实际上代表
的是TF*IDF,TF表示词频,IDF表示逆文件频率。
三、模型
(一)数据来源
1.变量选取
为了获得教师因素、学生因素以及环境因素这三个变量的有效数据,笔者精心设计一份调
查问卷,影响因素分为教师、学生及环境。
教师因素中包括:学与生互动情况、授课方法、课
堂考勤、按时上下课、PPT使用情况、普通话水平、讲课声音大小、作业布置情况以及课程考
查形式。
学生因素包括:出勤状况、遇到问题交流情况、课下与同学和老师交流情况、学习状态、听课表现、上课做笔记情况、课程内容掌握情况以及课堂上的感受。
环境因素包括:上课
时周边环境、所用教室类型、课程安排上下学期情况、上机教学与否、教学设备、授课时间段、授课时长以及教室卫生环境。
2.数据获取
在调查对象的选择上,我们主要以东北财经大学研究生为调查对象,发放线上调查问卷,
让学生认真对自己所学课程中某一门课的教学效果进行评价。
(二)数据挖掘过程及结果
(1)读入数据。
选择源选项卡中的excel节点,将调查问卷中数据导入到clementine中。
(2)数据审核。
选择输出选项卡中的数据审核节点连接到excel节点上,由审核结果可知,Q5变量的类别比为90∶9∶1,单个类别值过大,会影响建模的精确程度,故应删除。
(3)数据分区。
利用分区节点将数据进行分区,其中70%为训练集,其余30%为测试集。
(4)变量相关性分析。
利用统计量节点分析变量之间的相关性,若相关性高,需要剔除相关变量,反之则不需剔除。
经测试,在本文的变量中未发现高相关性变量,因此无需剔除变量。
(5)得分变量重新分类。
利用“重新分类”节点将得分变量分类,其中0—7分为一类,8、9、10分为另一类。
(6)特征选择建模。
选择建模选择项卡中的特征选择节点,将其连接到数据流的恰当位置上。
(7)支持向量机建模。
提取上一步得到的重要变量,选择建模选择项卡中的SVM节点进行建模。
(8)数据测试。
测试过程和训练过程是相同的,且得到的准确率为93%,测试结果良好。
(三)文本挖掘过程及结果
1.数据清洗
原始调查问卷数据中包括文字,标点符号。
其中一些信息对关键词抽取没有帮助,甚至会
严重影响研究。
为了方便抽取工作顺利开展,有必要先对原始评论数据进行清洗,如“无”或“好”等,对问卷内容没有帮助,进行直接删除处理。
2.数据预处理
预处理可以把句子级别的文本数据划分成可识别的词、词组,主要包括分词、词性标注和
依存句法分析三个部分。
在本文中使用LTP进行分词。
3.关键词提取。
由于人工标注会造成主观干扰,本文为了减小人工标注的主观性影响,要
利用TF-IDF算法自动提取关键词。
四、结论及建议
(一)结论
学生、教师、环境三方面均对课堂接收效果产生较大影响。
数据挖掘结果中,课堂兴趣、
学科掌握内容为学生因素,授课方法以及课堂互动属于教师因素,排在第二位的上课周边环境
则是环境因素。
文本挖掘结果中,学生、课程、认真为学生因素,理论、讲课、上课、教学、
案例、互动属于教师因素,教室则是环境因素。
因此,三种因素均对课堂接收效果产生影响。
利用文本挖掘与数据挖掘对比分析可以得到良好的研究结果。
文本挖掘与数据挖掘的结果
中均体现出了学生因素、教师因素以及环境因素对课堂接收效果产生影响,并且两种方法的分
析结果中均以高频率出现“互动”因素,印证了文中使用的两种方法均可行并可得到较为精准
的结果。
(二)建议
增加课堂小组讨论环节。
集体讨论是课堂中不可忽视的环节,既可以活跃课堂的气氛,交
换意见观点,拓宽学习范围;又可以活跃学生思维,多角度展开思考,提升解决问题的能力,
避免传统灌输式的教学方式。
增加师生课堂互动。
加强师生互动,调动课堂气氛,并利用实际问题创设情境,让学生给
出解决的方案,提高学生的学习兴趣。
增加课本知识与实际案例的结合。
书本的知识往往是生硬抽象的,而结合实际的案例后,
不仅可以使死板的课本知识更加形象生动,易于理解消化,融会贯通于实际案例中;也可以提
高学生的学习兴趣,提升学习的积极性与主动性。
增加课程实践环节。
将课本知识用于实际操作中,不仅可以升学生学习的乐趣,还可以使
学生结合生活经验学习相关知识,更好地将书本知识用于实际学习以及未来的工作中,同时在
实践中深化对于课本知识的理解。
增加高校课改调查。
本文针对东北财经大学研究生的调查问卷结果进行分析,并提出建议。
不同学校的实际情况会有一定差异,师资力量会有差异,学生学习素质不同,院校学习氛围也
有一定差异等。
不同院校根据本校情况设计相应的调查研究方式,会使研究结果更具可信性,
建议更具可行性,为教学改革提供更加切合实际的方案。