高校英语四级通过率预测模型
影响大学生英语四级通过率的因素及对策的研究
影响大学生英语四级通过率的因素及对策的研究【摘要】近年来,大学生英语四级考试通过率的低下已经成为一个备受关注的问题。
本研究旨在探讨影响大学生英语四级通过率的因素及提出对策建议。
在影响因素分析中,学习态度和动力、学习方法和技巧以及考试心理都被认为是影响四级通过率的重要因素。
针对这些因素,我们提出了一些对策建议,包括培养学习兴趣和积极态度、提高学习效率和应对考试技巧、调整心理状态和减轻考试压力等。
通过对这些因素的分析和对策建议的提出,我们得出结论认为,通过学生自身的努力和学校的指导,大学生英语四级通过率可以得到有效提高。
展望未来,我们希望大学生在英语学习中能够更加主动,提高学习效果,从而提高通过率。
【关键词】大学生、英语四级、通过率、因素分析、学习态度、动力、学习方法、技巧、考试心理、对策建议、总结、展望未来、结论、研究背景、研究目的、研究意义。
1. 引言1.1 研究背景在当今社会,英语已经成为一种全球通用的语言,对于大学生来说,英语四级考试是一个重要的里程碑。
通过英语四级考试不仅可以提升个人的英语水平,还可以为未来的就业和学习提供一定的帮助。
随着社会的发展和竞争的加剧,越来越多的大学生发现英语四级考试难度较大,通过率也在逐年下降。
研究影响大学生英语四级通过率的因素,探讨有效的对策建议,对于帮助大学生提高英语四级通过率具有重要的意义。
1.2 研究目的研究目的是为了探讨影响大学生英语四级通过率的因素,分析学习态度和动力因素、学习方法和技巧因素以及考试心理因素对四级通过率的影响。
通过研究,我们可以深入了解大学生在英语四级考试中的表现及其原因,为制定有效的对策建议提供依据。
通过对影响因素的分析和对策建议的提出,可以帮助大学生更好地备考英语四级,提高通过率,促进其英语学习水平的提升。
本研究旨在为大学生英语四级考试的准备和提升提供有益的参考,促进大学生英语综合能力的发展与提高。
1.3 研究意义研究意义是指研究对于解决具体问题、推动学科发展、促进社会进步等有积极意义和积极作用。
基于决策树的全日制本科生英语四级考试通过分析
基于决策树的全日制本科生英语四级考试通过分析作者:易新河文益民陈雄伟来源:《软件工程师》2014年第06期摘要:我国大学生为通过大学英语四级考试需要付出很大的时间代价,分析影响大学英语四级考试通过的原因,对于采取针对性措施通过英语四级考试意义重大。
以某特色地方工科高校教学管理系统为研究对象,从中提取了四个学院的学生成绩数据,采用决策树方法进行了分析。
数据分析结果表明:大学英语课程成绩对大学英语四级考试通过影响最大,毕业设计成绩、高等数学课成绩、专业基础必修课成绩也会影响大学英语四级考试的通过,基础必修课成绩对大学英语四级考试通过的影响不大。
关键词:教育数据挖掘;大学英语四级考试;决策树中图分类号:TP391 文献标识码:AData Mining on the Influential Factors of Passing CET-4 for Full-time College StudentYI Xinhe1,WEN Yimin2,CHEN Xiongwei2(1.College of Computer Science and Engineering,Guilin Univ of Electronic Technology,Guilin 54004,China;2.Higher Educational Research Institute,Guilin Univ of Electronic Technology,Guilin 54004,China)Abstract:For the higher cost of passing CET-4,it is very important to take strategies to direct the college students of China to pass CET-4 by analyzing its influential factors.Taking the teaching management information system of a local engineering university as an example,the paper collected the course grade data of full-time college students in four schools of the selected university,and then analyzed it by decision tree method.The experimental results illustrated that the most influential factor of passing CET-4 is the grade of college English course, and next are the grade of graduation thesis,higher maths,basic required courses for specialty.However there was little influence of the general basic required courses.Keywords:educational data mining;CET-4;decision tree1 引言(Introduction)《国家中长期教育改革与发展规划纲要》中对新时期人才培养提出了新的要求,即培养“适应国家经济、社会对外开放的要求,培养大批具有国际视野,通晓国际规则,能够参与国际事务与国际竞争的国际化人才”。
基于多元线性回归的大学英语四级成绩分析
基于多元线性回归的大学英语四级成绩分析为了帮助大学生做好英语四级备考准备,提高考试通过率。
文章采集了某大学土建学院14级大学生以往成绩,包括高考英语成绩、分班英语成绩、期末英语成绩以及平时英语成绩。
剔除了相关性不大的平时英语成绩,利用SPSS软件建立了预测四级成绩多元线性回归数学模型,采用该方法的成绩预测值与实际值符合较好。
该方法可以用来对四级成绩预测,具有一定的实用性。
标签:多元线性回归;英语四级;相关性;SPSSAbstract:In order to help college students prepare for CET-4 and improve the passing rate,this paper collects the past scores ofstudents of Grade 2014 in a university civil engineering college,including the scores of college entrance examination grades,class-division test grades,final English exam grades and regular English grades. The multivariate linear regression model was established using SPSS software,and the result predicted by this method was in good agreement with the actual value. This method can be used to predict the results of CET-4,and it has certain practicability.Keywords:multivariate linear regression;CET-4;correlation;SPSS1 概述大学英语四级考试(CET-4),是由国家教育部高等教育司主持的全国性教学考试。
大学英语四级考试结果统计分析
大学英语四级考试结果统计分析01级学生02-03学年度秋季通过人数为17人,春季通过人数为27人,总人数为44人,参加考试的总人数没有记录.02级学生03-04学年度秋季通过人数为35人,春季通过人数为34人,总人数为69人, 参加考试的总人数没有记录.03级学生04-05学年度秋季通过人数为28人,春季通过人数为34人,总人数为62人,参加考试总人数为1557人,过级率为4.0%.04级学生05-06学年度秋季通过人数为49人,春季通过人数为18人,总人数为67人, 参加考试总人数为1371人,过级率为4.9%.05级学生06-07学年度秋季通过人数为93人,春季结果尚未公布,秋季参加考试总人数为1470人,过级率为6.3%.以上数据表明,我院学生四级考试通过率逐年提高,其原因分析如下:04年以前英语授课教师均为外聘教师,从04年起学院开始聘用英语专职教师,工作认真负责,主抓英语教学,使过级率有所提高. 从04年起学院组织学生参加四级考试培训,对学生进行集中辅导. 05年起学院创办了外语教学台,使学生听力水平有所提高.但从教学过程中发现如下问题:1. 职高学生的英语基础普遍差,跟不上教学进度,不爱学习,通过四级考试的学生上课专心学习,能紧密跟上教师的教学步伐.2. 影响四级考试过级率的另一主要原因是存在学生严重缺考的现象,以及学生考试中应付考试,不认真答题.3. 与其他院校相比,四级考试的不同之处在于,其他院校在考前进行全员模拟,不合格者不允许参加四级考试,参加人数少于我院,所以我院的过级率相对受到了影响.大学英语六级考试结果统计分析03级学生04-05学年度秋季通过人数为4人,春季通过人数为4人,总人数为8人,参加考试总人数为70人,过级率为11.4%.04级学生05-06学年度秋季通过人数为2人,春季通过人数为4人,总人数为6人, 参加考试总人数为73人,过级率为8.2%.05级学生06-07学年度秋季通过人数为2人,春季参加考试人数没有记录,结果尚未公布,秋季参加考试总人数为33人,过级率为6.1%.以上数据表明,我院学生六级考试的参加总人数逐年增加,通过率相对有所下降.。
关于英语与四六级通过率的研究
关于大学生英四六级考试通过率调查研究——基于学习兴趣和学习态度视角 侯宝恒摘要:大学生怎样看待英语四六级?影响大学生能否通过四六级等级考试的因素有哪些?本文将通过理论分析和基于高校提供数据实证检验发现:<1>学生英语学习兴趣越高,班级四六级等级考试通过率越高;<2>学生学习态度越好的班级四六级等级考试通过率越高。
本文主要贡献在于:基于日常英语学习兴趣和学习态度研究了班级四六级等级考试通过状况:对今后英语教学方面具有借鉴意义。
关键词:课堂出勤率,作业完成度,英语四六级考试一、引言英语四六级开始最早是华东石油学院(中国石油大学)的校内广泛流行的一种英语水平测试。
1984年教育部在中国石油大学组织了一次英语教育研讨会,当时校内正在举行英语水平考试,吸引了与会者的注意力。
此后,教育部开始在全国高校内推广英语等级考试。
1986年第一次大学英语四级试验举行。
为适应我国高等教育新的发展形势,深化教学改革,提高教学质量,满足新时期国家对人才培养的需要,2004年初教育部高教司组织制定并在全国部分高校开始试点《大学英语课程教学要求(试行)》(以下简称《教学要求》)。
《教学要求》规定,大学英语课程的教学目标是:培养学生的英语综合应用能力,特别是听说能力,使他们在今后工作和社会交往中能用英语有效地进行口头和书面的信息交流。
自《教学要求》在全国部分院校开始试点以来,广大教师积极参加和关心这次改革,在教学模式、教学手段和教材使用等各方面做了许多有益的尝试。
参加试点的学生也普遍反映新的教学理念和方法大大提高了他们学习英语的兴趣,实现了个性化学习,提高了学习效率。
大学英语四、六级考试是一种为教学服务的标准化考试。
因此,考试改革的方向是在保持考试的科学性、客观性和公正性的同时,使考试最大限度地对大学英语教学产生正面的导向作用,即通过四、六级考试的改革,引导师生正确处理教学与考试的关系,更合理地使用四、六级考试,使考试更好地为教学服务。
高校英语四级通过率预测模型
于人 们对 客 观事物 的主观认 识上 的不 确定 , 随机 性 主要 源于 客观 事物发 生 或 出现 的 时间 、 空间 、 形态 、 性 质等
的不确定 .云模 型用期 望值 表述 定性 概念 在定量 论 域上 的一 次 确切 实 现 。 用 熵表 述 定性 概 念 的不确 定性 度
量. 而 熵本 身 又存在 着 不确 定性 . 因此 又有 超熵 描述 熵 的不 确定 性 , 如此 , 云用 3个 数字 特 征表 达一 个 概 念 , 即期望 E x 。 熵E n , 超熵 He , 能 够很 好 地 表达 出主观 认 识某 概 念 的模 糊性 , 以及 这一 概 念 某次 客 观 实 现 的随
一
次随机 实 现 , 若 x满足 : x — N( E x , E n ) , 其中 , E n ’ N( E n , H e ) , 且x 对 C的确定 度 满足
【 : 垒2 / z =e 2 ( E n )
一
,
,
( ) 1 ‘ )
吴 爱 燕 . 宋 宏伟
( 1 . 北方 工业 大学 理 学 院 , 北 京 1 0 0 1 4 4; 2 . 石家庄 学 院 计 算机 系 , 河北 石家庄 0 5 0 0 3 5 )
基于数据挖掘的大学英语四级通过率预测建模研究
第38卷第12期Vol.38 No.12长春师范大学学报Journal of Changchun Normal University 2019年12月Dec.2019基于数据挖掘的大学英语四级通过率预测建模研究叶泽俊(三明学院ꎬ福建三明365004)[摘㊀要]大数据在教育领域的应用研究主要分为教育数据挖掘和学习分析ꎬ前者侧重于发现数据之间的潜在联系ꎬ后者侧重于使用数据解释问题ꎮ本文研究的问题属于教育数据挖掘领域ꎬ使用SPSSModeler数据挖掘平台ꎬ采用基于C5.0算法的决策树分类方法ꎬ通过采集㊁整理某一地方性应用型本科院校非英语专业学生公共英语课程学习情况以及大学英语四级成绩等相关信息ꎬ建立决策树分类模型对四级通过概率进行预测ꎮ在分析了构建模型的各种属性之后ꎬ结合对数据分析统计结果ꎬ给出了改善高校教学管理与提升英语四级通过率的思考与建议ꎮ[关键词]教育数据挖掘ꎻ机器学习ꎻ决策树模型ꎻ英语四级ꎻ通过率预测[中图分类号]TP311㊀㊀[文献标志码]A㊀㊀[文章编号]2095-7602(2019)12-0055-081㊀研究背景随着信息化进程在教育领域的推进ꎬ围绕高校日常教学运行㊁学生学习等各个方面的数据被各种信息管理平台采集和存储ꎮ海量的数据可以帮助学校了解㊁掌握教学运行情况和学生学习情况ꎬ然而目前大多数普通本科院校对这些数据的使用仍停留在简单的数据汇总和分析阶段ꎬ并没有进行深入的挖掘ꎮ如何最大程度地利用这些存储在数据库中的数据?对大多数高校而言ꎬ都是巨大的挑战ꎮ近些年ꎬ伴随大数据概念的兴起ꎬ数据挖掘及数据分析技术逐步渗透进入教育领域为发掘高校数据库中海量数据的价值带来了可能ꎮ图1㊀教育数据挖掘和学习分析涉及的主要学科大数据在教育领域的两个主要研究方向是教育数据挖掘和学习分析ꎮ前者是指 综合运用数学统计㊁机器学习和数据挖掘的技术和方法ꎬ对教育大数据进行处理和分析ꎬ通过数据建模ꎬ发现学习者学习结果与学习内容㊁学习资源和教学行为等变量的相关关系ꎬ来预测学习者未来的学习趋势 ꎻ后者是指 综合运用信息科学㊁社会学㊁计算机科学㊁心理学和学习科学的理论和方法ꎬ通过对广义教育大数据的处理和分析ꎬ利用已知模型和方法去解释影响学习者学习的重大问题ꎬ评估学习者学习行为ꎬ并为学习者提供人为的适应性反馈ꎮ [1]教育数据挖掘㊁学习分析与计算机科学㊁教育学和统计学的关系ꎬ如图1所示[2]ꎮ本研究将数据挖掘技术用于分析课程与等级考试之间的关系ꎬ以某一地方性本科院校非英语专业本科学生大学英语课程与等级考试成绩数据为样本建立数据挖掘模型ꎬ通过探究两者之间的相互关系为改善教学管理和提升课程教学质量提供依据ꎮ[收稿日期]2019-01-08[作者简介]叶泽俊ꎬ男ꎬ研究实习员ꎬ硕士ꎬ从事教育管理研究ꎮ552㊀教育数据挖掘及其应用研究概述教育数据挖掘中使用的机器学习的方法分为两种:监督学习和非监督学习ꎮ两种学习的主要差别在于用于建立模型的数据除带有特征(feature)外是否还带有标签(label)或者说是否有确定的结果ꎮ监督学习问题主要有两种ꎬ分类和回归ꎮ监督学习的主要算法包括:K邻近分析法㊁线性模型㊁朴素贝叶斯分类器㊁决策树㊁核支持向量机㊁神经网络等ꎮ常见的非监督学习类型有两种:数据集变换和聚类ꎮ数据集的无监督变换是创建数据新的表示的算法ꎬ与数据的原始表示相比ꎬ新的表示可能更容易被人或其他机器学习算法所理解ꎮ聚类算法是将数据划分成不同的组ꎬ每组包含相似的物项ꎬ主要的聚类算法为K均值聚类和凝聚聚类[3]ꎮ分类是按照某种标准给数据贴 标签 ꎬ再根据标签区分归类ꎬ聚类是事先没有 标签 而通过分析找出数据之间存在聚集性原因的过程[4]ꎮ国内众多学者使用数据挖掘技术对教育数据展开了研究ꎬ得到较多的研究成果ꎮ舒忠梅[5]将逐步回归和神经网络技术用于分析大学生学习成果及其影响因素ꎮ施佺[6]借助统计分析与可视化㊁关联规则算法和聚类算法ꎬ分析了网络学习过程中产生的大量学习数据ꎬ并根据分析结果给出了网络学习过程监督与管理的思考和建议ꎮ尤佳鑫[7]将多元线性回归模型运用于实体课堂和云学习平台的混合式大学课程学生学业成绩预测ꎬ并根据预测展开教学干预以提升其学习效果ꎮ陈子健[8]采用嵌套集成学习的方法构建在线学习者学业成绩分类预测模型ꎬ为在线学习者学业成绩影响因素研究和预测建模研究提供参考ꎬ也有助于在线学习学业预警㊁学业成绩预测和评价的实践ꎮ孙力[9]将聚类算法运用于网络学历教育本科学生英语相关课程成绩及学习信息的分析ꎬ实现了对成人学位英语考试成绩的细分预测ꎮ通过整理国内学者教育数据挖掘应用的研究成果发现ꎬ众多研究相对集中于对网络教育领域进行数据挖掘ꎬ而对存储在数据库中的传统课堂教学产生的数据研究较少ꎮ网络教育平台可以监控学生课程学习的全过程ꎬ并通过设置大量数据采集点构建更加复杂㊁科学的评价体系ꎮ较之网络教育平台ꎬ传统数据存在学习过程监控点少㊁成绩结构单一等问题ꎮ这些问题给数据挖掘带来了挑战ꎮ本文借鉴学者对网络学习的数据挖掘研究ꎬ通过增加建模属性㊁分解成绩构成㊁转换成绩含义等方式ꎬ运用存储在数据库中的3个年级非英语专业本科学生的个人信息㊁大学英语课程成绩和等级考试成绩等传统数据ꎬ构建决策树分类模型ꎬ对学生通过英语四级的概率进行预测ꎬ并对构建模型的主要属性进行分析ꎮ本研究只针对是否通过英语四级考试进行建模ꎬ所研究问题属于监督学习中的分类问题ꎮ3㊀数据挖掘平台和算法的选用使用IBM的SPSSModeler18.0作为数据挖掘平台ꎮSPSSModeler的前身是ISL公司的Clementineꎮ1999年SPSS公司收购了ISL公司后对Clementine产品进行重新整合和开发ꎮ2009年SPSS被IBM收购后ꎬ更名为IBMSPSSModelerꎮSPSSModeler支持数据挖掘技术的行业标准:CRISP-DM(Cross-IndustryStandardProcessforDataMining)ꎬ是国际主流的数据分析挖掘工具之一ꎮ选用基于C5.0算法的决策树模型作为数据挖掘工具ꎮC5.0算法是在C4.5算法的基础上提出的ꎬ适用于处理大数据集ꎬ运行速度快ꎬ占用内存少ꎮC5.0算法根据能够提供最大信息增益的字段划分样本ꎬ对第一次划分出来的子样本递归划分ꎬ直到不能再分为止ꎬ最后重新检查最底层的划分ꎬ去掉影响较小的分支ꎬ得到最终模型ꎮC5.0可以产生两种模型:决策树和规则集ꎮ决策树由算法划分样本直接产生ꎬ每个叶子节点表示一个特定的数据子集ꎬ数据集中的每个样本只属一个叶子节点ꎮ也就是说ꎬ任何一个给定的样本通过决策树只能得到一个预测结果[10]ꎮ4㊀构建英语四级考试结果预测模型运用数据挖掘技术中的数据分类技术实现对英语四级考试结果的预测ꎬ历经数据提取㊁数据处理㊁决策树构建㊁结果预测和决策树优化等步骤(图2)ꎮ4.1㊀模型构建4.1.1㊀数据提取与预处理数据预处理是数据挖掘前的准备工作ꎬ目的是为数据挖掘提供格式规范㊁有针对性的数据ꎬ减少数据挖掘算法的数据处理量ꎬ提高挖掘效率ꎬ最终提升模型的准确度ꎮ数据预处理的方法包括数据清理㊁数据集成㊁数 65图2㊀英语四级通过率预测模型构建流程图据转换和数据规约等ꎮ根据本文的研究目标ꎬ从该校数据库中提取了3个年级学生的基本信息㊁大学英语课程成绩和3种类型的等级考试成绩ꎬ并按照如下规则对数据进行了处理ꎮ(1)学生基本信息只保留学号㊁姓名㊁性别㊁学院和专业5个属性ꎮ(2)学生大学英语课程成绩包含平时成绩㊁期末成绩和总评成绩ꎬ且3个年级大学英语课程开设学期数分别为2学期㊁3学期㊁4学期ꎮ作者将学生在校期间所有的大学英语课程成绩分为平时㊁期末和总评3类ꎬ分别求和后以课程开设学期数为分母取均值ꎬ形成 大学英语平时成绩平均分 ㊁ 大学英语期末成绩平均分 和 大学英语总评成绩平均分 3个属性ꎬ将大学英语课程开设学期数分类统计形成 学习时长 属性ꎬ分别用于衡量学生平时的课堂表现㊁学生的英语知识水平和应试能力㊁是否完成大学英语课程和大学英语课程学习时长ꎮ(3)学生在校期间可参加学校组织的3种类型的等级考试且不限次数ꎮ3种考试分别是:大学英语四级考试㊁计算机等级考试和普通话水平测试ꎮ在数据预处理过程中ꎬ本文只取学生每种类型等级考试的最高成绩ꎬ排除其余成绩ꎮ由于本文研究的问题属于分类问题ꎬ因此将英语四级成绩以425分为线分为 合格 与 不合格 ꎬ形成 是否通过四级 属性ꎮ在排除了无效记录并按以上3条规则对数据进行预处理后ꎬ形成了一个样本数为6756的数据集ꎬ其中包含2243个通过四级的样本和4513个未通过四级的样本ꎮ数据集中2012㊁2013㊁2014级学生的样本数分别为2410㊁2245和2101个ꎮ数据集命名为 四级通过预测.csv ꎮ4.1.2㊀建立SPSSModeler数据源启动SPSSModeler并新建流文件后ꎬ选择界面下部 源 子菜单内的 变量文件 ꎬ将其拖入面板中ꎮ双击面板中的 变量文件 图标ꎬ在弹出编辑界面中选择 导入文件 ꎬ选择文件 四级通过预测.csv ꎬ字段定界符选择逗号ꎬ之后点击 确定 导入数据ꎬ面板中图标名称变为 四级通过预测.csv ꎮ4.1.3㊀关联数据在工具面板区中选择 字段选项 中的 类型 节点ꎬ将其拖入面板中ꎮ选择 四级通过预测.csv 图标ꎬ单击鼠标右键ꎬ选择 连接 ꎬ并连接到 类型 ꎮ双击 类型 图标ꎬ在弹出 类型 对话框中点击 清除所有值 后ꎬ点击 读取值 ꎬ并在 角色 列中进行属性方向调整ꎮ其中ꎬ由于 学号 ㊁ 姓名 属性对于建模没有作用ꎬ将方向设置为 无 ꎻ 是否通过四级 为预测目标ꎬ将其角色设为 目标 ꎻ其他属性 角色 均为 输入 ꎮ4.1.4㊀导入特征选择模型在工具面板区中选择 建模 选项卡中的 特征选择 节点ꎬ将其拖入面板中ꎬ并与 类型 节点相连接ꎮ 特征选择 节点可以筛选出对预测属性与预测目标之间的关系有用的属性或数据ꎮ执行 特征选择 节点ꎬ从执行生成的模型中选择其中重要的属性ꎬ直接生成 过滤 节点ꎬ如图3所示ꎮ4.1.5㊀建立C5.0模型选择 建模 选项卡中的 C5.0 节点ꎬ将其拖入面板中并与执行 特征选择 节点生成的 过滤 节点相连接ꎮ设置 C5.0 节点的 输出类型 为 决策树 ꎬ并选择 交叉验证 ꎬ 折叠次数 设置为10ꎮ选择 专家 模 75式ꎬ 修建严重性 的初始值设置为85ꎬ 每个分支的最小记录数 的初始值设置为5ꎬ勾选 全局修剪 ꎮ执行 C5.0 节点ꎬ管理区和数据流设计区出现 是否通过四级 的图标ꎬ建模完成ꎮ双击该图标可以查看建模结果ꎮ图3㊀ 特征选择 节点输出结果4.1.6㊀模型评估选择 输出 选项卡中的 分析 节点ꎬ将其与 是否通过四级 图标相连ꎮ运行 分析 节点可以查看模型的预测准确率ꎬ如图4所示ꎮ图4㊀模型预测准确率分析界面4.2㊀模型优化通过前述步骤得到的决策树模型包含7个属性ꎬ 修建严重性 的值为85ꎬ 每个子分支的最小记录数 的值为5ꎬ预测正确率为79.62%ꎮ初次建模得到的决策树模型预测准确率较高ꎬ但仍不能确定模型的预测准确率是否达到最优ꎮ鉴于 大学英语总评成绩平均分 和 大学英语平时成绩平均分 两个属性未被用于建模ꎬ 85但这两个属性有与英语学习相关ꎮ此外ꎬ 修建严重性 和 每个分支的最小记录数 这两个参数值也存在调整的可能ꎮ本文制定了如下模型优化步骤:(1)依次将 大学英语总评成绩平均分 和 大学英语平时成绩平均分 依次加入决策树模型形成预测结果2和预测结果3ꎮ(2) 修建严重性 参数确定决策树的修剪程度ꎮ增加该值可获得一个更简洁的小型树ꎬ减小该值可获得一个更精确的树ꎮ本文尝试将 修建严重性 的值依次设置为75㊁65㊁55ꎬ形成预测结果4~预测结果6ꎮ(3) 每个子分支的最小记录数 参数可以用来限制树的任何分支中的分割数ꎬ增加该值有助于防止使用噪声数据进行过度训练ꎮ鉴于本文使用的数据类型较为简单ꎬ且在预处理过程中已将无效数据删除ꎬ因此在模型优化过程中尝试将 每个分支的最小记录数 的值依次减小ꎬ设置为4㊁3㊁2ꎬ形成预测结果7~预测结果9ꎮ依据上述步骤形成的决策树优化结果如表1所示ꎮ表1㊀决策树优化情况序号模型名称包含属性及参数设置预测准确率/%1预测结果1学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长ꎻ修剪严重性=85ꎬ每个子分支的最小记录数=579.622预测结果2学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长㊁大学英语平时成绩平均分ꎻ修剪严重性=85ꎬ每个子分支的最小记录数=580.243预测结果3学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长㊁大学英语平时成绩平均分㊁大学英语总评成绩平均分ꎻ修剪严重性=85ꎬ每个子分支的最小记录数=580.924预测结果4学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长㊁大学英语平时成绩平均分㊁大学英语总评成绩平均分ꎻ修剪严重性=75ꎬ每个子分支的最小记录数=581.255预测结果5学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长㊁大学英语平时成绩平均分㊁大学英语总评成绩平均分ꎻ修剪严重性=65ꎬ每个子分支的最小记录数=583.166预测结果6学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长㊁大学英语平时成绩平均分㊁大学英语总评成绩平均分ꎻ修剪严重性=55ꎬ每个子分支的最小记录数=583.167预测结果7学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长㊁大学英语平时成绩平均分㊁大学英语总评成绩平均分ꎻ修剪严重性=55ꎬ每个子分支的最小记录数=483.208预测结果8学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长㊁大学英语平时成绩平均分㊁大学英语总评成绩平均分ꎻ修剪严重性=55ꎬ每个子分支的最小记录数=384.259预测结果9学院㊁专业㊁性别㊁普通话成绩㊁计算机一级成绩㊁大学英语期末成绩平均分㊁学习时长㊁大学英语平时成绩平均分㊁大学英语总评成绩平均分ꎻ修剪严重性=55ꎬ每个子分支的最小记录数=284.21㊀㊀从表1可以看出ꎬ第一步优化过程在保持 修剪严重性 和 每个子分支的最小记录数 的值不变的情况下ꎬ增加与英语学期相关的属性可以提升决策树模型预测的准确率ꎮ第二步优化过程在属性数保持在9个ꎬ 每个子分支的最小记录数 保持不变的情况下ꎬ减少 修建严重性 的值ꎬ模型的预测准确率也会提升ꎮ需要注意的是预测结果5和预测结果6的值是相等的ꎬ表明减少 修建严重性 的值到65和55时对提升模型预测95准确率没有帮助ꎮ本文最终选择55作为 修建严重性 的最终参数ꎮ第三步优化过程在属性数保持在9个ꎬ 修建严重性 的值设置为55后ꎬ递减 每个子分支的最小记录数 的参数值ꎮ通过递减参数值可以发现ꎬ当参数值减小到3时预测准确率达到最高ꎬ参数值减小到2时预测准确率反而下降ꎮ综上所述ꎬ本文选用预测结果8作为最终结果ꎮ此时 修建严重性 的值为55ꎬ 每个子分支的最小记录数 的值为3ꎬ决策树深度为12ꎬ包含节点数为435ꎮ5㊀模型分析及结论应用5.1㊀模型分析本研究采用数据挖掘中的基于C5.0算法的决策树分类方法ꎬ以学生基本信息㊁大学英语课程成绩及各种等级考试成绩为基础ꎬ在SPSSModeler的数据挖掘环境中ꎬ通过增加建模属性㊁调整模型参数等步骤最终构建了本科生英语四级通过概率的预测模型ꎮSPSSModeler环境中构建决策树时ꎬ各属性的重要性可以通过双击 预测结果 节点查看ꎬ各属性的重要性值见图5ꎮA:专业㊀B:学院㊀C:大学英语总评成绩平均分㊀D:普通话成绩㊀E:大学英语平时成绩平均分F:学习时长㊀G:计算机一级成绩㊀H:性别㊀I:大学英语期末成绩平均分图5㊀各预测变量重要性值通过分析图5ꎬ结合模型可以得出以下结论:(1) 大学英语期末成绩平均分 对是否通过四级预测的重要性最大ꎮ究其原因ꎬ主要是大学英语课程的期末考试与英语四级考试要求较为接近ꎬ考试的题型和题量基本相同ꎮ从考试形式看ꎬ两者均为笔试并使用答题卡做题ꎮ两者均是对学生知识水平和应试心态的考量ꎮ因此ꎬ如果在大学英语课程考试中取得较好成绩ꎬ通过英语四级的概率自然增加ꎮ(2) 性别 在模型特征重要性中排在第二ꎬ说明英语四级通过率在该校男女生之间存在巨大差异ꎮ从表2对数据样本的分析中可以看出ꎬ女生的英语四级通过率和平均成绩均高于男生ꎮ表2㊀男女生四级考试平均分及通过率性别通过人数报名人数通过率/%平均成绩女1631359145.4387男612316519.3340㊀㊀(3) 计算机一级成绩 和 普通话成绩 两个属性能对模型预测结果产生影响ꎬ表明作为等级考试两者与英语四级之间存在相通之处ꎮ从模型的预测结果可以发现英语四级成绩与计算机一级成绩㊁普通话成绩存在明显的正向关系ꎬ即英语四级成绩较高的学生ꎬ计算机一级及普通话成绩也相对较高ꎮ(4) 学习时长 属性表明学习期限的长短对学生是否通过四级有一定的影响ꎮ该校2012㊁2013㊁2014级学生的培养方案中规定公共英语授课学期数分别为:4学期㊁3学期和2学期ꎬ且该校禁止学生在入学第一学期报考英语四级ꎮ结合表3的数据可以发现在大学英语开课学期四级通过人数能保持在3位数ꎬ当课程结束 06后通过人数出现大幅下跌ꎮ表3㊀各学年学期英语四级通过人数统计年级学年学期通过人数2012级2012-2013-23482013-2014-11772013-2014-21532014-2015-1822014-2015-2752015-2016-1252015-2016-252013级2013-2014-23512014-2015-11172014-2015-2662015-2016-1442015-2016-2552016-2017-1792016-2017-272014级2014-2015-22792015-2016-1692015-2016-2522016-2017-11062016-2017-2732017-2018-174㊀㊀(5)鉴于平时成绩是由任课老师在综合考察学生的出勤情况㊁作业完成质量㊁课堂参与度等指标后给出的评价ꎬ这些指标又与学生对课程的学习态度密切相关ꎮ因此ꎬ 大学英语平时成绩平均分 可作为衡量学生课程学习态度的一个属性ꎮ该属性在建模中仍有一定作用ꎬ表明学生学习态度的好坏对能否通过英语四级可以产生一定的影响ꎮ5.2㊀结论应用第一ꎬ教学管理者应重视学校学风建设ꎬ引导学生从高中阶段的被动学习向主动学习转变ꎬ帮助学生确立正确的学习态度ꎬ塑造学校积极㊁向上的学习风气ꎮ学习态度与学习成果密切相关ꎮ 计算机等级考试 普通话水平测试 和 大学英语四级考试 3种考试的内容㊁考试形式之间并没有相似性ꎬ但3种考试的成绩存在正向关联ꎬ说明学生对于等级考试的态度会对考试的结果产生影响ꎮ第二ꎬ改革大学英语课程教学ꎬ打造高质量的英语精品课程ꎮ大学英语课程一般在第一到第四学期开设ꎬ学生在这一段时期仍处在由被动学习向主动学习转变的过程中ꎮ大学英语的课堂教学在这一时期有重要作用ꎮ高质量的课程有利于学生引起学生的学习兴趣ꎬ帮助提高学生的四级通过率ꎮ第三ꎬ该校管理者应重视男女生之间英语四级通过率的巨大差距ꎮ从表3数据可以计算出四级通过率在该校男女生之间的差距高达26.1%ꎮ虽然造成这种现象的原因是多种多样的ꎬ以往学者的研究也表明女性相对于男性而言确实存在着语言优势[11]ꎬ在校女大学生更倾向于将在各类考试特别是大范围的英语四级考试中取得好成绩ꎬ作为其努力的目标[12]ꎬ但笔者认为除了性别差异外还有其他的原因造成了该校男女生之间英语四级通过率的巨大差距ꎬ这个问题值得进一步深入研究ꎮ166㊀结语当前各种网络教育平台飞速发展ꎬ大量新型数据不断融入高校数据库ꎬ但面对面的课堂教学依然是大学教育的主要形式ꎮ这就意味着在新型数据不断增长的同时ꎬ仍有大量的传统数据被收集存储ꎮ随着教育数据挖掘研究的持续发展ꎬ教育数据挖掘及分析方法更加丰富ꎬ传统教育数据的价值将得到重新发现ꎮ传统教育数据较之新型数据的最大优势在于数据量庞大且数据累积年限更长ꎮ因此ꎬ对海量传统数据的挖掘更有可能发现高校发展过程㊁教师教学和学生学习等方面的深层次规律ꎬ为改善高校教学管理㊁提升教学质量和促进学生学习提供助力ꎮ[参考文献][1]徐鹏ꎬ王以宁ꎬ刘艳华ꎬ等.大数据视角分析学习变革 美国«通过教育数据挖掘和学习分析促进教与学»报告解读及启示[J].远程教育杂志ꎬ2013(6):11-17.[2]ROMEROCꎬVENTURAS.Dataminingineducation[J].WileyInterdisciplinaryReviews:DataMiningandKnowledgeDiscov ̄eryꎬ2013(1):12-27.[3]MULLERACꎬGUIDOS.Python机器学习基础教程[M].张亮ꎬ译.北京:人民邮电出版社ꎬ2018.[4]KANTARDZIC.Datamining:Conceptsꎬmodelsꎬmethodsandalgorithms[M].NewJersey:JohnWiley&SonsꎬIncꎬ2011. [5]舒忠梅ꎬ屈琼斐.基于教育数据挖掘的大学生学习成果分析[J].东北大学学报(社会科学版)ꎬ2014(3):309-314. [6]施佺ꎬ钱源ꎬ孙玲.基于教育数据挖掘的网络学习过程监管研究[J].现代教育技术ꎬ2016(6):87-93.[7]尤佳鑫ꎬ孙众.云学习平台大学生学业成绩预测与干预研究[J].中国远程教育ꎬ2016(9):14-20.[8]陈子健ꎬ朱晓亮.基于教育数据挖掘的在线学习者学业成绩预测建模研究[J].中国电化教育ꎬ2017(12):75-81. [9]孙力ꎬ张凯ꎬ丁波.基于数据挖掘的网络教育学习成绩细分预测的研究与实现[J].中国远程教育ꎬ2016(12):22-29. [10]ZHUXLꎬWANGJꎬYANGHCꎬetal.ResearchandapplicationoftheimprovedalgorithmC4.5ondecisiontree[C].Inter ̄nationalConferenceonTestandMeasurementꎬIEEEꎬ2009:184-187.[11]黄崇岭.性别差异与大学外语教学 对外语学习中女强男弱现象的分析[J].同济大学学报ꎬ2004(1):104-109. [12]屠丽华ꎬ蔡慧萍.从CET4看性别差异对外语学习者单项技能的影响[J].外语研究ꎬ2014(2):46-51.ResearchonCollegeEnglishFour-LevelPassRatePredictionModelingBasedonDataMiningYEZe-jun(SanmingUniversityꎬSanming365004ꎬChina)Abstract:Theapplicationresearchofbigdataineducationfieldismainlydividedintoeducationdataminingandlearninganalysis.Theformerfocusesondiscoveringpotentiallinksbetweendataꎬwhilethelatterfocusesonusingdatatoexplainproblems.Theproblemstud ̄iedinthispaperbelongstothefieldofeducationaldatamining.ThearticleusesSPSSModelerdataminingplatformꎬadoptsC5.0algo ̄rithm-baseddecisiontreeclassificationmethodꎬcollectsandorganizestheinformationofpublicEnglishcoursesofnon-Englishmajorsinalocalapplication-orientedundergraduatecollegeꎬandthescoresofCET4ꎬestablishesadecisiontreeclassificationmodeltopredictCET4passprobability.AfteranalyzingthevariousattributesoftheconstructionmodelꎬcombinedwiththestatisticalanalysisresultsofthedataꎬthepapergivessomethoughtsandsuggestionsonimprovingtheteachingmanagementoftheschoolandimprovingthepassrateofCET4.Keywords:educationaldataminingꎻmachinelearningꎻdecisiontreemodelꎻCET4ꎻpassrateprediction26。
英语四级通过率是多少?竟然这么低!
不知道你们有没有好奇过每年的英语四级通过率,学姐当初刚上大学,得知要考四六级时,整个人都不好了。
你们之中,有很多人应该是大一甚至是大二才接触和知道英语四级这门考试的吧!我可是早就耳闻过四六级通过率低的传言了,所以在知道我们要过四级的时候,默默替自己捏了一把汗……是不是有人觉得学姐故意在吓大家?并没有哦,不信的话,我们用事实说话,可以直接来看看具体的数据!其实光看数据就已经很震惊了!因为19年上半年的大学英语四级全国总体通过率只有30%左右,其中985、211院校普遍要高一些,普通本科学校要偏低一些。
就目前来看,英语四级通过率是多少?四级的通过率并不是很高,且每年还在持续走低。
那到底为什么会这么低呢?是英语四级太难吗?NO!并不是!其实英语四级并不是很难,只要掌握好复习方法,英语底子再差也能轻松过。
学姐特地给大家整理了一份英语四级复习攻略——首先来看备考四级需要的资料:词汇书:闪过英语《四级词汇闪过》,真题书:巨微英语《四级真题逐句精解》。
我之前备考四级用的闪过英语《四级词汇闪过》词汇书里的词汇很全,内容也丰富,是按照考频划分了频考词、基础词、偶考词和超纲词,而且还重点突出了频考词,只有2000来个,记起来也节省时间,适合备考时间比较紧张的同学用。
此外还是词根词缀的乱序编排,这样可以帮你记忆得更深刻些。
而且每个频考词都有4个常考短语帮助理解,这样记了也会用,而且每一个短语都包含了一个用法,也就避免了记那么多单词却不会用的尴尬。
单词基础打扎实了,就可以开始做题了。
巨微英语《四级真题逐句精解》里面的历年真题是一词一句详细讲的,重点单词和句子语法都有分析,长难句还有语法图解,很适合英语基础差的人用。
补基础提分用这本效果很显著噢~接下来是学姐总结的四级高分复习技巧,希望能帮到你们:(1)先按照考试时间完整的做1套题,计时做!(2)做完不对答案,先跟着真题解析一句一句分析真题文章,尤其是里面的长难句一定要重点分析,可以对照语法图解学会分析句子的语法结构,把长句子变成短句子就容易理解了。
英语四六级考试通过率分析报告
北京XX大学XX学院大学生英语四、六级考试通过率分析报告班级:****姓名:XX学号:XXXXXXXX目录第一部份:调查方案设计................................................................................错误!未定义书签。
一、调查背景....................................................................................................错误!未定义书签。
二、调查目的....................................................................................................错误!未定义书签。
三、调查范围....................................................................................................错误!未定义书签。
四、调查内容....................................................................................................错误!未定义书签。
五、调查方式....................................................................................................错误!未定义书签。
第二部份:北京XX大学XX学院大学生英语四、六级考试通过率分析报告错误!未定义书签。
一、统计分析XX学院大学生英语四级通过率......................................错误!未定义书签。
大学英语四级成绩预测建模与分析——以天津体育学院运动与文化艺术学院为例
82019年27期总第467期ENGLISH ON CAMPUS的弊端。
学习方式多样化,有利于将应用型本科专业学生实践能力强的特色发挥到极致,实现语言学习与专业知识的再融合。
互联网+教育的蓬勃发展及应用型本科院校大学生英语学习需求丰富的大环境下,学习者的语言学习方式从单一走向多远,变得更有必要。
只有多元化的学习方式才能满足应用型本科院校不同专业对毕业生英语能力的要求,才能满足不同专业背景学生对课程多元化的需求,才能在大数据时代网罗各类教学资源辅助英语课程的学习。
多元化的学习方式应在面授与非面授、线上学习与线下学习的有机结合的基础下,自主学习、合作学习、个性化定制学习高度交融,形成学习主动性强的特点。
4.加强网络教育空间管理,赢得网络教育话语权。
互联网+教育模式下,良好的教学效果基于学生自我管理意识的提升。
泛在学习环境下的大学英语学习更具自主性、交互性和共享性,如何帮助学习者有效地、有针对性地整合及获取学习信息,教师如何在网络教育平台中做好学习交互、解答及评价,是急需解决的问题。
“教师应对学习内容、学习时间、学习过程、学习结果进行立体化、全方位的监控。
”互联网独具开放性,要求教师必须将培养学生甄别信息能力放在重要位置,一方面在这便利、开放的教育平台实现了多元化、个性化学习;另一方面在学习跨文化交际知识过程中也会出现盲目追捧等价值迷失的情况。
这需要大学英语教师建立健全多元化的学习评价体系,在三维目标的基础上进行网络化泛在学习的科学评价,帮助学习者培养文化自信及甄别信息、判断形势、善于创新的能力,赢得网络教育平台的话语权。
四、结语互联网+教育对于应用型本科院校大学英语教学是挑战亦是机遇。
在教学手段、教学方式、教学观念、教学素养、角色定位等方面要求革新,借助互联网+教育去探索应用型本科大学英语教学与专业需求互融,培养更具创造力,更具专业素养的应用型本科生,这无非是大学英语教学改革的良机。
大学英语教师应努力适应新要求,与时俱进,提高教学信息素养,找准个人角色定位;帮助学习者建立语言学习自信,充分利用优质教学资源实现翻转课堂的良性开展;教学内容、教学设计与专业需求相结合,满足大学生个性化学习需求;做好课堂及网络教学的管理者,逐步提升大学英语教学量。
基于SVR的CET-4成绩预测模型研究
2 SVR 算法
CET-4 成绩预测是典型的连续数据值预测,可参考的特征 属性数据包括历史 CET-4 的各分项成绩,学生日常学习的过程 数据,以及相关学生基础信息,目标属性为 CET-4 的总成绩,因 此选用线性预测模型具有较好的适用性[2]。机器学习算法中常 见的线性预测模型包括多元线性回归、岭回归、Lasso 回归和 SVR 算法等,其中,SVR 算法能够充分运用已经采集的大量基 础数据、过程数据和分项成绩,通过核函数有效控制预测模型 复杂度,对非线性时间序列情况下也具有较好预测效果[3]。因 此,本文使用 SVR 算法作为基础算法开展 CET-4 成绩预测模型 研究。
考阅读成绩,上次等考写作成绩,本次等考成绩),其中学号为
标识码,中间 9 项为特征属性,分别标注为 F1-F9,本次等考成
绩为目标属性,标定为 F0。由于需要依托上次等考成绩为训练
数据属性,因此,主要针对学校多次参考 CET-4 的学生进行预
测分析,首次参加考试不做预测,这也符合英语教学和 CET-4
线性回归模型是构建形如 y=f(x)=Wx+b 的预测函数,其中 x 为特征属性,y 为目标数据,f(x)为回归函数,包括两个参数 W 为 各特征属性的权重向量,b 为函数常量。SVR 是将原来的支持 向量机 SVM 的分类模型转化为回归模型,将原来训练数据集的 数据点远离自己类别一侧的支持向量,转为每个数据点拟合到
设 定 阈 值 ,如 0.8 或 0.75,即 完 成 了 F1-F9 特 征 的 关 键 特 征
提取。
3.3 预测模型构建
根据第 2 节 SVR 模型构建的方法,在数据预处理和关键特
本栏目责任编辑:王 力
数据库与信息管理
27
Computer Knowledge and Technology 电脑知识与技术
关于大学英语四级考试成绩的模型建立与分析
大学英语四级考试,即 CET-4,College English Test Band 4 的缩写,是由国家教育部高等教育司主持的全国性 教学考试。英语四级考试目的是推动大学英语教学大纲的 贯彻执行,对大学生的英语能力进行客观、准确的测量,为 提高我国大学英语课程的教学质量服务[1]。多年来,大学英 语四、六级考试已引起全国各高等院校及有关教育领导部 门对大学英语教学的重视[2]。大量数据和实验证明大学英 语四、六级考试可信度高,符合大规模标准化考试要求,能 够按教学大纲的要求反映我国大学生的英语水平,因此有 力地推动了大学英语教学大纲的贯彻实施,促进了我国大 学英语教学水平的提高。大学英语考试已经得到社会的认 可,已经成为各级人事部门录用大学毕业生的重要标准, 大学英语四级对于当代大学生而言具有非常重要的意义。 因此,为了能够更好地了解同学们的英语学习状 况,查找分析影响四级成绩的相关因素,本文对我 校 2013 级在校大学生的高考成绩、大学英语学习 成绩和四级成绩进行了收集、整理和分析,寻找三 者之间的关系,同时运用回归分析的方法建立了 回归预测数学模型。
31111222122601602604801110078754321110267431111046875yxxyxxyxxxy??????????????????????????????????????????????????????????????????????
2018 年 4 期
高教学刊 Journal of Higher Education
图 1 检验运行结果
* 基金项目院2017 年北京市大学生研究训练[URT]计划项目野概率论与数理统计实验案例研究与实践冶渊编号院2017J00032冤遥 * 通讯作者:吴春霞,北京石油化工学院,副教授,主要从事概率统计的教学与研究。
探究大学英语四级通过率的因素
探究大学英语四级通过率的因素一、引言大学英语四级考试是一项大规模的英语测试,始于1987年,在我国外语界乃至整个社会都有着重大影响,是公认的、最权威的、全国性的针对非英语专业在校大学生的英语水平测试。
大学生英语四级成绩在一定程度上反映了一所大学外语教学的质量和学生的英语水平,很多高校把英语四级成绩与学位挂钩,许多用人单位在招聘时也常常会把英语四级成绩作为衡量应聘者英语水平的主要依据。
因此,CET-4通过率一直受到各高校、教师及大学生们的高度重视。
二、CET-4通过率现状南京工业大学药学院自2008年成立以来,在校四个年级学生CET-4通过率一直较高,2015年6月2014级新生四级累计通过率为92.11% ,其中药学1402班新生四级一次通过率高达100%。
2014年12月药学院四个年级CET-4通过率情况为:2011级:96.91%,2012级:92.44%,2013级:80%,2014级:89.57%;2015年6月三个年级通过率分别为(2011级因毕业未统计),2012级:94.87%,2013级:81.03%,2014级:92.11%。
2014级药学院新生两个专业,共四个班,2014年12月CET-4通过率情况为:药学1401班:96.43%,药学1402班:100%,药剂1401班:81.48%,药剂1402班:80.65%;2015年6月药学1401和1402班四级通过率保持不变,药剂1401和1402班都有所提高,分别为:85.19%和86.67%。
三、影响四级通过率因素分析从以上数据及对四个年级学生的调查分析发现,影响CET-4通过率的主要因素包含以下几点。
1.生源地因素。
该院招生以江苏籍学生为主,另招全国其他各省份学生。
通过统计调查,生源地的差异较大程度地影响四级通过率。
总体来说,南方地区学生的CET-4通过率高,以江苏籍最为突出。
药学1401和1402两个班为江苏籍生源,2014年12月共57人参加考试,56个人通过,通过率高达98.25%。
基于数据挖掘的英语四级成绩分析与预测
基于数据挖掘的英语四级成绩分析与预测作者:王士虎吕纪荣冯波来源:《电脑知识与技术》2014年第03期摘要:阐述了数据挖掘的概念和算法,重点介绍了线性回归算法,基于多元线性回归算法分析了影响大学英语四级的诸多因素。
根据数据挖掘思想,收集历史数据并适当加以变换,使用统计分析技术对影响大学英语四级的诸多因素进行分析,得出了大学英语四级成绩与其影响因素之间的线性回归关系,拟合程度较高,可用于四级成绩预测,对学生学习和学校教学管理有很大的指导作用和使用价值。
关键词:英语四级;数据挖掘;统计分析;线性回归;预测中图分类号:TP301.6 文献标识码:A 文章编号:1009-3044(2014)03-0452-031 概述近几年,我国高等教育蓬勃发展,中华人民共和国国家统计局最新数据(2012年)显示,我国现有普通高等学校2442所,高校在校生人数2391.3万,其实现在的实际数字要大于统计局2012年的数据。
我国2013年毕业生数量699万,2013年号称“史上最难就业季”,而2014年的727万毕业生应该是遇上了“史上最最难就业季”。
面对这样的激烈竞争与“史上最难就业季”,用人单位对于人才的录用也更为苛刻,大学英语四级已经成为了很多用人单位的筛选条件。
如何才能顺利通过大学英语四级呢?很多在校大学生不清楚怎样能通过四级,很多教师也不知道如何管理以帮助学生通过四级。
学生的英语四级成绩到底和哪些因素有着千丝万缕的联系呢?因此,使用数据挖掘技术探索和研究并解决这些问题已经成为部分高校极为重视的教育课题。
这对于提高学生自身素质和竞争力,提升就业质量,促进部分高校的发展有一定的理论意义和实用价值。
2 数据挖掘2.1 数据挖掘概念数据挖掘(Data Mining, DM)是一个利用各种分析方法与技术,从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
基于多元线性回归的大学英语四级成绩分析
基于多元线性回归的大学英语四级成绩分析作者:陈坤陈天之覃金寿吴小钧来源:《科技创新与应用》2018年第10期摘要:为了帮助大学生做好英语四级备考准备,提高考试通过率。
文章采集了某大学土建学院14级大学生以往成绩,包括高考英语成绩、分班英语成绩、期末英语成绩以及平时英语成绩。
剔除了相关性不大的平时英语成绩,利用SPSS软件建立了预测四级成绩多元线性回归数学模型,采用该方法的成绩预测值与实际值符合较好。
该方法可以用来对四级成绩预测,具有一定的实用性。
关键词:多元线性回归;英语四级;相关性;SPSS中图分类号:O212.1 文献标志码:A 文章编号:2095-2945(2018)10-0037-03Abstract: In order to help college students prepare for CET-4 and improve the passing rate,this paper collects the past scores ofstudents of Grade 2014 in a university civil engineering college,including the scores of college entrance examination grades, class-division test grades, final English exam grades and regular English grades. The multivariate linear regression model was established using SPSS software, and the result predicted by this method was in good agreement with the actual value. This method can be used to predict the results of CET-4, and it has certain practicability.Keywords: multivariate linear regression; CET-4; correlation; SPSS1 概述大学英语四级考试(CET-4),是由国家教育部高等教育司主持的全国性教学考试。
基于随机森林的大学英语四级通过率预测模型
0 引言随着国际化进程的不断推进,英语能力已经成为衡量高校人才能力的重要指标之一,大学英语四级成绩也成为众多公司招聘的门槛之一。
通过预测大学英语四级成绩,既可以对学生英语四级成绩进行合理化评估,也可以有针对性地向成绩高危的学生进行成绩预警,帮助学生顺利通过大学英语四级考试。
常用的数据挖掘模型包括决策树[1]、贝叶斯网络和支持向量机[2]等,虽然能够对大学英语四级成绩进行预测,但它们的预测准确率不高。
随机森林模型具有泛化能力较强、对输入数据误差的不敏感性、具备分析输入特征重要度功能等优点,具有较强的通用性。
近年来,许多学者[3,4]应用随机森林模型进行预测,并取得了较高的预测准确率。
因此,本项目利用随机森林模型对某学院大学生英语四级通过率进行预测,旨在预测和识别处于成绩高危的学生,督促其认真学习英语知识,提高大学英语四级成绩。
1 随机森林算法简述随机森林是由LeoBreiman[5]提出的一种经典的机器学习算法,它是由弱模型决策回归树(Classification AndRegression Tree, CART)结合装袋算法(Bagging)和随机特征子空间(Random Subspace Method, RSM)构成。
CART既能用于回归也能用于分类,相应的随机森林也可用于分类和回归分析,其基本结构如图1所示[1]。
图1 随机森林模型基本结构构建随机森林的主要步骤大致如下:(1)boostrap 方法随机抽样,每个样本均构建一棵决策树;(2)每棵决策树持续分裂,直到节点的所有训练样例都属于同一类;achievement, College English achievement (a total of 4 semesters) and College students’ Extracurricular English use statistics With pass and fail as the classification variables, the prediction accuracy of the model reaches, which indicates that the model based on random forest is effective.Keywords: random forest; CET4; passing rate prediction; machine learning基金项目:陕西学前师范学院大学生创新创业训练项目(国家级)“基于随机森林的大学英语四级通过率预测模型——以陕西学前师范学院为例(S202014390003)”;陕西学前师范大学生创业创新训练(校级)“基于随机森林的大学英语四级通过率预测模型——以陕西学前师范学院为例(2020DC003)”。
2021-2023英语专四通过率
2021-2023英语专四通过率The English language proficiency examination known as the College English Test Level 4 or CET-4 has been a significant benchmark for university students in China for decades The CET-4 is a nationwide standardized test that assesses the English language skills of undergraduate students in China who have completed at least 4 semesters of college English courses The exam is administered twice a year in June and December and is considered a crucial indicator of a student's English language competency as well as a prerequisite for graduation and employment opportunitiesThe pass rate of the CET-4 exam has been a topic of great interest and concern among students parents and educational institutions in China In recent years the CET-4 pass rate has fluctuated with some years seeing a higher pass rate and others a lower one Analyzing the CET-4 pass rate trends from 2021 to 2023 can provide valuable insights into the overall English language proficiency of Chinese university students and the effectiveness of English language education in the countryIn 2021 the CET-4 pass rate saw a notable decline compared to previous years According to official data the CET-4 pass rate in June 2021 was 63 8 which was a decrease of nearly 5 percentage points from the June 2020 pass rate of 68 5 The December 2021 CET-4 pass rate also saw a dip to 64 7 down from 67 4 in December 2020 This decline in the CET-4 pass rate was attributed to several factors including the disruptions caused by the COVID-19 pandemic which led to online learning and reduced face-to-face instruction time Additionally the increasing difficulty of the CET-4 exam and the higher standards set by educational institutions may have contributed to the lower pass ratesHowever in 2022 the CET-4 pass rate showed signs of recovery In the June 2022 administration the pass rate increased to 66 3 a slight improvement from the previous year In the December 2022 exam the pass rate further increased to 67 9 indicating that students were able to adapt to the changes and challenges posed by the pandemic and were better prepared for the examLooking ahead to 2023 the CET-4 pass rate is expected to continue its upward trajectory as educational institutions and students adjust to the new normal and focus on improving English language proficiency Several factors are likely to contribute to this positive trend First the gradual return to in-person classes and the resumption of regular teaching and learning activities have providedstudents with more opportunities to practice and improve their English skills Second the implementation of various support measures such as targeted English language training programs and exam preparation workshops have helped students better prepare for the CET-4 exam Third the increased emphasis on English language competency in academic and professional settings has motivated students to invest more time and effort in improving their English proficiencyFurthermore the Chinese government's continued efforts to enhance English language education in the country are expected to have a positive impact on the CET-4 pass rate In recent years the government has introduced various initiatives to improve the quality of English language instruction in schools and universities These include the implementation of new curriculum standards the development of high-quality teaching materials and the provision of professional development opportunities for English language teachersAdditionally the growing importance of English language skills in the job market and the increasing number of international academic and professional opportunities available to Chinese students have further incentivized them to excel in the CET-4 exam As a result the CET-4 pass rate in 2023 is projected to continue its upward trend reaching levels comparable to or even surpassing the pre-pandemic yearsIn conclusion the CET-4 pass rate trends from 2021 to 2023 reflect the challenges and adaptations faced by Chinese university students in the face of the COVID-19 pandemic While the pass rate saw a decline in 2021 it has shown signs of recovery in 2022 and is expected to continue improving in 2023 as educational institutions and students adapt to the new normal and focus on enhancing English language proficiency The CET-4 exam remains a crucial benchmark for assessing the English language skills of Chinese university students and the pass rate trends provide valuable insights into the overall state of English language education in the country。
基于数据挖掘的大学英语四级通过率预测建模研究
Research on College English Four-Level Pass Rate Prediction Modeling Based on Data Mining
作者: 叶泽俊[1]
作者机构: [1]三明学院,福建三明365004
出版物刊名: 长春师范大学学报
页码: 55-62页
年卷期: 2019年 第12期
主题词: 教育数据挖掘;机器学习;决策树模型;英语四级;通过率预测
摘要:大数据在教育领域的应用研究主要分为教育数据挖掘和学习分析,前者侧重于发现数据之间的潜在联系,后者侧重于使用数据解释问题。
本文研究的问题属于教育数据挖掘领域,使用SPSS Modeler数据挖掘平台,采用基于C5.0算法的决策树分类方法,通过采集、整理某一地方性应用型本科院校非英语专业学生公共英语课程学习情况以及大学英语四级成绩等相关信息,建立决策树分类模型对四级通过概率进行预测。
在分析了构建模型的各种属性之后,结合对数据分析统计结果,给出了改善高校教学管理与提升英语四级通过率的思考与建议。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高校英语四级通过率预测模型
作者:吴爱燕, 宋宏伟, WU Ai-yan, SONG Hong-wei
作者单位:吴爱燕,WU Ai-yan(北方工业大学理学院,北京,100144), 宋宏伟,SONG Hong-wei(石家庄学院计算机系,河北石家庄,050035)
刊名:
石家庄学院学报
英文刊名:Journal of Shijiazhuang University
年,卷(期):2013,15(3)
1.FERNANDEZ V Wavelet and SVM Based Forecasts:an Analysis of the U.S.Metal and Materials Manufacturing Industry
2007(1-2)
2.WU Q The Forecasting Model Based on Wavelet V-support Vector Machine 2009(04)
3.LI Zhi-pong;YU Hong;LIU Yun-cai An Improved Adaptive Exponential Smoothing Model for Short-term Travel Time Forecasting of Urban Arterial Street 2008(11)
4.侯丽敏;马国峰基于灰色线性回归组合模型铁路客运量预测 2011(07)
5.Jeandro Bezerra;Rudy Braquehais;Filipo Roberto NAES:Natural Adaptive Exponential Smoothing Algorithm for WLAN Channel Prediction in Mobile Environment 2008
6.李德毅;肖俐平网络时代的人工智能 2008(02)
7.胡斌;王生进;丁晓青基于云模型的驾驶员驾驶状态评估方法 2009(10)
8.罗赟骞;夏靖波;陈天平基于云模型和熵权的网络性能综合评估模型 2009(06)
9.刘鹏;鄢余武协调质量的云模型评价方法 2009(06)
本文链接:/Periodical_sjzsfzkxxxb201303010.aspx。