教师在线教育环境下大数据的应用-2019年教育文档
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教师在线教育环境下大数据的应用
一、引言
大数据作为信息技术发展的新趋势,已经渗透到各行各业,成为重要的驱动因素,教育也无法置身事外。国内外许多专家指出,教育中的大数据挖掘,涉及教学进程、教学评估、教学管理、教学决策、教学反馈、个性化算法等各个方面。在数据分析驱动教育变革的大数据时代,教育领域蕴藏着广泛应用价值的海量数据,利用教育数据挖掘和学习具有分析技术,构建教学结构的相关模型,探索教学变量之间的相关关系,为教育教学决策提供有效的支持将成为未来教育的常态发展趋势。
从2014年上半年开始,本人负责开发的本市第一家面向浙江省中小学、幼儿园教师培训的网络学习平台正式开始投入运营。平台在师范生、教育硕士培养以及基础教育教师培训中得到良好的应用,支撑了教师教育创新,彰显了终身学习和开放学习的理念。在日常的运营过程中,教师学员在平台中日常的点击、浏览、视频操作、拖放、处理等一系列动作,无时无刻产生着海量的行为数据;除此之外,授课专家与学员的讨论区、学员与学员之间的互动区访问量都非常大,平台的论坛每天都更新数百条帖子,教师学员们在课程聊天室、Wiki、互动区一直处于超活跃状态,在这个过程中,平台也累积了大量的学员互动数据。
在这样的背景下,本文选取平台中的一门在线课程作为研究
对象,研究并构建大数据挖掘与分析机制,对这些纷繁复杂的数据进行提炼和分析,进行有效地利用开发,发现这些数据的背后蕴含的学员行为轨迹,捕捉学员群体或个体的学习行为、学习习惯,跟踪学员的成长轨迹,发掘平台本身所带有的不合理模块资源,进而改进平台功能模块、教学资源。平台中大数据的有效应用将会弥补目前国内教师在线教育的海量数据分析空白,具有非常突出的意义,除了促进教师教育培训模式的多样化和个性化定制,同时也会对我国各类在线教育提供大量的参考和启示。
二、平台大数据分析机制
平台学习分析的指导思路是选取数据聚集的各关键因素,运用大数据技术挖掘学员的平台登录细节、浏览页面、资源搜索词关联度、搜索频次、资源操作细节、互动研讨语义内容等信息轨迹,并在此基础上采用大数据集群算法和趋势探测等数学性算法过程,深度解析平台学员的学习行为数据和模式。
本文在借鉴瑞典斯德哥尔摩大学在线教育学习分析模式的
基础上,以遵循“Teschura”分析技术作为数据挖掘支撑,规划了平台学习数据分析三元架构。如图1所示,平台大数据分析架构包括资源活跃度分析、搜索词关联度解析、学习效果相关性分析三大部分。其中资源活跃度分析是页面数据挖掘的首要步骤,主要包括页面占用细节、登录信息、独立访客等要素,通过数据集分析组件Oracle Server Analysis Service与下一步骤绑定。搜索词关联度解析既是本文学习分析的核心架构组件,也是本文
学习分析的创新点之一,该模块旨在重组学员群体热点搜索词的相关性,挖掘学员群体的教学兴趣聚点,以此为依据重构并优化平台教学资源。学习效果相关性分析是三元分析架构的关键分析组件,以高性能网格算法HPCC,面向解决方案的标签工具RapidMiner作为分析工具,将各教学功能模块的使用率与学员群体的学习效果的相关性为研究对象,以此为依据来优化各教学模块在平台kecheng 中的比重。
三、基于学员的大数据行为分析
平台数据挖掘功能的首要任务就是进行资源活跃度分析,包括资源访问频次(V V)、独立访客(UV)、浏览次数(PV)、独立访问IP数(IP)、链接来源(SA)、站点停留时间(Ts)、页面停留时间(Tp),继而采用站点分析专有的全景统计、站长统计、流量分析、来源分析、转化分析、报表展示等手段,从资源利用角度来显现站点学员学习行为和习惯,并揭示平台的缺陷和优化方向。
本研究以浙江省中小幼教师教育EduSoho培训平台中2016年下半年的后台数据为参考,并选取平台中的一门在线课
程――“教师课件设计实用技巧与案例详解”(简称“课件技巧与案例”)作为研究对象。该门课程总共包含六章,其中按照课程教学重难点可分为九大版块内容,包括:动画、图表、音视频、插件、控件、图片高级技巧、超链接、模板、案例,开课时间为2016年10月15日至2017年1月15日,跨度三个月,这一时
间段该门课程的选课总人数为2613人。
(一)资源活跃度分析
对资源活跃度的分析主要关注3个参数:I P、UV、PV。独立访问IP数(IP),可统计学员在访问站点时的IP地址,该项参数与站点停留时间(Ts)、页面停留时间(Tp)这两项参数一同进行分析,便可挖掘出学员浏览平台的集中时间段和学习习惯等基础数据。浏览次数(PV),即通常所说的PageView值,学员每打开1个站点页面,记录1个PV,当学员多次打开同一页面则PV累积计算,用以衡量站点?Y源访问情况。独立访客(UV),单日内访问站点页面的访客数,相同访客多次访问站点页面,仍计算为1个独立访客。如图2所示,通过日均P V、I P 地址基础数据的挖掘整理,工作日白天有3个学员井喷时间段,分别是9:30-10:00、13:00-14:00、15:30-17:00,而这三段时间正好对应着是各校学生的课间休息阶段和下午的自习
阶段,大多数的学员更倾向于利用常规工作空余时间进行该门课程的学习。同时,这三个井喷时间段中的U V值远大于I P值,通过比对发现同一学校不同教师学员在访问站点时,平台所追溯的IP地址相同,则可推断为大部分学员更喜好在工作地点进行学习。而且个人每次登录学习的时间并不长,基本上平均每次以8-11分钟为主,甚至在线持续时间为3-6分钟的也占了相当一部分比重。出乎大多数研究人员的预料,根据日志数据统计,如图3所示,总体来看非工作日平台中学习的学员人数一直保持在
低位,小幅度起伏不足以成为变化标准。由此可见,学员更善于在工作进度中充分利用空余时间、闲散时间进行知识点和技能的学习,与传统的教学方式差异明显,更加符合碎片化学习的趋势。
对课程九大版块内容的PV与UV值比对中同样可以发现问题。如图4所示,插件、控件、超链接的资源访问度的UV值处于低位,但PV值非常高,两者的访问数据值差异很大,则表明这3部分版块内容尽管并不吸引所有学员的关注,但有一部分特定的学员对该页面资源的持续学习热度比较高。因此,可将插件、控件、超链接这3个模块内容整合为专题版块,并在互动区中划分专门的区域为这3块教学内容提供专题服务。
(四)学习效果分析
学员模块点击率与学习效果的相关性一直是文章研究的重点。日常在线学习行为与学习效果的相关性是掌握学员学习习惯的主要因素,也是判断平台功能模块设置合理性的关键。选取本课程中的热点教学资源为研究对象,通过格鲁姆―拉格瑞斯(Grum-Lagrus)解析式(式1)对统计的各时间占比进行频次解析,并将频次的访问版块相关性进行分类,可得互动版块频次、Wiki版块频次、视频浏览频次、文本浏览频次、SCORM/AICC频次五大重点研究频次。
其中;Si为第i个学员的学习效果平分数,Wi为第i个学员的学习时长,d为德佩因子,β为希莱尔系数,αi为第i个学员的点击频次。剔除相关度不高的版块访问粒度,进一步通过