如何用线性回归分析和水平测试成绩解读
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何用线性回归分析和水平测试成绩
估计学生高考成绩 评价学生和学校的进步情况
“普通高中新课程学生学业成绩评价研究”项目组
从2005年开始,教育部“普通高中新课程学生学业成绩评价研究”项目组开始高中必修课学业水平测试的研究活动。作为高中必修课的学业水平测试,具有三个方面的功能:第一,检查学生经过必修课学习后达到的水平,帮助学生建构学科知识结构;第二,诊断教学中存在的问题,为教师搞好选修阶段的教学以及高考复习做准备;第三,预测学生在高考中可能达到的成绩水平。前两方面的功能是显而易见的,我们通过每年测试后的信息反馈和分析报告,已经做了这项工作。第三项工作是大家所关心的,然而要如何做才能达到呢?通过回归分析,我们可以计算出每一位同学、每一间学校从必修课水平测试到高考这段时间内的进步情况,建立起高考与水平测试之间的关系模型,进而粗略地预计新参加水平测试的学生将来参加高考可能达到的成绩区间。下面简单介绍线性回归分析的方法和如何解读数据的方法。
1、 线性回归分析
线性回归是利用线性方程来模拟表示两组相关数据之间的关系的方法。如果两组相关数据,比如说,必修课水平测试与高考成绩之间存在着相关关系,这种关系可以近似地用一个线性方程来表达,即高考的成绩高考y 与水平测试的成绩水平x 之间的关系可以表示为:b ax y +=水平高考,其中a 和b 为两个常数,通过统计分析可以把这两个常数找出来。这样对应于每一个水平x 的值,就可以找到相应的高考y 值,即可以用这一关系来预测高考的期望成绩。
由于新课程实施后的高考是以必修课的内容为主要的测试对象,学生经过必修课的学习基本上奠定了高考的知识基础,掌握了相关学科的基本能力,又因为我们的测试题目的目标要求与高考的目标要求在本质上是一致的,必修课水平测试的成绩与高考成绩应该存在着高度相关的关系。我们的研究也证实了这种关系的存在。在2005年,佛山市顺德区和禅城区的高二学生参与了我们的必修课水平测试,在2007年他们又参加了高考。根据这些考生两次考试的成绩,我们计算得到两次测试的语文科相关系数为0.454,数学科(文)的相关系数为0.429,数学科(理)的相关系数为0.450,英语科的相关系数为0.608,语数英三科总分(文)的相关系数为0.680,语数英三科总分(理)的相关系数为0.693。由于高考是在必修课水平测试施测一年后才进行的,因而上述相关系数都是比较可观的,尤其是语数英三科总分(理)的相关系数高达0.693。因此,通过统计分析确定上述回归方程是可能的。
以下以英语学科为例来具体说明如何运用线性回归分析来估计学生高考可能达到的成绩。
2、 利用回归直线与回归方程估计高考成绩
在研究05年必修课水平测试和07年英语高考成绩的关系时,以横坐标和纵坐标分别表示各考生必修课水平测试中英语成绩和高考英语成绩画点(见图1)。我们发现,这些点均匀地分散在图中的红色线周围。红色线基本展示了必修课水平测试中英语成绩和高考英语成绩的关系,我们称之为两者的回归直线。回归直线对应的线性方程称为回归方程,下图红色线对应的回归方程为:
高考y =37.887+0.790水平x 。
图1:05年必修水平测试与07年高考 英语科 回归图线
我们可以利用回归方程来预测高考的期望成绩。例如,在05年的必修课水平测试中,张恒源同学的英语成绩是25分。由回归方程高考y =37.89+0.79水平x 我们可以得到其英语高考成绩期望值为57.64分。
不过,由于在必修课水平测试与高考之间,学生还要经过一年多的选修课学习以及高考复习。在这段时间内的许多因素,如:学生本身的努力程度,学生的学习方式,教师的教学水平和教学方法等等,都会对学生的高考成绩产生影响,水平测试成绩与高考成绩之间的关系不可能是简单的线性关系,由线性方程b ax y +=水平高考计算得到的高考y 跟考生高考的实际成绩未必一致。加上水平测试和高考本身都存在测量误差,因此需要在回归方程的基础上加一个反映估计误差的区间,以此来估计学生的高考可能达到的成绩。在回归分析中,有一个概念“估计标准误”S ,就是用来表示估计误差的。当统计数据正态分布时,考生高考的实际成绩落在区间[高考y -S ,高考y +S ]的概率是68%,而落在区间[高考y -1.9S ,高考y +1.9S ]的概率是95%。一般的,我们采取[高考y -S ,高考y +S ]作为高考成绩的期望区间。当然,用这样的方式来估计学生的成绩不可能是非常精确的,但是也可以让学生和教师明确自己的努力方向,可以判断学生和学校的进步情况,从而为评价学校的教学和学生的学习提供依据。
在上例中,由SPSS 计算可得估计标准误为17.21。由于张恒源同学的英语高考成绩期望值为57.64分,所以
他的英语高考成绩的期望区间为[-17.21+57.64,17.21+57.64],即[40.43,74.85]。
由于高考的延续性和考生总体水平的相对稳定性,我们可以利用05-07年的回归分析结果,预测06年参加水平测试的学生在08年参加高考时可能得到的成绩。比如说,06年有一位考生的英语水平测试成绩和张恒源一样是25分,可以粗略地预测他08年参加高考的英语成绩可能在40-75分之间。
经过我们对05年参加必修课水平测试、07年参加高考的考生的数据进行回归分析,我们得到的回归方程如表1所示。
表1:05年必修水平测试与07年高考回归分析数据表
科目 语文 数学(文)
数学(理)
英语 三科总分(文) 三科总分(理)
匹配的考生数 8927 4370 3821 8531 3589 3459 匹配的学校数 20 19 19 20 17 17 相关系数 0.454
0.429
0.450
0.608
0.680
0.693
回归方程 Y =63.03+0.43X Y =60.62 +0. 59X Y =55.58 +0. 52X Y =37.89+0.79X Y =100.92 +0. 90X Y =94.35 +0.88 X
估计标准误
10.94
22.66
18.81
17.21
35.77
33.71
3、 进步值
用回归分析来预测高考的期望成绩,得到的是一个以期望值为中值、标准误为幅度的区间。如图1所示,两条蓝色线分别为方程y =高考y +S 和y =高考y -S 对应的直线。这两条蓝色线分别表示期望区间的上下界。当表示考生两次成绩的点落在两条蓝色线之间时,则认为他正常发挥,该考生的进步值为“0”;如果他的实际成绩超过区间上界,即在表示上限的蓝线的上方,则认为他进步了,进步值=高考实际成绩-区间上界;如果他的实际成绩比区间下界还少,即在表示下限的蓝线的下方,则认为他退步了,进步值=高考实际成绩-区间下界。
图2给出每位同学的水平测试成绩、高考成绩期望区间和进步值的情况。从图2中可见,在07年的高考中,张恒源同学英语高考的实际成绩为32分,比区间下界还少,所以他的进步值=高考实际成绩-区间下界=32-40.43=-8.43。又如,蔡淑意同学水平测试的成绩为27.50,高考英语成绩的期望区间为[42.41,76.83],她高考的实际成绩为44分,落在期望区间,她的进步值为0。再如,黄冠鹏同学水平测试的成绩为37.00,高考英语成绩的期望区间为[49.92,84.34],他高考的实际成绩为101分,超出了期望区间的上界,因而他的进步值=高考实际成绩-区间上界=101-84.34=16.66.。
图2:05年必修课水平测试与07年高考英语成绩期望区间与进步值
4、 学校教学质量监控
按如上方法可以计算出各个考生的英语高考成绩期望值、期望区间以及进步值。进而可以计算出各学校进步