运用数理统计方法分析考试成绩
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我们计算分数高于 75 的概率 :
(1) 班 : P (ξ ≥75 ) = 1 - F ( 75 ) = 1 -
(75 - 75. 9) 5. 76
= 1 - ( - 0. 16) = (0.
16) = 0. 5636≈56. 4 % (2) 班 : P (η≥75) = 0. 2843≈28. 4 % 就是说 ,成绩高于 75 分的人数 , (1) 班约占全班的 56. 4 % ,而 (2) 班约占全班的 28. 4 %. 6 对两班学习成绩的差异情况进行分析
够反映该组数据统计特征的数字 ———统计量. 最常用
的有两种 :一是表现数据集中趋势的量算术平均数
(平均分数) ;二是表现数据分散程度的量方差或标准
差 ,有时也用变异系数.
2 算术平均数 (平均分数)
经过计算 , ( 1) 班和 ( 2) 班几何的平均分数分别
为 : x1 = 75. 9 x2 = 72. 4 它表明 , (1) 班成绩集中在 75. 9 分 , (2) 班成绩集
收稿日期 :2000 - 06 - 07 作者简介 :张雄 (1964 - ) ,男 ,陕西蓝田人 ,安康第二师范学校讲师.
66
最多 ; (2) 班成绩在 71. 5~74. 5 一组人数最多. 还能看
出各班分数的集中及差异大致情况. 这时 , 我们已对
分数的分布特征有了较直观的认识.
要进一步发现和表示成绩的规律性 , 还需计算能
中在 72. 4 分. 由 75. 9 > 72. 4 说明 : (1) 班学生学习几
何课的整体水平高于 (2) 班.
我们也可算出两班全体学生的总平均分数 : x w =
74. 2
3 离中趋势的度量
3. 1 方差或标准差
n 个数据 x1 , x2 , …, x n 称
S2 =
1 n
n
6(
i=1
xi
(
y
4
72. . 55
4)
P ( x1 ≤ξ< x2) =
(
x
2τ
μ )
-
(
x
1τ
μ )
68
图 1 正态分布图
=
(
x2
-
75. 9 )
5. 76
-
(
x1
-
75. 9 )
5. 76
P ( x1 ≤η< x2) =
(
x2
-
72. 4 )
4. 55
-
(
x1
-
72. 4 )
4. 55
计算时应注意 : ( - h) = 1 - ( h)
数据单位一致 ,用 S 来刻画数据的离散程度比 S2 更
方便.
我们先算出两个班成绩的方差 ,再算出标准差.
因数据已分组 ,可用公式
S2 =
r
6 f k d2
k=1
n
-
r
6 fkd 2
k=1
i2
n
其中 : d =
xck
i
AM
, AM
为估计平均数.
xck为第 k 组的组中值
f k 为第 k 组的实际频数
表 1 频 数 分 布 表
组中值
频 数
xc
f 1 (1 班)
f 2 (2 班)
61
1
2
64
4
1
67
2
5
70
4
9
73
6
17
76
13
12
79
9
2
82
7
1
85
2
1
88
1
91
1
n1 = 6 f 1 = 50
n2 = 6 f 2 = 50
频数分布表将一堆杂乱无序的数据排列成序. 从 表 1 中可以看出 : (1) 班成绩在 74. 5~77. 5 一组人数
E ( x1 - x2) = Eξ - Eη = 0
方差 D ( x1 -
x2)
=
D(
x1)
+
D(
x2) )
=
τ21 n1
+
τ22 n2
构
造统计量
U = x1 - x2 ~ N (0 ,1)
τ21 n1
+
τ22 n2
给水平 α= 0. 05 ,算出 U =
75. 9 - 72. 4
5. 762 50
2001 年 8 月 第 17 卷第 3 期
陕西教育学院学报 Journal of S haanxi Instit ute of Education
A ug. 2001 V ol . 17 No. 3
运用数理统计方法分析考试成绩
张 雄
(安康第二师范学校 , 陕西安康 725000)
摘 要 :本文以一次考试成绩为例 ,给出了数理统计方法在教学评估中的一个应用 ,通过编制频 数分布表 ,计算均值 、方差 、标准差 ,进行正态分布的拟合度检验及对成绩差异情况检验等过程 ,得出 了一些结论. 分析了班主任这一因素对学生学习成绩的明显影响.
p11 = P(89. 5 < x < 92. 5) = 0. 0072 再由 pk ( k = 1 , 2 , …, 11) 可算出 npk 及 x2 值 (表 2) :
组别
1 、2 3 4 5 6 7 8 9 10 、11
实际频数 fk
1+4 2 4 6 13 9 7 2
1+1
理论频数 npk
2 3 6 9 10 9 6 3 1
合计 n = 6 f k = 50
表 2 拟合度检验值
f k - npk
( f k - npk) 2
3
9
-1
1
-2
4
-3
9
3
9
0
0
1
1
-1
1
1
1
( f k - npk) 2 n pk
4. 50
0. 33
0. 67
1
0. 90
0
0. 17
0. 33
1
x2
=
6
( fk
- npk) 2 n pk
= 8. 9
给 α= 0. 05 ,查自由度为 r - m - 1 = 9 - 2 - 1 = 6 的 x2 分布临界值表 , xα2 = 12. 592. 由 x2 < xα2 , 故接受 H0 , 即可以认为该班成绩的频数分布服从正态分布. 用同样的办法可检验 (2) 班成绩的频数分布亦服从正 态分布 .
正态分布 ,有时也出现偏态分布 , 这时需对分布进行 正态化转换. 为了进一步对成绩进行分析 , 我们要检 验分布是否为正态分布. 4 成绩频数分布为正态的拟合度检验
拟合度就是吻合度 , 拟合度检验是指理论曲线与 实际观察曲线相吻合的程度. 常用方法是 x2 检验.
我们对 (1) 班成绩的频数分布进行 x2 检验. 设 H0 : x ~ N (μ,τ2 ) 其中 μ、τ2 为未知参数 , μ、τ2 的极大似然估计分别为 x 、s2 、由前文资料 , x = 75. 9 , s2 = 5. 762 ,在 H0 成立的条件下 , 查标准正态分 布函数值表得 : p1 = p (59. 5 < x < 62. 5)
6. 1 平均分数的差异
已知 (1) (2) 两班成绩都服从正态分布 ,即 ξ~ N (μ1 ,5. 762) n1 = 50 η~ N (μ2 ,4. 552) n2 = 50 又知 x1 = 75. 9 , x2 = 72. 4 设 H0 :均值相等 ,μ1 = μ2 ,则有
r
n = 6 f k 为总频数 i=1
经计算 , (1) 班成绩的方差为
S
2 1
= 33. 17 ,标准差
S1
=
5. 76 ; ( 2) 班 成 绩 的 方 差, 标 准 差
S2
=
4. 55.
3. 2 由两个班成绩的标准差计算全体学生成绩的标
准差
用公式 :
Sw =
1 n
k
-
x) 2
为这 n 个数据的方差 。其中 x 是 n 个数据的算术平
均数.
用 S2 来衡量一组数据波动大小 , 即数据偏离平
均分数的大小. 当平均分数一定时 S 2 越大 , 说明这组
数据波动越大 , 即这组数越分散或称离散程度大 , 反
之亦然 .
由于 S2 的单位是原数据单位的平方 , 故常用方
差的算术平方根 : S = S 2 并称 S 为标准差. S 与原
p5 = P(71. 5 < x < 74. 5) = 0. 1816
p6 = P(74. 5 < x < 77. 5) = 0. 2051
p7 = P(77. 5 < x < 80. 5) = 0. 1778
67
P8 = P (80. 5 < x < 83. 5) = 0. 1185 p9 = P(83. 5 < x < 86. 5) = 0. 0605 p10 = P(86. 5 < x < 89. 5) = 0. 0238
关键词 :数理统计 ;频数分布 ;标准差 ;拟事度检验 中图分类号 :O212 ; G633. 6 文献标识码 :A 文章编号 :1008 - 598X(2001) 03 - 0066 - 04
0 数理统计有着极为广泛的应用 ,对教育及教学工 作进行评估 、定量分析也要用数理统计. 本文以安康 二师 98 级 (1) (2) 两个班《几何》期末考试成绩为例 ,运 用数理统计方法对成绩 (数据) 进行分析研究.
ξ~ N (75. 9 ,τ21) n1 = 50
η~ N (72. 4 ,τ22) n2 = 50
又 S1 = 5. 76 , S2 = 4. 55
设 H0 :τ21 =τ22 构造统计量
= F(62. 5) - F(59. 5)
=
(
62.
5 - 75. 5. 76
9
)
-
(
59.
5 - 75. 5. 76
9
)
= 0. 0072
同理 : p2 = P(62. 5 < x < 65. 5) = 0. 0252
p3 = P(65. 5 < x < 68. 5) = 0. 0634
p4 = P(68. 5 < x < 71. 5) = 0. 1251
两个班成绩的频数分布与理论频数分布 (正态分 布) 差异不显著 (α = 0. 025) , 或认为吻合度很好. 这 样 ,我们就可以用正态分布的性质来研究两个班成绩 的规律 . 5 用正态分布的性质分析两个班的成绩
正态分布有中间高 、两头低 、左右对称的直观特
征. 已经知道 , 两个班成绩的频数可从认为是正态分 布 , (1) 班成绩ξ~ N (75. 9 , 5. 762 ) , (2) 班成绩 η~ N (74. 2 ,4. 552) . 5. 1 密度函数及图形 (如图 1)
从两组数据 (略) 中 ,只能看出成绩分布在 60~90 和 60~85 之间 ,不能看出其它信息. 首先 ,要对这些数
据进行分组 ,编制出成绩的频数分布表. 1 编制成绩频数分布表
就是把成绩 (数据) 分成若干组 (小区间) , 编制出 每个组内数据出现的个数 ( 频数) 的表格. 通过求极 差 、确定组距 i 与组数 r 、确定分组区间 、计算频数 f 等步骤 、编制出下列频数分布表 (表 1) :
组别
1 2 3 4 5 6 7 8 9 10 11 合计
分组区间
(59. 5 ,62. 5) (62. 5 ,65. 5) (65. 5 ,68. 5) (68. 5 ,71. 5) (71. 5 ,74. 5) (74. 5 ,77. 5) (77. 5 ,80. 5) (80. 5 ,83. 5) (83. 5 ,86. 5) (86. 5 ,89. 5) (89. 5 ,92. 5)
+
4. 552 50
= 3. 37
再查表知 Uα = 1. 96 ,因 U > Uα 故拒绝假设 H0 . 即是
说 ,两个班平均分数有明显差异. 且知得此结论犯错
误的概率只有 5 %.
由平均分 75. 9 > 72. 4 知 , (1) 班平均分数明显高
于 (2) 班.
6. 2 离散程度的差异 (方差差异)
ξ: f ( x) =
1
5. 76
η: f ( y) =
1
4. 55
5. 2 分布函数
2πe -
( x - 75. 9) 2 2 ×7. 562
2πe -
( y - 72. 4) 2 2 ×4. 552
ξ: F ( x ) = ∫x- ∞f ( x) dx =
(
x
- 75. 5. 76
9)
η: F ( y) = ∫y- ∞f ( y) dy = 5. 3 在区间[ x1 , x2) 上的概率
5. 48
3. 3 变异系数
比较两组数据时 , 若平均分数不相等 , 要用变异
系数来比较. 一组数据的标准差与平均数的百分比称
为该组数据的变异系数 ,记为 CV . 公式为 :
CV = s ×100 % x
计算两 个 班 成 绩 的 变 异 系 数 分 别 为 : CV 1 = 7.
59 % , CV 2 = 6. 28 %. 由此可见 , (1) 班成绩的差异程度略高于 (2) 班. 考试成绩的频数分布大多数是正态分布或近似
k
6 ( nisi2) + 6 ni ( xi - x w ) 2
i =1
i=1
式中 : ni 为第 i 个班的人数 si 为第 i 个班学生成绩的标准差
xi为第 i 个班学生成绩的平均分数
x w 为全体学生成绩的总平均分数
k
n = 6 为全体学生人数 i=1
经过计算 ,两个班全体学生成绩的标准差 S w =