第九章体育统计学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章
计,也
适用于非参数估计,同方差分析 F 检验一样, 能同时对多种资料进行检验的方法。

在本章将阐述如何将统计假设检验的概念加以推广, 样本来自元素可分成三个或更多个类目的总体的情形。

/ 2
检验在检验两个以上样本率或构成比之间差异时有无显著性
的方 法。

第一节 八分布与/2

/ 2
检验是一种用途较广的显著性检验方法,它既适用于参数估
* 2
检验是一种
使之适用于 这里只介绍用
在第七章叙述总体方差的假设检验时,曾简单提到 定义:设从标准正态分布 N (0, = 1,2,,,,),它们的平方和记作 八,
八=u 12 + U 22 + ,,
+ U n 2 1)中,取出n

n
=2 U 2
八分布。

个样品u i ( i
(9— 1)
般称/ 2
为服从参数为
n 的/ 2
的分布。

(卡方分布)
如果从一般正态分布
N (卩,b 2
)中,抽出n 个样品x i ,因为
/2,所以公式(9—1)转化为:
n X —P
2
=送
(一)2
n
艺(Xi»
iM (9 —2)
有时在实用中,用X代替则有
丁 2
=
送(X -X)2 = (n - 1)S 2
这同第七章中提过的相同。

如果将/2的各种不同数值连同相应的相对出现频数列出, 就得 到/
2
9— 1可看到/ 2
的样本分布形式有两个特点: 正态,而是正偏态分布,右侧无限延长以横轴为渐近线; 不
同自由度的/2
取样分布不同。

随自由度增大,曲线趋于 “正
态”分布。

实际上,在自由度为 30时,曲线基本对称
且近似正态分布。

/ 2
分布的实际重要性是基本于这样的事实,即对大样本而言, 量
X 2 上[d^XJl]
i W T i
的分布接近于*2的分布。

由图
(1)
(2) “对(9— 3)
图9— 1 与几种自由度相对应的/ 2
分布
式中:A \ =观察频数,即“实际数”;
T i =预期频数,即“理论数”;
K=给定情形下实际数与理论数的配对数。

所以近似地有
/2
= F (A-T )2
T
公式(9 — 4)是下面进行鼻2
检验的常用公式。

/ 2
检验主要是根据样本算出的 / 2
值与查 2 2
值/ a (n )作比较。

若/ 2
" a (n ) , P (Ho )W - 显著性水平o 上差异有显著性意义;否则称在《水平上差异无显著性 意义。

/ 2
分布的尾端面积或概率 P 值在附表“ / 2
值表”中按不同的 自
由度n 分别列出。

至于自由度n ’是直接由资料划分类别的多少 所决定的,与样本的大小无关。

确定 n 的原则是:互相排斥的类别 数k ,减去所受的限制数m ,即n ’二k — m 。

第二节 两个样本率差别的/ 2检验
当两个样率不同时,可能由两个原因造成:一是差异由抽样误差 所致;二是它们来自不同质的总体,确有不同。

为区分二者,则要做 检验。

/ 2
检验的步骤通过下例说明。

例9— 1 (资料同7— 12)为研究游泳与患慢性鼻炎有无关系,
随机抽测游泳与田径两专业的学生进行对比,抽测资料如下:
问患慢性鼻炎是否与专业有关? ( d = 0. 05)
(9 — 4)
'值表所得的临界 ,拒绝H o ,则称在
上表中,—20---------- 60这四个格子内的数字是整个表的基本数
6 74
字,故这种资料称为“四格表资料”,或称为“ 2X 2列联表”。

解:(1)无效假设H 0 :兀1二兀2 (两专业患病率相同,均为合计的患病率16. 25%)
(2)计算八值:
宀二(A-T)2
T
实际数A已知,理论数T(表中括号内的数字)是根据H 0推算出来的:
先由合计的160人患病26人知理论上的患病率为26
160 16. 25%,则游泳专业80人理论上的患病人数为
T11 = 80 X 空=13
160
由此可知理论数的计算公式为:
n r - n
c
n
(9 —5)
式中: r —行号,c —列号, n
c —c列的合计数,n n r —r行的合计数, —总例数。

这样, T I2 80^134
160
67
T21 = 空些=13 160
T22 80M34
160
67
=(20-13)2 亠(60 - 67)2 亠(6-13)2 亠(74 -67)2
1367 13 67 =3. 7692 + 0. 7313 + 3. 7692 + 0. 7313 = 9. 001
(3) 取 a = 0. 05;
“行X 列表”资料的自由度为:
n =(行数—1)(列数—1) = (r — 1) (C — 1) (9— 6) 本例
n'= 2— 1) (2— 1) = 1 查八值表得到'0.05(1) = 3. 84
(4) 判断结果: 丁 2 V 2
:* = 9. 001> 上 0.05(1)= 3. 84
••• P (H 。

)< 0. 05,拒绝H 。

,由数据上看,认为患慢性鼻 炎
与游泳专业有关。

此结论与例7— 11用U 检验去作的结论一致。

我们还可以用四格表专用公式计算 / 2值:
(ad - be)2
-n
式中a 、b 、c 、d 分别为四格表资料实际数,总例数 n 二a + b + c + d 。

把上例数据
(ad - b C)2
”n
(a + b)(C + d) (a + C )(b 中 d)
=(20
"60
92
"60
〜9. 001 80X80X 26^134
结果与前法相同。

2
另外需要注意:7 2
沪 只是一种近似。

在1
<T <5
, 且n >40时,对于自由度为1的四格表来说为减小偏差,需要计算
7 2
(a + b) (c + d)(a + c)(b
(9— 7)
代入公式(9— 7)得:
校正的工2
值。

此时:
公式(9— 8)为公式(9— 4)的校正;公式(9 — 9)为公式(9 —7)的校正。

第三节
多个样本率(行X 列表)的 /2
检验
四格表是行X 列表中最简单的形式。

至于行X 列表(亦称r X c 表)的理论与计算步骤均与四格表类同。

用公式/ 2
=送(A 小 去计算行X 列表的 八
T
简便可用下面公式,由实际数直接计算出 /2
值。

/2
=送(|A-T 卜 0.5)2
T
2
y 2
=
( |ad -bc|- 0.5n ) -n
(9— 8)
(a + b) (c + d) (a + c) (b + d)
(9— 9)
值较为麻烦,为
宀 n (送 一-1) n r n c
(9— 10)
例9 — 2 上例的结论认为患慢性鼻炎与游泳专业有关。

步了解患慢性鼻炎的发病率与游泳专项运动年限有无关系, 资料如下表中。

为进一 收集调查 解:(1)无效假设H 0 :发病率与运动年限无关。

(2)计算/ 2
值:
Z 2
二 n (送 --- 1)
=281 X (丄84 咒41
802
84 咒
152
84咒
702
85 咒
〜10.36
(3) 取 a = 0. 05, =3。

查/ 2值表(书后附表6)知
(4) 判断结果:
*2 0.05(3),拒绝H 0 ,认为不同运动年限的游泳运
动员鼻炎发病率的差别的显著性意义。

行X 列表八检验的注意事项: (1)

行X 列表中如果有五分之一以上的格子的理论数小于
5,
或有一个格子的理论数小于1时,则应使理论数小于5的格子与邻组 合并以增大理论数。

否则易导致错误的结论。

但合并时要注意是否合 理,不同质的资料不可并组!此时只有增加观察例数再作统计分析。

(2) 做行X 列表*2检验得到P ( H 0 )w 0. 05,则拒绝无效假 设H 0 ,说明被比较的几个样本率之间总的差别有显著性,但不能作 出任何两组间差别都有显著性的结论!要比较某两个样本率之间的差 别如何,需另作检验。

鼻2分布检验程序
、程序功能
/ 2
检验常用于符合度分析。

应用本程序时如按程序所问输入行 元
素的个数、列元素的个数和每个元素值,程序就能自动计算出其 2
值、自由度数及其结尾值(检验水平)。

使用者将结尾值与给定的显 著性水平比较即能得出检验的结果。

二、程序中使用的主要符号说明
Z : TOTAL X - SQUARE VALUE 总计鼻 2
值; V : DEGREE OF FREEDOM 自
由度数;
X2 : TAILEND VALUE 结尾值。

102
+ + 60咒 41 502
122
+
60x 240
52^41
+ 40
' -1 ) 52 沢 240
n =( r — 1)( c - 1) 鼻 0.05(3) = 7. 81
=(4- 1) (2- 1)
三、程序所依据的理论计算公式
k (f • _f .)2
Z = Z [('oi 'ei)]
i 3 f
oi
其中:f oi 为每一组的观察频数;
f ei 为相应的理论频数。

5 四、程序名称:X — SQUARE . TES
REM X — Square. TES 10 P RINT x square. Tes
20 P RINT
30 DIM V1(25), V2(5), A(5), M(4) 40 INPUT “ number of rows = ” , R 50 P RINT “ number of rows = ” ; R
60
INPUT “number of columns = ” , C
70 P RINT
“number of columns = ” ;
C
80 P RINT “Contingency table : ” 90 FOR I =1 TO R 100 P RINT “ROW” ;I 110 FOR J =1 TO C
120 P RINT “Element ” ; J; 125 P RINT “Element ” , J; 130 INPUT E
131 EA = (I -
-1)*C + J
132 V1(EA): =E 135 P RINT E
136 P RINT
140 NEXT J
145 P RINT
150 NEXT I
160 P RINT 170 L = 0
440 450 ; v
180
190 FOR I = 1 TO 200 FOR J = 1 TO 210 A(I) = A(I) +
V1(M) 220
230 NEXT J 240 L = L +
A(I) 250 NEXT I 260
270 FOR I = 1 TO 280 FOR J = 1 TO N STEP C
290 V2(I) = V2(I) +
V1(J) 300 NEXT 310 NEXT 320 330 PRINT
Observed value ””; ;“ Expected value ””
340 350 360 370 380 390 400 410 420 430 460 X -SQUARE CONTRIBUTION”
FOR I = 1 TO C PRINT “Column” ; I FOR J = 1 TO R P = A(J) * V2(I)
/ L
X = I + (J -1) *
C
Y 二(V1(X) — P)八 2
/ P PTINT NEXT NEXT
”V1(X), ”P,
V = (C —1) * (R —1) PRINT “X— square = PRINT “Degree of freedom =
470 PRINT “Tial end value = ” ;
480 R = 1
490 FOT I = V TO 2 STE P — 2
500 R = R * I
510 NEXT I
520
K = Z 八(INT ((V + 1) / 2)) *
EXP (
—Z / 2) / R 530 IF INT (V / 2) = V / 2 THEN 560
540 J = SQR (2 / Z / 3. 1415926536)
550 GOTO 570 560 J = 1
570 L = 1
580 M = 1
590 V = V + 2
600 M = M * Z / V
610 IF M < . 0000001 THEN 640
620 L = L + M
630 GOTO 590
640 X2 = 1 — J * K * L
650 P RINT X2
660 END
五、例题
用A 和B 两种方法,对同一物体进行处理的试验结果如下表:
试有/ 检验法检验这两种方法的处理结果有无显著性差别?
Observed value
Exp ected value
X — Square C
Colum n
1
44 39. 70588 0. 4644007
81
85. 29412
0. 2161869
Colum n
2
10
14.29412
1.290003
35 30. 70588
0. 6005182
X — square = 2. 571108
Degree of freedom = 1 Tial end value = 0. 1088316
•••结尾值二0. 1088316大于a 值 ••• A 与B 两种方法的处理结
果没有显著性差别。

(a 二 0. 05)
解:按程序所问输入数据,计算得到结果。

RUN
X — square. Tes nu mber of rows=2 nu mber of colu mn s=2 Con ti ngency table: Row 1 Eleme nt 44 Eleme nt
10
ROW 2 Eleme nt 81 Eleme nt
35
习题九
1 .对r壮列联表资料的检验应注意什么问题?
2.在对两个率作显著性检验时,既可用/ 2检验,又可用第七章中的U检验。

这是因为在自由度为1时,有7 2 = U2。

请思考两种检验在实用上的区别。

3 .如何从r >C列联表计算自由度?
4.为调查某体校新生的运动能力,特作运动测试,结果受过基
础训练的58人中有40人成功;未受过基础训练的27人中有9人成功。

试问在a = 0. 05的显著性水平下,这些资料能否说明基础训练与运动成绩有关系?
5.某校高一男、女生体育锻炼的达标情况如下,试检验男、女生达标率有无显著差异? ( Ct = 0. 05)
7.统计甲、乙、丙三支篮球队投篮情况如下表,试作投篮命中率差别的显著性检验。

3 = 0. 05)
投中次数未投中次数
甲队38 57
乙队36 44 丙队45 45。

相关文档
最新文档