第四讲非参数检验
合集下载
非参检验PPT课件
2
Npar
两均值比较相 独关 立样 样本 本中符 符秩数号 号和检等检检验级验验法检法法(((验MSMieg法adnn(i)Wnani)lWcohxiotnne)y U ) 多均值比较随完机全区随组机::弗克里 瓦德氏曼方方差差分分析析((KFrruiesdkmalaann)d Wallis H )
非参数检验
1
非参数检验是与参数检验相对应的,参数 检验指的是在总体分布已知,满足某些 假定条件(独立性、方差齐性等),检验的 数据一般为连续数据的情况下进行的检 验。如果有些条件不能满足, 则采用非参 数检验,可以根据实际情况采用如下一 些方法进行检验, 这些检验都是在 Nonparametric tests菜单项里执行。
9
练习
• 输入以下数据并检验两组数据的差异性:
– 甲:12,14,15,12,21,31,26,21 – 乙:21,32,15,21,12,14,12,15
• 1.假设上述配对样本资料 • 2.假设上述资料不是配对样本资料
10
2020/1/1
11
3
两独立样本非参数检验例题
设有两种安眠药,考虑它们的治疗效果(失眠者服用之 后睡眠延长的小时数),现将20名患者分成两组,分别服用 一种药,收集的数据如下:
甲 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 乙 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0 由于延长的时数的分布不明,我们考虑用非参数检验 ! Mann-Whitney U 类似于t检验。
由于脉博跳动的次数不服从正态分布,我们考虑用非 参数检验。
5
2020/1/1
6
多个独立样本非参数检验例1
Npar
两均值比较相 独关 立样 样本 本中符 符秩数号 号和检等检检验级验验法检法法(((验MSMieg法adnn(i)Wnani)lWcohxiotnne)y U ) 多均值比较随完机全区随组机::弗克里 瓦德氏曼方方差差分分析析((KFrruiesdkmalaann)d Wallis H )
非参数检验
1
非参数检验是与参数检验相对应的,参数 检验指的是在总体分布已知,满足某些 假定条件(独立性、方差齐性等),检验的 数据一般为连续数据的情况下进行的检 验。如果有些条件不能满足, 则采用非参 数检验,可以根据实际情况采用如下一 些方法进行检验, 这些检验都是在 Nonparametric tests菜单项里执行。
9
练习
• 输入以下数据并检验两组数据的差异性:
– 甲:12,14,15,12,21,31,26,21 – 乙:21,32,15,21,12,14,12,15
• 1.假设上述配对样本资料 • 2.假设上述资料不是配对样本资料
10
2020/1/1
11
3
两独立样本非参数检验例题
设有两种安眠药,考虑它们的治疗效果(失眠者服用之 后睡眠延长的小时数),现将20名患者分成两组,分别服用 一种药,收集的数据如下:
甲 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 乙 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0 由于延长的时数的分布不明,我们考虑用非参数检验 ! Mann-Whitney U 类似于t检验。
由于脉博跳动的次数不服从正态分布,我们考虑用非 参数检验。
5
2020/1/1
6
多个独立样本非参数检验例1
第四讲——非参数检验
• •
2 拟合优度检验原理以及计算
类别 观测频数 1
O1
2 …. K
总和
O2
OK
n
假设检验问题:
H0 : F(X) F0 (X) H1 : F(X) F0 (X)
观测频数 O 和理论频数 E 的差别作为检验总体分 布和理论分布是否一致的标准,定义Pearson 2 统计量: 2 2
非参数检验方法
•第一节 非参数检验的一般问题 •第二节 单样本非参数检验 •第三节 列联表与 的独立性检验 •第四节 等级相关分析 •第五节 两个相关样本的非参数检验 •第六节 两个独立样本的非参数检验 •第七节 多个相关样本的非参数检验 •第八节 多个独立样本的非参数检验
2
第一节 非参数检验的一般问题
1
2
1
2
第三节 列联表与 的独立性检验
2
连列表又称交互分类表,指抽自某一总体的样本同时按照两个或
两个以上标志进行分类,一下以量个分类标志位例。
[例]下表是一个由220名饮酒者组成的随机样本,对饮酒者 进行酒的类型偏好的调查。横向看,反映了再固定性别 的条件下,对白酒与啤酒的偏好;总向看,反映了再固 定酒类型的条件下,各性别的人数。
性别 男性 女性 合计
饮酒偏好 白酒 啤酒 60 50 40 70 100 120
合计 110 110 220
直观看似乎饮酒偏好 与性别有关,是这样 吗?利用 统计量可 以完成对分类数据或 顺序数据之间是否独 立的检验。
• 建立假设:Ho:两个分类变量之间独立(性别与饮酒偏好无关);
•
• 从参数检验的前提条件看,仅要求观察值是独立的、变 非参数检验方法的特点
•
•
《医学统计学》教学课件-非参数检验
*校正公式(当相同秩次较多时)
zc z / c; c 1
(t
3 j
t
j
)
/
N3 N
;
t j 为第 j个相同秩次的 个数
2020/8/6
23
(二)两组等级资料的秩和检验
表 9-4 针灸组与对照组疗效结果
疗效 针灸组 对照组 合计 秩次范围 平均秩次
⑴
⑵
治愈 24
显效
8
好转
2
无效
1
⑶
⑷
⑸
⑹
15
H0 : 171.2cm H0 : 1 2 k
2020/8/6
3
非参数检验(nonparametric test)
对数据的总体分布类型不作严格假定, 直接对总体分布作假设检验。 又称任意分布检验。
2020/8/6
4
第一节 非参数检验概述
一、非参数检验
表 9-1 参数检验与非参数检验的区别及优缺点
表 7-2 12 名工人尿氟含量测定结果
尿氟含量(mmol/L) (1)
差值 d (2)=(1)-2.15
秩次
2.15
0
2.10
-0.05
-2.5
2.20
0.05
2.5
2.12
-0.03
-1
2.42
0.27
4
2.52
0.37
5
2.62
0.47
6
2.72
0.57
7
2.99
0.84
8
3.19
1.04
9
3.37
2020/8/6
35
表 7-8 不同种系雌性大白鼠注射不同剂量雌激素后子宫重量(g)
zc z / c; c 1
(t
3 j
t
j
)
/
N3 N
;
t j 为第 j个相同秩次的 个数
2020/8/6
23
(二)两组等级资料的秩和检验
表 9-4 针灸组与对照组疗效结果
疗效 针灸组 对照组 合计 秩次范围 平均秩次
⑴
⑵
治愈 24
显效
8
好转
2
无效
1
⑶
⑷
⑸
⑹
15
H0 : 171.2cm H0 : 1 2 k
2020/8/6
3
非参数检验(nonparametric test)
对数据的总体分布类型不作严格假定, 直接对总体分布作假设检验。 又称任意分布检验。
2020/8/6
4
第一节 非参数检验概述
一、非参数检验
表 9-1 参数检验与非参数检验的区别及优缺点
表 7-2 12 名工人尿氟含量测定结果
尿氟含量(mmol/L) (1)
差值 d (2)=(1)-2.15
秩次
2.15
0
2.10
-0.05
-2.5
2.20
0.05
2.5
2.12
-0.03
-1
2.42
0.27
4
2.52
0.37
5
2.62
0.47
6
2.72
0.57
7
2.99
0.84
8
3.19
1.04
9
3.37
2020/8/6
35
表 7-8 不同种系雌性大白鼠注射不同剂量雌激素后子宫重量(g)
《非参数检验方法》课件
用于比较两个独立样本的中位数是否相等。
用于比较三个或多个独立样本的中位数是 否相等。
3 Wilcoxon符号秩检验
4 Friedmann检验
用于比较两个相关样本的中位数是否相等。
用于比较三个或多个相关样本的中位数是 否相康型”饮料,是否对销售额产生显著影响?
使用 Mann-Whitney U检验来比较推出“健康型”饮料前后的销售额差异。
案例2:针对不同年龄段顾客的购物偏好是否存在差异?
使用 Kruskal-Wallis H检验来分析不同年龄段顾客的购物偏好是否有显著差异。
总结
非参数检验方法的应用场景和局限性。非参数检验方法的总体流程。非参数 检验方法的意义及应用前景。
《非参数检验方法》PPT 课件
非参数检验方法PPT课件
简介
什么是非参数检验方法?为什么需要非参数检验方法?非参数检验方法的优 势和劣势。
基本原理
什么是假设检验?什么是零假设和备择假设?非参数检验方法与参数检验方 法的区别。
常见的非参数检验方法
1 Mann-Whitney U检验
2 Kruskal-Wallis H检验
非参数检验
非参数检验又称为任意分布检验 (distribution-free test),它不考虑 研究对象总体分布具体形式,也不对总体 参数进行统计推断,而是通过检验样本所 代表的总体分布形式是否一致来得出统计 结论。
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
非参数检验综合概述PPT(30张)
•
9、别再去抱怨身边人善变,多懂一些道理,明白一些事理,毕竟每个人都是越活越现实。
•
10、山有封顶,还有彼岸,慢慢长途,终有回转,余味苦涩,终有回甘。
•
11、人生就像是一个马尔可夫链,你的未来取决于你当下正在做的事,而无关于过去做完的事。
•
12、女人,要么有美貌,要么有智慧,如果两者你都不占绝对优势,那你就选择善良。
多个独立样本的非参数检验
例3 14名新生儿出生体重按其母亲的吸烟习惯分组(A组: 每日吸烟多于20支;B组:每日吸烟少于20支;C组:过去 吸烟而现已戒烟;D组:从不吸烟),具体如下。试问四个 吸烟组出生体重分布是否相同?数据见npc.sav:
A组: 2.7 2.4 2.2 3.4 B组: 2.9 3.2 3.2 C组: 3.3 3.6 3.4 3.4 D组: 3.5 3.6 3.7
两独立样本的非参数检验 (2) 检验统计量
分析结果
给 出 Mann-Whitney U 、 Wilcoxon W 统 计 量 和 Z 值 , 近 似 值 概 率 (Asymp.Sig)和精确概率值(Exact.sig)均小于0.05,结论一致,表明 猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫 (15.7)、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。
•
3、命运给你一个比别人低的起点是想告诉你,让你用你的一生去奋斗出一个绝地反击的故事,所以有什么理由不努力!
•
4、心中没有过分的贪求,自然苦就少。口里不说多余的话,自然祸就少。腹内的食物能减少,自然病就少。思绪中没有过分欲,自然忧就少。大悲是无泪的,同样大悟无言。缘来尽量要惜,缘尽就放。人生本来就空,对人家笑笑,对自己笑笑,笑着看天下,看日出日落,花谢花开,岂不自在,哪里来的尘埃!
非参数检验
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
第三章(4) 非参数检验
其中F0(x)是给定的连续分布函数。 2.选取检验统计量
Dn sup | Fn ( x) F ( x) |
x
当H0为真时,Dn有偏小趋势,则拟合的越好;
当H0不真时,Dn有偏大趋势,则拟合的越差。
84/25
实际使用的检验统计量 n Dn
• 推导检验统计量的分布时,使用 n Dn比Dn方便
– 对于正态总体,样本容量n与区间个数k要满 足渐近最优关系,即k =1.87(n-1)0.4 – 样本容量n与区间个数k对应表如下
n k 50 9 100 12 200 16 500 1000 2000 10000 22 30 56 74
84/10
几点说明
• 若分布函数F0(x) 含有r个未知参数,须先用 极大似然估计法求出未知参数的估计值, 然后再作假设 • 若理论频数vi=npi<5,则将相邻的小区间 合并,直至全部npi ≥5(合并区间的同时, 也将实测频数合并),合并后的小区间数 设为k*,则此时2统计量的自由度变为 df = k*-r-1
非参数检验方法
84/1
非参数检验方法
1.参数检验方法是基于总体分布为正态分布 的前提下对参数进行的检验。当条件不满 足时,不能用参数检验方法 2.非参数检验方法可以不考虑总体的参数和 总体的分布类型,也称为任意分布检验 3.不对总体参数进行比较,而是用于分布之 间的比较 4.适用条件无特殊要求
–实际应用中不满足参数统计条件的资料均可用
(原理)
• Glivenko-Cantelli引理证明了当n趋于无穷大时,Dn 以概率收敛到0,即
P lim Dn 0
• 检验统计量建立在Dn基础上
Dn sup | Fn ( x) F ( x) |
Dn sup | Fn ( x) F ( x) |
x
当H0为真时,Dn有偏小趋势,则拟合的越好;
当H0不真时,Dn有偏大趋势,则拟合的越差。
84/25
实际使用的检验统计量 n Dn
• 推导检验统计量的分布时,使用 n Dn比Dn方便
– 对于正态总体,样本容量n与区间个数k要满 足渐近最优关系,即k =1.87(n-1)0.4 – 样本容量n与区间个数k对应表如下
n k 50 9 100 12 200 16 500 1000 2000 10000 22 30 56 74
84/10
几点说明
• 若分布函数F0(x) 含有r个未知参数,须先用 极大似然估计法求出未知参数的估计值, 然后再作假设 • 若理论频数vi=npi<5,则将相邻的小区间 合并,直至全部npi ≥5(合并区间的同时, 也将实测频数合并),合并后的小区间数 设为k*,则此时2统计量的自由度变为 df = k*-r-1
非参数检验方法
84/1
非参数检验方法
1.参数检验方法是基于总体分布为正态分布 的前提下对参数进行的检验。当条件不满 足时,不能用参数检验方法 2.非参数检验方法可以不考虑总体的参数和 总体的分布类型,也称为任意分布检验 3.不对总体参数进行比较,而是用于分布之 间的比较 4.适用条件无特殊要求
–实际应用中不满足参数统计条件的资料均可用
(原理)
• Glivenko-Cantelli引理证明了当n趋于无穷大时,Dn 以概率收敛到0,即
P lim Dn 0
• 检验统计量建立在Dn基础上
Dn sup | Fn ( x) F ( x) |
非参数检验课件
3. 求各组秩和Ri Ri = 各组秩次相加 4. 计算统计量 H 值
R 12 H 3N 1 N N 1 ni
2 i
ni为各组观察值个数,
N ni
本例:
2 2 2 2 12 15 81 63.5 50.5 H 2020 1 5 5 5 5 320 1
2.求各对数值的差数 3.编秩:按差值的绝对值由小到 大编秩,将秩次按差值的正负 分两栏 差值的绝对值相等、符号相反 时,各取平均秩次;符号相同 的相等差值,不必取平均秩次; 差值为0,则弃去不计,并从 相应的对子数n中减去
4.确定统计量T:分别求正负秩 次之和,以绝对值较小者为统 计量T ,本例T = 10.5
u
T n1 n1 n2 1 / 2 0.5 n1n2 n1 n2 1 / 12
u
308 2020 32 1 / 2 0.5 20 3220 32 1 / 12
4.1662
由于相同秩次过多,使u值偏 小,应计算uc进行校正
C 1 t3 j tj
N3 N 263 26 123 12 73 7 33 3 43 4 1 523 52 0.8599
uc
u C
4.1662 0.8599
4.493
(4)确定P值和得出推断结论 uc=4.493>2.58,P<0.01, 故可认为铅作业工人尿棕色 素高于正常人
3.个别数据偏大或数据的某一端无 确定的数值
4.各总体方差不齐
非参数检验优点:不受总体 分布的限定,适用范围广 非参数检验不足之处:符合 作参数检验的资料(如两样本 均数比较的t检验),如用非 参数检验,检验效率低于参 数检验。一般犯第二类错误 的概率β比参数检验大
非参数检验教学课件
如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普 遍偏小得组,秩和也必然偏小,各组得秩之间就 会存在显著差异。如果各样本得平均秩大致相 当,那么可以认为各组得总体分布 没有显著差 异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样 本得非参数检验,但分析得角度不同。多配对 样本得Kendall协同系数检验主要用在分析评 判者得判别标准就是否一致公平方面。她将每 个评判对象得分数都看作就是来自多个配对总 体得样本。一个评判对象对不同被判定对象得 分数构成一个样本,其零假设为:样本来自得多 个配对总体得分布无显著差异,即评判者得评 判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总 体分布未知或无法确定。因为有得数据不就是 来自所假定分布得总体,或者数据根本不就是 来自一个总体,还有可能数据因为某种原因被 严重污染,这样在假定分布得情况下进行推断 得做法就有可能产生错误得结论。此时人们希 望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系 可以分为单样本非参数检验、两独立样本非参数检 验、多独立样本非参数检验、两配对样本非参数检 验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公 式 定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种 拟合优度得非参数检验方法。单样本K-S检验 就是利用样本数据推断总体就是否服从某一理 论分布得方法,适用于探索连续型随机变量得 分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。 如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个 评委判定标准不一致,也就就是判定结果不一 致。
统计学之非参数检验讲义PPT课件( 92页)
单边检验的p-值等于0.074/2=0.037X(渐
近N 检验)和0.069/2=0.0345(精确检50
验Nor)mal 。Param如ete果rs 按a,b 照MS显teda.nD著eviat性ion 水平为0.01.510.70的604271标
准Mo,st Ex可trem以e 拒绝产A生bsolu数te 据的总体为正.1态82 分
费时间,后两种要粗糙一些,但 要快些。
秩(rank)
• 非参数检验中秩是最常使用的概 念。什么是一个数据的秩呢?一 般来说,秩就是该数据按照升幂 排列之后,每个观测值的位置。 例如我们有下面数据
Xi 15 9 18 3 17 8 5 13 7 19 Ri 7 5 9 1 8 4 2 6 3 10
这下面一行(记为Ri)就是上面一 行数据Xi的秩。
99.05 100.25 102.56 99.15 104.89 101.86 96.37 96.79 99.37 96.90 93.94 92.97 108.28 96.86 93.94 98.27 98.36 100.81 92.99 103.72 90.66 98.24 97.87 99.21 101.79
秩(rank)
•利用秩的大小进行推断就避免 了不知道背景分布的困难。这 也是非参数检验的优点。
•多数非参数检验明显地或隐含 地利用了秩的性质;但也有一 些非参数方法没有涉及秩的性 质。
16.2 单样本检验
16.2.1单样本中位数(a-分位数)符号检验
• 我们知道某点为中位数(a-分位数)意 味着一个数小于该点的概率应该为
Category gsweight G roup1 <=100
G roup2 >100 Total
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
差数 5 0 2 4 2 8 0 4 1 6 14 3
秩次 7
2.5 5.5 2.5 9 5.5 1 8 10 4
添号 +
+ +-+
+-+ +-
T- = 7.5 < 8
符号秩次检验
• 大样本的情况
– 当样本容量 n > 25时,可用正态分布近似处 理。检验统计量为:
Z T n(n1)/ 4 n(n1)(2n1) 24
好。问:被试对两种包装的偏好程度有
无显著差异?
• 根据题意,正号有22个,负号有9个,n = 22 +
9 = 31为大样本。将符号数较小的一个记为r,
故r = 9。
Z(r0.5)n/2(90.5)31/22.16
1n
1 31
2
2
Z2.161.96
符号秩次检验
• 威尔科克逊(F.Wilcoxon)提出了既考 虑差数符号,又考虑差数大小的符号秩 次检验法(signed-rank test)。
200
决策:
在 = 0.05的水平上接受H0
结论:
有证据表明研究者的估计可信
1、百分数显著性检验举例
• 例1.已知某区升学率为45%,其中某校300 名毕业生中共升学162人,问该校升学率与 全区升学率是否相同?
2、百分数差异的显著性检验(两个 样本)
• 条件:当n1p1≥5,n2p2≥5时,两样本比例 的差异接近正态分布。
一个样本比例的 Z 检验
(结果)
• H0: p = 0.3
• H1: p 0.3
= 0.05
• n = 200 • 临界值(s):
拒绝 H0
拒绝 H0
.025
.025
-1.96 0 1.96 Z
检验统计量:
z
pˆ p 0
p 0 (1 p 0 )
n
0 .34 0 .3 1 .234 0.3 0.7
•
标准误
: DP
(n1p1n2p2)n (1q1n2q2)
n1n2(n1n2)
• 临界值 : Z pˆ1 pˆ 2
Dp
• 按正态分布确定显著性,并进行解释。
两个总体比例之差的Z检验
符号 + 0 + + - + 0 + - + + -
r=3>1
符号检验
• 大样本的情况
– 对差数的正号与负号差异的检验本属于二项 分布的问题,当样本容量较大,即n>25时, 二项分布接近正态分布,因此可以用正态分 布近似处理,检验统计量为:
Z (r 0.5)n/ 2 1n 2
例题
• 32名被试中有1名被试对两种包装打出相 同的分数,有22名被试认为A包装比B包 装好,另有9名被试认为B包装比包装A
符号秩次检验
• 小样本的情况
– 当样本容量 n < 25时,可用查表法进行符号 秩次检验。
例题6
配对 1 2 3 4 5 6 7 8 9 10 11 12
得 A组 18 20 26 14 25 25 21 12 14 17 20 19
分 B组 13 20 24 10 27 17 21 8 15 11 6 22
例: 在一项关于模拟训练的实验中,以技工学校的学生为对象,对5名学 生用针对某一工种的模拟器进行训练,另外让6名学生下车间直接在实习 中训练,经过同样时间后对两组人进行该工种的技术操作考核,结果如
下: 模拟器组:56,62,42,72,76 实习组:68,50,84,78,46,92 假设两组学生初始水平相同,则两种训练方式有否显著差异?
二、 平均数差异显著性检验 (非参数检验)
• 相关样本 1、符号检验法 2、符号秩次检验法
符号检验
• 符号检验(sign test)是通过对两个相关样 本的每对数据之差的符号(正号或负号) 进行检验,以比较这两个样本差异的显 著性。
例题
配对 1 2 3 4 5 6 7 8 9 10 11 12 得 A组 18 20 26 14 25 25 21 12 14 17 20 19 分 B组 13 20 24 10 27 17 21 8 15 11 体和样本)
条件:百分数又称作比率,比率的分布服从二
项分布。当np≥5时近似正态分布。
标准误:
p
pq n
临界值:
Z
p p0
p0q0 n
按正态分布,确定显著性水平并予以解释
一个总体比例的 Z 检验
(实例)
• 【例】某研究者估计
本市居民家庭的电脑拥 有率为30%。现随机抽 查了200的家庭,其中 68个家庭拥有电脑。试 问研究者的估计是否可 信? ( = 0.05)
第五节 计数数据的检验——χ2 检验
一.百分数的检验 1、百分数显著性检验(总体和样本) 2、百分数差异的显著性检验(两个样本)
二.计数数据的χ2检验 1、配合度的检验 2、独立性的检验
三.品质相关 1、四分相关 2、φ相关 3、列联相关
举例说明
1、投掷硬币的问题:40/100 2、态度的测量:赞成、反对、不置可否 3、一个学校不同职称构成比:2:4:3:1 4、考试中是否及格的问题(男女不同性别
二、 平均数差异显著性检验 (非参数检验)
• 独立样本 1.秩和检验法:将两样本数据混合起来统
一排序。
(1)大样本:
T n1(n1 n2 1)
Z
2
n1n2 (n1 n2 1)
12
二、 平均数差异显著性检验 (非参数检验)
• 2、中数检验法
• 将两样本统一排序,取中数。分别统计 两样本位于中数以上和中数以下的数据 个数。列2×2四格表。用χ2检验,确定两 样本是否存在显著差异
非参数检验
二、 平均数差异显著性检验 (非参数检验)
• 独立样本 1.秩和检验法:将两样本数据混合起来统
一排序。
(1)小样本:将n比较少的样本数据所得 等级相加求和为T,直接查秩和检验表。
秩和检验
• 当比较两个独立样本的差异时,可以采 用曼-惠特尼(Mann-Whitney)两人提 出的秩和检验方法。又称曼-惠特尼U检 验法(Mann-Whitney U-test)。
①排等级: 等级:1 2 3 4 5 6 7 8 9 10 11 模拟器:42 56 62 72 76 实 习:46 50 68 78 84 92 ②计算秩和(等级和)
T=1+4+5+7+8=25(即模拟器组的秩和) ③查附表 n1=5 n2=6时 T1=19 T2=41 19<25<41 即T1< T< T2 • 所以两种方式的训练差异不显著。