第4章 假设检验 - 非参数假设检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 确定统计量T
– T为正秩次及负秩次和中绝对值较小者
• 统计推断
– 令正负差值的总个数为n – T>T0.05(n),P>0.05,不能否定H0,两个处理差异不显著 – T0.01(n)<T≤T0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理 差异显著 – T≤T0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著
非配对试验资料符号秩和检验
• 提出原假设与备择假设
– H0:甲样本所在的总体中位数=乙样本所在的总体中位数 – H1:甲样本所在的总体中位数≠乙样本所在的总体中位数 – 进行单尾检验,把“≠”换成“<”或者“>”
• 求两个样本合并数据的秩次
– – – – 两个样本的含量为n1和n2,合并后为n1+ n2 合并后的数据按从小到大的顺序排列,序号即为数据的秩次 不同样本的观测值相同,取原秩次的平均秩次 同一样本的观测值相同,不必改动
2 拟合检验计算表
Ai
A1 : 0 x 4.5
fi
������������ −������������������ (������������ −������������������ )2
ˆi p
0.2788 0.2196 0.1527 0.1062 0.0739 0.0514 0.0358 0.0248 0.0568
• 计算差值,确定符号及其个数
– 样本各观测值中大于已知总体中位数的,记为“+”, “+”个 数记为n+ – 样本各观测值中小于已知总体中位数的,记为“-”, “-”个 数记为n- – 样本各观测值中等于已知总体中位数的,记为“0”, “0”个数记 为 n0 – 统计量K = min{ n+ ,n- }
– K>K0.05(n),P>0.05,不能否定H0,两个处理差异不显著
– K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理 差异显著
– K≤K0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著
• 某数据分析公司研究加薪对数据分析员工 作准确度的影响。结果如下表所示,问加 薪对工作精确度有没有影响K0.05(15)=3, K0.05(10)=1?
(X 表示相继两次地震间隔天数, Y 表示出现的频数)
X Y 0 4 5 9 10 14 15 19 20 24 25 29 30 34 35 39 40 50 31 26 17 10 8 6 6 8
试检验相继两次地震间隔天数 X 服从指数分布. 解 所求问题为: 在水平 0.05下检验假设
ˆi np
45.1656 35.5752 24.7374 17.2044 11.9718 8.3268 5.7996 4.0176 9.2016 4.8344 -4.5752 1.2626 -0.2044 -1.9718 -0.3268 0.2004 1.9824 -1.2016
������������������
配对资料的符号检验
• 提出原假设与备择假设
– H0:/
• 计算差值并赋予符号
– – – – d>0,记为“+”, “+”个数记为n+ d<0,记为“-”, “-”个数记为n- d=0,记为“0”, “0”个数记为n0 统计量K = min{ n+ , n- }
• 统计推断
– 令 n = n+ + n -
P≤0.05,否定H0,接受H1,两个处理差异差异显著 – T在T0.01(n1) - T0.01(n2–n1) 之外,P≤0.01,否定H0,接受H1,两个处
理差异差异极显著
卡方分布拟合检验
χ2检验的原理与方法
χ2检验的基本原理
χ2检验统计量的基本形式 χ2检验的基本步骤
χ2检验的注意事项
χ2检验就是统计样本的实际观测值与理论推算
ˆ ( A2 ) ˆ2 P 如p
Pˆ {4.5 X 9.5}
ˆ (9.5) F ˆ (4.5) 0.2196, F
2.6523,
2
k 9, r 1,
0.05
2 (k r 1) 2 (7) 14.067 2.6523,
在使用卡方检验时要注意两点:n要足够大, 以及npi 不太小这两个条件. 根据计算实践,要求n不小于50,以及 npi 都不小于 5. 否则应适当合并区间,使 npi满足这个要求 .
例题1:自1965年1月1日至1971年2月9日共2231天中, 全世界记录到里氏震级4级和4级以上地震共162次, ( 0.05) 统计如下:
要回答这个问题,首先需要确定一个统计量, 将其用来表示实际观测值与理论值偏离的程度。
判断实际观测值与理论值偏离的程度,最简 单的办法是求出实际观测值与理论值的差数。
羔羊性别观察值与理论值
性别 公 母 合计 观察值(O) 428 448 876 理论值(E) 438 438 876 O-E -10 +10
A9 : 39.5 x
在 H0 为真的前提下,
x 1 e 13.77 , x 0 ˆ X 的分布函数的估计为 F ( x ) x 0. 0,
概率 pi P ( Ai )有估计
ˆ ( Ai ) P ˆ {ai X ai 1 } F ˆ (ai 1 ) F ˆ (ai ), ˆi P p
理论值(E)
438 438
O-E
-10 +10
(O-E)2 /E
0.2283 0.2283
合计
876
0
0.4566
χ2值就等于各组观测值和理论
(Oi-Ei)2 值差的平方与理论值之比,再求其和。 χ2= ∑ Ei 皮尔逊证明了这个样本统计量服从自
由度为k-1的卡方分布。
在用 卡方时,若分布类型已知,但其参数 未知,这时需要先用极大似然估计法估计参 数,然后作检验. (注意,估计了几个参数,就 要在相应的卡方估计量的自由度上减去相应 的个数)
2 1 2 2
2
d d 5、t sd / n
_
3、
4、、、
假设检验的内容
假设检验
总体均值的
假设检验
总体方差的
假设检验
两个总体均值差 的假设检验
1、 2
2 n 1 s
s2
单一总体
两个总体 方差比
s12 2、F 2 s2
4.3 非参数假设检验
*4.3.1 符号检验法:通过两个相关样本的每对数据 之差的符号进行检验,比较两个样本的显著性
– 配对资料的符号检验 – 样本中位数与总体中位数比较的符号检验
*4.3.2 秩和检验法:一种用样本秩来代替样本值的检验法,
可用于检验两个总体的分布函数是否相等的问题 – 配对试验资料符号秩和检验 – 非配对试验资料符号秩和检验
4.3.3 非参数假设检验。
– 卡方检验 – 柯尔莫哥洛夫-斯米诺夫检验
• 确定统计量T
– 秩和较小的样本含量记为n1,秩和为T统计量
• 统计推断
– T在T0.05(n1) - T0.05(n2–n1)之内 ,P>0.05,不能否定H0,两个处理差 异不显著
– T在T0.05(n1) - T0.05(n2–n1)之内外,在T0.01(n1) - T0.01(n2–n1) 之内,0.01<
配对试验资料符号秩和检验
• 提出原假设与备择假设
– H0:差值d总体中位数= 0
– H1:差值d总体中位数≠0 – 进行单尾检验,把“≠”换成“<”或者“>”
• 编秩次,定符号
– 求配对数据的差值d
– 按d的绝对值从小到大编秩次
– 根据原差值正负,在各秩次前标正负号 – d=0,舍去不记 – d的绝对值相等,取其平均秩次
No
加薪 前 加薪 后 差值 符号
1
0.05 0.04 0.01 +
2
0.06 0.06 0 0
3
0.07 0.06 0.01 +
4
0.05 0.05 0 0
5wk.baidu.com
0.04 0.03 0.01 +
6
0.02 0.02 0 0
7
0.08 0.07 0.01 +
8
0.01 0.01 0 0
9
0.05 0.04 0.01 +
x 1 e , H0 : X 的概率密度 f ( x ) 0,
x 0, x 0.
由于在 H 0 中参数 未具体给出 , 故先估计 . ˆ x 2231 13.77, 由最大似然估计法得 162 X 为连续型随机变量,
将 X 可能取值区间[0 , ) 分为 k 9 个互不重叠 的子区间[ai , ai 1 ), i 1, 2,, 9. (见下页表)
4.2 参数假设检验
假设检验
一个正态总体均值的 假设检验
总体方差的 假设检验
_
两个正态总体均值差 的假设检验
1、Z
1、s已知
x s / n X s / n x 0 s / n
_
s未知
2、Z
2、大样本 3、小样本
3、t
t n 1
1、Z
( x1 x 2 ) 1 2
0
由于差数之和正负相消,并不能反映实际
观测值与理论值相差的大小。
为了弥补这一不足,可先将实际观测值与理 论值的差数平方,即(O-E)2,再用差数的平方 除以相应的理论值,将之化为相对数,从而来反
映(O-E)2 的比重,最后将各组求和,这个总
和就是χ2 。
羔羊性别观测值与理论值
性别
公 母
观测值 (O) 428 448 876
值之间的偏离程度。
实际观测值与理论推算值之间的偏离程度就决定
其χ2 值的大小 。理论值与实际值之间 偏差越大 ,
χ2值就越大,越不符合;偏差越小,χ2值就越小, 越趋于符合;若两值完全相等时,χ2值就为0,表明 理论值完全符合。
876只羔羊性别调察
性别 公 母 合计 观察值(O) 428 448 876 理论值(E) 438 438 876 O-E -10 +10 0
0.517460708 0.588400207 0.064443262 0.002428411 0.324762796 0.012825844 0.006924643 0.978173477 0.15691212
50 A2 : 4.5 x 9.5 31 A3 : 9.5 x 14.5 26 A4 : 14.5 x 19.5 17 A5 : 19.5 x 24.5 10 8 A6 : 24.5 x 29.5 6 A7 : 29.5 x 34.5 6 A8 : 34.5 x 39.5 8
_
_
假设检验
s s n1 n2
2 1 _ _
2 2
2、Z
( x1 x 2 ) 1 2
2 s12 s2 n1 n2 _ _ 2 (n1 1) s12 (n2 1) s2 ,s n1 n2 2 2 p
两个正态总体均值差 的假设检验
3、t
( x1 x 2 ) 1 2 sp
_ _
5、配对样本
独立样本
1 1 n1 n2
s s 1、已知 2、未知 ,大样本 ( x1 x 2 ) 1 2 n n 4、t ,自由度:f = 12 2 2 2 2 s12 s2 s12 s2 未知s, 小样本 n1 n2 n1 n2 n1 n2
• 统计推断
– 令 n = n+ + n -
– K>K0.05(n),P>0.05,不能否定H0,样本中位数与已知总体中位
数差异不显著 – K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,样本中位
数与已知总体中位数差异差异显著
– K≤K0.01(n),P≤0.01,否定H0,接受H1,样本中位数与已知总体中 位数差异差异极显著
10
0.02 0.03 -0.01 -
11
0.03 0.02 0.01 +
12
0.02 0.02 0 0
13
0.06 0.05 0.01 +
14
0.07 0.08 -0.01 -
15
0.05 0.06 -0.01 -
样本与总体中位数比较的符号检验
• 提出原假设与备择假设
– H0:样本所在的中位数= 已知总体的中位数 – H1:样本所在的中位数≠已知总体的中位数 – 进行单尾检验,把“≠”换成“<”或者“>”