非参数统计讲义三--两样本检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i 1
T
X Y
~ t(n m 2)
1 n
1 m
Sw
Sw
(n 1)S12 (m 1)S22 nm2
T 150.1149.9 (8 9 2) 0.2 1080 0.1702 66.88 20.89 1/ 8 1/ 9 87.77 17
对 0.05 查表得
t (n1 n2 2) t0.025(15) 2.1315 2
H0 : 1 2 H1 : 1 2 H0 :1 2 H1 :1 2
Brown-Mood 中位数检验
Mann-Whitney 秩和检验。
Mood检验
Moses方法
两个样本检验
两个独立样本
两个成对相关样本
MINITAB非参数统计界面与功能
两个独立样本检验
Brown-Mood中位数检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
拒绝域
1 – 2 = 1 – 2 1 – 2 1 – 2 < 1 – 2 1 – 2 >
X Y
U
2 1
2 2
nm
~ N (0,1)
( 12,22 已知)
U u
2
U u
U u
原假设 备择假设 检验统计量及其在
H0
H1
N(0,1)
mnt(m n t) /(m n)3
另外可求得 Mx My 置信区间:
[Xtc'1 Yc' , Xtc Yc1]
其中c和c’满足: Phyper (A c) Phyper (A c ')
大样本卡方分布近似
2 (2a m)2 (m n) , df 1
mn
2 (ad cb)2 (m n 1) , df 1
统计思想:用于检验两个总体抽取的样本的中位数 是否相同。
Brown-Mood中位数检验
样本来自两个相互独立总体。
假设(X1, X2, … ,Xn)~i.i.d.F(x ) , (Y1, Y2, … ,Yn)~i.i.d.F(x - )
H0 : medx medy H1 : medx medy
检验基本内容
H0
Mx My
Mx My Mx My
H1
Mx My Mx My Mx My
检验统计量
P-值
A
PH0 (A a)
PH0 (A a)
A
A
2 min(PH0 (A a), PH0 (A a))
对于水平 ,如果p-值小于
,那么拒绝零假设
P(A
2)=
C C1 8-1 9 16-9 C186
原理:在零假设成立时,如果数据有相同中位数,那么 混合样本的中位数应该和混合前的项等。
计算和例子
首先将两个样本混合,找出混合样本中位数M xy ,将X和 Y按照在 M xy 两侧分类计数,即:
XY
总和
Mxy A B
t
Mxy C D (m n) (A B)
总和 m n m n A B C D
两个正态总体的假设检验
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两总体X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
关于均值差 1 – 2 的检验
在给定m,n和t的时候,在零假设成立时,A的分布服从超
几何分布:
mn
( )( )
P(A k)
k tk mn
,k m
()
t
当A值太大时,考虑拒绝零假设。
HYPGEOMDIST(a,m,a+b,m+n)
例:全国30个省人均GDP,中位数4690,检验 沿海省X与非沿海省Y的中位数是否有差异?
观测值大于ME 观测值大于ME 总和
拒绝域为 W {| T | t /2 (15)} {| T | 2.1315}
T 0.1702W
所以应接受H 0.
两样本位置和尺度检验
假设样本: (X1, X2, … ,Xn)~i.i.d.F1
x
1
1
(Y1, Y2, … ,Yn)~i.i.d.F2
x
2
2
样本之间相互独立,1, 2 为位置参数,1, 2 称为尺 度参数。
甲:150, 145, 152, 155, 148, 151, 152, 148
乙:152, 150, 148, 152, 150, 150, 148, 151, 148
假定甲、乙两机床截下的长度方差相等,问 长度的期望值是否一样?
解 设甲床截下的长度为X;乙床截下
的长度为Y,由假定知21=22=2 检验假设 H0 1 2 v.s.H1 1 2
+
C C2 8-2 9 16-9 C186
=0.02028
HYPGEOMDIST(2,9,8,16)=0.01958
HYPGEOMDIST(1,9,8,16)=0.00699 拒绝H0,认为两品牌的价格有显著差异
大样本检验
对于大样本情况下,可以使用超几何分布 的正态近似进行检验:
Z
A mt /(m n)
x 1 (150 145 L 148) 150.125 150.1 8
8
( Xi X )2 (150 150.1)2 (145 150.1)2 L (148 150.1)2
i 1
66.88
Y 1 (152 150 148) 149.889 149.9 9
9
(Yi Y )2 (152 149 .9)2 (150 149 .9)2 (148 149 .9)2 20.89
X样本 A=11 1 M=12
Y样本 B=4 14 N=18
总和 A+B=15
15 M+N=30
从M+N=30个中抽出A+B=15个,成功A=11个,M=12,N=18
P(A
1)=
C112C1184 C15
30
=
C1121C148 C15
30
P(A=11)=0.000236724 拒绝H0,认为沿海省与非沿海省的中位数有显著差异。
H0为真时的分布
1 – 2 = 1 – 2 1 – 2 1 – 2 <
T X Y
1 n
1S m
w
~ T (n m 2)
wk.baidu.com
拒绝域
T t
2
T t
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
T t
其中
Sw
(n 1)S12 (m 1)S22 nm2
例8-8 从两台切断机所截下的坯料(长度 按正态分布)中,分别抽取8个和9个产品, 测得长度如下(单位:mm):
T
X Y
~ t(n m 2)
1 n
1 m
Sw
Sw
(n 1)S12 (m 1)S22 nm2
T 150.1149.9 (8 9 2) 0.2 1080 0.1702 66.88 20.89 1/ 8 1/ 9 87.77 17
对 0.05 查表得
t (n1 n2 2) t0.025(15) 2.1315 2
H0 : 1 2 H1 : 1 2 H0 :1 2 H1 :1 2
Brown-Mood 中位数检验
Mann-Whitney 秩和检验。
Mood检验
Moses方法
两个样本检验
两个独立样本
两个成对相关样本
MINITAB非参数统计界面与功能
两个独立样本检验
Brown-Mood中位数检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
拒绝域
1 – 2 = 1 – 2 1 – 2 1 – 2 < 1 – 2 1 – 2 >
X Y
U
2 1
2 2
nm
~ N (0,1)
( 12,22 已知)
U u
2
U u
U u
原假设 备择假设 检验统计量及其在
H0
H1
N(0,1)
mnt(m n t) /(m n)3
另外可求得 Mx My 置信区间:
[Xtc'1 Yc' , Xtc Yc1]
其中c和c’满足: Phyper (A c) Phyper (A c ')
大样本卡方分布近似
2 (2a m)2 (m n) , df 1
mn
2 (ad cb)2 (m n 1) , df 1
统计思想:用于检验两个总体抽取的样本的中位数 是否相同。
Brown-Mood中位数检验
样本来自两个相互独立总体。
假设(X1, X2, … ,Xn)~i.i.d.F(x ) , (Y1, Y2, … ,Yn)~i.i.d.F(x - )
H0 : medx medy H1 : medx medy
检验基本内容
H0
Mx My
Mx My Mx My
H1
Mx My Mx My Mx My
检验统计量
P-值
A
PH0 (A a)
PH0 (A a)
A
A
2 min(PH0 (A a), PH0 (A a))
对于水平 ,如果p-值小于
,那么拒绝零假设
P(A
2)=
C C1 8-1 9 16-9 C186
原理:在零假设成立时,如果数据有相同中位数,那么 混合样本的中位数应该和混合前的项等。
计算和例子
首先将两个样本混合,找出混合样本中位数M xy ,将X和 Y按照在 M xy 两侧分类计数,即:
XY
总和
Mxy A B
t
Mxy C D (m n) (A B)
总和 m n m n A B C D
两个正态总体的假设检验
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两总体X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
关于均值差 1 – 2 的检验
在给定m,n和t的时候,在零假设成立时,A的分布服从超
几何分布:
mn
( )( )
P(A k)
k tk mn
,k m
()
t
当A值太大时,考虑拒绝零假设。
HYPGEOMDIST(a,m,a+b,m+n)
例:全国30个省人均GDP,中位数4690,检验 沿海省X与非沿海省Y的中位数是否有差异?
观测值大于ME 观测值大于ME 总和
拒绝域为 W {| T | t /2 (15)} {| T | 2.1315}
T 0.1702W
所以应接受H 0.
两样本位置和尺度检验
假设样本: (X1, X2, … ,Xn)~i.i.d.F1
x
1
1
(Y1, Y2, … ,Yn)~i.i.d.F2
x
2
2
样本之间相互独立,1, 2 为位置参数,1, 2 称为尺 度参数。
甲:150, 145, 152, 155, 148, 151, 152, 148
乙:152, 150, 148, 152, 150, 150, 148, 151, 148
假定甲、乙两机床截下的长度方差相等,问 长度的期望值是否一样?
解 设甲床截下的长度为X;乙床截下
的长度为Y,由假定知21=22=2 检验假设 H0 1 2 v.s.H1 1 2
+
C C2 8-2 9 16-9 C186
=0.02028
HYPGEOMDIST(2,9,8,16)=0.01958
HYPGEOMDIST(1,9,8,16)=0.00699 拒绝H0,认为两品牌的价格有显著差异
大样本检验
对于大样本情况下,可以使用超几何分布 的正态近似进行检验:
Z
A mt /(m n)
x 1 (150 145 L 148) 150.125 150.1 8
8
( Xi X )2 (150 150.1)2 (145 150.1)2 L (148 150.1)2
i 1
66.88
Y 1 (152 150 148) 149.889 149.9 9
9
(Yi Y )2 (152 149 .9)2 (150 149 .9)2 (148 149 .9)2 20.89
X样本 A=11 1 M=12
Y样本 B=4 14 N=18
总和 A+B=15
15 M+N=30
从M+N=30个中抽出A+B=15个,成功A=11个,M=12,N=18
P(A
1)=
C112C1184 C15
30
=
C1121C148 C15
30
P(A=11)=0.000236724 拒绝H0,认为沿海省与非沿海省的中位数有显著差异。
H0为真时的分布
1 – 2 = 1 – 2 1 – 2 1 – 2 <
T X Y
1 n
1S m
w
~ T (n m 2)
wk.baidu.com
拒绝域
T t
2
T t
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
T t
其中
Sw
(n 1)S12 (m 1)S22 nm2
例8-8 从两台切断机所截下的坯料(长度 按正态分布)中,分别抽取8个和9个产品, 测得长度如下(单位:mm):