数理统计13 非参数假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例3 将一颗骰子投掷了120次,结果如下: 点数:1,2,3,4,5,6;对应频数:21,28,19,24,16,12. 问这颗骰子是否匀称(0.05)? 解:依题意,即检验
H 0:pi =1/6, H1:pi 1/ (i 1, 2,..., 6) 6 2 2 计算 n =8.1,查分布表得 0.95(6-1)=11.07,
T ( X Y ) ( 1 2 )
2 S12 S 2 m n L N (0,1)
例1 设总体X 的方差DX=25,欲检验假设
H 0:EX=1, H1:EX 1
今从总体X中抽取了一个样本容量n=50的样 本,并且算得样本均值为2,试问原假设是否 成立? 解:用样本均值估计总体均值,由定理1, X 1 X 1 L n = 2 N (0,1) (n ) 1 DX
xx
x xn
利用密度函数或分布率说明检验假设 H 0的 基本思想。
(一) 2检验
a) H 0:总体的分布函数为F0(x).
( fi npi ) 2 2 b) 构造统计量 n npi i 1 2 2 c)利用P{ n 1-(m-1)} ,
m
2 得到拒绝域{ n 12 (m-1)}。 -
谓大样本指样本容量n>30,最好大于50或100.
定义1 对于统计量Tn,若存在常数序列{n },
{ n }( n 0) 使得
2
n
Tn n
L N (0,1)
(n )
2
n
n
则称Tn的渐近分布为 N ( n, ), n, n 分别 n n
2
称为渐近均值和渐近方差。
n2 渐近 定理6 当原假设成立时,上面定义的
服从自由度为m-r-1的 2分布。其中r为分布 函数F0(x)中未知参数的个数。
2-检验的步骤如下:
(1) 把( , )分成k个互不相交的区间 ( , a1 ], (a1 , a2 ],, (ak 2 , ak 1 ], (ak 1 ,) (2) 若分布函数 F0 ( x )中包含未知参数, 需先
抽取次数 频数 1 43 2 31 3 15 4 6 大于等于5 5
试问该盒中黑球和白球个数是否相等?
例2 对维尼纶的纤度(表示纤维粗细的程度) 进行抽样,获得100个数据,结果如下表:
纤度 1.28 频数 1 1.31 4 1.34 7 1.37 22 1.40 23 1.43 25 1.46 10 1.49 1.52 1.55 6 1 1
X1,X2,…,Xn 为来自总体X的样本,则 X n F L n N (0,1) ( n ) Sn
均值的渐近分布为N ( F,
F
2
).
定理3 设(X1,X2,…,Xm) 与(Y1,Y2,…,Yn) 是来
自X~N(1,12)与Y~N(2,22)的两独立样本,
则当n趋于无穷, m趋于无穷时有
, , 未知但 = = .
2 1 2 2 2 3 2 1 2 2 2 3
试提出三正态总体均值1 2 =3的 假设检验.
2. 某厂使用两种不同的工艺生产同一类型的产 品。现对产品进行分析比较,抽取第一种工艺 生产的样品120件,测得均值为1.25 (kg),标准 差为0.52(kg);抽取第二种工艺生产的样品60 件,测得均值为1.32(kg),标准差为0.45 (kg)。 设产品的质量都服从正态分布,试判断在检验 水平0.05下,能否认为两种生产工艺的方差相 等?如果能认为两种工艺质量的方差相等,再 进一步判断能否认为使用第二种工艺生产的产 品的平均质量较使用第一种生产的为大?
k
计算出 的值。
2
(5) 对给定的水平 , 查自由度为 k r 1的
分布的 1 分位点
2
2 1
( k r 1)。
(6) 若 2 12 ( k r 1),则拒绝假设H 0 , 否
则接受 H 0。
例1 在某盒中放有白球和黑球,现做下面试 验:用返回抽取方式从此盒中摸球,直到取到 的是白球为止,记录下抽取的次数。重复此 试验100次,结果如下表:
定理1 设总体X的分布函数为F(x),
E ( X ) F , D( X ) F , 0 F ,
2 2
X1,X2,…,Xn 为来自总体X的样本,则样本的
n 定理2 设总体X的分布函数为F(x), 2 2 E ( X ) F , D( X ) F , 0 F ,
试问纤度是否服从正态分布?
(二)柯尔莫哥洛夫及斯米尔诺夫检验
1. 柯尔莫哥洛夫检验
a) H 0:总体的分布函数F(x)=F0(x).
b) 构造统计量Dn sup | F ( x) F ( x) |
c)利用P{Dn Dn , }=( ) ,得到拒绝 域{Dn Dn , }。
x * n
所以接受H 0.
七 非参数检验
• • • • • • 卡方检验 柯尔莫哥洛夫及斯米尔诺夫检验 符号检验 秩和检验 游程检验 独立检验
考虑假设检验问题
H 0:F ( x ) F0 ( x ),
0, k 经验分布函数 Fn ( x ) , n 1,
xx x
k 1
1 k
习 题 课
一、样本容量的确定
二、非参数的拟合优度检验
三、独立性检验 四、课堂及课后习题
冯伟 数学与系统科学学院 wfeng_323@buaa.edu.cn
第三章 假设检验(续2)
六、非正态总体参数的检验
百度文库
七、非参数假设检验
六 非正态总体大样本的检验
(一)统计量的渐近分布
当样本容量n趋于无穷时,若统计量的分布
趋于一定的分布,则称后者为该统计量的极限
分布。它提供了统计推断的一种近似解法。所
的极限分布,从而可以对问题(1)进行检验。
定理5 当原假设成立时,上面定义的 渐近 服从自由度为m-1的 2分布。
2 n
由定理5,当n比较大时,用 分布表求出
2
常数 (m-1),使得P{ (m-1)} ,
2 1- 2 n 2 1- 2 则{ n 12 (m-1)}便为拒绝域。 -
. .
B1 n11 n21
. . .
B2 n12 n22
. . .
... ... ...
Bk n1k n2k
. . .
ni. nij
j 1
k
n1. n2.
. Am
nm1 n.1
nm2 n.2
...
nmk n.k
nm.
n. j nij
i 1
m
...
记pij=P{X Ai,Y Bj}, pi.=P{X Ai},
1. H 0:pij =pi.p.j ,
i=1,2, ,m; j=1,2, ,k
由于(2),上面的假设H0中只有 m+k-2各独立参数,为了用卡方检验 来验证假设,我们首先用MLE从样 本中定出这些未知参数的值:
n. j ni. pi. , i 1, 2,..., m; p.j , j 1, 2,..., k n n
得到拒绝域{Dn1 ,n2 Dn , }。 Fn1 ( x)和Gn2 ( x)是两个总体对应的经验分布函数
柯尔莫哥洛夫检验 当连续分布时,效率较
高,不能用于离散情形
-检验能用于离散情形,连续情形精度较差
2
(三)独立性检验 分析
需要检验H0 :两个总体X和Y是否独立 将这两个总体的取值范围分成m个和k个 互不相交的区间A1 , A2 , . . . ,Am 和B1 ,B2 ,... ,Bk 。 设从总体中抽取一个容量为n的样本 (X1,Y1), (X2,Y2), …,(Xn,Yn),
H0:pi =pi0 H1:pi pi0 (其中pi0已知) (1)
思路:根据频率替换的思想,当然频率趋于 ni 概率,因此用 与pi0的差异程度来反映H0是 n 否成立。K.pearson提出运用统计量 2 m ( N i npi 0 ) 2 n npi 0 i 1 ni 来衡量 与pi0的差异程度,这个统计量称为 n Pearson统计量。Pearson给出了这个统计量
2.斯米尔诺夫检验(两个总体) 比较两个总体分布是否相同,即考虑的检
验问题 H 0:F ( x ) G ( x );H 1:F ( x ) G ( x )
a) H 0:F(x)=G(x).
b) 构造统计量Dn1 ,n2 sup | Fn1 ( x) Gn2 ( x) | x n1n2 c)令n= ,利用P{Dn1 ,n2 Dn , }=( ) , n1 n2
记nij表示样本值中其横坐标落入Ai,纵坐 标落入Bj中的个数(i=1,2,…,m;j=1,2,…k).
记 ni.
易见
n ,n
j 1 ij m
k
.j
nij ,
i 1
m
n= nij
i 1 j=1
k
(1)
用下表表示样本元素的这种分类(称为列联表)
列 联 表
Y
Y
X
A1 A2 X
3. 在社会调查中,调查人员可能怀疑男人 和女人对某种提案将会有不同的反应,他 们根据被调查的性别和对某项提案的态度 来进行分类,结果如下表(本表称为23的 列联表)。
态度 性别 赞成 1154 1083 反对 475 442 弃权 243 362
我们要检 验原假设
男性 女性
H0:公民的态度与性别是无关的。
所以双侧检验的拒绝域为{|U|>U1- /2 }, 显然接受原假设。
例2 设总体X 的方差有界,欲检验假设
H 0:EX=0, H1:EX 0
设今从总体X中抽取了一个样本容量n=150 的样本,并且算得样本均值为0.4,方差为16, 试问原假设是否成立(0.05)?
解:用样本均值估计总体均值,由定理2,一 样得到结论。不过要注意,如果总体方差未知, n至少要大于100。
p.j={Y Bj}, i=1,2,…,m; j=1,2,…,k.显然有
pi. pij , p.j pij ,
j 1 i 1
k
m
p p p
i 1 j=1 ij i 1 i. j 1
m
k
m
k
(2)
.j
1
如果H0成立,则pij=pi..p.j,因此列联表中 的独立性就是检验 1. H 0:pij =pi.p.j , i=1,2, ,m; j=1,2, ,k
态度 性别 赞成 1154 1083 反对 475 442 弃权 243 362
我们要检 验原假设
男性 女性
H0:公民的态度与性别是无关的。
作业: 1.设(X1,X2,…,Xn) , (Y1,Y2,…,Yn) (Z1,
Z2,…, Zn)与是来自X~N(1,12), Y~N(2,22)
与Z~N(2,32)的三独立样本, 假设
给出参数的极大似然估计,再计算随机变量
落在(1)中各区间的概率 pi , 并计算出npi。
(3) 计算样本观测值 x1 , , xn 落在(1)中各区间 的个数 f i 。
(4) 将(2)和(3)中所获得 npi , f i 的代入公式
( f i npi )2 2 npi i 1
(二)多项分布的 检验
2
设总体X是仅取m个可能值的离散型随机变量, 不失一般性,设X的可能取值是1,2,...,m,记 P{X=i}=pi,i=1,2,...,m, 且 pi 1.记Ni 表示容量为
i 1 m
n的样本中事件{X=i}的频数,则(N1 ,N2 , ,Nm )
服从多项分布(m项)。需要检验假设
2.构造统计量
n
2 n i 1 j 1
m
k
(nij ni .n. j / n) ni.n. j
2
它近似服从自由度为mk-(m+k-2)-1= (m-1)(k-1)的卡方分布。
3.构造拒绝域{n2>1-2[(m-1)(k-1)]},计算 样本值,做出判断。
例 在社会调查中,调查人员可能怀疑男人和 女人对某种提案将会有不同的反应,他们 根据被调查的性别和对某项提案的态度来 进行分类,结果如下表(本表称为23的列 联表)。