统计5.4_其他分布参数的假设检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
拒绝原假设。
山西大学数学科学学院
7
第五章 假设检验
§5.5 分布拟合检验
分布拟合检验属于非参数检验范畴。
§5.5.1 总体分布只取有限个值的情况
X 频数 A1 n1 … … Ak nk
k
和为n
H 0 : P( Ai ) pi , i 1, 2, , k . pi 0, i 1 pi 1
例
山西大学数学科学学院 14 第五章 假设检验
§5.5 分布拟合检验
§5.5.3 正态性检验
一、正态概率纸 一种特殊的坐标纸,其横坐标表示样本值,是等间隔 的;纵坐标是标准正态的分布函数值,但不等间隔。
二、夏皮洛-威尔克(Shapiro-Wilk)检验
山西大学数学科学学院
15
第五章 假设检验
§5.5 分布拟合检验
一、正态概率纸检验正态性步骤:
(1)将数据从小到大排序:x(1) x(2) x( n) (2)对每一个i,计算修正(累积)频率,有三种方法:
ˆ (x ) F (i )
i i 0.5 i 0.375 , , or , n 1 n n 0.25
ˆ ( x )) 逐一标在正态概率纸上 (3)将点 ( x(i ) , F (i )
在假设检验问题中,我们有时会遇上这种情况:在一 个较大的显著水平(如 0.05)下得到拒绝原假设的结 论,而在一个较小的显著水平(如 0.01)下却会得出 相反的结论。 原因是当显著性水平减小,意味着拒绝域缩小而接受 域增大,因此原来落在拒绝域中的点可能落在接受域中。
一般地不给定显著水平,而是计算出一个p值。
… i … r Sum
山西大学数学科学学院
1 n11
… ni1 nr1 n· 1 …
… …
… … …
j n1j …
nij
… …
…
c n1c
… nic … nrc n· c
Sum n1·
ni· nr· n
第五章 假设检验
…
nrj n· j
12
… …
§5.5 分布拟合检验
§5.5.2 列联表的独立性检验
特别是第一种,即如果经对数变换后服从正态分布,
则说明原来的数据分从对数正态分布。
山西大学数学科学学院
17
第五章 假设检验
§5.5 分布拟合检验
二、夏皮洛-威尔克(Shapiro-Wilk)检验
简称W检验,当样本容量为8至50个时可以使用。
Sort Ascending : x(1) x(2) x( n ) (ai a )( x(i ) x ) Test Statistic:W= n i 1 n 2 2 ( a a ) ( x x ) i1 i i1 (i )
n 2
where, ai an 1i , i 1, 2, ,[n 2],
2 a 0, a i 1 i i 1 i 1 n n
山西大学数学科学学院
18
第五章 假设检验
§5.5 分布拟合检验
二、夏皮洛-威尔克(Shapiro-Wilk)检验(续)
因此可化简为:
ai ( x( n 1i ) x(i ) ) W= i 1 n 2 ( x x ) i1 (i )
c0
where x is the number of times the event occurs.
山西大学数学科学学院 4 第五章 假设检验
§5.4 其它分布参数的假设检验
§5.4.3 大样本的假设检验
Distributon X : E ( X ) , Var ( X ) ( ) H 0 : 0 vs H 0 : 0
A\B 1 …
1 p11 …
… …
j p1j
… … …
c p1c …
Sum p1·
… … … …
i
…
pi1
…
pij … prj p· j
13
pic
…
pi· pr· 1
第五章 假设检验
r Sum
山西大学数学科学学院
pr1 p· 1
… …
prc p· c
§5.5 分布拟合检验
§5.5.2 列联表的独立性检验(续)
分两种情况考虑:
一、诸pi均已知
二、诸pi不完全已知
山西大学数学科学学院 8 第五章 假设检验
§5.5 分布拟合检验
一、诸pi均已知
英国统计学家K.Pearson提出如下统计量:
2 ( n np ) i 2 i 1 i npi k
ቤተ መጻሕፍቲ ባይዱ
并证明在H0成立时对充分大的n,以上统计量近似服从自由 度为k-1的卡方分布,其值越大,表示观测频数与理论频 数的偏离程度越大。因此得拒绝域为:
概率统计基础
(Ⅲ) 2009年5月
山西大学数学科学学院
1
第五章 假设检验
§5.4 其它分布参数的假设检验
§5.4.1 指数分布参数的假设检验
exponential distrubution : Exp (1 ) H 0 : 0 vs H 0 : 0
n
when 0 , nx 1 xi ~ Ga (n, also
2
1
0
)
2nx
0
~ 2 (2n)
2 2 1
rejection region W {
山西大学数学科学学院 2
(2n )}
第五章 假设检验
§5.4 其它分布参数的假设检验
§5.4.2 比例p的假设检验
two point distrubution : b(1, p ) H 0 : p p0 vs H 0 : p p0 to look for c0 , which n i n i n n i n i p (1 p ) p (1 p ) ic0 i 0 0 ic0 1 i 0 0 rejection region W {x c0 1}
2
According to Central Limit Theorem : u n ( x 0 )
2 ( 0 )
~ N (0,1)
rejection region W {x u1 }
山西大学数学科学学院 5 第五章 假设检验
§5.4 其它分布参数的假设检验
§5.4.4 检验的p值
[ n 2]
2
rejection region :{W W } where, ai 和W 均查表得出。
在“总体服从正态分布”原假设成立的情况下,W 的
值应接近1。
山西大学数学科学学院 19 第五章 假设检验
W {
2
山西大学数学科学学院 9
2 1
(k 1)}
例
第五章 假设检验
§5.5 分布拟合检验
二、诸pi不完全已知
Fisher证明了如下检验统计量:
2 ˆ ( n np ) i 2 i 1 i ˆi np k
在H0成立时近似服从自由度为k-r-1的卡方分布。
ˆ i 为 pi 的最大似然估计,r<k为未知参数的个数。 p 其中,
H 0 : pij pi p j
ni n j
n n
, i 1,, r , j 1,, c.
2 ˆ ( n np ) r c ij 2 i 1 j 1 ij ˆ ij np
degree of freedom : rc ( r c 2) 1 ( r 1)(c 1) significanc level : rejection region : W { 2 12 ((r 1)(c 1))}
ij ij
个个体的属性属于等
ij
级Ai和Bj, n 称为 频数,将r×c个n
排列为一个r行
c 列的二维列联表,简称 r×c 表。若所考虑的属性多于两
个,也可按类似的方式作出列联表,称为多维列联表。
山西大学数学科学学院 11 第五章 假设检验
§5.5 分布拟合检验
§5.5.2 列联表的独立性检验
A\B 1
山西大学数学科学学院
6
第五章 假设检验
§5.4 其它分布参数的假设检验
§5.4.4 检验的p值(续)
Def:在一个假设检验问题中,利用观测值能够做出 拒绝原假设的最小显著性水平称为检验的p值。 如果 p ,则在显著水平alpha下拒绝原假设; 如果 p ,则在显著水平alpha下接受原假设; 实验中,p值越小,说明原假设越不显著,越倾向于
拒绝域为: W
{ 2 12 (k r 1)}
山西大学数学科学学院
10
第五章 假设检验
§5.5 分布拟合检验
§5.5.2 列联表的独立性检验
Def:列联表是观测数据按两个或更多属性(定性变量)分
类时所列出的频数表。 一般 , 若总体中的个体可按两个属性A 与 B 分类, A 有 r 个等级 A1,A2,…,Ar , B 有 c 个等级 B1,B2,…,Bc, 从总体中 抽取大小为 n 的样本,设其中有 n
(4)观察点的分布:如基本保持一条直线,则认为该组
数据来自正态总体,否则不是正态的。
山西大学数学科学学院
16
第五章 假设检验
§5.5 分布拟合检验
一、正态概率纸(续)
有时,数据本身不服从正态分布,但变换后可能是服 从正态分布的。 这样的变换称为正态性变换,常见有: 对数变换log(x)、倒数变换1/x、根号变换sqrt(x)。
n
where x is the number of times the event occurs.
山西大学数学科学学院 3 第五章 假设检验
§5.4 其它分布参数的假设检验
§5.4.2 比例p的假设检验(续)
corresponding: H 0 : p p0 vs H 0 : p p0 to look for c0 , which n i n i p (1 p ) i 0 i 0 0 rejection region W {x c0 }