统计检验分析-第五章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
~ x11~1 ~1 2 ~2 12xx1 12 3 ~ ~3 25.73
x 1 2 1 ~ 1 1 ~ 1 ~ 2 2 1 ~ 2 2 1 ~ x 1 2 1 3 .9 2x 9 1[1 x1,2 x1]35 .7[0 3 ,3 ][0 ,1.1 7]8
同样估计缺损的另外两个数对统计量的影响,预测出 T1和T2:
置信域由样本数据决定,用R(X)表示,如 果样本被抽取前有下式成立,则称区域 R(X)为θ 的100(1-α)%的置信域。
1. 一元统计中 2. 多元统计中
1. 一元统计中
例如,给定一个样本:样本均值和方 差分别为10和2,样本大小为11(自由 度为10)。
则根据下式和查表
2. 多元统计中
1
~
2 1
1
4 1
1
3
4 2 4
5
615
4. 利用初始的均值和协方差估计值预测缺
1
3 4
5 2
损值对充分统计量T1和T2的贡献
~[ ~ ~ ~ 1 3 2] ~ ~((1 2)) ,
~ ~ ~ 1 12 1 ~ 13
~
12
~
22
~
23
~ ~ ~ 1 3 2 3 3 3 ~ ~1 21 1 ~ ~1 2 2 2
03
6
7 X [
2
6 ]
~ [ 1 ]
512
4
5
603
726
X [
]
512
615
1
~
2 1
1
4 1
1
3
4 2 4
1
3 4
5 2
预测与估计一直迭代,直到估计值的元素基本不变化
七、多元观察中由时间相依性造成 的困难
当时间相依性可以由一阶多元自回归模型 (AR(1))来刻画时,有:
X t (X t 1)t
似然比统计量 的计算如下式,当该值太小时,拒绝零假设
2. T2和Λ分布的关系 设X1,…Xn是来自均值为μ,协方差矩阵为Σ的联 合分布的一个随机样本,服从Np(μ, Σ)分布有 小的Λ或大的T2, 拒绝零假设。
三、置信域和均值分量的联合比较
假设θ是未知的总体分布的参数向量,Θ 是所有可能的θ的集合,置信域是可能的θ 组成的集合,与一元的置信区间类似。
1. 均值控制图(一元) 2. 椭圆控制图(二元) 3. T2控制图(多元)
1. 均值控制图(一元) 按时间顺序对各个观察值或样本均值作
标绘 画出所有观察值的样本均值的中心线 按照如下公式计算并画出控制限 控制上限UCL:x+3*标准差 控制下限LCL:x-3*标准差
2. 椭圆控制图(二元) 按散布图进行标绘 按照如下不等式计算95%的置信椭圆,并
即T2分布与(系数*F)同分布 在一定概率水平下,如果下式成立则拒绝零假设
二、霍特林T2与似然比检验
1. 构造似然比 2. T2和Λ分布的关系 多元正态似然函数的最大值为:
极大似然估计量:
1. 构造似然比 2. 在零假设条件下(μ=μ0),最大正态似然值为:
其中 将两种最大似然值进行比较得到 的比值为似然比统计量:
T~1x~x1121xx2221xx3321~x~x441224.43.103 x13x23x33x43 16.00
T~2xx12111 x1x2221 x2x1x32212xx42311x32x41x42
x122x222x322x422
x11x13x21x23x31x33x41x43 x12x13x22x23x32x33x42x43
2 2
f(F ) ( 1(/2 1 ) 2(2 2)/2)1 1/2 22/2(1F F vv 2 2 1) (1 1 2)/2
第5章 关于均值向量的推断
一、μ0作为正态总体均值的似真性 二、霍特林T2与似然比检验 三、置信域和均值分量的联合比较 四、总体均值向量的大样本推断 五、多元质量控制图 六、观测值缺损时均值向量的推断 七、多元观察中由时间相依性造成的困难
p=2时置信域为一椭圆
四、总体均值向量的大样本推断
当样本量很大时,不需要总体的正态性假 定就可以构造均值的假设检验及置信域;
当n-p很大时,有下式成立:
则在α的置信水平下拒绝零假设
五、多元质量控制图
控制图的目的是为了识别是否出现了引 起变动的特殊原因,这些原因来自外部, 表明需要对数据进行修正或改进。
卡方分布(χ2 distribution)
u ~ N(0,1) 2u1 2u2 2Lun 2
2(x 2x)2(n 12)s2
s2
22
~
22
f(2)2(/2 2)(/2/12)exp(122)
n1 v
F分布( F distribution, RA Fisher,
F
1923) s
2 1
s
值与协方差矩阵,n=4,p=3,某些 值缺损。
1.对样本均值做初始估计:
03
726
X [
]
512
5
百度文库
~1
75 2
6
~2
0211 3
~3
36254 4
2.用样本均值代替缺损值 3. 估计协方差矩阵
603
726
X [
]
512
615
~ 1 1(6 6 )2 (7 6 )2 4 (5 6 )2 (6 6 )2 1 2
所有 t独立同分布,, 均协 值方 为差 零为
的特征值1均 和1之 值间;
则 C o(X v t,X t r) x,
x j j j 0
第5章习题
利用计算机程序实现EM算法。
此课件下载可自行编辑修改,此课件供参考! 部分内容来源于网络,如有侵权请与我联系删除!
这个统计分布为自由度为 n-1的学生t分布
学生t-分布(Student's tdistribution)应用在当对呈正态分 布的母群体的均值进行估计。它是 对两个样本均值差异进行显著性测 试的学生t测定的基础。
如果计算的t的绝对值较大,则拒绝零假设 上式也等同于当t的平方较大时,拒绝零假设, 即μ0不是总体均值的似真值。
六、观测值缺损时均值向量的推断
如何处理不完全观测值? 登普斯特(Dempster)提出一种从不完
全数据出发,计算其极大似然估计的一 般方法,称为EM算法。 EM算法: 1. 预测,预测任何缺损值对充分统计量的 贡献; 2. 估计,计算修正后的极大似然估计值。
EM算法具体步骤:
1. 利用不全数据X计算各个变量的均值,缺损 值不计入,用这些估计的均值代替缺损值;
画出椭圆控制限(α=0.05或0.01,p=2)
<
. ....
.
.
..
3. T2控制图(多元) 对第j个点计算T2统计量 把计算结果画在时间轴上,LCL为零,
UCL为α=0.05或0.01的卡方值.
99%限制
95%限制
T2
学生t分布(1)
f (t)
2
(1t2)21
(/2)
P(|t|t0)2t0 f(t)dt
~22
12,~33
5 2
~ 1 2 ( 6 6 ) 0 ( 1 ) ( 7 6 ) 2 ( 1 ) 4 ( 5 6 ) 1 1 ( ) ( 6 6 ) 1 1 ( ) 1 4
~23 43,~131
03
726
X [
]
512
6
603
~ [ 1 ]
7 X [
2
6 ]
4
512
2. 利用估计的上述数据估计协方差;
3. 把有缺损的数据和正常数据进行分块处理, 按照公式估计缺损值、缺损值的平方、缺损 值与其它观测值的乘积;
4. 计算充分统计量T1和T2的估计值; 5. 利用T1和T2估计均值和协方差; 再重复预测与估计,直到估计出的均值和协
方差中的元素基本保持不变为止。
例题,用下面数据估计正态总体均
第5章 关于均值向量的推断
一、μ0作为正态总体均值的似真性 二、霍特林T2与似然比检验 三、置信域和均值分量的联合比较 四、总体均值向量的大样本推断 五、多元质量控制图 六、观测值缺损时均值向量的推断 七、多元观察中由时间相依性造成的困难
一、μ0作为正态总体均值的似真性
本章将讨论关于总体均值向量及其分量的 统计推断问题。 判断μ0是否为总体均值的似真值? 一元统计中:t分布
14.08527 .2710.118 27 .07 6.97 20 .50
10.11820 .50 74 .00
x123x223x323x423
5. 求出修正估计
6.03
~
1 n
T~1
1.08
4.00
0.61 0.33 1.17
~1nT~2~~0.33 0.59 0.83
1.17 0.83 2.50
t2为样本均值到μ0的距离的平方
多元统计中 p*1的μ0向量是否为多元正态分布均值的似 真值? 从一元推广到多元平方距离:
•T2为样本均值到μ0的距 离的平方,如果距离太 远,则拒绝零假设; •T2以研究者霍特林命名, 称为霍特林统计量
其中
T2分布的性质: 设X1,…Xn是来自均值为μ,协方差矩阵为Σ 的联合分布的一个随机样本,服从Np(μ, Σ) 分布,