多元正态分布参数的假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 22.74 32.56 51.49 61.39 9 22.62 32.57 51.23 61.39 16 23.02 33.05 51.48 61.44
3 22.60 32.76 51.50 61.22 10 22.67 32.67 51.64 61.50 17 23.02 32.95 51.55 61.62
5
武汉理工大学统计学系唐湘晋
一、Σ已知时单个总体均值向量的检验
设 X1, X2,…, Xn 是来自正态总体 N p ( μ , Σ ) 的样本, 考虑假设: H 0 :μ = μ 0 ,
H 1 :μ ≠ μ 0
a) p = 1 b) p > 1
U 1 )
T02 = n ( X − μ 0 )′ Σ − 1 ( X − μ 0 ) .
4
武汉理工大学统计学系唐湘晋
§3.2 多元正态分布的均值向量的检验
p维正态总体 N p (μ, Σ) 的统计推断问题,包括均 值向量的检验和均值的置信域问题。 p维正态随 机向量的每一个分量都是一元正态变量,若将p 维均值向量的检验问题化为p个一元正态的均值 检验问题,虽然可以使问题简化,但忽略了p个 分量间的互相依赖关系,常常得不出正确的结 论。
13
武汉理工大学统计学系唐湘晋
解:
⎡ X 1 ⎤ ⎡ 22.82 ⎤ ⎢ ⎥ ⎢ X 2 ⎥ ⎢ 32.79 ⎥ ⎥ = X=⎢ ⎢ X 3 ⎥ ⎢ 51.45 ⎥ ⎢ ⎥ ⎢ ⎥ X 4 ⎥ ⎣ 61.38 ⎦ ⎢ ⎦ ⎣
1 21 V= ∑ (Xi − X)(Xi − X)′ 21 − 1 i=1 ⎡ 70.3076 ⎤ ⎢ −52.1469 ⎥ 73.5511 ⎥ =⎢ ⎢ 3.4462 −19.3637 ⎥ 90.4098 ⎢ ⎥ 1.2022 −33.6989 40.0895⎦ −6.9624 ⎣
2
利用T2与F的关系,检验统计量取为
( n + m − 2) − p + 1 2 F= T ~ F ( p, n + m − p − 1) ( n + m − 2) ⋅ p
19
武汉理工大学统计学系唐湘晋
具体步骤是:
H 1.作统计假设: 0 :μ1 = μ 2 , H1:μ1 ≠ μ 2
2.计算样本的均值 X 和 Y ,样本离差阵S1和S2 3.由公式 F = 具体值F。
定理 设 X1, …, Xn 是来自正态总体 N p ( μ , Σ ) 的样本,且
Σ已知,则在原假设 H 0 : μ = μ 0 下, T02 服从自由度为 p
2 χ 2分布,且原假设的拒绝域为: T02 > χα ( p ) .
7
武汉理工大学统计学系唐湘晋
具体步骤是:
1. 2. 3. 4.
作统计假设: 0 :μ = μ 0 , H 算样本的均值 X
T 2 = 21( X − μ 0 )′V −1 ( X − μ 0 ) = 15.2910
F0 =
n− p 2 17 T = T 2 = 3.2493 p(n − 1) 4 × 20
查F表,得F0.05(4,17) = 2.96,因为 F0 > F0.05 (4,17) 故拒绝H0。
14
武汉理工大学统计学系唐湘晋
三、两总体协差阵相等(但Σ未知)时均值向量的检验
设 X1 , X 2 ,K, X n为来自总体 X ~ N p ( μ1 , Σ ) 的样本;
Y1 , Y2 ,K, Ym 为来自总体 Y ~ N ( μ , Σ ) 的样本,且 p 2
两总体相互相互独立,Σ未知。要检验两总体均值是 否相等,即
H 0 : μ1 = μ 2
2
n + m − p −1 2 ( ) T ~ F p, n + m − p − 1 ( n + m − 2) p
17
武汉理工大学统计学系唐湘晋
因为在H0成立条件下
1 1 ( X - Y ) ~ N p (0, ( + ) Σ), n m
n
nm ( X - Y) ~ N p (0, Σ) n+m
S1 = ∑ ( Xi - X)( Xi - X)′ ~ Wp (n − 1, Σ)
S 2 = ∑ (Y j − Y)(Y j − Y)′ ~ W p (m − 1, Σ)
j =1
i =1 m
且相互独立,由Wishart分布的可知性知
S1 + S 2 ~ W p (n + m − 2, Σ)
18
武汉理工大学统计学系唐湘晋
由T2统计量的定义知
nm T = (n + m − 2) ( X − Y)′(S1 + S 2 ) −1 ( X − Y) ~ T 2 ( p, n + m − 2) n+m
9
武汉理工大学统计学系唐湘晋
1 1 在 H 0 :μ = μ 0下, X ~ N P (μ 0 , Σ) , X − μ 0 ~ N P (0, Σ) n n n
S = ∑ ( X j - X )( X j - X )′ ~ W p ( n − 1, Σ ) .
j =1
故由T2分布定义知
⎡ n ( X − μ 0 ) ⎤′ S −1 ⎡ n ( X − μ 0 ) ⎤ ~ T 2 ( p, n − 1) T = ( n − 1) ⎣ ⎦ ⎣ ⎦
12
武汉理工大学统计学系唐湘晋
小区号 性状 X1 X2 X3 X4 小区号 性状 X1 X2 X3 X4 小区号 性状 X1 X2 X3 X4
1 22.88 32.81 51.51 61.53 8 22.74 32.67 51.44 60.30 15 22.81 33.02 51.70 61.49
4 22.93 32.95 51.17 60.91 11 22.82 32.80 51.32 60.97 18 23.15 33.15 51.58 61.65
5 22.74 32.74 51.45 61.56 12 22.67 32.67 51.21 61.49 19 22.88 33.06 51.45 61.54
第三章
多元正态分布参数的假设检验
1
武汉理工大学统计学系唐湘晋
§3.1 基本概念
统计假设检验包括两类问题:一是已经知道随机变量 分布函数的形式,但其中包含几个未知的参数,要求 检验这些参数是否等于某些已知的数值,这类问题称 为参数的假设检验;二是随机变量的分布函数未知, 要检验它是否服从某一已知的分布,这类问题称为分 布的假设检验。 在假设检验理论中,把原假设以外的那些值称为备择 假设。
2
利用T2与F分布的关系,检验统计量取为
n− p 2 T ~ F p, n − p) ( ( n − 1) p
10
武汉理工大学统计学系唐湘晋
具体步骤是:
1. 2.
3.
H 作统计假设: 0 :μ = μ0 ,
H1:μ ≠ μ 0
1 n V= ∑ (Xi − X)(Xi − X)′ n − 1 i =1
11
武汉理工大学统计学系唐湘晋
例 某小麦良种的四个主要经济性状的理论值 为 μ 0 = (22.75, 32.75, 51.50, 61.50)′ 。现在从外地引入 一新品种,在21个小区种值,取得如表所示数据。设 新品种的四个性状 X = ( X 1 , X 2 , X 3 , X 4 )′ ~ N 4 (μ, Σ), 试检 验假设 H 0 : μ = μ 0 (α = 0.05)
2
武汉理工大学统计学系唐湘晋
例如,若正态总体的平均数未知,但知道它的取值域 为μ>0,我们要检验原假设“μ=μ0”,这样,除μ0 以外的一切正实数都是备择假设。但是,如果在假设 检验中只提出原假设,检验的目的只是通过观测资料 来判断是接受还是拒绝这个假设,那么这种假设称为 显著性检验。如果检验结果否定了原假设,就说(假 设与实际)差异显著;如果检验结果不能否定原假 设,就说(假设与实际)无显著差异。
m ⎡ n 1 ′⎤ ′+ Ve = ⎢ ∑ ( Xi − X )( Xi − X ) ∑ ( Y j − Y )( Y j − Y ) ⎥ n + m − 2 ⎣ i =1 j =1 ⎦
1 n 1 m 其中 X = ∑ Xi , Y = ∑ Yj n i =1 m j =1
在原假设H0下
nm X − Y )′ Ve-1 ( X − Y) ~ T 2 (p, n + m -1) T = ( n+m
算样本的均值 X 和样本协方差
n− p 2 T ~ F p, n − p) 计算F统计量具体值F。 ( 由公式 ( n −1) p
4.
按规定的显著水平α,查F分布临界值 Fα ( p, n − p ) , 当 F0 ≤ Fα ( p, n − p ),接受H0,拒绝H1,即认为与没有
并作出判断:
显著差异。 当F0 > Fα ( p, n − p ),接受H1,拒绝H0,即认为与有显 著差异。
3
武汉理工大学统计学系唐湘晋
小概率原理
一个概率很小的事件,在一次试验中可以认为是不可 能发生的; 在假设检验中,接受或拒绝原假设的决定是根据样本 特征值与假设值的偏差超过一定界限的概率作出的, 如果这个概率很小,就拒绝假设;如果这个概率较 大,就接受假设。这里显然有一个标准问题,即要规 定一个很小的概率α作为临界值,当上述偏差超出规 定界限的概率小于或等于α时,就拒绝原假设,反之 就接受原假设。这个临界概率α称为显著性水平。
H1:μ ≠ μ 0
2 ′ −1 计算统计量T的具体值 T0 = n ( X − μ 0 ) Σ ( X − μ 0 ) .
按规定的小概率标准α,查 χ 分布表,得临界
2
2 2 当 T02 ≤ χα ( p),接受H0,拒绝H1,即认为与没有显
值 χα ( p) ,并作出判断: 著差异。 当 T02 > χα ( p),接受H1,拒绝H0,即认为与有显著
显然
⎡ 2 2⎤ ⎢ ∑( Xi − X ) + ∑(Yj −Y ) ⎥ nm i=1 j =1 2 ⎥ ( X −Y ) ~ F(1, n + m − 2) ( X −Y )′ ⎢ t = m+ n n + m− 2 ⎢ ⎥ ⎢ ⎥ ⎣ ⎦
n m
16
−1
武汉理工大学统计学系唐湘晋
推广到p元总体,可以得到形式类似的统计量 T2: 记
6 22.53 32.53 51.36 61.22 13 22.81 32.67 51.43 61.15 20 23.16 32.78 51.48 61.41
7 22.67 32.58 51.44 61.30 14 22.67 32.67 51.43 61.15 21 23.13 32.95 31.38 61.58
H1 : μ1 ≠ μ 2
15
武汉理工大学统计学系唐湘晋
当p = 1时,因为,X ~ N1 ( μ1 , 互独立,在H0成立条件下,有
,
σ2
n
) , ~ N1 ( μ 2 , Y
σ2
m
) , 且相
1 1 ( X −Y ) + n m ~ t(n + m− 2) t= m ⎡n 2 2⎤ ⎢∑( Xi − X ) + ∑(Yi −Y ) ⎥ (n + m− 2) j =1 ⎣ i=1 ⎦
6
武汉理工大学统计学系唐湘晋
在原假设 H0 下, X ~ N p ⎛ μ 0 , Σ ⎞ . 则 ⎜ ⎟ n
1 ⎝ ⎠
1 1 X = μ0 + Σ 2 Y , Y ~ N p ( 0, I p ) . n
nΣ
− 1 2
(X − μ ) = Y
0
T02 = n ( X − μ 0 )′ Σ −1 ( X − μ 0 ) = Y'Y ~ χ 2 ( p )
( n + m − 2) − p + 1 2 T ~ F ( p, n + m − p − 1) ( n + m − 2) ⋅ p
计算F统计量
4. 按规定的显著水平α,查F分布临界值 Fα ( p, n + m − p − 1) 并作出判断: 当 F0 ≤ Fα ( p, n + m − p − 1) 接受H0,拒绝H1,即认为与 没有显著差异。 当 F0 > Fα ( p, n + m − p − 1) 接受H1,拒绝H0,即认为与有 显著差异。
2
差异。
8
武汉理工大学统计学系唐湘晋
二、Σ未知时单个总体均值向量的检验
建议:用样本协方差S来替换Σ ,即 T 2 = n X − μ ′ V -1 X − μ
(
0
)
(
0
)
= n ( n − 1) ( X − μ 0 )′ S -1 ( X − μ 0 )
其中
1 1 n ′ V= S= ∑ ( X j − X )( X j − X ) n -1 n - 1 j =1