多元正态总体参数的假设检验(上)
多元正态分布参数的估计与假设检验-判别分析
注 共轭分布族总是针对分布中的某个参数而言的 共轭分布族总是针对分布中的某个参数而言的.
三、贝叶斯风险
1、贝叶斯风险的定义 由第一小节内容可知,给定损失函数以后, 由第一小节内容可知,给定损失函数以后,风 险函数定义为
R(d ) = inf R(d ),
* d ∈D
∀d ∈ D
则称d * ( X )为参数θ的贝叶斯估计量
注 1、贝叶斯估计是使贝叶斯风险达到最小的决策 、 函数. 函数 2、不同的先验分布,对应不同的贝叶斯估计 、不同的先验分布, 2、贝叶斯点估计的计算 平方损失下的贝叶斯估计 定理4.2 定理 设θ的先验分布为π(θ)和损失函数为 的先验分布为π θ 和损失函数为
Θ
=∫
Θ
∫
Χ
L(θ , d ( x ))q( x | θ )π(θ )dxdθ
=∫
Θ
∫θ | x )g(x )dxdθ
Θ
= ∫ g(x ){ ∫ L(θ , d ( x ))h(θ | x )dθ }dx
Χ
四 、贝叶斯估计
1、贝叶斯点估计 定义4.6 若总体 的分布函数F(x,θ)中参数θ为随机 定义 若总体X的分布函数 中参数θ 的分布函数 θ 中参数 变量, θ 为 的先验分布,若决策函数类D中存在 变量,π(θ)为θ的先验分布,若决策函数类 中存在 一个决策函数使得对决策函数类中的任一决策函数 均有
第8.2节 节
判别分析
一、先验分布和后验分布 二、共轭先验分布 三、贝叶斯风险 四、贝叶斯估计
一、先验分布与后验分布
上一章提出用风险函数衡量决策函数的好坏, 上一章提出用风险函数衡量决策函数的好坏,但 是由于风险函数为二元函数,很难进行全面比较。 是由于风险函数为二元函数,很难进行全面比较。 贝叶斯通过引入先验分布, 的指标. 贝叶斯通过引入先验分布,给出了整体比较 的指标 1、先验信息 在抽取样本之前, 在抽取样本之前,人们对所要估计的未知参数 先验信息. 所了解的信息,通常称为先验信息 所了解的信息,通常称为先验信息 例1(p121例4.6) 某学生通过物理试验来确定当地 1(p121例 的重力加速度,测得的数据为(m/s²): 的重力加速度,测得的数据为 9.80, 9.79, 9.78, 6.81, 6.80 试求当地的重力加速度. 试求当地的重力加速度
第六章(4)多元正态总体均值向量的假设检验
第六章(4)多元正态总体均值向量的假设检验类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协差阵的检验。
我们只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例第1节 HotellingT 2分布为了对多元正态总体均值向量作检验,首先需要给出HotellingT 2分布的定义。
定义 设),(~),,(~∑∑n W S N Xp p μ且X 与S 相互独立,pn ≥,则称统计量XS X n T12-'=的分布为非中心HotellingT 2分布,记为),,(~22μn p T T 。
当0=μ时,称2T 服从(中心)HotellingT 2分布,记为),(2n p T ,由于这一统计量的分布首先由Harold Hotelling 提出来的,故称为HotellingT 2分布,值得指出的是,我国著名统计学家许宝马录 先生在1938年用不同方法也导出T 2分布的密度函数,因表达式很复杂,故略去。
在一元统计中,若n X X ,,1 来自总体),(2σμN 的样本,则统计量:)1(~ˆ)(--=n t X n t σμ分布其中212)(11ˆ∑=--=ni iX Xn σ显然)()ˆ()(ˆ)(12222μσμσμ-'-=-=-X X n X n t与上边给出的T2统计量形式类似,且⎪⎪⎭⎫⎝⎛-n N X 2,0~σμ。
可见,T 2分布是一元统计中t 分布的推广。
基本性质:在一元统计中,若统计量)1(~-n t t 分布,则)1,1(~2-n F t 分布,即把t 分布的统计量转化为F 统计量来处理,在多元统计分析中T 2统计量也具有类似的性质。
定理 若),(~),,0(~∑∑n W S N Xp p 且X 与S 相互独立,令X S X n T 12-'=,则)1,(~12+-+-p n p F Tnpp n这个性质在后面经常用到。
第2节 均值向量的检验设p 元正态总体),(∑μp N ,从总体中抽取容量为n 的样本∑∑=='--==ni ni i i i n X X X XS X nX X X X 11)()()()()2()1())((,1,,,, 。
正态总体方差的假设检验
方差的计算方法
简单方差
适用于数据量较小,且数据间相互独立的情况。
加权方差
适用于数据量较大,且数据间存在相关关系的 情况,需要考虑到每个数据点的重要程度。
配对样本方差检验
总结词
配对样本方差检验用于比较两个相关样本的方差是否相同。
详细描述
在配对样本方差检验中,我们首先需要设定一个零假设,即两个相关样本的方差无显著差异。然后, 通过计算检验统计量(如Wilcoxon秩和统计量或Stevens' Z统计量),我们可以评估零假设是否被拒 绝。如果零假设被拒绝,则可以得出两个相关样本方差不相同的结论。
方差齐性检验的目的是为了后续 的方差分析提供前提条件,确保 各组数据具有可比性。
方差分析
方差分析(ANOVA)是
1
用来比较多个正态总体均
值的差异是否显著的统计
方法。
4
方差分析的结果通常以p值 表示,若p值小于显著性水 平(如0.05),则认为各组 均值存在显著差异。
2
方差分析的前提条件是各
组数据具有方差齐性和正
正态总体方差假设检验的未来发展
改进假设检验方法
结合其他统计方法
结合其他统计方法,如贝叶斯推断、机器学习等, 可以更全面地分析数据和推断总体特征。
针对正态总体方差假设检验的局限性,未来 研究可以探索更灵活、适应性更强的检验方 法。
拓展应用领域
正态总体方差假设检验的应用领域可以进一 步拓展,特别是在大数据和复杂数据分析方 面。
数学表达式
多元课件第三章
H H D D ' ' ' 11 1 2 rO rO AB B O H H O O O O 21 2 2
22
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
结论2 当μi≠0(i=1,„,n),σ2 =1时,X′X的 分布常称为非中心χ2分布. 定义3.1.1 设n维随机向量X~Nn(μ,In)
(μ≠0),则称随机变量ξ=X'X为服从 n n个自由度,非中心参数 i2 i 1` 2 的χ 分布,记为
2 2 n
X X ~ ( n , ), X X ~ ( )
第三章 多元正态总体参数的假设检验
一元统计中,参数μ ,σ 2的检验 涉及到一个总体、二个总体,乃至 多个总体的检验问题; 推广到p元统计分析中,类似地 对参数向量μ 和参数矩阵Σ 涉及 到的检验也有一个总体、二个总体 ,乃至多个总体的检验问题。
3
第三章 多元正态总体参数的假设检验
在一元统计中,用于检验μ, σ2的抽 样分布有χ2分布,t 分布,F分布等,它们都 是由来自总体N(μ, σ2)的样本导出的检验 统计量. 推广到多元统计分析后,也有相应于 以上三个常用分布的统计量: Wishart, Hotelling T 2,Wilks Λ统计 量,讨论这些统计量的分布是多元统计分 析所涉及的假设检验问题的基础.
6
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
1 1 2 则Y Y X X ~ ( n , ), 其中 2 2
结论3 设X~Nn(0 ,σ2In), A为n阶对称方阵, rk(A)= r,则 二次型 X'AX/σ2~χ2(r) A2=A(A为对称幂等阵). 2 2 2 特例:当A=In时, X I X / X X / ~ ( n ) n
多元正态分布参数的假设检验
( ) ( ) 3. 计算统计量T的具体值 T02 = n X − μ0 ′ Σ−1 X − μ0 .
4. 按规定的小概率标准α,查 χ 2分布表,得临界
值 χα2 ( p),并作出判断: 当 T02 ≤ χα2 ( p),接受H0,拒绝H1,即认为与没有显
著差异。 当 T02 > χα2 ( p),接受H1,拒绝H0,即认为与有显著
当p = 1时,因为,X
~
N1 ( μ1 ,
σ2
n
)
,Y
~
N1 ( μ2
,
σ2
m
)
,
且相
互独立,在,H0成立条件下,有
(X −Y) 1 + 1
t=
nm
~ t(n + m− 2)
∑ ∑ ⎡ n
⎢
(Xi
− X)2
+
m
(Yi
−Y
)2
⎤ ⎥
(n+m−2)
⎣ i=1
j=1
⎦
∑ ∑ 显然
t2 = nm
⎡ ⎢
n
Xj −X
Xj −X ′
9
武汉理工大学统计学系唐湘晋
( )( ) ∑ 在
H 0 :μ
=
μ0下, S=
X~
n
X
1 NP (μ0 , n Σ)
j -X Xj -X
′
,
~
X − μ0 ~
Wp (n −1,
NP (0,
Σ).
1 n
Σ)
j =1
故由T2分布定义知
( ) ( ) T 2 = (n −1) ⎡⎣ n X − μ0 ⎤⎦′ S−1 ⎡⎣ n X − μ0 ⎤⎦ ~ T 2 ( p, n −1)
多元线性回归模型的各种检验方法
对多元线性回归模型的各种检验方法对于形如u X X X Y k k +++++=ββββ 22110 (1) 的回归模型,我们可能需要对其实施如下的检验中的一种或几种检验:一、 对单个总体参数的假设检验:t 检验在这种检验中,我们需要对模型中的某个(总体)参数是否满足虚拟假设0H :j j a =β,做出具有统计意义(即带有一定的置信度)的检验,其中j a 为某个给定的已知数。
特别是,当j a =0时,称为参数的(狭义意义上的)显著性检验。
如果拒绝0H ,说明解释变量j X 对被解释变量Y 具有显著的线性影响,估计值j βˆ才敢使用;反之,说明解释变量j X 对被解释变量Y 不具有显著的线性影响,估计值j βˆ对我们就没有意义。
具体检验方法如下:(1) 给定虚拟假设 0H :j j a =β;(2) 计算统计量 )ˆ(ˆ)ˆ()(ˆjj j j j j Se a Se E t βββββ-=-= 的数值; 11ˆ)ˆ(++-==j j jj jj j C C Se 1T X)(X ,其中σβ(3) 在给定的显著水平α下(α不能大于1.0即 10%,也即我们不能在置信度小于90%以下的前提下做结论),查出双尾t (1--k n )分布的临界值2/αt ;(4) 如果出现 2/αt t >的情况,检验结论为拒绝0H ;反之,无法拒绝0H 。
t 检验方法的关键是统计量 )ˆ(ˆj jj Se t βββ-=必须服从已知的t 分布函数。
什么情况或条件下才会这样呢?这需要我们建立的模型满足如下的条件(或假定):(1) 随机抽样性。
我们有一个含n 次观测的随机样(){}n i Y X X X i ik i i ,,2,1:,,,,21 =。
这保证了误差u 自身的随机性,即无自相关性,0))())(((=--j j i i u E u u E u Cov 。
(2) 条件期望值为0。
给定解释变量的任何值,误差u 的期望值为零。
R语言版应用多元统计分析多元正态总体的假设检验
应用多元统计分析第3章 多元正态总体的假设检验- 1-•在一元正态总体 中,关于参数 的假设检验涉及到一个总体和多个总体情况,推广到多元正态总体 ,关于参数 的假设检验问题也涉及一个总体和多个总体情况。
本章我们只讨论关于均值向量 的假设检验问题。
•在多元统计中,用于检验 的抽样分布有维希特(Wishart)分布、霍特林(Hotelling)分布和威尔克斯(Wilks)分布,它们都是由来自多元正态总体 的样本构成的统计量。
在第2章中,我们已经讨论了维希特分布的定义和性质,本章我们讨论后两个统计量的分布。
霍特林 分布在一元统计中,若 ,且 相互独立,则或等价地下面把 的分布推广到多元正态总体。
定义3.1 设 , ,其中 ,且 与 相互独立。
则称统计量 为 统计量,其分布称为自由度为n的霍特林 分布,记为分布的性质性质1 设 是来自正态总体 的随机样本, 和A 分别是样本均值向量和样本离差阵,则性质2 分布与F分布的关系为:若 则分布的性质性质3 设 是来自正态总体 的随机样本, 和A 分别是样本均值向量和样本离差阵,记则性质4 分布只与n,p有关,而与 无关。
威尔克斯 分布定义3.2 设 ,称协方差阵 的行列式 为的广义方差。
若 是来自总体 的随机样本,A为样本离差阵,则称或 为样本广义方差。
定义3.3设 ,这里 ,且 与 独立,则称广义方差比为 统计量,其分布称为威尔克斯 分布,记为 。
当p=1时, 分布正是一元统计中参数为 的贝塔分布,即。
分布的性质性质1当 时,若 ,则当 时,若 ,则当p=1时,当p=2时,若 ,则当 时有下列极限分布其中 。
下面是 分布的两个有用性质。
性质6 若 ,则存在 , 且 之间相互独立,使得性质7 若 则单总体均值向量的假设检验设总体为 , 为来自该总体的随机样本。
欲检验下列假设:其中 为已知常数向量。
1. 当 已知时均值向量的假设检验此时于是有若检验统计量取为则当原假设 成立时, 。
多元线性回归模型的各种检验方法
对多元线性回归模型的各种检验方法对于形如u X X X Y k k +++++=ββββΛΛ22110 (1)的回归模型,我们可能需要对其实施如下的检验中的一种或几种检验:一、 对单个总体参数的假设检验:t 检验在这种检验中,我们需要对模型中的某个(总体)参数是否满足虚拟假设0H :j j a =β,做出具有统计意义(即带有一定的置信度)的检验,其中j a 为某个给定的已知数。
特别是,当j a =0时,称为参数的(狭义意义上的)显著性检验。
如果拒绝0H ,说明解释变量j X 对被解释变量Y 具有显著的线性影响,估计值j βˆ才敢使用;反之,说明解释变量j X 对被解释变量Y 不具有显著的线性影响,估计值j βˆ对我们就没有意义。
具体检验方法如下:(1) 给定虚拟假设 0H :j j a =β;(2) 计算统计量 )ˆ(ˆ)ˆ()(ˆjj j j j j Se a Se E t βββββ-=-= 的数值; 11ˆ)ˆ(++-==j j jj jj j C C Se 1T X)(X ,其中σβ(3) 在给定的显著水平α下(α不能大于1.0即10%,也即我们不能在置信度小于90%以下的前提下做结论),查出双尾t (1--k n )分布的临界值2/αt ;(4) 如果出现 2/αt t >的情况,检验结论为拒绝0H ;反之,无法拒绝0H 。
t 检验方法的关键是统计量 )ˆ(ˆj jj Se t βββ-=必须服从已知的t 分布函数。
什么情况或条件下才会这样呢?这需要我们建立的模型满足如下的条件(或假定):(1) 随机抽样性。
我们有一个含n 次观测的随机样(){}n i Y X X X i ik i i ,,2,1:,,,,21ΛΛ=。
这保证了误差u 自身的随机性,即无自相关性,0))())(((=--j j i i u E u u E u Cov 。
(2) 条件期望值为0。
给定解释变量的任何值,误差u 的期望值为零。
多元统计分析:第三章 多元正态总体参数的假设检验(补充)
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
ˆ X时 (4) 当 0 (0 0巳知)时, 取 似然函数达最大值:
L( X , 0 ) 2
np 2
0
n 2
n 1 etr - 0 A 2
19
第三章 多元正态总体参数的假设检验
15
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
单个p维正态总体Np(μ,Σ),设X(i)(i=1,…,n)为来自p 维总体的随机样本.样本的似然函数为
L( , ) 2
np 2
1 ˆ A时, 似然函数达最大值 : ˆ X , (1)当 n n np A 2 A np L( X , ) 2 2 exp - n n 2
9
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
D2(1)≤ D2(2) ≤…≤ D2(n) 统计量 D2 的经验分布函数取为
.
其中H(D2(t) |p)表示χ2 (p)的分布函数在D2(t)的值. 设χ2 分布的pt分位数为χt2 ,显然χt2满足: H(χt 2 |p)= pt. 即χ2 分布的pt 分位数χt2 =H-1(pt |p). 由经验分布得到样本的pt 分位数D2(t)=Fn-1(pt ). 若H(x|p)≌Fn(x),应有D2(t) ≌ χt2 ,绘制点(D2(t) , χt2 )的散 布图,当X为正态总体时,这些点应散布在一条直线上. 10
(1) (1) ( 2) ( 2)
np 2
A1 A2 n
(t )
np 2 2
e
X )( X
第三章多元正态总体参数的假设检验
第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布一、正态变量二次型的分布1、分量独立的n 维随机向量X 的二次型设),,1)(,(~21n i N X i i =σμ,且相互独立,记⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=n X X X 1,则),(~2n n I N X σμ,其中)',,(1n μμμ =。
X 的二次型具有以下一些结论:结论1 当),,1(0n i i ==μ,12=σ时,则)(~'212n XX X ni iχξ∑===;当),,1(0n i i ==μ,12≠σ时,则)(~'122n X X χσ(或记为)(~'22n X X χσ)。
结论2 当),,1(0n i i =≠μ,X X '的分布常称为非中心2χ分布。
Def3.1.1 设n 维随机向量)0)(,(~≠μμn n I N X ,则称随机向量X X '=ξ为服从n 个自由度、非中心参数∑===ni i 12'μμμδ的2χ分布,记为)(~'),(~'22δχδχn X X n X X 或。
若时且1),0)(,(~22≠≠σμσμn n I N X ,有)(~'122δχσn X X 。
结论3 设),0(~2n n I N X σ,A 为对称矩阵,且r A rank =)(,则二次型 A A r AX X =⇔222)(~/'χσ(A 为对称幂等矩阵)。
结论4 设),(~2n n I N X σμ,'A A =,则),(~'122δχσr AX X ,其中A A A =⇔=22'1μμσδ,且)()(n r r A rank ≤=。
结论5 二次型与线性函数的独立性:设),(~2n n I N X σμ,A 为n 阶对称矩阵,B 为n m ⨯矩阵,令)(,'维随机向量为m Z BX Z AX X ==ξ,若O BA =,则AX X BX '和相互独立。
应用多元统计分析课后习题答案高惠璇第三章部分习题解答
m 0L ( a0 ,x 0 )m L ( a, x 0 )
分 |2 子 1 0|n /2e x 1 2 p n 1 (X ()0 ) 0 1 (X ()0 )
|2 1 0|n /2e x 1 2 tp [ r0 1 n 1 (X ()0 )X ( ()0 )]
这是单个k维正态总体均值向量的检验问
题.利用§3.2当Σy = CΣC′未知时均值向 量的检验给出的结论,取检验统计量:
F
nk
H0下
T2 ~F(k,nk)
(n1)k
其T 中 2(n 1 )n(Yr)A y 1(Yr).
(n 1 )n(C Xr)CC A 1(C Xr).
解:令 Y ()C(X )( 1 ,2 , ,n )
则Y(α)(α =1,…,n) 为来自k维正态总体Y 的样本,且
Y ( )~ N k ( C ,C Σ C )记 ;y C , y C C .
21
第三章 多元正态总体参数的检验
检验 H 0:C rH 0 : y r
由于Y1,…,Yr ,Yr+1 ,…,Yn相互独立,故 X′AX与X′BX相互独立.
9
第三章 多元正态总体参数的检验
3-3 设X~Np(μ,Σ),Σ>0,A和B为p阶对称阵, 试证明 (X-μ)′A(X-μ)与(X-μ)′B(X-μ)相互独立
ΣAΣBΣ=0p×p.
(记
1
2
12 1)
解:检验三个尺寸(变量)是否符合这一规律的问题
可提成假设检验问题.因为 1: 2: 3 6 :4 :1 C 0
其中
C10
多元统计分析和假设检验
因子分析步骤:
因子分析
聚类分析
聚类分析是一组将研究对象分为相对同质的群组的 统计分析技术,每群内部成员彼此比较相似,聚 类分析也叫分类分析。
2.参数检验与非参数检验
假设检验的过程可以跟据变量采用的测量指标,广泛分 为参数检验和非参数检验。
检验问题可以分为两类:在已知总体分布的具体函数形 式的前提下,只是其中若干个参数未知,则称这种检验 问题为参数检验问题,否则称为非参数检验问题。
非参数检验是在总体分布情况不明时,用来检验数据资 料是否来自同一个总体假设的一类检验方法。
是检验来自两个彼此独立的总体的样本均值是否 存在显著性差异;
两个样本方差相等于不等式使用的计算t值的公式 不同,因此要先对方差进行齐次性检验。SPSS的 输出,给出了方差齐次与不齐两种计算结果的t值, 和t检验显著性概率的同时,还给出了对方差齐次 性检验的F值和F检验的显著性概率。
独立样本的t检验
相关分析步骤:
相关分析
回归分析
把存在相关关系的两个或多个变量,一个或几个作为自变量, 另一个作为因变量,把它们之间不十分准确、稳定的关系 用数学方程式来表达,用自变量的值来估计、预测因变量 的值,这个过程称为回归分析。变量之间相互关联的规律 或关系称为回归关系,表达回归关系的数学方程称为回归 方程。
来生成比单个观察更容易管理的数据群组。
聚类分析步骤:
聚类分析
尺度分析步骤:
尺度分析
一个样本的柯尔摩格洛夫-斯米诺夫检验
正态总体参数的假设检验
正态总体参数的假设检验 正态总体中有两个参数:正态均值与正态⽅差。
有关这两个参数的假设检验问题经常出现,现逐⼀叙述如下。
(⼀) 正态均值的假设检验 ( 已知情形) 建⽴⼀个检验法则,关键在于前三步l,2,3。
5.判断(同前) 注:这个检验法称为u检验。
(⼆) 正态均值的假设检验 ( 未知情形) 在未知场合,可⽤样本标准差s去替代总体标准差,这样⼀来,u统计量变为t统计量,具体操作如下: 1.关于正态均值常⽤的三对假设为 5.判断 (同前) 注:这个检验法称为t检验。
(三)正态⽅差的假设检验 检验正态⽅差有关命题成⽴与否,⾸先想到要⽤样本⽅差。
在基础上依据抽样分布特点可构造统计量作为检验之⽤。
具体操作如下: 1.关于正态⽅差常⽤的三对假设为 5.判断(同前) 注:这个检验法称为检验。
注:关于正态标准差的假设与上述三对假设等价,不另作讨论。
(四) ⼩结与例⼦ 上述三组有关正态总体参数的假设检验可综合在表1.5-1上,以供⽐较和查阅。
续表 [例1.5-2] 某电⼯器材⼚⽣产⼀种云母带,其厚度在正常⽣产下服从N(0.13,0.0152)。
某⽇在⽣产的产品中抽查了10次,发现平均厚度为0.136,如果标准差不变,试问⽣产是否正常?(取 =0.05)来源:考试通 解:①⽴假设:②由于已知,故选⽤u检验。
③~④根据显著性⽔平 =0.05及备择假设可确定拒绝域为{ >1.96}。
⑤由样本观测值,求得检验统计量: 由于u未落在拒绝域中,所以不能拒绝原假设,可以认为该天⽣产正常。
[例1.5-3] 根据某地环境保护法规定,倾⼊河流的废⽔中⼀种有毒化学物质的平均含量不得超过3ppm。
已知废⽔中该有毒化学物质的含量X服从正态分布。
该地区环保组织对沿河的⼀个⼯⼚进⾏检查,测定每⽇倾⼊河流的废⽔中该物质的含量,15天的记录如下(单位:ppm)3.2,3.2,3.3,2.9,3.5,3.4,2.5,4.3,2.9,3.6,3.2,3.0,2.7,3.5,2.9 试在⽔平上判断该⼚是否符合环保规定? 解:①如果符合环保规定,那么应该不超过3ppm,不符合的话应该⼤于3ppm。
多元正态总体的假设检验和方差分析
第 3 章多元正态总体的假设检验与方差分析从本章开始,我们开始转入多元统计方法和统计模型的学习。
统计学分析处理的对象是带有随机性的数据。
按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法。
由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。
所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。
统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。
统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。
参数估计问题回答诸如“未知参数的值有多大?”之类的问题, 而假设检验回答诸如“未知参数的值是吗?”之类的问题。
本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断,两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。
3.1 一元正态总体情形的回顾一、假设检验在假设检验问题中通常有两个统计假设(简称假设), 一个作为原假设(或称零假设),另一个作为备择假设(或称对立假设),分别记为和。
1、显著性检验2为便于表述,假定考虑假设检验问题:设X1, X2,…,X n来自总体N(,)的样本,我们要检验假设3.1)原假设H。
与备择假设H i应相互排斥,两者有且只有一个正确。
备择假设的意思是,一旦否定原假设H0 ,我们就选择已准备的假设H1。
2当 已知时,用统计量 z在原假设H 。
成立下,统计量z 服从正态分布z 〜N (0 ,1),通过查表,查得N(0 ,1)的上对于检验问题(3.1.1,我们制定这样一个检验规则(简称检验)(3.2)分位点z 2。
当z z 2时,拒绝H 0 ; 当z z 2时,接受H o 。
第四章 多元正态总体均值向量和协差阵的假设检验
210
280 280 293 210 190 310 200 189 280 190 295 177
100
65 117 114 55 64 110 60 110 88 73 114 103
34
63 48 63 30 51 90 62 69 78 63 55 54
468
416 468 395 546 507 442 440 377 299 390 494 416
1.当
已知时,检验用的统计量为
2、当
未知时,检验用的统计量为
(二)两个正态总体均值的比较检验 设从总体 中抽出一个样本 中抽出一个样本 ,从总体
,要进行的假设检验为
1.两个正态分布总体方差
和
已知时,检验用的统计量
2.两个正态分布总体方差
和
未知,但
(三)多个正态总体均值的比较检验 设有k个正态总体分别为 本:各总体的样本如下: 从k个总体中各自独立的抽取一个样
经计算得
拒绝原假设
甲和丁存在显著差别
第二节 协方差阵的检验 一、检验
设
要检验
是来自
的样本是已知的正定矩阵,检验的统计量是对于方阵A =
,将它对角线的所有元素相加所得的和,称为矩阵A的迹,记为trA=
当
及
时
的
分位点表
二、检验
检验用的统计量是
当
不大且
时,
的上
分位点
销售方式3 X1 65 X2 33 X3 480 X4 260
2
3 4 5 6 7 8 9 10 11 12 13 14
119
63 65 130 69 46 146 87 110 107 130 80 60
正态总体中参数的假设检验
正态总体中参数的假设检验正态总体参数的假设检验是统计推断中的一种方法,用于判断总体参数是否符合我们的假设。
下面将详细介绍正态总体参数的假设检验原理和步骤。
一、假设检验原理正态总体参数的假设检验是通过收集样本数据,计算样本统计量来推断总体参数的方法,其中包括均值和标准差。
在进行正态总体参数的假设检验时,我们首先假设总体参数的值,并设立一个零假设和一个备择假设。
其中零假设(H0)是我们希望证伪的假设,备择假设(H1)是我们希望证明的假设。
然后,我们根据样本数据计算得到样本统计量,比如样本均值和样本标准差,并将其与假设中的总体参数进行比较。
通过计算假设检验统计量的值,我们可以判断是否拒绝零假设,即总体参数是否符合我们的假设。
二、假设检验步骤1.确定假设:我们首先需要确定我们要研究的总体参数是均值还是标准差,并设立零假设和备择假设。
通常情况下,零假设是总体参数等于一些特定值,备择假设可以是总体参数大于、小于或者不等于该特定值。
2.收集样本数据:我们需要从总体中取得一个样本,并记录相应的观测值。
3.计算样本统计量:根据样本数据,我们可以计算得到样本均值和样本标准差。
4.计算假设检验统计量:根据样本数据和零假设中的总体参数值,我们可以计算得到假设检验统计量的值,该值用于判断是否拒绝零假设。
5.设定显著性水平:我们需要设定一个显著性水平,通常为0.05或0.01、显著性水平表示拒绝零假设的程度,如果得到的结果小于显著性水平,则可以拒绝零假设。
6.判断拒绝或接受零假设:根据计算得到的假设检验统计量的值与临界值进行比较,如果假设检验统计量的值小于临界值,则拒绝零假设;如果假设检验统计量的值大于等于临界值,则接受零假设。
7.得出结论:根据拒绝或接受零假设的结果,我们可以得出总体参数是否符合我们的假设。
三、举例说明假设我们要研究厂生产的产品的重量是否符合标准,假设标准重量为500克。
我们收集了一个包含30个产品的样本,并计算得到样本的平均重量为495克,标准差为10克。
第十二讲 多元正态分布的参数估计与检验
1 2
由性质3知 Y 的每个分量 Yi服从标准正态分布,
2 且相互独立, 故 分布的定义知
Y TY ~ 2 ( p).
二、参数的估计
在此给出多元正态分布的参数 和 V 的估 计。 为简单计,仅考虑 V 0 的情形。
设 X 1 , X 2 ,, X n ( n p) 是来自多元正态总 体 N p ( ,V ) 的简单样本,令 1 n X Xk ——样本均值向量 n k 1
多元正态分布的性质: (1) p 维正态分布由其均值向量和协方差阵唯 一确定。 (2) 对于任一 p 维向量 及 p 阶非负定矩阵V , 必存在 p 维正态随机向量 X ~ N p ( ,V ) 。 (3) 设 X ~ N p ( ,V ),A 是 m p 常数矩阵, b 是 m 维向量, 若令Y AX b, 则 Y ~ N p ( A b, AVAT ).
2 1
( p)
(2) V 未知 检验统计量
n1n2 ( n1 n2 p 1) T ˆ 1 F (X Y ) V (X Y ) p( n1 n2 )( n1 n2 2)
ˆ 其中V
1 ( S1 S 2 ) 是协方差阵 V 的估 n1 n2 2
H 0:1 2,H1:1 2
根据协方差阵 V 已知和未知分两种情形:
(1) V 已知
检验统计量
可以证明当 H 0成立时, 即 1 2 时,
n1n2 T 1 D (X Y ) V (X Y ) n1 n2
而当 H 0不成立时, D有偏大的趋势。因此,对 给定的显著性水平 ,当
I 0 m I p m 0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
2
X X ~ (n, ), 其中
2
1
2
结论3 设X~Nn(0 ,σ2In), A为n阶对称方阵, rk(A)= r,则 二次型 X'AX/σ2~χ2(r) A2=A(A为对称幂等阵). 特例:当A=In时, X I n X / 2 X X / 2 ~ 2 (n)
一元统计中,参数μ ,σ 2的检验 涉及到一个总体、二个总体,乃至 多个总体的检验问题; 推广到p元统计分析中,类似地 对参数向量μ 和参数矩阵Σ 涉及 到的检验也有一个总体、二个总体 ,乃至多个总体的检验问题。
3
多元正态总体参数的假设检验
在一元统计中,用于检验μ, σ2的抽 样分布有χ2分布,t 分布,F分布等,它们都 是由来自总体N(μ, σ2)的样本导出的检验 统计量. 推广到多元统计分析后,也有相应于 以上三个常用分布的统计量: Wishart, Hotelling T 2,Wilks Λ统计 量,讨论这些统计量的分布是多元统计分 析所涉及的假设检验问题的基础.
27
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
rk(A)=r. 则(X-μ)′A(X-μ) ~χ2 (r) ΣAΣAΣ=ΣAΣ . 证明 因Σ>0,则rk(Σ)=p.因Σ为对 称阵,故存在正交阵Γ,使得
结论2 设X~Np(μ,Σ),Σ>0,A为对称阵,
(充分性的证明类似于结论3中充分性的证 明方法,必要性证明不要求)
13
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
结论5 二次型与线性函数的独立性: 设X~Nn(μ,σ2In), A为n阶对称阵, B为m×n阵,令ξ=X'AX,Z=BX(Z为m维 随机向量),若BA=O,则BX和X'AX相互独 立. 证明 设rk(A)=r>0 (当r=0时A=0, 结论显然成立),存在正交阵Γ使
证明
结论1 设X~Np(μ,Σ),Σ>0,则X'Σ-1 X~
因Σ>0,由正定阵的分解可得 Σ=C C′(C为非退化阵). 令Y=C -1X (即X=CY),则 Y~Np(C -1μ,C -1 Σ(C -1)′), 因Σ=CC′,所以Y~Np(C -1μ,Ip). 且 X′Σ-1X=Y ' C'Σ-1 CY=Y ' Y~χ2(p,δ), 其中δ=(C -1μ)′(C -1μ)=μ'Σ-1μ.
应用多元统计分析
多元正态总体 参数的假设检验(一)
1
多元正态总体参数的假设检验
目 录( 一 )
§3.1 几个重要统计量的分布
一、正态变量二次型的分布 二、威沙特分布 三、霍特林T2分布 四、威尔克斯统计量
§3.2 单总体均值向量的检验及置信域 §3.3 多总体均值向量的检验
2
多元正态总体参数的假设检验
Dr O ' Dr O H11 H12 ' ' AB B O O O O O H 21 H 22
22
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
χ2(p,δ),其中δ=μ'Σ-1 μ.
7
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量的二次型
结论4 设X~Nn(μ,σ2In), A为对称阵,且 rk(A)=r, 则二次型
1
2
X AX ~ (r , ), 其中
2
1
A2=A(A为对称幂等阵).
2
A.
作业1:证明充分性(习题3-1 )
21
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
③且
又因为 X' BX=Y 'Γ'BΓ Y= Y 'HY, 其中H=Γ‘BΓ 。④如果由AB=O,能够证明 X′BX可表示为Yr+1,…,Yn的函数,即H 只是右下子块H22为非O的矩阵。 则X′AX 与X′BX相互独立。
17
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
结论6 两个二次型相互独立的条件: 设X~Nn(μ,σ2In), A,B为n阶对称阵则 AB =O X'AX与X'BX相互独立. 作业2:证明必要性(习题3-2) 证明必要性的思路:记rk(A)=r. ①因A为n阶对称阵,存在正交阵Γ,使得 Γ'AΓ=diag(λ1,…,λr 0,..,0) ②令Y=Γ' X,则Y~Nn(Γ'μ,σ2In),
30
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
结论3 设X~Np(μ,Σ),Σ>0,A和B为p阶 注意:修改P55倒2行 对称阵,则 (X-μ)′A(X-μ)与(X-μ)′B(X-μ)独立
ΣAΣBΣ=Op×p.
ቤተ መጻሕፍቲ ባይዱ
(μ≠0),则称随机变量ξ=X'X为服从 n n个自由度,非中心参数 i2 的χ2分布,记为
2
i 1`
X X ~ (n, ), X X ~ ( )
2 n
6
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
则 Y Y
1/ 2
1/ 2
28
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
注意:修改P55
令
这里
29
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
由以上“1.结论3”的证明知
即
两边左右乘Σ1/2,即得
ΣAΣAΣ=ΣAΣ .
4
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
设Xi ~N1(μi ,σ2)(i =1,...…,n),且相互独立,记
结论1
一般情况(μi =0,σ2 ≠1时),
5
多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
结论2 当μi≠0(i=1,…,n),σ2 =1时,X′X的 分布常称为非中心χ2分布. 定义3.1.1 设n维随机向量X~Nn(μ,In)