应用多元统计分析 北大版 第三章

合集下载

多元统计分析第三章 假设检验与方差分析

多元统计分析第三章 假设检验与方差分析

第3章 多元正态总体的假设检验与方差分析从本章开始,我们开始转入多元统计方法和统计模型的学习。

统计学分析处理的对象是带有随机性的数据。

按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法。

由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。

所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。

统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。

统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。

参数估计问题回答诸如“未知参数θ的值有多大?”之类的问题,而假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。

本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断, 两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。

3.1一元正态总体情形的回顾一、 假设检验在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另一个作为备择假设(或称对立假设),分别记为0H 和1H 。

1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来自总体),(2σμN 的样本,我们要检验假设0100:,:μμμμ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有一个正确。

备择假设的意思是,一旦否定原假设0H ,我们就选择已准备的假设1H 。

当2σ已知时,用统计量nX z σμ-=在原假设0H 成立下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。

对于检验问题(3.1.1),我们制定这样一个检验规则(简称检验): 当αz z >时,拒绝0H ;当αz z ≤时,接受0H 。

北大应用多元统计分析课件第三章

北大应用多元统计分析课件第三章
聚类分析的分类
02
根据聚类过程中数据点之间的相似性度量方式,聚类分析可以分为基于距离的聚类和基于密度的聚类。
聚类分析的数学基础
03
聚类分析的数学基础主要包括距离度量、相似性度量和概率统计等。
通过聚类分析将市场划分为不同的细分市场,为企业的市场策略提供依据。
市场细分
根据客户的行为和属性特征,将客户划分为不同的群体,便于企业进行个性化营销和服务。
Y = β0 + β1X1 + β2X2 + ... + βpXp + ε,其中Y是因变量,X1, X2, ..., Xp是自变量,β0, β1, β2, ..., βp是模型的参数,ε是误差项。
多元线性回归模型的特点
它不仅可以处理多个自变量对因变量的影响,而且可以处理自变量之间的交互作用和多元共线性问题。此外,通过引入虚拟变量,多元线性回归模型还可以处理分类自变量和有序分类因变量的情况。
北大应用多元统计分析课件第三章
目录
多元线性回归模型主成分分析因子分析聚类分析
多元线性回归模型
多元线性回归模型
在统计学中,多元线性回归模型是一种用于探索和预测多个自变量与因变量之间关系的统计方法。它假设因变量和自变量之间存在一种线性关系,即因变量的变化可以由自变量的线性组合来解释。
多元线性回归模型的一般形式
最小二乘法:最小二乘法是一种常用的参数估计方法,它通过最小化预测值与实际值之间的残差平方和来估计模型的参数。这种方法基于一种假设,即误差项的均值为零,且误差项之间相互独立。
线性关系检验:在多元线性回归模型中,需要检验因变量与自变量之间是否存在线性关系。可以通过绘制散点图和残差图来直观判断是否存在非线性关系。如果存在非线性关系,可以考虑使用其他模型或对自变量进行变换来满足线性关系假设。

应用多元统计分析北大

应用多元统计分析北大
本课程要讨论的多元分析方法,它同时对多 门课程成绩进行分析。这样的分析对这些课程 之间的相互关系、相互依赖性等都能提供有用 的信息。
8
第9页/共86页
第一章 绪 论
§1.1 引言--多元分析的研究 对象和内容
由于大量实际问题都涉及到多个变量,这些 变量又是随机变化,如学生的学习成绩随着被 抽取学生的不同成绩也有变化(我们往往需要 依据它们来推断全年级的学习情况)。所以要 讨论多维随机向量的统计规律性。
两组变量的相关分析
1
第2页/共86页
使用的教材
普通高等教育”十一五”国家级教材
北京大学数学教学系列丛书
本科生 数学基础课教材
应用多元统计分析
(北京大学出版社,高惠璇,2006.10)
2
第3页/共86页
参考书(一)
1. 实用多元统计分析(方开泰,1989,见参考文献[1]) 2. 多元统计分析引论(张尧庭,方开泰, 2003,见[2]) 3. 实用多元统计分析(王学仁,1990 ,见[6]) 4. 应用多元分析(王学民,1999 ,见[8]) 5. 实用统计方法与SAS系统(高惠璇,2001, 见[3]) 6. 多元统计分析(于秀林,1999 ,见[9]) 7. 多元统计方法(周光亚,1988 ,见[28]) 8. 多元分析(英 . M . 肯德 尔,1983 ,见[15]) 9. SAS系统使用手册等资料(1994-1998 ,见[17]-[21])
主成分分析方法为样品排序或多指标系 统评估提供可行的方法.
23
第24页/共86页
教育学--
主成分分析在学生学习成绩排序中的应用
这里把12门课的成绩看成12个变量,这些 变量是相关的,有的相关性强些,有的相关 性一般些。用主成分分析方法从12个相关的 变量中可以综合得出几个互不相关的主成分 --它们是原始变量的线性组合。其中第一 主成分综合原始变量的信息最多(一般在70 %以上),我们就用第一主成分(即单个综 合指标)替代原来的12个变量;然后计算第 一主成分的得分并进行排序。

多元统计分析1-3章剖析

多元统计分析1-3章剖析

第一章绪论§1.1 什么是多元统计分析在工业、农业、医学、气象、环境以及经济、管理等诸多领域中,常常需要同时观测多个指标。

例如,要衡量一个地区的经济发展,需要观测的指标有:总产值、利润、效益、劳动生产率、万元生产值能耗、固定资产、流动资金周转率、物价、信贷、税收等等;要了解一种岩石,需观测或化验的指标也很多,如:颜色、硬度、含碳量、含硫量等等;要了解一个国家经济发展的类型也需观测很多指标,如:人均国民收入,人均工农业产值、人均消费水平等等。

在医学诊断中,要判断某人是有病还是无病,也需要做多项指标的体检,如:血压、心脏脉搏跳动的次数、白血球、体温等等。

总之,在科研、生产和日常生活中,受多种指标共同作用和影响的现象是大量存在的,举不胜举。

上述指标,在数学上通常称为变量,由于每次观测的指标值是不能预先确定的,因此每个指标可用随机变量来表示。

如何同时对多个随机变量的观测数据进行有效的统计分析和研究呢?一种做法是把多个随机变量分开分析,一次处理一个去分析研究;另一种做法是同时进行分析研究。

显然前者做法有时是有效的,但一般来说,由于变量多,避免不了变量之间有相关性,如果分开处理不仅会丢失很多信息,往往也不容易取得好的研究结果。

而后一种做法通常可以用多元统计分析方法来解决,通过对多个随机变量观测数据的分析,来研究变量之间的相互关系以及揭示这些变量内在的变化规律,如果说一元统计分析是研究一个随机变量统计规律的学科,那么多元统计分析则是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科,同时,利用多元分析中不同的方法还可以对研究对象进行分类(如指标分类或样品分类)和简化(如把相互依赖的变量变成独立的或降低复杂集合的维数等等)。

在当前科技和经济迅速发展的今天,在国民经济许多领域中特别对社会经济现象的分析,只停留在定性分析上往往是不够的。

为提高科学性、可靠性,通常需要定性与定量分析相结合。

实践证明,多元分析是实现做定量分析的有效工具。

多元统计分析第三章课件

多元统计分析第三章课件

( X 0 ) t n S
2 n ( X ) 2 1 t2 n ( X ) ( S ) ( X ) 2 S 对于多元变量而言,可以将 t 分布推广为下面将要介绍的 2 Hotelling T 分布。
定义
设 X ~ N p (μ , Σ , ) S ~ Wp ( n, Σ 且 ) X 与S
2 -1
相互独立,n p , 则称统计量 T nX S X 的分布 为非中心 HotellingT2 分布,记为 T 2 ~ T 2 ( p, n, μ) 。 当 μ 0 时,称 T 服从(中心) Hotelling T 分布。
2 2
记为 T 2 ( p, n) 。 由于这一统计量的分布首先由 Harold Hotelling 提出 来的,故称为 Hotelling T 分布,值得指出的是,我 国著名统计学家许宝禄先生在 1938 年用不同方法也
n ai μ ai X T aiSai
n 1

当k很小时,联合T2置信区间 aix T aiSai n ai μ ai X T aiSai
n , i 1, 2,, k
的置信度一般会明显地大于1−α,因而上述区间会显得过宽, 即精确度明显偏低。这时,考虑采用庞弗伦尼(Bonferroni) 联合置信区间(p177):
第三章 多元正态总体的统计推断
§3.1 引言 §3.2 单个总体均值的推断
§3.3 单个总体均值分量间结构关系的检验
§3.4 两个总体均值的比较推断 §3.5 两个总体均值分量间结构关系的检验 §3.6 多个总体均值的比较检验(多元方差分析) §3.7 协方差阵的检验
§3.1 引言
在单一变量的统计分析中,已经给出了正态总体N ( , 2) 的均值和方差2的各种检验。对于多变量

多元统计分析第三章课件

多元统计分析第三章课件

查表得F0.01(3,3)=29.5,于是
T 2 0.01
35 3
F0.01
3, 3
147.5
故在显著性水平α=0.01下,拒绝原假设H0,即认为农村
与城市的2周岁男婴上述三个指标的均值有显著差异
(p=0.002)。
三、置信区域
T 2 n X μ S1 X μ
Q
n p
p n 1
称之为霍特林(Hotelling)T2 统计量。
当 H0 为真时,
n p
p n 1
T
2
服从F(p,n−p)
,对给定的显著
性水平α,拒绝规则为:
若T 2 T2,则拒绝H0.
其中T2
pn 1
n p
F
p,
n
p 。
这里需要解释的是,当 Σ 未知时,自然想到要用样本协差阵 1 S 取代 n 1
替 Σ ,因 (n 1)S1 是 Σ1 的无偏估计量,而样本离差阵
这里我们应该注意到,(3.3)式可以表示为
t2
n(X )2
S2
n( X
)(S 2 )1( X
)
对于多元变量而言,可以将 t 分布推广为下面将要介绍的
HotellingT 2 分布。
定义 设 X ~ N p (μ ,Σ ,) S ~ Wp (n ,Σ 且) X 与 S 相互独立,n p ,则称统计量T 2 nX S - X1 的分布
当 2 未知时,用
S 2
1 n 1
n i 1
(Xi
X )2
作为 2 的估计量,用统计量:
t (X 0) n
S
来做检验。当假设成立时,统计量 t 服从自由度为 n 1的 t 分布,

多元统计分析第三章聚类分析

多元统计分析第三章聚类分析

类平均法
类平均法的特点是定义两类之间的距 离平方为这两类元素两两之间距离的 平方的平均。其聚类方法和过程与前 两种方法相同。
离差平方和法
该方法的基本思想来自方差分析。即如 果分类正确,则同类样品的离差平方和 应当较小,而类间的离差平方和应当较 大。具体做法是:先令每个样品各自成 一类,然后每次缩小一类,计算所有可 能合并结果带来的离差平方和S,选择使 S增加最小的两类首先合并,依次类推。
设空间中的两点
P (x 1 ,x 2 , ,x p )',Q (y 1 ,y 2 , ,y p )'
s11,s22, ,spp
表示p个变量n次观测的样本方差,则定义 P到Q 的统计距离为:
d (P ,Q ) (x 1y 1 )2 s 1 1
(x 2y 2 )2 s2 2
(x py p )2 sp p
所有样品之间的样品相关系数矩阵记为:
Cij (2) ,定义为:
r11 r12
r1 p
Cij (2) (rij )
r21 r22
r2 p
rn1 rn2
rnp
Q型聚类 R型聚类
计算公式p :
xi x j
cosij
1 p
p
xi2
x
2 j
1 1 n
x i x j
cosij
1 n
n
j 个指标
1 ,2 , p )为第
i
一、相似系数:
这是大家最熟悉的统计量,它是将数据标准化后的夹
角的余弦。
常用 rij 表示。
p
(xik X i )(x jk X j )
rij
k1 p
p
1
( (xik X i )2 (x jk X j )2 ) 2

应用多元统计分析课后习题答案详解北大高惠璇(第三章部分习题解答).ppt

应用多元统计分析课后习题答案详解北大高惠璇(第三章部分习题解答).ppt

def
2 ln n( X 0 )01( X 0 )

X
H 0下
~
N
p (0,
1 n
0 ),
H 0下
n( X 0 ) ~ N p (0, 0 )
所以由§3“一﹑2.的结论1”可知
2 ln ~ 2 ( p).
20
第三章 多元正态总体参数的检验
3-6 (均值向量各分量间结构关系的检验) 设总体
若r=0时,则A=0,则两个二次型也是独 立的.
以下设0<r<n.因A为n阶对称阵,存在正 交阵Γ,使得
7
第三章 多元正态总体参数的检验
其中λi≠0为A的特征值(i=1,…,r).于是

r
由AB=O可得DrH11=O , DrH12=O . 因Dr为满秩阵,故有H11=Or×r,H12=Or×(n-r) .
由定义314可知15性质5在非退化的线性变换下t分别表示正态总体x的样本均值向量和离差阵则由性质1有1735对单个p维正态总体n均值向量的检验问题试用似然比原理导出检验h已知的似然比统计量及分布
第三章习题解答
第三章 多元正态总体参数的假设检验
3-1 设X~Nn(μ,σ2In), A为对称幂等 阵,且rk(A)=r(r≤n),证明
~
N pr
(0, 22 ),

X
n p
xij
X (1) | X (2) , nr n( pr)

W
X X
X (1)X (1) X (2)X (1)
X X
(1) X (2) X
(2) (2)
WW1211
W12 W22
,

W11 X (1)X (1), W22 X (2)X (2)

应用多元统计分析SAS作业第三章

应用多元统计分析SAS作业第三章

3-8 假定人体尺寸有这样的一般规律,身高 (X1),胸围 (X2)和上半臂围 (X3)的平均尺寸比例是6:4:1,假设 X 1, , n 为来自总体 X = X1 , X 2 , X 3的随机样本,并设 X ~N , 。

试利用表 3.4 中男婴这一数据来检验其身高、胸围和上半臂围这三个尺寸变量是否符合这一规律(写出假设H0,并导出检验统计量)。

性别表 3.4某地区农村两周岁婴儿的体格测量数据身高 (X1)胸围 2 上半臂围3(X ) (X )男78 60.616.5男76 58.112.5男92 63.214.5男81 59.014.0男81 60.815.5男84 59.514.0女80 58.414.0女75 59.215.0女78 60.315.0女75 57.413.0女79 59.514.0女78 58.114.5女75 58.012.5女64 55.511.0女80 59.212.5解:设Y CX, X ~ N3( , ),Y ~ N2 (C ,C C)。

1 0 61, 2,1, 2,3分别为 X1, X 2, X3的样本均值。

则检验其中 C1 43三个变量是否符合规律的假设为H0 :C O2,H1:C O2。

检验统计量为F n 1 (p1) 1T 2 ~F ( p1,n p 1)(p 3, n 6) ,(n 1)(p 1)由样本值计算得:X =(82,60.2,14.5) ,及15840.2 2.5A= 40.215.86 6.55,2.5 6.559.5T 2n(n 1)(CX ) (CAC )-1 (CX )=47.1434,Fn 1 ( p 1) 1T 2= 2 T 2 18.8574 ,(n 1)( p 1)5对给定显著性水平=0.05 ,利用软件 SAS9.3 进行检验时,首先计算 p 值:p=P{ F ≥ 18.8574}=0.0091948。

因为 p 值=0.0091948<0.05,故否定 H 0 ,即认为这组男婴数据与人类的一般规律不一致。

第三章 多元回归分析 《应用多元统计分析》 ppt课件

第三章 多元回归分析 《应用多元统计分析》 ppt课件

n
n
ei2
yi b0 b1xi1 b2 xi2
2
bp xip
i 1
i 1
达到最小。解形如下式的正规方程:
yi (b0 b1xi1 b2 xi 2
bp xip )
0
xi1 yi (b0 b1xi1 b2 xi 2
bp xip ) 0
xip yi (b0 b1xi1 b2 xi 2
二、逐步回归分析
每步都要进行显著 性检验,以便保证 每次引入变量前回 归方程中只包括显 著性变量。这个过 不能 程反复进行,直到 既无不显著变量从 回归方程中剔除, 又无显著变量需要 选入回归方程时为 止。
开始
能否引入 不在方程中的变量

引入变量
能否剔除 已在方程中的变量

引入变量
不能
筛选结束
二、逐步回归分析
可以进一步证明最小二乘法估计量 b 服从正态分布,

b ~ Np1[β, 2(XX)1]
此时,最小二乘估计是一切无偏估计中方差最小的估计。
特别地,有 bj N[ j , 2 cjj ] ( j 0,1, , p ),其中,cjj 表
示矩阵 (XX)1 中第 j 行第 j 列的元素。
二、模型检验
通常来说,模型的设定只是基于定性分析作出的 假设。这种假设是否符合实际,能否得到样本数据 的支持,还需要在求出线性回归方程后,对回归方 程进行显著性检验。多元线性回归方程的显著性检 验与一元线性回归方程的显著性检验思想是一致的, 但也有不同之处。这里我们介绍两种方法,一是回 归方程整体显著性的 检验F ,另一个是回归系数显
从回归模型的简洁性上看,回归方程中包含自变量个数 越小越好。

应用多元统计2013

应用多元统计2013
矩阵形式:y X 0 1 x11 x1, p y1 1 1 x x y 21 2, p 1 其中y 2 , , X , 2 1 xn1 xn , p p yn n 满足E ( ) 0, D( ) 2 I nn
应用统计分析
§3.1 多元线性回归模型
Y 0 1 X1 p X p , E( ) 0,Var( ) 2
式中0 , 1 , , p为未知参数, 为随机误差项, X 1, ,X p是普通变量,这里称为自变量,Y 是因变量。
应用统计分析
对( X 1 , , X p , Y )进行观察,得到n组样本观测值 ( xi1 , , xip , yi ), i 1, , n, 则有 y1 0 1 x11 p x1 p 1 y2 0 1 x21 p x2 p 2 y x x 0 1 n1 p np n n
年龄 3岁 4岁 5岁 6岁 7岁 8岁
92.5
97.0 96.0 96.5 身 高 97.0 92.0 96.5
96.5
101.0 105.5 102.0 105.0 99.5 102.0
106.0
104.0 107.0 109.5 111.0 107.5 107.0
115.5
115.5 111.5 110.0 114.5 112.5 116.5
•若某公司管理人员要预测来年该公司的销售额y时, 研究认为影响销售额的因素不只是广告宣传费x1,还 有可支配收入x2,价格x3,研究与发展费用x4,各种投 资x5,销售费用x6.

北大应用多元统计分析课件第三章

北大应用多元统计分析课件第三章

在进行相关分析时,我们需要满足一些基本 假设,以确保结果的有效性和可靠性。
相关系数的含义及意义
1 相关系数的数值范围和方向
相关系数的范围在-1和1之间,负值表示负相关,正值表示正相关,接近0表示无相关。
2 相关系数的含义与意义
相关系数反映了变量之间的关系紧密程度,可以帮助我们预测和解释变量之间的相互作 用。
解释Pearson相关系数的值可以帮助我们理解变量之间的线性相关性,并应用于预测和决 策。
Spearman等级相关系数的计算与检验
1 Spearman等级相关系数的数值计算
计算Spearman等级相关系数需要将变量转化为等级形式,通过计算排位差异来获得相关 性。
2 Spearman等级相关系数的显著性检验
相关分析的概念与基本原理
1 相关分析的定义
相关分析是一种统计技术,用于研究变量之 间的关系。它可以帮助我们理解变量之间的 相关性。
2 相关分析的分类
相关分析可分为线性相关和非线性相关两种 类型,具体取决于变量之间的关系形式。
3 相关系数的定义与意义
4 相关分析的基本假设
相关系数衡量了变量之间的相关性强度和方 向,可以帮助我们理解变量之间的关系程度。
A. Johnson and Dean W. Wichern.
2 相关分析的注意事项
在进行相关分析时,我们需要考虑样本大小、数据类型、线性关系等因素,并避免过度 解读相关性。
3 相关分析与因果关系的区别
相关分析只能揭示变量之间的相关性,而不能确定因果关系。因果关系需要更多的实验 证据。
参考资料
• 应用多元统计分析(北京大学)课件 • Applied Multivariate Statistical Analysis (6th Edition) by Richard

多元统计分析第三章

多元统计分析第三章

判别分析的应用实例
1
判别分析在市场细分中应用广泛,可以根据消费 者的购买行为、偏好等因素将市场划分为不同判别分析可用于信用评估、风险评 估等,根据借款人的财务状况、信用记录等因素 判断其信用风险。
3
在医学领域,判别分析可用于疾病诊断和治疗方 案选择,根据患者的症状、体征、检查结果等因 素进行分类和预测。
06 判别分析
CHAPTER
判别分析的基本原理
判别分析是一种多元统计分析方法,用于根 据已知分类的观测数据来建立一个或多个判 别函数,从而对新的观测数据进行分类。
判别分析广泛应用于经济、金融、医 学、生物等领域的数据分类问题。
它基于概率理论,通过寻找一个或多个函数 ,使得不同类别的观测数据尽可能地分开, 同时使同一类别的观测数据尽可能地接近。
支持决策制定
通过多元统计分析,我们可以对数据进行深入挖掘,为决 策提供有力支持,帮助我们做出更好的决策。
多元统计分析的应用领域
市场营销
在市场营销中,多元统计分析常用于市场细分、顾客行为 分析、产品关联分析等方面,帮助企业更好地了解客户需 求和市场趋势。
生物医学
在生物医学领域,多元统计分析用于基因关联研究、疾病 诊断和预测、药物研发等方面,有助于提高医疗水平和治 疗效果。
03 主成分分析
CHAPTER
主成分分析的基本原理
01
降维思想
通过线性变换将多个相关变量转 化为少数几个不相关的变量,即 主成分,以简化数据结构。
02
03
方差最大化
线性变换
主成分的确定基于各变量的方差, 最大化总体方差,使变换后的新 变量更具代表性。
主成分分析通过线性变换将原始 变量转换为新变量,新变量之间 互不相关。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


1 / 2
1 / 2
28
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
注意:修改P55

这里
29
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
由以上“1.结论3”的证明知

两边左右乘Σ1/2,即得
一元统计中,参数μ ,σ 2的检验 涉及到一个总体、二个总体,乃至 多个总体的检验问题; 推广到p元统计分析中,类似地 对参数向量μ 和参数矩阵Σ 涉及 到的检验也有一个总体、二个总体 ,
3
第三章 多元正态总体参数的假设检验
在一元统计中,用于检验μ, σ2的抽 样分布有χ2分布,t 分布,F分布等,它们都 是由来自总体N(μ, σ2)的样本导出的检验 统计量. 推广到多元统计分析后,也有相应于 以上三个常用分布的统计量: Wishart, Hotelling T 2,Wilks Λ统计 量,讨论这些统计量的分布是多元统计分 析所涉及的假设检验问题的基础.
ΣAΣAΣ=ΣAΣ .
30
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
27
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
rk(A)=r. 则(X-μ)′A(X-μ) ~χ2 (r) ΣAΣAΣ=ΣAΣ . 证明 因Σ>0,则rk(Σ)=p.因Σ为对 称阵,故存在正交阵Γ,使得
结论2 设X~Np(μ,Σ),Σ>0,A为对称阵,
作业1:证明充分性(习题3-1 )

(充分性的证明类似于结论3中充分性的证 明方法,必要性证明不要求)
13
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
结论5 二次型与线性函数的独立性: 设X~Nn(μ,σ2In), A为n阶对称阵, B为m×n阵,令ξ=X'AX,Z=BX(Z为m维 随机向量),若BA=O,则BX和X'AX相互独 立. 证明 设rk(A)=r>0 (当r=0时A=0, 结论显然成立),存在正交阵Γ使
应用多元统计分析
第三章 多元正态总体
参数的假设检验(一)
1
第三章 多元正态总体参数的假设检验
目 录 (一 )
§3.1 几个重要统计量的分布
一、正态变量二次型的分布 二、威沙特分布 三、霍特林T2分布
§3.2 单总体均值向量的检验及置信域 §3.3 多总体均值向量的检验
2
第三章 多元正态总体参数的假设检验
χ2(p,δ),其中δ=μ'Σ-1 μ.
证明
结论1 设X~Np(μ,Σ),Σ>0,则X'Σ-1 X~
因Σ>0,由正定阵的分解可得 Σ=C C′(C为非退化阵). 令Y=C -1X (即X=CY),则 Y~Np(C -1μ,C -1 Σ(C -1)′), 因Σ=CC′,所以Y~Np(C -1μ,Ip). 且 X′Σ-1X=Y ' C'Σ-1 CY=Y ' Y~χ2(p,δ), 其中δ=(C -1μ)′(C -1μ)=μ'Σ-1μ.
7
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量的二次型
结论4 设X~Nn(μ,σ2In), A为对称阵,且 rk(A)=r, 则二次型

1 1 2 X AX ~ ( r , ), 其中 A . 2 2
A2=A(A为对称幂等阵).
21
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
③且
又因为 X' BX=Y 'Γ'BΓ Y= Y 'HY, 其中H=Γ‘BΓ 。④如果由AB=O,能够证明 X′BX可表示为Yr+1,…,Yn的函数,即H 只是右下子块H22为非O的矩阵。 则X′AX 与X′BX相互独立。
结论2 当μi≠0(i=1,…,n),σ2 =1时,X′X的 分布常称为非中心χ2分布. 定义3.1.1 设n维随机向量X~Nn(μ,In)
(μ≠0),则称随机变量ξ=X'X为服从 n n个自由度,非中心参数 i2 i 1` 2 的χ 分布,记为
2 2 n
X X ~ ( n , ), X X ~ ( )
H H D D ' ' ' 11 1 2 rO rO AB B O H H O O O O 21 2 2
22
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布ຫໍສະໝຸດ -一般p维正态变量的二次型17
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
结论6 两个二次型相互独立的条件: 设X~Nn(μ,σ2In), A,B为n阶对称阵则 AB =O X'AX与X'BX相互独立. 作业2:证明必要性(习题3-2) 证明必要性的思路:记rk(A)=r. ①因A为n阶对称阵,存在正交阵Γ,使得 Γ'AΓ=diag(λ1,…,λr 0,..,0) ②令Y=Γ' X,则Y~Nn(Γ'μ,σ2In),
6
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
1 1 2 则Y Y X X ~ ( n , ), 其中 2 2


结论3 设X~Nn(0 ,σ2In), A为n阶对称方阵, rk(A)= r,则 二次型 X'AX/σ2~χ2(r) A2=A(A为对称幂等阵). 2 2 2 特例:当A=In时, X I X / X X / ~ ( n ) n
4
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
设Xi ~N1(μi ,σ2)(i =1,...…,n),且相互独立,记
结论1
一般情况(μi =0,σ2 ≠1时),
5
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
相关文档
最新文档