应用多元统计第三章汇总

合集下载

《多元统计分析》第三章 判别分析

《多元统计分析》第三章  判别分析
8
v (3) 交叉验证法(或称刀切法)
Ø 从组π1中取出x1j,用该组的其余n1−1个观测值和组π2的n2个观测值构造 判别函数,然后对x1j进行判别,j=1,2,⋯ ,n1。同样,从组π2中取出x2j, 用这一组的其余n2−1个观测值和组π1的n1个观测值构造判别函数,再对 x2j作出判别,j=1,2,⋯ ,n2。
v (1) 回代法
Ø 令n(2|1)——样本中来自π1而误判为π2的个数,n(1|2)——样本中来自π2
而误判为π1的个数,则P(2|1) 和P(1|2) 可估计为

2
| 1

n
2
| 1
,
Pˆ 1 | 2 n 1 | 2
n1
n2
Ø 该方法简单、直观,且易于计算。但它给出的估计值通常偏低,当样
xΣ 1x 2 Iix ci
其中 Ii

Σ 1 μi , ci


1 2
μiΣ 1 μi ,i
1, 2,, k,判别规则简化为
x l,
若Ilx

cl

max
1 i k
Iix

ci

这里Ii′x+ci为线性判别函数。
x l,
若d
2
x,
l


v 当Σ1=Σ2=⋯ =Σk=Σ时,采用线性判 别函数。
v 当Σ1,Σ2,⋯ ,Σk不全相等时,采用二 次判别函数
v 实践中,Σ1,Σ2,⋯ ,Σk几乎不可能完 全相等。
x l ,
若Iˆlx

cˆl

max
1 i k
Iˆix cˆi
Iˆi

北大应用多元统计分析课件第三章

北大应用多元统计分析课件第三章
聚类分析的分类
02
根据聚类过程中数据点之间的相似性度量方式,聚类分析可以分为基于距离的聚类和基于密度的聚类。
聚类分析的数学基础
03
聚类分析的数学基础主要包括距离度量、相似性度量和概率统计等。
通过聚类分析将市场划分为不同的细分市场,为企业的市场策略提供依据。
市场细分
根据客户的行为和属性特征,将客户划分为不同的群体,便于企业进行个性化营销和服务。
Y = β0 + β1X1 + β2X2 + ... + βpXp + ε,其中Y是因变量,X1, X2, ..., Xp是自变量,β0, β1, β2, ..., βp是模型的参数,ε是误差项。
多元线性回归模型的特点
它不仅可以处理多个自变量对因变量的影响,而且可以处理自变量之间的交互作用和多元共线性问题。此外,通过引入虚拟变量,多元线性回归模型还可以处理分类自变量和有序分类因变量的情况。
北大应用多元统计分析课件第三章
目录
多元线性回归模型主成分分析因子分析聚类分析
多元线性回归模型
多元线性回归模型
在统计学中,多元线性回归模型是一种用于探索和预测多个自变量与因变量之间关系的统计方法。它假设因变量和自变量之间存在一种线性关系,即因变量的变化可以由自变量的线性组合来解释。
多元线性回归模型的一般形式
最小二乘法:最小二乘法是一种常用的参数估计方法,它通过最小化预测值与实际值之间的残差平方和来估计模型的参数。这种方法基于一种假设,即误差项的均值为零,且误差项之间相互独立。
线性关系检验:在多元线性回归模型中,需要检验因变量与自变量之间是否存在线性关系。可以通过绘制散点图和残差图来直观判断是否存在非线性关系。如果存在非线性关系,可以考虑使用其他模型或对自变量进行变换来满足线性关系假设。

多元统计分析-第三章 多元正态分布

多元统计分析-第三章  多元正态分布

第三章 多元正态分布多元正态分布是一元正态分布在多元情形下的直接推广,一元正态分布在统计学理论和应用方面有着十分重要的地位,同样,多元正态分布在多元统计学中也占有相当重要的地位。

多元分析中的许多理论都是建立在多元正态分布基础上的,要学好多元统计分析,首先要熟悉多元正态分布及其性质。

第一节 一元统计分析中的有关概念多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,学习多元统计分析,首先要对随机向量和随机矩阵有所把握,为了学习的方便,先对一元统计分析中的有关概念和性质加以复习,并在此基础上推广给出多元统计分析中相应的概念和性质。

一、随机变量及概率分布函数 (一)随机变量随机变量是随机事件的数量表现,可用X 、Y 等表示。

随机变量X 有两个特点:一是取值的随机性,即事先不能够确定X 取哪个数值;二是取值的统计规律性,即完全可以确定X 取某个值或X 在某个区间取值的概率。

(二)随机变量的概率分布函数随机变量X 的概率分布函数,简称为分布函数,其定义为:)()(x X P x F ≤=随机变量有离散型随机变量和连续型随机变量,相对应的概率分布就有离散型概率分布和连续型概率分布。

1、离散型随机变量的概率分布若随机变量X 在有限个或可列个值上取值,则称X 为离散型随机变量。

设X 为离散型随机变量,可能取值为1x ,2x ,…,取这些值的概率分别为1p ,2p ,…,记为k k p x X P ==)((Λ,2,1=k )称k k p x XP ==)((Λ,2,1=k )为离散型随机变量X 的概率分布。

离散型随机变量的概率分布具有两个性质: (1)0≥k p ,Λ,2,1=k(2)11=∑∞=k k p2、连续型随机变量的概率分布若随机变量X 的分布函数可以表示为dt t f x F x⎰∞-=)()(对一切R x ∈都成立,则称X 为连续型随机变量,称)(x f 为X 的概率分布密度函数,简称为概率密度或密度函数。

多元统计分析第三章课件

多元统计分析第三章课件

查表得F0.01(3,3)=29.5,于是
T 2 0.01
35 3
F0.01
3, 3
147.5
故在显著性水平α=0.01下,拒绝原假设H0,即认为农村
与城市的2周岁男婴上述三个指标的均值有显著差异
(p=0.002)。
三、置信区域
T 2 n X μ S1 X μ
Q
n p
p n 1
称之为霍特林(Hotelling)T2 统计量。
当 H0 为真时,
n p
p n 1
T
2
服从F(p,n−p)
,对给定的显著
性水平α,拒绝规则为:
若T 2 T2,则拒绝H0.
其中T2
pn 1
n p
F
p,
n
p 。
这里需要解释的是,当 Σ 未知时,自然想到要用样本协差阵 1 S 取代 n 1
替 Σ ,因 (n 1)S1 是 Σ1 的无偏估计量,而样本离差阵
这里我们应该注意到,(3.3)式可以表示为
t2
n(X )2
S2
n( X
)(S 2 )1( X
)
对于多元变量而言,可以将 t 分布推广为下面将要介绍的
HotellingT 2 分布。
定义 设 X ~ N p (μ ,Σ ,) S ~ Wp (n ,Σ 且) X 与 S 相互独立,n p ,则称统计量T 2 nX S - X1 的分布
当 2 未知时,用
S 2
1 n 1
n i 1
(Xi
X )2
作为 2 的估计量,用统计量:
t (X 0) n
S
来做检验。当假设成立时,统计量 t 服从自由度为 n 1的 t 分布,

应用多元统计分析课后习题答案详解北大高惠璇第三章部分习题解答

应用多元统计分析课后习题答案详解北大高惠璇第三章部分习题解答
2 XNn μσ 2InAArr ≤因nA 为对称幂等阵而对称幂等阵的特征 值非 0 即 1 且只有 r 个非 0 特征值即存在正交阵 Γ其列向量 ri 为相应特征向量使 3 4 其中非中心参数为 5 Xn μσ 2In ABnABX′ AXX′ BX Ar An ΓΓ A Γλ 1…λ r Y Γ′ XYNnΓμσ 2In riiiYA ΓΓΓ YAΓΓΓ YAXX126 XBXYΓ BΓ YYHY H Γ BΓ XBX Yr1 … YnH0 XAX XBX 7 ArrnABOBOn× nX′ AXX′ BXrArn.An Γ 8 λ iAi 由…Ar Br O 可得 DrH11O DrH12O . 因 Dr 为满秩阵故有 H11Or×rH12Or ×n-r . 由于 H 为对称阵所以 H21On-r×r .于是 9 Y1…Yr Yr1 … YnX′ AXX′ BX令 YΓ′X则 Y n Γ′μσ且2In riiiYA ΓΓΓ YAΓΓΓ YAXX12nrnrYYHYYHYYBΓΓΓ YBXX122 1BΓΓ H10设 XNpμ∑∑ 0A和 B 为 p 阶对称阵试证明 X- μ′ A- μX与 X- μ′ B-μX相互独立 ∑ A∑ B∑ 0p× p.-33 记 1212111 ”ξη OBAOBAOCD21212121性12质 4 分块 Wishart 矩阵的分布 :设 Xα Np0∑ α1…相n互独立其中 又已知随机矩 阵 rpr22211211W222112111nrprWWWWXXWpn 试证明 Wishart 分布的性质 4 和 T2 分布的性质 5. 3-4 13 证明 : 设 21rpnrnijpnXXxX00 则 22211121rprNXNXrprXXX 记 则 2212211122211211WWWWXXXXXXXXXXW22112211XX WXXW 即 14 .221222222nrpnWXXXXW ∑ 12 O α 12… n相 互 独立 .故有 W11 与 W22 相互独立 . 21 与 XX111111111nrnWXXXXW 由定义 3.1.4 可知 15 性质 5 在

多元统计分析(何晓群 中国人民大学) 第三章

多元统计分析(何晓群 中国人民大学)  第三章
• 为此最常用的技巧是聚类分析,聚类分析将个体或对 象分类,使得同一类中的对象之间的相似性比与其他 类的对象的相似性更强。目的在于使类间对象的同质 性最大化和类与类间对象的异质性最大化。本章将介 绍聚类分析的性质和目的,并且引导研究者使用各种 聚类分析方法。
2021/1/28
中国人民大学六西格玛质量管理研究中心
2021/1/28
中国人民大学六西格玛质量管理研究中心
23
目录 上页 下页 返回 结束
§3.2 相似性度量
2021/1/28
中国人民大学六西格玛质量管理研究中心
24
目录 上页 下页 返回 结束
§3.2 相似性度量
(2) 相关系数。这是大家最熟悉的统计量,它 是将数据标准化后的夹角余弦。
有时指标之间也可用距离来描述它们的接近程度。 实际上距离和相似系数之间可以互相转化,
• 与多元分析的其他方法相比,聚类分析的方法是 很粗糙的,理论上还不完善,但由于它能解决许 多实际问题,很受人们的重视,和回归分析、判 别分析一起被称为多元分析的三大方法。
2021/1/28
中国人民大学六西格玛质量管理研究中心
7
目录 上页 下页 返回 结束
§3.1 聚类分析的思想
• 3.1.2 聚类的目的
(2)一种改进的距离就是在前面曾讨论过 的马氏距离,它对一切线性变换是不变 的,不受指标量纲的影响。它对指标的 相关性也作了考虑,我们仅用一个例子 来说明。
2021/1/28
中国人民大学六西格玛质量管理研究中心
16
目录 上页 下页 返回 结束
§3.2 相似性度量
2021/1/28
中国人民大学六西格玛质量管理研究中心
2021/1/28

第三章 多元回归分析 《应用多元统计分析》 ppt课件

第三章 多元回归分析 《应用多元统计分析》 ppt课件

n
n
ei2
yi b0 b1xi1 b2 xi2
2
bp xip
i 1
i 1
达到最小。解形如下式的正规方程:
yi (b0 b1xi1 b2 xi 2
bp xip )
0
xi1 yi (b0 b1xi1 b2 xi 2
bp xip ) 0
xip yi (b0 b1xi1 b2 xi 2
二、逐步回归分析
每步都要进行显著 性检验,以便保证 每次引入变量前回 归方程中只包括显 著性变量。这个过 不能 程反复进行,直到 既无不显著变量从 回归方程中剔除, 又无显著变量需要 选入回归方程时为 止。
开始
能否引入 不在方程中的变量

引入变量
能否剔除 已在方程中的变量

引入变量
不能
筛选结束
二、逐步回归分析
可以进一步证明最小二乘法估计量 b 服从正态分布,

b ~ Np1[β, 2(XX)1]
此时,最小二乘估计是一切无偏估计中方差最小的估计。
特别地,有 bj N[ j , 2 cjj ] ( j 0,1, , p ),其中,cjj 表
示矩阵 (XX)1 中第 j 行第 j 列的元素。
二、模型检验
通常来说,模型的设定只是基于定性分析作出的 假设。这种假设是否符合实际,能否得到样本数据 的支持,还需要在求出线性回归方程后,对回归方 程进行显著性检验。多元线性回归方程的显著性检 验与一元线性回归方程的显著性检验思想是一致的, 但也有不同之处。这里我们介绍两种方法,一是回 归方程整体显著性的 检验F ,另一个是回归系数显
从回归模型的简洁性上看,回归方程中包含自变量个数 越小越好。

多元统计 第三章

多元统计 第三章

必要性证明不要求
证明: 只证充分性 不妨设 rank(A) = r &g以存在正交阵Γ 使
⎡ Dr A=Γ ⎢ ⎣O O⎤ Γ′, ⎥ O⎦ ⎡λ1 Dr = ⎢ ⎢ ⎢ ⎣0 O 0⎤ ⎥ ⎥ λr ⎥ ⎦
其中λ1 , … , λr 是A的非零特征值.
ξ = X ′X = ∑ X i2 ~ χ 2 ( n)
n
当μ i = 0 ( i= 1, … , n ), σ 2 ≠ 1 时, 则
1
i =1
σ2
X ′X =
1
σ2
2 2 X ~ χ ( n) ∑ i i =1
n
结论 2
当μ i ≠ 0 ( i= 1, … , n )时, X′X 的分布 常称为非中心的χ2分布.
i =1
n
2 i
.
结论 3
设X ~Nn (0n , σ2In ) , A=A′, 且 rank(A) = r , 则 证明: 二次型X′AX /σ2 ~ χ2(r) ⇔ A2 = A
⇒ 必要性:
因为A=A′ , 所以存在正交阵Γ 使
Γ ′AΓ = diag(λ1 , … , λr ,0 , … , 0 )
一、正态变量二次型的分布
1. 分量独立的n 维随机向量X的二次型 设 Xi ~N(μ i , σ 2) ( i= 1, … , n ), 且相互独立, 记 X = ( X1 , … , Xn )′ 则X ~Nn (μ , σ2In ) , 其中μ = (μ 1 , … , μ n ) ′
结论 1
当μ i = 0 ( i= 1, … , n ), σ 2 = 1 时, 则
⎡ Dr A=Γ ⎢ ⎣O
O⎤ Γ′, ⎥ O⎦
0⎤ ⎡ λ1 ⎥ Dr = ⎢ O ⎢ ⎥ ⎢ λr ⎥ ⎣0 ⎦

北大应用多元统计分析课件第三章

北大应用多元统计分析课件第三章

在进行相关分析时,我们需要满足一些基本 假设,以确保结果的有效性和可靠性。
相关系数的含义及意义
1 相关系数的数值范围和方向
相关系数的范围在-1和1之间,负值表示负相关,正值表示正相关,接近0表示无相关。
2 相关系数的含义与意义
相关系数反映了变量之间的关系紧密程度,可以帮助我们预测和解释变量之间的相互作 用。
解释Pearson相关系数的值可以帮助我们理解变量之间的线性相关性,并应用于预测和决 策。
Spearman等级相关系数的计算与检验
1 Spearman等级相关系数的数值计算
计算Spearman等级相关系数需要将变量转化为等级形式,通过计算排位差异来获得相关 性。
2 Spearman等级相关系数的显著性检验
相关分析的概念与基本原理
1 相关分析的定义
相关分析是一种统计技术,用于研究变量之 间的关系。它可以帮助我们理解变量之间的 相关性。
2 相关分析的分类
相关分析可分为线性相关和非线性相关两种 类型,具体取决于变量之间的关系形式。
3 相关系数的定义与意义
4 相关分析的基本假设
相关系数衡量了变量之间的相关性强度和方 向,可以帮助我们理解变量之间的关系程度。
A. Johnson and Dean W. Wichern.
2 相关分析的注意事项
在进行相关分析时,我们需要考虑样本大小、数据类型、线性关系等因素,并避免过度 解读相关性。
3 相关分析与因果关系的区别
相关分析只能揭示变量之间的相关性,而不能确定因果关系。因果关系需要更多的实验 证据。
参考资料
• 应用多元统计分析(北京大学)课件 • Applied Multivariate Statistical Analysis (6th Edition) by Richard

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

1
4
4
1
2
14
2
1
2
5
2
3
2
15
4
1
1
6
4
0
2
16
2
2
1
7
3
2
1
17
3
3
1
8
4
0
1
18
3
2
2
9
2
1
1
19
3
1
1
10
3
1
2
20
4
0
2
假定三组都服从多元正态分布,检验这三组的总体均值是否有显著性差异
(α = 0.05 )。
3.7 某医生观察了 16 名正常人的 24 小时动态心电图,分析出早晨 3 个小
2 LF HF 4.29 3.03 4.69 4.77 5.28 4.41 5.05 3.28 4.94 3.56 4.54 3.28 4.26 3.11 5.56 5.36
3 LF HF 4.77 3.57 4.58 3.04 5.37 4.79 4.65 2.86 4.68 3.97 4.61 4.40 5.27 3.88 5.55 5.00
3 LF HF 4.16 2.70 3.30 3.10 4.64 3.87 5.54 4.89 5.21 3.88 5.26 3.84 5.43 4.50 4.57 2.32
3.8 根据习题 3.5 中的数据,检验男性婴幼儿与女性婴幼儿的协差阵是否
相等(α = 0.05 )。
3.9 根 据 习 题 3.6 中 的 数 据 , 检 验 三 位 候 选 人 的 协 差 阵 是 否 相 等

《多元统计分析》第三章聚类分析

《多元统计分析》第三章聚类分析

图像处理
聚类分析可用于图像分割、目 标检测等任务,提高图像处理 的效率和准确性。
社交网络
通过聚类分析,可以发现社交 网络中的社区结构,揭示用户 之间的关联和互动模式。
聚类分析的常用方法
K-均值聚类
一种迭代算法,通过最小化每个簇内对象与簇质 心的距离之和来实现聚类。需要预先指定簇的数 量K。
DBSCAN
感谢聆听
聚类结果的优化方法
层次聚类法
通过不断合并或分裂簇来优化聚类结果,可以灵活处理不同形状 和大小的簇,但计算复杂度较高。
基于密度的聚类法
通过寻找被低密度区域分隔的高密度区域来形成簇,可以发现任意 形状的簇,但对参数敏感。
基于网格的聚类法
将数据空间划分为网格单元,然后在网格单元上进行聚类,处理速 度较快,但聚类精度受网格粒度影响。
一种基于密度的聚类方法,通过寻找被低密度区 域分隔的高密度区域来实现聚类。可以识别任意 形状的簇,且对噪声数据具有较强的鲁棒性。
层次聚类
通过计算对象之间的距离,逐步将数据集构建成 一个层次结构的聚类树。可以分为凝聚法和分裂 法两种。
谱聚类
利用图论中的谱理论进行聚类分析,将数据集中 的对象表示为图中的节点,节点之间的相似度表 示为边的权重。通过求解图的拉普拉斯矩阵的特 征向量来实现聚类。
药物发现
通过对化合物库进行聚类分析,研究人员可以发现具有相 似化学结构和生物活性的化合物,从而加速新药的发现和 开发过程。
生物信息学
在基因表达谱、蛋白质互作网络等生物信息学研究中,聚 类分析可以帮助研究人员发现基因或蛋白质之间的功能模 块和调控网络。
在社交网络中的应用案例
社区发现
聚类分析可用于识别社交网络中的社区结构,即具有相似兴趣、行为或属性的用户群体。 这有助于社交网络运营商为用户提供更加个性化的推荐和服务。

多元统计分析第三章课件

多元统计分析第三章课件
2
定理
若 X ~ N p (0, Σ ) , S ~ Wp (n, Σ ) 且 X 与 S 相互独
2 1
立,令 T nX S X ,则
n p 1 2 T ~ F ( p, n p 1) np
在我们后面所介绍的检验问题中,经常会用到这一性质。
二、均值向量的检验
设X1,X2, ⋯,Xn是取自总体X~Np (μ, Σ)的一个样本,这里
2 -1
相互独立,n p , 则称统计量 T nX S X 的分布 为非中心 HotellingT2 分布,记为 T 2 ~ T 2 ( p, n, μ) 。 当 μ 0 时,称 T 服从(中心) Hotelling T 分布。
2 2
记为 T 2 ( p, n) 。 由于这一统计量的分布首先由 Harold Hotelling 提出 来的,故称为 Hotelling T 分布,值得指出的是,我 国著名统计学家许宝禄先生在 1938 年用不同方法也
当 未知时,用
2 2
1 n 2 S ( X X ) i n 1 i 1
2
作为 的估计量,用统计量:
来做检验。当假设成立时,统计量 t 服从自由度为 n 1 的 t 分布, 从而否定域为 | t | t / 2 (n 1) ,t / 2 (n 1) 为自由度为 n 1 的 t 分布 上的 / 2 分位点。 这里我们应该注意到, (3.3)式可以表示为
性水平α下被接受。因此,可以通过构造的置信区域的
方法来进行假设检验。
四、联合置信区间
P a X T a Sa a

n a μ a X T a Sa
n 1


a X T a Sa

多元统计分析第三章

多元统计分析第三章

判别分析的应用实例
1
判别分析在市场细分中应用广泛,可以根据消费 者的购买行为、偏好等因素将市场划分为不同判别分析可用于信用评估、风险评 估等,根据借款人的财务状况、信用记录等因素 判断其信用风险。
3
在医学领域,判别分析可用于疾病诊断和治疗方 案选择,根据患者的症状、体征、检查结果等因 素进行分类和预测。
06 判别分析
CHAPTER
判别分析的基本原理
判别分析是一种多元统计分析方法,用于根 据已知分类的观测数据来建立一个或多个判 别函数,从而对新的观测数据进行分类。
判别分析广泛应用于经济、金融、医 学、生物等领域的数据分类问题。
它基于概率理论,通过寻找一个或多个函数 ,使得不同类别的观测数据尽可能地分开, 同时使同一类别的观测数据尽可能地接近。
支持决策制定
通过多元统计分析,我们可以对数据进行深入挖掘,为决 策提供有力支持,帮助我们做出更好的决策。
多元统计分析的应用领域
市场营销
在市场营销中,多元统计分析常用于市场细分、顾客行为 分析、产品关联分析等方面,帮助企业更好地了解客户需 求和市场趋势。
生物医学
在生物医学领域,多元统计分析用于基因关联研究、疾病 诊断和预测、药物研发等方面,有助于提高医疗水平和治 疗效果。
03 主成分分析
CHAPTER
主成分分析的基本原理
01
降维思想
通过线性变换将多个相关变量转 化为少数几个不相关的变量,即 主成分,以简化数据结构。
02
03
方差最大化
线性变换
主成分的确定基于各变量的方差, 最大化总体方差,使变换后的新 变量更具代表性。
主成分分析通过线性变换将原始 变量转换为新变量,新变量之间 互不相关。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

X1
X
,
X n
则 X ~ Nn ( , 2In ) ,其中 (1,, n )' .
X 的二次型具有以下一些结论:
结论1 当 i 0 (i 1,, n) , 2 1 时,则
n
X ' X
X
2 i
~
2 (n)
;
i 1
当 i 0 (i 1,, n) , 2 1 时,则有
为Hale Waihona Puke n×p 矩阵,则称随机阵n
W
X
(
a)
X
' (a
)
X
'X
a 1
的分布为威沙特分布,记为W~Wp( n ,∑ ).
显然,p=1时,X(a) ~ N(0, 2) , 此时
n
W
X2 (a)
~
2 2 (n)
,
a 1
即 W1(n, 2 )就是 2 2 (n).当p=1, 2 1时,W1(n,1)就是 2 (n) .
n
aa' 或 M 'M a 1
这里
11
M
1
p
1'
n1
np
' n
其中 p 为随机阵 W 的阶数,n 为自由度,一元统计中的 2对
应 p 元统计中的协方差阵∑.
【注】随机阵 W 的密度函数是威沙特于1928年推导出来的, 故此分布称为威沙特分布。
2. 威沙特分布的性质
性质1 设X(a)~Np( ,∑ ) (a=1,2,…,n)相互独立,则样本离差阵A
www,
第三章 多元正态分布参数的假设检验
几个重要统计量的分布
单总体均值向量的检验及置信域
主要内容
多总体均值向量的检验 协方差阵的检验
独立性检验
正态性检验
§3.1 几个重要统计量的分布
一、正态变量二次型的分布
1. 分量独立的 n 维随机向量 X 的二次型
设 X i ~ N1(i , 2 ) (i 1,2,, n) , 且相互独立,记
则称 T 的分布具有n个自由度、非中心参数为 的
非中心 t 分布,记为 T ~ t (n, ).
定义3.1.3 设 X ~ 2 (m , )与Y ~ 2 (n) 相互独立,令
X
F
m Y
,
n
则称 F 的分布为具有自由度为 m , n 和非中心参数
为 的 F 分布,记为 F~F ( m , n , ).
第一类错误的概率=P{“以真当假”}=P{|T|>| = 0}|}
=显著性水平 ;
当H0相容时,可能犯第二类错误,且
第二类错误的概率=P{“以假当真”}=P{|T|≤| ≠ 0}
设=1≠0
P
X
1 (1 0 )
S2 n
|
1
此时检验统计量T~ t (n-1, )(非中心参数 n(1 0) / ),
结论3 设 X ~ N p ( , ) , 0 , A 和 B 为 p 阶对称矩阵,则
( X )' A( X )与( X )' B( X )独立
AB Op p .
3. 非中心 t 分布和非中心 F 分布
定义3.1.2 设 X ~ N ( ,1)与Y ~ 2 (n) 相互独立,令
T X , Y n
利用非中心 t 分布可以计算第二类错误 的值,从而得到检
验法的功效函数为1- .
类似地,非中心 2和非中心 F 分布在一元统计的相应检验
中,将应用非中心分布来计算第二类错误。
二、威沙特(Wishart)分布
1. 威沙特分布的定义
定义3.1.4 设 X(a) ~ Np( 0,∑ ) (a=1,…,n)相互独立,记 X (X(1),, X(n) )'
为 n 阶对称矩阵,B 为 m×n 矩阵,令 X ' AX ,
Z=BX ( Z 为 m 维随机向量),若 BA=O,则 BX 和 X ' AX
相互独立。
结论6 两个二次型相互独立的条件:设 X ~ Nn ( , 2In ),A,
B 为 n 阶对称矩阵,则 AB O X ' AX 与 X 'BX 相互独立 .
1
2
X 'X
~
2 (n) ;
(或记为 X ' X ~ 2 2 (n) )。
结论2 当 i 0 (i 1,2,, n) ,X ' X 的分布常称为非中心
2分布。
定义3.1.1 设 n 维随机向量 X~Nn( , In )(≠0),则称随机 n
变量 X ' X 为服从 n 个自由度、非中心参数 ' i2
2. 一般 p 维正态随机向量 的二次型 p 维随机向量的二次型具有下述结论:
结论1 设 X ~ N p ( , ) , 0 , 则 X '1X ~ 2 ( p , ) ,
其中 '1 .
结论2 设 X ~ N p ( , ) , 0 , 则A为对称矩阵 ,rank(A)=r. 则( X )' A( X ) ~ 2 (r) AA A .
一般地,设X(a)~Np( ,∑) (a=1,2,…,n)相互独立,记
M
1
p
1n
'
1 p
则称 W X ' X 服从非中心参数为Δ的非中心威沙特分布,记
为 W ~ Wp (n, , ),其中
M 'M (1n ' ) ' (1n ') 1n '1n ' n'
当X(a)~Np(a ,∑) (a=1,2,…,n)相互独立,非中心参数
二次型
X ' AX
2
~ 2(r)
A2
A(A为对称幂等矩阵)。
结论4
设 X ~ Nn ( , 2In ) , A A' , 则
1 X 'AX ~ 2(r , ) , 2
其中
1
2
' A
A
A2(对称幂等矩阵),
且 rank (A) = r (r≤n)。
结论5 二次型与线性函数的独立性:设 X ~ Nn ( , 2In ) ,A

2 分布,记为
X
'X
~
2 (n, )或
X 'X
~
2 n
(
).
i 1
当X~Nn( , 2In ),≠0,且 2 1时,令
1
Yi
Xi
,
显然
Yi
~
N
i
, 1 (i
1,2,, n) ,

Y 'Y
1
2
X 'X
~
2 n
(
)
,
其中
1
2
'
.
结论3 设 X ~ Nn (0n , 2In ),A为对称矩阵,且 rank (A) = r
4. 非中心 2、非中心 t 分布和非中心 F 分布的应用
在一元统计中,关于在一个正态总体 N ( , 2 ) 的均值检
验中,检验H0: = 0时,检验统计量为
T
X
0
H 0下
~ t(n 1)
,
S2 n
否定域为{|T|>},其中满足:P{|T|>}= (显著性水平).
当否定H0时,可能犯第一类错误,且
相关文档
最新文档