第一章 多元正态分布
多元正态分布
p 2
12
1 1 exp ( x ) ( x ) 2
1
( 这里Σ=AA′,
1 1 1 ( AA ) ( A ) A )
§2.2 多元正态分布的定义
定义2.2.4 若 p 维随机向量X=(X1,X2…Xp)′的联合密 度函数为
⑤ 写出X=AU+μ的密度函数: 1 1 f X ( x) exp u u J (u x) p 2 (2 ) 2 1 1 2 1 1 1 exp [ A ( x )][ A ( x )] p 2 (2 ) 2
§2.2 多元正态分布的定义
1. 多元正态分布的定义
2. 多元正态分布的性质
§2.2 多元正态分布的定义
在一元统计中,若U~N(0,1),则U的任意线性变 换X=σU+μ~N(μ,σ2)。利用这一性质,可以从标准 正态分布来定义一般正态分布: 若U~N(0,1),则称X =σU+μ的分布为一般正态分 布,记为X ~N(μ, σ2 )。 此定义中,不必要求σ>0,当σ退化为0时仍有意 义。把这种新的定义方式推广到多元情况,可得 出多元正态分布的第一种定义。
故 X2 0 2 0 1 Y X 3 ~ N ( 0 , 0 3 0 ). 2 1 0 1 X1
§2.2 多元正态分布的性质
(3) 设Z=2 X1-X2+3X3,试求随机变量Z的分布. Z=2 X1-X2+3X3 =(2,-1,3)X=CX 2 故有: z C x (2,1,3) 0 4 0 2 z C xC 1 1 0 2 2 (2,1,3) 1 2 0 1 1,0,9 1 0 0 3 3 3 29 所以 Z ~ N(4,29).
多元统计分析——多元正态分布
一、多元正态分布的定义
1、一元正态分布的定义 若变量 X 的概率密度为:
x 2
2 2
1 f x e 2
, 0 ,
则称 X 服从一元正态分布,记为 X ~ N , 2 。 我们可以将上式改写为:
f x 2
1 2
1 exp x ' 2 2
量 X 的相关阵为
R rij p p
其中
rij
Var X i Var X j
covX i , X j
ij ii Байду номын сангаасj
i, j 1,2,, p
另证明:标准化数据的协方差阵正好是原始指标的相 关阵
第2节
多元正态分布
一、多元正态分布的定义 二、均值向量和协方差阵的估计 三、维希特(Wishart)分布 四、统计距离
三、多元变量的独立性
定义 3 两个随机向量 x 和 y 相互独立的充要条件为:
PX x, Y y PX x PY y
对任意的 x, y
若 F x, y 为 x, y 的联合分布函数; G x 和 H y 分别为 x 和 y 的分布函数, 则 x 与 y 独立当且仅当 F x, y G x H y 若 X ,Y ' 有密度函数 f x, y , g x 和 h y 分别表示 X 和 Y 的分布密度, X 和 Y 用 则 独立当且仅当
X 1 X 2 X p q
q
μ 1 μ 2 μ p q
q
11 21
12 21 p q
第1章多元正态分布的参数估计(精)
第一章 多元正态分布的参数估计一、填空题1.设X 、Y 为两个随机向量,对一切的u 、v ,有)v (p )u (p )uv (p =,则称X 与Y 相互独立。
2.多元分析处理的数据一般都属于 横截面 数据。
3.多元正态向量()'=X X X p ,,1 的协方差阵∑是 对角阵 ,则X 的各分量是相互独立的随机变量。
4.一个p 元函数()p x x x f ,,,21 能作为p R 中某个随机向量的密度函数的主要条 件是 p 'p 21p 21R )x ,,x ,x (,0)x ,,x ,x (f ∈∀≥和1dx dx dx )x ,,x ,x (f p 21-p 21-=⎰⎰+∞∞+∞∞ 。
5.若()∑,~i p i n W S ,k i ,,1 =,且相互独立,则~21k S S S S +++= ),n (W k1i i p ∑∑=。
二、判断题1.多元分布函数()x F 是单调不减函数,而且是右连续的。
正确2.设X 是p 维随机向量,则X 服从多元正态分布的充要条件是:它的任何组合()p R X ∈'αα都是一元正态分布。
错误3.μ是一个P 维的均值向量,当A 、B 为常数矩阵时,具有如下性质:(1)E (AX )=AE (X ) (2)E (AXB )=AE (X )B 正确4.若P 个随机变量X 1,…X P 的联合分布等于各自边缘分布的乘积,则称X 1,… X P 是相互独立的。
正确5.一般情况下,对任何随机向量()'=X X X p ,,1 ,协差阵∑是对称阵,也是正定阵。
错误6.多元正态向量()'=X X X p ,,1 的任意线性变换仍然服从多元正态分布。
正确7.多元正态分布的任何边缘分布为正态分布,反之一样。
错误8.多元样本中,不同样品之间的观测值一定是相互独立的。
正确9.多元正态总体参数均值μ的估计量X 具有无偏性、有效性和一致性。
结构方程模型的多元正态分布
结构方程模型的多元正态分布多元正态分布是结构方程模型中的一种常见假设。
本文将从多元正态分布的概念、性质和应用等方面进行阐述,旨在为读者提供对该主题的全面了解。
第一部分:多元正态分布的概念多元正态分布是指多个随机变量同时服从正态分布的情况。
在结构方程模型中,我们通常假设观测变量和潜变量都服从多元正态分布。
这种假设使得我们能够对变量之间的关系进行推断和建模。
第二部分:多元正态分布的性质多元正态分布具有许多重要的性质。
首先,多元正态分布的边际分布也是正态分布。
这意味着每个变量的边际分布可以独立地进行分析。
其次,多元正态分布的协方差矩阵可以用来描述变量之间的线性关系。
协方差矩阵可以通过样本数据的协方差矩阵估计得到。
最后,多元正态分布的联合分布可以通过均值向量和协方差矩阵来确定。
第三部分:多元正态分布的应用多元正态分布在许多领域都有广泛的应用。
在社会科学中,多元正态分布可以用来建立结构方程模型,研究变量之间的因果关系。
在金融学中,多元正态分布可以用来建立投资组合模型,评估不同投资资产之间的相关性。
在医学研究中,多元正态分布可以用来分析多个生物标志物之间的关系。
第四部分:多元正态分布的优缺点多元正态分布具有许多优点,如易于推断和建模、具有丰富的数学性质等。
然而,多元正态分布也有一些局限性,如对数据的要求较高、对大样本量的依赖性等。
因此,在应用多元正态分布时,需要考虑这些因素。
第五部分:结论多元正态分布作为结构方程模型的基本假设之一,在数据分析和建模中具有重要的应用。
通过对多元正态分布的概念、性质和应用的介绍,本文希望读者对该主题有更深入的理解。
同时,也提醒读者在实际应用中要考虑到多元正态分布的优缺点,并结合具体情况进行分析和建模。
通过合理的应用和推广,多元正态分布将为各个领域的研究提供有力的工具和方法。
多元正态分布
1 2 n
1 n æ 1 ö ç ÷ | Σ | 2 exp{- å ( X j - m )¢Σ -1 ( X j - m )} 2 j =1 è 2p ø
np
n
对于观测结果
X1
X2 L Xn
固定的集合, 所得表
达式作为 m 和 Σ 的一个函数, 称为似然函 ˆ ˆ 数,并记为 L ( m , Σ ). 若存在 m , Σ ,使 ˆ ˆ ˆ L ( m , S ) = max { L ( m , S )}, 则称 m , Σ 为 m , Σ 的 ˆ 极大似然估计。
令
æ l1 ç Λ =ç ç ç 0 è
1 2
O
0 ö ÷ ÷, li > 0 ÷ lk ÷ ø
1 2
则å
k
i =1
l i e i e i¢ = P Λ P ¢
1 2
并令 A
= PΛ P¢
1 2
则有 (1) ( A (3) (4)
A
1 2 1 2
)¢ = A
Δ
1 2 1 2
; (2) A
-
1 2
A
1 e b |Σ|
1 - Tr ( Σ -1 B ) 2
1 £ ( 2b) pb e -bp b |B|
而且仅当
Σ=
1 B 2b
时,等号才成立。
定理:设 X X L X 是来自正态总体 ˆ ˆ N ( m , Σ ) 的随机样本,则 m = X , Σ = S n 分别 是 m , Σ 的极大似然估计。 证明:
B Σ= n
=
å(X
j =1
n
j
- X )( X j - X )¢
三、 X 和 S 的分布 定 义 : 设 Z ,Z L Z ~ N ( 0 , Σ ) ,则称 å
多元统计分析陈钰芬课后答案
多元统计分析陈钰芬课后答案第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。
在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
其中最典型的就是0-1标准化和Z标准化。
2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。
在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。
每个坐标对欧氏距离的贡献是同等的。
当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。
当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。
没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。
为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。
受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。
多元正态分布
另,x1 和
1 x1 1 2 f1 ( x1 ) exp[ ( ) ] 21 2 1 2 1 1 x2 2 f 2 ( x2 ) exp 2 2 2 2 1
x2 的边际密度函数分别是
,其中 u ~ N 2 (0, I ) ,
1 0 ,则 X 的分布就是退化的三元正 A 0 1 1 1
态分布,即 x ~ N3 (0, ) ,其中
1 0 1 0 1 1 0 1 T AA 0 1 0 1 1 0 1 1 1 1 2 1 1
(2 )
p 2
1 2
1 T 1 exp (x ) (x ) 2
专业课件讲义教材PPT文档 4
设随机向量 u ~ N P (0, I ) , 为 p 维常 数向量, A 是一个 p q 常数矩阵,则称 x Au 的分布为多元正态分布,仍记 T X ~ N ( , ) 作 ,其中 AA 。 P
专业课件讲义教材PPT文档 1
u 的均值和协方差矩阵分别为
E (u) E (u1 ),, E (u p )
V (u) E (uuT )
T
0
u12 u1u2 u1u p 1 0 0 2 u2u1 u2 u2u p 0 1 0 E I u u u u u2 0 0 1 p 2 p p 1 u 的分布称为均值为 0 ,协方差矩阵为 I 的多元正态分布,记作 u ~ N P (0, I )
第三章
第一节
多元正态分布
多元正态分布的定义
§1-5 多元正态分布
, xm ) , ym ) y1 g1 ( x1, x1 h1 ( y1, y g ( x , x h ( y , , x ) ym ) m 1 m m 1 , m m
f Y1 ,,Ym ( y1, , ym ) ( x1, , xm ) f X 1 ,, X m ( h1 ( y1, , y m ), , hm ( y1, , y m )) ( y1, , ym )
二.多元正态分布的基本定理
回顾与拓展:随机向量变换的概率密度函数
, Xm) , Ym ) Y1 g1 ( X 1, X 1 h1 ( Y1, Y g ( X , X h ( Y , Xm) Ym ) m 1 , m 1 , m m
Y1 Y p1 Y 2
1 2
V11 V V 21
V12 V22
则Y1与Y2 独立的充分必要条件是 V12 0
三.多元正态分布的性质
思考题
设 ( X1, X2, …, Xn ) 是抽自总体 X ~ N( , ² )的 样本,试问 X = ( X1, X2, …, Xn ) ´服从什么分布?
正态分布 或 Gauss分布。记为 X∼ N(, ² )
( x )2 2 2
一.多元正态分布的定义 标准正态分布
设 X∼ N(, ² ),当 = 0, = 1 时, 称 X 服从标准正态分布,记为 X ∼ N(0,1 ) 标准正态分布的概率密度为
x2 2
( x)
§1-5
多元正态分布
一.多元正态分布的定义
二.多元正态分布的基本定理 三.多元正态分布的性质
一.多元正态分布的定义
多元正态分布.ppt
(2)
令
Y
X X
2 3
X1
0 0 1
1 0 0
0 1 0
X1 X2 X3
BX
,
由性质1知,Y为3维正态随机向量,且
0 1 0 2 0
y
Bx
0 1
0 0
10 00
02
1
xp ap1u1 ..... appu p p
u A
x1 xp
u p
u p
AA 1 2 1 2
§2.2
故 J (u x) 1 1 2. J(x u)
§2.2
⑤ 写出X=AU+μ
fX
(x)
1
(2 ) p
B
fX (x)dx
B
以下来求Jacobi行列式J(u→x).
§2.2
④ 积分变换的Jacobi行列式J(u→x)可利用线性变换
x=Au+μ及J(x→u)来计算:
x1 xp
因
J (x u) x
u1
u1
x1
a11u1
.....
a1pu p
1
2 1
1 1 2
1
1
2
1
2 2
12 1
2
1
2 2
2
二元正态随机向量X
多元正态分布
混合模型
除了高斯混合模型,还有其他类 型的混合模型,如多项式混合模 型、泊松混合模型等。
扩展应用领域
多元正态分布在许多领域都有广 泛的应用,如心理学、经济学、 生物统计学等。
THANKS
感谢观看
02
联合分布的均值向量和协方差矩阵由各个分量的均 值和协方差决定。
03
当各分量之间相互独立时,其联合分布的协方差矩 阵为各分量协方差矩阵的线性组合。
04
多元正态分布的推断
参数估计
最大似然估计
01
通过最大化样本数据的似然函数来估计多元正态分布的参数,
包括均值向量和协方差矩阵。
最小二乘估计
02
将多元正态分布的均值向量作为回归系数,利用最小二乘法进
多元正态分布
• 多元正态分布概述 • 多元正态分布的参数 • 多元正态分布的性质 • 多元正态分布的推断 • 多元正态分布在统计和机器学习中的
应用 • 多元正态分布的扩展和变种
01
多元正态分布概述
定义与性质
定义
多元正态分布是多个连续随机变量的 概率分布,其概率密度函数是多元高 斯函数。
性质
多元正态分布具有旋转对称性、椭球 等高性、边缘分布的独立性和最大熵 等性质。
当其他维度固定时,该维度的边缘分 布是关于均值对称的,且方差与该维 度与其他维度的协方差成正比。
随机变量的线性变换
对于多元正态分布的随机变量,对其 进行线性变换后,新变量的分布仍然 是多元正态分布。
线性变换包括平移、旋转、缩放等, 这些变换不会改变变量的分布形态。
随机向量的联合分布
01
对于多元正态分布的随机向量,其各分量之间的联 合分布也是正态分布。
06
【教学课件】第一章 多元正态分布
k个变量是两两不相关,另一方面,
在尽可能保持原有信息的基础上,使
得 k尽可能的小。
.
16
定理3.2.1 设 的 p 个顺序特征值为
1 p 0, 1 2 p ,
其中
j
(
j
1,2,,
p)是对应于
的标准
j
正交特征向量,则 I , X 的第 j 个
主成分 Yj 表达式的系数向量 a j j ,
X)(Xi
X)( 样 本 协 方 差 )
.
11
或检验统计量
F n p T2 p(n1)
当F
F
(
p,n
p)时 , 拒 绝 H 0
注T : 2p n (n p 1 )F (p ,np )
.
12
两个多元正态总体均值成组比较
设X1, X2,, Xn1和Y1,Y2,,Yn2分别取
自于p维正态总体Np (1, )和Np (2 , )
即Y j
j X ,且D(Yj )
。
j
.
17
贡献率
p
定义3.2.1 称j j 为主成分Yj的 j1
k
p
贡献率,称j j 为前k个主成分
j1
j1
Y1,Y2 ,,Yk的累积贡献率。
.
18
原始变量与主成分的相关系数
因子负荷量
(Xi,Yj)
coX vi,Yj
Va XirVaYjr
j ij
1
.
20
第四章 因子分析
正交因子模型
因子模型的参数估计
因子旋转
因子得分
应用实例
.
21
有关记号
多元正态分布
§1.1 §1.2 §1.3 §1.4 多元分布的基本概念 多元正态分布 均值向量和协方差阵的估计 常用分布及抽样分布
一元正态分布在统计学的理论和实际应用中都有 着重要的地位。同样,在多变量统计学中,多元 正态分布也占有相当重要的位置。原因是: 许多随机向量确实遵从正态分布,或近似遵从正 态分布;
X和Y 的协差阵:
cov( X , Y ) (cov( X i , Y j )), i 1,, n ; j 1,, p
随机向量X 的相关阵:
R (corr ( X i , X j )) ( rij ) P P rij COV ( X i , X j ) D( X i) D( X j ) , i , j 1,2, , p
总体参数协差阵Σ的极大似然估计是:
1 1 n p L ( X ( i ) X )( X ( i ) X ) n n i 1
n 2 ( X X ) 1 i1 i 1 n 2 ( X X ) 2 1 i2 i 1 n
自协方差阵:
Σ COV ( X , X ) E ( X EX )( X EX ) D( X )
D( X 1 ) COV ( X , X ) 2 1 COV ( X , X ) P 1 COV ( X 1 , X 2 ) D( X 2 ) COV ( X P , X 2 ) COV ( X 1 , X P ) COV ( X 2 , X P ) D( X P )
xn2
X (1) x1 p x2 p X (2 ) ( X 1 , X 2 , , X P ) X x np (n)
多元正态分布 ppt课件
ppt课件
16
一元正态分布密度函数图形
f (x) O
0.5 1
2
图1 2 1
ppt课件
x
17
二元正态分布密度函数
f ( x1, x2 )
1
2 1 2
1
2
exp
1 2(1
2)
( x1 1 )2
2 1
2
x1 1 1
20
多元正态分布定义1
定义1.2.1 若 p维随机向量 X 的概率密度函数为
ppt课件
4
随机矩阵的数学期望
定义1.1.2
z11 z12
设Z
z21
z22
zp1 zp2
则Z的数学期望(均值)E(Z )为
z1q
z2q
为p
q阶随机矩阵
,
zpq
E(z11)
E(
Z
)
E
(
z21
)
E(zp1)
E(z12 ) E(z22 )
x2 2 2
( x2 2 )2
2 2
ppt课件
18
二元正态分布密度函数图形
ppt课件
19
一元正态分布密度函数变形
f (x)
1
( x )2
e 2 2
2
(2
)
1 2
(
2
)
1 2
exp
1
(
x
多元正态分布
EX ( EX1,, EX p ) 为X的均值向量或数学期望。
均值向量有如下性质
(1) E ( AX ) AE ( X ) (2) E ( AXB) AE ( X ) B (3) E ( AX BY ) AE ( X ) BE (Y )
其中X,Y为随机向量,A,B为适合运算的常数矩阵。 定义:设
多元正态分布
一、随机向量的 概率分布 定义:设
X ( X1 ,, X p ) 是p维随机向量,它的多维
分布函数定义为
F ( x) F ( x1 , x2 , , x p ) P X 1 x1 , X 2 x2 , , X p x p
( X1,, X p )的取值是有限的或可列的, 则称 X ( X1 ,, X p )是离散型随机向量。
X ( X1,, X p ) 的密度函数为
1
1 f ( x1 , x2 ,, x p ) exp ( x )1 ( x ) 12 2 ( 2 ) p
其中 x ( x1, x2 ,, x p ), (1, 2 ,, p )
是阶正定矩阵。则称X服从p元正态分布,也称X为p
元正态变量,简记为
X ~ N p (, )
多元正态分布的性质
(1)设 X ( X1 ,, X p ) ~ N p (, ), 是对角阵,
则 X1 ,, X p 是相互独立的
(2)若 X ( X1 ,, X p ) ~ N p ( , ), A为s×p阶常数阵,d为s维常数向量,则
协方差矩阵有以下性质பைடு நூலகம்(1)DX是非负定矩阵。
(2)对于常数a,有D(X+a)=DX。
(3)设A为常数矩阵,则 D( AX ) AD( X ) A (4)设A、B为常数矩阵,则 cov( AX , BY ) A cov( X , Y ) B
1.多元正态分布资料
E(
X
i
)
存在,
i
E ( X1 ) 1
E ( X )
E
(
X2
)
2
μ
E ( X P )
P
1.6
是一个p维向量,称为均值向量.
当A、B为常数矩阵时,由定义可立即推出如下性质:
(1) E(AX ) AE(X )
1.7
(2) E(AXB) AE(X )B
(1.8)
9
目录 上页 下页 返回 结束
P(X x,Y y) P(X x)P(Y y) (1.3)
对一切(X , Y )成立。
(1)若F(x,y)为(X,Y)的联合分布函数,G(x)和H(y) 分别为
X和Y的分布函数,则X与Y独立当且仅当
F(x, y) G(x)H( y)
(1.4)
(2)若(X,Y)有密度f(x, y),用g(x)和h(y)分别表示X和Y
的分布密度,则X和Y独立当且仅当
f ( x, y) g( x)h( y)
(1.5)
注意:在上述定义中,X 和 Y 的维数一般是不同的。
8
目录 上页 下页 返回 结束
§1.1.4 随机向量的数字特征
1、随机向量X 的均值
i
设X
1,2,
p
(
,
X1, X 2 ,, X p )'有 定义随机向量
p X
个分量。若 的均值为
( ij )
COV ( X1, X P )
COV
(
X
2
,
X
P
)
D( X P )
(1.9)
称它为p维随机向量X的协方差阵,简称为 X的协方差阵。
第一章 多元正态分布
❖ /z04-2/143.htm
(2) Λ统计量和Λ分布
设k个总体G1,,Gk ,它们服从 Np (i ,) 。分别抽出
如下的样本:
x11, x12, , x1n1
x21, x22, , x2n2
xk1, xk2, , xknk
x j x j1, x j2 , , x jnj
(i=1,2,…,p)
E(x) (E(x1), E(x2), , E(xp )) (1, 2 p )'
是一个p维向量,称为均值向量
性质 1) 设为常数,则 E(aX) aE(X); 2)设 A, B,C 分别为常数矩阵,则
E(AXB C) AE(X)B C
3)设 X1, X2,, Xn为 n 个同阶矩阵,则
E{[(Ax AE(x)][(Bx BE(x)]}
AE[(x )(x )]B 5、若(k1,k2,…,kp)是n个不全为零的常数, (x1,x2,…,xp) 是相互独立的p维随机向量,则
V (k1x1 k2x2 knxn ) k12V (x1) k22V (x2 ) kn2V (xn )
若(x, y) 0,两随机向量相互独立。
其中,ij
cov(xi , y j ) D(xi ) D( y j )
❖ 多元正态分布的定义及其性质
多元正态分布是一元正态分布的直接推广。许多 实际问题的分布常是多元正态分布或近似正态分布, 或本身不是正态分布,但他的样本均值近似于多元正 态分布。因此,多元分析的主要理论都是建立在多元 正态总体基础上的。
i 1
1.3 维希特(Wishart)分布
定义 设n个随机向量 xi (xi1, xi2, , xip )(i 1, 2,3, ,n)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010-11-23
目录 上页 下页 返回 结束
26
§1.3 多元正态分布
多元正态分布是一元正态分布的推广。 多元正态分布是一元正态分布的推广。迄今 为止, 为止,多元分析的主要理论都是建立在多元正态 总体基础上的,多元正态分布是多元分析的基础。 总体基础上的,多元正态分布是多元分析的基础。 另一方面, 另一方面,许多实际问题的分布常是多元正态分 布或近似正态分布,或虽本身不是正态分布, 布或近似正态分布,或虽本身不是正态分布,但 它的样本均值近似于多元正态分布。 它的样本均值近似于多元正态分布。 本节将介绍多元正态分布的定义, 本节将介绍多元正态分布的定义,并简要给 出它的基本性质。 出它的基本性质。
2010-11-23
目录 上页 下页 返回 结束
5
横看表1 横看表1-1,记
, 列的元素
个样品的观测值。竖看表1 它表示第 个样品的观测值。竖看表1-1,第
表示对
第个变量
的n次观测数值。 次观测数值。
下面为表 下面为表1-1
变量 序号 1 2 n
2010-11-23
目录 上页 下页 返回 结束
… … … …
p
(. ) (1.6)
µ是一个p维向量,称为均值向量. 是一个p维向量,称为均值向量. 当 为常数矩阵时,由定义可立即推出如下性质: :
2010-11-23
目录 上页 下页 返回 结束
11
2、随机向量 自协方差阵 、
则称Σ为X的自协方差阵
2010-11-23
目录 上页 下页 返回 结束
12
3、随机向量X 和Y 的协差阵
2010-11-23
目录 上页 下页 返回 结束
22
下面先用一个一维的例子说明欧氏距离与马氏距离在概 率上的差异。
设有两个一维正态总体 。若有 一个样品,其值在A处,A点距离哪个总体近些呢?由 图1-2
图1-2
2010-11-23
目录 上页 下页 返回 结束
23
由图1-2可看出,从绝对长度来看,A点距左面总体G1近些, 即A点到 比A点到 要“近一些”(这里用的是欧氏距离,比 较的是A点坐标与 到 值之差的绝对值),但从概率观点来 的左侧约3 处,若以标 看,A点在 右侧约4 处,A点在 准差的观点来衡量,A点离 比A点离 要“近一些”。显然, 后者是从概率角度上来考虑的,因而更为合理些,它是用坐标 差平方除以方差(或说乘以方差的倒数),从而化为无量纲数。
2010-11-23
目录 上页 下页 返回 结束
24
马氏距离
设X、Y从均值向量为 ,协方差阵为 的总体 从均值向量为µ,协方差阵为∑的总体 的总体G 从均值向量为 中抽取的两个样品,定义X、Y两点之间的马氏距 两点之间的马氏距 离为
− 2 dm ( X, Y) = ( X −Y))/ Σ 1 ( X − Y)
6
因此,样本资料矩阵可用矩阵语言表示为: 因此,样本资料矩阵可用矩阵语言表示为:
注:若无特别说明,本书所称向量均指列向量
定义1.1 设 定义 成的向量
2010-11-23
目录 上页 下页 返回 结束
为p个随机变量,由它们组 称为随机向量。
7
§1.1.2
分布函数与密度函数
描述一维随机变量的最基本工具是分布函数, 类似地描述随机向量的最基本工具还是分布函数。 。 定义1.2 是一随机向量, 定义1.2 设 X = ( X 1 , X 2 ,..., X p )′ 是一随机向量,它的多 元分布函数是
目录 上页 下页 返回 结束
3
§1.1多元分布的基本概念 1.1多元分布的基本概念
§1.1.1 §1.1.2 §1.1.3 §1.1.4 随机向量 分布函数与密度函数 多元变量的独立性 随机向量的数字特征
2010-11-23
目录 上页 下页 返回 结束
4
§1.1.1
随机向量
假定所讨论的是多个变量的总体, 假定所讨论的是多个变量的总体,所研究的数 个指标(即变量), ),又进行了 据是同时观测 个指标(即变量),又进行了 次 观测得到的, 观测得到的,把这 个指标表示为 常 用向量 个变量。 表示对同一个体观测的 个变量。若观测了 个个体,则可得到如下表 的数据, 个个体,则可得到如下表1-1的数据,称每一个个 个变量为一个样品, 体的 个变量为一个样品,而全体 个样品形成一 个样本。 个样本。
2010-11-23
目录 上页 下页 返回 结束
30
§1.3.2 多元正态分布的性质
1、如果正态随机向量 的协方差阵 的各分量是相互独立的随机变量。 是对角阵, ∑是对角阵,则X的各分量是相互独立的随机变量。
2、多元正态分布随机向量X的任何一个分量子集的分布(称为X的 多元正态分布随机向量X的任何一个分量子集的分布( 边缘分布)仍然遵从正态分布。而反之, 边缘分布)仍然遵从正态分布。而反之,若一个随机向量的任何边缘分 布均为正态,并不能导出它是多元正态分布。 布均为正态,并不能导出它是多元正态分布。 例如, 例如,设 有分布密度
(1.21)
定义X 与总体G 的马氏距离为
−1 2 / dm ( X, G ) = ((X −µ)) Σ ( X − ) ) µ)
(1.22)
25
目录 上页 下页 返回 结束
2010-11-23
表示一个点集, 表示距离, 设 表示一个点集, 表示距离,它 是到 的函数,可以证明,马氏距离符合如下距离的四条基本公 的函数,可以证明 马氏距离符合如下距离的四条基本公 理: (1) (2) (3) (4) , 当且仅当 ; ;
容易验证, 容易验证, 是正态分布。 是正态分布。
,但
显然不
联合正态
2010-11-23
边缘正态
31
目录 上页 下页 返回 结束
3、多元正态向量 的任意线性变换仍然遵从多元正 态分布。 态分布。即设 ,而m维随机向量 ,其中 阶的常数矩阵, 维的常向量。 维随机向量Z也是正态的, 是 m×p阶的常数矩阵,b是m维的常向量。则m维随机向量Z也是正态的, 遵从m元态分布, 且 。即Z遵从m元态分布,其均值向量为 ,协 差阵为 。
一 个 p 维 变 量
9
目录 上页 下页 返回 结束
§1.1.3
和
多元变量的独立性
个随机向量
称为是相互独立的, 称为是相互独立的,若 Y X
若 有密度 的分布密度, 的分布密度,则 和
,用 独立当且仅当
分别表示
和 (1.5)
注意:在上述定义中, 和 注意:在上述定义中,
2010-11-23
的维数一般是不同的。 的维数一般是不同的。
2010-11-23
目录 上页 下页 返回 结束
19
例如,横轴 代表重量(以kg为单位),纵轴 代表长度(以cm为单位)。有四个点A、B、C、D见 图1.1,它们的坐标如图1.1所示
图1.1
2010-11-23
目录 上页 下页 返回 结束
20
x2
这时 显然AB比CD要长。 现在,如果 用mm作单位, 单位保持不变, 此时A坐标为(0,50),C坐标为(0,100),则
2010-11-23
目录 上页 下页 返回 结束
2
多元正态分布是最常用的一种多元 概率分布。除此之外,还有多元对数正 态分布,多项式分布,多元超几何分布, 多元 分布、多元 分布、多元指数 分布等。本章从多维变量及多元分布的 基本概念开始,着重介绍多元正态分布 的定义及一些重要性质。
2010-11-23
2010-11-23
目录 上页 下页 返回 结束
13
维随机向量, (3)设X为n ) 为 维随机向量,期望和协方差存在记 则
来说, 对于任何随机向量 来说, 其协差阵∑都是对称阵,同时总是非负定( 其协差阵∑都是对称阵,同时总是非负定(也称 半正定) 大多数情形下是正定的。 半正定)的。大多数情形下是正定的。
10
目录 上页 下页 返回 结束
§1.1.4
设
随机向量的数字特征
有P个分量.若
1、随机向量 X的均值 存在,我们定义随机向量X的均值为:
E ( X 1 ) µ1 E ( X 2 ) µ2 = =µ E ( X) = E ( X P ) µP
第一章 多元正态分布
§1.1 §1.2 §1.3 §1.4 §1.5 多元分布的基本概念 统计距离和马氏距离 多元正态分布 均值向量和协方差阵的估计 常用分布及抽样分布
2010-11-23
目录 上页 下页 返回 结束
1
一元正态分布在统计学的理论和实际应用 中都有着重要的地位。同样,在多变量统 计学中,多元正态分布也占有相当重要的 位置。原因是: 许多随机向量确实遵从正态分布,或近似 遵从正态分布; 对于多元正态分布,已有一整套统计推断 方法,并且得到了许多完整的结果。
2010-11-23
目录 上页 下页 返回 结束
16
§1.2 统计距离和马氏距离
欧氏距离 马氏距离
2010-11-23
目录 上页 下页 返回 结束
17
欧氏距离
在多指标统计分析中,距离的概念十分重要,样 品间的不少特征都可用距离去描述。大部分多元 方法是建立在简单的距离概念基础上的。即平时 人们熟悉的欧氏距离,或称直线距离.如几何平面 上的点p=(x1,x2)到原点O=(0,0) O=(0,0)的欧氏距离,依勾 O=(0,0) 股定理有
2010-11-23
目录 上页 下页 返回 结束
14
4、随机向量X 的相关阵 若随机向量 的协差阵存在,且每 个分量的方差大于零,则X的相关阵定义为:
也称为分量
与
之间的(线性)相关系数。