多元正态分布
第三章 多元正态分布
则称X为连续型随机向量,称 它具有两个性质: 二、随机向量的数字特征 1.随机 向量的数学期望 设 若
为分布密度函数。
存在且有限,则称
为X的均值向量或数学期望
均值向量有以下性质: 1.E(AX)=AE(X) 2.E(AXB)=AE(X)B 3.E(AX+BY)=AE(X)+BE(Y) 其中:X、Y为随机变量,A、B为适合运算的常数矩阵。
的分布
是从总体中抽到的一个样本,则样本均值
的分布服从正态分布,即
(二)非正态总体 中心极限定理: 是来自总体的一个样本,该总体有均值 和有限协方差阵
则当样本容量 n很大且 n相对于 p也很大时,样本平均数的分布近似于正态分布,
二、样本离差阵
Wishart分布
定义:设 维正态总体 则
的分布
分别来自于协方差阵相等的 p 维随机矩阵
2.随机向量的协方差矩阵 设 称
为X的方差阵或协差阵.
3.随机向量X和Y的协差阵
当X=Y时,即D(X)
4.随机向量的相关系数矩阵 若 相关阵为 的协差阵存在,且每个分量的方差都大于0,则随机向量的
5.协方差阵和相关系数矩阵的关系 设标准离差阵为 则: 协差阵有如下数学性质: 即X的协差阵为非负定阵。 对于常数向量a,有D(X+a)=D(X) 设A为常数矩阵,则 其中,a,A,B为大小 适合运算的常数向量和 矩阵。
多元正态分布
的n次观测数值。下面为表1-1
… … … …
2016/1/14
6
目录 上页 下页 返回
结束
§1.1.1
随机向量
因此,样本资料矩阵可用矩阵语言表示为:
若无特别说明,本书所称向量均指列向量
定义1.1 设 的向量
2016/1/14
目录 上页 下页 返回
为p个随机变量,由它们组成 称为随机向量。
7
结束
2016/1/14
目录 上页 下页 返回
结束
29
§1.3 多元正态分布
§1.3.1 §1.3.2 §1.3.3 多元正态分布的定义 多元正态分布的性质 条件分布和独立性
2016/1/14
目录 上页 下页 返回
结束
30
§ 1.3.1
多元正态分布的定义
定义1.5:若 元随机向量 的概率密度函数为:
则称 正态变量。记为
表示对同一个体观测的 个变量。若观测了 个个体,则可得到如下表1-1的数据,称每一个个 体的 个变量为一个样品,而全体 个样品形成一 个样本。
5
目录 上页 下页 返回 结束
§1.1.1
横看表1-1,记 它表示第
随机向量
, 列的元素
个样品的观测值。竖看表1-1,第
表示对
序号
1 2 n
第个变量
变量
多元统计分析——多元正态分布
X 1 X 2 X p q
q
μ 1 μ 2 μ p q
q
11 21
12 21 p q
q
则 X1 ~ N q μ
1
, 11 , X 2 ~ N p q μ 2 , 22 。
一、随机向量和矩阵
在多元统计分析中,仍将所研究对象的全体称为总体, 若构成总体的个体是具有p个需要观测指标的个体,称 这个总体为p维总体或p元总体。设从多元总体中随机 抽取n个个体: X (1) , X ( 2) ,,X ( n)
若X (1) , X ( 2) ,,X ( n) 相互独立且与总体同分布,称 X (1) , X ( 2) ,,X ( n) 为该总体的一个多元随机样本, 简称为简单样本。
设 x1 , x 2 ,, x p 为 p 个随机变量,由它们组成的向量 X x1 , x 2 ,, x p ' 称作随机向量
例 美国10家最大的工业公司提供的数据
公司 通用汽车 福特 埃克森 IBM 通用电气 美孚 菲利浦 克莱斯勒 杜邦 德士古
(单位:百万美元)
x1 销售总额
126 974 96 933 86 656 63 438 55 264 50 976 39 069 36 156 35 209 32 416
多元正态分布 方差
多元正态分布方差
多元正态分布是指在多维空间中服从正态分布的随机变量的分布。在多元正态分布中,变量之间可能存在线性相关性,而且每个变量都能够独立地对整个分布产生影响。
方差是衡量随机变量分布的离散程度的统计量。对于多元正态分布,方差可以用协方差矩阵来表示。协方差矩阵是一个对称矩阵,其中的每个元素表示两个变量之间的协方差。对角线上的元素表示每个变量自身的方差,非对角线上的元素表示两个变量之间的协方差。
通过分析协方差矩阵,可以得出多元正态分布中各个变量之间的相关性和方差大小。方差的大小反映了随机变量在每个维度上的离散程度,较大的方差表示变量的取值范围较广,较小的方差表示变量的取值范围较窄。
总之,多元正态分布的方差可以通过协方差矩阵来描述,并且用于衡量变量之间的相关性和离散程度。
多元正态分布随机数
多元正态分布随机数
多元正态分布随机数是指服从多维正态分布的随机变量所生成的随机数。在统计学中,多元正态分布是一种常见的概率分布,它是一种定义在n维向量空间上
的连续概率分布。通常使用的多元正态分布是二维和三维的。
一般来说,多元正态分布的随机数可以通过以下步骤产生:
1. 首先,生成标准正态分布的随机数。标准正态分布是指均值为0、方差为1
的正态分布。
2. 然后,使用相关矩阵进行线性变换,将标准正态分布的随机数变换为服从多元正态分布的随机数。
3. 最后,根据需要对生成的多元正态分布的随机数进行调整,以满足特定的统计要求。
在实际应用中,多元正态分布的随机数可以用于模拟许多现实世界中的随机变量,如金融市场和天气模拟。此外,多元正态分布的随机数也可用于解决统计探索、因素分析、回归分析、贝叶斯网络、机器学习算法等问题。
需要注意的是,多元正态分布的随机数生成过程涉及到矩阵运算和线性代数的知识,因此需要具备一定数学基础才能进行操作。此外,在实际应用中,还需要考
虑随机数的样本量、参数设置等问题,以保证生成的多元正态分布的随机数满足特定的要求。
总之,多元正态分布的随机数生成是一种重要的统计方法,在许多领域都具有广泛的应用价值。对于想要深入了解和应用多元正态分布随机数的人士,需要掌握相关数学知识和统计学基础,并且在实践中不断积累经验和提升技能。
多维正态分布特征函数
多维正态分布特征函数
多维正态分布,也称为多元正态分布或高斯分布,是多个连续随机变量组成的概率分布。其特征函数定义为:E(e^(i t X)) = e^(i t u + (1/2)t t*C),其中i 是虚数单位,t是实数,X是随机向量,u是均值向量,C是协方差矩阵。
这个特征函数描述了多维正态分布的一些关键属性。首先,它揭示了分布的均值向量u,这是分布的中心位置。其次,协方差矩阵C决定了分布的形状和各维度之间的相关性。C的每个元素CCkk表示随机变量Xk和Xk之间的协方差。如果CCkk等于0,那么Xk和Xk是独立的。
此外,特征函数的形式也表明多维正态分布具有旋转对称性,即分布的形状不会因为坐标轴的旋转而改变。这一特性在许多实际应用中非常重要,如数据分析、信号处理和机器学习等领域。
总的来说,多维正态分布的特征函数是一个强大的工具,它提供了对分布属性的深入理解,并广泛应用于各种科学和工程领域。
第三讲多元正态分布
随机向量
随机向量: 由多个随机变量组成的向量。 n个样品,p个指标
X ( X1, X 2 , X p )
数据表:变量为列,样品为行。
X1 1 2 …… n x11 x21 …… xn1 X2 x12 x22 …… xn2 …… …… …… …… …… Xp x1p x2p …… xnp
p
f ( x)dx 1
9
边缘分布函数及边缘密度函数
用途:
判断
随机变量的 独立性
多元向量的独立性
独立的充分必要条件:
F ( x1, x2 , xq , xq1,, x p ) F ( x1,, xq )F ( xq1,, x p )
或
f ( x1, x2 , xq , xq1,, x p ) f ( x1,, xq ) f ( xq1,, x p )
F ( x)
x1
x2
f (t1, t2 ,t p )dt1, dt 2 ,, dt p
对一切 x ( x1, x2 ,xp ) R p 成立,则称X有分布密 度f(.),并称X为连续型随机向量。 性质: ① ②
f ( x) 0 ,对于任意x属于p维实数空间。
R
(1) q
(1) q
q
注:
(1) 多元正态分布的任何边缘分布为正态分布,但反之不真。 (1) ( 2) (1) (2) 由于 12 cov(X , X ) ,故 12 0 表示 X 和 X ( 2)不相 X (1) 和 X ( 2) 的不相 关,因此可以知道,对于多元正态变量而言, 关与独立是等价的。
多元正态分布不相关和独立等价证明
多元正态分布不相关和独立等价证明
多元正态分布是统计学中的重要概念,它在许多领域中被广泛应用。在多元正态分布中,不相关和独立是两个基本的概念,它们在某些情况下可以等价证明。本文将从概念、性质和证明等角度,探讨多元正态分布中不相关和独立的等价关系。
我们来了解一下多元正态分布的概念。多元正态分布是指多个随机变量服从正态分布,并且它们之间存在一定的相关性。多元正态分布的特点是具有多个维度,每个维度都有自己的均值和方差,同时不同维度之间可能存在相关性。多元正态分布可以用来描述多个随机变量之间的关系,例如多个股票的收益率、多个变量的测量结果等。
在多元正态分布中,不相关和独立是两个重要的概念。不相关是指多个随机变量之间不存在线性关系,即它们的协方差为0。独立是指多个随机变量之间不存在任何关系,即它们的联合概率分布等于各自的边缘概率分布的乘积。在一维情况下,不相关和独立是等价的,但在多维情况下,它们并不总是等价的。
接下来,我们来探讨多元正态分布中不相关和独立的等价关系。首先,我们可以从多元正态分布的性质入手。多元正态分布的性质之一是,如果多维随机变量服从多元正态分布且各个维度之间不相关,那么它们一定是独立的。这是由于多元正态分布的联合概率密度函
数可以表示为各个维度的边缘概率密度函数的乘积。因此,如果各个维度之间不相关,那么它们的联合概率密度函数就等于各自的边缘概率密度函数的乘积,即它们是独立的。
然而,这个等价关系并不是双向的。也就是说,如果多维随机变量服从多元正态分布且各个维度之间独立,不一定能推出它们之间不相关。这是因为在多维正态分布中,不相关只是线性关系的一种特殊情况,而独立是更为严格的条件。换句话说,独立可以推出不相关,但不相关不能推出独立。
多元正态分布
多元正态分布
正态分布,又称为高斯分布,是概率论与统计学中最为重要的概率
分布之一。正态分布的特点是其概率密度函数呈现出钟形曲线的形状,可以描述大多数自然现象中的分布情况。本文的主要目的是介绍正态
分布的定义、性质和应用,并对其多元形式进行讨论。
一、正态分布的定义和性质
正态分布的定义如下:
设X是一个连续型随机变量,如果它的概率密度函数为
f(x) = (1/√(2πσ^2)) * exp(-(x-μ)^2/(2σ^2))
其中μ为均值,σ^2为方差,exp为自然指数函数,那么称X服从
参数为(μ,σ^2)的正态分布,记作X~N(μ,σ^2)。
正态分布的性质如下:
1. 正态分布是一个对称分布,其均值、中位数和众数都重合,位于
分布的中心。
2. 正态分布的曲线在均值两侧呈现对称性,标准差决定了曲线的宽度,标准差越小,曲线越陡峭,反之越平缓。
3. 正态分布的累积分布函数可用标准正态分布的累积分布函数来计算。
4. 正态分布的随机变量相加仍然服从正态分布。
二、正态分布的应用
正态分布在各个领域中都有广泛的应用,以下列举几个常见的应用场景。
1. 自然科学:正态分布常被用来描述测量误差、物理实验结果和自然现象。例如,在物理实验中测量的误差往往服从正态分布。
2. 金融领域:正态分布被广泛应用于金融领域的风险管理和股票价格预测中。基于正态分布的投资组合理论和资产定价模型是金融领域中的重要工具之一。
3. 质量控制:正态分布被应用于质量控制中,用于确定产品的标准差、设定合适的控制上限和下限,从而判断产品是否合格。
4. 社会科学:正态分布在社会科学领域的人口统计、心理学实验和经济学研究中得到广泛应用。例如,身高、体重等指标的分布往往服从正态分布。
多元正态分布
例(二元正态分布) 设 X ~ N 2 ( , )
2 x 1 1 1 , X , x 2 2 1 2
,这里
1 2 2 2
由于 这时
故有 f ( x1 , x2 ) f1 ( x1 ) f 2 ( x2 ) 即 x1 和 x2相互 独立,因此,对于二元正态分布来说,两个分 量的不相关和独立性是等价的。当 1 1 时, 0,即 不存在,此时, X 的概率密 度不存在, X 是一个退化的二元正态分布,并 且 x1和 x2 之间以概率 1 存在着线性关系。
,其中 u ~ N 2 (0, I ) ,
1 0 ,则 X 的分布就是退化的三元正 A 0 1 1 1
态分布,即 x ~ N3 (0, ) ,其中
1 0 1 0 1 1 0 1 T AA 0 1 0 1 1 0 1 1 1 1 2 1 1
1
2 1
0, (1 )故当 1 时,
2 2 2
1 2 1 2 2 2 2 1 2 (1 ) 2 2 1
2 2
专业课件讲义教材PPT文档 7
由多元正态分布密度函数公式可得此时 概率密度为
专业课件讲义教材PPT文档 2
多元正态分布
tr 矩阵的迹
目录 上页 下页 返回 结束
15
§1.1.4 随机向量的数字特征
4、随机向量X 的相关阵
若随机向量
的协差阵存在,且每
个分量的方差大于零,则X的相关阵定义为:
也称为分量 与 之间的(线性)相关系数。
2020/4/8
16
目录 上页 下页 返回 结束
§1.1.4 随机向量的数字特征
在数据处理时,为了克服由于指标的量纲不同对统计分 析结果带来的影响,往往在使用某种统计分析方法之前,常 需将每个指标“标准化”,即做如下变换
讨论:为什么现实中有那么多的 数据服从正态分布?
目录 上页 下页 返回 结束
3
第一章 多元正态分布
多元正态分布是最常用的一种多元概率 分布。除此之外,还有多元对数正态分布,多 项式分布,多元超几何分布,多元 分布、 多元 分布、多元指数分布等。本章从多维 变量及多元分布的基本概念开始,着重介绍多 元正态分布的定义及一些重要性质。
LOGO
多元统计分析
第一章 多元正态分布
§1.1 多元分布的基本概念 §1.2 统计距离和马氏距离 §1.3 多元正态分布 §1.4 均值向量和协方差阵的估计 §1.5 常用分布及抽样分布
目录 上页 下页 返回 结束
2
第一章 多元正态分布
一元正态分布在统计学的理论和实际应用中都有 着重要的地位。同样,在多变量统计学中,多元正态 分布也占有相当重要的位置。原因是: 许多随机向量确实遵从正态分布,或近似遵从正态分 布; 对于多元正态分布,已有一整套统计推断方法,并且 得到了许多完整的结果。
多元正态分布
3
协方差矩阵检验
检验多元正态分布的协方差矩阵是否等于某个已 知矩阵,常用的方法有Box's M检验等。
方差分析
01
多元方差分析
在多个均值向量的假设下,分析 多个样本之间的差异,以确定哪 些因素对数据有影响。
02
多因素方差分析
03
方差成分分析
同时考虑多个因素对数据的影响, 分析各因素之间的交互作用和主 效应。
在聚类分析中的应用
K-均值聚类
基于多元正态分布的相似性度量,K-均值聚类算法可以将数 据集划分为多个簇,使得同一簇内的数据尽可能相似,不同 簇的数据尽可能不同。
高斯混合模型
高斯混合模型是一种基于多元正态分布的概率模型,用于对 数据进行聚类或异常检测。通过估计每个簇的中心、协方差 和簇中数据所占的比例,可以对数据进行分类或异常检测。
将数据的变异分解为多个成分, 以了解各成分对总变异的贡献程 度。
05
多元正态分布在统计和机器学习中的
应用
在回归分析中的应用
多元线性回归
多元正态分布常用于构建多元线性回归模型,以预测多个因变量的响应变量。 通过估计回归系数和误差方差,可以对因变量进行预测和解释。
稳健回归
在存在异常值或离群点的情况下,多元正态分布可以用于稳健回归分析,以减 少异常值对回归结果的影响。
长度与随机变量的维度相同。
第三章多元正态分布
ry x
sxy
S 1 xx
sxy
s yy
称为样本复相关系数。
rxy Rˆ xx1rxy
33
❖ 例3.4.2 今对31个人进行人体测试,考察或测试的 七个指标是: 年龄(x1)、体重(x2)、肺活量(x3)、1.5 英里跑的时间(x4)、休息时的脉搏(x5)、跑步时的脉 搏(x6)和跑步时记录的最大脉搏(x7)。数据列于表 3.4.1。
E
Σˆ
=
1 n
E
n i 1
xi
x
xi
x
=
1 n
E
n i 1
xi
μ
x
μ
xi
μ
x
μ
1 n
E
n
i1
xi
μ
xi
μ
n
x
μ
x
μ
1 n
n
V
i 1
xi
nV
x
1 n
nΣ
n
1 n
Σ
n 1 n
Σ
25
2.有效性
❖ 设θˆ 是θ的一个无偏估计,若对θ的任一无偏估计 θ
有
V θˆ V θ ,θ Θ
?????231xxx???????15?解令于是23121212xxyxxx??????????y23111221230111?????????00210201112xxxxxyxxx???????????????????????????????????????????????????????????????????????????????y161212100011022301116420111????00441100102214102eyvy??????????????????????????????????yy1061661620162040???????????????????给定y2时y1的条件均值和条件协差阵分别为??????21322132545122545452161312012121240223551061632116201620yxxyyxx?????????????????????????????????????????????????????????16????????????????????所以176204026?1323122113254545353221212262xxxxxxnxxx?????????????????????????????????????????????33极大似然估计及估计量的性质?简单随机样本简称样本
多元正态分布的联合分布的条件分布
多元正态分布的联合分布的条件分布
多元正态分布的联合分布是指多个随机变量的联合概率分布,而条件分布是指在某个条件下的概率分布。
对于多元正态分布,其联合分布是多元正态分布,即所有随机变量都服从正态分布。条件分布则是指给定某些随机变量值的条件下,其他随机变量的概率分布。
对于多元正态分布,其条件分布也是正态分布。具体来说,如果随机变量$X$和$Y$是多元正态分布的随机变量,那么在给定$X=x$的条件下,$Y$的条件分布是正态分布;同样地,在给定$Y=y$的条件下,$X$的条件分布也是正态分布。
需要注意的是,多元正态分布的条件分布的均值和方差会随着条件的变化而变化。具体来说,如果随机变量$X$和$Y$是多元正态分布的随机变量,那么在给定$X=x$的条件下,$Y$的条件均值和条件方差分别是$E(YX=x)$和$var(YX=x)$;同样地,在给定$Y=y$的条件下,$X$的条件均值和条件方差分别是$E(XY=y)$和$var(XY=y)$。这些条件均值和条件方差可以通过多元正态分布的性质计算得到。
多维正态分布概率密度函数
多维正态分布概率密度函数
多维正态分布概率密度函数,也称为多元正态分布概率密度函数,是概率论和统计学中的重要概念之一。它在描述多个随机变量之间的关系以及概率分布时起到了重要的作用。本文将以人类的视角,以简洁明了的语言解释多维正态分布概率密度函数的含义和应用。我们需要了解什么是正态分布。正态分布,又称为高斯分布,是概率论和统计学中最为常见的连续型概率分布之一。在一维情况下,正态分布由两个参数完全描述:均值μ和方差σ^2。它的概率密度函数曲线呈钟形,以均值为中心对称,而方差决定了曲线的宽窄程度。
当我们将正态分布推广到多维情况时,就得到了多维正态分布。在多维正态分布中,我们需要考虑多个随机变量之间的关系。假设我们有n个随机变量X1, X2, ..., Xn,它们服从多维正态分布。那么它们的联合概率密度函数可以表示为:
f(x1, x2, ..., xn) = (2π)^(-n/2) * det(Σ)^(-1/2) * exp(-0.5 * (x-μ)^T * Σ^(-1) * (x-μ))
其中,x = [x1, x2, ..., xn]是一个n维向量,μ = [μ1, μ2, ..., μn]是均值向量,Σ是协方差矩阵。det(Σ)表示协方差矩阵Σ的行列式。
多维正态分布概率密度函数的含义是,给定n个随机变量的取值,计算这些取值出现的概率。与一维情况类似,多维正态分布的概率
密度函数曲线也是钟形的,以均值向量为中心对称,而协方差矩阵决定了曲线在各个方向上的分布情况。
多维正态分布概率密度函数在实际应用中有着广泛的应用。例如,在金融领域中,我们可以使用多维正态分布来描述股票价格的变动。在医学领域中,我们可以使用多维正态分布来描述人群的生理指标。在机器学习中,多维正态分布可以作为一种概率模型,用于建模和预测。
多元正态分布(简介)
2
二次型的矩阵表示
设 A 是一个 n 阶对称矩阵,即
a11 a12 A a21 a22
an1 an2
a1n
a2n
,
ann
x1
x
x2
又
xn
是一个
n
维列向量,
则由矩阵的乘法,知二次型 f x1, x2, , xn 可表示为
f x1, x2, , xn xT Ax .
5
二元正态分布的矩阵表示
并且矩阵
B
的行列式
B
12 r1 2
r12
2 2
12
2 2
1
r2
,再观察密度函数
. f x1,
x2
2
1 1 2
1
r2
exp
2
1 1
r2
x1
1
2 1
2
2rx1
1x2
1 2
2
x2
2 2
2 2
1
其系数 2 12
1 r2
1
1
2 B 2
,又
2
1
1
r2
x1
1 12
2
2rx1
1x2
1 2
2
x2
2 2
2 2
1 2
x
μT
B1x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 多元正态分布的定义
2. 多元正态分布的性质
§2.2 多元正态分布的定义
在一元统计中,若U~N(0,1),则U的任意线性变 换X=σU+μ~N(μ,σ2)。利用这一性质,可以从标准 正态分布来定义一般正态分布: 若U~N(0,1),则称X =σU+μ的分布为一般正态分 布,记为X ~N(μ, σ2 )。 此定义中,不必要求σ>0,当σ退化为0时仍有意 义。把这种新的定义方式推广到多元情况,可得 出多元正态分布的第一种定义。
0 ) 3
§2.2 多元正态分布的性质
(2)
X 2 0 1 0 X 1 0 0 1 X BX , 令 Y X 3 1 0 0 2 X 3 X1
由性质1知,Y为3维正态随机向量,且
0 1 0 2 0 y B x 0 0 1 0 0 1 0 0 0 2
则 X(1) ~ Nr(μ(1),Σ11), X(2) ~ Np-r(μ(2),Σ22).
§2.2 多元正态分布的性质
证明: 取 B1 I r O , r维向量 d1 0,
r p
由性质1可得: X 类似地
(1)
B1 X d1 ~ Nr ( , 11 ).
(1)
取 B2 O I p r , p r维向量 d 2 0, 则
1 1 f (x) exp ( x ) ( x ) 1 2 p 2 2 (2 ) 1
其中μ是p维实向量,Σ是p阶正定阵,则称X=(X1,X2…Xp )′ 服从(非退化的)p元正态分布.也称X为p维正态随机向量 ,简记为 X~Np(μ,Σ).
1 1 exp ( x )() ( x ) 12 2 2 1
§2.2 多元正态分布的定义
证明 ① 因Σ>0,rk(Σ)=p,由线性代数的知识知存在 非奇异方阵A,使得 Σ=AA′,且 X = AU+μ 其中U=(U1,…,Up)′,且U1,…,Up相互独立同N(0,1)分 布。 ② U的联合密度函数(p元函数)为
④ 积分变换的Jacobi行列式J(u→x)可利用线性变换 x=Au+μ及J(x→u)来计算: x
来自百度文库
p
u1 x p u p
12
A AA
12
§2.2 多元正态分布的定义
1 1 2 故 J (u x) . J ( x u)
§2.2 多元正态分布的定义
1 1 fU (u ) exp u u p 2 (2 ) 2
§2.2 多元正态分布的定义
③ 利用U的联合密度函数及随机向量的变换求 X=AU+μ的密度函数。 对任给Borel可测集B,求p元函数fX(x)使得
P{ X B} f X ( x)dx
d为s×1常向量,令Z=BX+d,则
Z~Ns(Bμ+d , BΣB ). 该性质指出正态随机向量的任意线性组合 仍为正态分布.
§2.2 多元正态分布的性质
证明 因Σ ≥0, Σ可分解为Σ=AA ,其中A为p×q 矩阵 .已知X~Np(μ,Σ),由定义2.2.1可知 d X = AU+μ
( p-r) p
X
( 2)
B2 X d2 ~ N pr ( , 22 ).
( 2)
§2.2 多元正态分布的性质
此推论指出,多元正态分布的边缘分布仍为
正态分布。但反之,若随机向量的任何边缘分布
均为正态分布,也不一定能导出该随机向量服从
多元正态分布.
如例2.1.1,证明了X1,X2均为一元正态分布,但由 (X1,X2) 联合密度函数的形式易见它不是二元正态.
§2.2 多元正态分布的性质
y B x B 0 1 0 1 1 0 0 0 1 1 2 0 0 0 1 0 0 1 1 2 0 1 0 0 0 0 3 1 0 0 1 0 0 0 0 3 0 1 0 1 1 0 0 1 0 2 0 1 0 3 0 1 0 1
1 1 f (x) exp ( x ) ( x ) 1 2 p 2 2 (2 ) 1
其中μ是p维实向量,Σ是p阶正定阵,则称X=(X1,X2…Xp )′ 服从(非退化的)p元正态分布.也称X为p维正态随机向量 ,简记为 X~Np(μ,Σ).
(d表示两边的随机向量服从相同的分布.)
其中U=(U1,…,Uq),且U1,…,Uq 相互独立同 N(0,1)
分布。
§2.2 多元正态分布的性质
d Z=BX+d = B(AU+μ)+d
= (BA)U+(Bμ+d)
由定义2.2.1可知 Z ~Ns(Bμ+d, (BA)(BA)), 即 Z ~Ns(Bμ+d, BΣB).
§2.2 多元正态分布的性质
例如:设三维随机向量X=(X1,X2,X3),且
X1 2 1 1 0 ~ N ( 0 , 1 2 0 ), X X 2 0 0 0 3 X3
则有(1) X1 ~ N(2,1),
X2 0 2 X ~ N 2 ( 0 , 0 3
B
P{U D} fU (u )du
其中 D={u | u=A-1(x-μ), xB}
D
§2.2 多元正态分布的定义
根据附录§8 (P397)公式(8.4),即有
P{ X B} fU (u )du
D B
[u A ( x )]
1
fU ( A1 ( x )) J (u x)dx f X ( x)dx
1 (2 )
p 2
12
1 1 exp ( x ) ( x ) 2
1
( 这里Σ=AA′,
1 1 1 ( AA ) ( A ) A )
§2.2 多元正态分布的定义
定义2.2.4 若 p 维随机向量X=(X1,X2…Xp)′的联合密 度函数为
则称X服从 p 维正态分布,记为 X ~Np(μ,Σ) .
t ' t X (t ) exp[ it ' ] ( 0) 2
§2.2 多元正态分布的定义
定义2.2.3 若p维随机向量X的任意线性组合均服从 一元正态分布,则称X为p维正态随机向量. 定义2.2.4 若 p 维随机向量X=(X1,X2…Xp)′的联合密 度函数为
⑤ 写出X=AU+μ的密度函数: 1 1 f X ( x) exp u u J (u x) p 2 (2 ) 2 1 1 2 1 1 1 exp [ A ( x )][ A ( x )] p 2 (2 ) 2
§2.2 多元正态分布的定义
定义2.2.1 设U=(U1,…,Uq)′为随机向量,U1,…, Uq相互独立且同N(0,1)分布;设μ为p维常数向量 ,A为p×q常数矩阵,则称X=AU + μ的分布为p维
正态分布,或称X为p 维正态随机向量,记为X ~
Np(μ, AA′)。 定义2.2.2 若p维随机向量X的特征函数为:
§2.2 多元正态分布的性质
§2.2 多元正态分布的性质
性质3 若X~Np(μ,Σ),E(X)=μ,D(X)=Σ. 证明 因Σ≥0,Σ可分解为:Σ=AA′, 则由定义2.2.1可知 X = AU+μ (A为p×q实矩阵)
其中U=(U1,…,Uq)′,且U1,…,Uq相互独立同N(0,1)分
布,故有 E(U )=0, D(U )=Iq .
(这里Σ=AA).
§2.2 多元正态分布的性质
性质1 设X~Np(μ,Σ), B为s×p常数阵, d为s×1常向量,令Z=BX+d,则 Z~Ns(Bμ+d , BΣB ).
§2.2 多元正态分布的性质
X(1) 推论 设X= (2) X
r p-r
~Np(μ,Σ),将μ,Σ剖分为
(1) r 11 12 r ( 2) p r , pr 22 21
§2.2 多元正态分布的定义
定义2.2.2 若p维随机向量X的特征函数为:
t ' t X (t ) exp[ it ' ] ( 0) 2
则称X服从 p 维正态分布,记为 X ~Np(μ,Σ) .
§2.2 多元正态分布的定义
性质 设X=(X1,…,Xp)′为p维随机向量,则X服从p维
正态分布 对任一p维实向量a,ξ=a′X是一维正态随 机变量. 定义2.2.3 若p维随机向量X的任意线性组合均服从 一元正态分布,则称X为p维正态随机向量.
§2.2 多元正态分布的定义
性质 设X~Np(μ,Σ),且Σ>0 (正定),则X的联合密度 函数为
1 1 () ( x ) f ( x) exp ( x ) 1 2 2 (2 ) p 2 1
§2.2 多元正态分布的定义
定义2.2.1 设U=(U1,…,Uq)′为随机向量,U1,…,
Uq相互独立且同N(0,1)分布;设μ为p维常数向量
,A为p×q常数矩阵,则称X=AU + μ的分布为p维 正态分布,或称X为p 维正态随机向量,记为X ~ Np(μ, AA′)。 简单地说,称q个相互独立的标准正态随机变
故 X2 0 2 0 1 Y X 3 ~ N ( 0 , 0 3 0 ). 2 1 0 1 X1
§2.2 多元正态分布的性质
(3) 设Z=2 X1-X2+3X3,试求随机变量Z的分布. Z=2 X1-X2+3X3 =(2,-1,3)X=CX 2 故有: z C x (2,1,3) 0 4 0 2 z C xC 1 1 0 2 2 (2,1,3) 1 2 0 1 1,0,9 1 0 0 3 3 3 29 所以 Z ~ N(4,29).
B
以下来求Jacobi行列式J(u→x).
§2.2 多元正态分布的定义
x1 u 1 因 x J ( x u) u x 1 x1 a11u1 ..... a1 p u p 1 u p
x p a p1u1 ..... a ppu p p
量的一些线性组合构成的随机向量的分布为多元
正态分布。
§2.2 多元正态分布的定义
性质1 设U= (U1,…,Uq)′为随机向量, U1, …,Uq 相 互独立且同 N(0,1)分布;令X=μ+AU,则X的特征函
数为
1 X (t ) exp[ it t AAt ]. 2
这里t=(t1,…,tp), 故ΦX(t)为p元函数.
§2.2 多元正态分布的定义
以上给出了多元正态分布的4种定义。定义2.2.4
用密度函数给出定义,它可看成一元正态密度的直
接推广;但在这个定义里要求Σ是正定阵,它给出的
是非退化的正态分布的定义。
另三种定义中把Σ阵推广到非负定的情形,这三种 定义是等价的。
§2.2 多元正态分布的性质
性质1 设X~Np(μ,Σ), B为s×p常数阵,