第三章 多元正态分布
应用多元统计第三章汇总
X1
X
,
X n
则 X ~ Nn ( , 2In ) ,其中 (1,, n )' .
X 的二次型具有以下一些结论:
结论1 当 i 0 (i 1,, n) , 2 1 时,则
n
X ' X
X
2 i
~
2 (n)
;
i 1
当 i 0 (i 1,, n) , 2 1 时,则有
为Hale Waihona Puke n×p 矩阵,则称随机阵n
W
X
(
a)
X
' (a
)
X
'X
a 1
的分布为威沙特分布,记为W~Wp( n ,∑ ).
显然,p=1时,X(a) ~ N(0, 2) , 此时
n
W
X2 (a)
~
2 2 (n)
,
a 1
即 W1(n, 2 )就是 2 2 (n).当p=1, 2 1时,W1(n,1)就是 2 (n) .
n
aa' 或 M 'M a 1
这里
11
M
1
p
1'
n1
np
' n
其中 p 为随机阵 W 的阶数,n 为自由度,一元统计中的 2对
应 p 元统计中的协方差阵∑.
【注】随机阵 W 的密度函数是威沙特于1928年推导出来的, 故此分布称为威沙特分布。
2. 威沙特分布的性质
性质1 设X(a)~Np( ,∑ ) (a=1,2,…,n)相互独立,则样本离差阵A
www,
第三章 多元正态分布参数的假设检验
几个重要统计量的分布
单总体均值向量的检验及置信域
多元正态分布条件分布例题
多元正态分布条件分布例题
多元正态分布是指具有多个随机变量的正态分布。
它的概率密度函数可以用矩阵符号来表示。
对于一个具有n个变量的多元正态分布,其概率密度函数可以写作:
f(x) = (1 / ( (2π)^(n/2) |Σ|^0.5 )) exp(-0.5 (x-μ)' Σ^(-1) (x-μ))。
其中,x是一个n维向量,μ是一个n维向量,Σ是一个n×n 的对称正定矩阵,|Σ|表示Σ的行列式。
这个概率密度函数描述了多元正态分布的形状和分布情况。
现在让我们来看一个条件分布的例题。
假设我们有一个二维多元正态分布,其均值向量为μ = [1, 2],协方差矩阵为Σ = [[2, 1], [1, 2]]。
我们想要求在给定X1 = 1 的条件下,X2 的条件分布。
首先,我们可以计算边缘分布,即X1的边缘分布。
X1的边缘
分布仍然是一个正态分布,其均值和方差可以通过均值向量和协方差矩阵的对应元素得到。
然后,我们可以计算条件分布。
在给定X1 = 1 的条件下,X2 的条件分布也是一个正态分布,其均值和方差可以通过边缘分布的均值和方差以及协方差矩阵的相关元素计算得到。
通过这个例题,我们可以理解多元正态分布的条件分布是如何计算的,以及如何利用均值向量和协方差矩阵来描述多元正态分布的形状和分布情况。
多元正态分布的概率密度函数
多元正态分布的概率密度函数
p(x) = (2π)^(−d/2) * ,Σ,^(-1/2) * exp[−1/2 *( x−μ )^T
Σ^(-1)(x−μ)]
其中,(2π)^(−d/2) 表示一个常数系数,Σ,^(-1/2) 表示协方差
矩阵的行列式的平方根的倒数,Σ^(-1)表示协方差矩阵的逆,exp[−1/2
*( x−μ )^T Σ^(-1)(x−μ)]表示对指数函数的指数部分进行运算。
在上述公式中,μ是一个d维向量,表示多元正态分布的均值向量,表示了数据在各个维度上的中心位置。
Σ是一个d×d的协方差矩阵,表
示不同维度之间的相互关系。
正态分布的主要特性是其均值和方差。
在多元正态分布中,均值向量
μ指示了分布在每个维度上的平均值。
协方差矩阵Σ则指示了分布在不
同维度间的相关性及展开度。
当协方差矩阵Σ是对角矩阵时,表示各个
维度之间是相互独立的,若协方差矩阵Σ中一些非对角元素为零,则表
示各个维度是独立的。
总之,多元正态分布的概率密度函数是一个描述多维空间中随机变量
分布的函数。
它通过均值向量和协方差矩阵来表示数据在不同维度上的中
心位置和相互关系,是统计学和概率论中一个重要的分布函数。
第三章 多元正态分布均值向量和协方差的检验
第三章多元正态分布均值向量和协方差的检验
1.基本思想和步骤
2.均值向量的检验
(1)分布:设且X与S相互独立,,则称统计量的分布为非中心分布
当时,称服从(中心)分布,记为
(2)转换为F分布:若且X与S相互独立,令,则
3.一个正态总体均值向量的检验
(1)协差阵已知,检验统计量为
(2)协差阵未知,检验统计量为
4.两个正态总体均值向量的检验
设为来自p维正态总体的容量为n的样本,
为来自p维正态总体的容量为m的样本,且两组样本相互独立
①针对共同已知协差阵,检验统计量为
②针对共同未知协差阵,检验统计量为
(2)协差阵不等
①针对n=m的情形,检验统计量为
②针对n≠m的情形,检验统计量为
5.多个正态总体均值向量的检验
(1)单因素方差分析:设k个正态总体分别为,从k个总体中取个独立样本,,假设H0成立,检验统计量为
其中,组间平方和为,组内平方和为,总平方和为,其中,
(2)若,则为X的广义方差,为样本广义方差
(3)Wilks分布:若且二者相互独立,
为Wilks统计量,分布为Wilks分布,简记为
(4)多元方差分析:检验统计量为
其中,,A为组间离差阵,E为组内离差阵,T为总离差阵,且T=A+E
6.协差阵的检验
(1)一个正态总体协差阵的检验:构造检验统计量
(2)多个协差阵相等的检验:构造检验统计量。
多元统计分析-第三章 多元正态分布
第三章 多元正态分布多元正态分布是一元正态分布在多元情形下的直接推广,一元正态分布在统计学理论和应用方面有着十分重要的地位,同样,多元正态分布在多元统计学中也占有相当重要的地位。
多元分析中的许多理论都是建立在多元正态分布基础上的,要学好多元统计分析,首先要熟悉多元正态分布及其性质。
第一节 一元统计分析中的有关概念多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,学习多元统计分析,首先要对随机向量和随机矩阵有所把握,为了学习的方便,先对一元统计分析中的有关概念和性质加以复习,并在此基础上推广给出多元统计分析中相应的概念和性质。
一、随机变量及概率分布函数 (一)随机变量随机变量是随机事件的数量表现,可用X 、Y 等表示。
随机变量X 有两个特点:一是取值的随机性,即事先不能够确定X 取哪个数值;二是取值的统计规律性,即完全可以确定X 取某个值或X 在某个区间取值的概率。
(二)随机变量的概率分布函数随机变量X 的概率分布函数,简称为分布函数,其定义为:)()(x X P x F ≤=随机变量有离散型随机变量和连续型随机变量,相对应的概率分布就有离散型概率分布和连续型概率分布。
1、离散型随机变量的概率分布若随机变量X 在有限个或可列个值上取值,则称X 为离散型随机变量。
设X 为离散型随机变量,可能取值为1x ,2x ,…,取这些值的概率分别为1p ,2p ,…,记为k k p x X P ==)((Λ,2,1=k )称k k p x XP ==)((Λ,2,1=k )为离散型随机变量X 的概率分布。
离散型随机变量的概率分布具有两个性质: (1)0≥k p ,Λ,2,1=k(2)11=∑∞=k k p2、连续型随机变量的概率分布若随机变量X 的分布函数可以表示为dt t f x F x⎰∞-=)()(对一切R x ∈都成立,则称X 为连续型随机变量,称)(x f 为X 的概率分布密度函数,简称为概率密度或密度函数。
多元统计分析:第三章 多元正态总体参数的假设检验(补充)
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
ˆ X时 (4) 当 0 (0 0巳知)时, 取 似然函数达最大值:
L( X , 0 ) 2
np 2
0
n 2
n 1 etr - 0 A 2
19
第三章 多元正态总体参数的假设检验
15
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
单个p维正态总体Np(μ,Σ),设X(i)(i=1,…,n)为来自p 维总体的随机样本.样本的似然函数为
L( , ) 2
np 2
1 ˆ A时, 似然函数达最大值 : ˆ X , (1)当 n n np A 2 A np L( X , ) 2 2 exp - n n 2
9
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
D2(1)≤ D2(2) ≤…≤ D2(n) 统计量 D2 的经验分布函数取为
.
其中H(D2(t) |p)表示χ2 (p)的分布函数在D2(t)的值. 设χ2 分布的pt分位数为χt2 ,显然χt2满足: H(χt 2 |p)= pt. 即χ2 分布的pt 分位数χt2 =H-1(pt |p). 由经验分布得到样本的pt 分位数D2(t)=Fn-1(pt ). 若H(x|p)≌Fn(x),应有D2(t) ≌ χt2 ,绘制点(D2(t) , χt2 )的散 布图,当X为正态总体时,这些点应散布在一条直线上. 10
(1) (1) ( 2) ( 2)
np 2
A1 A2 n
(t )
np 2 2
e
X )( X
第三章 正态分布
u
u指单侧U界值,也称
随机变量U的上侧α 分 位数。其意义为:从u 到+∞这一侧的面积为 α。
u/2
u/2 指双侧U界值,也
称随机变量U的双侧α 分位数。其意义为:从 u/2 到+∞这一侧的面 积为α /2,从-∞到-u/2 这一侧的面积也为α /2, 两侧面积之和为α 。
1.3 正态分布曲线及其面积分布
图3-8 两尾概率
图 正态分布两尾概率
对于标准正态分布,其两尾概率为: P(∣u∣≥1.96)=0.05 P(∣u∣≥2.58)=0.01
图 标准正态分布两尾概率
图 标准正态分布两尾概率
标准正态分布,其单尾概率为
图 标准正态分布单尾概率
图 标准正态分布单尾概率
图 正态分布与标准分布的概率
例如 x在(μ -1.96σ ,μ +1.96σ )之外取值的两尾概率 为0.05,而一尾概率为0.025。即: P(x<μ -1.96σ )=P(x>μ +1.96σ )=0.025
图
正态分布两尾概率
同理,x在(μ-2.58σ,μ+2.58σ)之外取值的两尾概率为0.01, 而一尾概率为0.01。即: P(x<μ-2.58σ)=P(x>μ+2.58σ)=0.01。
第三章 正态分布
正态分布的概念 • 正态分布的通俗概念: 如果把数值变量资料编 制频数表后绘制频数分布图(又称直方图,它用 矩形面积表示数值变量资料的频数分布,每条直 条的宽表示组距,直条的面积表示频数(或频率 )大小,直条与直条之间不留空隙。),若频数 分布呈现中间为最多,左右两侧基本对称,越靠 近中间频数越多,离中间越远,频数越少,形成 一个中间频数多,两侧频数逐渐减少且基本对称 的分布,那我们一般认为该数值变量服从或近似 服从数学上的正态分布。
第三章 常用概率分布之正态分布
图4.13 离均差的绝对值≤1 , 2 和3 的概率值
随机变量x在区间( μ – kσ, μ + kσ )外取值的概率P ( x<μ – kσ ) + P( x>μ + kσ )为两尾概率,记为α P ( x<μ – kσ ) + P( x>μ + kσ )=α P ( x<μ – kσ ) = P( x>μ + kσ )=α/2 两尾分位数Uα
=0.0227
0.020
fN (x)
0.020
fN (x)
0.016
0.016
0.012
0.012
0.008
P( y 40) 0.9773
P( y 26) 0.2119
0.008
0.004
0.004
0.000 10 15 20 25 30 35 40 45
0.000 10 15 20 25 30 35 40 45
第三章
常用概率分布
第一节 事件与概率 第二节 概率分布 第三节 二项式分布 第四节 正态分布 第五节 样本平均数抽样分布与标准误 第六节 t分布,x2分布和F分布
第三章
常用概率分布
第一节 事件与概率 第二节 概率分布 第三节 二项式分布 第四节 正态分布 第五节 样本平均数抽样分布与标准误 第六节 t分布,x2分布和F分布
首先计算:
查附表2,当u=-0.8时,FN(26)=0.2119,说明这 一分布从-∞到26范围内的变量数占全部变量数的 21.19%,或者说,y≤26概率为0.2119. 同理可得: FN(40)=0.9773
所以:P(26<y≤40)=FN(40)-FN(26)=0.9773-0.2119
多元正态分布均值向量和协差阵的检验
而
Y n(X 0) ~ Np (0,)
故 T02 n(X 0)T 1(X 0) ~ 2( p)
(2)协差阵未知时,均值向量的检验
H0:=(0 0为已知向量),H1: 1
假设H
成立,检验统计量为
0
F (n 1) p 1T 2 ~ F ( p, n p) (n 1) p
第三章 多元正态分布均值向量和
协差阵的检验
一、均值向量的检验
二、协差阵的检验
一、均值向量 •的假设检验
1、霍特林(Hotelling)T 2分布
定义1:设X ~ N p (, ),S ~ Wp (n, ),且X与S相互独立,n p,
则称统计量 T 2 nX T S 1X的分布为非中心霍特林T 2分布,
X (i) ~ N4 (1, ), i 1,2,,10; Y(i) ~ N4 (2 , ), i 1,2,,10
且两组样本相互独立,有共同未知协方差阵 0
假设检验 H0 : 1 2 , H1 : 1 2
构造统计量
F
(n+m 2) (n+m
p 2) p
X
~N
p
(0,
2
n
)
,
在一元统计中,若 t ~ t(n 1) 分布, 则 t2 ~ F (1, n 1) 分布,即把t分布转化为F分 布来处理,在多元统计分析中统计量也有类 似的性质。
定理1:设X ~ N p (0, ), S ~ Wp (n, ),且X与S相互独立, 令 T 2 nX T S 1 X 则 n p 1T 2 ~ F ( p, n p 1)
再由样本值计算出统计量T02,比较
若T02
多元正态分布
另,x1 和
1 x1 1 2 f1 ( x1 ) exp[ ( ) ] 21 2 1 2 1 1 x2 2 f 2 ( x2 ) exp 2 2 2 2 1
x2 的边际密度函数分别是
,其中 u ~ N 2 (0, I ) ,
1 0 ,则 X 的分布就是退化的三元正 A 0 1 1 1
态分布,即 x ~ N3 (0, ) ,其中
1 0 1 0 1 1 0 1 T AA 0 1 0 1 1 0 1 1 1 1 2 1 1
(2 )
p 2
1 2
1 T 1 exp (x ) (x ) 2
专业课件讲义教材PPT文档 4
设随机向量 u ~ N P (0, I ) , 为 p 维常 数向量, A 是一个 p q 常数矩阵,则称 x Au 的分布为多元正态分布,仍记 T X ~ N ( , ) 作 ,其中 AA 。 P
专业课件讲义教材PPT文档 1
u 的均值和协方差矩阵分别为
E (u) E (u1 ),, E (u p )
V (u) E (uuT )
T
0
u12 u1u2 u1u p 1 0 0 2 u2u1 u2 u2u p 0 1 0 E I u u u u u2 0 0 1 p 2 p p 1 u 的分布称为均值为 0 ,协方差矩阵为 I 的多元正态分布,记作 u ~ N P (0, I )
第三章
第一节
多元正态分布
多元正态分布的定义
第3章 多元正态分布
©
谢中华, 天津科技大学数学系.
多元统计分析
定理 3.3.1 设 x 和 A 分别是正态总体 N p (, ) 的样本均值和样 本离差矩阵,则
1 x ~ N , ; p (1) n
yi y i ,其中 y1 , y2 , (2) A i 1
多元统计分析
1、一元正态分布的定义
定义3.1 若r.v. x 的密度函数为
1 f ( x) e 2
( x )2 2 2
x
其中 , 为常数,
0
亦称高斯 (Gauss)分布
则称 x 服从参数为 , 2 的正态分布,记作 x ~ N ( , 2 )
1 , 2
12 1 2 . 2 2 1 2
试写出x的概率密度的表达式,并观察其图像。 解 x的概率密度为
f (x) (2 )
1 2 1 2
2 2
1 2
1 1 exp (x ) (x ) 2
i i
i 1
n
i
i
ij
p p
其中 aij ( xki xi )( xkj x j )
k 1
n
3. 样本协方差矩阵 1 1 n S A (x i x)(x i x) sij p p n 1 n 1 i 1 1 n ( xki xi )( xkj x j ) 其中 sij n 1 k 1
多元统计分析
7.设 x ~ N p (, ) ,对 x, , ( 0) 作如下剖分
x1 k 1 k 11 12 k x , , x p k p k 2 2 21 22 p k k pk
多元正态分布参数的假设检验
2 22.74 32.56 51.49 61.39 9 22.62 32.57 51.23 61.39 16 23.02 33.05 51.48 61.44
3 22.60 32.76 51.50 61.22 10 22.67 32.67 51.64 61.50 17 23.02 32.95 51.55 61.62
5
武汉理工大学统计学系唐湘晋
一、Σ已知时单个总体均值向量的检验
设 X1, X2,…, Xn 是来自正态总体 N p ( μ , Σ ) 的样本, 考虑假设: H 0 :μ = μ 0 ,
H 1 :μ ≠ μ 0
a) p = 1 b) p > 1
U 1 )
T02 = n ( X − μ 0 )′ Σ − 1 ( X − μ 0 ) .
4
武汉理工大学统计学系唐湘晋
§3.2 多元正态分布的均值向量的检验
p维正态总体 N p (μ, Σ) 的统计推断问题,包括均 值向量的检验和均值的置信域问题。 p维正态随 机向量的每一个分量都是一元正态变量,若将p 维均值向量的检验问题化为p个一元正态的均值 检验问题,虽然可以使问题简化,但忽略了p个 分量间的互相依赖关系,常常得不出正确的结 论。
13
武汉理工大学统计学系唐湘晋
解:
⎡ X 1 ⎤ ⎡ 22.82 ⎤ ⎢ ⎥ ⎢ X 2 ⎥ ⎢ 32.79 ⎥ ⎥ = X=⎢ ⎢ X 3 ⎥ ⎢ 51.45 ⎥ ⎢ ⎥ ⎢ ⎥ X 4 ⎥ ⎣ 61.38 ⎦ ⎢ ⎦ ⎣
1 21 V= ∑ (Xi − X)(Xi − X)′ 21 − 1 i=1 ⎡ 70.3076 ⎤ ⎢ −52.1469 ⎥ 73.5511 ⎥ =⎢ ⎢ 3.4462 −19.3637 ⎥ 90.4098 ⎢ ⎥ 1.2022 −33.6989 40.0895⎦ −6.9624 ⎣
厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验
3
2
50.5
2.25
53
2.25
3
51
2.5
51.5
2.5
4
56.5
3.5
51
3
5
52
3
51
3
6
76
9.5
77
7.5
7
80
9
77
10
8
74
9.5
77
9.5
9
80
9
74
9
10
76
8
73
7.5
11
96
13.5
91
12
12
97
14
91
13
13
99
16
94
15
14
92
11
92
12
15
94
15
91
12.5
3.6 1992 年美国总统选举的三位候选人为布什、佩罗特和克林顿。从支
持三位候选人的选民中分别抽取了 20 人,登记他们的年龄段( x1 )、受教育
程度( x2 )和性别( x3 )资料如下表所示:
投票人
x1
x2
x3
投票人
x1
x2
x3
布什
2
1
2
1
1
11
1
1
2
2
1
3
2
12
4
1
2
3
3
3
1
13
4
0
2
4
1
3
2
14
3
4
2
5
3
1
多元正态分布
混合模型
除了高斯混合模型,还有其他类 型的混合模型,如多项式混合模 型、泊松混合模型等。
扩展应用领域
多元正态分布在许多领域都有广 泛的应用,如心理学、经济学、 生物统计学等。
THANKS
感谢观看
02
联合分布的均值向量和协方差矩阵由各个分量的均 值和协方差决定。
03
当各分量之间相互独立时,其联合分布的协方差矩 阵为各分量协方差矩阵的线性组合。
04
多元正态分布的推断
参数估计
最大似然估计
01
通过最大化样本数据的似然函数来估计多元正态分布的参数,
包括均值向量和协方差矩阵。
最小二乘估计
02
将多元正态分布的均值向量作为回归系数,利用最小二乘法进
多元正态分布
• 多元正态分布概述 • 多元正态分布的参数 • 多元正态分布的性质 • 多元正态分布的推断 • 多元正态分布在统计和机器学习中的
应用 • 多元正态分布的扩展和变种
01
多元正态分布概述
定义与性质
定义
多元正态分布是多个连续随机变量的 概率分布,其概率密度函数是多元高 斯函数。
性质
多元正态分布具有旋转对称性、椭球 等高性、边缘分布的独立性和最大熵 等性质。
当其他维度固定时,该维度的边缘分 布是关于均值对称的,且方差与该维 度与其他维度的协方差成正比。
随机变量的线性变换
对于多元正态分布的随机变量,对其 进行线性变换后,新变量的分布仍然 是多元正态分布。
线性变换包括平移、旋转、缩放等, 这些变换不会改变变量的分布形态。
随机向量的联合分布
01
对于多元正态分布的随机向量,其各分量之间的联 合分布也是正态分布。
06
第三章 多元正态分布
作业
P.91 3.6
x
2
x1 和x2 的边际密度分别是
2 1 1 x1 1 f1 ( x1 ) exp 2 1 2 1 2 1 1 x2 2 f 2 ( x2 ) exp 2 2 2 2
第三章 多元正态分布
多元正态分布是一元正态分布在多元情形下 的推广,是多元统计中最重要的一个分布,多 元分析中的许多理论都是建立Байду номын сангаас多元正态分布 的基础上。
3.1多元正态分布的定义
一元回顾
定理
f X h( y) h( y ) , y , fY ( y ) 0, 其它, 其中 min(g (), g ()), max(g (), g ()), h( y )是 g ( x) 的反函数。
x1 x x , 2
1 , 2
是 x1和 x2 的相关系数。由于 易见, 故当 1 时, 0,这时有
12 1 2 2 2 1 2
2 12 2 (1 2 ),
3.2多元正态分布的性质
例子
3.3极大似然估计及估计量的性质
一、样本的联合分布概率密度
和 的极大似然估计 二、
三、相关系数的极大似然估计
简单相关系数
和 四、 的极大似然估计的性质
3.4 x 和(n 1)S 的抽样分布
一、x 的抽样分布
(n 1) S 的抽样分布 二、
2 x1 1 1 1 f ( x1 , x2 ) exp 2 2 ( 2 1 ) 21 2 1 1
第三章正态分布.
第三章 正态分布一、教学大纲要求(一) 掌握内容1.正态分布的概念和特征 (1)正态分布的概念和两个参数; (2)正态曲线下面积分布规律。
2.标准正态分布标准正态分布的概念和标准化变换。
3.正态分布的应用 (1)估计频数分布; (2)制定参考值范围。
(二) 熟悉内容 标准正态分布表。
(三) 了解内容1.利用正态分布进行质量控制 2.正态分布是许多统计方法的基础二、教学内容精要(一)正态分布 1.正态分布若X 的密度函数(频率曲线)为正态函数(曲线)2.正态分布的特征服从正态分布的变量的频数分布由μ、σ完全决定。
(1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以x μ=为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。
σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
(二)标准正态分布1.标准正态分布是一种特殊的正态分布,标准正态分布的0=μ,12=σ ,通常用u(或Z )表示服从标准正态分布的变量,记为u ~N (0,21)。
2.标准化变换:σμ-=X u ,此变换有特性:若X 服从正态分布),(2σμN ,则u 就服从标准正态分布,故该变换被称为标准化变换。
3. 标准正态分布表标准正态分布表中列出了标准正态曲线下从-∞到u 范围内的面积比例()u Φ。
(三)正态曲线下面积分布1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。
不同),(21X X 范围内正态曲线下的面积可用公式3-2计算。
)()(2112)22(2)(21u u dx eD X X X Φ-Φ==--⎰σμπσ (3-2)1212X X u u μμσσ--==其中, , 。
2.几个重要的面积比例X 轴与正态曲线之间的面积恒等于1。
第三章多元正态分布
设x~N2(μ, Σ),这里
12
1 2
x1
1
x , μ , Σ
2
x
2
2
2
1 2
易见,ρ是x1和 x2的相关系数。当|ρ|<1时,可得x的
概率密度函数为
f x1 , x2
1
2 1 2 1 2
达为:
n
L μ, Σ f x1 , x2 ,
, x n f xi
i 1
1
1
2
Σ
exp xi μ Σ xi μ
2
i 1
n
n 2
1
p
1
2 Σ
exp xi μ Σ xi μ
μ, Σ
1
ˆ
Σ A
n
其中 x 称为样本均值向量(简称为样本均值),
μˆ x ,
n
A xi x xi x 称为样本离差矩阵。
i1
三、相关系数的极大似然估计
1.
❖ 2.
❖ 3.偏相关系数
❖
1.简单相关系数
❖
相关系数ρij的极大似然估计为
n
rij
ˆ ij
ˆ ii ˆ jj
N i , ii , i 1,2,3,4 ;
x1
(ii)
x4
1 11 14
N2 ,
;
4 41 44
x4
x
第三章多元正态总体参数的假设检验
第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布一、正态变量二次型的分布1、分量独立的n 维随机向量X 的二次型设),,1)(,(~21n i N X i i =σμ,且相互独立,记⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=n X X X 1,则),(~2n n I N X σμ,其中)',,(1n μμμ =。
X 的二次型具有以下一些结论:结论1 当),,1(0n i i ==μ,12=σ时,则)(~'212n XX X ni iχξ∑===;当),,1(0n i i ==μ,12≠σ时,则)(~'122n X X χσ(或记为)(~'22n X X χσ)。
结论2 当),,1(0n i i =≠μ,X X '的分布常称为非中心2χ分布。
Def3.1.1 设n 维随机向量)0)(,(~≠μμn n I N X ,则称随机向量X X '=ξ为服从n 个自由度、非中心参数∑===ni i 12'μμμδ的2χ分布,记为)(~'),(~'22δχδχn X X n X X 或。
若时且1),0)(,(~22≠≠σμσμn n I N X ,有)(~'122δχσn X X 。
结论3 设),0(~2n n I N X σ,A 为对称矩阵,且r A rank =)(,则二次型 A A r AX X =⇔222)(~/'χσ(A 为对称幂等矩阵)。
结论4 设),(~2n n I N X σμ,'A A =,则),(~'122δχσr AX X ,其中A A A =⇔=22'1μμσδ,且)()(n r r A rank ≤=。
结论5 二次型与线性函数的独立性:设),(~2n n I N X σμ,A 为n 阶对称矩阵,B 为n m ⨯矩阵,令)(,'维随机向量为m Z BX Z AX X ==ξ,若O BA =,则AX X BX '和相互独立。
第3章统计实验(多元正态总体检验)
实验零多元正态总体检验(均值向量检验)1.实验目的:本实验讨论利用多元正态总体检验中的均值向量检验方法去判断满足多元正态分布的总体的均值是否等于预先判断的向量(单正态总体检验)或判断两个独立的、满足多元正态分布的总体的均值是否相等(双正态总体检验)。
通过该实验,能够起到如下的效果:(1) 理解多元正态总体检验中的均值向量检验方法的作用、思想、数学基础、方法和步骤;(2) 熟悉如何利用多元正态总体检验中的均值向量检验方法,提出问题、分析问题、解决问题、得出结论;(3)会调用SAS软件实现多元正态总体检验中的均值向量检验方法的各个步骤,根据计算的结果进行分析,得出正确的结论,解决实际的问题。
2.知识准备:多元正态总体检验中的均值向量检验是从判断满足多元正态分布的总体的均值是否等于预先判断的向量(单正态总体检验)或判断两个独立的、满足多元正态分布的总体的均值是否相等(双正态总体检验)。
其思想和步骤是:1.假设“需判断的总体均值等于预先判断的向量(单正态总体检验)”或“需判断的两个总体的均值相等(双正态总体检验)”;2.在该假设下,构造适当的统计量并给出其分布;3.根据观测数据算出其统计量的值;4.根据预先确定的检验水平查阅相应的分布表确定临界值和拒绝域;5.根据结果判断接受或拒绝原假设,得出结论。
(具体见书【1】第三章)3.实验内容:一、单正态总体检验:人出汗多少与人体内钠、钾含量有一定关系。
今测20名健康成年女性出汗多少(X1)、钠含量(X2)、钾含量(X3),其数据如下表1:表1 健康成年女性出汗情况的基本数据序号X1 X2 X3 序号X1 X2 X31 3.7 48.5 9.3 11 3.9 36.9 12.72 5.7 65.1 8 12 4.5 58.8 12.33 3.8 47.2 10.9 13 3.5 27.8 9.84 3.2 53.2 12 14 4.5 40.2 8.45 3.1 55.5 9.7 15 1.5 13.5 10.16 4.6 36.1 7.9 16 8.5 56.4 7.17 2.4 24.8 14 17 4.5 71.6 8.28 7.2 33.1 7.6 18 6.5 52.8 10.99 6.7 47.4 8.5 19 4.1 44.1 11.210 5.4 54.1 11.3 20 5.5 40.9 9.4利用多元正态总体检验中的单正态均值向量检验方法判断“(X1,X2,X3)的均值是否等于(4,50,10)”【1】(假设总体服从正态分布,分别取检验水平为0.05、0.01)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的分布遵从非中心Wishart分布,记为 其中 时称为中心Wishart分布,记为
Wishart分布的基本性质:
1.设 是从P维正态总体
中随机抽取的n个样品,则样本离差阵
2.若
且相互独立,则
3.若
为非奇异矩阵,则
第六节
随机向量数字特征的上机实现
第四节 多元正态分布的参数估计 多元正态分布的参数估计.doc
第三节 多元正态分布的定义及基本性质
一、多元正态分布的定义
定义1:若p维随机向量
的密度函数为:
其中:
是p维均值向量,
是p阶正定阵,则称X服
从p元正态分布 ,记为:
当
当p等于1时,即为一元正态分布。
时,也有正态分布的定义。
二、多元正态变量的基本性质
1、若 是对角阵,则
相互独立。
2、
A为s×p阶常数阵,d为s维常数向量,则:
的分布称为t分布。记为 4. F分布 设随机变量 且x与y相互独立,则随机变量 服从自由度为(n,m)的F分布,记为
第二节 多元统计分析中的基本概念
一、随机向量及概率分布 (一)随机向量
的整体称为p维随机向量,记为:
将p个随机变量
在多元统计分析中,仍将所研究对象的全体称为总体。如果构成总体中的个
二、随机变量的数字特征 (一)离散型随机变量的数字特征
若X为离散型随机变量,其概率分布为 则X的数学期望(或称均值)和方差分别定义为:
(二)连续型随机变量的数字特征 若X为连续型随机变量,其密度函数为f(x),则X的数学期 望(或称均值)和方差分别定义为:
数学期望有如下的数学性质: 1.设C是常数,则E(C)=C 2.设X是随机变量,C是常数,则E(CX)=CE(X) 3.设X、Y是任意两个随机变量,则E(X+Y)=E(X)+E(Y) 4.设X、Y是两个相互独立的随机变量,则E(XY)=E(X)E(Y) 方差有如下数学性质: 1.设C是常数,则D(C)=0 2.设X是随机变量,C是常数,则D(CX)=C2D(X)
3、设X、Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)
三、一些重要的一元分布 1.正态分布 连续型随机变量X的概率密度函数为:
则称X服从正态分布。
2.卡方分布 设X~N(0,1), 服从自由度为n的 为抽自总体的一个样本,其平方和 分布,记为:
3.t分布 设x~N(0,1),
且x与y相互独立,则随机变量
2.随机向量的协方差矩阵 设 称
为X的方差阵或协差阵.
3.随机向量X和Y的协差阵
当X=Y时,即D(X)
4.随机向量的相关系数矩阵 若 相关阵为 的协差阵存在,且每个分量的方差都大于0,则随机向量的
5.协方差阵和相关系数矩阵的关系 设标准离差阵为 则: 协差阵有如下数学性质: 即X的协差阵为非负定阵。 对于常数向量a,有D(X+a)=D(X) 设A为常数矩阵,则 其中,a,A,B为大小 适合运算的常数向量和 矩阵。
因为:
样本离差阵的定义为:
因为:
样本协差阵定义为:
样本相关阵定义为:
其中:
三、 设 每个样品为:
的最大似然估计及基本性质
来自于正态总体 的样本(样本容量为n), 样本资料阵为:
则用极大似然估计法可求出
的估计量:
的估计量同样具有以下的优良性质:
第五节
一、样本均值向量 (一)正态总体 设
的抽样分布
对随机向机向量,它的多元分布函数定义为: 记为 其中:
1、离散型随机向量的概率分布
定义:若 记 则称X为离散型随机向量,并称 为离散型随机变量X的概率分布。 它具有两个性质: 是p维随机向量,若存在有限或可列个p维随机向量 且
2、连续型随机向量的概率分布 定义:设 使得对一切 若存在一个非负函数 有:
值得注意的是: 1、多元样本中的每个样品,对p 个指标的观测值往往是有相关关 系的,但不同样品之间的观测值 一定是相互独立的。 2、多元分析所处理的多元样本观 测数据一般都属于横截面数据, 即在同一时间不同空间上的数据。
二、多元样本的数字特征
定义:设 为来自p元总体的样本,其中:
则:样本均值向量定义为:
即正态随机向量的线性函数还是正态的。
3、 ,将 做如下剖析:
则
多元分析中的许多方法,大都假定数据来自多元正态总体。但 要 判断已有的一批数据是否来自多元正态总体,是很困难的。可是 反过来要肯定数据不是来自多元正态总体,比较容易。即如果
则它的每个分量必服从一元正态分布,因
此把每个分量的n个样品值作成直方图,如果断定不是正态分布,就可以
则称X为连续型随机向量,称 它具有两个性质: 二、随机向量的数字特征 1.随机 向量的数学期望 设 若
为分布密度函数。
存在且有限,则称
为X的均值向量或数学期望
均值向量有以下性质: 1.E(AX)=AE(X) 2.E(AXB)=AE(X)B 3.E(AX+BY)=AE(X)+BE(Y) 其中:X、Y为随机变量,A、B为适合运算的常数矩阵。
1、离散型随机变量的概率分布 若随机变量X在有限或可列个值上取值,记
且 则称X为离散型随机变量,并称
为离散型随机变量X的概率分布。 它具有两个性质: 2、连续型随机变量的概率分布 对于随机变量X的分布函数, 一切实数x有: 则称X为连续型随机变量,称f(x)为X的分布密度函数。 它具有两个性质: 若存在一个非负函数f(x),使得对
体是由p个需要观测指标的个体,称这样的总体为p维总体,或p元总体。由 于从p维总体中随机抽到一个个体,其p个指标观测值是不能事先精确知道, 它依赖于被抽到的个体,因此,p维总体可用p维随机向量来表示,这里的维 或元表示共有几个分量。例如,要研究某类企业的三项经济效益指标,则所
有这类企业的三项经济效益指标就构成了一个三元总体。
断定随机向量 不服从正态分布。
第四节
多元正态分布的参数估计
一、多元样本的概念
多元分析研究的总体是多元总体,从多元总体中随机抽取n个个体: 若 相互独立,且与总体同分布,则称
为该总体的一个随机样本 。每个
称为一个样品,
为第a个样品对第j个指标的观测值,显然每个样品都
是一个随机向量,将n个样品对p个指标都进行观测,得到如下一个随机 矩阵(观测矩阵、样本资料阵):
的分布
是从总体中抽到的一个样本,则样本均值
的分布服从正态分布,即
(二)非正态总体 中心极限定理: 是来自总体的一个样本,该总体有均值 和有限协方差阵
则当样本容量 n很大且 n相对于 p也很大时,样本平均数的分布近似于正态分布,
二、样本离差阵
Wishart分布
定义:设 维正态总体 则
的分布
分别来自于协方差阵相等的 p 维随机矩阵