数学实验和Matlab介绍.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.多元样本的相关概念
从多元总体中随机抽取n个个体。
X 1, X 2,, X n i.i.d. 简单随机样本
X a1
X a


X
a2

(a 1,2,, n) X1 X2 X p
X ap
观测矩阵(随机)
X11 X12 X1p X 1
i 1
X i1 X 1


n i 1

X
i
2


X2

X i1

X 1, Xi2

X 2 ,, X ip

X
p
Leabharlann Baidu


X
ip

X
p




2
X i1 X 1

n i 1

Xi2
ˆ X
ˆ
X
1S n 1
n
n i 1
X i
1
n

1
n


1
n
n i 1 n i 1
n i 1
X i1

X 1
X
i2



X
2


X
ip


X
p

n
多元统计分析简介
多元统计分析:通过对多个随机变量 观测数据的分析,来研究变量之间的 相互关系以及解释这些变量内在的变 化规律。
一元统计分析——一个随机变量的 统计规律
多元统计分析——多个随机变量之间的 相互依赖关系及内在统计规律性
多元统计分析应用:
经济学、工业、农业、医学、教育学、 生态学、地质学、社会学、考古学、环境 学、气象、文学等许多领域

S p p X i X X i X sij p p
i 1
ˆ和ˆ 的 估 计 量 有 如 下 性 质 :
(1)E X ,即X是的 无 偏 估 计 ;
E 1 S n 1 ,即ˆ 不 是的 无 偏 估 计 ; n n
而E 1 S , 即 1 S是的 无 偏 估 计 ;


12
a


1 2




2 1

1 2
1
2
2 2

1
1

1



2 1
(1
1
2
)

1
2
(1


2
)

1
1 2 (1 2 )

2 2
(1


2
)

f
(x1, x2 )
(2)协方差矩阵
设 X ( X1, X 2 ,, X p ),Y (Y1,Y2 ,,Yq ) 称
DX


EX

EX X

EX



11 12 1p

21


22

2p


ij
p p
p1 p2 pp
(样本资料阵) 多元分析的
X


X 21
X 22

X2
p



X 2


研究对象
X n1 X n2 X np X n
(1) 样本平均值
X11 X12 X1p X 1
X

X 21
X i X
X i X vij p p
(4) 样本相关阵

Rp p rij p p
非负定矩阵
其 中rij
vij

vii v jj
sij sii s jj
----样本相关系数
第二节 多元正态分布
1. 多元正态分布
若随机向量 1 2 p '
)
分布密度函数应满足的两个条件?
Def2:设 X ( X1, X 2,, X p ) 是p维随机向量,称由它 的q(q<p)个分量组成的子向量 X i (Xi1, Xi2,, Xiq ) 的
分布为X 的边缘分布,相对的把 X 的分布称为联合分布。
边缘分布函数和边缘分布密度可由联合分布和联合 密度确定。
多元统计分析主要内容:
1、多元正态总体的参数估计和假设检验 2、常用的处理多元数据的统计方法:
1)聚类分析 2)判别分析 3)主成分分析 4)因子分析 5)多重多元回归分析等等
第一章 多元统计中的基本概念
第一节 基本概念 第二节 多元正态分布 第三节 多元统计中的常用分布
第一节 基本概念
1.随机向量
为相关系数。
设标准离差阵为
则有
1 11
V2

0
0
pp


V
1 2
RV
1 2
,即R

V
1 2
1
V
1 2
1
称X和Y的协差阵为:
Cov( X

,Y )
EX

EX Y

EY
Cov( X1,Y1) Cov( X1,Y2 ) Cov( X1,Yq )
X 1
X
i2



X
2



X
p

n i1 X ip
(2) 样本离差阵
n

S p p X i X X i X sij p p
i 1
n

X i X X i X
n 1
n 1
(2) X , 1 S分 别 是,的 一 致(相 合)估 计 。
n 1
定 理 : 设X和S分 别 是 正态 总 体N p , 的 样 本 均值 向 量
和离差阵,则
(1)X
~
N
p


,
1 n


(2)离 差 阵S可 以 表 示为 :
n
S ZiZi i 1
为X的协差阵。 其中 ij Cov( X i , X j )
若X的协差阵存在,且每个分量的方差大于0,则称
随机变量X的相关阵为 R
rij
,其中
p p
rij
Cov X i , X j
VarXi Var X j

ij ;i, j 1,2,, p ii jj

X2
X i1

X1
Xi1 X 1 Xi2 X 2 2
Xi2 X 2


Xi1 X 1
X ip X p

Xi2

X 2 X ip

X
p

Xip X p Xi1 X 1 Xip X p Xi2 X 2 Xip X p Xip X p
样本均值和样本离差阵的矩阵表示:
X
p1

1 n
X
1n
S

X

In

1 n
1n1n
X
n

S pp X i X X i X
i 1
X X nX X
(3) 样本协差阵
Vpp


1
n
S

1 n
n i 1




2



EX p p

EXi xi f (x1, x2,, xp )dx1dx2 dxp
(i 1,2,, p)
均值向量具有如下性质:
(1)E(AX ) AE(X ); (2)E(AXB) AE(X )B; (3)E(AX BY) AE(X ) BE(Y )

1
2 1 2
1 2
exp{
2(1
1

2
)
[
(
x1


1
2 1
)2

2 ( x1
1)(x2 21 2
2)

(x2 2 )2
2
2 1
]}
2. 多元正态分布的常用性质
和的参数估计
设X 1, X 2,, X n来 自正 态 总 体N p (, )容 量为n的
1、Wishart分布
(1) Wishart分布由Wishart在1928年推导出来。
Def : 设X i X i1, X i2 ,, X ip ~ N p 0, ,i 1,2,, n,
其数学期望与协方差矩阵分别为: E a D



当a

0,0,,0,


I

p

称服 从 多 元 标 准 正 态 分 布。
特例1(一元正态分布) a ( 2 )

f (x)
1
2
exp[
(x )2 2 2
]
特例2 (二元正态分布)

Cov( X 2 ,Y1)


Cov( X 2 ,Y2 ) Cov( X 2 ,Yq )



Cov( X p ,Y1) Cov( X p ,Y2 ) Cov( X p ,Yq )
若CovX ,Y 0,则称X和Y不相关,由X和Y相互 独立可以推出CovX ,Y 0,即X和Y不相关;
分布密度函数∶ f (x) f (x1, x2 ,, xp )
x
满足
F(x) f ( y)dy
xp x1

F(x1, x2,, xp ) f ( y1, y2,, yp )dy1dy2 dyp

f
(x1,
x2
,,
xp
)


p
F(x1, x2,, xp x1x2 xp
但反过来一般不成立。
协差阵具有如下性质:(试证之)
(1)D( X ) 0;即X的协差阵非负定 (2)对常数向量a,有D( X a) D( X ) (3)D( AX ) AD( X ) A (4)Cov( AX , BY) ACov( X ,Y )B
3.多元总体
多元分析研究具有多个(如p个)属性(指标)的对象组成的 总体--多元总体。
Def1:将p个随机变量 X1, X 2,, X p 的整体称为p维随机 向量,记作 X ( X1, X 2 ,, X p ) 。
分布函数∶ F(x) P( X x)
F (x1, x2 ,, xp ) P( X1 x1, X 2 x2 ,, X p xp )
离散型:分布律 连续型:密度函数
从总体中任意抽出一个对象(总体单元),其p个属性的值
为∶
X1
X


X
2

X p
X i 为一维随机变量 (i 1,2,, p)
X 为多维随机变量
(随机向量)
多元总体∶多维随机变量(随机向量)可能取值的全体。
多元分析的任务∶分析各变量之间的关系,推断总体的性质
简单样本,每个样品X i X i1, X i2,, X ip ,i 1.2,, n
样本资料阵为:
X11 X12 X1p
X


X
21
X 22

X2p


X n1 X n2 X np
则 用 极 大 似 然 法 求 出 和的 估 计 量 分 别 为 :
Def3:若p个随机变量 X1, X 2,, X p 的联合分布等于 各自的边缘分布的乘积,则称 X1, X 2,, X p 是相互独立的。
2.随机向量的数字特征
(1)数学期望
其中,
X1
X


X2

X p
EX1 1
EX

EX2
其 中 ,Z1,Z2,,Zn1i.i.d.N p 0,
(3) X和S相 互 独 立;
分布?
第三节 多元统计中的常用分布
在一元统计中,卡方分布、t分布和F分布 在参数估计和假设检验中起着非常重要的作用。 在多元统计中,他们分别发展为Wishart分布、 Hotelling-T2分布和Wilks分布,在多元参数估 计和假设检验中占有非常重要的地位。
的分布密度函数为
f (x1, x2 ,, xp )
1
p
1
exp[
1 (x a)' 1(x a)] 2
(2 ) 2 | |2
其中 a a1 a2 ap ' ( i j ) p p 为对称正定矩阵,
则称 服从p维正态分布。记作: ~ N p a,


X 22

X2p




X 2


X n1 X n2 X np
样本平均值是n个 样本点的重心
X 1 n
X n 1 n
n

1
X i n
i 1


1
n i 1 n i 1
n
X i1
相关文档
最新文档