多元课件第三章(1)

合集下载

第三章 多元线性回归模型

第三章 多元线性回归模型


Y Xb U
X 称为数据矩阵或设计矩阵。
6
二、古典假定
假定1:零均值假定 E(ui ) 0 (i 1,2,...,n)
1 E ( 1 ) E ( ) 2 2 E (μ) E 0 n E ( n )
写成矩阵形式:
Y1 1 X 21 Y 1 X 22 2 Yn 1 X 2 n X 31 X k 1 b 1 u1 X 32 X k 2 b 2 u 2 X 3 n X kn b k un

ei 1 X 21 X e 1 X 22 2i i X ki ei 1 X 2 n X 31 X k 1 e1 X 32 X k 2 e2 X e 0 X 3 n X kn en
9
当总体观测值难于得到时,回归系数向 量 b 是未知的,这时可以由样本观测值进行 估计,可表示为
ˆ ˆ Xb Y
但实际观测值与计算值有偏差,记为:
ˆ e Y Y
于是
ˆ e Y Xb
称为多元样本回归函数。
10
ˆ b 1 ˆ b2 ˆ b ˆ b k
同理
ˆ x x b ˆ x 2 x3 i yi b 2 2i 3i 3 3i
x2 i yi x x3 i yi x2 i x3 i ˆ b2 2 2 2 x2 x ( x x ) i 3i 2i 3i
2 3i
x3 i yi x x2 i yi x2 i x3 i ˆ b3 2 2 2 x2 x ( x x ) i 3i 2i 3i

计量经济学 多元线性回归模型及参数估计ppt课件

计量经济学 多元线性回归模型及参数估计ppt课件

解 该 ( k+ 1) 个 方 程 组 成 的 线 性 代 数 方 程 组 , 即 可 得 到 (k+ 1)个 待 估 参 数 的 估 计 值 j,j0,1 ,2, ,k。
问题:我们无法象一元回归那样,用小代数 公式来表达多元线性回归模型的参数估计量!
精选课件
16
上述估计过程的矩阵表示 对于模型Y X ,如果模型的参数估计值 Bˆ
i1
i1
精选课件
17
根 据 最 小 二 乘 原 理 , 参 数 估 计 值 应 该 是 下 列 方 程 组 的 解 :
(YX )(YX )0
求解过程如下: (教材P66)
ˆ
(Y
ˆ
X
)(
Y
Xˆ )
0
注意:一个函数关于列 向量求导,是指这个函 数关于列向量中的每个 元素求导,其结果仍应 写成列向量的形式。
ˆ
( Y Y
ˆ XY
Y

ˆ XXˆ )
0
ˆ
( Y Y
2 Y X ˆ
ˆ XXˆ )
0
XY XXˆ 0
要点:若A、X均为列向 量,则 A’X 关于列向 量X的导数为A。
精选课件
18
于是,得到正规方程组:
XYXX
该式等价于P66 的(3.2.3)式
由于假定解释变量之间不存在多重共线性, X’X为 (k+1)阶满秩矩阵,可得参数的最小二乘估计值为:
(3)各个解释变量Xj在所抽取的样本中具有变异性, 而且随着样本容量的无限增加,各个解释变量Xj的样
本方差趋于一个非零的有限常数Qj。即当n→∞时,
1 ni n1(XijXj)2 精选Q 课j件, j1,2, ,k

第3章 多元线性回归模型 《计量经济学》PPT课件

第3章 多元线性回归模型  《计量经济学》PPT课件

于是:
βˆ
ˆ1 ˆ 2
0.7226 0.0003
0.0003 1.35E 07
15674 39648400
01.0737.71072
⃟ 正规方程组 的另一种写法
对于正规方程组 XY XXβˆ
XXβˆ Xe XXβˆ
于是 Xe 0 (*)

ei 0
(**)
X jiei 0
i
(*) 或( ** )是多元线性回归模型正规方程 组的另一种写法。
第三章 经典单方程计量经济学模型: 多元线性回归模型
• 多元线性回归模型 • 多元线性回归模型的参数估计 • 多元线性回归模型的统计检验 • 多元线性回归模型的预测 • 回归模型的其他形式
§ 3. 1 多元线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定
一、多元线性回归模型
多元线性回归模型 : 表现在线性回归模型 中的解释变量有多个。
的秩 =k+1 ,即 X 满秩。
假设 2. 随机误差项零均值,同方差。
0
0
0
E

μ
)
E
1
n
1
n
E
12
n 1
1 n
2 n
var(1 ) cov(1, n ) 2 0
2I
cov(
n
,
1
)
var(n )
0
2
i E(i )
βˆ (xx)1 xY
ˆ0 Y ˆ1 X 1 ˆk X k
⃟ 随机误差项的方差的无偏估计
可以证明,随机误差项的方差的无偏 估计量为:
ˆ 2
ei2 n k 1
ee n k 1

高中化学 人教版选修4 课件:第三章 第一节 第2课时 弱电解质的电离(36张PPT)

高中化学 人教版选修4 课件:第三章 第一节 第2课时 弱电解质的电离(36张PPT)
栏 目 链 接
五、设计实验验证时注意等物质的量浓度和等pH的两种 酸的性质差异。
实验设计思路:以证明某酸(HA) 是弱酸为例
栏 目 链 接
尝试
应用 2.常温下,下列有关酸HA的叙述中,不能说明HA是弱 酸的是( ) ②测0.01 mol/L
栏 目 链 接
①取0.1 mol/L HA溶液,其溶液pH为2 NaA溶液,其溶液pH大于7 泡发光很暗 HA酸加水量多
第三章
水溶液中的离子平衡第一节
第一节 弱电解质的电离
第2课时 弱电解质的电离
栏 目 链 接
1.掌握弱电解质的电离平衡。
2.了解影响电离平衡的因素。
3.了解电离常数的意义。
栏 目 链 接
栏 目 链 接
要点一
1.概念
弱电解质的电离平衡
在一定条件(如温度、浓度一定)下,弱电解质在溶液中 电离成离子 __________的速率和 离子结合成分子 __________ 的速率相等,电离过程 就达到了平衡状态。 2.电离平衡的建立过程(用vt图象描述)
栏 目 链 接
多元弱酸各步电离常数大小的比较为K1≫K2≫K3,因此
多元弱酸的酸性主要由第一步电离所决定 (八字诀:分步进 行,一步定性)。
栏 目 链 接
四、一元强酸与一元弱酸的比较
♨ 特别提示:判断一种酸是强酸还是弱酸时,实质是 看它在水溶液中的电离程度,完全电离即为强酸,不完全电 离即为弱酸。
mol/L的NaA溶液,其溶液的pH大于7,说明NaA是强碱弱
酸盐,所以能说明HA是弱酸,故不选;③用HA溶液做导电 性实验,灯泡发光很暗,只能说明溶液中氢离子浓度较小,
栏 目 不能说明该酸的电离程度,所以不能说明该酸是弱酸,故选; 链 ④等体积pH=4的盐酸和HA稀释到pH=5,HA加水量多, 接

多元课件第三章

多元课件第三章

H H D D ' ' ' 11 1 2 rO rO AB B O H H O O O O 21 2 2
22
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
结论2 当μi≠0(i=1,„,n),σ2 =1时,X′X的 分布常称为非中心χ2分布. 定义3.1.1 设n维随机向量X~Nn(μ,In)
(μ≠0),则称随机变量ξ=X'X为服从 n n个自由度,非中心参数 i2 i 1` 2 的χ 分布,记为
2 2 n
X X ~ ( n , ), X X ~ ( )
第三章 多元正态总体参数的假设检验
一元统计中,参数μ ,σ 2的检验 涉及到一个总体、二个总体,乃至 多个总体的检验问题; 推广到p元统计分析中,类似地 对参数向量μ 和参数矩阵Σ 涉及 到的检验也有一个总体、二个总体 ,乃至多个总体的检验问题。
3
第三章 多元正态总体参数的假设检验
在一元统计中,用于检验μ, σ2的抽 样分布有χ2分布,t 分布,F分布等,它们都 是由来自总体N(μ, σ2)的样本导出的检验 统计量. 推广到多元统计分析后,也有相应于 以上三个常用分布的统计量: Wishart, Hotelling T 2,Wilks Λ统计 量,讨论这些统计量的分布是多元统计分 析所涉及的假设检验问题的基础.
6
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
1 1 2 则Y Y X X ~ ( n , ), 其中 2 2


结论3 设X~Nn(0 ,σ2In), A为n阶对称方阵, rk(A)= r,则 二次型 X'AX/σ2~χ2(r) A2=A(A为对称幂等阵). 2 2 2 特例:当A=In时, X I X / X X / ~ ( n ) n

3.1 多元线性回归模型及古典假定

3.1 多元线性回归模型及古典假定
第三章 多元线性回归模型
第一节 多元线性回归模型及古典假设
一、多元线性回归模型及其矩阵表示 二、多元线性回归模型的古典假设
一、多元线性回归模型及其矩阵表示
1、在计量经济学中,将含有两个以上解释变量的回归模 型称为多元回归模型。相应地,在此基础上进行的回归分析 就叫多元回归分析。如果总体回归函数描述了一个应变量与 多个解释变量之间的线性关系,由此而设定的回归模型就称 为多元线性回归模型。例如:在生产理论中,C—D生产函 数描述了产量与投入要素之间的关系,其形式为: Y=AKαLβ (Y为产量,K、L分别为资本和劳动投入,α,β 为参数). 利用对数变换,可将其转化为:㏑Y=㏑A+α㏑K+β㏑L 在进行回归分析时,可设定如下形式的回归模型: (㏑Y)i= α0+α(㏑K)i+β(㏑L)i+μi (3.1.1) 回归模型3.1.1就是一个二元线性回归模型。
这就是多元线性回归模型的一般形式。(Yi,X2i,X3i,…,XKi )为 第 i 次观测样本,βj(j=1,2, …,k) 为模型参数,μi为随机误差项。
在多元线性回归模型中,所有解释变量会同时对应变量Y的 变动发挥作用,所以,我们考察其中某个解释变量对应变量Y的 影响,必须是其它解释变量保持不变来进行。模型中的回归系 数βj(j=2, …,k) 就表示在其它解释变量不变的条件下,第 j 个解 释变量的单位变动对应变量Y的影响。由式3.1.3,可得Y的条件 期望函数:E(Y|X2i,X3i,…,XKi )= β1i+β2X2i+β3X3i+…+βKXKi
1 X 2n
X 31 X 32 X 3n
X K1
XK2

第三章(1) 多元线性回归模型课件

第三章(1) 多元线性回归模型课件

分离差的大小
解释的那部分离差的大小。也
称剩余平方和。
第三章 多元线性回归模型
§ 3-3 多元线性回归模型的统计检验 一、 拟合优度检验 检验模型对样本观测值的拟合程度。用在总离差分解 基础上确定的可决系数R2 (调整的可决系数 ) 度量。 1、总离差平方和的分解
总离差平方和TSS 回归平方和ESS
3、随机误差项在不同 样本点之间是独立的,
Cov( i,
不存在序列相关
因为 i与 j相互独立,有:
j)=0 i≠j
无自相关假定表明:产生 误差(干扰)的因素是完 全随机的,此次干扰与彼 次干扰互不相关,互相独 立。由此应变量Yi的序列 值之间也互不相关。
第三章 多元线性回归模型
§ 3-1 多元线性回归模型及其基本假定
3、有效性(最小方差性):
指在所有线性、无偏估计量中, OLS参数估计量的 方差最小。
4、 服从正态分布,即:
其中,
, G2是随机误差项的方差,
Cjj是矩阵(X’X)-1 中第j行第j列位置上的元素。
第三章 多元线性回归模型
§ 3-2 多元线性回归模型的参数估计
一、 参数的最小二乘估计
二、 OLS估计量的统计性质及其分布
三、随机误差项方差Q2的估 计
参数估计的另一项任务是: 求随机误差项 i 的分布参数
称作回归标准差 (standard error of regression), 常作为对所估计回归线的拟
合优度的简单度量。
i~N(0, Q2)
随机误差项 i 的 方差的估计量为:
可以
证明:
说明 是QS 的无偏估计量。
t-Statistic 6.411848 22.00035 4.187969

多元统计分析(何晓群 中国人民大学) 第三章

多元统计分析(何晓群 中国人民大学)  第三章
• 为此最常用的技巧是聚类分析,聚类分析将个体或对 象分类,使得同一类中的对象之间的相似性比与其他 类的对象的相似性更强。目的在于使类间对象的同质 性最大化和类与类间对象的异质性最大化。本章将介 绍聚类分析的性质和目的,并且引导研究者使用各种 聚类分析方法。
2021/1/28
中国人民大学六西格玛质量管理研究中心
2021/1/28
中国人民大学六西格玛质量管理研究中心
23
目录 上页 下页 返回 结束
§3.2 相似性度量
2021/1/28
中国人民大学六西格玛质量管理研究中心
24
目录 上页 下页 返回 结束
§3.2 相似性度量
(2) 相关系数。这是大家最熟悉的统计量,它 是将数据标准化后的夹角余弦。
有时指标之间也可用距离来描述它们的接近程度。 实际上距离和相似系数之间可以互相转化,
• 与多元分析的其他方法相比,聚类分析的方法是 很粗糙的,理论上还不完善,但由于它能解决许 多实际问题,很受人们的重视,和回归分析、判 别分析一起被称为多元分析的三大方法。
2021/1/28
中国人民大学六西格玛质量管理研究中心
7
目录 上页 下页 返回 结束
§3.1 聚类分析的思想
• 3.1.2 聚类的目的
(2)一种改进的距离就是在前面曾讨论过 的马氏距离,它对一切线性变换是不变 的,不受指标量纲的影响。它对指标的 相关性也作了考虑,我们仅用一个例子 来说明。
2021/1/28
中国人民大学六西格玛质量管理研究中心
16
目录 上页 下页 返回 结束
§3.2 相似性度量
2021/1/28
中国人民大学六西格玛质量管理研究中心
2021/1/28

第3章 多元正态分布

第3章 多元正态分布
2019/1/19
©
谢中华, 天津科技大学数学系.
多元统计分析
定理 3.3.1 设 x 和 A 分别是正态总体 N p (, ) 的样本均值和样 本离差矩阵,则
1 x ~ N , ; p (1) n
yi y i ,其中 y1 , y2 , (2) A i 1
多元统计分析
1、一元正态分布的定义
定义3.1 若r.v. x 的密度函数为
1 f ( x) e 2
( x )2 2 2
x
其中 , 为常数,
0
亦称高斯 (Gauss)分布
则称 x 服从参数为 , 2 的正态分布,记作 x ~ N ( , 2 )
1 , 2
12 1 2 . 2 2 1 2
试写出x的概率密度的表达式,并观察其图像。 解 x的概率密度为
f (x) (2 )
1 2 1 2
2 2

1 2
1 1 exp (x ) (x ) 2
i i

i 1
n
i
i
ij
p p
其中 aij ( xki xi )( xkj x j )
k 1
n
3. 样本协方差矩阵 1 1 n S A (x i x)(x i x) sij p p n 1 n 1 i 1 1 n ( xki xi )( xkj x j ) 其中 sij n 1 k 1
多元统计分析
7.设 x ~ N p (, ) ,对 x, , ( 0) 作如下剖分
x1 k 1 k 11 12 k x , , x p k p k 2 2 21 22 p k k pk

第三章多元正态分布

第三章多元正态分布
的任一线性函数 F=l1x1+⋯+ lp xp与x1,⋯,xp的复相关系数为1。 证明
F 1,, p max F , a1 x1 a p x p F , l1 x1 l p x p 1 F 1,, p 1
(4)设 x~N p (μ, Σ),对 x, μ, Σ(>0) 作剖分:
x1 k μ1 k Σ11 Σ12 k x , μ , Σ pk x μ Σ Σ p k p k 22 2 2 21 k pk
则子向量 x1和 x2 相互独立,当且仅当Σ12=0。
对于多元正态变量,其子向量的条件分布仍是(多元) 正态的。
例5. 设 x~N3(μ, Σ),其中
1 μ 0 , 2 16 4 2 Σ 4 4 1 2 1 4
x2 x3 试求给定x1+2x3时, x 的条件分布。 1
2 2
上述等高线上的密度值:
2 1 c f x1 , x2 exp 2 2 1 2 1 2 2 1
二元正态分布的 密度等高线族
0
0
§2.2.2 多元正态分布的性质
(1)设 x 是p维随机向量,则 x 服从多元正态分布 它的任何线性函数 ax 均服从一元正态分布。
§2.2.4 极大似然估计及 估计量的性质
数理统计方法,特点是推断和分析从样本出发。 一、样本 x1,x2, ⋯,xn的似然函数 二、 μ和Σ的极大似然估计 三、相关系数的极大似然估计 四、估计量的性质
设x~Np(μ, Σ) , Σ>0,x1,x2, ⋯,xn是从总体 x 中抽取的简单随机样本(简称为样本), 即满足:x1,x2, ⋯,xn独立,且与总体分布相同。 令

第三章第一节 多元线性回归模型及古典假定

第三章第一节 多元线性回归模型及古典假定
例如,对人均国民生产总值(Y)的影响因素(X)有: 人口变动因素、固定资产数、货币供给量、物价 指数、国内国际市场供求关系等 。
假设我们要研究商品的需求。
建模:很自然会想到商品需求(Q)是商品价格(P)的函数,
其它因素微不足道,所以建立模型:Qi =a+bPi +ui 估计:我们可以得到Q、P的样本观测值,并利用ols求出a、b。
其中: Y

Y1 Y2


1 X 21 X 31 X 1 X 22 X 32

Yn

n1
1 X 2n X 3n

1



2

3 31
n3
u1
U

u2


un

n1
推广:Y与(K 1)个解释变量X 2 , X 3 ,, X K 之间有线性关系
u1 Eu1 0
E (U
)

E
u2



Eu2


0

un


Eun


0
2、同方差和无自相关性 COV (ui , uk ) E[(ui Eui )(uk Euk )]
2 , i k
E(Y X 2i , X3i ,, X ki ) 1 X2 2i X3 3i Xk ki
Yi E(Y X 2i , X3i , , X ki ) ui 1 2 X 2i 3 X3i k X ki ui
样本回归函数(SRF)
矩阵形式
Y X U
Y1 1

3chapter1(1)多元函数的概念、极限与连续

3chapter1(1)多元函数的概念、极限与连续
P P0
数,且 P0 是 f (P ) 的定义域的内点,则 f (P ) 在

P0
处连续,于是
lim
P P0
f (P)
f (P0 ).
ex10. 求 lim xy 1 1. x0 xy
y0
Solution. 原式 lim xy 1 1 x0 xy( xy 1 1)
Chapter 1(1)
多元函数的概念、 极限与连续
教学要求:
1. 理解多元函数的概念; 2. 了解二元函数的极限与连续性的概念以及有界闭
区域上连续函数的性质.
一. 预备知识 二. 多元函数的概念 三. 多元函数的极限 四. 多元函数的连续性
一. 预备知识
1. 邻域
设P0 ( x0 , y0 )是xoy 平面上的一个点, 是某 一正数,与点P0 ( x0 , y0 )距离小于 的点P( x, y) 的全体,称为点P0 的 邻域,记为U (P0 , ) ,
xy 0 . 原结论成立.
x2 y2
ex7. 计算 lim ( x sin 1 y cos 1 ).
x0
y
x
y0
Solution. 0 x sin 1 y cos 1
y
x
x sin 1 y cos 1
y
x
x y 0 ( x 0, y 0)
由夹逼准则得,lim ( x sin 1 y cos 1 ) 0.
Solution. z ln[ x( x y)]的定义域为 x( x y) 0,
z
ln
x
ln( x
y)的定义域为
x x
0 y
, 0
z ln[ x( x y)]与z ln x ln( x y)不是同一函数

《多元统计分析》第三章聚类分析

《多元统计分析》第三章聚类分析

图像处理
聚类分析可用于图像分割、目 标检测等任务,提高图像处理 的效率和准确性。
社交网络
通过聚类分析,可以发现社交 网络中的社区结构,揭示用户 之间的关联和互动模式。
聚类分析的常用方法
K-均值聚类
一种迭代算法,通过最小化每个簇内对象与簇质 心的距离之和来实现聚类。需要预先指定簇的数 量K。
DBSCAN
感谢聆听
聚类结果的优化方法
层次聚类法
通过不断合并或分裂簇来优化聚类结果,可以灵活处理不同形状 和大小的簇,但计算复杂度较高。
基于密度的聚类法
通过寻找被低密度区域分隔的高密度区域来形成簇,可以发现任意 形状的簇,但对参数敏感。
基于网格的聚类法
将数据空间划分为网格单元,然后在网格单元上进行聚类,处理速 度较快,但聚类精度受网格粒度影响。
一种基于密度的聚类方法,通过寻找被低密度区 域分隔的高密度区域来实现聚类。可以识别任意 形状的簇,且对噪声数据具有较强的鲁棒性。
层次聚类
通过计算对象之间的距离,逐步将数据集构建成 一个层次结构的聚类树。可以分为凝聚法和分裂 法两种。
谱聚类
利用图论中的谱理论进行聚类分析,将数据集中 的对象表示为图中的节点,节点之间的相似度表 示为边的权重。通过求解图的拉普拉斯矩阵的特 征向量来实现聚类。
药物发现
通过对化合物库进行聚类分析,研究人员可以发现具有相 似化学结构和生物活性的化合物,从而加速新药的发现和 开发过程。
生物信息学
在基因表达谱、蛋白质互作网络等生物信息学研究中,聚 类分析可以帮助研究人员发现基因或蛋白质之间的功能模 块和调控网络。
在社交网络中的应用案例
社区发现
聚类分析可用于识别社交网络中的社区结构,即具有相似兴趣、行为或属性的用户群体。 这有助于社交网络运营商为用户提供更加个性化的推荐和服务。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

7
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量的二次型
结论4 设X~Nn(μ,σ2In), A为对称阵,且 rk(A)=r, 则二次型
1

2
X AX ~ (r , ), 其中
2
1
A2=A(A为对称幂等阵).
2
A.
作为σ 的估计,而且知道
n 1 2 2 s ( X X ) 一元统计中,用样本方差 (i ) n 1 i 1 2
1

2
(X
i 1
n
(i )
X ) ~ (n 1)
2 2
36
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--Wishart分布(威沙特分布)
推广到p维正态总体时,随机矩阵W的分布是 什么? 定义3.1.4 设X(α) ~Np(0,Σ) (α=1,…,n)相 n 互独立,则称随机矩阵 W X X X X ( ) ( )
1
的分布为Wishart分布(威沙特分布),记 为W~Wp(n,Σ). n 2 2 2 W X ~ (n) , 即 显然p=1时 ( )
2
北大数学学院
第三章 多元正态总体参数的假设检验
一元统计中,参数μ ,σ 2的检验 涉及到一个总体、二个总体,乃至 多个总体的检验问题; 推广到p元统计分析中,类似地 对参数向量μ 和参数矩阵Σ 涉及 到的检验也有一个总体、二个总体 ,
3
北大数学学院
第三章 多元正态总体参数的假设检验
在一元统计中,用于检验μ, σ 2的抽 样分布有χ2分布,t 分布,F分布等,它们都 是由来自总体N(μ, σ 2)的样本导出的检 验统计量. 推广到多元统计分析后,也有相应于 以上三个常用分布的统计量: Wishart, Hotelling T 2,Wilks Λ统计 量,讨论这些统计量的分布是多元统计分 析所涉及的假设检验问题的基础.
应用多元统计分析
第三章 多元正态总体
参数的假设检验(一)
1
第三章 多元正态总体参数的假设检验
北大数学学院
目 录( 一 )
§3.1 几个重要统计量的分布
一、正态变量二次型的分布 二、威沙特分布 三、霍特林T2分布 四、威尔克斯统计量
§3.2 单总体均值向量的检验及置信域 §3.3 多总体均值向量的检验
1
38
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--Wishart分布(威沙特分布)
一般地,设X(α)~Np(μ,Σ) (α=1,…,n) 相互独立, 记
则称W=X'X服从非中心参数为Δ的非中心 Wishart分布,记为W~Wp(n,Σ,Δ).
其中
39
北大数学学院
A Z Z
n 1
而Zα~Np(0,Σ)(α=1,…,n-1)相互独立,由定 义 3.1.4可知A~Wp(n-1,Σ).
41
1
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--Wishart分布的性质
由于Wishart分布是χ2分布的推广,它具有χ2分 布的一些性质.
27
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
rk(A)=r. 则(X-μ)′A(X-μ) ~χ2 (r) ΣAΣAΣ=ΣAΣ . 证明 因Σ>0,则rk(Σ)=p.因Σ为对 称阵,故存在正交阵Γ,使得
结论2 设X~Np(μ,Σ),Σ>0,A为对称阵,
推广到p元正态总体,样本协差阵S=A/(n-1) 及随机矩阵A(离差阵)的分布是什么? 设X(α) (α=1,…,n)为来自Np(0,Σ)的随机样本, 考虑随机矩阵 X (1) n W X ( ) X ( ) X (1) , , X ( n ) X X pn n p 1 X (n) 的分布.当p=1时,
ΣAΣAΣ=ΣAΣ .
30
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
结论3 设X~Np(μ,Σ),Σ>0,A和B为p阶 注意:修改P55倒2行 对称阵,则 (X-μ)′A(X-μ)与(X-μ)′B(X-μ)独立
ΣAΣBΣ=Op×p.
§3.1 几个重要统计量的分布--非中心t分布的应用
当否定H0 第一类错误的概率=P{“以真当假”} =P{|T|>λ|μ=μ0 =显著性水平α. 当H 0 第二类错误的概率=P{“以假当真”} =P{|T|≤λ|μ=μ1 ≠μ0 } 此时检验统计量T~t(n-1,δ),利用非中心 t分 布可以计算第二类错误β的值.
证明
结论1 设X~Np(μ,Σ),Σ>0,则X'Σ-1 X~
因Σ>0,由正定阵的分解可得 Σ=C C′(C为非退化阵). 令Y=C -1X (即X=CY),则 Y~Np(C -1μ,C -1 Σ(C -1)′), 因Σ=CC′,所以Y~Np(C -1μ,Ip). 且 X′Σ-1X=Y ' C'Σ-1 CY=Y ' Y~χ2(p,δ), 其中δ=(C -1μ)′(C -1μ)=μ'Σ-1μ.
1 1
n
n
d
由定义3.1.4有:
Y Y ~ W
1 n m
(n, CC), 故CWC ~ Wm (n, CC).
31
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
由“1.结论6”知ξ与η相互独立
32
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--非中心 t 分布和F分布
定义3.1.2
定义3.1.3
33
北大数学学院
4
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
设Xi ~N1(μi ,σ2)(i =1,...…,n),且相互独立,记
结论1
一般情况(μi =0,σ2 ≠1时),
5
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
Dr O ' Dr O H11 H12 ' ' AB B O O O O O H 21 H 22
22北大数学学院来自第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
χ2(p,δ),其中δ=μ'Σ-1 μ.
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--Wishart分布(威沙特分布)
当X(α)~Np(μα ,Σ) (α=1,…,n) 相互独立时,非 中心参数
这里 其中p为随机矩阵W的阶数,n为自由度,一元统计 中的σ2对应p元统计中的协差阵Σ.
40
北大数学学院
第三章 多元正态总体参数的假设检验
21
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
③且
又因为 X' BX=Y 'Γ'BΓ Y= Y 'HY, 其中H=Γ‘BΓ 。④如果由AB=O,能够证明 X′BX可表示为Yr+1,…,Yn的函数,即H 只是右下子块H22为非O的矩阵。 则X′AX 与X′BX相互独立。
42
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1
证明 因 W Z Z ~ Wp (n, )
1
几个重要统计量的分布--Wishart分布的性质 d n
其中 Zα~Np(0,Σ)(α=1,…,n)相互独立. 令Yα=CZα,则Yα~Nm(0,CΣC′). 故
CZ Z C CWC Y Y

1/ 2

1/ 2
28
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
注意:修改P55

这里
29
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
由以上“1.结论3”的证明知

两边左右乘Σ1/2,即得
作业1:证明充分性(习题3-1 )
(充分性的证明类似于结论3中充分性的证 明方法,必要性证明不要求)
13
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
结论5 二次型与线性函数的独立性: 设X~Nn(μ,σ2In), A为n阶对称阵, B为m×n阵,令ξ=X'AX,Z=BX(Z为m维 随机向量),若BA=O,则BX和X'AX相互独 立. 证明 设rk(A)=r>0 (当r=0时A=0, 结论显然成立),存在正交阵Γ使
17
北大数学学院
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
结论6 两个二次型相互独立的条件: 设X~Nn(μ,σ2In), A,B为n阶对称阵则 AB =O X'AX与X'BX相互独立. 作业2:证明必要性(习题3-2) 证明必要性的思路:记rk(A)=r. ①因A为n阶对称阵,存在正交阵Γ,使得 Γ'AΓ=diag(λ1,…,λr 0,..,0) ②令Y=Γ' X,则Y~Nn(Γ'μ,σ2In),
相关文档
最新文档