《应用多元分析》第三版PPT(第四章)

合集下载

《多元统计分析》PPT课件

《多元统计分析》PPT课件
上式中的第一项Y’ Σ-1Y与i无关,则舍去,得一个等价的函数
gi (Y ) 2y1i i1i
将上式中提-2,得
gi
(Y )

2(y
1 i

0.5i1i)
令 fi (Y ) (y1i 0.5i1i)
则距离判别法的判别函数为:
§2 距离判别
(一)马氏距离
距离判别的最直观的想法是计算样品到第i类 总体的平均数的距离,哪个距离最小就将它判 归哪个总体,所以,我们首先考虑的是是否能 够构造一个恰当的距离函数,通过样本与某类 别之间距离的大小,判别其所属类别。
设 x (x1, x2,, xm )和 y ( y1, y2,, ym ) 是从
样本,来检验方法是否稳定的问题。
判类
原类
G1 G2 Gk
G1
G2
合计

Gk
m11
m12

m1k
n1
m21
m22

m2k
n2




mk1
mk 2

mkk
nk
简单错判率:p
1 n
k i 1
k
mij
j 1
ji
加权错判率:
设qi是第i类的先验概率, pi是第i类的错判 概率,则加权错判率为
1 1

1
1 1
)
2y1(1 2 ) (1 2 )1(1 2 )

2[y

(1
2
2
)]1 (1

2
)
令 1 2
2
1(1 2 ) (a1, a2,, ap )

《多元统计分析》课件

《多元统计分析》课件

采用L1正则化,通过惩罚项来选择最重要 的自变量,实现特征选择和模型简化。
比较
应用场景
岭回归适用于所有自变量都对因变量有影 响的情况,而套索回归更适用于特征选择 和模型压缩。
适用于数据集较大、自变量之间存在多重 共线性的情况,如生物信息学数据分析、 市场细分等。
主成分回归与偏最小二乘回归
主成分回归
适用于自变量之间存在多重 共线性的情况,同时要求高 预测精度,如金融市场预测 、化学计量学等。
06 多元数据的典型相关分析
典型相关分析的基本思想
01
典型相关分析是一种研究多个 随机变量之间相关性的多元统 计分析方法。
02
它通过寻找一对或多个线性组 合,使得这些线性组合之间的 相关性达到最大或最小,从而 揭示多个变量之间的关系。
原理
基于最小二乘法原理,通过最小化预 测值与实际值之间的平方误差来估计 回归系数。
应用场景
适用于因变量与自变量之间存在线性 关系的情况,如预测房价、股票价格 等。
注意事项
需对自变量进行筛选和多重共线性诊 断,以避免模型的不稳定性和误差。
岭回归与套索回归
岭回归
套索回归
是一种用于解决多重共线性的回归方法, 通过引入一个小的正则化项来稳定系数估 计。
层次聚类
01
步骤
02
1. 将每个数据点视为一个独立的集群。
2. 计算任意两个集群之间的距离或相似度。
03
层次聚类
01 3. 将最相近的两个集群合并为一个新的集群。 02 4. 重复步骤2和3,直到满足终止条件(如达到预
设的集群数量或最大距离阈值)。
03 应用:适用于探索性数据分析,帮助研究者了解 数据的分布和结构。

应用多元分析》第三版PPT(第一章)

应用多元分析》第三版PPT(第一章)
分不同类别。构建判别函数的方法包括线性判别分析和非线性判别分析。验证 判别函数的准确性可以通过交叉验证等技术实现。应用判别函数时,需要将数 据带入判别函数中,根据判别函数的输出结果进行分类。
回归分析
• 总结词:回归分析是一种统计方法,用于探索和描述变量之间的关系。 • 详细描述:回归分析通过建立回归模型,描述一个或多个自变量与因变量之间
K-均值聚类
K-均值聚类是一种基于划分的聚类方法,通过将数据点分配到K个中心点,使得每个 数据点到其所在类别的中心点的距离之和最小。
K-均值聚类的优点是计算效率较高,适用于大规模数据的聚类分析。
K-均值聚类的缺点是需要预先设定类别数K,且对初始中心点的选择敏感,容易陷入 局部最优解。
05 多元数据的判别与回归分 析
平行坐标系
通过平行坐标系展示多维 数据,可以清晰地展示数 据的分布和变化趋势,并 方便进行数据比较。
数据的中心趋势与离散程度
01
02
03
04
均值
计算各个变量的均值,可以反 映数据的中心趋势。
中位数
计算各个变量的中位数,可以 反映数据的中心趋势。
标准差
计算各个变量的标准差,可以 反映数据的离散程度。
应用多元分析》第三版ppt(第一 章)
目 录
• 引言 • 多元数据的描述性统计 • 多元数据的降维技术 • 多元数据的分类与聚类 • 多元数据的判别与回归分析 • 多元数据的典型相关分析
01 引言
多元分析的定义与重要性
定义
多元分析是一门研究多个变量之间关 系的学科,通过统计方法对多个变量 进行描述、探索和建模,以揭示变量 之间的内在联系和规律。
相似性度量
用于衡量数据点之间的相似程度 ,常见的相似性度量方法有皮尔 逊相关系数、余弦相似度等。

《应用多元分析》第三版

《应用多元分析》第三版

v Ø
例1.2.2 用矩阵分块方法证明正交矩阵A:p×p的p 个列向量和p个行向量都是一组正交单位向量。 证明 将矩阵A分别按列向量和行向量分块,并记
a(′1) a(′2 ) A = ( a1 , a2 ,L , a p ) = M a(′ p ) ′ a1 a′ 2 ( a , a ,L , a ) = I p M 1 2 ′ ap
v
若将矩阵A的行与列互换,则得到的矩阵称为A的转 置,记作A′,即 a11 a 12 A′ = M a1q a21 L a p1 a22 L a p 2 M M a2q L a pq
v
若方阵A满足A′=A,则称A为对称矩阵。显然, aij=aji。向量和矩阵的迹
一、特征值和特征向量 v 二、矩阵的迹
v
一、特征值和特征向量
v
v
v
设A是p阶方阵,若对于一个数λ,存在一个p维非零向量x, 使得Ax=λx,则称λ为A的一个特征值或特征根,而称x为A 的属于特征值λ的一个特征向量。 依该定义有,(A−λI)x=0,而x≠0,故必有 |A−λI|=0 |A−λI|是λ的p次多项式,称为特征多项式。上式有p个根 (可能有重根),记作λ1,λ2,⋯,λp,它们可能为实数,也可能 为复数(虽然A是实数矩阵)。反过来,若λi是上式的一个根 ,则A−λiI为退化矩阵,故存在一个p维非零向量xi,使得 (A−λiI)xi=0 即λi是A的一个特征值,而xi是相应的特征向量。 今后,一般取xi为单位向量,即满足xi′xi=1。
矩阵秩的基本性质
v v
v v v v
(1)rank(A)=0,当且仅当A=0。 (2)若A为p×q矩阵, 且A≠0,则1≤rank(A)≤min{p,q}(若 rank(A) =p,则称A为行满秩的;若rank(A)=q,则称A为列满秩的)。 (3)rank( AA )=rank( 0 A′)。 0 A rank = rank =rank ( A ) + rank ( B ) 0 B B 0 (4) 。 (5)rank(AB)≤min{rank(A),rank(B)}。 (6)若A和C为非退化方阵,则 rank(ABC)=rank(B) (7)p阶方阵A是非退化的,当且仅当rank(A)=p(称作A满秩)。 (8)rank(AA′)=rank(A′A)=rank(A)。

应用多元统计分析.ppt

应用多元统计分析.ppt

多元统计分析研究 的对象就是多 维随机向量.
第一章
§1.1


引言--多元分析的研究对象和内容
研究的内容既包括一元统计学中某 些方法的直接推广,也包括多个随机 变量特有的一些问题。
多元统计分析是一类范围很广 的理论和方法。
第一章
§1.1


引言--多元分析的研究对象和内容
就以学生成绩为例,我们可以研究很多 问题:用各科成绩的总和作为综合指标来 比较学生学习成绩的好坏(如成绩好的与成 绩差的,又如文科成绩好的与理科成绩好 的);研究各科成绩之间的关系(如物理 与数学成绩的关系,文科成绩与理科成绩 的关系);……等等。所有这些都属于多 元统计分析的研究内容。
课程其它事项

教学软件: R 课程主页: 课程评估:

作业 : 期中 : 期末 :
10% 40% 50%

答疑时间: 周二 9:30—11:30
第一章
§1.1

引 言

在实际问题中,很多随机现象涉及到 的变量不止一个,而经常是多个变量,而 且这些变量间又存在一定的联系。我们常 常需要处理多个变量的观测数据。例如考 察学生的学习情况时,就需了解学生在几 个主要科目的考试成绩。 下表给出从某年级随机抽取的12名学 生中5门主要课程期末考试成绩。
0 . 1025 X 0 . 2852 X 4 12 Z1是12个变量的线性组合,且系数都是正数, 数值有大有小。显然数值大的变量对综合指标 (主成分)的贡献大;数值小的变量对综合指 标(主成分)的贡献小。
教育学-主成分分析在学生学习成绩排序中的应用
12个原始变量(课程)提供的信息各为多少?用什 么量来表达?最经典的方法是用变量的方差Var(Xi)为 多少来表达。 如果某课程全班学生的成绩都差不多,比如都是80 分左右,则这门课程在学生成绩的排序中不起什么作 用。这反映在原始变量的线性组合Z1 (第一主成分) 上该变量对应的系数会很小(如0.1025). 如果另一门课程全班学生的成绩相差很大,有的 100分,有的只有30多分,则这门课程在学生成绩的 排序中起的作用很大。这反映在原始变量的线性组合 Z1 (第一主成分)上该变量对应的系数会很大(比如 0.4525).

应用多元统计分析课后习题答案高惠璇第四章部分习题解答市公开课获奖课件省名师示范课获奖课件

应用多元统计分析课后习题答案高惠璇第四章部分习题解答市公开课获奖课件省名师示范课获奖课件

0
2
)
3 2

2
)
3 2
ˆ 2 ˆ 0 2
3
2
V
3 2
下列来讨论与V等价旳统计量分布:
ˆ 2
1 3
( y1
aˆ)2
( y2
2aˆ
bˆ)2
( y3

2bˆ)2
1 3
( y1
yˆ1 ) 2
( y2
yˆ2 )2
( y3
yˆ3 )2
1 3
(Y
Xˆ )(Y
Xˆ )
1Y 3
(I3
X
(
X
X
)1
Q(β)=(Y-Cβ) '(Y-Cβ) . 试证明β^=(C'C)-1C'Y是在下列四种意义下达最小:
(1) trQ(β^)≤trQ(β) (2) Q(β^)≤Q(β) (3) |Q(β^)|≤|Q(β)|
(4) ch1(Q(β^))≤ch1(Q(β)),其中ch1(A)表达A
旳最大特征值. 以上β是(m+1)×p旳任意矩阵.
[(
y1
aˆ0
)2
]
0
可得
ˆ
2
1 3
( y1
aˆ0 )2
( y2
aˆ0 )2
( y3
3aˆ0 )2
drf
ˆ
2 0
似然比统计量旳分子为
L(aˆ0

2 0
)
(2
)
3 2
(ˆ 0 2
)
3 2
exp[
3 2
].
5
第四章 回归分析
似然比统计量为
L(aˆ0 ,ˆ02 ) L(aˆ,bˆ,ˆ 2 )

应用多元统计分析课后习题答案详解北大高惠璇(第四章部分习题解答).ppt

应用多元统计分析课后习题答案详解北大高惠璇(第四章部分习题解答).ppt




1 2 1
201
a b



1 2 3

def


X

ˆ


aˆ bˆ


( X X )1
X Y


1 0
2 1
21
1 2 1
1
201

1 0
2 1
21
~ F(1,1)
3
因 V 2 ,
ˆ 2
V

ˆ
2 0
,
故 V 或V ,
1V
1
否定域为
{ } {V V } { f }
10
第四章 回归分析
4-2 在多元线性回归模型(4.1.3)中(p=1),试求出参数 向量β和σ2的最大似然估计.
解:模型(4.1.3)为

1 3
( y1
aˆ0 )2
( y2
aˆ0 )2
( y3
3aˆ0 )2
7
第四章 回归分析

1 3
(Y

Zaˆ0
)(Y

Zaˆ0
)

1 3
Y
(I3

Z
(Z Z
)1 Z
)Y
1 Y BY
3
考虑
ˆ
2 0
ˆ
2

1 Y (B 3

A)Y
B A X ( X X )1 X Z (Z Z )1 Z
应用多元统计分析
第四章部分习题解答
第四章 回归分析
4-1

y1 y2

《应用多元分析》(第三版,前言、目录、参考文献)

《应用多元分析》(第三版,前言、目录、参考文献)

前言多元统计分析是统计学中内容十分丰富、应用性极强的一个重要分支,它在自然科学、社会科学和经济学等各领域中得到了越来越广泛的应用,是一种非常重要和实用的多元数据处理方法。

本书此次又在第二版的基础上作了较大幅度的改写和扩充,使之更能适应当今统计教学的需要。

本教材主要是针对财经类院校的统计学和数理统计学专业的本科生而写的,也可作为其他各专业读者的多元统计分析教材或教学参考书。

整本书写得比较细致,便于自学,书中的绝大部分内容曾向上海财经大学统计学系的本科生和研究生分别讲授过十多届。

本教材有如下一些特点:(1)全书对数学基础知识的要求较低,只需读者掌握初步的微积分、线性代数和概率统计知识。

尽管如此,为便于非统计专业的读者也能顺利地阅读本书,书中前几个章节对矩阵代数及一元统计知识作了简单的回顾和介绍,其所述的预备知识内容对于本书的阅读基本上已足够了。

(2)本教材以简明和深入浅出的方式阐述了多元统计分析的基本概念、统计思想和数据处理方法,在充分考虑到适合财经院校学生使用的前提下进行了严谨的论述,有助于学生深刻地理解并掌握多元分析的基本思想方法。

(3)书中提供的许多例题和习题为读者展示了多元分析在社会科学和经济学等领域中的应用,每章的例题和习题安排侧重于对基本概念的理解和知识的实际应用,并不注重解题的数学技巧和难度。

为便于读者的学习(特别是自学),书后的附录一给出了习题参考答案及部分解答。

(4)本书与SAS软件紧密结合,在每一章后面都附有SAS的应用,这有利于将SAS软件更好地融入各章的内容中,使读者对多元分析的意义能够有贴切的体会,便于读者进入应用的领域。

全书共分十章。

第一章介绍了多元分析中常用的矩阵代数知识,这是全书的基础。

第二章至第四章介绍的基本上是一元统计推广到多元统计的内容,主要阐述了多元分布的基本概念和多元正态分布及其统计推断。

第五章至第十章是多元统计独有的内容,这部分内容具有很强的实用性,特别是介绍了各种降维技术,将原始的多个指标化为少数几个综合指标,便于对数据进行分析。

《应用多元统计分析》课件

《应用多元统计分析》课件
介绍常用的多元统计模型和技术,如 线性回归、集与处理
介绍数据采集的方法和技术,以及如何对采集到的数据进行处理和整理。
缺失值处理
探讨处理数据中出现的缺失值的方法和策略,确保分析结果的准确性。
异常值检测与处理
介绍异常值的概念和检测方法,并提供处理异常值的实践指南。
学习目标和预期结果
明确学员的学习目标和预期结果,为学习过程提供指导和动力。
多元统计分析方法
1
目的和应用领域
2
探讨多元统计分析方法的目的和实际
应用领域,帮助学员理解其实际意义。
3
不同类型的多元统计分析方法
介绍多元统计分析方法的分类和不同 类型,包括主成分分析、因子分析、 聚类分析等。
常用的多元统计模型和技术
详细讲解多元统计分析结果的统计和分析方 法,帮助学员理解结果的含义和解读方式。
报告撰写与演示技巧
提供撰写数据分析报告和演示的技巧和方法, 以便学员能够清晰地传达分析结果。
《应用多元统计分析》 PPT课件
本课程旨在介绍多元统计分析的应用方法和技术,帮助学员掌握数据准备、 多元统计分析实践和结果解读等关键环节,进一步提升数据分析能力。
课程介绍
课程背景和目标
探索多元统计分析方法的应用领域和优势,了解在不同场景下的使用情况。
授课内容概览
介绍多元统计分析的主要内容和技术,帮助学员建立整体的学习框架。
多元统计分析实践
1
主要分析技术与方法
2
深入介绍多元统计分析的主要技术和
方法,如聚类分析、判别分析和因子
分析等。
3
数据分析流程
介绍多元统计分析的常见流程和步骤, 帮助学员掌握分析的整体框架。
案例研究与应用举例

多元回归分析 ppt课件

多元回归分析  ppt课件
否),结构x3影响(高 层与砖混)
ppt课件
3
汽车销售
若公司管理人员要预测来年该公 司的汽车销售额y时,影响销 售额的因素---广告宣传费x1
还有个人可 支配收入x2, 价格x3
ppt课件
4
研究地区经济增长GDP,受劳动力投入人数 x1影响!
还有:资本要素X2,科 技水平X3的影响
ppt课件
5
多元回归应用
25.96732 2.85478 0.01449
Lower 95% 57.58835 -48.57626 17.55303
Upper 95%
555.46404 -12.237392
130.70888
多元回归方程
Sales 306.526- 24.975(Prci e) 74.131(Advertising)
Sales 306.526- 24.975(Prci e) 74.131(Advertising) 306.526- 24.975(5.50) 74.131(3.5) 428.62
预测销量为 428.62 pies
ppt课件
注意:单位百元,$350 意味 X2 = 3.5
24
模型的F检验 系数的T检验 拟合度检验--决定系数
描述因变量 y 依赖于自变量 x1 , x2 ,…, xk 和误差项 的方程,称为多元回归模型
y 0 1x1 2 x2 k xk
β0 ,β1,β2 ,,βk是参数
是被称为误差项的随机变量
包含在y里面但不能被k个自变量的线性关系所解释
的变异性
价格 Price
($) 5.50 7.50 8.00 8.00 6.80 7.50 4.50 6.40 7.00 5.00 7.20 7.90 5.90 5.00 7.00

《应用多元统计分析》教学全套课件

《应用多元统计分析》教学全套课件
应用多元统计分析
1
第一章 绪 论
本章主要讨论:
●多元统计分析概述 ●多元统计分析的应用 ●线性代数基础
2
第一节 多元统计分析概述
本节基本内容:
一、多元统计分析的涵义 二、多元统计研究的内容和方法
3
一、多元统计分析的涵义
多元统计分析(简称多元分析),是运用数理统 计的方法来研究多变量问题的理论和方法,它是 一元统计学的推广。
量乘法和加法可分别定义为:
cx (cx1, cx2 ,L , cxn )
x y (x1 y1, x2 y2 ,L , xn yn )
12
二、矩阵及基本运算
矩阵:
将 n p个数 x11, x12 ,L , xnp 排成一个形如 n 行 p 列的
长方形表:
x11 x12 L
ቤተ መጻሕፍቲ ባይዱ
X
x21 M
可以得到如下运算规律:
(X Y) X Y
(XY) YX
15
二、矩阵及基本运算
X(Y1 Y2 ) XY1 XY2
X
k
Y
k
XY
1 1
c(X Y) cX cY
若 X 为方阵,满足 XX XX I,则称 X 为
正交矩阵。
16
二、矩阵及基本运算
矩阵分块
矩阵的分块是处理阶数较高的矩阵时常用的方法。 有时,我们把一个高阶矩阵看成是由一些低阶矩阵 组成的,就像矩阵由数值组成一样。设 X (xij )为 n p 矩阵,将 X 剖分称四块,表示成
x22
L
X
x2 p
MM
M
xp1 xp2 L xpp
(1) ( j1 j2L jp ) x x 1 j1 2 j2 L xpjp

《应用多元统计分析》第五版PPT(第四章)-简化版(JMP13.1)-作为选读

《应用多元统计分析》第五版PPT(第四章)-简化版(JMP13.1)-作为选读

μ
:
n pn
pn 1
x
μ
S
1
x
μ
F
p,
n
p
❖ 当p=1时,它是一个区间;当p=2时,它是一个实心椭圆,这
时可将其在坐标平面上画出;当p=3时,它是一个椭球体;
当p>3时,它是一个超椭球体;它们均以 x 为中心。
9
置信区域与假设检验之间的关系
❖ 一般来说,μ0包含在上述1−α置信区域内,当且仅当 原假设 H0:μ=μ0在显著性水平α下被接受。
H0:μ=μ0,H1:μ≠μ0
表4.2.1
某地区农村男婴的体格测量数据
编号 1 2 3 4 5 6
身高(x1) 78 76 92 81 81 84
胸围(x2) 60.6 58.1 63.2 59.0 60.8 59.5
上半臂围(x3) 16.5 12.5 14.5 14.0 15.5 14.0
6

两个项目的测试成绩
编号
12345678
甲项成绩(x1) 62 80 66 84 75 80 54 79 乙项成绩(x2) 70 77 75 87 87 91 61 84
➢ n=8,p=2,取1−α=0.90,查表得F0.10(2,6)=3.46,于是, T0.10(2,7)=2.841。
x
72.5
❖ 可以通过构造的置信区域的方法来进行假设检验。 实践中,该方法通常用于p=2时的情形,并借助于 平面置信区域图形。
10
❖ 例4.2.2 为评估某职业培训中心的教学效果,随机抽取8名受 训者,进行甲和乙两个项目的测试,其数据列于表4.2.2。假 定x=(x1,x2)′服从二元正态分布。
表4.2.2
37.3760 35.5936

第三章 多元回归分析 《应用多元统计分析》 ppt课件

第三章 多元回归分析 《应用多元统计分析》 ppt课件

n
n
ei2
yi b0 b1xi1 b2 xi2
2
bp xip
i 1
i 1
达到最小。解形如下式的正规方程:
yi (b0 b1xi1 b2 xi 2
bp xip )
0
xi1 yi (b0 b1xi1 b2 xi 2
bp xip ) 0
xip yi (b0 b1xi1 b2 xi 2
二、逐步回归分析
每步都要进行显著 性检验,以便保证 每次引入变量前回 归方程中只包括显 著性变量。这个过 不能 程反复进行,直到 既无不显著变量从 回归方程中剔除, 又无显著变量需要 选入回归方程时为 止。
开始
能否引入 不在方程中的变量

引入变量
能否剔除 已在方程中的变量

引入变量
不能
筛选结束
二、逐步回归分析
可以进一步证明最小二乘法估计量 b 服从正态分布,

b ~ Np1[β, 2(XX)1]
此时,最小二乘估计是一切无偏估计中方差最小的估计。
特别地,有 bj N[ j , 2 cjj ] ( j 0,1, , p ),其中,cjj 表
示矩阵 (XX)1 中第 j 行第 j 列的元素。
二、模型检验
通常来说,模型的设定只是基于定性分析作出的 假设。这种假设是否符合实际,能否得到样本数据 的支持,还需要在求出线性回归方程后,对回归方 程进行显著性检验。多元线性回归方程的显著性检 验与一元线性回归方程的显著性检验思想是一致的, 但也有不同之处。这里我们介绍两种方法,一是回 归方程整体显著性的 检验F ,另一个是回归系数显
从回归模型的简洁性上看,回归方程中包含自变量个数 越小越好。

应用多元分析第四章 多元正态总体1

应用多元分析第四章   多元正态总体1

两总体方差已知
检验统计量:
u xy
2 1
n1

2 2
n2
H0成立时, u N (0,1).
检验规则为:
当 u u 时, 拒绝H 0 ;
2
当 u u 时, 接受H 0 .
2
2 (2) 两总体方差 未知,但 12 2 2 .
检验统计量:
t sp xy 1 1 n1 n2
proc iml; x={78 60.6 16.5, 76 58.1 12.5, 92 63.2 14.5, 81 59.0 14.0, 81 60.8 15.5, 84 59.5 14.0}; E={[6 ]1}; Xbar=t(x)*t(e)/6; A=t(x)*x-6*xbar*t(xbar); s=a/5; mu={90,58,16}; T=6*t(xbar-mu)*inv(s)*(xbar-mu); t1=5*29.5; Print xbar a s T t1;
是未知参数是来自总体x的样本若存在两个统计量使得对任何11单个正态总体均值的置信区间单个正态总体均值的置信区间2两个正态总体均值之差的置信区间二假设检验在研究实际问题时为了对实际问题作出决断需要作适当的假设然后根据样本进行判断作出接受或拒绝假设的选择
计划学时: 2学时 教学课型: 理论课 教学目的与要求:掌握一元总体统计推断的基本原理与方法 教学重点:一元总体统计推断的基本原理与方法 教学难点:一元总体统计推断的基本原理与方法 教学方法、手段与媒介:根据教材用多媒体课件课堂讲授 教学过程与内容:
构造检验统计量 x 0 u

n
当原假设H 0成立时, u N 0, 由此可得检验规则为: ( 1), 当 u u 时, 拒绝H 0 ;
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

72.5 2.841 112.5714 / 8 1 72.5 2.841 112.5714 / 8

79 2.841 103.1429 / 8 2 79 2.841 103.1429 / 8
61.84≤μ1≤83.16,68.80≤μ2≤89.20 这两个区间分别正是椭圆在μ1轴α。 若tα/2k(n−1)≤Tα ,则邦弗伦尼区间比T2区间要窄,这时宜采用 前者作为联合置信区间;反之,若tα/2k(n−1)>Tα,则邦弗伦尼 区间比T2 区间宽,宜采用后者作为联合置信区间。 当k=p时,邦弗伦尼区间要比T2 区间窄。故在求μ的所有p个 分量μ1, μ2,⋯, μp的联合置信区间时,应采用邦弗伦尼区间。

例4.3.1 设x~Np(μ,Σ),μ=(μ1,μ2,⋯,μp)′,Σ>0,x1,x2,⋯,xn是取 自该总体的一个样本,欲检验 H0:μ1=μ2=⋯=μp,H1:μi≠μj,至少存在一对i≠j 令 1 1 0 0 1 0 1 0 C 1 0 0 1 则上面的假设可表达为 H0:Cμ=0,H1:Cμ≠0 检验统计量为
§4.3 单个总体均值分量间 结构关系的检验


设x1,x2,⋯,xn是取自多元正态总体Np(μ,Σ)的一个样本,Σ>0, n>p,欲检验 H0:Cμ=φ,H1:Cμ≠φ 其中C为一已知的k×p矩阵,k<p,rank(C)=k,φ为已知的k维 向量。 根据多元正态分布的性质知 Cx~Nk(Cμ,CΣC′) 由于 1 1 1 2 2 2 rank CΣC rank CΣ CΣ rank CΣ rank C k


63.63≤μ1≤81.37,70.51≤μ2≤87.49 这个联合置信区间在精确度方面要好于T2联合置信 区间。由该联合置信区间可得到置信度至少为0.90 的矩形置信区域(见图4.2.1中的实线矩形),但其 矩形面积要大于椭圆面积。
图4.2.1 置信椭圆和联合置信区间
利用置信区域进行假设检验
平α,拒绝规则为:
2 2 T T 若 ,则拒绝H0 p n 1 2 F p, n p 。 其中 T n p

例4.2.1 对某地区农村的6名2周岁男婴的身高、胸围、上半 臂围进行测量,得样本数据如表4.2.1所示。根据以往资料, 该地区城市2周岁男婴的这三个指标的均值μ0=(90,58,16)′, 现欲在多元正态性假定下检验该地区农村男婴是否与城市男 婴有相同的均值。这是假设检验问题: H0:μ=μ0,H1:μ≠μ0
第四章 多元正态总体的统计推断
§4.1 §4.2 §4.3 §4.4 §4.5 §4.6 §4.7

一元情形的回顾 单个总体均值的推断 单个总体均值分量间结构关系的检验 两个总体均值的比较推断 两个总体均值分量间结构关系的检验 多个总体均值的比较检验(多元方差分析) 总体相关系数的推断
§4.2 单个总体均值的推断
一、均值向量的检验
二、置信区域 三、联合置信区间
一、均值向量的检验
设x1,x2, ⋯,xn是取自总体x~Np (μ, Σ)的一个样本,这 里Σ>0,n>p,欲检验 H0:μ=μ0,H1:μ≠μ0 1.Σ已知 检验统计量为

T02 n x μ0 Σ 1 x μ0

μ1和μ2的0.90邦弗伦尼联合置信区间为(t0.025(7)= 2.3646)
72.5 2.3646 112.5714 / 8 1 72.5 2.3646 112.5714 / 8 79 2.3646 103.1429 / 8 2 79 2.3646 103.1429 / 8
三、联合置信区间
P a x T a Sa n a μ a x T a Sa n a 即 a x T a Sa n a μ a x T a Sa


1
n

以1−α的概率对一切a∈Rp成立,称它为一切线性组合{a′μ, a∈Rp}的置信度为1−α的联合置信区间(simultaneous confidence intervals)。 对k个线性组合{ai′μ,i=1,2,⋯,k},有
的置信度一般会明显地大于1−α,因而上述区间会显得过宽 ,即精确度明显偏低。这时,我们可以考虑采用邦弗伦尼 (Bonferroni)联合置信区间:
ai x t /2k n 1 aiSai n ai μ ai x t /2k n 1 aiSai i 1, 2, , k
T nx C CSC Cx
2 1

对于给定的显著性水平α,拒绝规则为: 若 T 2 T2 ,则拒绝H0 其中 p 1 n 1 2 T F p 1, n p 1 n p 1 由于C是行满秩的,且每行均为对比向量(即有一个1和一个 −1,其余皆为0),故称C为对比矩阵。 该例中对比矩阵C的选择不是惟一的,比如也可以选取对比 矩阵为
k P ai x T aiSai i 1

n ai μ ai x T aiSai
n 1


当k很小时,联合T2置信区间 aix T aiSai n ai μ ai x T aiSai
n , i 1, 2, , k
某地区农村男婴的体格测量数据 身高(cm) 78 76 92 81 81 84 胸围(cm) 60.6 58.1 63.2 59.0 60.8 59.5 上半臂围(cm) 16.5 12.5 14.5 14.0 15.5 14.0 编 号 1 2 3 4 5 6
表4.2.1
82.0 8.0 x 60.2 , x μ0 2.2 14.5 1.5 31.600 8.040 0.500 S 8.040 3.172 1.310 0.500 1.310 1.900 14.6210 8.9464 4.3107 1 S 1 23.13848 14.6210 59.7900 37.3760 8.9464 37.3760 35.5936 T 2 n x μ S 1 x μ 6 70.0741 420.445
拒绝规则为: 2 2 T 若0 p ,则拒绝H0

2. Σ未知 检验统计量为
T 2 n x μ0 S 1 x μ0
称之为霍特林(Hotelling)T2 统计量。当 H0
n p 2 T 服从F(p,n−p) ,对给定的显著性水 为真时 p n 1

0


0

查表得F0.01(3,3)=29.5,于是 3 5 2 T0.01 F0.01 3,3 147.5 3 故在显著性水平α=0.01下,拒绝原假设H0,即认为农村与城 市的2周岁男婴上述三个指标的均值有显著差异(p=0.002)。
二、置信区域
T 2 n x μ S 1 x μ n p 2 T F p, n p p n 1 n p 2 P T F p, n p 1 p n 1 1 2 P n x μ S x μ T 1

μ的置信度为1−α的置信区域为

μ : n x μ S 1 x μ T2

当p=1时,它是一个区间;当p=2时,它是一个椭圆, 这时可将其在坐标平面上画出;当p=3时,它是一 个椭球;当p>3时,它是一个超椭球;它们均以 x 为中心。 同置信区间与假设检验的关系一样,置信区域与假 设检验之间也有着同样的密切关系。一般来说,μ0 包含在上述置信区域内,当且仅当原假设 H0:μ=μ0 在显著性水平α下被接受。因此,可以通过构造的置 信区域的方法来进行假设检验。
87
80
91
54
61
79
84
n=8,p=2,取1−α=0.90,F0.10(2,6)=3.46,于是,T0.10=2.841。
72.5 112.5714 96.1429 x , S 79 96.1429 103.1429 0.0436 0.0406 1 S 0.0406 0.0475

例4.2.2 为评估某职业培训中心的教学效果,随机抽取8名受 训者,进行甲和乙两个项目的测试,其数据列于表4.2.2。假 定x=(x1,x2)′服从二元正态分布。
表4.2.2 编 号 1 两个项目的测试成绩 2 3 4 5 6 7 8
甲项成绩x1
乙项成绩x2

62
70
80
77
66
75
84
87
75


在例4.2.2中,如果在 α=0.10下对假设 H0:μ=μ0,H1:μ≠μ0 进行检验,其中μ=(μ1,μ2)′,μ0=(μ01,μ02)′ ,则我们容易利用图 4.2.1中的椭圆得出检验的结果。若被检验值μ0位于图4.2.1中 的椭圆外,则拒绝;反之,则接受。 图4.2.1中的虚线矩形在μ1和μ2轴上的区间范围分别是μ1和μ2 的0.90置信区间。当μ0位于椭圆外虚线矩形内的位置(如图 中A点)时,检验结果虽拒绝H0,但如在α=0.10下分别检验 H01:μ1=μ01,H11:μ1≠μ01 和 H02:μ2=μ02,H12:μ2≠μ02 则检验结果都将接受原假设;当μ0位于椭圆内虚线矩形外的 位置(如图中B点)时,检验结果虽接受H0,但H01:μ1=μ01 和H02:μ2=μ02都将会被拒绝。

故CΣC′>0。故我们可以用上一节检验假设H0:μ=μ0的方法 来检验上述假设。检验统计量为 1 T 2 n Cx φ CSC Cx φ 当原假设H0:Cμ=φ为真时, nk T 2 F k, n k k n 1 对于给定的显著性水平α,拒绝规则为: 2 2 若T T ,则拒绝H0 k n 1 2 F k , n k 。 其中T nk 特别地,若欲检验 H0:Cμ=0,H1:Cμ≠0 则T2可简化为 1 T 2 nx C CSC Cx
相关文档
最新文档