多元统计分析——均值向量和协方差阵检验

合集下载

[理学]03_多元正态分布均值向量和协差阵的检验

[理学]03_多元正态分布均值向量和协差阵的检验
T 2 (n 1)[ n(X μ0)S 1 n(X μ0)] ~ T (2 p, n p) 再根据 Hotelling T 2 分布的性质,所以
(n 1 ) p T1 2 ~ F (p n, p ) (n 1 )p
在处理实际问题时,单一变量的检验和多变量检验可以联合使用,多元 的检验具有概括和全面考察的特点,而一元的检验容易发现各变量之间 的关系和差异,能给人们提供更多的统计分析信息。
检验统计量是单一变量检验情况的推广。
2.针对有共同的未知协差阵的情形 对假设
H0:μ1 μ2
进行检验。
H1:μ1 μ2
对此问题,假设 H 0 成立时,所构造的检验统计量为
F (n m 2) p 1T 2 ~ F ( p, n m p 1) (n m 2) p
为了对多元正态总体均值向量作检验,首先需要给出 HotellingT2分布的定义。
在单一变量的检验问题中,设 X1, X2, , Xn 来自总体
N ( , 2 ) 的样本,我们要检验假设
H0 : 0 ; H1 : 0
当 2 已知时,用统计量 z (X 0 ) n
假设 H 0 成立时,构造检验统计量为
F (n p)n ZS-1Z ~ F ( p, n p) p
(3.10)
2.针对 n m 的情形
在此,我们不妨假设 n m ,令
Z(i) X(i)
分 布 为 非 中 心 HotellingT2 分 布 , 记 为
T 2 ~ T 2 ( p, n, μ) 。当 μ 0 时,称 T 2 服从(中心) Hotelling T 2 分布。记为T 2 ( p, n) 。
由于这一统计量的分布首先由 Harold Hotelling 提出

多元统计分析实验指导书——实验一均值向量和协方差阵检验

多元统计分析实验指导书——实验一均值向量和协方差阵检验

实验一SPSS软件的基本操作与均值向量和协方差阵的检验【实验目的】通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。

同时能够掌握对均值向量和协方差阵进行检验。

【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1.操作SPSS的基本方法(打开、保存、编辑数据文件)2.问卷编码3.录入数据并练习数据相关操作4.对均值向量和协方差阵进行检验,并给出分析结论。

【实验学时】4学时【实验方法与步骤】1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗4.对一份给出的问卷进行编码和变量定义5.按要求录入数据6.练习基本的数据修改编辑方法7.检验多元总体的均值向量和协方差阵8.保存数据文件9.关闭SPSS,关机。

【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。

2.遇到各种难以处理的问题,请询问指导教师。

3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。

4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。

5.上机时间,禁止使用计算机从事与课程无关的工作。

【上机作业】1.定义变量:试录入以下数据文件,并按要求进行变量定义。

表1学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($代表人民币)200201 刘一迪男1982.01.12 156.42 47.54 75 79 345.00 200202 许兆辉男1982.06.05 155.73 37.83 78 76 435.00 200203 王鸿屿男1982.05.17 144.6 38.66 65 88 643.50 200204 江飞男1982.08.31 161.5 41.68 79 82 235.50 200205 袁翼鹏男1982.09.17 161.3 43.36 82 77 867.00 200206 段燕女1982.12.21 158 47.35 81 74200207 安剑萍女1982.10.18 161.5 47.44 77 69 1233.00 200208 赵冬莉女1982.07.06 162.76 47.87 67 73 767.80 200209 叶敏女1982.06.01 164.3 33.85 64 77 553.90 200210 毛云华女1982.09.12 144 33.84 70 80 343.00200211 孙世伟男1981.10.13 157.9 49.23 84 85 453.80200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00男1981.11.21 168.55 50.67 79 79 657.40 200213 欧阳已祥200214 贺以礼男1981.09.28 164.5 44.56 75 80 1863.90200215 张放男1981.12.08 153 58.87 76 69 462.20200216 陆晓蓝女1981.10.07 164.7 44.14 80 83 476.80200217 吴挽君女1981.09.09 160.5 53.34 79 82200218 李利女1981.09.14 147 36.46 75 97 452.80200219 韩琴女1981.10.15 153.2 30.17 90 75 244.70200220 黄捷蕾女1981.12.02 157.9 40.45 71 80 253.00要求:1)变量名同表格名,以“()”内的内容作为变量标签。

多元正态分布均值向量和协差阵的检验

多元正态分布均值向量和协差阵的检验

1T
2
~
F( p, n

m

p
1)
经ቤተ መጻሕፍቲ ባይዱ算得
X=(64,43,30.5,63),Y=(51.5,51,40,70.5)
490 -170 -120 245 502.5 60 175 -7.5
S
=-170 x -120
510 10
10 332.5
310 260

;S
= y
i 1
i 1
S Sx Sy ~ Wp (m n 2, )
又由于
mn n+m
(
X
Y)
~
N p (0, )
所以有
F

(n+m 2) (n+m
p 2) p

1T
2
~
F( p,n

m

p
1)
以后假设统计量的选取和前面统计量的选取思路是
一样的,只提出待检验的假设,然后给出统计量及其分 布,为节省篇幅,就不再重复解释。
60 175
390 50
50 450
195

-100
245 310
260
510

-7.5 195 -100 322.5
992.5
S

Sx


S
= y
-110 55
252.5
-110 900 60 505
55 60 802.5 160
252.5
505
其中,T 2 (n 1)[ n ( X 0 )T S 1 n ( X 0 )]
给定检验水平,查F分布表,使PF F =,确定出临界值F。

多元统计分析变量样本均值和协方差阵的相等检验

多元统计分析变量样本均值和协方差阵的相等检验
多元统计分析实验报告
实验名称
变量样本均值和协方差阵的相等检验
姓名
学号
班级
实验地点
实验日期
指导教师
实验目的:
1.检验样本均值和协方差阵是否相等。
2.检验变量是否符合正态分布。
涉及实验的相关情况介绍(包含使用软件或实验设备等情况):
1、实验设备:一台电脑、互联网、SAS软件、投影仪。
2、实验相关知识点:
样本均值和协方差阵的估计
变量是否服从正态分布
实验报告(2):
在主要城市废气中主要污染物排放情况数据中六个变量互不影响,工业二氧化硫,工业氮氧化物,工业烟尘都符合正态分布,而生活二氧化硫,生活氮氧化物,生活烟尘在QQ图上的表现较为符合正态分布。
注实验报告电子版命名方式为:学号+姓名+实验名称。
实验过程:
1.自行车租用数据:
样本均值和协方差阵估计
样本均值相等
BOX’S M-协方差相等
检验变量是否服从正态分布
实验结论(1):
在自行车租用数据中四个变量互不影响,互不相关,变量都符合正态分布。在实验中,பைடு நூலகம்行单变量正态检验时,从QQ图,箱型图可以得出变量服从正态分布。
2.“主要城市废气中主要污染物排放情况”

第三章 多元正态分布均值向量和协方差的检验

第三章 多元正态分布均值向量和协方差的检验

第三章多元正态分布均值向量和协方差的检验
1.基本思想和步骤
2.均值向量的检验
(1)分布:设且X与S相互独立,,则称统计量的分布为非中心分布
当时,称服从(中心)分布,记为
(2)转换为F分布:若且X与S相互独立,令,则
3.一个正态总体均值向量的检验
(1)协差阵已知,检验统计量为
(2)协差阵未知,检验统计量为
4.两个正态总体均值向量的检验
设为来自p维正态总体的容量为n的样本,
为来自p维正态总体的容量为m的样本,且两组样本相互独立
①针对共同已知协差阵,检验统计量为
②针对共同未知协差阵,检验统计量为
(2)协差阵不等
①针对n=m的情形,检验统计量为
②针对n≠m的情形,检验统计量为
5.多个正态总体均值向量的检验
(1)单因素方差分析:设k个正态总体分别为,从k个总体中取个独立样本,,假设H0成立,检验统计量为
其中,组间平方和为,组内平方和为,总平方和为,其中,
(2)若,则为X的广义方差,为样本广义方差
(3)Wilks分布:若且二者相互独立,
为Wilks统计量,分布为Wilks分布,简记为
(4)多元方差分析:检验统计量为
其中,,A为组间离差阵,E为组内离差阵,T为总离差阵,且T=A+E
6.协差阵的检验
(1)一个正态总体协差阵的检验:构造检验统计量
(2)多个协差阵相等的检验:构造检验统计量。

第四讲均值向量和协方差阵的检验

第四讲均值向量和协方差阵的检验
n1n2 ( X Y )1 ( X Y ) ~ 2 ( p) n1 n2
2
若两总体协差阵相等且未知时,
n1n2 ˆ 1 ( X Y ) ~ T 2 ( p, n n 2) T ( X Y )' 1 2 n1 n2
2
根据两个样本可得μ1和μ2的无偏估计量为
1 n1 x xi n1 i 1 1 n2 y yi n2 i 1 1 1 X Y ~ N p 0,( ) n21 n2 n1n2 X Y ~ N p 0, n1 n2

L1 L2 ˆ 又 ~ Wp (n1 n2 2, ) n1 n2 2
检验原k个观测指标向量之间的互协方差阵是否为零,就是要 检验如下的假设:
H0 : ij 0, i j, i, j 1, 2,, k
若对此p维观测指标向量进行了n次观测,得到了一个容量 为n的样本 x(1) , x(2) , x(n )

并已计算出了样本叉积矩阵向量,则可将此样本叉积 矩阵按原k个观测指标向量进行分块,得到如下的分块 叉积矩阵为:
方差分析表
协方差阵的检验
单个总体协方差阵相等的检验

总体协方差阵是否等于已知常数矩阵的检验
H0 : 0 , H1 : 0

总体协方差阵是否等于已知常数矩阵倍数的 检验
H0 : 0 , H1 : 0
2 2
多总体协方差阵相等的检验


假设有k个多元正态总体,它们的分布分别 为 N p (1, 1 ),, N p (k , k ) 。现从每个总体中分别 随机抽取了一个样本,要根据这些样本,对于 这些总体的协方差阵是否相同进行检验。 首先,列出原假设和备择假设。它们分别为:

多元正态总体均值向量和协差阵的假设检验.

多元正态总体均值向量和协差阵的假设检验.

第三章 多元正态总体均值向量和协差阵的假设检验什么是假设检验及基本思想、计算步骤,在初等数理统计中都已做过介绍。

多元分析也涉及这方面内容,在后面介绍的常用各种统计方法,有时要对总体的均值向量和协差阵做检验,比如,对两个总体做判别分析时,事先就需要对两个总体的均值向量做检验,看看是否在统计上有显著差异,否则做判别分析就毫无意义。

本章类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协差阵的检验。

不论做上述任何检验,其基本步骤均可归纳为四步:第一步,提出待检验的假设0H 和1H 。

第二步,给出检验的统计量及它服从的分布。

第三步,给定检验水平a ,查统计量的分布表,确定临界值a λ,从而得到否定域。

第四步根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设检验做出决策(拒绝或接受)。

由于各种检验的计算步骤类似,关键在于对不同的检验给出不同的统计量,而有关统计量的给出大多用似然比方法得到。

本章只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例。

同时为了说明统计量的分布,自然地给出HotellingT 2分布和Wilks 分布的定义,它们分别是一元统计中t 分布和F 分布的推广。

§3.1 均值向量的检验为了对多元正态总体均值向量作检验,首先需要给出HotellingT 2分布的定义。

1 HotellingT 2分布定义 设),(~),,(~∑∑n W S N X p p μ且X 与S 相互独立,p n ≥,则称统计量X S X n T 12-'=的分布为非中心HotellingT 2分布,记为),,(~22μn p T T 。

当0=μ时,称2T 服从(中心)HotellingT 2分布,记为),(2n p T ,由于这一统计量的分布首先由Harold Hotelling 提出来的,故称为HotellingT 2分布,值得指出的是,我国著名统计学家许宝马录先生在1938年用不同方法也导出T 2分布的密度函数,因表达式很复杂,故略去。

[理学]03_多元正态分布均值向量和协差阵的检验

[理学]03_多元正态分布均值向量和协差阵的检验

定理 3.1 若 X ~ N p (0, Σ ) , S ~ Wp (n, Σ ) 且 X 与 S 相互
独立,令T 2 nX S 1X ,则
n p 1T 2 ~ F ( p, n p 1) np
(3.5)
在我们后面所介绍的检验问题中,经常会用到这一性质。
二、一个正态总体 均值向量的检验
假设 H 0 成立时,构造检验统计量为
F (n p)n ZS-1Z ~ F ( p, n p) p
(3.10)
2.针对 n m 的情形
在此,我们不妨假设 n m ,令
Z(i) X(i)
t2

n(X )2
S2
n(X
)(S 2 )1( X
)
(3.4)
对于多元变量而言,可以将 t 分布推广为下面将要介绍的
Hotelling T 2 分布。
定义 3.1 设 X ~ N p ( μ , Σ ) ,S ~ Wp (n, Σ ) 且 X 与 S 相互独立, n p ,则称统计量 T 2 nX S-1X 的
其中,Y n(X μ0) ~ Np (0, ) ,因此,
T02 n( X 0 )Σ 1( X μ0 ) ~ 2 ( p) 。
(二)协差阵 Σ 未知时均值向量的检验 H0:μ μ0 ( μ0 为已知向量) H1:μ μ0 假设 H 0 成立,检验统计量为
(n 1) p 1T 2 ~ F ( p, n p) (n 1) p
为了更好的说明检验过程中统计量的分布,本章还要介绍 HotellingT2分布和Wilks分布的定义。
第二节 均值向量的检验
一 单一变量检验的回顾及HotellingT2分布 二 一个正态总体均值向量的检验 三 两个正态总体均值向量的检验 四 多个正态总体均值向量的检验

多元统计分析——均值向量和协方差阵检验

多元统计分析——均值向量和协方差阵检验

多元统计分析——均值向量和协方差阵检验均值向量检验是评估两个或多个总体均值是否相等的方法。

在多元统计分析中,均值向量检验常用于比较不同组别或条件下的均值是否有差异。

假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。

假设每个观测值有p个测量变量,那么每个样本组别的均值向量可以表示为一个p维的向量。

我们的目标是比较这k个均值向量是否相等。

常用的均值向量检验方法有Hotelling's T-squared统计量和Wilks' Lambda统计量。

Hotelling's T-squared统计量是基于方差-协方差阵的一个推广,它考虑了样本组别的大小和协方差结构。

它的计算公式为:T^2=n(p-k)/(k(n-1))*(x1-x)^TS^(-1)(x1-x)其中,n是每个组别的观测数,p是变量的个数,k是组别的个数,x1是第一个组别的均值向量,x是总体均值向量,S是协方差阵。

T^2的分布是一个自由度为k,维度为p的非中心F分布。

Wilks' Lambda统计量是基于协方差阵的特征值的一个变换,它的计算公式为:Lambda = ,W,/,B其中,W是所有组别的散布矩阵(Within-groups scatter matrix),B是总体的散布矩阵(Between-groups scatter matrix)。

Wilks' Lambda的分布是一个自由度为k和n-k-1的F分布。

协方差阵检验是评估两个或多个总体协方差阵是否相等的方法。

在多元统计分析中,协方差阵检验常用于比较不同组别或条件下的变量之间的协方差结构是否有差异。

假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。

假设每个观测值有p个测量变量,那么每个样本组别的协方差阵可以表示为一个p维的矩阵。

我们的目标是比较这k个协方差阵是否相等。

常用的协方差阵检验方法有Hotelling-Lawley's Trace统计量和Pillai-Bartlett's Trace统计量。

第四章 多元正态总体均值向量和协差阵的假设检验

第四章 多元正态总体均值向量和协差阵的假设检验

1.当
已知时,检验用的统计量为
2、当
未知时,检验用的统计量为
(二)两个正态总体均值的比较检验 设从总体 中抽出一个样本 中抽出一个样本 ,从总体
,要进行的假设检验为
1.两个正态分布总体方差

已知时,检验用的统计量
2.两个正态分布总体方差

未知,但
(三)多个正态总体均值的比较检验 设有k个正态总体分别为 本:各总体的样本如下: 从k个总体中各自独立的抽取一个样
经计算得
拒绝原假设
甲和丁存在显著差别
第二节 协方差阵的检验 一、检验

要检验
是来自
的样本
是已知的正定矩阵,
检验用的统计量是
对于方阵A =
,将它对角线的所有元素相加所得的和,称为矩阵A的迹,记为trA=




分位点表
二、检验
检验用的统计量是

不大且
时,
的上
分位点
330
203 150 205 190 200 250 240 270 200 200 270 190
82
65 40 67 38 42 113 80 76 94 60 55 65
45
65 51 54 50 45 40 55 60 33 51 40 48
403
312 477 481 468 351 390 520 507 260 429 390 481
210
280 280 293 210 190 310 200 189 280 190 295 177
100
65 117 114 55 64 110 60 110 88 73 114 103
34

多元统计分析——均值向量和协方差阵检验

多元统计分析——均值向量和协方差阵检验



2 2


构造检验统计量
u xy
12


2 2
n1 n2
当 H0 成立时,u N (0,1) 。检验规则为: 当| u | u /2 时,拒绝 H0 ; 当| u | u /2 时,接受 H0 。

2)两个总体方差
12


2 2
未知,但

2 1
=

2 2
=

2
用 sp 代替 ,构造检验统计量
构造统计量
F SS(TR) /(k 1) SSE /(n k)
当假设成立时, F : Fk 1,nk ,其否定域为 F Fk 1,nk (r)
多元方差分析 应用前提
与一元方差分析一样,多元方差分析要 满足独立性、正态性、方差齐性(各组方 差协方差矩阵相等)。
多元方差分析对正态性是稳健的,即总 体稍微偏离正态,对结论的影响不大。因 此,在样本量充分大的情况下,也能够对 偏态总体的均值作出推断。
较大且{ni}互不相等时,此时可用 F 分布去近似,M 近似遵从 bF( f1, f2 ),记作
i 1
i 1
当假设
H0
成立时,T
2

T2 p,
n
m

p1
,从而
n m p 1T 2 (n m 2)p
F ~ p, n m p1
即当给定显著性水平 的值时,若
F * Fp,nm p1
时,拒绝 H0 ,否则没有足够的理由拒绝 H0 。
(2)协方差不相等的情况(见书P25)
设 x1, x2 , , xn 是取自总体 N p (, ) 的一个样本,给定显著性水平 。

《应用多元统计分析》第03章-多元正态分布均值向量和协差阵的检验

《应用多元统计分析》第03章-多元正态分布均值向量和协差阵的检验

(3.7)
其中, T 2 (n 1)[ n(X μ0)S1 n(X μ0)]
给定检验水平
,查
F
分布表 ,使
P

n p (n 1) p
T
2

F


,可
确定出临界值
F
,再用样本值计算出 T 2 ,若
n p (n 1) p
T2

F

则否定 H 0 ,否则接受 H 0 。
例如,我们要考察全国各省、自治区和直辖市的社会经济发展 状况,与全国平均水平相比较有无显著性差异等,就涉及到多 元正态总体均值向量的检验问题等。
本章类似单一变量统计分析中的各种均值和方差的检验,相 应地给出多元统计分析中的各种均值向量和协差阵的检验。
其基本思想和步骤均可归纳为: 第一,提出待检验的假设H0和H1; 第二,给出检验的统计量及其服从的分布;
设 X (1) , X (2) , , X (n) 是 来 自 p 维 正 态 总体 N p ( μ , Σ ) 的 样
本,且
X

1 n
n
X ( )
1
,S

n
( X (a)
a 1

X )( X (a)

X ) 。
(一) 协差阵 Σ 已知时均值向量的检验
H0:μ μ0 ( μ0 为已知向量) H1:μ μ0
假设 H 0 成立,检验统计量为
T02 n( X μ0 )Σ 1( X μ0 ) ~ 2 ( p) (3.6)
给定检验水平 ,查 2 分布表使 P T02 2 ,可确定
出临界值

2

应用多元统计分析-第三章 均值向量和协差阵检验

应用多元统计分析-第三章 均值向量和协差阵检验

假设检验的过程-以妇女身高为例
首先要提出一个原假设,如妇女身高的
均值等于160cm( 160cm)。这种原假
设也称为零假设(null hypothesis),记 为H0。 与此同时必须提出对立假设,如妇女身
高均值不等于160cm( 160c)m。对立
假设又称为备选假设或备择假设 (alternative hypothesis)记为H1。
如果是两个以上总体的均值检验,则将 用到方差分析,到方差分析一章时,再 进行介绍。
根据一个样本对其总体均值大小进行检验
例3.1:如果你买了一包标有500g重的一包红糖, 你觉得份量不足。于是你找到监督部门; 当然他们会觉得一包份量不够可能是随机的。 于是监督部门就去商店称了50包红糖(数据在 sugar.sav); 其中均值(平均重量)是498.35g;这的确比 500g少,但这是否能够说明厂家生产的这批红 糖平均起来不够份量呢? 于是需要统计检验。 首先,可以画出这些重量的直方图(图5.)
这一步一般都可由计算机软件来完成。
第五,进行判断:如果p-值小于或等于a,
就拒绝零假设,这时犯错误的概率最多
为 ;如果p-值大于 ,就不拒绝零假
设,因 为证据不足。
假设检验的过程
在这个意义上,p-值又称为观测的显著 性水平(observed significant level)。 在统计软件输出p-值的位置,有的用“pvalue”,有的用significant的缩写“Sig” 就是这个道理。
n
如果 (x X ) 2cm 真是由抽样误差造成的, 那么它就不应该大于2或3个标准差,即
(x
X
)
2或3
n
如何假设检验?
反之,如果:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一元正态总体均值向量的检验
(1)一元的回顾 一元的回顾
2 2 设有 k 个总体 G1 , G2 ,L , Gk ,它们的分布分别是 N ( µ1 , σ ),L , N ( µ k , σ ) ,
从它们中分别抽取了样本如下: 从它们中分别抽取了样本如下:
(1) X 1(1) ,L , X n1 (2) X 1(2) ,L , X n 2
−1
~T
2
(p,n-1)
T 2 与 F 分布的关系: n− p 2 在 H0 条件下 F = T (n −1) p
实例
对某地区农村的 6 名 2 周岁男婴的身高、胸围、上半臂围进行测量,得样本数据如表 2.1 所示。根据以往资料,该地区城市 2 周岁男婴的这三个指标的均值 µ0 = (90, 58,16)′ , 现欲在多元正态性假定下检验该地区农村男婴是否与城市男婴有相同的均值。
2、P 维单个正态总体均值向量的检验 考虑假设检验问题
H 0 : µ = µ 0 , H1 : µ ≠ µ0
设 x1 , x2 , L, xn 是取自总体 N p ( µ , ∑ ) 的一个样本,给定显著性水平 α 。 (1) ∑ 已知。
当假设成立时,
2 T02 = n ( X − µ 0 )' ∑ −1 ( X − µ 0 ) ~ χ p
一元情况的回顾 考虑假设检验问题
H0 : µ1 = µ2 , H1 : µ1 ≠ µ2
2 的样本, 设 x1 , x2 ,L, xn1 是取自总体 N(µ1 ,σ1 ) 的容量为 n1 的样本, y1 , y2 ,L, yn2 是取自总体
N(µ2 ,σ22 ) 的容量为n2 的样本,给定显著性水平α 。 的样本,
3.独立样本检验 独立样本检验
• 即对相互独立的两个样本的均值进行比较,看二者是否有 即对相互独立的两个样本的均值进行比较, 显著的差异。与单一样本T检验的原理相同 检验的原理相同, 显著的差异。与单一样本 检验的原理相同,采用小概率 反证法。 反证法。 • 首先假设:H0两个样本来自同一总体 首先假设: 两个样本来自同一总体 两个样本来自同一总体,u1=u2 • 独立样本t检验的前提: 独立样本t检验的前提 检验的前提: (1)两个样本相互独立 (2)两个样本来自正态总体 若违反这一假设, 若违反这一假设,应采用非参数检验或变换变量使适应条件 (3)比较的两个样本有实际意义 如一个关于产品重量的样本和一个关于产价格的样本均值比 较无意义。 较无意义。
∑ n (X
r =1 r
k
r
− X )2
组内平方和: 组内平方和:SSE=
∑∑ ( X
r =1 j =1 nr (r )
j
k
nr
(r )
j
− X r )2
总平方和: 总平方和:SST=
∑∑ ( X
r =1 j =1
k
− X )2
1 式 中 : Xr = nr
∑X
j =1
nr
(r )
j
1 表示 第 r 个 处 理的均值 , X = nr
即当给定显著性水平 α 的值时,若
F * > Fp ,n + m − p −1 (α )
时,拒绝 H 0 ,否则没有足够的理由拒绝 H 0 。
(2)协方差不相等的情况(见书P25)
4.方差分析 方差分析
• 进行两组及多组间样本平均数的比较 • 如在医学研究中,分析几中药物对某种疾 如在医学研究中, 阵的检验
一、均值向量检验 1.均值比较的意义 1.均值比较的意义 2.单一样本检验 2.单一样本检验 3.独立样本检验 3.独立样本检验 4.方差分析:一元和多元 4.方差分析: 方差分析 二、协方差阵检验
1.均值比较的意义 均值比较的意义
• 在抽样调查中,按随机原则从总体中抽取一定数 在抽样调查中, 量的样本, 量的样本,然后根据样本的数量特征来推断总体 的数量特征。由于样本中个体的差异性, 的数量特征。由于样本中个体的差异性,样本所 得到的样本统计量与总体参数之间是存在差异的。 得到的样本统计量与总体参数之间是存在差异的。 • 例如:推断样本是否来自同一总体 例如: 情形一:有两个样本,其均值不等; 情形一:有两个样本,其均值不等; 并不能断定它们不是来自同一总体) (并不能断定它们不是来自同一总体) 情形二:有两个样本,其均值相等; 情形二:有两个样本,其均值相等; 并不能据此断言它们是来自同样的总体) (并不能据此断言它们是来自同样的总体) ——这就需要用到均值比较的方法 这就需要用到均值比较的方法
某地区农村男婴的体格测量数据 编号 1 2 3 4 5 6 身高(cm) 78 76 92 81 81 84 胸围(cm) 60.6 58.1 63.2 59.0 60.8 59.5 上半壁围(cm) 16.5 12.5 14.5 14.0 15.5 14.0
这是假设检验问题: H 0 :μ = µ 0 , H1 :μ≠ µ0
当假设成立时, µ ~N(0,1) ,否定域为 | µ |> µα / 2 , µα / 2 为 N (0,1) 的上 α / 2 分位点。 (2)当 σ 未知时,用 S =
2
∑ (x
i =1
n
i
− x ) 2 /( n − 1) 作为 σ 2 的估计,用统计量
t=
x − µ0 S
n
来检验假设。
当假设成立时,t~t(n-1),否定域为 | t |> t n−1 (α / 2) , t n −1 (α / 2) 为 t n −1 的上 α / 2 分位点。
其否定域为 T0 ≥
2
2 χ 2 (α ) ,后者是 χ p 的上 α 分位点。 p
ˆ (2) ∑ 未知。这时 ∑ 的无偏估计是 Σ = S /(n − 1) ,
统计量
ˆ T 2 = n( X − µ0 )' Σ−1 ( X − µ0 ) = n(n − 1)( X − µ0 )' S ( X − µ0 )
方差分析的思想
• 方差分析认为,不同样本间的均值差异来 方差分析认为, 源于两个方面: 源于两个方面: • 总变异=随机误差+由于不同的实验条件 总变异=随机误差+ 导致的误差 • 总变异=组内差异+组间差异 总变异=组内差异+
量化
• 随机误差:由于测量导致。 随机误差:由于测量导致。 用变量在各组每个取值与该组的变量 均值的离差平方和的总和表示。 均值的离差平方和的总和表示。 • 不同的实验条件导致的差异:意思是样本 不同的实验条件导致的差异: 抽自不同的总体而导致的差异。 抽自不同的总体而导致的差异。 用各组的均值与总体均值的离差平方 和表示
1、一元情况的回顾 考虑假设检验问题
H 0 : µ = µ 0 , H1 : µ ≠ µ0
设 x1 , x2 , L, xn 是取自总体 N ( µ , σ 2 ) 的一个样本,给定显著性水平 α 。 (1)当 σ 已知时,用统计量
µ=
其中:
x − µ0
σ
n
1 n x = ∑ xi 为样本均值。 n i =1
2.单一样本检验 单一样本检验
• 已知某校大三学生的平均身高是 已知某校大三学生的平均身高是163cm。 。 现从某院大三学生中随机抽取20个测量出 现从某院大三学生中随机抽取 个测量出 其身高。 其身高。检验该院大三学生的身高与该校 大三学生的身高平均值是否相等。 大三学生的身高平均值是否相等。 • 建立一个原假设:H0:假设该院大三学生 建立一个原假设: : 的身高与该校大三学生的平均身高相等。 的身高与该校大三学生的平均身高相等。 • 这属于单个变量的均值与已知常数的比较
∑ (x
i =1
n
i
− x )( x i − x )′ , Ay =
∑ (y
i= 1
m
i
− y )( y i − y ) ′
当假设 H 0 成立时, T ~ Tp , n + m − p −1 ,从而
2
2
n + m − p −1 2 T ~ F p , n + m − p −1 (n + m − 2) p
用 sp 代替σ ,构造检验统计量
x−y t= 1 1 sp + n1 n2
成立时, 分布, 当 H0 成立时,t 服从自由度为n1 + n2 − 2 的 t 分布,即t t (n1 + n2 − 2) 。 检验规则为: 检验规则为: 当| t |≥ tα / 2 (n1 + n2 − 2) 时,拒绝 H0 ; 当| t |< tα / 2 (n1 + n2 − 2) 时,接受 H0 。
3、两个p维正态总体均值的检验 、两个 维正态总体均值的检验
(1)协方差相 等的情况 考虑假设 检验问题
H 0 : µ1 = µ 2 , H 1 : µ1 ≠ µ2
设 x1 , x2 , L , xn 是 取 自 总 体 N p (µ 1 , ∑ ) 的 容 量 为 n 的 样 本 , y1 , y 2 ,L , ym 是 取 自 总 体
为什么多样本均值检验不采用两两样 本的t检验 检验, 本的 检验,而一定要采用方差分析
• 统计结论都是概率性的。假设实际情况是 统计结论都是概率性的。 H0成立,那么根据设置的显著性水平如 成立, 成立 0.05, 平均每 平均每100次检验中有 次会得出拒绝 次检验中有5次会得出拒绝 次检验中有 H0的错误结论。 的错误结论。 的错误结论
∑∑ X
r =1 j =1
k
nr
(r )
j
表 示总均
值 , n = n1 + L + nk 构造统计量
统计量
2
t=
x − µ0 S
2 −1
n
等价于 t = n ( x − µ0 )' (S ) ( x − µ0 ) 当假设成立时,t ~F(1,n-1)(自由度为 1,n-1 的 F 分布) ,其否定域为 t ≥ F1, n −1 (α ) ,后者
相关文档
最新文档