应用多元统计分析-第三章 均值向量和协差阵检验

合集下载

应用多元统计分析课后习题答案高惠璇(第三章部分习题解答)

应用多元统计分析课后习题答案高惠璇(第三章部分习题解答)

因 X ~ N ( , 1 ), p 0 0 n
H 0下
n ( X 0 ) ~ N p (0, 0 )
H 0下
所以由§3“一﹑2.的结论1”可知
2 ln ~ ( p).
2
20
第三章 多元正态总体参数的检验
3-6 (均值向量各分量间结构关系的检验) 设总体
X~Np(μ ,Σ )(Σ >0),X(α) (α =1,…,n)(n>p)为 来自p维正态总体X的样本,记μ =(μ 1,…,μ p)′.C 为k×p常数(k<p),rank(C)=k,r为已知k维向量.试给出 检验H0:Cμ =r的检验统计量及分布.
(n 1)n(CX r )CAC (CX r ).
1
A ( X (i ) X )( X (i ) X ).
i 1
n
22
第三章 多元正态总体参数的检验
维正态总体X的样本,样本均值为X,样本离差阵为A.记μ= (μ1,…,μp)′.为检验H0:μ1=μ2=…=μp ,H1:μ1,μ2,…,μp至少有一对不 相等.令
X (1) X (1) W X X X (2) X (1) X (1) X (2) W11 W12 , X (2) X (2) W21 W22

W11 X (1) X (1), W22 X (2) X (2)
13
第三章 多元正态总体参数的检验
1 T n(n 1)( X ) Ax ( X ) 2 ~ T ( p, n 1). 2 x

其中C是pp非退化常数矩阵,d是p1常向量。 则 Y ~ N (C d , CC) (i 1,2,...,n)

多元统计分析实验指导书——实验一均值向量和协方差阵检验

多元统计分析实验指导书——实验一均值向量和协方差阵检验

实验一SPSS软件的基本操作与均值向量和协方差阵的检验【实验目的】通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。

同时能够掌握对均值向量和协方差阵进行检验。

【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1.操作SPSS的基本方法(打开、保存、编辑数据文件)2.问卷编码3.录入数据并练习数据相关操作4.对均值向量和协方差阵进行检验,并给出分析结论。

【实验学时】4学时【实验方法与步骤】1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗4.对一份给出的问卷进行编码和变量定义5.按要求录入数据6.练习基本的数据修改编辑方法7.检验多元总体的均值向量和协方差阵8.保存数据文件9.关闭SPSS,关机。

【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。

2.遇到各种难以处理的问题,请询问指导教师。

3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。

4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。

5.上机时间,禁止使用计算机从事与课程无关的工作。

【上机作业】1.定义变量:试录入以下数据文件,并按要求进行变量定义。

表1学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($代表人民币)200201 刘一迪男1982.01.12 156.42 47.54 75 79 345.00 200202 许兆辉男1982.06.05 155.73 37.83 78 76 435.00 200203 王鸿屿男1982.05.17 144.6 38.66 65 88 643.50 200204 江飞男1982.08.31 161.5 41.68 79 82 235.50 200205 袁翼鹏男1982.09.17 161.3 43.36 82 77 867.00 200206 段燕女1982.12.21 158 47.35 81 74200207 安剑萍女1982.10.18 161.5 47.44 77 69 1233.00 200208 赵冬莉女1982.07.06 162.76 47.87 67 73 767.80 200209 叶敏女1982.06.01 164.3 33.85 64 77 553.90 200210 毛云华女1982.09.12 144 33.84 70 80 343.00200211 孙世伟男1981.10.13 157.9 49.23 84 85 453.80200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00男1981.11.21 168.55 50.67 79 79 657.40 200213 欧阳已祥200214 贺以礼男1981.09.28 164.5 44.56 75 80 1863.90200215 张放男1981.12.08 153 58.87 76 69 462.20200216 陆晓蓝女1981.10.07 164.7 44.14 80 83 476.80200217 吴挽君女1981.09.09 160.5 53.34 79 82200218 李利女1981.09.14 147 36.46 75 97 452.80200219 韩琴女1981.10.15 153.2 30.17 90 75 244.70200220 黄捷蕾女1981.12.02 157.9 40.45 71 80 253.00要求:1)变量名同表格名,以“()”内的内容作为变量标签。

第3章 多元正态分布均值向量和协差阵的检验

第3章 多元正态分布均值向量和协差阵的检验
x
y
Sx
(X
i 1
n
i
X )( X i X )
T
~ W p ( n 1, ) , S y
பைடு நூலகம்
(Y
i 1
m
i
Y )( Y i Y )
T
~ W p ( m 1, )
S S x S y ~ W p (m n 2, )
又由于 所以有
mn n+ m
• 例1:对某地区农村的6名2周岁男婴的身高、胸围、上半 臂围进行测量,得样本数据如表所示:
编号 1 2 3 4 5 6 身高(cm) 胸围(cm) 上半臂围(cm) 78 60.6 16.5 76 58.1 12.5 92 81 81 84 63.2 59.0 60.8 59.5 14.5 14.0 15.5 14.0
70 75 60 75 80 65 70
解: 比较日美两国在华投资企业对中国多方面经营环境的 评价是否存在差异问题,就是两总体均值向量是否相等的 检验问题。记日美两国在华投资企业对中国4个方面经营环 境的评价可以看成是2个4元总体,因此可设两组样本分别 来自于正态总体,分别记为:
X ( i ) ~ N 4 ( 1 , ), i 1, 2 , ,10 ; Y ( i ) ~ N 4 ( 2 , ), i 1, 2 , ,10
(X Y ) ~ ( p)
2
,查 分布表,使
2
P T 0 = ,确定出临界值
2



再由样本值计算出统计 若 T 0 ,则拒绝
2
量 T 0 ,比较 H 0,否则,接受 H 0。
2
( 2 ) 针对有共同的未知协差 H 0: 1= 2, H 1: 1 2 假设 H 0 成立,检验统计量为 F (n+ m 2) p 1 (n+ m 2) p

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

3
2
50.5
2.25
53
2.25
3
51
2.5
51.5
2.5
4
56.5
3.5
51
3
5
52
3
51
3
6
76
9.5
77
7.5
7
80
9
77
10
8
74
9.5
77
9.5
9
80
9
74
9
10
76
8
73
7.5
11
96
13.5
91
12
12
97
14
91
13
13
99
16
94
15
14
92
11
92
12
15
94
15
91
12.5
3.6 1992 年美国总统选举的三位候选人为布什、佩罗特和克林顿。从支
持三位候选人的选民中分别抽取了 20 人,登记他们的年龄段( x1 )、受教育
程度( x2 )和性别( x3 )资料如下表所示:
投票人
x1
x2
x3
投票人
x1
x2
x3
布什
2
1
2
1
1
11
1
1
2
2
1
3
2
12
4
1
2
3
3
3
1
13
4
0
2
4
1
3
2
14
3
4
2
5
3
1

多元统计分析——均值向量和协方差阵检验

多元统计分析——均值向量和协方差阵检验

多元统计分析——均值向量和协方差阵检验均值向量检验是评估两个或多个总体均值是否相等的方法。

在多元统计分析中,均值向量检验常用于比较不同组别或条件下的均值是否有差异。

假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。

假设每个观测值有p个测量变量,那么每个样本组别的均值向量可以表示为一个p维的向量。

我们的目标是比较这k个均值向量是否相等。

常用的均值向量检验方法有Hotelling's T-squared统计量和Wilks' Lambda统计量。

Hotelling's T-squared统计量是基于方差-协方差阵的一个推广,它考虑了样本组别的大小和协方差结构。

它的计算公式为:T^2=n(p-k)/(k(n-1))*(x1-x)^TS^(-1)(x1-x)其中,n是每个组别的观测数,p是变量的个数,k是组别的个数,x1是第一个组别的均值向量,x是总体均值向量,S是协方差阵。

T^2的分布是一个自由度为k,维度为p的非中心F分布。

Wilks' Lambda统计量是基于协方差阵的特征值的一个变换,它的计算公式为:Lambda = ,W,/,B其中,W是所有组别的散布矩阵(Within-groups scatter matrix),B是总体的散布矩阵(Between-groups scatter matrix)。

Wilks' Lambda的分布是一个自由度为k和n-k-1的F分布。

协方差阵检验是评估两个或多个总体协方差阵是否相等的方法。

在多元统计分析中,协方差阵检验常用于比较不同组别或条件下的变量之间的协方差结构是否有差异。

假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。

假设每个观测值有p个测量变量,那么每个样本组别的协方差阵可以表示为一个p维的矩阵。

我们的目标是比较这k个协方差阵是否相等。

常用的协方差阵检验方法有Hotelling-Lawley's Trace统计量和Pillai-Bartlett's Trace统计量。

多元统计分析实验指导书——实验一-均值向量和协方差阵检验

多元统计分析实验指导书——实验一-均值向量和协方差阵检验

实验一SPSS软件的基本操作与均值向量和协方差阵的检验【实验目的】通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。

同时能够掌握对均值向量和协方差阵进行检验。

【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1.操作SPSS的基本方法(打开、保存、编辑数据文件)2.问卷编码3.录入数据并练习数据相关操作4.对均值向量和协方差阵进行检验,并给出分析结论。

【实验学时】4学时【实验方法与步骤】1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗4.对一份给出的问卷进行编码和变量定义5.按要求录入数据6.练习基本的数据修改编辑方法7.检验多元总体的均值向量和协方差阵8.保存数据文件9.关闭SPSS,关机。

【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。

2.遇到各种难以处理的问题,请询问指导教师。

3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。

4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。

5.上机时间,禁止使用计算机从事与课程无关的工作。

【上机作业】1.定义变量:试录入以下数据文件,并按要求进行变量定义。

表1学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($代表人民币)200201 刘一迪男1982.01.12 156.42 47.54 75 79 345.00 200202 许兆辉男1982.06.05 155.73 37.83 78 76 435.00 200203 王鸿屿男1982.05.17 144.6 38.66 65 88 643.50 200204 江飞男1982.08.31 161.5 41.68 79 82 235.50 200205 袁翼鹏男1982.09.17 161.3 43.36 82 77 867.00 200206 段燕女1982.12.21 158 47.35 81 74200207 安剑萍女1982.10.18 161.5 47.44 77 69 1233.00 200208 赵冬莉女1982.07.06 162.76 47.87 67 73 767.80 200209 叶敏女1982.06.01 164.3 33.85 64 77 553.90 200210 毛云华女1982.09.12 144 33.84 70 80 343.00 200211 孙世伟男1981.10.13 157.9 49.23 84 85 453.80 200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00 200213 欧阳已祥男1981.11.21 168.55 50.67 79 79 657.40 200214 贺以礼男1981.09.28 164.5 44.56 75 80 1863.90 200215 张放男1981.12.08 153 58.87 76 69 462.20 200216 陆晓蓝女1981.10.07 164.7 44.14 80 83 476.80 200217 吴挽君女1981.09.09 160.5 53.34 79 82200218 李利女1981.09.14 147 36.46 75 97 452.80 200219 韩琴女1981.10.15 153.2 30.17 90 75 244.70 200220 黄捷蕾女1981.12.02 157.9 40.45 71 80 253.00 要求:1)变量名同表格名,以“()”内的内容作为变量标签。

应用多元统计分析课后答案

应用多元统计分析课后答案

第二章2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。

解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。

求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。

(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd cc d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布,则均值为2b a +,方差为()212b a -。

《应用多元统计分析》第03章-多元正态分布均值向量和协差阵的检验

《应用多元统计分析》第03章-多元正态分布均值向量和协差阵的检验

(3.7)
其中, T 2 (n 1)[ n(X μ0)S1 n(X μ0)]
给定检验水平
,查
F
分布表 ,使
P

n p (n 1) p
T
2

F


,可
确定出临界值
F
,再用样本值计算出 T 2 ,若
n p (n 1) p
T2

F

则否定 H 0 ,否则接受 H 0 。
例如,我们要考察全国各省、自治区和直辖市的社会经济发展 状况,与全国平均水平相比较有无显著性差异等,就涉及到多 元正态总体均值向量的检验问题等。
本章类似单一变量统计分析中的各种均值和方差的检验,相 应地给出多元统计分析中的各种均值向量和协差阵的检验。
其基本思想和步骤均可归纳为: 第一,提出待检验的假设H0和H1; 第二,给出检验的统计量及其服从的分布;
设 X (1) , X (2) , , X (n) 是 来 自 p 维 正 态 总体 N p ( μ , Σ ) 的 样
本,且
X

1 n
n
X ( )
1
,S

n
( X (a)
a 1

X )( X (a)

X ) 。
(一) 协差阵 Σ 已知时均值向量的检验
H0:μ μ0 ( μ0 为已知向量) H1:μ μ0
假设 H 0 成立,检验统计量为
T02 n( X μ0 )Σ 1( X μ0 ) ~ 2 ( p) (3.6)
给定检验水平 ,查 2 分布表使 P T02 2 ,可确定
出临界值

2

应用多元统计分析-第三章 均值向量和协差阵检验

应用多元统计分析-第三章 均值向量和协差阵检验

假设检验的过程-以妇女身高为例
首先要提出一个原假设,如妇女身高的
均值等于160cm( 160cm)。这种原假
设也称为零假设(null hypothesis),记 为H0。 与此同时必须提出对立假设,如妇女身
高均值不等于160cm( 160c)m。对立
假设又称为备选假设或备择假设 (alternative hypothesis)记为H1。
如果是两个以上总体的均值检验,则将 用到方差分析,到方差分析一章时,再 进行介绍。
根据一个样本对其总体均值大小进行检验
例3.1:如果你买了一包标有500g重的一包红糖, 你觉得份量不足。于是你找到监督部门; 当然他们会觉得一包份量不够可能是随机的。 于是监督部门就去商店称了50包红糖(数据在 sugar.sav); 其中均值(平均重量)是498.35g;这的确比 500g少,但这是否能够说明厂家生产的这批红 糖平均起来不够份量呢? 于是需要统计检验。 首先,可以画出这些重量的直方图(图5.)
这一步一般都可由计算机软件来完成。
第五,进行判断:如果p-值小于或等于a,
就拒绝零假设,这时犯错误的概率最多
为 ;如果p-值大于 ,就不拒绝零假
设,因 为证据不足。
假设检验的过程
在这个意义上,p-值又称为观测的显著 性水平(observed significant level)。 在统计软件输出p-值的位置,有的用“pvalue”,有的用significant的缩写“Sig” 就是这个道理。
n
如果 (x X ) 2cm 真是由抽样误差造成的, 那么它就不应该大于2或3个标准差,即
(x
X
)
2或3
n
如何假设检验?
反之,如果:

均值向量和协方差阵的检验

均值向量和协方差阵的检验

实验报告实验课程名称多元统计分析实验项目名称均值向量和协方差阵的检验年级 09级专业统计学生姓名周江学号 01理学院实验时间:2011年 10 月 4 日学生实验室守则一、按教学安排准时到实验室上实验课,不得迟到、早退和旷课。

二、进入实验室必须遵守实验室的各项规章制度,保持室内安静、整洁,不准在室内打闹、喧哗、吸烟、吃食物、随地吐痰、乱扔杂物,不准做与实验内容无关的事,非实验用品一律不准带进实验室。

三、实验前必须做好预习(或按要求写好预习报告),未做预习者不准参加实验。

四、实验必须服从教师的安排和指导,认真按规程操作,未经教师允许不得擅自动用仪器设备,特别是与本实验无关的仪器设备和设施,如擅自动用或违反操作规程造成损坏,应按规定赔偿,严重者给予纪律处分。

五、实验中要节约水、电、气及其它消耗材料。

六、细心观察、如实记录实验现象和结果,不得抄袭或随意更改原始记录和数据,不得擅离操作岗位和干扰他人实验。

七、使用易燃、易爆、腐蚀性、有毒有害物品或接触带电设备进行实验,应特别注意规范操作,注意防护;若发生意外,要保持冷静,并及时向指导教师和管理人员报告,不得自行处理。

仪器设备发生故障和损坏,应立即停止实验,并主动向指导教师报告,不得自行拆卸查看和拼装。

八、实验完毕,应清理好实验仪器设备并放回原位,清扫好实验现场,经指导教师检查认可并将实验记录交指导教师检查签字后方可离去。

九、无故不参加实验者,应写出检查,提出申请并缴纳相应的实验费及材料消耗费,经批准后,方可补做。

十、自选实验,应事先预约,拟订出实验方案,经实验室主任同意后,在指导教师或实验技术人员的指导下进行。

十一、实验室内一切物品未经允许严禁带出室外,确需带出,必须经过批准并办理手续。

学生所在学院:理学院专业:统计班级:09(1)班实验步骤:1.在SPSS软件的数据窗口依次定义变量,并输入要进行检验的数据。

2.首先要对数据是否遵从多元分布进行检验:Analyze-Descriptive Statistic-Explore....进入对话框,选中净资产收益率、总资产报酬率、资产负载率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率及资本积累率八个变量到Dependend List框中,点击进入Plots对话框,选中Normality Plots with tests复选项以输出有关正态性检验的图表,Continue继续,OK运行,则得到结果。

多元统计分析——均值向量和协方差阵检验33页PPT

多元统计分析——均值向量和协方差阵检验33页PPT
多元统计分析——均值向量和协方差 阵检验
46、法律有权打破平静。——马·格林 47、在一千磅法律里,没有一盎司仁 爱。— —英国
48、法律一多,公正就少。——托·富 勒 49、犯罪总是以惩罚相补偿;只有处 罚才能 使犯罪 得到偿 还。— —达雷 尔
50、弱者比强者更能富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非

多元统计分析——均值向量和协方差阵检验

多元统计分析——均值向量和协方差阵检验



2 2


构造检验统计量
u xy
12


2 2
n1 n2
当 H0 成立时,u N (0,1) 。检验规则为: 当| u | u /2 时,拒绝 H0 ; 当| u | u /2 时,接受 H0 。

2)两个总体方差
12


2 2
未知,但

2 1
=

2 2
=

2
用 sp 代替 ,构造检验统计量
构造统计量
F SS(TR) /(k 1) SSE /(n k)
当假设成立时, F : Fk 1,nk ,其否定域为 F Fk 1,nk (r)
多元方差分析 应用前提
与一元方差分析一样,多元方差分析要 满足独立性、正态性、方差齐性(各组方 差协方差矩阵相等)。
多元方差分析对正态性是稳健的,即总 体稍微偏离正态,对结论的影响不大。因 此,在样本量充分大的情况下,也能够对 偏态总体的均值作出推断。
较大且{ni}互不相等时,此时可用 F 分布去近似,M 近似遵从 bF( f1, f2 ),记作
i 1
i 1
当假设
H0
成立时,T
2

T2 p,
n
m

p1
,从而
n m p 1T 2 (n m 2)p
F ~ p, n m p1
即当给定显著性水平 的值时,若
F * Fp,nm p1
时,拒绝 H0 ,否则没有足够的理由拒绝 H0 。
(2)协方差不相等的情况(见书P25)
设 x1, x2 , , xn 是取自总体 N p (, ) 的一个样本,给定显著性水平 。

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

厦门大学《应用多元统计分析》习题第03章 多元正态分布均值向量和协差阵的检验

1
4
4
1
2
14
2
1
2
5
2
3
2
15
4
1
1
6
4
0
2
16
2
2
1
7
3
2
1
17
3
3
1
8
4
0
1
18
3
2
2
9
2
1
1
19
3
1
1
10
3
1
2
20
4
0
2
假定三组都服从多元正态分布,检验这三组的总体均值是否有显著性差异
(α = 0.05 )。
3.7 某医生观察了 16 名正常人的 24 小时动态心电图,分析出早晨 3 个小
2 LF HF 4.29 3.03 4.69 4.77 5.28 4.41 5.05 3.28 4.94 3.56 4.54 3.28 4.26 3.11 5.56 5.36
3 LF HF 4.77 3.57 4.58 3.04 5.37 4.79 4.65 2.86 4.68 3.97 4.61 4.40 5.27 3.88 5.55 5.00
3 LF HF 4.16 2.70 3.30 3.10 4.64 3.87 5.54 4.89 5.21 3.88 5.26 3.84 5.43 4.50 4.57 2.32
3.8 根据习题 3.5 中的数据,检验男性婴幼儿与女性婴幼儿的协差阵是否
相等(α = 0.05 )。
3.9 根 据 习 题 3.6 中 的 数 据 , 检 验 三 位 候 选 人 的 协 差 阵 是 否 相 等

多元统计分析第三章

多元统计分析第三章
元统计分析中有关检验问题。
① n2 =1时,用n代替n1 得到下面的关系式:
( p, n,1)
1
n p
1
1 n
T
2
(
p,
n)
所以
n p 1 1 ( p, n,1) p ( p, n,1)
② n2 =2时
F ( p, n p 1)
n p 1 ( p, n, 2) F (2 p, 2(n p)) p ( p, n, 2)
且两组样本相互独立,1 0,2 0
H0:1=2 H1: 1 2
分两种情况:
⑴ n=m
令 Z(i) X (i) Y(i) i 1, , n
1 n
Z n i1 Z(i) X Y
n
S (Z( j) Z )(Z( j) Z ) j 1
n
= ( X ( j) Y(i) X Y )( X ( j) Y(i) X Y )
3 协差阵相等时,两个正态总体均值向量的检验
设 X( ) ( X1, , X p ) N p (1, ) =1, ,n
Y( ) (Y1, ,Y p ) N p (1, ) =1, ,m
且两组样本相互独立,X
(1)有共同协差阵时
1 n
n i 1
X (i)
,Y
1 m

Y(i)
⑴H0 : p H1 : p
,n)来自p元正
检验统计量:
np
exp
1 2
trS
S
1 2
e n
2
其中
n
S= ( X ( ) X )( X ( ) X ) 1
(2)H0 : 0 p H1 : 0 p 0 0
存在D( D 0)使D0D p
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

请问:调查结果是否 说明这批妇女的身高 升高了?
为什么要假设检验?
为了回答这个问题,我们必须知道: 样本平均身高与总体平均身高之差
x X 162160 2cm
是由什么原因造成(或带来)的,即 是抽样误差造成的身高没变化
2cm产生的原因 不仅是误差, 确实是身高发生了变化
为什么要假设检验?
又如:同一位老师教授统计系本科两个 班同一门课程,如果两个班考试内容和 形式完全一样,但是平均成绩却不同: 一班28人,平均成绩74.82分,标准差 10.06分 三班38人,平均成绩76.74分,标准差9.11 分 请问:这两个班的平均成绩是否有显著 的差异?(学生成绩.sav)
这样的例子很多,其实只要我们进行比 较、判断时:总体与样本比,不同总体 之间比,样本与样本比等,都要用到假设 检验。
那么如何检验呢?
如何假设检验?
还是回到妇女身高的例子,已知样本均值与总 体均值相差2cm,这2cm是如何造成的?
是抽样误差造成的身高没变化 2cm产生的原因
不仅是误差, 确实是身高发生了变化
假设检验的过程-以妇女身高为例
形式上,上面的关于总体均值的H0相对 于H1的检验记为:
H0 : 160cm H1 : 160cm 我们将 H1 : 160 cm 的假设称为双
尾检验 ,即前面说述的假设检验。
假设检验的过程-以妇女身高为例
如果备选假设为:
H1 : 160 cm
或:
H1 : 160 cm
n
如果 (x X ) 2cm 真是由抽样误差造成的, 那么它就不应该大于2或3个标准差,即
(x
X
)
2或3
n
如何假设检验?
反之,如果:
(
x
X
)
2或3
n
那么我们说不应该发生的小概率发生了, 即2cm的误差不仅是由抽样误差带来的,而 且确实是样本均值与总体均值发生了显著 的差异。即这批妇女的身高增高了!
如何假设检验?
在用计算机软件进行假设检验时,计算 机输出的检验结果是:t-值和p-值(p-
value)
T值就是我们刚才计算过的t值,对于不 同的分布,计算t值的方法和公式不一样。 p-值(p-value)就是对应于t值及之外的双 尾概率,即小概率。
这就是双尾概率,p值为0.045,即p=4.5%
假设检验的过程
第二,确定检验统计量 。 有了两个假设,就要根据数据来对它们 进行判断。
根据零假设(不是备选假设!)来判断:
如果是检验均值的,那么一般是在正态 总体分布的背景下检验的。 如果是检验比例的,那么就要用到非参 数检验。
假设检验的过程
第三,确定显著性水平
根据样本所得的数据来拒绝零假设的概 率应小于0.05,当然也可能是0.01, 0.005,0.001等等。 显著性水平就是小概率水平,但小概率 并不能说明不会发生,仅仅是发生的概 率很小罢了。拒绝正确零假设的错误常 被称为第一类错误(type I error)。
这一步一般都可由计算机软件来完成。
第五,进行判断:如果p-值小于或等于a,
就拒绝零假设,这时犯错误的概率最多
抽样误差,即(x X )在 2 范围内的概率为99.45%
n
.即: P 2
n
(x
X)
2
n
99.45%
抽样误差,即(x X )在 3 范围内的概率为99.73%
n
.即:
P 3
n
(x
X)
3
n
99.73%
如何假设检验?
因此我们就需要计算:样本均值与总体 均值的差究竟等于几个标准差,即:
假设检验的过程
有第一类错误,就有第二类错误; 那是备选假设正确时反而说零假设正确 的错误,称为第二类错误(type II error)。 在一般的假设检验问题中,由于备选假 设往往不是一个点,所以无法算出犯第 二类错误的概率。
假设检验的过程
第四,根据数据计算检验统计量的实现
值(t-值)和根据这个实现值计算p-值;
如何假设检验?
首先可假设这2cm的误差是由抽样误差造 成的。 在总体参数估计中我们学过了样本均值 的分布:
样本均值 (x)服从N ( X , )
n
即:
样本均值(x)服从正态分布N (X, )
n
即: x N (160, 5
)
100
如何假设检验?
那么: (x X ) 2cm,等于 ?个标准差 呢?
第三章 多元正态总体
均值向量和斜方差阵 的检验
第一节
假设检验的回顾
为什么要假设检验?
我们举妇女身高的例子, 如果在2002年对10000 名妇女的身高进行了全 面调查,得出平均身高 为160cm,标准差为5cm。
在2004年对该妇女(还 是原总体)进行了随机 抽样调查,调查了100 名妇女,测得样本身高 162cm,标准差为5cm。
则称为单尾检验。 需要选择何种备选假设,则需根据需要决 定。
假设检验的过程-以妇女身高为例
需要注意的是:计算机输出结果中的p值 是双尾检验的概率。 如果备选假设选择的是单尾检验,则要 将计算机给的p值除以2,即取p值的一半。
计算机给的p值为0.045,即p=4.5%, 如果是单尾检验,则p=0.045/2=0.0225
为什么要假设检验?
还有:某减肥产品夸口说它的减肥效果 是如何如何的好,如果我们有一些志愿 者对该产品试服减肥,减肥前和减肥后 的体重发生了一些差异。(具体数据见 spss数据:diet.sav) 请问:体重发生的差异是否显著的?即 减肥是否真有效果,是否能相信该减肥 产品的减肥效果?
为什么要假设检验?
t
(x
X
)
162 5
160
2 0.5
4
n
100
所以说明样本均值与总体均值的差不仅是 抽样误差,而是确实两者之间存在着显著 的差异,即该批妇女的身高增高了!
如何假设检验?
小概率事件:在一次事件中几乎不可能 发生的事件。
一般称之为“显著性水平,用 表示。
显著性水平一般取值为:
0.05,即5% 0.01,即1%
假设检验的过程-以妇女身高为例
首先要提出一个原假设,如妇女身高的
均值等于160cm( 160cm)。这种原假
设也称为零假设(null hypothesis),记 为H0。 与此同时必须提出对立假设,如妇女身
高均值不等于160cm( 160c)m。对立
假设又称为备选假设或备择假设 (alternative hypothesis)记为H1。
相关文档
最新文档