均值向量和协方差阵的检验
多元统计分析实验指导书——实验一均值向量和协方差阵检验
实验一SPSS软件的基本操作与均值向量和协方差阵的检验【实验目的】通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。
同时能够掌握对均值向量和协方差阵进行检验。
【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1.操作SPSS的基本方法(打开、保存、编辑数据文件)2.问卷编码3.录入数据并练习数据相关操作4.对均值向量和协方差阵进行检验,并给出分析结论。
【实验学时】4学时【实验方法与步骤】1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗4.对一份给出的问卷进行编码和变量定义5.按要求录入数据6.练习基本的数据修改编辑方法7.检验多元总体的均值向量和协方差阵8.保存数据文件9.关闭SPSS,关机。
【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。
2.遇到各种难以处理的问题,请询问指导教师。
3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。
4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。
5.上机时间,禁止使用计算机从事与课程无关的工作。
【上机作业】1.定义变量:试录入以下数据文件,并按要求进行变量定义。
表1学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($代表人民币)200201 刘一迪男1982.01.12 156.42 47.54 75 79 345.00 200202 许兆辉男1982.06.05 155.73 37.83 78 76 435.00 200203 王鸿屿男1982.05.17 144.6 38.66 65 88 643.50 200204 江飞男1982.08.31 161.5 41.68 79 82 235.50 200205 袁翼鹏男1982.09.17 161.3 43.36 82 77 867.00 200206 段燕女1982.12.21 158 47.35 81 74200207 安剑萍女1982.10.18 161.5 47.44 77 69 1233.00 200208 赵冬莉女1982.07.06 162.76 47.87 67 73 767.80 200209 叶敏女1982.06.01 164.3 33.85 64 77 553.90 200210 毛云华女1982.09.12 144 33.84 70 80 343.00200211 孙世伟男1981.10.13 157.9 49.23 84 85 453.80200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00男1981.11.21 168.55 50.67 79 79 657.40 200213 欧阳已祥200214 贺以礼男1981.09.28 164.5 44.56 75 80 1863.90200215 张放男1981.12.08 153 58.87 76 69 462.20200216 陆晓蓝女1981.10.07 164.7 44.14 80 83 476.80200217 吴挽君女1981.09.09 160.5 53.34 79 82200218 李利女1981.09.14 147 36.46 75 97 452.80200219 韩琴女1981.10.15 153.2 30.17 90 75 244.70200220 黄捷蕾女1981.12.02 157.9 40.45 71 80 253.00要求:1)变量名同表格名,以“()”内的内容作为变量标签。
第二章均值向量和协方差阵的检验
若m元随机向量X=(X1,…,Xm)T的概率密度函数为
f(x1,…,xm) = (2π)- m/2 |Σ|- 0.5 exp{--0.5(x—μ)T Σ-1 (x—μ)}
其中μ、Σ分别是X的均值向量和协方差阵,则称X为m元正态分 布。记作X ~ N (μ, Σ)。
正态随机变量的线性函数的分布
定理1.已知XN(,2),则Y=a+bXN(a+b,b22)
1) 1)
S12 / σ12 S22 / σ22
i1
~ F ( n1 -1 ,n2 -1 ) .
§3 正态总体参数的假设检验
一、单总体均值的假设检验
iid
~ 设X1,,X n N(, 2 ),给定检验水平,由观测
值 x1,,xn检验假设H0: 0
1、2已知的情形---U检验
2
2
检验统计量: T X μ0 ~ t(n1) Sn
由p{|T|>t/2(n 1)} =,
得水平为的拒绝域为
|T|>t/2(n1)
·右侧HT问题 H0: =0 ;H1: >0
·左侧HT问题 H0: =0 ;H1: <0
检验统计量: T X μ0 ~ t(n1) Sn
)
(
y2
2 2
)2
21 2 1 2
1 0, 2 0, x , y
X与Y的边缘密度函数为:
fX (x) f (x, y)dy
1
e
(
x1 )2 212
,
x
2 1
fY ( y) f (x, y)dx
第三章 多元正态分布均值向量和协方差的检验
第三章多元正态分布均值向量和协方差的检验
1.基本思想和步骤
2.均值向量的检验
(1)分布:设且X与S相互独立,,则称统计量的分布为非中心分布
当时,称服从(中心)分布,记为
(2)转换为F分布:若且X与S相互独立,令,则
3.一个正态总体均值向量的检验
(1)协差阵已知,检验统计量为
(2)协差阵未知,检验统计量为
4.两个正态总体均值向量的检验
设为来自p维正态总体的容量为n的样本,
为来自p维正态总体的容量为m的样本,且两组样本相互独立
①针对共同已知协差阵,检验统计量为
②针对共同未知协差阵,检验统计量为
(2)协差阵不等
①针对n=m的情形,检验统计量为
②针对n≠m的情形,检验统计量为
5.多个正态总体均值向量的检验
(1)单因素方差分析:设k个正态总体分别为,从k个总体中取个独立样本,,假设H0成立,检验统计量为
其中,组间平方和为,组内平方和为,总平方和为,其中,
(2)若,则为X的广义方差,为样本广义方差
(3)Wilks分布:若且二者相互独立,
为Wilks统计量,分布为Wilks分布,简记为
(4)多元方差分析:检验统计量为
其中,,A为组间离差阵,E为组内离差阵,T为总离差阵,且T=A+E
6.协差阵的检验
(1)一个正态总体协差阵的检验:构造检验统计量
(2)多个协差阵相等的检验:构造检验统计量。
第四讲均值向量和协方差阵的检验
2
若两总体协差阵相等且未知时,
n1n2 ˆ 1 ( X Y ) ~ T 2 ( p, n n 2) T ( X Y )' 1 2 n1 n2
2
根据两个样本可得μ1和μ2的无偏估计量为
1 n1 x xi n1 i 1 1 n2 y yi n2 i 1 1 1 X Y ~ N p 0,( ) n21 n2 n1n2 X Y ~ N p 0, n1 n2
L1 L2 ˆ 又 ~ Wp (n1 n2 2, ) n1 n2 2
检验原k个观测指标向量之间的互协方差阵是否为零,就是要 检验如下的假设:
H0 : ij 0, i j, i, j 1, 2,, k
若对此p维观测指标向量进行了n次观测,得到了一个容量 为n的样本 x(1) , x(2) , x(n )
并已计算出了样本叉积矩阵向量,则可将此样本叉积 矩阵按原k个观测指标向量进行分块,得到如下的分块 叉积矩阵为:
方差分析表
协方差阵的检验
单个总体协方差阵相等的检验
总体协方差阵是否等于已知常数矩阵的检验
H0 : 0 , H1 : 0
总体协方差阵是否等于已知常数矩阵倍数的 检验
H0 : 0 , H1 : 0
2 2
多总体协方差阵相等的检验
假设有k个多元正态总体,它们的分布分别 为 N p (1, 1 ),, N p (k , k ) 。现从每个总体中分别 随机抽取了一个样本,要根据这些样本,对于 这些总体的协方差阵是否相同进行检验。 首先,列出原假设和备择假设。它们分别为:
多元统计分析(何晓群 中国人民大学) 第二章
2021/1/28
中国人民大学六西格玛质量管理研究中心
因为T 2的值与总体均值的马氏距离 (X Y)'Σˆ 1 (X Y) 成 正比例,此值愈大,说明两总体的均值很接近的可能性就愈小,
因而拒绝域可以取为F 值较大的右侧区域,即当给定显著性水
平 的值时,若
F F ( ) p,n1n2 p1
(2.12)
时,拒绝 H 0 ,否则没有足够理由拒绝H 0。
本,且两样本之间相互独立,n1 p, n2 p假定两总体 协方差阵相等,但未知,现对假设
H0 : 0 , 0
(2.9)
进行检验。与前面类似的统计量的形式是:
2021/1/28
中国人民大学六西格玛质量管理研究中心
18
目录 上页 下页 返回 结束
§2.1.3 两总体均值的比较
T 2 n1n2 (X Y)/ Σˆ 1(X Y) n1 n2
多元统计分析
何晓群
中国人民大学出版社
2021/1/28
中国人民大学六西格玛质量管理研究中心
1
第二章 均值向量和协方差阵的检验
•§2.1 均值向量的检验 •§2.2 协方差阵的检验 •§2.3 形象分析 •§2.4 有关检验的上机实现
2021/1/28
中国人民大学六西格玛质量管理研究中心
2
目录 上页 下页 返回 结束
0
f
p fp
1
T
2
近似遵从第一自由度为
p、第二自由度为
f p 1的F分布,即
((
f
f
p 1))T 2 p
~
Fp, f p1
(2.14)
当min( n1, n2 ) 时,T 2近似于2p
第三章 均值向量和协方差阵检验1
例1:如果你买了一包标有 500g 重的一包红 糖,你觉得份量不足。于是你找到监督部门; 当然他们会觉得一包份量不够可能是随机的。 于是监督部门就去商店称了 50 包红糖(数 据在 sugar.sav );其中均值(平均重量) 是 498.35g ;这的确比 500g 少,但这是否 能够说明厂家生产的这批红糖平均起来不够 份量呢?于是需要统计检验。
2
未知
X 0
X 0 s n
在显著水平
Ⅰ Ⅱ Ⅲ
n
下拒绝 H0,若
0
0 0
0
0 0
z u
1
2
t t
1
2
( n 1)
z u1 z u1
t t1 ( n 1) t t1 ( n 1)
2 2 A、 1 与 2 已知时
构造统计量
z
X Y
12
n1
2 2
n2
2 2 B、 1 与 2 未知但相等时
构造统计量
t
X Y (n1 1) s12 (n2 1) s22
n1n2 (n1 n2 2) n1 n2
H0
H1
1 , 2 已知 方差 统计量 z
(2)确定检验统计量 1 有了两个假设,就要根据数据来对它们进行判断: 选择适当的统计量,并在原假设 H0 成立的条件下确 定该统计量的分布。 (3)确定显著性水平α 根据样本所得的数据来拒绝零假设的概率应小于 0.05 ,当然也可能是 0.01 , 0.005 , 0.001 等 等。 根据统计量的分布查表,确定对应于α的临界值.
显著性水平就是小概率水平,但小概率并不 能说明不会发生,仅仅是发生的概率很小罢 了。拒绝正确零假设的错误常被称为第一类 错误( type I error )。 有第一类错误,就有第二类错误:那是备选 假设正确时反而说零假设正确的错误,称为 第二类错误( type II error )。
均值向量和协方差估计、均值分析和协差阵检验
武夷学院实验报告课程名称:多元统计分析项目名称:均值向量和协方差估计、均值分析和协差阵检验姓名:专业:信息与计算科学班级:1班学号:同组成员:无协差阵。
下面通过一个实例来说明多元正态分布参数估计的SPSS实现过程。
这里以海峡西岸经济区的20个城市为研究对象,选取海峡西岸经济区的主要经济指标进行均值向量和协差阵的估计。
主要经济指标包括:地区生产总值、固定资产投资额、社会消费品零售总额、货物进出口总额、实际利用外商直接投资,规模以上工业总产值以及公共财政预算收入等7个指标。
表2.2数据来源于2013年《中国城市统计年鉴》和2013年《中国区域经济统计年鉴》。
将表2.2数据输入到SPSS的数据编辑窗口中得到如下图(一)计算样本均值向量的步骤(1)点击分析→描述统计→描述,进入描述性主对话框,将待估计的7个变量选入变量列表框中。
(2)点击主对话框选项。
选择Mean选项,即可计算样本均值向量。
(3)点击继续返回主对话框。
点击确定按钮,执行操作。
(二)输出结果解释下表是描述统计(Descriptive Statistics)的内容,该表给出了样本均值向量。
由上表可得地区生产总值的样本均值向量估计为16830963.10万元;固定资产投资额的样本均值向量为10152282.35万元;社会消费品零售的样本均值向量为6857594.05万元;货物进出口总额的样本均值向量估计为1059096.20万美元;实际利用外商直接投资的样本均值向量估计为46204.65万美元;规模以上工业总产值的样本均值向量为24937870.25万元;公共财政预算收入135.3055亿元。
2、协方差的估计(1)样本协方差阵的步骤(1)点击分析→相关→双变量,进入双变量相关主对话框。
将7个变量选入右边的变量列表框中。
(2)点击主对话框选项。
选择叉积偏差和协方差选项,即可计算样本离差阵和样本协差阵。
(3)点击继续,返回主对话框。
点击确定按钮,执行操作。
多元统计分析——均值向量和协方差阵检验
多元统计分析——均值向量和协方差阵检验均值向量检验是评估两个或多个总体均值是否相等的方法。
在多元统计分析中,均值向量检验常用于比较不同组别或条件下的均值是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的均值向量可以表示为一个p维的向量。
我们的目标是比较这k个均值向量是否相等。
常用的均值向量检验方法有Hotelling's T-squared统计量和Wilks' Lambda统计量。
Hotelling's T-squared统计量是基于方差-协方差阵的一个推广,它考虑了样本组别的大小和协方差结构。
它的计算公式为:T^2=n(p-k)/(k(n-1))*(x1-x)^TS^(-1)(x1-x)其中,n是每个组别的观测数,p是变量的个数,k是组别的个数,x1是第一个组别的均值向量,x是总体均值向量,S是协方差阵。
T^2的分布是一个自由度为k,维度为p的非中心F分布。
Wilks' Lambda统计量是基于协方差阵的特征值的一个变换,它的计算公式为:Lambda = ,W,/,B其中,W是所有组别的散布矩阵(Within-groups scatter matrix),B是总体的散布矩阵(Between-groups scatter matrix)。
Wilks' Lambda的分布是一个自由度为k和n-k-1的F分布。
协方差阵检验是评估两个或多个总体协方差阵是否相等的方法。
在多元统计分析中,协方差阵检验常用于比较不同组别或条件下的变量之间的协方差结构是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的协方差阵可以表示为一个p维的矩阵。
我们的目标是比较这k个协方差阵是否相等。
常用的协方差阵检验方法有Hotelling-Lawley's Trace统计量和Pillai-Bartlett's Trace统计量。
均值向量和协方差阵的检验实验报告
均值向量和协方差阵的检验实验报告嘿,大家好!今天咱们聊聊一个听上去挺高大上的话题,均值向量和协方差阵的检验。
这听起来就像在说外星人的语言,其实也没那么复杂,咱们慢慢来,轻松愉快地搞定它。
想象一下你在和朋友聚会,大家都在聊各自的生活,分享自己的故事。
每个人的经历就像一组数据,有的高高兴兴,有的郁郁寡欢,这些故事就形成了一个均值向量。
均值向量呢,就是这些故事的“平均水平”,能告诉我们大家的普遍状况。
比如说,某个朋友总是出去旅游,那他在这个聚会里的均值肯定就比其他人高。
这其实很有趣,感觉每个人的生活就像一根根串珠,串在一起的就是大家的均值。
再说到协方差阵,这玩意儿就像一个大网,把每个人的故事串联起来。
它能告诉你不同数据之间的关系。
想象一下,你和你的小伙伴经常一起吃饭,这种关系就像是协方差阵的体现。
它不仅仅告诉你们的吃饭频率,还能分析出你们吃什么、什么时候吃,以及这段友情对你们生活的影响。
换句话说,协方差阵帮我们理解这些数据是怎么互动的。
在我们的实验中,咱们主要是想检验一下这些均值和协方差是不是合理。
这时候,就需要一些统计的方法。
大家可能会觉得统计是个无聊的领域,满是公式和计算,简直让人打哈欠。
其实不然,这个过程就像侦探在寻找证据,解决一个个谜团。
我们拿到数据,就像是拿到了一张藏宝图。
通过计算均值、协方差,咱们一点点挖掘出其中的秘密。
检验均值向量和协方差阵的过程可不简单,得用到一些统计检验的方法,比如t检验和卡方检验。
这些方法就像是咱们的工具箱,各种工具都有其独特的用途。
有的用来比较均值,有的用来检查数据的分布。
想象一下,一个厨师在厨房里忙碌,调料、锅具、食材各司其职,最后做出一顿美味的大餐。
咱们在统计的世界里也是如此,得心应手才能得出正确的结论。
在这个过程中,数据可得经过一番“洗礼”。
有时,咱们会发现数据里藏着一些“异常值”,这些就像是在聚会上讲冷笑话的人,让人哭笑不得。
为了让我们的结果更靠谱,就得把这些“冷笑话”给去掉,保持数据的干净整洁。
多元统计分析-均值向量和协方差阵检验
81
60.8
84
59.5
上半壁围(cm) 16.5 12.5 14.5 14.0 15.5 14.0
3.独立样本检验
• 即对相互独立的两个样本的均值进行比较,看二者 是否有显著的差异。与单一样本T检验的原理相同, 采用小概率反证法。
• 首先假设:H0两个样本来自同一总体,u1=u2 • 独立样本t检验的前提: (1)两个样本相互独立 (2)两个样本来自正态总体 若违反这一假设,应采用非参数检验或变换变量使适
6r2 (n 1)2
1 }, nr n1 n2
至少有一对ni nr
nj
检验的基本步骤:
一.提出待检验的假设H0和H1
二.给出检验的统计量及它服从的分布 三.给定检验水平 ,查统计量的分布表,确定临界值,从而得到否定域 四.根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待
(1)当 已知时,用统计量 x 0 n
其中:
1 n
x n i1 xi
为样本均值。
当假设成立时, ~N(0,1),否定域为| | /2 , / 2 为 N (0,1) 的上 / 2 分位点。
n
(2)当 未知时,用 S 2 (xi x )2 /(n 1) 作为 2 的估计,用统计量 i 1
02
如在医学研究中, 分析几中药物对某 种疾病的疗效;
为什么多样本均值检验不采 用两两样本的t检验,而一定 要采用方差分析
统计结论都是概率性的。假 设实际情况是H0成立,那么 根据设置的显著性水平如 0.05, 平均每100次检验中 有5次会得出拒绝H0的错误 结论。
设有4个样本,若采用两两样本的t检验,共要进行4!/[2!(42)!]=6次,
由 的函数的近似分布进行检验
第2章均值向量和协方差阵的检验作业及解答
第2章均值向量和协⽅差阵的检验作业及解答
第2章均值向量和协⽅差阵的检验作业及解答
2.1 ⼤学⽣的素质⾼低要受各⽅⾯因素的影响,其中包括家庭环境与家庭教育(x1)、学校⽣活环境(x2)、学校周围环境(x3)和个⼈向上发展的⼼理动机(x4)等。
从某⼤学在校学⽣中抽取了20 ⼈对以上因素在⾃⼰成长和发展过程中的影响程度给予评分(以9分制),数据如下表所⽰:
假定x=(x1,x2,x3,x4)’服从四元正态分布。
试检验
H0:µ=µ0=(7,5, 4,8),H1:µ≠µ0,(α= 0.05).
解:这是⼀个总体的多元均值检验。
2.2 测量30名出⽣到3周岁婴幼⼉的⾝⾼和体重数据(见下表),其中男⼥各15名,
1),假定这两组都服从正态分布且协⽅差阵相等,试在显著性⽔平0.05下检验男⼥婴幼⼉的这两项指标是否有显著差异?请将下表的数据输⼊到SPSS⽂件中,并进⾏检验。
解:这是两总体均值检验。
2.3 1992年美国总统选举的三位候选⼈为布什、佩罗特和克林顿。
从⽀持三位候选⼈的选民中分别抽取了20 ⼈,登记他们的年龄段(x1)、受教育程度(x2)和性别(x3)资料如下
1),假定三组都服从多元正态分布,检验这三组的总体均值是否有显著性差异(α=0.05)。
2),检验三位候选⼈的协差阵是否相等(α=0.05)。
解:这是多总体均值检验。
均值向量和协方差阵的检验
μ= x - µ0 n σ
∑ 其中
x=1 n
n
xi
i −1
为样本均值
(2.1)
当假设成立时,统计量μ服从正态分布μ-N(0,1),
从而拒绝域为 µ >μα/2,μα/2为N(0,1)上的 α/2分位点
§2.1.1 一个指标检验的回顾
当σ2未知时,用
S2
=
n
∑
i −1
(xi − x)2 (n −1)
§2.2.1 检验
设X1,…,Xn是来自正态总体Np(μ,Σ)的有一个样本, Σ0是已知的正定矩阵,要检验
H0: Σ= Σ0,H1: Σ≠ Σ0
检验假设(2.17)式用的统计量是:
是样本协方差阵,关于统计量M的推证过程见参考文献[1]。
§2.2.1 检验
柯云(Korin 1968)已导出M的极限分布和近似分布,并对 小的n算出了表,当p≤10,n≤75,α=0.05及α=0.01时M的 α分位点表,当P>10或n>75时,M近似于bF(f1,f2)
H0:μ=μ0, H1:μ≠μ0. 或 H0:∑=∑0, H1:
∑≠∑0等
第二章 均值向量和协方差阵的检验
关于μ和∑的各种形式的假设检验构成了本章的内 容。本章的不少内容是一元的直接推广,但由于多指标 问题的复杂性,本章将只列出检验用的统计量,主要详 细介绍如何使用这些统计量做检验,而对有关检验问题 的理论推证全部略去。
当假设为真时,统计量 t 2 遵从第一自由度为1、第二 自由度为n-1的F分布,简写成 t 2 > F1,n−1(α ), 其否定域是
t 2 > F1,n−1(α ) ,后者为 F1,n−1 的上α分位点
§2.1.2 多元均值检验
均值向量和协方差阵的检验
实验报告实验课程名称多元统计分析实验项目名称均值向量和协方差阵的检验年级 09级专业统计学生姓名周江学号 01理学院实验时间:2011年 10 月 4 日学生实验室守则一、按教学安排准时到实验室上实验课,不得迟到、早退和旷课。
二、进入实验室必须遵守实验室的各项规章制度,保持室内安静、整洁,不准在室内打闹、喧哗、吸烟、吃食物、随地吐痰、乱扔杂物,不准做与实验内容无关的事,非实验用品一律不准带进实验室。
三、实验前必须做好预习(或按要求写好预习报告),未做预习者不准参加实验。
四、实验必须服从教师的安排和指导,认真按规程操作,未经教师允许不得擅自动用仪器设备,特别是与本实验无关的仪器设备和设施,如擅自动用或违反操作规程造成损坏,应按规定赔偿,严重者给予纪律处分。
五、实验中要节约水、电、气及其它消耗材料。
六、细心观察、如实记录实验现象和结果,不得抄袭或随意更改原始记录和数据,不得擅离操作岗位和干扰他人实验。
七、使用易燃、易爆、腐蚀性、有毒有害物品或接触带电设备进行实验,应特别注意规范操作,注意防护;若发生意外,要保持冷静,并及时向指导教师和管理人员报告,不得自行处理。
仪器设备发生故障和损坏,应立即停止实验,并主动向指导教师报告,不得自行拆卸查看和拼装。
八、实验完毕,应清理好实验仪器设备并放回原位,清扫好实验现场,经指导教师检查认可并将实验记录交指导教师检查签字后方可离去。
九、无故不参加实验者,应写出检查,提出申请并缴纳相应的实验费及材料消耗费,经批准后,方可补做。
十、自选实验,应事先预约,拟订出实验方案,经实验室主任同意后,在指导教师或实验技术人员的指导下进行。
十一、实验室内一切物品未经允许严禁带出室外,确需带出,必须经过批准并办理手续。
学生所在学院:理学院专业:统计班级:09(1)班实验步骤:1.在SPSS软件的数据窗口依次定义变量,并输入要进行检验的数据。
2.首先要对数据是否遵从多元分布进行检验:Analyze-Descriptive Statistic-Explore....进入对话框,选中净资产收益率、总资产报酬率、资产负载率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率及资本积累率八个变量到Dependend List框中,点击进入Plots对话框,选中Normality Plots with tests复选项以输出有关正态性检验的图表,Continue继续,OK运行,则得到结果。
第二章均值向量和协方差阵的检验
tx0 n
S
(2.2
| t | tn1(/2),
tn1(/2)为 tn1的 上 /2分为点。
2021/8/19
中国人民大学六西格玛质量管理研究中心
6
目录 上页 下页 返回 结束
§2.1.1 一个指标检验的回顾
t2 n (x 0 )S ( 2 ) 1 (x 0 )
(2.3
2021/8/19
§2.1.2 多元均值检验
(ⅱ)协方差阵Σ未知
此时Σ的无偏估计是
L ,类似于式(2.3)
的统计量是:
(n 1)
1
T2 n(x0)' Σ (x0)
n(n1)(x0)' L1(x0)
可以证明,统计量遵从参数为p,n-1,,的 T 2 分布,
即
T2
T2 p,n1
。统计量 T 2实际上也是样本均值X 与已知均值
2021/8/19
中国人民大学六西格玛质量管理研究中心
19
目录 上页 下页 返回 结束
§2.1.3 两总体均值的比较
2.协方差阵不相等情形
设从两个总体 Np(1,1) 和 Np(2,2),分别抽
取容量为 n 1 和 n 2 的两个样本,X ( ) (X 1 ,X 2 , ,X p )'
( 1 , ,n 1),Y () (Y 1 ,Y 2 , ,Y p )(' 1 , ,n 2 )
n1p,n2p.假定两总体协方差阵不相等,我们
考虑对假设(2.9)作检验。这是著名Behrens—
Fisher问题。长期以来,统计学家用许多方法试
图解决这个问题。当
Σ
与
1
Σ
2相差较大时,T
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设从总体 Np(1,)和Np(2,)中各自独立地抽取样本 x (x (1 ),x (2 ), ,x (n 1 ))和 y (y (1 ),y (2 ), ,y (n 2 )), 0。
考虑假设 H0:12 H1:12
统 计 量 T 2n 1 n 2 (x y )' ˆ 1(x y ) n 1n 2
825.1429 自由 n1度 2 1 1 : 20
组间离差平方和(条件误差)SSA
i k1ni(yi y)2 7 ( 3 4 . 7 1 4 4 1 . 5 7 1 ) 2 7 ( 4 9 . 5 7 1 4 1 . 5 7 1 ) 2
7(4.4 02 4 9.5 17 )2178.2686
这里,现欲检验
H0:0
H1:0
1、协方差阵 已知:
T 0 2 n (X 0 ) 1 (X 0 )~p 2
其中:
n
X
i1
i=1 n
X
1
1 n
n i 1
(i)
1 n
i=1
Xi2
X2
n X p
i=1
X ip
拒 绝 域 :T 0 2 n ( X 0 ) 1 ( X 0 ) p 2 ()
S yn 2(y(i)y)(y(i)y)(n2 1 ) ˆY i 1
n
S X ( X (i) X )( X (i) X ) i 1
n
( xi1 X1)2
i1
n
( xi1 X1)( xi2 X 2 )
i1
n
( xi2 X 2 )2
i 1
n
( xi1
X1)( xip
X
p)
2、协方差阵不相等情形
设从总体 Np(1,1)和Np(2,2)中各自独立地抽取样
本 x (x (1 ),x (2 ), ,x (n 1 ))和 y (y (1 ),y (2 ), ,y (n 2 )),1 2 。
考虑假设
H0:12 H1:12
统 计 量 T2(xy)'( Sx Sy )1(xy) n1(n11) n2(n21)
n
( xi1 X1)2
i1
n
( xi1 X1)( xi2 X 2 )
i1
n
( xi2 X 2 )2
i 1
n
( xi1
X1)( xip
X
p)
i 1
n
( xi2 X 2 )( xip X p )
i 1
n
( xip X p )2
i 1
二、 两个总体均值的检验
1、协方差阵相等的情形
yij)/n3 43 7 2 1 4 24 04.5 171
三个班次工人的平均劳动效率分别为:
y134.714 y249.571 y340.429
总离差平方和SST
k
i1
jni4 . 5 ) 1 2 7 3 4 1 7 . 5 ) 1 2 7 ( 4 1 4 0 . 5 ) 1 2 7
均值向量和协方差阵的检验
主要内容
§1 均值向量的检验 §2 协方差阵的检验 §3 形象分析
§1 均值向量的检验
一、单个总体均值的检验 二、两个总体均值的检验 三、多总体均值的检验
一、 单个总体均值的检验
问题:
设 X ( ) ( X 1 ,,X p ) '( 1 ,,n )是容量为n
的样本,且 X()~Np(,),对于指定向量 0
=(xy)'S* 1(xy)
令:f 1 (n13n12)-1(xy)'S*1(n1Sx1)S*1(xy)2T4 (n32 n22)-1(xy)'S*1(n2Sy 1)S*1(xy)2T4
当原假设为真的条件下,
(f
-fpp+1)T2
~Fp,f-p+1
三、多总体均值的检验
问题的提出 统计的模型及检验方法 多重比较检验
1、回顾:一元方差分析: F检验
例1: 某工厂实行早、中、晚三班工作制。工厂管理部门想了解不
同班次工人劳动效率是否存在明显的差异。每个班次随机抽出了7 个工人,得工人的劳动效率(件/班)资料如表。分析不同班次工人 的劳动效率是否有显著性差异。 a=0.05,0.01。
早班
中班
晚班
34
49
39
37
47
i 1
n
( xi2 X 2 )( xip X p )
i 1
n
( xip X p )2
i 1
当原假设为真的条件下, F n p 1 ( n 1 n 2n 2 p 2 1 )T 2~ F (p ,n 1 n 2 p 1 )
检验的规则为:
n p 1 ( n 1 n 2 n 2 p 2 1 ) T 2 F ( p ,n 1 n 2 p 1 ) ,接 受 原 假 设 ; n p 1 ( n 1 n 2 n 2 p 2 1 ) T 2 F ( p ,n 1 n 2 p 1 ) ,拒 绝 原 假 设 .
2、协方差阵 未知:
的无偏估计为ˆ
1S n1
1 n1
n i1
(X(i)
X)(X(i)
X),
统计量
T2 n(X0)ˆ 1(X0)n(n-1)(X0)S1(X0)
T2 ~ T2p,n1
拒绝域: T2 T2p,n1()
或:
n- p T2 (n1)p
Fp,np()
n
S ( X (i) X )( X (i) X ) i 1
其中:
1 n1 x n1 i1 x(i)
y
1 n2
n2
y(i)
i1
ˆ ( n ( 1 S x n 2 S y ) 2 ) n 1 n 1 n 2 1 2 ˆX n 1 n 2 n 2 1 2 ˆY
S xn 1(x (i)x )(x (i)x )(n 1 1 ) ˆX i 1
组内离差平方和(随机误差)SSe
k
i1
jni1(yij
yi
)2
( 3 3 4 .7 4 ) 2 1 4 ( 3 3 6 .7 4 ) 2 14
( 4 4 9 .5 1 )2 7 1 ( 5 4 1 .5 1 )2 71
40
35
51
42
33
48
39
33
50
41
35
51
42
36
51
40
为什么各值 会有差异?可能的原因有两个。
一是,各个班次工人的劳动效率可能有差异, 从而导致了不同水平下的观察值之间差异,即存 在条件误差。
二是,随机误差的存在。
如何衡量两种原因所引起的观察值的差异?
总平均劳动效率为:
y(
k
ni
i1ji