均值向量和协方差阵的检验讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§2.3.1 形象分析的基本思想
形象(profile)又称轮廓图,是将总体样本的均值绘制到
同一坐标轴里所得的折线图,每一个指标都表示为折线图上的 一点,若总体有 个指标,则其形象即由坐标轴里 个点连接 而成。注意这里的 个指标必须是同类可比指标,否则不能画 到一个坐标里面。
形象分析即是将两(多)总体的形象绘制到同一坐标下, 根据形象(轮廓图)的形状对总体的均值进行比较分析。
由§1.5,将 统计量乘上一个适当的常数后,便成为
F 统计量,也可用F分布表获得零假设的拒绝域。即
关于 、 的合理性及推证见参考文献[3] 在实际工作中,一元检验与多元检验可以联合使
用,多元的检验具有概括和全面考察的特点,而一元的 检验容易发现各指标之间的关系和差异,能帮助我们找 出存在差异的侧重面,提供了更多的统计分析信息。
§2.1.4 多总体均值的检验
设有r个总体G1,…,Gr,它们的分布分别是一元正态
N(μ1,σ2),…, N(μr,σ2),现从各个总体中抽 取的样本如下:
假设r个总体的方差相等,要检验的假设就是
§2.1.4 多总体均值的检验
这个检验的统计量与下列平方和密切相关
§2.1.4 多总体均值的检验
将上述方法推广到多元,就是设有r个总体G1,…,Gr,从 这r个总体抽取独立样本如下:
其中
Text in here Text in here Text i here Text in here
Text in here
§2.3 形象分析
§2.3.1 形象分析的基本思想 §2.3.2 形象分析的基本理论 §2.3.3 多个总体的形象分析 §2.3.4 需要注意的问题
§2.3 形象分析
上面我们论述了多个遵从多元正态分布的总体的均值比较问 题,在实际研究中,人们常常需要对来自两正态总体的样本做 更细致的分析。比如,比较两总体各个指标之间变动的幅度是 否相等,进一步,如果两总体各指标之间的变量幅度相等,比 较两总体的均值是否相等,更进一步,当通过了两总体均值相 等的假设之后,检验两总体各个指标的取值是否相等。统计学 家将对这类问题的解决方法归结为本节所讲的形象分析 (Profile Analysis)。形象分析广泛地用于实验设计数据的 检验,同时,也可应用于其他领域对多个指标的比较研究。本 节主要讲述形象分析的基本思想,分析过程及用SPSS软件进行 形象分析的方法。
相等的可能性就越小。
§2.1.2 多元均值检验
因而,在备择假设成立时, 的值有变大的趋势, 所以拒绝域可取为 值较大的右侧部分。因此,当给定 显著性水平 后,由样本的数值可立即算出 值,当
时,便拒绝零假设 。 T 2分布的5%及1%的分位点已列成专表,由网上下载,
为 的上 分位点。
§2.1.2 多元均值检验
虑对假设(2.9)作检验。这是著名Behrens— Fisher问题。长期以来,统计学家用许多方法试
图解决这个问题。当 与 相差较大时,T 2统计量 的形式是:
§2.1.3 两总体均值的比较
式中,
的统计含义与前相同,再令
§2.1.3 两总体均值的比较
当假设(2.9)的 成立时,可以证明(见文献[3]) 近似遵从第一自由度为 、第二自由度为
时,便拒绝零假设 ,说明均值μ不等于 ,其中 是
自由度为P的 分布的分为点。即
§2.1.2 多元均值检验
(ⅱ)协方差阵Σ未知
此时Σ的无偏估计是 的统计量是:
,类似于式(2.3)
可以证明,统计量遵从参数为p,n-1,,的 分布,

。统计量 实际上也是样本均值 与已知均值
向量 之间的马氏距离再乘以n(n-1),这个值越大,μ与 0
的H0为真的条件下求出能使风险值控制在α的临 界值W;
④ 建立判别准则; ⑤ 由样本观测值计算统计量值,再由准则做统计判
断。最后应对统计判断作出具体的解释
§2.1.2 多元均值检验
设 X ( ) ( X1,..., Xp ), 1,..., n 是容量为n的一个样本,
他们来自均值向量为μ,协方差阵∑(∑>0是正定阵)的
的F分布,即
§2.1.4 多总体均值的检验
在许多实际问题中,我们要研究的总体往往 不止两个。例如,要对全国的工业行业的生产经 营状况做一比较时,一个行业可以看成一个总体, 此时要研究的总体就达几十甚至几百个之多。这 类问题的研究就需要多元方差分析的知识。多元 方差分析是一元方差分析的直接推广,为了易于 理解多元方差分析的方法,我们先回顾一元的方 差分析。
著的差异,就是做行业间协方差阵相等性的检验。
用统计理论来描述就是:
§2.2.2 检验
(2.20) (2.21)
§2.2.2 检验

不大且
时,本书附表4中列出了M 的
上 分位点;若
较大且 互不相当时,附表4中未列出它们
对应的临界值,此时可用F分布去近似,M 近似遵从
,记

M≈
(2.22)
§2.2.2 检验
p的 2分布;事实上由§1.5
§2.1.2 多元均值检验
统计量 实质上是样本均值 与已知平均水平 之间的马
氏距离的 倍,这个值越大,μ与 相等的可能性就越小,
因而,在备择假设 H1成立时, 有变大的趋势,所以拒绝域应 取为 值较大的右侧部分。式中 是样本均值, 是样本容量。
当给定显著性水平 后,由样本值可以算出 的值,当
当假设为真时,统计量 t 2 遵从第一自由度为1、第二 自由度为n-1的F分布,简写成 t2 F1,n1(), 其否定域是
t2 F1,n1() ,后者为 F1,n1 的上α分位点
§2.1.2 多元均值检验
某工业行业的管理机构,想要掌握所属企业的生产经营
活动情况,选取了P个指标进行考察,根据历史资料的 记载,将P个指标的历史平均水平记作μ0,今年的P项 指标平均值记作μ,今年的P项指标平均值,与历史资
P元正态总体,对于指定向量μ0,要对下面的假设
H0 : 0 , H1 : 0 , (2.4)
做检验。检验的方法与一元相似,将分两种情况讨论
§2.1.2 多元均值检验
(ⅰ)协方差阵Σ已知 类似于(2.3)的统计量(注意(2.3)的形式)是
可以证明,在假设 为真时,统计量 遵从自由度为
§2.2.1 检验
设X1,…,Xn是来自正态总体Np(μ,Σ)的有一个样本, Σ0是已知的正定矩阵,要检验
H0: Σ= Σ0,H1: Σ≠ Σ0
检验假设(2.17)式用的统计量是:
是样本协方差阵,关于统计量M的推证过程见参考文献[1]。
§2.2.1 检验
柯云(Korin 1968)已导出M的极限分布和近似分布,并对 小的n算出了表,当p≤10,n≤75,α=0.05及α=0.01时M的 α分位点表,当P>10或n>75时,M近似于bF(f1,f2)
作为σ2的估计,用统计量
t x 0 n
S
(2.2)
来做检验。当假设成立时,t统计量遵从自由度为n-1的t分 布,t~tn-1,拒绝域为︳t ︳>tn-1(α/2)
tn-1(α/2)为tn-1上的α/2分位点
§2.1.1 一个指标检验的回顾
统计量(2.2)也可以改成如下的形式 :
t 2 n(x 0 )(S 2 )1(x 0 ) (2.3)
§2.1.3 两总体均值的比较
在许多实际问题中,往往要比较两个总体之 间的平均水平有无差异。例如,两所大学新生录取成 绩是否有明显差异;研究职工工资总额的构成情况, 若按国民经济行业分组,就是例如要研究工业与建筑 业这两个行业之间,是否有明显的不同之处;同理, 可按工业领导关系(中央、省、市、县属工业)分组; 也可按工业行业分组。组与组之间的工资总额构成有 无显著差异,本质上就是两个总体的均值向量是否相 等,这类问题,通常也称为两样本问题。两总体均值 比较的问题,又可分为两总体协方差阵相等与两总体 协方差阵不等两种情形。
料记载的平均值有无显著差异?有差异的话,进一步分 析,差异主要在哪些指标上,类似这样的情况,就是要 对下面的假设
H0 : 0, H1 : 0,
做检验,检验的思想和步骤与一元相似,可归纳如下:
§2.1.2 多元均值检验
① 根据问题的要求提出统计假设H0以及H1;
② 选取一个合适的统计量,并求出它的抽样分布; ③ 指定α风险值(即显著性水平α),并在零假设
μ x - 0 n
其中
1n x n i1 xi
为样本均值
(2.1)
当假设成立时,统计量μ服从正态分布μ-N(0,1),
从而拒绝域为 >μα/2,μα/2为N(0,1)上的 α/2分位点
§2.1.1 一个指标检验的回顾
当σ2未知时,用
S2

n

i 1
(xi x)2 (n 1)
H0:μ=μ0, H1:μ≠μ0. 或 H0:∑=∑0, H1:
∑≠∑0等
第二章 均值向量和协方差阵的检验
关于μ和∑的各种形式的假设检验构成了本章的内 容。本章的不少内容是一元的直接推广,但由于多指标 问题的复杂性,本章将只列出检验用的统计量,主要详 细介绍如何使用这些统计量做检验,而对有关检验问题 的理论推证全部略去。本章最后还介绍形象分析以及有 关检验的上机实现
成正
比例,此值愈大,说明两总体的均值很接近的可能性就愈小,
因而拒绝域可以取为 值较大的右侧区域,即当给定显著性水
平 的值时,若
时,拒绝 ,否则没有足够理由拒绝H 0。
§2.1.3 两总体均值的比较
2.协方差阵不相等情形
设从两个总体

取容量为 和 的两个样本,
,分别抽

假定两总体协方差阵不相等,我们考
下面我们借助于这一指标体系对我国上市公司的运营情况进行分析表21所列的是35家上市公司2000年年报数据这35家上市公司分别来自于电力煤气及水的生产和供应业房地行业信息技术业在后面各章中也经常以该数据为例进行分241均值及协方差阵的检验行业公司简称净资产收益率总资产报酬率总资产周转率流动资产周转已获利息倍数销售增深能源a168512354232037178718457354542215304651076177156748111941富龙热力897798305601705810431780944102589940440462465061106109粤电力a208120003587043125348924771267韶能股份886752275902408420593505402惠天热电1098794493003606912431688352原水股份88588836200130418531149244大连热电90374146890280796861623152龙电股份1207870168102806829754116306华银电力68561241930240654381120380表21241均值及协方差阵的检验房地产行业长春经开9851050312303404017131805718兴业房产10715266910210241533193108金丰投资1944701733402603070271221273新黄浦76159239640160174201477791浦东金桥4243993730020025398924469外高桥167319249050030051062174024中华企业87862857420170193587529293渝开发a022246340009015107125602981239869100100722653583316粤宏远a04211637420090151591918043st中福517662654801602113319912374倍特高新0722766539030042124840070三木集团59945365170740884147536087寰岛实业04202024030020038187133042中关村932448677603203716422942409241均值及协方差阵的检验信息技术业中兴通讯18781109691509310847980802327长城电脑149494
§2.1 均值向量的检验
§2.1.1 一个指标检验的回顾 §2.1.2 多元均值检验 §2.1.3 两总体均值的比较 §2.1.4 多总体均值的检验
§2.1.1 一个指标检验的回顾
设从总体N(μ,σ2) 中抽了一个样本x1,x2,…,
xn,我们要检验假设:
H0:μ=μ0, H1:μ≠μ0
当 σ2 已知时,用统计量
第二章 均值向量和协方差阵的检验
§1.1 均值向量的检验 §1.2 协方差阵的检验 §1.3 形象分析 §1.4 有关检验的上机实现
第二章 均值向量和协方差阵的检验
在一元统计中,关于正态总体N(μ,σ2)的均值μ和方
差σ2的各种检验,已给出了常用的μ检验、t检验、F检验 和χ2检验等。对于多个指标的正态总体Np(μ,∑ ), 各种实际问题同样要求对μ和∑进行统计推断。例如,要 考察某工业行业的生产经营情况,今年与去年相比指标的 平均水平有无显著差异,以及各生产经营指标间的波动是 否有显著差异,需做检验。
§2.1.3 两总体均值的比较
1.协方差阵相等的情形

态总体
的容量为 n1 的样本,
是来自p元正态总体
本,且两样本之间相互独立,
协方差阵相等,但未知,现对假设
为来自p元正
容量为 的样 假定两总体
进行检验。与前面类似的统计量的形式是:
§2.1.3 两总体均值的比较
§2.1.3 两总体均值的比较
因为 的值与总体均值的马氏距离
设我们要对 A、B 两个多元正态总体(方差相等)的 p将 样本均值作图得到如 图2-1所示的形象:
§2.3.1 形象分析的基本思想
A B
1
2
3
4
图2-1两总体的形象图
由上面的轮廓图可以清楚地看到,两总体的形象大体平
行,也就是说,p个指标的变动幅度大致相等,是否如此还
§2.1.4 多总体均值的检验
用类似于一元方差分析的办法,前面所述的三个平方和变成了 矩阵,形式如下:
很显然W =B + E
关于的检验可用Wilks Λ分布,再化为F分布,详细参考1.5节
§2.2 协方差阵的检验
§2.2.1 检验 §2.2.2 检验
§2.2 协方差阵的检验
上面讨论了多元正态分布均值的检验。但这仅 仅研究了问题的一个方面,倘若要进一步深究不同 总体的平均水平(均值)波动的幅度,前面介绍的 方法就无能为力了。本节所介绍的协方差阵的检验 可以解决该类问题
其中
§2.2.2 检验
上面讨论的检验
,是帮助我们分析当前
的波动幅度与过去的波动情形有无显著差异。但在
实际问题中,我们往往面临多个总体,需要了解这
多个总体之间的波动幅度有无明显的差异。例如在
研究职工工资构成时,若按工业行业分组,就有采
掘业、制造业、文化教育、金融保险等,不同行业
间工资总额的构成存在波动,研究波动是否存在显
相关文档
最新文档