多元统计分析第2章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

13
目录 上页 下页 返回 结束
§2.1.2
多元均值检验
T 2的值有变大的趋势,所以 因而,在备择假设成立时, 拒绝域可取为 T 2值较大的右侧部分。因此,当给定显著性 水平α 后,由样本的数值可立即算出 T 2 值,当
T 2 > T p2,n−1 (α )
(2.7)
时,便拒绝零假设H 0。 为 Tp2,n −1 的上 α 分位点。
' i =1 i =1
n1


n2


样本离差阵.
2012-2-23
中国人民大学六西格玛质量管理研究中心
18
目录 上页 下页 返回 结束
§2.1.3
两总体均值的比较
当假设H 0 : μ1 = μ 2 成立时, T 2 ~ Tp2,n1 + n2 −2 , 从而 n1 + n2 − p − 1 2 T ~ Fp ,n1 + n2 − p −1 (2.11) (n1 + n2 − 2) p n1 + n2 − p − 1 2 * = T F 有变大的趋势, 当备择假设H 1 : μ1 ≠ μ 2 成立时, (n + n − 2) p
2012-2-23
中国人民大学六西格玛质量管理研究中心
16
目录 上页 下页 返回 结束
§2.1.3
两总体均值的比较
1.协方差阵相等的情形 设 X (α ) = ( X α 1 , X α 2 , " , X αp )' (α = 1," , n1 )为来自p元正 Y(α ) = (Yα 1 , Yα 2 , " , Yαp )' 态总体 N p ( μ1 , Σ) 的容量为 n1 的样本, (α = 1, " , n2 )是来自p元正态总体 N p ( μ 2 , Σ) 容量为 n2的样 本,且两样本之间相互独立,n1 > p , n2 > p假定两总体 协方差阵相等,但未知,现对假设
2
目录 上页 下页 返回 结束
第2章 均值向量和协方差阵的检验
2012-2-23
中国人民大学六西格玛质量管理研究中心
3
目录 上页 下页 返回 结束
§2.1
均值向量的检验
§2.1.1 §2.1.2 §2.1.3 §2.1.4
一个指标检验的回顾 多元均值检验 两总体均值的比较 多总体均值的检验
2012-2-23
2012-2-23
中国人民大学六西格玛质量管理研究中心
20
目录 上页 下页 返回 结束
§2.1.3
2 /
两总体均值的比较
Ly Lx + ) −1 ( X − Y) T = ( X − Y) ( n1 (n1 − 1) n2 (n2 − 1)
−1 = (X − Y) / S∗ (X − Y)
− −
(2.13)
Lx n1 ( n1 −1)
X , Y , Lx 和Ly 的统计含义与前相同,再令 S* = 式中,
+ n2 ( n2 −1)
Ly
f
−1
⎛ ⎞ −4 Lx −1 / −1 = ( n − n ) ⎜ ( X − Y ) S∗ ( )S∗ ( X − Y) ⎟ T n1 − 1 ⎝ ⎠
3 1 2 −1 1 2 3 2 2 −1 2
(α = 1, " , n1 ) ,Y(α ) = (Yα 1 , Yα 2 , " , Yαp )' (α = 1, " , n2 )
n1 > p, n2 > p.假定两总体协方差阵不相等,我们考 虑对假设(2.9)作检验。这是著名Behrens— Fisher问题。长期以来,统计学家用许多方法试 T 2统计量 图解决这个问题。当 Σ 1与 Σ 2相差较大时, 的形式是:
1 n1 1 n2 其中 X = ∑ xi , Y = ∑ yi ; n1 , n2 是样本容量 ; n1 i =1 n2 i =1 ∧ ( Lx + L y ) Σ= , 是协方差阵Σ的估计量; (n1 + n2 − 2)
Lx = ∑ ( xi − x)( xi − x) , Ly = ∑ ( yi − y )( yi − y ) ' , 是两个总体的
n− p 2 { T > Fp ,n − p (α )} (n − 1) p
2
(2.8)
关于 T、 在实际工作中,一元检验与多元检验可以联合使用, 多元的检验具有概括和全面考察的特点,而一元的检验 容易发现各指标之间的关系和差异,能帮助我们找出存 在差异的侧重面,提供了更多的统计分析信息。
2012-2-23
22
目录 上页 下页 返回 结束
§2.1.4
多总体均值的检验
在许多实际问题中,我们要研究的总体往往 不止两个。例如,要对全国的工业行业的生产经 营状况做一比较时,一个行业可以看成一个总 体,此时要研究的总体就达几十甚至几百个之 多。这类问题的研究就需要多元方差分析的知 识。多元方差分析是一元方差分析的直接推广, 为了易于理解多元方差分析的方法,我们先回顾 一元的方差分析。
2012-2-23
中国人民大学六西格玛质量管理研究中心
5
目录 上页 下页 返回 结束
§2.1.1 一个指标检验的回顾
2 − x x ( ) 当σ 2 未知时, 用S 2 = ∑ i 作为σ 2的估计, 用统计量 i =1 ( n − 1) x − μ0 t= n (2.2) S n
| t |> t n −1 (α / 2),
2
Ly ⎛ ⎞ −4 −1 / −1 S∗ ( X − Y ) ⎟ T + (n − n ) ⎜ ( X − Y ) S∗ (n2 − 1) ⎝ ⎠
2012-2-23
中国人民大学六西格玛质量管理研究中心
21
目录 上页 下页 返回 结束
§2.1.3
两总体均值的比较
当假设(2.9)的 H 0成立时,可以证明(见文献[3])
' − −1 −
∧ −1 −
可以证明,统计量遵从参数为p,n-1,,的− T 2分布, 即 T 2 > Tp2,n −1 。统计量 T 2实际上也是样本均值 X 与已知均值 向量 μ 0之间的马氏距离再乘以n(n-1),这个值越大,μ与 μ 0 相等的可能性就越小。
2012-2-23
中国人民大学六西格玛质量管理研究中心
H 0 : μ = μ0 , μ ≠ μ0
(2.9)
进行检验。与前面类似的统计量的形式 是:
2012-2-23
中国人民大学六西格玛质量管理研究中心
17
目录 上页 下页 返回 结束
§2.1.3
T2 =
两总体均值的比较
(2.10)
n1n2 ˆ −1 ( X − Y ) (X − Y)/ Σ n1 + n2
⎛ f − p +1⎞ ⎜ ⎟ T ⎜ ⎟ fp ⎝ ⎠
2
近似遵从第一自由度为 p、第二自由度为
f − p + 1的F分布,即
( ( f − p +1) 2 )T ~ Fp, f −p+1 fp (2.14)
当min(n1 , n2 ) → ∞时, T 2近似于χ 2 p
2012-2-23
中国人民大学六西格玛质量管理研究中心
Tp ,n −1 (α ) T 2分布的5%及1%的分位点已列成专表,由网上下载,
2
2012-2-23
中国人民大学六西格玛质量管理研究中心
14
目录 上页 下页 返回 结束
§2.1.2
多元均值检验
由§1.5,将 T 2统计量乘上一个适当的常数后,便成为 F 统计量,也可用F分布表获得零假设的拒绝域。即
7
目录 上页 下页 返回 结束
§2.1.2
多元均值检验
2012-2-23
中国人民大学六西格玛质量管理研究中心
8
目录 上页 下页 返回 结束
§2.1.2
多元均值检验
α
α α
2012-2-23
中国人民大学六西格玛质量管理研究中心
9
目录 上页 下页 返回 结束
§2.1.2
多元均值检验
α
X (α ) = ( X α 1 , " , X αp )'
中国人民大学六西格玛质量管理研究中心
4
目录 上页 下页 返回 结束
§2.1.1 一个指标检验的回顾
u=
x − μ0
σ
n
(2.1)
1 n 其中x = ∑ xi为样本均值。 n i =1 当假设成立时 u ~ N (0,1), , 统计量u服从正态分布 从而拒绝域为| u |〉ua / 2 , ua / 2为N (0,1)的上a / 2分位点
T02 的合理性及推证见参考文献[3]
中国人民大学六西格玛质量管理研究中心
15
目录 上页 下页 返回 结束
§2.1.3
两总体均值的比较
在许多实际问题中,往往要比较两个总体之间的 平均水平有无差异。例如,两所大学新生录取成绩是 否有明显差异;研究职工工资总额的构成情况,若按 国民经济行业分组,就是例如要研究工业与建筑业这 两个行业之间,是否有明显的不同之处;同理,可按 工业领导关系(中央、省、市、县属工业)分组;也 可按工业行业分组。组与组之间的工资总额构成有无 显著差异,本质上就是两个总体的均值向量是否相 等,这类问题,通常也称为两样本问题。两总体均值 比较的问题,又可分为两总体协方差阵相等与两总体 协方差阵不等两种情形。
2 χ = n( x − μ 0 ) Σ ( x − μ 0 ) ≥ χ p (α ) 2 0 ' −1


自由度为P的 χ 分布的分为点。即
2
2 2 P{χ 0 > χp (α )} = α
时,便拒绝零假设 H 0,说明均值μ不等于 μ 0,其中 χ p (α )是
2
2012-2-23
中国人民大学六西格玛质量管理研究中心
时,拒绝 H 0 ,否则没有足够理由拒绝H 0。
2012-2-23
(2.12)
中国人民大学六西格玛质量管理研究中心
19
目录 上页 下页 返回 结束
§2.1.3
两总体均值的比较
2.协方差阵不相等情形 设从两个总体 N p (μ1 , Σ1 ) 和 N p (μ 2 , Σ 2 ) ,分别抽 取容量为 n1和 n2的两个样本,X (α ) = ( X α 1 , X α 2 ," , X αp )'
第2章 均值向量和协方差阵的检验
•§2.1 •§2.2 均值向量的检验 协方差阵的检验
•§2.3 有关检验的上机实现
2012-2-23
Baidu Nhomakorabea中国人民大学六西格玛质量管理研究中心
1
目录 上页 下页 返回 结束
第2章 均值向量和协方差阵的检验
χ2
以 做检验。
2012-2-23
中国人民大学六西格玛质量管理研究中心
12
目录 上页 下页 返回 结束
§2.1.2
(ⅱ)协方差阵Σ未知 的统计量是:

多元均值检验

L 此时Σ的无偏估计是 Σ = (n − 1)
,类似于式(2.3)
T 2 = n( x − μ 0 ) ' Σ ( x − μ 0 ) = n(n − 1)( x − μ 0 ) L ( x − μ 0 )
1 2
ˆ − 1 ( X − Y ) 成正 因为T 2 的值与总体均值的马氏距离 ( X − Y )'Σ 比例,此值愈大,说明两总体的均值很接近的可能性就愈小, 因而拒绝域可以取为F ∗ 值较大的右侧区域,即当给定显著性水 平 α 的值时,若
F ∗ > Fp ,n1 + n2 − p −1 (α )
t n −1 (α / 2)为t n −1的上α / 2分为点。
2012-2-23
中国人民大学六西格玛质量管理研究中心
6
目录 上页 下页 返回 结束
§2.1.1 一个指标检验的回顾
t 2 = n ( x − μ 0 )( S 2 ) −1 ( x − μ 0 )
(2.3)
α α
2012-2-23
中国人民大学六西格玛质量管理研究中心
− − 1 −1 − ' −1 ( X − μ 0 ) ( Σ) ( X − μ 0 ) = n ( X − μ 0 ) Σ ( X − μ 0 ) ~ χ 2 ( p) n ' −
2012-2-23
中国人民大学六西格玛质量管理研究中心
11
目录 上页 下页 返回 结束
§2.1.2
多元均值检验

2 χ 统计量 0 实质上是样本均值 X 与已知平均水平 μ 0 之间的马 氏距离的 n 倍,这个值越大,μ与μ 0 相等的可能性就越小, 2 χ H 因而,在备择假设 1 成立时, 0 有变大的趋势,所以拒绝域应 − 2 χ 取为 0值较大的右侧部分。式中 X 是样本均值, n 是样本容 量。 2 χ α 0 当给定显著性水平 后,由样本值可以算出 的值,当
2012-2-23
中国人民大学六西格玛质量管理研究中心
10
目录 上页 下页 返回 结束
§2.1.2
(ⅰ)协方差阵Σ已知
多元均值检验
类似于(2.3)的统计量(注意(2.3)的形式)是
χ = n( x − μ 0 ) Σ ( x − μ 0 )
2 0 ' −1
2


(2.5)
可以证明,在假设 H 0为真时,统计量 χ 0 遵从自由度为 2 p的χ 分布;事实上由§1.5 − 1 X− μ ~ N p (0, Σ), n 知当H 0: μ = μ 0 成立时,由多元统计分布的性质4,有
相关文档
最新文档