(参考资料)卡方分布与F分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

卡方分布与F 分布
北京师范大学心理学院
骆方2009.9.8
要解决的问题
在日常生活中,我们经常关注总体方差,甚至超过高于总体平均数。

教育均衡问题
生产过程中的质量管理 投资风险的控制
抽样分布的作用
在推估总体平均值时,基于样本平均数的抽样分布
在用样本方差来推估总体方差时,必须知道样本方差的抽样分布
如果要比较两个总体的方差是否相等时,必须知道样本方差的联合抽样分布
卡方分布(chi-square distribution)
卡方分布的定义 卡方分布的密度函数 卡方分布的形状 卡方分布的性质 卡方分布的临界值 卡方分布定理一 卡方分布定理二
卡方分布的定义
设Z 1, Z 2, …Z υ相互独立且都为标准正态随机变量,则称变量2
22212v Z Z Z +++= χ所服从的分布为自由度为υ的χ2分布
For ν= 2:
22
121)(Y
Y Y Z σμ-=
2
2
22
2)(Y
Y Y Z σμ-=
22
2122Z Z +==νχ卡方分布的密度函数
定义:如果随机变量U 的概率密度函数f (u)为
则称随机变数U 服从自由度为ν的卡方分配,记为。

2
2
2
121(),0()2
u
f u u e u ν
νν
--=
≤<∞
Γ)(~2v U χ
卡方分布的形状卡方分布的性质(1)
卡方曲线所围的面积和为1
卡方分布为在大于等于0(正数)范围的正偏分布 不同的自由度决定不同的卡方分布
0.00
0.020.040.060.080.100.120.140.160
102030405060
70
f ()
χχv =5
v =30
卡方分布的性质(2)
卡方分布只有一个参数即自由度,为ν。

卡方分布的平均数与方差为:
卡方分布随着自由度增加而逐渐趋于对称,当自由度趋近于无穷大时,卡方分布趋近于正态分布
v
E =)(χv
Var v 2)(2=χ)
2,(~ ,2ννχνN v ∞→卡方分布的性质(3)
卡方分布的加法定理
两个独立的卡方随机变量相加所得的随机变量仍满足卡方分布,其自由度为其自由度之和。

222~)(,~,~v v v W U W U W U ++νχχχ独立,则且卡方分布的临界值
9.2364α=0.10
f ()
χχ2
v =5
Χ2α=
Table VII: Chi-Square Probabilities
0.10.050.0250.010.005df 2.706 3.841 5.024 6.6357.87914.605 5.9917.3789.21010.59726.2517.8159.34811.34512.83837.7799.48811.14313.27714.86049.23611.07012.83315.08616.750510.64512.59214.44916.81218.548612.01714.06716.01318.47520.278713.36215.50717.53520.09021.955814.68416.91919.02321.66623.589915.98718.30720.48323.20925.1881017.27519.67521.92024.72526.7571118.54921.02623.33726.21728.3001219.81222.36224.73627.68829.8191321.06423.68526.11929.14131.3191422.307
24.996
27.488
30.578
32.801
15
9.2364
α=0.10
f ()
χ2χ2
v =5查表练习
df=20
0.0250.0250.95
χ2.025=?
χ2.975=?
df
0.9950.990.9750.950.90.10.050.0250.010.0051------0.0010.0040.016 2.706 3.841 5.024 6.6357.87920.010.020.0510.1030.211 4.605 5.9917.3789.2110.59730.0720.1150.2160.3520.584 6.2517.8159.34811.34512.83840.2070.2970.4840.711 1.0647.7799.48811.14313.27714.8650.4120.5540.831 1.145 1.619.23611.0712.83315.08616.7560.6760.872 1.237 1.635 2.20410.64512.59214.44916.81218.54870.989 1.239 1.69 2.167 2.83312.01714.06716.01318.47520.2788 1.344 1.646 2.18 2.733 3.4913.36215.50717.53520.0921.9559 1.735 2.088 2.7 3.325 4.16814.68416.91919.02321.66623.58910 2.156 2.558 3.247 3.94 4.86515.98718.30720.48323.20925.18811 2.603 3.053 3.816 4.575 5.57817.27519.67521.9224.72526.75712 3.074 3.571 4.404 5.226 6.30418.54921.02623.33726.21728.313 3.565 4.107 5.009 5.8927.04219.81222.36224.73627.68829.81914 4.075 4.66 5.629 6.5717.7921.06423.68526.11929.14131.31915 4.601 5.229 6.2627.2618.54722.30724.99627.48830.57832.80116 5.142 5.812 6.9087.9629.31223.54226.29628.8453234.26717 5.697 6.4087.5648.67210.085
24.76927.58730.19133.40935.71818 6.2657.0158.2319.3910.86525.98928.86931.52634.80537.15619 6.8447.6338.90710.11711.65127.20430.14432.85236.19138.582207.4348.269.59110.85112.44328.41231.4134.1737.56639.997218.0348.89710.28311.59113.2429.61532.67135.47938.93241.401228.6439.54210.98212.33814.041
30.81333.92436.78140.28942.796
χ2
.025=34.17
df
0.9950.990.9750.950.90.10.050.0250.010.0051------0.0010.0040.016 2.706 3.841 5.024 6.6357.87920.010.020.0510.1030.211 4.605 5.9917.3789.2110.59730.0720.1150.2160.3520.584 6.2517.8159.34811.34512.83840.2070.2970.4840.711 1.0647.7799.48811.14313.27714.8650.4120.5540.831 1.145 1.619.23611.0712.83315.08616.7560.6760.872 1.237 1.635 2.20410.64512.59214.44916.81218.54870.989 1.239 1.69 2.167 2.83312.01714.06716.01318.47520.2788 1.344 1.646 2.18 2.733 3.4913.36215.50717.53520.0921.9559 1.735 2.088 2.7 3.325 4.16814.68416.91919.02321.66623.58910 2.156 2.558 3.247 3.94 4.86515.98718.30720.48323.20925.18811 2.603 3.053 3.816 4.575 5.57817.27519.67521.9224.72526.75712 3.074 3.571 4.404 5.226 6.30418.54921.02623.33726.21728.313 3.565 4.107 5.009 5.8927.04219.81222.36224.73627.68829.81914 4.075 4.66 5.629 6.5717.7921.06423.68526.11929.14131.31915 4.601 5.229 6.2627.2618.54722.30724.99627.48830.57832.80116 5.142 5.812 6.9087.9629.31223.54226.29628.8453234.26717 5.697 6.4087.5648.67210.085
24.76927.58730.19133.40935.71818 6.2657.0158.2319.3910.86525.98928.86931.52634.80537.15619 6.8447.6338.90710.11711.65127.20430.14432.85236.19138.582207.4348.269.59110.85112.44328.41231.4134.1737.56639.997218.0348.89710.28311.59113.2429.61532.67135.47938.93241.401228.6439.54210.98212.33814.041
30.81333.92436.78140.28942.796
χ2
.975=9.591
卡方分布定理一
)
,(~2σμN X 自正态总体中抽取n 个随机样本(X 1, X 2, …X n ),则2
2
12
1⎥⎦⎤
⎢⎣⎡-+⎥⎦⎤⎢⎣⎡-=⎥⎦⎤⎢⎣
⎡-∑=σμσμσμn n
i i X X X 2
2121n
χχχ=++= 的卡方分布
为自由度为n x X n
i n
i 2
1
2
2
1
)
(σμσμ∑∑==-=⎥⎦⎤
⎢⎣
⎡-卡方分布定理二
)
,(~2
σμN X 自正态总体中抽取n 个随机样本(X 1, X 2, …X n ),令
为样本方差
为样本平均数,2S X 2
1
2
1
2
2
2
~)
()1(-=∑-=
-n n
i X X S
n χσσ的卡方分布
为自由度为1)1(2
2
--n S n σ的卡方分布为自由度为1)1(2
2
--n S n σ
证明2
1
2
2
2
)
1()
()1()1(σσ---=
-∑=n X X n S
n n
i 2
1
2
)
(σ∑=-=
n
i X X []
2
1
2
)()(σ∑=---=
n
i u X u X []
2
1
2
2
)())((2)
(σ∑=-+----=
n
i u X u X u X u X 22
2
22
)
())((2)
(σσσ∑∑∑-+
---
-=
u X u X u X u X 常数
u X u X n u X u X u X ,)()
()(2)
(2
2
22
2
σσσ-+
---
-=
∑∑
的卡方分布为自由度为1)1(2
2
--n S n σ
证明2
2
2
2
2
2
2
)
()
()(2)
()1(σ
σ
σ
σ
u X n u X u X u X S
n -+
---
-=
-∑∑∑∑∑∑∑≠-=--=-=-=-0
)(0)()()(u X X X u X n nu X n u X u X 但注意 2
2
2
2
2
2
2
)()
()(2)
()1(σ
σ
σ
σ
u X n u X n u X u X S n -+
---
-=
-∑2
22
2222
)()()(⎪
⎪⎪⎭⎫

⎛---=---=∑∑n u X u X u X n u X σσσσ2
22
22
)1()(⎪
⎪⎪
⎭⎫

⎛-+-=-∑n u X S n u X σσσ的卡方分布为自由度为1)1(2
2
--n S n σ
证明2
22
2
2
)1()(⎪
⎪⎪⎭⎫

⎛-+-=-∑n u X S n u X σσσ的卡方分布
为自由度为n x X n
i n
i 2
1
2
2
1)
(σμσμ∑∑==-=
⎥⎦⎤
⎢⎣
⎡- 的卡方分布为自由度为1~212
χσ⎪
⎪⎪⎭⎫

⎛-n u X 根据卡方分布的加法定理
2
12
2~)1(--n S n χσ
单一总体方差的统计推断
2
1
2
2
~)1(--n S
n χσ
从一个标准差为σ的正态分布中取n 个样本
总体方差的区间估计总体方差的显著性检验
f ()
χχ总体方差的置信区间
2
1
2
2
~)1(--n S n χσα
χ
σχ
αα-=≤-≤
--
-1))1((22
,
12
2
22
1,1n n S n P α/2
α/2
1-α
2
2
1,1αχ-
-n 2
2
,
1αχ-n α
χσχαα-=-≤
≤--
--1))1()1((
2
2
1,12
22
2
,
12
n n S n S n P 2
2
1,12
2
2
2
,
12
)1()1(1ααχσχα-
---≤
≤--n n S n S n 置信区间总体方差的总体方差的置信区间(例子)
在一次全区统考中,某校40名学生成绩的方差为
144分,问全区学生成绩的方差95%的置信区间是多少?
解:df=40-1=39该区学生成绩的方差95%的置信区间(94.7,230.2)
22
1,12
222
,
12
)1()1(α
α
χ
σχ
-
---≤
≤-n n S n S n 4
.24144
393.59144392⨯≤≤⨯σ3.592025.02)2/05.0(==χχ4
.242975.02)2/05.01(==-χχ总体方差的显著性检验
建立假设
test)
l (right tai : : test)(left tail : : test) tails (two : :20212020202120202
0212020σσσσσσσσσσσσ>≤<≥≠=H H H H H H 2
2
2)1(σχS n -=
计量总体方差假设检验的统假设为真时的总体方差
例題
某工厂生产10mm 的螺钉,假设所生产的螺丝钉直径为常态分布且期望值为10mm ,虽然每支螺钉的直径不一定会刚好等于10mm ,生管部门希望将方差控制在0.09mm 以内,抽取12支螺钉样本来检验,得出以下数据,根据这些样本数据,在α=5%的水平下,推论所生产的镙钉是否合乎品管的要求?
10.0510.0010.029.9710.0710.039.9810.109.959.9910.0010.08
f ()
χχ
例題
写出假设
0.09: 0.09:2120>≤σσH H 计算统计检验量988
.209.0)
0022)(.112()1(2
20
2
2=-=
-=
σ
χS n 0022
.02=S 找出临界值α=0.05,
df= 12-1, χ2=?
χ20.05=19.675
比较检验统计量与临界值2.988 < 19.675
F 分布(F distribution )
F 分布的密度函数 F 分布的形状 F 分布的临界值 F 分布的定理一 F 分布的定理二
两个总体方差的统计推论
两总体方差是否相等可以用利F 分布作估计与检验 如果随机变量X 有密度函数f (x ) 为
则称随机变量X 服从自由度为ν1,ν2的F 分布(Ronald Fisher
),计为12
111222122
2(
)
2
()(
)(1),0
()()22
f x x x x νννν
νννννννν+--+Γ=
+>ΓΓ)
,(~21v v F X F 分布的形状
Degrees of freedom for the numerator
(分子自由度,第一个自由度)
Degrees of freedom for the denominator
(分母自由度,第二个自由度)
F 分布的性质
性质1: F 曲线所围的面积和为1
性质2: F 曲线横轴数值从0向右伸展至无限,与横轴没有相交
性质3: F 曲线为正偏分布,其形状由两个自由度ν1,ν2决定, 不同自由度有不同F 分布
F 分布的性质
性质4:
)
2( 2
)(222>-=
νννF E )
4( )
4)(2()
2(2)(22212122>---+=
νννννννF Var 定理一
如果U 与W 自由度分别为ν1及ν2的
独立卡方分布,则
,2
2
1
22
1~v v v v F v
v v W v U χχ=~U χ2
~v W χ两个独立的卡方随机变量分别除以其自由度后,两者相除可得F 随机变量,其中分子的自由度决定F 分布的第一个自由度,分母的自由度决定F 分布的第二个自由度。

定理二
假设X 1与X 2独立,且1
)
(--=
∑n X X S 1
)(--=
∑n X X S ),(~σμN X )
,(~σμN X ,
分别从这两个总体中抽取独立随机样本n 1与n 2
1
,122
222
12121~--n n F S S σσ证明定理二
根据卡方分布的定理:

個樣本,令:
1
,122
222
121~--=
n n F S S σσ的卡方分布
为自由度为)1()1(12
12
1
1--n S n σ2
1
2
12
1
1~)1(--n
S n χσ21
2
22
2
2~)1(--n S n χ
σ同理
根据定理一,两个独立的卡方随机变量分别除以其自由度后,两者相除可得F 随机变量。

)1()1(12
121
1--n S
n σ)
1()1(22
22
2
2--n S n σ定理二
根据定理二:

1
,122
222
121~--n n F S S σσ1
,12
2
212
221~--n n F S S σσ我们可以根据这个知识,从两样本的方差的比较来推论两总体方差是否相等。

F 分布的临界值
右侧临界值 左侧临界值
F 分布表(α=0.05)
v v /12345…910…
120∞1161.4199.5215.7224.6230.2…240.5241.9…253.3254.3218.5119.0019.1619.2519.30…19.3819.40…19.4919.50310.139.559.289.129.01…8.818.79…8.558.5347.71 6.94 6.59 6.39 6.26… 6.00 5.96… 5.66 5.635
6.61
5.79 5.41 5.19 5.05… 4.77 4.74…
4.40 4.36
……
10 4.96 4.10 3.71 3.48 3.33… 3.02 2.98… 2.58 2.5411
4.84 3.98 3.59 3.36 3.20… 2.90 2.85… 2.45 2.40……

3.84 3.00 2.60 2.37 2.21… 1.88 1.83…
1.22
1
分子自由度
分母自由度
找出df =(5, 10) F 0.05=?
找出df =(10, 5) F 0.05=?
找出df =(10, 5) F 0.05=?
4.74
F
f F ()
α=005
.df = (10, 5)
F 的倒数仍为F 随机变量

2
1
2
1
,2
21
2~v
v v v F v v F χχ=1212,1
22
2
~1v v v v F v v F χχ=1
2
1
2
2
1,1
222,~1
v
v v v F v v F χχνν=两个独立的卡方随机变量分别除以其自由度后,两者相除可得F 随机变量。

自由度的分子分母对调
F 的左侧临界值

)
,(1),(12211ννννααF F =
-F 表中为右侧概率为α的F 值,因为左侧的F 值可用F 分布的倒数值求得,左侧概率为α的F 值表为:
)
,(211v v F α-
F-Table α=0.025
F 0.025(9,8)=4.36
F0.975(9,8)= =1/ F0.025(8,9)=1/4.1=0.24
两总体方差比的区间估计
要对总体方差作区间估计必须假设两总体为正态分布且独立,1,122
222
1212
22122
2121~--=n n F S S S S σσσσF v v 12,,/-α0
F v v 12
,F v v 2
,,/αF
1-α
f F ()
的概率区间
F )1(α-α
αα-=≤≤-
1)),(),((212
212
1v v F F v v F
P 的概率区间
F )1(α-α
αα-=≤≤-
1)),(),((212
212
1v v F F v v F P ασσ
αα-=≤≤
-
1)),(//),((212
22
222121212
1v v F S S v v F
P ασσαα-=≤⋅≤
-
1)),(),((212
222
12122212
1v v F S S v v F
P )
,(1
),(1212
12
22
12221212
2
221v v F
S S v v F S S αασσ-
≤⋅≤总体方差比的置信区间
两总体方差比的区间估计(例子)
已知n1=10,=5,n2=15,=6,求二总体方
差之比的置信区间,能否说二总体方差相等: 解:计算自由度v 1=9,v 2=14
F 0.025(9,14)=3.21 F 0.975(9,14)= 1/3.77=0.27
故二总体方差之比,在0.26—3.14之间,作此推论正确的概率为0.95。

)
,(1
),(1v v F
S S
v v F S S σσ≤
≤21-n S 21-n S 27
.016521.316522
2
1⨯≤≤⨯σσ两总体方差的假设检验
比较两方差的比值
1:,1:
:22
2
10222102
2210≠=→=σσσσσσH H H 1:,1:
:22
2
11222102
2210<≥→≥σσσσσσH H H 1:,1:
:22
2
11222102
2210>≤→≤σσσσσσH H H Two tails test
Left tail test
Right tail test
两总体方差的假设检验
F 检验的统计量
,22
21
2
2
21~v v F S S F σ
σ=
1:
:22
2
102
2210=→=σσσσH H 如果虚拟假设为真,22
2
1~v v F S S F =
我们将方差较大者视为第一个总体,可以省去查左尾F 值的麻烦
例題
有甲、乙两牌电池,各抽10个测得其使用时间数据如下表(设使用时间呈正态分布)。

试在显著水平之下,比较甲乙两牌电池的平均寿命,是否有差异请先检定甲、乙两种电池寿命的方差是否相等。

平均寿命(小时)标准差(小时)甲16012乙
120
10
例題
设甲、乙两种电池使用时间均为常态分布,先检定两方差是否相等,即
H H 01222
11222::σσσσ=≠⎧⎨⎪⎩
⎪)
05.0(03.4)9,9(44.110
12025.022
==<==α设F F 无法推翻两方差相等的假设
1.44F f (F )
4.03F
平均寿命标准差甲16012乙
120
10
例題
甲乙两种电池使用时间的方差相等条件下,检验两平均数是否相等
假设两方差相等
H H 012112
::μμμμ=≠⎧⎨
⎩734.109.894
.440
2
.0122400)120160(05.0,1810
110
1=>==
⨯=
+
--=
t S t p
122
2
1010100
)110(144)110(2=-+⨯-+⨯-=
P S 方差分析中的方差齐性检验 哈特莱最大F 比率法
查F max 临界值表(附表5),当计算所得的值小于表中相应的临界值,可认为方差齐性 Fmax 的临界值表
k=比较的组数, 对每个样本方差来说df=n-1
2
min
2max max
S S F =方差分析中的方差齐性检验
在一项英语单词记忆实验中,要求一批被试分别采用机械式、联想武、理解式方法记忆100个英语单词。

各组被试正确回忆量的方差如下表所示。

试检验各组方差是否齐性。

(取α=0.05)
机械式
联想武
理解式
N 30 30 30S 2 2.5 3.0 4.5
方差分析中的方差齐性检验
计算F值F=S2max/S2min=1.8
计算自由度k=3,n-1=30-1=29
查表
0.05(3,29)=8.5
查表F
max
结论
F<F0.05(30,28)因此,方差齐性。

相关文档
最新文档