抽样与抽样分布概论(PPT 43页)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
.8
F(8,200) F(4,100) F(2,50)
F_2_50 F_4_100 F_8_200
.6
.4
.2
0
0
1
2
3
4
5
x
图4-4 不同自由度的F分布
4.4.1 样本均值的抽样分布 4.4.2 样本比率的抽样分布
在重复选取容量为n的样本时,由样本均值的所有 可能取值形成的相对频数分布,一种理论概率分 布。
密度函数为
1
z2
f (z)
e 2 ( z )
2
E(z)=0 D(z)=1 1、z分布以Y轴为中心,左右对称
2、服从标准正态分布的随机变量Z的概率,与一 般的正态随机变量原理相同。
标准正态分布概率密度函数图
若随机变量 X N (0,1),随机变量 Y 2(n),且随机变量
X与Y相互独立,则随机变量
n
4.3.1 Z分布及其特点 4.3.2 t分布及其特点
4.3.3 2分布及其特点
4.3.4 F分布及其特点
当连续型随机变量X的密度函数为
f (x)
1
( x )2
e 22 ( x )
2
时,称X服从正态分布 N (, 2 ) ,有时也称X为正态随机变量。
设
Z X
则Z是一个服从标准正态分布 N (0,1) 的连续型随机变量,其
4.1.1 总体分布 4.1.2 样本分布 4.1.3 抽样分布
总体中各单位的观测值所形成的相对频数分布 。 分布通常是未知的 可以假定它服从某种分布
总体
从总体中抽取一个容量为n 的样本,由这 个观测值 n
形成的相对频数分布,称为样本分布,也称经验分 布。 当样本容量n逐渐增大时,样本分布逐渐接近总体的 分布
n n
当多次重复观察某个现象时,该现象发生的频率 与该现象发证的概率之间的差距是非常小的,是 用频率去代替概率提供理论依据。
设总体均值为 ,且存在有限方差 2,从中抽取
样本容量为n的样本。当样本容量足够大时
(n≥30),样本平均数 x的抽样分布近似地服
从正态分布,这就是著名的中心极限定理。
x N (, 2 )
们的平方和 2 服X从i2 自由度为n的 分布2 ,记 i 1 n
为
X
2 i
2 (n)。
i 1
其概率密度函数为:
f
(x)
n 22
1 ( n)
n 1 x
x2 e 2
x
0
2
0x 0
2
E(x)=n D(x)=2n 自由度增大,期望和方差随之增大。
2 是一种不对称偏峰分布,值域区间(0,+∞)
f
(x)
( n1 n2 ) 2
( n1 )( n2 )
(
n1
)
n1 2
n2
n1 1
x 2 (1
n1 n2
n1 n2
x) 2 x
0
2 2
0x 0
E(F)=n2/(n2-2) D(F)=2n22(n1+n2-2)/n1(n2-2)2(n2-4) 非对称的正偏分布,值域(0,+∞)
F分布的极限是正态分布,随第一自由度n1的增大, 分布曲线逐渐趋于对称,随两个自由度的增大, 分布曲线逐渐趋于正态分布。
t
X 服从自由度为 n
Y /n
的t分布,记为 t t(n)
其密度函数为
f
(x)
n 1 2
( n ) n
(1
x2 n
n1
) 2
x
2
E(t)=0 D(t)=n/(n-2) (n>2) 1、t分布是对称分布,均值为0 2、当自由度n ∞,方差极限为1 t分布的形状和自由度n有关系,自由度越小,t分布曲
(Xi )2
2 i1
1.25
N
现从总体中抽取n=2的简单随机样本,在重复抽
样条件下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
样本均值的抽样分布
n
x
xi
i1
M
1.0
1.5 16
4.0 2.5
n
(xi x )2
样 本
总体
样
计算样本统计量
本
如:均值、比例
、方差等。
4.2.1 大数定律 1. 独立同分布大数定律 2. 伯努利大数定律
4.2.2 中心极限定理
设独立随机变量 x1, x2, , xn 服从同一分布,且存
在数学期望 和方差 ,2 对于任意给定的 0
有
1
lim P( n n
n i1
4,3
4,4
计算出各样本的均值,如下表。并给出样本均值
的抽样分布
16个样本的均值(x)
第一个 观察值
第二个观察值
1
2
3
4
1
1.0 1.5 2.0 2.5
2
1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
4
2.5 3.0 3.5 4.0
P(x)
0.3
0.2
0.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
线较为扁平,与标准正态分布差异越大;自由度越大, t分布曲线与标准正态分布曲线的差异逐渐缩小。
y=f(t,4) y=f(t,10) y=f(t,180) N(0,1)
-6.0
-4.0
-2.0
0.0
2.0
4.0
6.0
图4-2标准正态分布以及各种自由度的t分布的密度函数的曲线
2Βιβλιοθήκη Baidu
若随机变量 X1,, X独n 立n 且同为标准正态分布 N (0,1,) 则它
xi
) 1
个别现象受到偶然因素的影响,对总体的大量观察 后进行平均,能使偶然因素的影响相互抵消,样本 平均数会稳定在附近,为样本平均数估计总体均值 提供理论依据。
在独立试验序列中,m是事件 A在 n次试验中发生
的次数,p是事件 A发生的概率,对于任意给定的
0有 lim P( m p ) 1
推断总体均值的理论基础
【例4-1】设一个总体,含有4个元素(个体) ,即总体
单位数N=4。4 个个体分别为X1=1,X2=2,X3=3,
X4=4 。从总体中采取重复抽样方法抽取容量为2的随 机样本,写出样本均值的抽样分布。
总体分布
.3
.2
.1
0 1
234
均值和方差
N
Xi
i 1
N
2.5
N
随自由度增大,曲线的最高点逐渐下移并向右移 动,趋于对称。
图4-3 不同自由度的 分2 布
若随机变量 X、Y 相互独立,且分别服从自由度为 n、1 n2的 2
分布,则随机变量
F
X Y
/ n1 / n2
服从第一自由度为
n,1 第二自由度
为 的n2F分布,记为 F F (n1, n2 )
其密度函数为: