概率论与数理统计 第六章 样本及抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
于是, F1 (1 ( n2 , n1 ), F 1 ( n1 , n2 ) n1 , n2 ) F 例 : F0.95 (12,9)
1 F0.05 (9,12) 1 2.80 0.357.
1 F ( n2 , n1 )
(查表 : F (n, m) (n m))
x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n

X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
X 100 Pr[7(98 100) / 5 7(102 100) / 5] 5/ 7 X 100 Pr[14 / 5 14 / 5] 5/ 7 2(2.8) 1 2*0.9974 1 0.9948 (标准化)
] 100, D [ X ]
25 49
] ].
1 ] 1 Pr[ F
1 F1 ( n1 , n2 )
1 F1 ( n1 , n2 )
] .
1 由于 F ~ F (n2 , n1 ), Pr[ F (n2 , n1 ) F (n2 , n1 )] .. 1 故 Pr[ F F (n2 , n1 )] .
X
X3 X4 Xn
Y=g(X1 , X2 ,…… ,Xn)
X1,X2,……,Xn独立与X共享同一分布
6
抽样分析中,我们要用到如下条件:
(1)来自总体X的随机样本 X1 , X2 ,…… ,Xn 独立、同分布。 (2)X1 , X2 ,…… ,Xn 独立、同分布。 分布已知,并重点讨论标准正态分布。 容量为n的一个样本:X1 , X2 ,……,Xn 思考题: 为什么只考虑(标准)正态分布就足够了?
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )
i1
n
n X
2
]
样本k阶(原点)矩: A k 样本k阶(中心)矩:B k
1 n

n
X
i 1
k i
, k 1 , 2 , 3 ,........

i 1
( X i X ) k , k 2, 3, ........
3
四大分布的联系
1. (标准)正态分布: X~N(0,1) 具有可加性 2.
23
(4) F-分布的分位点
Pr[ F F (n1 , n2 )] 性质: F1 (n1 , n2 )
1 F ( n2 , n1 )
(反对称性)

F (n1 , n2 )
24
F-分布的密度函数及反对称性质
1 函数性质: 如果F ~ F (n1 , n2 ), 则 ~ F (n2 , n1 ). F
为自由度为(n1, n2)的F-分布: F ~ F ( n1 , n 2 )
18
F-分布的密度函数
n n2 11 n1n2 ( n1 ) 2 n1 n1 n1 2 n1 n2 ( n2 )(n2 x) 1 n2 x 2 x 0 f (x; n1, n2 ) ( 2 ) ( 2 ) 0 x 0

t ( n )
17
(3)F-分布
设 U ~ ( n1 ), V ~ ( n 2 ) 且U、V为独立随 机变量,则称随机变量
2 2
F
U / n1 V / n2

2 ( X 12 ...... X n ) / n1 1 2 ( X '1 ...... X ' 2 n2 ) / n 2
U / n1 F ( n1 , n2 ) V / n2
4
§3 正态总体样本均值与方差分布
已知: 设总体X的均值为 ,方差为 2 , X 1 , X 2 , ....... , X n 为X的一个样本,则无论 X服从什么样的分布,总有:
E ( X ) , D( X ) 2 / n
观察值:
g(x1, x2 , ......., xn )
8
常用统计量(视为n元函数)
样本均值:X 1 n Xi
i 1 n
样本方差:S
2Biblioteka Baidu


1 n 1

S
n
i 1
(X i X )
2
2
1 n 1
[ X i2 n X 2 ]
i 1
2 i
n
样本标准差:S

1 n
n
1 n 1
[ X
i1
n
n X
2
]
样本k阶(原点)矩: A k 样本k阶(中心)矩:B k
1 n

n
X
i 1
k i
, k 1 , 2 , 3 ,........

i 1
( X i X ) k , k 2, 3, ........
9
已知总体分布,如何求一个统计量满足一定条件的概率 例:在总体N(100,25)中, 随机抽取一个容量为49的样 本,求样本均值 X 落在98到102之间的概率。 解:总体服从N(100,25), 有: E[X 所求概率为: p Pr[98 X 102]
(1) 2 分布
设 X 1 ,......, X n 是来自总体N(0,1)[标准正态 分布]的样本,则统计量
2 X 12 ...... X n2
是服从自由度为n的 2 -分布,记为: 2 ~ 2 (n)
14
2 -的密度函数
n / 2 1 x / 2 1 x e 2n / 2 ( n / 2) f ( x) 0
总体分布函数F(x)相应的统计量 ---经验分布函数 设 X 1 , ........, X n 为总体F的一个样本,定义:
S ( x ) | {i | X i x} | x ( , )
1 n
并定义经验分布函数为: F n ( x )
S (x)
例:总体F具有一个样本值:1, 2,3,则经验分布函数 为: x 1 0 1 1 x 2 3 F3 2 3 2 x 3 12 x3 1
16
t(n)-分布的密度函数及良好性质
h( x )
[( n 1) / 2]
n ( n / 2)
(1 )
x 2 ( n 1) / 2 n
, x
函数性质: (1) 关于x 0对称. (2) lim n h( x)
1 2
e
x2 / 2
.
h(x)
以标准正态分布为起点,研究三种特殊组合构 成的统计量的分布 1. (标准)正态分布: X ~ N ( 0 , 1 ) 2. 3. 4.
2 ( n ) 分布:
具有可加性
具有可加性
2 Y X 12 ...... X n , X i ~ N (0,1)
t ( n ) 分布: X ~ N (0,1), Y ~ 2 ( n )
26
f(y)

2

2
0
y
F (m , n) 1 2
F ( m , n ) 2
27

习题: P174-175 1,2,3,4
28
概率论与数理统计
主讲教师:许道云
贵州大学计算机科学与信息学院
Pr[ X x ] p
1
总体、样本、统计量
总体 样本 统计量
X1 X2
X
X3 X4 Xn
Y=g(X1 , X2 ,…… ,Xn)
t(n) X Y /n X ( X 12 ...... X n2 ) / n
F ( n1 , n 2 ) 分布: U ~ 2 ( n ), V ~ 2 ( n ) 1 2
U / n1 F ( n1 , n2 ) V / n2
13
§2 抽样分布(统计量的分布) 我们仅讨论(标准)正态总体X的几个常 见统计量的分布。



F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]

z
(1)标准正态分布分位点

(x)
( x)dx 1 ( x)dx


z
z1
( x)
Pr[ X z ]


z1
z
性质: z1 z
n1n2 ( ) n1 n1 n1 n1 n2 ( n2 )(n2 x) 1 n2 x 2 x 0 f (x; n1, n2 ) ( 2 ) ( 2 ) 0 x 0 n1n2 2
n 11 2


25
反对称性证明及换算:
1 1 Pr[ F F1 (n1 , n2 )] Pr[ F 1 1 Pr[ F 1 所以, Pr[ F 1 F1 ( n1 , n2 ) 1 F1 ( n1 , n2 )
7
统计量与观察值: (抽样:试验:观察)
随机样本X1 , X2 ,…… ,Xn 的实际测试值是 一组具体实数:x1 ,x2 ,……,xn 。 称为对X1 ,X2 ,……,Xn的观察值(或试验结 果、或样值)。 统计量:g ( X 1 , X 2 , ....... , X n )
2 2 2 g ( X , X , ....... , X ) X X ....... X 如: 1 2 n 1 2 n
X1,X2,……,Xn独立与X共享同一分布
2
常用统计量(视为n元函数) :
样本均值:X 1 n Xi
i 1 n
样本方差:S
2


1 n 1

S
n
i 1
(X i X )
2
2
1 n 1
[ X i2 n X 2 ]
i 1
2 i
n
样本标准差:S

1 n
n
1 n 1
[ X
假设 X ~ N ( , 2 ) 。 于是
X ~ N ( , 2 / n)
5
例1.设总体X~N(12,4),抽取一个样本 (X1,X2,…,X5).
概率论与数理统计
主讲教师:许道云
贵州大学计算机科学与信息学院
Pr[ X x ] p
1
第六章 样本及抽样分布
§1
随机样本 §2 抽样分布(来自标准正态总体) §3 正态总体样本均值与方差分布
2
数理统计研究方法流程图:
采集数据 抽样
总体X
样本
进行加工
统计量
对统计量 分析
对总体X作 出推断
P r[ X z ]

2 ( n )
22
(3) t(n)-分布的分位点
Pr[t t (n)] 性质: (1) t1 (n) t (n). (由对称性) (2) 当n 45时, t (n) z (标准正态分布分位点).
h(x)

t ( n )
由 ( z ) 1
2
z
= z 0.05
2
=
2
z0.025

1 0.025 0.975 2
21
(2)
2
-分布的分位点
分位点近似计算(当n充分大时):
2 2 (n) 1 ( z 2 n 1 ) , 其中 z 为标准正态分布分位点 。 2
分位点:

5 7
2
10
随机样本决定的联合分布函数
X的密度函数和分布函数:
f (x) F (x)
随机样本的密度函数和分布函数:
f
*
( x 1 , ........,
xn )

n
n
f (xi)
i1
F
*
( x 1 , ........,
xn )

F (xi)
i1
思考题: 为什么要这样定义?
11
20
分位点的确定
附:zα的值的确定-------查《标准正态分布表》法
例如,P{X>z0.05}=0.05,即 P{X<z0.05}=0.95, 查表得:z0.05=1.645 P{X>z0.01}=0.01,即 P{X<z0.01}=0.99, 查表得:z0.01= 2.33 又如,α=0.05,则
相关文档
最新文档