统计学 第六章 样本及抽样分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.由分布的可加性易得 2分布的可加性:
若12
~
2
(n1
),
2 2
~
2 (n2
),并且12
,
22独立,
有
2 1
2 2
~
2
(n1
n2 ).
3. 若 2 ~ 2 (n), 则有E( 2 ) n, D( 2 ) 2n.
( Xi ~ N(0, 1), E(X i )2 D(Xi ) 1,
D(Xi2 )
2
,y
0,
0, 其它.
3. 性质 :
若F
~
F(n 1 , n2 ), 则
1 F
~
F(n
2 , n1 ).
4. F - 分布的上分位点:
对于给定的, 0 1, 称满足条件:
P{F F (n1 , n2 )}
(y)dy
F (n1 ,n2 )
的点F (n1 , n2 )为F 分布的上分位点.
(
n
)
的
点
2
(n)为
2
(n)分
布
的
上分
位
点.
其值由附表4给出.
2 ( n )
1 2 (Z
2n-1)2 .
2
(
nf()y)1
2
(Z
2n-1)2 .
0
2
(n)
y
(二) t-分布:
1. 定义: 设X~N(0, 1), Y~ 2 (n), 并且X, Y 相互独立,
则称 t X Y /n
服从自由度为n 的 t 分布, 记作t~t(n).
E(X
4 i
)-(E(X
2 i
))
2
3-1 2
n
n
于是有E(2 ) E(
X
2 i
)
E(X
2 i
)
n,
i1
i1
n
n
D(2 ) D(
X
2 i
)
D(X
2 i
)
2n.
)
i1
i1
4. 2分布的上分位点:
对于给定的正数, 0 1, 称满足条件
P{ 2
2
(n)}
f (y)dy
2
n
n
P{
2 2
1 n
(Xi
)2
2
2
};
P{
2 2
1 n
(Xi X)2 22 }
i1
i1
16
16
解
( ) Xi 2
~
2
(16),
而
1 2
(Xi X)2 ~ 2 (15),
i1
i1
16
则(1)P{
2 2
1 16
(Xi )2 22 }
i1
16
P{
16 2
( ) Xi 2
32}
定义经验分布函数F n
(x)为:
F n
(x)=
1 n
S(
x
),
x
统计量是样本的函数, 它是一个随机 变量. 统计量的分布称为抽样分布.
三. 几种常用的统计分布:
(一) 2分布
1. 定义 :设X1 , X2 ,, Xn来自总体N(0, 1)的样本,则称
统计量 2
X12
X
2 2
X
2 n
服
从
自
由度
为n的
f2 (1 , 2 ,l )
g l (1 , 2 , l ) l
目
录
随机样本 抽样分布 点估计 估计量的评选标准 区间估计 正态总体均值与方差的区间估计 (0-1)分布参数的区间估计 单侧置信区间 假设检验 正态总体均值的假设检验 正态总体方差的假设检验 分布的拟合检验 秩和检验
第六章 样本及抽样分布
数理统计的内容:如何收集、整理带有随机 性的数据资料;如何对所得的数据资料进行分 析、研究,从而对所研究的对象的性质、特点 作出推断。
S
2 2
1 n2 1
n2
(Yi
i 1
Y )2分别为两样本方差
,则:
(1) S12
2 1
/ S22
/
2 2
~F(n1 -1,n2 -1);
(2)当1 = 2 = 时,
(X-Y)-(1 -2
11
)
~
t ( n1
n2
2),
S
n1 n2
其中 S2
(n1
1)S12 (n2 1)S22 (n1 n2 2)
定理二. 设X1 ,X2 , , Xn是总体N (, 2 )的一个样本,
X , S 2分别是样本均值和样本方差,则 :
10 . (n-1)S 2 ~ 2 (n-1), 20 . X与S 2独立. 2
定理三. 设X1 ,X2 , , Xn是总体N (, 2 )的一个样本,
X , S 2分别是样本均值和样本方差,则 :
h(t)dt
t (n)
的点t (n)为t(n)分布的上分位点.
1.由t分布的上分位点的定义及h(t)的对称性知
t1- (n) -t (n).
2.t分布的上侧分位点由附表3给出.当n>45时,有
t (n) Z .
h(t)
0
t ( n )
(三) F分布:
1.定 义 : 设U ~ 2 (n1 ), V ~ 2 (n2 ),且U, V独 立,
§1. 随机样本
一. 定义:在统计学中, 我们将试验的全部可能的观察值称 为总体(这些值可能是相同的),每一个可能观察值称为 个体,总体中所包含的个体的个数称为总体的容量。 (可分为有限总体和无限总体)
一个总体对应于一个随机变量。
二. 定义:设X是具有分布函数F的r.v.,若X1, X2,…,Xn是具 有同一分布函数F的相互独立的r.v.,则称为从分布函数F (或总体F、或总体X)得到的容量为n的简单随机样本, 简 称样本, 它们的观察值x1,x2, …, xn称为样本值, 又称为X 的n个独立的观察值.
X ~t(n-1).
Sn
定理四. 设X1 ,X2 , , Xn1 与Y1 ,Y2 , , Yn2 分别是
来自正态总体N
(
1
,
2 1
),
N
(
2
,
2
2
)的样本,
且这两个样本相互独立, 设X
1 n1
n1
i 1
Xi ,
Y
1 n2
n2
Yi 分别为两样本均值, S12
i 1
1 n1
n1
1
(Xi
i 1
X )2 ,
二. 矩估计法:
设总体X的分布函数为F(x; 1 , 2 ,l ),
则X的k阶 原 点 矩 k
E(X
k
)也
是
1
,
2
,
的
l
函
数,
记g g1
(k(1 ,1, 2 ,2, l )l
) E(X 1
k
)(k
1, 2,l)假定 1 f1 (1 , 2 ,
从方程 l )
组
g
2
(
1
,
2
,
l
)
2 可解出2
,k
2, 3, .
说明
1.它们的观察值为x
1 n
n i1
xi
,仍称为样本
均值,
s2
1 n1
n i1
(x i
x)2 , 称为样本方差,
2.
当k
1时,
A1
X,当k
2时,
B2
n n
1
S2.
结论 : 若总体X的k阶矩E(X k ) k 存在, 则当n 时, Ak P k .
证明:X1 , X2 ,Xn独立且同分布,
2. t(n)分布的概率密度函数
n1
( h(t)
2
)
(1
t2
n1 -
) 2 ,-
t
.
n(n ) n
2
利用函数的性质可得lim h(t)
1
t2 -
e 2,
n
2
即当n充分大时, 有t - 分布近似N(0, 1)分布.
3. t(n)分布的上分位点:
对于给定的, 0 1, 称满足条件:
P{t t (n)}
2.设X1 , X2 , X3 ;Y1 ,Y2 ,Y3 ,Y4是来自总体X ~ N ( 0, 2 )
的两个独立样本,则统计量
2 T
X1 X2 X3
服从
t(4 ) _______
分布.
3 Y12 Y22 Y32 Y42
3.设总体X ~ N(, 4)分布, X1 , , Xn是来自总体X的 一个样本,要使E(X )2 0.1,n至少应取多少?
.
第六章 习题课
总体 样本 统计量 抽样分布 正态总体样本均值与样本方差的分布
1.设X1 , X2 , , X5是来自正态总体X~N(0,22)的 一个样本, Y C1 (X1 2X2 )2 C2 (X3 2X4 X5 )2 , 当C1 ______,C2 _____时, Y服从2分布, 自由度为________ .
一.定义: 设X1, X2, …, Xn是来自总体X的一个样本, 又设g(X1, X2, …, Xn)是一个连续函数, 如果g中不含 有未知参数, 则称g(X1, X2, …, Xn)为统计量.
由定义可知, 统计量也是一个随机变量,如 果x1, x2, …, xn是一组样本值, 则g(x1, x2, …, xn)是统计量g(X1, X2, …, Xn)的一个观察值.
二. 常用的统计量:
1. 样本均值
1n X n i1 Xi ;
2. 样本方差
S2
1 n-1
n i1
(X i
2
X) ;
3. 样本标准方差 S
1 n-1
n i1
(Xi
X
2
);
4. 样本k阶原点矩
Ak
1 n
n i1
X
k i
,k
1, 2,;
5. 样本k阶中心矩
Bk
1 n
n
(X i
i1
X)k
2
分
布, 记作 2 ~ 2 (n).
2 (n)的概率密度为
1
f(y)
2n
2
(
n
n 1 - y
y2 e 2 , 2)
y 0, .
0,
y 0,
(1) 由 分布的概率密度知 2 (n)分布就是 n 2 , 2的 分布, 即 2 (n) ( n / 2, 2).
(2) 设X~N(0, 1), 则X2 ~ (1 / 2, 2). (P64 例3) .
解
X
~
N(,
4 n
)
E(X
)2
4 n
, 可得n
40
或者 X ~ N(0,1),( X )2 ~ 2 (1),
2
2
n
n
故E( X )2 2
1, E(X )2
4 n
n
即要使
4 n
0.1, 故n
40.
例 总体X ~ N(, 2 ), n 16, X1 , X2 , , X16是 总体X的一个样本,求下列概率 :
0.99
0.05
0.94
i1
(查2分布表02.95
(16)
7.96,
2 0.01
(16)
32)
上式 0.95 0.01 0.94
16
(
2)P{
2 2
1 16
(Xi X)2 22 }
i1
n
P{
16 2
1 2
(Xi X)2 32} 0.995 0.1 0.895
i1
(查表02(.9 15) 8.547,02.00(5 15) 32.801)
则 称r.v.F
U/n1 V / n2
服 从 自 由 度 为(n1 , n2 )的F
分 布, 记 作F ~ F(n1 , n2 ).
2. F分布的概率密度函数:
(y)
[(n1 n 2 )
(n1 2)(n2
2] (n 1
n ) y n1 2 (n1 2)-1 2
2)(1 n1y
n )(n1 n2 ) 2
故X
k 1
,
X
k 2
,
X
k n
独
立
且
与X
k同
分
布,
故
有E(X
k 1
)
E(X
k 2
)
E(
X
k n
)
k ,
由辛钦大数定理得1
n
n i1
X
k i
P
k ,k
1,
2,
进一步由依概率收敛的序列的性质知
g(A1 , A 2 , , Ak ) P g(1 , 2 , , k ) (g为连续函数).
6.经验分布函数: 设X1 , X2 , , Xn是总体F的一个样本, 用S(x),-<x<表示样本中不大于x的随机变量的个数,
E( X) , D(X) 2 n ,
进一步,若X ~
N(, 2 ),则X
1 n
n
Xi
i1
~ N(, 2
n ).
对于正态总体N ( , 2 )的样本均值X,样本方差S 2 ,
我们有以下定理 :
定理一. 设X1 ,X2 , X是样本均值,则 :
X ~ N (, 2 ).
n
, Xn是总体N (, 2 )的一个样本,
上式=0.9-0.005=0.895
第七章 参数估计
参数估计的一般提法: 设有一个统计总体,总体的分布函数
F (x; ), 现从该总体中抽样,得样
本X1, X 2 , X n ,要依据该样本对
参数作出估计(或估计参数的
某个已知函数)。这类统计问题
称为参数估计。
§1. 点估计
一. 问题的提法:
设 总 体X的 分 布 函 数F(x; )的 形 式 为 已 知, 是 待 估 参 数, X1 , X 2 ,, X n是X的 一 个 样 本, x1 , x2 , , xn是 相 应 的 一ห้องสมุดไป่ตู้个 样 本 值,点 估 计 问 题 就 是 要 构 造 一 个 适 当 的 统 计 量(X1 , X 2 , X n ),用 它 的 观 察 值ˆ (x1 , x2 , xn )来 估 计 未 知 参 数, 我 们 称(X1 , X 2 ,, X n )为的 估 计 量, 称 ˆ (x1 , x2 ,, xn )为的 估 计 值.
5. F - 分布的上分位点的性质:
F1- (n1 , n 2 )
1 F (n 2 , n1 )
.
(y)
0
F(n1,n2 )
y
(四) 正态总体样本的均值与样本方差的分布:
设总体X(不管服从什么样的分布, 只要均值
和方差存在)的均值为, 方差为 2 , X1 , X2 , , Xn 是X的一个样本, 则总有
若总体X的分布函数为F,X1 , X2 ,
X
为X的
n
一个样本, 则X1 , X2 ,
X
的联合分布函数为
n
:
n
F * ( x1 , x2 , xn ) F(xi ) i1
又
若X具