统计量与抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2) 设 2~2 (n )则 ,E ( 2 ) n ,D (2 ) 2 n .
证明 (1) 由2分布的定义易得证明.
(2) 因为 2 ~ 2(n ), 存在相互独立、同分布于
n
N(0,1)的随机变量X1,X2,…,Xn,使
2
X
2 i
i1

n
n
n
E(2)E( Xi2)
E
(
X
2 i
)
D(Xi) n
D(X)
n
n
E(S2)D(X)2
E(S2
)
1 n En1i1(Xi
X)2
En11i n1
Xi2nX2
n1 1i n1E(Xi2)nE (X2) n1 1i n1(22)nn22 2
6.2.1 统计量
由辛钦大数定理和依概率收敛的性质可以证明
定理6.2 设总体X的k阶原点矩E(X k) = k存在(k
即X~N(80,100)0
16

X800 778 500
P{X77 }5P
10
10
P X 18000 2.5 1 (2.5)0.0062
6.2.2 抽样分布
【例6.6】设总体X~N(,102),抽取容量为n的样本,
样本均值记为 .欲X 使 与 X 的偏差小于5的概率大于 0.95,样本容量n至少应该取多大?
y2),…,(xn,yn),则下列各量为统计量:
(1)
样本协方差
1n SXY n1i1(Xi X)Y (i Y)
(2) 样本相关系数 RXY
其 SX中Y 和SRX 2XY 常n1分1i n别1(X 用i 来X作)2,
SXY
S为SY X2S总Y n体11Xin和1(YYi 的Y)协2


Cov(X,Y)与相关系数XY的估计量.
定义6.6 设X为随机变量,若对给定的 (0, 1),存在x满足 P{X > x} = ,则称x为X的上 分
位数(点).
6.2.3 分位数
若X具有密度f(x),
P{X > x} = 说明分位数x 右边的一块阴影面积为,

f(t)dt x
容易看出,X的上分位数x是 关于 的减函数,即增大时x减少. 下面给出几种常用分布的上分位数的求法:
于是 ES2 2, D S2 24 . n1
6.2 统计量与抽样分布
6.2.3 分位数 设X为一随机变量,我们知道对于给定的实数x,
P{X > x}是事件{X > x}的概率.在统计中,我们常 常需要对给定事件{X > x}的概率,由此确定的x取是 一个临界点,称为分位数(点),有如下定义:
表6-1 常用的标准正态分布的分位数
0.001 0.005 0.01 0.025 0.05 0.10
z
3.090 2.576 2.326 1.960 1.645 1.282
6.2.2 抽样分布
图6-11 F分布的概率密度曲线
由F分布的定义
F
X Y
n1 n2
容易看出, 若F ~F(n1,n2),则1/F ~F(n2,n1).
6.2.2 抽样分布
4. 正态总体的抽样分布定理
在数理统计问题中,正态分布占据着十分重要 的位置,一方面因为在应用中,许多随机变量的 分布或者是正态分布,或者接近于正态分布;另 一方面,正态分布有许多优良性质,便于进行较 深入的理论研究.因此,我们着重讨论正态总体 下的抽样分布,给出有关最重要的统计量样本均 值和样本方差S2的抽样分布定理.
6.2.2 抽样分布
(1)
X~N(,
2
);
n
(2)
(n1)S2
2
~( 2 n1) ;
(3) X与S2相互独立;(4) X~t(n1)
S/ n
证明(4):由(1)知
X~
N(, 2 ),从而
n
X ~ N(0,1) / n
由(2)(3)知
(n1)S2
2
~( 2 n1) ,
X与S 2相 互 独 立,
根据t分布的定义
6.2 统计量与抽样分布
6.2.2 抽样分布
统计量的分布称为抽样分布.为了研究抽样分 布,先研究数理统计中三种重要的分布.
6.2.2 抽样分布
1. 2分布
定义6.3 设X1,X2,…,Xn为相互独立的随机 变量,它们都服从标准正态N(0,1)分布,则称随
机变量
n
2
X
2 i
i1
服从自由度为n的2分布,记为2 ~ 2(n).
X
/ n
X ~t(n1)
(n1)S2
2
(n1)
S/ n
6.2.2 抽样分布
【例6.5】某厂生产的灯泡寿命近似服从正态分布 N(800,402),抽取16个灯泡的样本,求平均寿命 小于775小时的概率.
解:设灯泡寿命总体为X,
因为X~N(800,402),n=16,
所以样本均值
X
~
402 N(800, ),
6.2.1 统计量
(4) 样本k阶原点矩(简称样本k阶矩)
Ak
1 n
n i1
Xik
,(k
=
1,2,…)
(5) 样本k阶中心矩
显然
Bk
1n ni1(Xi
X)k
,(k = 2,3,…)
A1 X,
B2
1n ni1(Xi
X)2
Ak和Bk的观测值分别记为
ak
1 n
n i 1
xik ,
bk
1n ni1
3. F分布
定义6.5 设X~2(n1),Y~2(n2),且X与Y独立,
称 记随为机F~变F量(n1F,nY2X).nn21服从自由度为(n1,n2)的F分布, 可以证明的概率密度函数为
n1
fF
(x)
n1 2
0,
n1 n2 2
n2 2
n1 n2
2
1
n1 n2
n1 1
x2
n1n2
2 x
,
x0 x0
统计量是处理、分析数据的主要工具.对统计 量的一个最基本的要求就是可以将样本观测值代 入进行计算,因而不能含有任何未知的参数.
6.2.1 统计量
【例6.4】设X1,X2,…,Xn是来自总体X的样本,
X~N(, 2),其中 、 2为未知参数,则
X1,
1 2
X1
1 3
X2
,
均为统计量,
min{ X1,X2,…,Xn }
= 1,2,…,m),X1,X2,…,Xn为总体X的样 本,g(t1,t2,…,tm)是m元连续函数,则
A k n 1 i n 1X ik P E (X k )k (n ,k 1 ,2 ,.m .).,
g ( A 1 ,A 2 ,.A n .) . P ,g (1 ,2 ,.n .).( n , )
但诸如
1
n
n i1
(Xi
)2,
X1
等均不是统计量,因它含有未知参数 或.
常用的统计量有如下几种:
6.2.1 统计量
1. 有关一维总体的统计量
设X1,X2,…,Xn为总体X的样本,x1,x2,...,
xn为样本观测值,
(1) 样本均值
1n X n i1 Xi
常用来作为总体期望(均值)的估计量,其观测
2
6.2.2 抽样分布
【例6.7】设X1,X2,…,Xn为总体X ~ N (, 2)
的样本,求样本方差 的均值和方差.
S2n11in1(Xi X)2
解:本题可以通过2分布的均值和方差简单求
出.由定理6.3,
(n1)S2
2
~( 2 n1)
所以有
(n1)S2
(n1)S2
E
2
n1, Dຫໍສະໝຸດ 22(n1) 可以看出,随着n的增大,的图形趋于“平缓”, 其图形下区域的重心亦逐渐往右下移动.
6.2.2 抽样分布
2分布具有下面性质:
(1) (可加性) 设 12, 是22 两个相互独立的随机变量,

1 2 ~ 2 ( n 1 )2 2 ,~ 2 ( n 2 ) 则 ,1 2 2 2 ~ 2 ( n 1 n 2 )
(xi
x)k
设(X1,X2,…,Xn)是来自总体X的一个样本,则
样 本 : 均 值 X1n X ni i1
样本 : 方 S 2 差 1 n(X X )2
n 1 i i 1

本:
标 S准 1
n
差 (XX )2
n1 i i 1
样 k 阶 本原 :A 点 1n X k 矩 k 1 ,2 ,...
x
图6-10 t分布的概率密度曲线
6.2.2 抽样分布
ft (x)
n1 2
n n
1
x2 n
n1 2
,
2
x
图6-10 t分布的概率密度曲线
显然t分布的概率密度是x的偶函数,图6-10描绘 了n = 1,3,7时t(n)的概率密度曲线.作为比较, 还描绘了N(0,1)的概率密度曲线.
6.2.2 抽样分布
可看出,随着n的增大,t(n)的概率密度曲线与
N(0,1)的概率密度曲线越来
越接近.
可以证明t分布具有下面性质:
ft(x)
1
x2
e2
2
,n
即当n趋向无穷时,t(n)近似于标准正态分布N(0,1). 一般地,若n > 30,就可认为t(n)基本与N(0,1)相
差无几了.
6.2.2 抽样分布
统计的一般步骤
总体 选择个体 样本 观测样本 样本观察值 (数据) 数据处理 样本有关结论
统计量
推断总体性质
这种不含任何未知参数的样本的函数称为统 计量. 它是完全由样本决定的量.
6.2 统计量与抽样分布
6.2 统计量与抽样分布.
6.2.1 统计量
定义6.2 设X1,X2,…,Xn为来自总体X的样本, 称不含未知参数的样本的函数g(X1,X2,…,Xn) 为统计量.若x1,x2,...,xn为样本观测值,则称 g(x1,x2,...,xn)为统计量g(X1,X2,…,Xn)的观 测值.
特别有 X PE(X),
B 2 n 1i n 1(X i X )2 n 1 (i n 1X i2 n X 2 ) A 2 A 1 2
P 21 2D (X).
6.2.1 统计量
2. 有关二维总体的统计量
设(X1,Y1),(X2,Y2),…,(Xn,Yn)为二维总
体 (X , Y) 的 样 本 , 其 观 测 值 为 (x1 , y1) , (x2 ,
6.2.2 抽样分布
定理6.3 设X1,X2,…,Xn为来自总体N(, 2)
的样本,X ,S 2分别为样本均值和样本方差,则有
(1) X ~ N(, 2 );
n
(2)
(n1)S2
2
~( 2 n1) ;
(3) X 与S 2相互独立;
(4) X ~ t(n1)
S/ n
证明:由正态分布的性质容易得到(1),略去(2)和(3) 的证明,下面仅证明4.
此处自由度指2中包含独立变量的个数.
可以证明,2(n)的概率密度为 1
() x1exd,x0 0
f2(x)2n2(n2)
n1 x
x2 e 2
,
其中()称为伽马函数,
0,
x0 x0
6.2.2 抽样分布
2分布概率密度
f2(x)
1
2n2(n2)
n1 x
x2 e 2,
0,
x0 x0
图6-9 2(n)分布的概率密度曲线
解:依题令 P{X5}0.95,即P {5X5}0.95
因为总体 X~N(,102),从而 X ~ N(0,1)
10 n
所以 5 X 5
P
0.95
10n 10n 10n
即 2n 2n0.95,2
2n10.95,
n 2
0.975
查表知 1.960.97,5由于 (x) 单调不减,应有
n 1.96, n15.48. 故n至少应该取为16.
i1
i1
i1
6.2.2 抽样分布
由于Xi独立,且注意到N(0,1)的四阶矩为3,可得
n
D(2) D(Xi2)
i1 n
{E(Xi4)[E(Xi2)]2}
i1
n
(31) 2n
i1
英国统计学家费歇(R.A.Fisher)曾证明,当n较 大时, 2 2(n) 近似服从 N( 2n1,1).
6.2.2 抽样分布
值为
x
1 n
n i1
xi
6.2.1 统计量
(2) 样本方差
S2n11i n1(Xi X)2
n11in1
Xi2 nX2
(3) 样本标准差
S S2
样本方差和样本标准差刻画了样本数据的分散 程度,常用来作为总体方差和标准差的估计量. 观测值分别为
s2
1n n1i1(xi
x)2,
s s2
n11i n1(xi x)2
6.2.3 分位数
1. 设Z N(0,1),记N(0,1)的上分位数为z, 即有P{Z > z} = .
由于(z) = P{Z z} = 1 – P{Z z}=1 – ,
由标准正态分布函数表(附表2)反过来查,即可 以得到z的值.
为使用方便,表6-1列出了标准正态分布的几个 常用分位数z的值.
2. t分布
定义6.4 设X ~ N(0,1),Y ~ 2(n),X与Y独立,
则称随机变量 T X
Yn
服从自由度为的t分布,
又称为学生氏分布(Student distribution),
记为T ~ t(n). 可以证明t(n)的概率密度为
ft (x)
n1 2
n n
1
x2 n
n1
2 ,
2
n k
i
i 1
样 k 阶 本 中 :B 1心 n(X X 矩 )k k 1 ,2 ,...
n k
i
i 1
6.2.1 统计量
定理6.1 设总体X的期望E(X) = ,方差D(X) = 2,
X1,X2,…,Xn为总体X的样本,X ,S2分别为样 本均值和样本方差,则
D(X) 2
E(X)E(X)
相关文档
最新文档