概率论与数理统计A第6章
概率论与数理统计(06)第6章 统计量及其抽样分布
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率论与数理统计第六章测试题
第6章 参数估计选择题1.设n X X X ,...,,21是来自正态总体X 的简单随机样本,X 的分布函数F(x;θ)中含未知参数,则(A )用矩估计法和最大似然估计法求出的θ的估计量相同 (B) 用矩估计法和最大似然估计法求出的θ的估计量不同 (C )用矩估计法和最大似然估计法求出的θ的估计量不一定相同 (D) 用最大似然估计法求出的θ的估计量是唯一的2.设n X X X ,...,,21是来自正态总体X 的简单随机样本,EX=μ,DX=σ2,其中μ,σ2均为未知参数,X =1ˆμ,12ˆX =μ,下面结论哪个是错误的。
(A )X =1ˆμ是μ的无偏估计 (B) 12ˆX =μ是μ的无偏估计 (C )X =1ˆμ比12ˆX =μ 有效 (D) ∑=-ni i X n 12)(1μ是σ2的最大似然估计量 3.设n X X X ,...,,21是来自正态分布总体N(μ,σ2)的简单随机样本,其中数学期望μ已知,则总体方差σ2的最大似然估计量是(A ) ∑=--n i i X X n 12)(11 (B) ∑=-ni i X X n 12)(1 (C ) ∑=--n i i X n 12)(11μ (D) ∑=-n i i X n 12)(1μ 4.已知总体X 在区间[0,θ]上均匀分布,其中θ是未知参数,设n X X X ,...,,21是来自X 的简单随机样本,X 是样本均值,},...,max {1)(n n X X X = 是最大观测值,则下列选项错误的是 (A ))(n X 是θ的最大似然估计量 (B) )(n X 是θ的无偏估计量 (C )X 2是θ的矩估计量 (D) X 2是θ的无偏估计量5. 设总体X~N(μ1,σ2),总体Y~N(μ2,σ2),m X X X ,...,,21和n Y Y Y ,...,,21分别是来自总体X和Y 的简单随机样本,样本方差分别为2X S 与2Y S ,则σ2的无偏估计量是(A )22YX S S + (B) 22)1()1(Y X S n S m -+-(C )222-++n m S S Y X (D) 2)1()1(22-+-+-n m S n S m Y X6. 设X 是从总体X 中取出的简单随机样本n X X X ,...,,21的样本均值,则X 是μ的矩估计,如果(A )X~N(μ,σ2) (B) X 服从参数为μ的指数分布 (C )P (X=m )=μ(1-μ)m-1,m=1,2,… (D) X 服从[0,μ]上的均匀分布 填空题1.假设总体X 服从参数为λ的泊松分布,n X X X ,...,,21是取自总体X 的简单随机样本,其均值、方差分别为X ,S 2,如果2)32(ˆS a X a -+=λ为λ的无偏估计,则a= 。
西北工业大学《概率论与数理统计》课件-第六章 参数估计
(2) 似然函数
定义6.1 设总体X的分布密度(或分布律)为 p(x; ), 其中 (1, 2, ,m )为未知参数. 又设
( x1, x2,, xn ) 为自总体X的样本(X1,X2,…,Xn) 的一 个观察值,则称样本的联合分布
n
L( ) p(x1, x2, … , xn; ) p( xi; )
2º似然估计方程组与最大似然估计之间没有必 然
从中解得 pˆ k n
参数 p的估计值
这时, 对一切 0< p <1, 均有
P{Y k; pˆ } P{Y k; p}
综上所述: 设某试验的可能结果为: A1, A2 , ···, Ai , ···
若在一次试验中,某结果 Ai 出现,则应选择参 数使Ai 出现的概率最大.
以上这种选择一个参数使得实验结果具有
(k 1,2,, m)
(4) 求最大似然估计(MLE)的步骤:
1 写出似然函数
(1, 2 , ,m )
n
L( ) L( x1, x2,, xn; ) p( xi; )
n
i 1
2 取对数 ln L( ) ln p( xi; )
i 1
3 解似然方程(组)
ln L
ln L
2
为来自总体X的简单随机样本. 矩估计法的具体步骤:
1 求出k E( X k ) (1,2,,m ), k 1,2,,m;
2 要求k Ak , k 1,2,, m
这是一个包含 m个未知参数1,2 ,,m的方程组.
3 解出其中1,2,,m , 用ˆ1,ˆ2,,ˆm表示.
4 用方程组的解ˆ1, ˆ2 , ,ˆm 分别作为 1,2 ,,m的估计量,这个估计量称为
概率论与数理统计第6章参数区间估计2,3节
n
E(X
k
)
E(X
k)
i1
i1
二、有效性
未知参数 的无偏估计量不是唯一的.
设 ^1 和 ^2 都是参数 的无偏估计量,
θˆ 1
θˆ 2
集中
分散
蓝色是采用估^ 计量 1 , 用 14 个样本值得到的 14 个估计值. 紫色是采用估^ 计量 2 , 用 14 个样本值得到的 14 个估计值.
若limD(ˆ)0, 则ˆ是的一致估 . 计量 n
回顾例子.设总体X的概率密度为
f(x)6x3 (x),0x;
0, 其他
X1, X2,…, Xn 是取自总体X 的简单随机样本, (1) 求的矩估计量 ˆ;
(2) 求ˆ的方差D(ˆ).
解:矩估计 ˆ量 2X. D(ˆ)4D(X)4D(X)2
若滚珠直径服从正态分布X ~ N( , 2), 并且已知 = 0.16(mm),求滚珠直径均值的置信水平为95%
的置信区间.
解:由上面求解的置信水平为1- 的置信区间
Xσn 0 uα/,2 Xσn 0 uα/2
已 n 知 1,0 0 0 .1,6 0 .0,5 x110i110xi 14.92,
若进行n次独立重复抽样,得到n个样本观测值,
每个样本观测 个值 随确 机(定 ˆ1区 ,ˆ2一 )间 .那么
每个区间的 可真 能 , 或 值 包不 含包 的含 真 , 值
根据伯努利大数定理, 在这n个随机区间中,
包含 真值1 的 0(1 0 约 )% 占 ,不包含 10 的 % 0. 约
便得 k的 到 最大似 ˆk(X 1,然 X 2, ,估 X n).计
第二节 判别估计量好坏的标准
概率论与数理统计教程第二版茆诗松课件PPT第六章
ˆ 与样本值 x1 , x2 ,, xn 有关, 记为 这样得到的 ˆ ( x1 , x2 ,, xn ), 参数 的最大似然估计值 ,
ˆ ( X 1 , X 2 , , X n ) 参数 的最大似然估计量 .
12 April 2016
L( ) 1
n
I
i 1
n
{0 xi }
1
n
I{ x
( n ) }
要使L( )达到最大,首先一点是示性函数取值 n n 应该为1,其次是1/ 尽可能大。由于1/ 是 的单调减函数,所以 的取值应尽可能小,但 示性函数为1决定了 不能小于x(n),由此给出 的极大似然估计 ˆ x( n ) 。
经计算有
x 28.695,
2 sn 0.9185,源自m0.5 28.6由此给出总体均值、方差和中位数的估计分别 为: 28.695, 0.9185 和 28.6。 矩法估计的实质是用经验分布函数去替换总体 分布,其理论基础是格里纹科定理。
12 April 2016
第六章 参数估计
第6页
二、概率函数P(x,θ)已知时未知参数的矩法估计 设总体具有已知的概率函数 P(x, 1, …, k), x1, x2 , …, xn 是样本,假定总体的k阶原点矩k 存在,若1, …, k 能够表示成 1, …, k 的函数 j = j(1, …,k),则可给出诸j 的矩法估计为
数作出估计。
参数估计的形式有两种:点估计与区间估计。
12 April 2016
第六章 参数估计
第3页
设 x1, x2,…, xn 是来自总体 X 的一个样本,
ˆ ˆ( x ,, x ) 我们用一个统计量 的 1 n ˆ 取值作为 的估计值, 称为 的点估计 ˆ (量),简称估计。在这里如何构造统计量 并没有明确的规定,只要它满足一定的合理 性即可。这就涉及到两个问题:
概率论与数理统计(叶慈南 刘锡平 科学出版社)第6章 数理统计的基本概念教程
3.样本k阶(原点)矩 Ak = 样本k阶中心矩
Bk =
1 n k ∑ X i 反映总体k阶矩E(Xk)的信息 n i =1 P E ( X k ) = k , k = 1, 2, L →
反映总体k
9
1 n P → ∑ ( X i X )k E {[ X E ( X )]k } = mk n i =1 k=1,2,…
1o
X ~ N ( ,
σ2 ) n
即
X ~ N (0,1) σ/ n
2o 3o
(n 1) S 2 ~ χ 2 ( n 1) σ2 X 与 S 2 相互独立 4o X ~ t ( n 1) S/ n
23
24
4
1o
X ~ N ( , X=
σ2 ) n
即
X ~ N ( 0, 1) σ/ n
4o
正态总体的抽样分布定理
例 设 X1,…,X10 是取自N(0,0.32)的样本,求
P{∑ X i > 1.44}
2 i =1 10
定理一,二,三
2 2 设 X 1 ,..., X n 是来总体 N ( , σ ) 的样本, X , S 分别为样
本均值和样本方差,则
例 设 X 1 , X 2 , L , X 15 是来自总体 N (0,1)的一个简单随 2 2 X 12 + X 2 + L + X 10 机样本, Y= 则 服从 分布. 2 2 2 2( X 11 + X 12 + L + X 15 )
4
个体:组成总体的元素(如:某一个灯泡的寿命)
每个可能的观察值
有限总体 无限总体 如:考察某大学大一2000名男生的身高 如:考察某大学大一2000名男生的身高 如:测量一湖泊任一地点的深度
概率论与数理统计第六章课后习题及参考答案
概率论与数理统计第六章课后习题及参考答案1.已知总体X ~),(2σμN ,其中2σ已知,而μ未知,设1X ,2X ,3X 是取自总体X 的样本.试问下面哪些是统计量?(1)321X X X ++;(2)μ31-X ;(3)222σ+X ;(4)21σμ++X ;(5)},,max{321X X X ;(6)σ221++X X ;(7)∑=3122i i X σ;(8)2μ-X .解:(1)(3)(4)(5)(6)(7)是,(2)(8)不是.2.求下列各组样本值的平均值和样本差.(1)18,20,19,22,20,21,19,19,20,21;(2)54,67,68,78,70,66,67,70.解:(1)9.19)21201919212022192018(101101101=+++++++++==∑=i i x x ;43.1)(9110122=-=∑=i i x x s .(2)5.67)7067667078686754(1018181=+++++++==∑=i i x x ;018.292)(718122=-=∑=i i x x s .3.(1)设总体X ~)1,0(N ,则2X ~)1(2χ.(2)设随机变量F ~),(21n n F ,则F1~),(12n n F .(3)设总体X ~),(2σμN ,则X ~),(2n N σμ,22)1(S n σ-~)1(2-n χ,nS X /μ-~)1(-n t .(4)设总体X ~)10(2χ,Y ~)15(2χ,且X 与Y 相互独立,则=+)(Y X E 25,=+)(Y X D 50.4.设随机变量X 与Y 都服从标准正态分布,则(C )A .Y X +服从正态分布B .22Y X +服从2χ分布C .2X 与2Y 均服从2χ分布D .22YX 服从F 分布5.在总体X ~)3.6,52(2N 中随机抽取一容量为36的样本,求样本平均值X 落在8.50到8.53之间的概率.解:因为X ~)3.6,52(2N ,即52=μ,223.6=σ,因为36=n ,22205.1363.6==n σ,所以X ~)05.1,52(2N .由此可得)8.538.50(≤≤X P 05.1528.50()05.1528.53(-Φ--Φ=8302.0)1429.1()7143.1(=-Φ-Φ=.6.设总体X ~)1,0(N ,1X ,2X ,…,10X 为总体的一个样本,求:(1))99.15(1012>∑=i i X P ;(2)写出1X ,2X ,…,10X 的联合概率密度函数;(3)写出X 的概率密度.解:(1)由题可知∑==1012i i X X ~)10(2χ,查2χ分布表有99.15)10(210.0=χ,可得10.0=α,即10.0)99.15(1012=>∑=i i X P .(2)1X ,2X ,…,10X 相互独立,则联合概率密度函数为}exp{321}21exp{21),,,(1012510121021∑∏==-=-=i i i i x x x x x f ππ .(3)X Y =~)1.0,0(N ,所以有2251.02)0(e 5e1.021)(y y y f -⋅--==ππ.7.设总体X ~)1,0(N ,1X ,2X ,…,5X 为总体的一个样本.确定常数c ,使25242321)(XX X X X c Y +++=~)3(t .解:因为i X ~)1,0(N ,5,,2,1 =i ,所以21X X +~)2,0(N ,)(2121X X +~)1,0(N ,252423X X X ++~)3(2χ,因为25242321252423212632XX X X X X X X X X +++=+++~)3(t ,所以有23=c .8.设1X ,2X ,3X ,4X 是来自正态总体)4,0(N 的样本.已知243221)43()2(X X b X X a Y -+-=为服从自由度为2的2χ分布,求a ,b 的值.解:由题可知i X ~)4,0(N ,4,3,2,1=i ,故有0)2(21=-X X E ,20)2(21=-X X D ,所以212X X -~)20,0(N .同理4343X X -~)100,0(N .而20)2(221X X -~)1(2χ,100)43(221X X -~)1(2χ,故有100)43(20)2(243221X X X X -+-~)2(2χ,比较可知201=a ,1001=b .9.设总体X ~)3.0,(2μN ,1X ,2X ,…,n X 为总体的一个样本,X 是样本均值,问样本容量n 至少应取多大,才能使95.0)1.0(≥<-μX P .解:易知X ~)3.0,(2nN μ,由题意有95.013(2/3.01.0/3.0()1.0(≥-Φ=<-=<-nnnX P X P μμ,即应有975.0)3(≥Φn,查正态分布表知975.0)96.1(=Φ,所以取96.13≥n,即5744.34≥n ,取35=n .10.设总体X ~)16,(μN ,1X ,2X ,…,10X 为总体的一个样本,2S 为样本方差,已知1.0)(2=>αS P ,求α的值.解:由抽样分布定理知22)1(σS n -~)1(2-n χ,因为10=n ,故有2249S ~)9(2χ,得1.0)169169()(22=>=>ααS P S P ,查2χ分布表得684.14)9(21.0=χ,即684.14169=α,解得105.26=α.11.设(1X ,2X ,…,1+n X )为来自总体X ~),(2σμN 的一个样本,记∑==n i i n X n X 11,∑=--=n i in X X n S 122(11,求证:nn n S X X n n T -⋅+=+11~)1(-n t .证:由题可知n X ~),(2nN σμ,n n X X -+1~)11(,0(2σn N +,标准化得σnX X nn 111+-+~)1,0(N .又因为∑=-=-ni inX XS n 1222)(1)1(σσ~)1(2-n χ,从而有nn nnn S XX n n n S n n X X -+=--+-++122111)1(11σσ~)1(-n t ,即nnn S X X n n T -⋅+=+11~)1(-n t .。
概率论与数理统计-第六章
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
概率论与数理统计答案第六章
第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解:8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P=2628.0)]25(1[2=Φ- (2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15} =.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10} =.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i iXP 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i iXP解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i i i i i i X P X P χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2 ).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλn X D === [六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
《概率论与数理统计》第六章
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .
概率论与数理统计第6章
以分组区间为底,以
Yj
Wj X j1 X j
Wj 5
为高
作频率直方图
23
从频率直方图可看到:靠近两个极端的数据出现比 较少,而中间附近的数据比较多,即中间大两头小的分 布趋势,——随机变量分布状况的最粗略的信息。
在频率直方图中, 每个矩形面积恰好等于样本值 落在该矩形对应的分组区间内的频率,即
S j
Wj X j1
Xj
X j1 X j
Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的
分布状况。
24
12
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
代表性——即子样( X1, X2 ,
,
X
)的每个分量
n
X
与
i
总体 X 具有相同的概率分布。
独立性——即 X1, X2, , Xn 是相互独立的随机变量。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X2 , , Xn 是来自总体 X、与总体 X具有相同分布的随机变量.
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、 t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
31
一、 2分布
定义 设总体 X ~ N 0,1 , X1, X2,..., Xn 是 X
概率论与数理统计第6章
不含未知参数的样本的函数称为统计量 不含未知参数的样本的函数称为统计量. 统计量 2. 几个常见统计量
1 n 样本均值 X = ∑Xi n i=1
反映总体 均值的信息 反映总 体方差 的信息
1 n 2 2 样本方差 S = ∑( Xi − X) n −1 i=1
样本2阶中心矩 样本 阶中心矩
反映总体2 反映总体 阶 中心矩的信息
(
)
−
n1 +n2 2
x≥0
例1 设X、Y相互独立均服从正态分布 、 相互独立均服从正态分布 N(0,3), X1,X2,…,X9和Y1,Y2,…,Y9分别为来 的样本。 自X、Y的样本。求 、 的样本
U=
X1 + X 2 + L + X 9 Y +Y +L+Y
2 1 2 2
的分布。 的分布。
2 9
小样本问题中使用) 精确抽样分布(小样本问题中使用) 抽样分布 大样本问题中使用) 渐近分布 (大样本问题中使用
{
三. 统计三大分布
1 . χ 分布
2
定义: 相互独立, 定义 设 X1 , X2 ,L, Xn相互独立 都服从正态 分布N(0,1), 则称随机变量: 则称随机变量: 分布 2 2 2 2 χ = X 1 + X 2 + …+X n 所服从的分布为自由度为 n 的 χ 分布. 分布
3. F分布 分布 与 X ~ χ (n1),Y ~ χ (n2 ), X与Y X / n1 相互独立, 相互独立,则称统计量 F = Y / n2 定义: 定义 设
2 2
服从自由度为n 分布, 服从自由度为 1及 n2 的F分布,n1称为第 分布 一自由度, 称为第二自由度, 一自由度,n2称为第二自由度,记作 F~F(n1,n2) .
概率论与数理统计习题及答案-第6章习题详解
习题六1.设总体X ~N (60,152),从总体X 中抽取一个容量为100的样本,求样本均值与总体均值之差的绝对值大于3的概率. 【解】μ=60,σ2=152,n =100~(0,1)/X Z N nσ-=即 60~(0,1)15/10X Z N -=(|60|3)(||30/15)1(||2)P X P Z P Z ->=>=-<2[1(2)]2(10.9772)0.0456.=-Φ=-=2.从正态总体N (4.2,52)中抽取容量为n 的样本,若要求其样本均值位于区间(2.2,6.2)内的概率不小于0.95,则样本容量n 至少取多大? 【解】~(0,1)5/X Z N n-=2.2 4.2 6.2 4.2(2.2 6.2)()55P X P n Z n --<<=<<2(0.4)10.95,n =Φ-=则Φ(0.4n )=0.975,故0.4n >1.96,即n >24.01,所以n 至少应取253.设某厂生产的灯泡的使用寿命X ~N (1000,σ2)(单位:小时),随机抽取一容量为9的样本,并测得样本均值及样本方差.但是由于工作上的失误,事后失去了此试验的结果,只记得样本方差为S 2=1002,试求P (X >1062). 【解】μ=1000,n =9,S 2=10021000~(8)100/3/X X t t S n-==10621000(1062)()( 1.86)0.05100/3P X P t P t ->=>=>=4.从一正态总体中抽取容量为10的样本,假定有2%的样本均值与总体均值之差的绝对值在4以上,求总体的标准差.【解】~(0,1)X Z N =,由P (|X -μ|>4)=0.02得P |Z |>4(σ/n )=0.02,故210.02⎡⎤-Φ=⎢⎥⎢⎥⎝⎭⎣⎦,即0.99.σ⎛Φ= ⎝⎭查表得2.33,σ=所以5.43.2.33σ== 5.设总体X ~N (μ,16),X 1,X 2,…,X 10是来自总体X 的一个容量为10的简单随机样本,S 2为其样本方差,且P (S 2>a )=0.1,求a 之值.【解】2222299~(9),()0.1.1616S a P S a P χχχ⎛⎫=>=>= ⎪⎝⎭ 查表得914.684,16a= 所以 14.6841626.105.9a ⨯==6.设总体X 服从标准正态分布,X 1,X 2,…,X n 是来自总体X 的一个简单随机样本,试问统计量Y =∑∑==-ni ii i XX n 62512)15(,n >5服从何种分布? 【解】2522222211~(5),~(5)i nii i i XX X n χχχ====-∑∑且12χ与22χ相互独立. 所以2122/5~(5,5)/5X Y F n X n =--7.求总体X ~N (20,3)的容量分别为10,15的两个独立随机样本平均值差的绝对值大于0.3的概率. 【解】令X 的容量为10的样本均值,Y 为容量为15的样本均值,则X ~N (20,310),Y ~N (20,315),且X 与Y 相互独立. 则33~0,(0,0.5),1015X Y N N ⎛⎫-+= ⎪⎝⎭那么~(0,1),X YZ N = 所以(||0.3)||2[1(0.424)]P X Y P Z Φ⎛->=>=- ⎝2(10.6628)0.6744.=-=8.设总体X ~N (0,σ2),X 1,…,X 10,…,X 15为总体的一个样本.则Y =()21521221121022212X X X X X X ++++++ 服从 分布,参数为 . 【解】~(0,1),iX N σi =1,2, (15)那么122210152222111~(10),~(5)i i i i X X χχχχσσ==⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭∑∑且12χ与22χ相互独立, 所以222110122211152/10~(10,5)2()/5X X X Y F X X X ++==++ 所以Y ~F 分布,参数为(10,5).9.设总体X ~N (μ1,σ2),总体Y ~N (μ2,σ2),X 1,X 2,…,1n X 和Y 1,Y 2,…,2n X 分别来自总体X 和Y 的简单随机样本,则⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21121221n n Y Y X X E n j j n i i = . 【解】令 1222212111211(),(),11n n i i i j S X X S Y Y n n ===-=---∑∑ 则122222112211()(1),()(1),n n i j i j XX n S y y n S ==-=--=-∑∑又2222221122112222(1)(1)~(1),~(1),n S n S n n χχχχσσ--=-=-那么1222112222121212()()1()22n n i j i j X X Y Y E E n n n n σχσχ==⎡⎤-+-⎢⎥⎢⎥=+⎢⎥+-+-⎢⎥⎣⎦∑∑2221212221212[()()]2[(1)(1)]2E E n n n n n n σχχσσ=++-=-+-=+-10.设总体X ~N (μ,σ2),X1,X 2,…,X 2n (n ≥2)是总体X 的一个样本,∑==ni i X n X 2121,令Y =∑=+-+ni i n iX X X12)2(,求EY .【解】令Z i =X i +X n +i , i =1,2,…,n .则Z i ~N (2μ,2σ2)(1≤i ≤n ),且Z 1,Z 2,…,Z n 相互独立.令 2211, ()/1,nni i i i Z Z S Z Z n n ====--∑∑则 21111,222nn i i i i X X Z Z n n =====∑∑ 故 2Z X = 那么22211(2)()(1),n ni n i i i i Y X X X Z Z n S +===+-=-=-∑∑所以22()(1)2(1).E Y n ES n σ=-=-11. 设总体X 的概率密度为f (x )=x-e 21 (-∞<x <+∞),X 1,X 2,…,X n 为总体X 的简单随机样本,其样本方差为S 2,求E (S 2).解: 由题意,得。
概率论与数理统计A第6章
3.若 2 ~ 2(n),则当n充分大时,
2 2 (n) 近似正态分布 N ( 2n 1,1)
4. 若2 ~ 2(n),2分布的数学期望与方差,
E( 2 ) =n, D( 2 ) =2n.
事实上,由Xi ~ N (0,1), 故E( Xi2 ) D( Xi ) 1
n
2
2
当总体为正态分布时,给出几个重要的抽样分布 定理.
定理 4 (样本均值的分布)
设 X1, X2, …, Xn 是来自正态总体 N (, 2 )
的样本, X是样本均值,则有
X ~ N (, 2 ) n
即 X ~ N(0,1) n
X ~ N (, 2 ) X ~ N (0,1) n n
再由函数的性质有
lim h(t)
n
1 et2 2. 2
近似
即当n足够大时,t ~ N (0,1).
3. t分布的分位点
对于给定的,0 1, 称满足条件
pt t (n)
的点t (n)为t(n)分布的上分位数。如图所示.
t (n)
t分布的上分位点的性质: t1 (n) t (n)
0, 若x 1
F3
(
x)
132,,
若1 x 若x
2 2
一般,设x1, x2 ,, xn是总体的一个容量为n的样本
值.将它们按大小次序排列如下:x(1) x(2) x(n)
则经验分布函数Fn( x)的观察值为
0, Fn( x) 1kn,,
2分布是由正态分布派生出来的一种分布.
定义: 设 X1, X2,, Xn 相互独立, 都服从正态分布
概率论与数理统计 第6章
6.1 基本概念 6.2 抽样分布 习题 6
数理统计是具有广泛应用的一个数学分支,它以概率论 为基础,根据试验或观察得到的数据来研究随机现象,对研 究对象的客观规律性作出种种合理的估计和判断。数理统计 的内容包括:如何收集、整理数据资料;如何对所得的数据
资料进行分析、研究,从而对所研究的对象的性质、特点作
设总体 X 的分布律为 P ( X = x ) = p ( x ), X 1 , X
2
,…, X n为来自总体 X 的一个样本,则 X 1 , X 2 ,…, , X 2 ,…, X n)的联合分布律为
X n的分布律都是 P ( X i = x ) = p ( x ),从而 n 维随机变量(X
1
设总体 X 的概率密度为 f ( x ), X 1 , X 2 ,…, X n为 来自总体 X 的一个样本,则 X 1 , X 2 ,…, X n的概率密度 都是 f ( x ),从而 n 维随机变量(X 1 , X 2 ,…, X n)的联合 概率密度为
( n ) ,则称函数
为总体 X 的经验分布函数。
需要指出的是,若在 F n (x )的定义中将样本值换成对 应的样本,则当 n 固定时,它是一个随机变量,此时仍称之 为总体 X 的经验分布函数。所以用样本值定义的 F n (x )其 实是经验分布函数的观察值,在不致混淆的情况下统称为总 体 X 的经验分布函数。
出推断。数理统计的重要分支有统计推断、试验设计、多元 分析等,其具体方法甚多,应用相当广泛,已成为各学科从
事科学研究及生产、经济等部门进行有效工作的必不可少的
数学工具。
本章从数理统计的基本概念开始,讨论抽样分布及其重 要定理,这些抽样分布及其重要定理在概率论中尚未提到,
概率论与数理统计(茆诗松)第二版课后第六章习题参考答案
⎝ 2 2⎠
2
则X
=Y
+θ
−
1 2
,
X (1)
= Y(1)
+θ
−
1 2
, X(n)
= Y(n)
+θ
−
1 2
,即
1 2
(
X
(1)
+
X(n)) =
1 2 (Y(1)
+ Y(n) ) + θ
−1 2
,
可得 E( X ) = E(Y ) + θ − 1 = E(Y ) +θ − 1 = θ , Var(X ) = Var(Y ) = 1 Var(Y ) = 1 ,
解:因 E(Y ) = aE( X1) + bE( X 2 ) = aµ + bµ = (a + b)µ = µ , 故 Y 是µ 的无偏估计;
因 Var(Y ) = a2 Var( X1) + b2
Var( X 2 ) = a2
⋅σ2 n1
+ (1 − a)2 ⋅ σ 2 n2
=
⎜⎜⎝⎛
n1 + n2 n1n2
y( n) 0
⎤ ⎥⎦
=
1 0
y(nn+)1dy(n)
=
n
1 +
2
y n+2 (n)
1 0
=
1 n+
2
,
即 Var(Y(1) )
=
(n
2 + 1)(n
+
2)
−
⎜⎛ ⎝
1 ⎟⎞2 n +1⎠
=
(n
n + 1)2 (n
概率论与数理统计(茆诗松)第二版课后第六章习题参考答案
习题 6.1
1. 设 X1, X2, X3 是取自某总体容量为 3 的样本,试证下列统计量都是该总体均值µ 的无偏估计,在方差存 在时指出哪一个估计的有效性最差?
(1) µˆ1
=
1 2
X1
+
1 3
X
2
+
1 6
X3 ;
(2) µˆ2
=
1 3
X1
+
1 3
X
2
+
1 3
X
3
;
(3) µˆ3
=
n1 + n2
n1 + n2
n1 + n2
8. 设总体 X 的均值为µ ,方差为σ 2,X1, …, Xn 是来自该总体的一个样本,T (X1, …, Xn)为µ 的任一线性
无偏估计量.证明: X 与 T 的相关系数为 Var( X ) Var(T ) .
n
∑ 证:因 T (X1, …, Xn)为µ 的任一线性无偏估计量,设 T ( X1, L, X n ) = ai X i , i=1
2. 设 X1, X2, …, Xn 是来自 Exp(λ)的样本,已知 X 为 1/λ的无偏估计,试说明1/ X 是否为λ的无偏估计. 解:因 X1, X2, …, Xn 相互独立且都服从指数分布 Exp(λ),即都服从伽玛分布 Ga(1, λ),
n
∑ 由伽玛分布的可加性知 Y = X i 服从伽玛分布 Ga(n, λ),密度函数为 i=1
=
(n
2 + 1)(n
+
2)
,
E(Y(2n) )
=
1 y 2 ⋅ nyn−1dy = n ,
概率论与数理统计6.第六章:样本及抽样分布
),
,
,
,
是来
Z=
(
-
证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2)
n 1 x
x2 e 2
0
其中伽玛函数( x)通过积分
x0 x0
(x) ett x1dt, x 0 0
来定义.
注
已知
2
(1)就是
1 2
,2
分布.由定义X
2 i
~
2 (1),
即X
2 i
~
1 2
,2
.再由可加性知
2
n
X
2 i
i 1
~
n 2
,2 .
2分布的性质
1. 设 X1, X2, , Xn相互独立, 都服从正态分布
t (n)
t分布的上分位点的性质: t1 (n) t (n)
t分布的左侧分位点t (n)可查表 求得,例t0.975 (15) 6.262.
当n 45时,对于常用的的值,可用正态近似
t (n) u
3、F分布
定义: 设 U ~ 2(n1 ),V ~ 2(n2 ),U 与V 相互
独立,则称随机变量
定理3
E(X) , D( X ) 2 n,
E(S2) 2
事实上
E(S 2 )
E
1
n
1
n i 1
Xi2
nX
2
n
1
1
n
i 1
E
(
X
i
2
)
nE( X
2 )
n
1
1
n
i 1
2
2
n 2
n
2
2
当总体为正态分布时,给出几个重要的抽样分布 定理.
定理 4 (样本均值的分布)
设 X1, X2, …, Xn 是来自正态总体 N (, 2 )
则经验分布函数Fn( x)的观察值为
0, Fn( x) 1kn,,
若x x(1) 若x(k) x x(k1) , (k 1,2, , n 1)
若x x(n)
顺序统计量
极差: 最直接也是最简单的方法,即最大值-最小 值(也就是极差)来评价一组数据的离散度。
6.2 几个重要分布
2分布 t 分布 F 分布
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有 lim h(t ) 1 et2 2 .
n
2
近似
即当n足够大时,t ~ N (0,1).
3. t分布的分位点
对于给定的,0 1, 称满足条件
pt t (n)
的点t (n)为t(n)分布的上分位数。如图所示.
定义 经验分布函数为
Fn (
x)
1 n
s(
x)
x
例 设总体F具有一个样本值1,1,2,则经验分布函数
F3( x)的观察值为
0, 若x 1
F3
(
x)
132,,
若1 x 若x
2 2
一般,设x1, x2 , , xn是总体的一个容量为n的样本
值.将它们按大小次序排列如下:x(1) x(2) x(n)
解 (1) 由 0,有Xi 0.5 ~ N (0,1),则
Y
2
1 0.52
10
X
2 i
i 1
~
2 (10)
pi101 Xi2
4
p
1 0.52
10
i 1
X
i
2
4 0.52
p Y2
16
查表求02.10 (10) 16.由此可得
(2) 由题设及定理2,
p
10
Xi2 4 0.10.
X和S2分别为样本均值和样本方差, 则有
(1)
(n 1)S2
2
~
2(n 1)
(2) X与S 2独立.
n取不同值时 (n 1)S 2
2
的分布
推论1 (样本均值的分布)
设X1,X2,…,Xn是取自正态总体 N (, 2 )
的样本, X和S2 分别为样本均值和样本方差,
则有
X ~ t(n 1)
Sn
1、 2 分布
2分布是由正态分布派生出来的一种分布.
定义: 设 X1, X2, , Xn 相互独立, 都服从正态分布
N(0,1), 则称随机变量:
2
X12
X
2 2
Xn2
所服从的分布为自由度为 n 的 2分布.
记为 2 ~ 2(n)
2分布的密度函数为
f
( x; n)
2n
1 2 (n
N(, 2), 则
2
1
2
n
(Xi
i1
)2
~ 2(n)
2.设 X1 ~ 2(n1), X2 ~ 2(n2 ),且X1,X2相互独立,
则X1 X 2 ~ 2 (n1 n2 ).
这个性质叫 2分布的可加性.
3.若 2 ~ 2(n),则当n充分大时,
2 2 (n) 近似正态分布 N ( 2n 1,1)
)
n1 2
(
y
)
n1 2
1
1
n1 n2
y
n1 n2 2
y
y 0
0
F分布的性质
1.F分布的数学期望为:
E(F ) n2 n2 2
若n2>2
即它的数学期望并不依赖于第一自由度n1.
2.F分布的分位数
对于给定的p,0 p 1,称满足条件
P F Fp (n1, n2 ) p
的点Fp (n1, n2 )为F (n1, n2 )分布的左侧p分位点.如图所示.
X1,X2,…, X n是1 来自X的样本,Y1,Y2,…,Yn2是取自Y的样本, X和Y分别是这两个样本的样本均值,S12和S22 分别是
这两个样本的样本方差,则有
1、
S12 S22
12
2 2
~
F (n1
1, n2
1)
2、
X Y (1 2) (n1 1)S12 (n2 1)S22
1
第六章 抽样分布
6-1 总体、样本与经验分布函数 6-2 几个重要分布 6-3 抽样分布定理
6.1总体、样本与经验分布函数
总体、个体、简单随机样本 统计量 小样问题与大样问题
有限总体
总体 研究对象的全体(整体)X。 无限总体
个体 每一个研究对象。实际上是对总体的一次观察。
样本 由部分个体构成的集合。经常说,来自(或取自 ) 某总体的样本。
i1
Z
9S2 0.52
1 0.52
10
(Xi
i 1
X )2
~
2 (9)
pi101( X i
X )2
2.85
F分布的左侧p分位点的性质:
p
Fp (n1, n2)
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
6.3 抽样分布定理
设总体X的均值为,方差为2,X1, X2 , , Xn是 来自总体的一个样本,则样本均值X和样本方差S 2有
样本容量 样本中所含个体的数目n.
注 (1)样本具有二重性: 在抽样前,它是随机变量,用X1,X2,…,Xn表示; 在抽样后,它是n个样本值(随机变量的取 值)x1,x2,…,xn.
(2)样本选择方式: 有放回抽样.
特别,样本容量<<总体数量时, 无放回抽样可近似看作有放 回抽样.
简单随机样本 具有两个特点的样本: 代表性(组成样本的 每个个体与总体同分布), 独立性 (组成样本的个体间相互 独立)。
4. 若2 ~ 2(n),2分布的数学期望与方差,
E( 2 ) =n, D( 2 ) =2n.
事实上,由Xi ~ N (0,1), 故E( Xi2 ) D( Xi ) 1
D(
X
2 i
)
E
(
X
4 i
)
[
E
(
X
2 i
)]2
31
2
E(2 )
n
E(Xi2)
n, D(2 )
n
D( Xi2 )
2n.
i 1
定义 设X1, X 2 , , X n是来自总体X的一个样本, g( X1, X 2 , , X n )是X1, X 2 , , X n的函数,若g 中不含未知参数,则g( X1, X 2 , , X n )称是一 个统计量.
请注意 : 设X1, X2 , Xn是来自总体X的一个样本, x1, x2 ,
25
P
X 12 0.4
1.25
1
(1.25)
0.1063
(2)
PX
12.5
P
X
12
12.5 12
PT
1.059
S 25 S 25
查自由度为24的t分布表,t0.15 (24) 1.059,即
PT 1.059 0.15. 故有PX 12.5 0.15.
例2 从正态总体N (,0.52 )中抽取样本X1, , X10. (1)已知 0,求概率pi101 Xi2 4; (2)未知,求概率pi101( Xi X )2 2.85.
1
~ t(n1 n2 2)
n1 n2 2
n1 n2
四、例题
例1设总体X服从正态分布N (12,2 ),抽取容量为 25的样本,求样本均值X大于12.5的概率.如果(1)已
知 2;(2)未止,但已知样本方差S 2 5.57.
解
(1)
PX
12.5
P