概率论与数理统计(浙大版)第七章-参数估计(简)
浙江大学概率论与数理统计第七八章复习
若
在很多情形, L关于 可微,要使L 取得最大值,
ˆ( x1 , x2 , , xn ) 为 的极大似然估计值, 则称 ˆ( X , X , , X ) 为 的极大似然估计量 称
1 2 n
ˆ) max L( x1 , x2 ,, xn ; ) L( x1 , x2 ,, xn ;
i 1 n
极大似然估计法:就是固定样本观察值 x1 , x2 , , xn ,在
ˆ, 取值的可能范围 内挑选使似然函数达到最大的参数
ˆ( x1 , x2 , , xn ) 为 的极大似然估计 作为 的估计值,若 ˆ( X 1 , X 2 , , X n ) 值,则 为 的极大似然估计量
S t 2 ( n 1) X n
(3)方差
2
的置信区间 (只介绍 未知的情况)
( n 1) S 2
取
2
~ 2 ( n 1)
方差 2 的一个置信度为1- 的置信区间:
2 ( n 1) S 2 ( n 1 ) S , 2 ( n 1) 2 ( n 1) 1 2 2
点估计常用方法:
矩估计法
用样本(原点)矩作为总体(原点)矩的估计量的方法称为 矩估计法.
矩估计法的具体做法是:令
A (l 1,2,, k )
l l
, ,, 的联立方程组。 ˆ1 , ˆ2 , , ˆk ,由于 Al 解此方程组,得到一组解 ˆl (l 1,2, , k ) 也是随机变量,则将 是随机变量,故解 ˆ1 , ˆ2 , , ˆk 分别作为 , ,, 的矩估计量.
定义3
ˆ 有效. 2 ˆ 是未知参数 设
概率论与数理统计完整课件第七章参数估计PPT课件
n
L(1,2,,k ) L(x1, x2,, xk ;1,2,,k ) f (xi ;1,2,,k ) i 1
将其取对数,然后对1,2 ,,k 求偏导数,得
ln L(1, 2 ,, k ) 0 1
ln L(1, 2 ,, k ) 0 k
该 方 程 组 的 解 ˆi ˆi (x1, x2,, xn),i 1,2,,k ,即 为 i 的 极
§1 参数的点估计
设总体 X 的分布函数 F(x;) 形式已知,其中θ 是待估计的参数,点估计问题就是利用样本 (X1, X 2,, X n ) ,构造一个统计量ˆ ˆ(X1, X2,, Xn) 来估 计θ,我们称ˆ(X1, X2,, Xn )为θ的点估计量,它是 一个随机变量。将样本观测值 (x1, x2 ,, xn ) 代入估计 量 ˆ(X1, X2,, Xn ) , 就 得 到 它 的 一 个 具 体 数 值 ˆ(x1, x2,, xn ) ,这个数值称为θ的点估计值.
如果样本中白球数为0,则应估计p=1/4,而不估计 p=3/4.因为具有X=0的样本来自p=1/4的总体的 可能性比来自p=3/4的总体的可能性要大.一般当 X=0,1时,应估计p=1/4;而当X=2,3时,应估计 p=3/4.
第10页/共71页
定义:设总体 X 的分布类型已知,但含有未知参数θ. (1)设离散型总体 X 的概率分布律为 p(x; ) ,则样本 (X1, X2,, Xn ) 的联合分布律
~~ 2n1nLeabharlann ini1n1x(i xix
x
)
2
由微积分知识易验证以上所求为μ与σ2的极大似然 估计.
第21页/共71页
• 例:设总体X具有均匀分布,其概率密度函数为
p(x;)
概率论与数理统计--第七章 参数估计(7.5和7.7)_OK
2021/8/23
9
例3 (续例1)如果只假设糖包的重量服从正态分布
N(, 2), 试求糖包重量 的 95%的置信区间. 解 此时未知, n 12,
0.05, x 502.92, s 12.35,
附表3-2
查 t(n 1) 分布表可知: t0.025(11) 2.201,
2021/8/23
26
F / 2(n1 1, n2 1) F0.05(17, 12) 2.59,
F1
/ 2(17,
12)
F0.95(17,
12)
1 F0.05 (12,
17)
1, 2.38
于是得
2 1
2 2
的一个置信度为
0.90
的置信区间
0.34 0.29
1 2.59
,
0.34 0.29
514 505 493 496 506 502 509 496
设袋装糖果的重量服从正态分布, 试求总体均值
的置信度为0.95的置信区间.
解 0.05, n 1 15,
附表3-1
查 t(n 1) 分布表可知: t0.025(15) 2.1315,
计算得 x 503.75, s 6.2022,
解 10, n 12,
计算得 x 502.92,
(1) 当 0.10时, 1 0.95,
2 查表得 z / 2 z0.05 1.645,
附表2-1
2021/8/23
3
x
n
z
/
2
502.92
10 1.645 498.17, 12
x
n
z
/2
502.92
概率论与数理统计 第七章 参数估计
设X1,…Xn是取自 N (, 2 )的样本,
求参数 2 的置信度为 1的置信区间.
确定分位数 12 / 2 (n 1), 2 / 2 (n 1) 使
二、有效性
设 ˆ1 ˆ1(X1,, X n )和 ˆ2 ˆ2( X1,, Xn)
都是参数 的无偏估计量,若有
D(ˆ1) D(ˆ2 ) 则称 ˆ1 较 ˆ2 有效 .
如果对固定的n, D(ˆ1) min(D(ˆ)) 则称ˆ1是ˆ的有效估计。
例1:设X1,X2, X3是来自某总体X的样本,且 E(X)=μ,讨论μ的以下估计量的无偏性和一致性。
缺点是,当总体类型已知时,没有 充分利用分布提供的信息 .
极大似然估计
例: 设一箱中装有若干个白色和黑色的球, 已知两种球的数目之比为3:1或1:3,现有放回 地任取3个球,有两个白球,问:白球所占的 比例p是多少?
如果只知道0<p<1,并且实 测记录是X=k (0 ≤ k≤ n),又 应如何估计p呢?
(4) 结论
区间(ˆ1,ˆ2 )就是的一个 置信度为1的置信区间.
方差未知,求期望的区间估计
例2:随机地从一批服从正态分布N(μ, σ2)的零件 16个,分别测得其长度为: 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 估计该批零件的平均长度μ,并求μ的置信区间 (α=0.05)
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
概率论与数理统计课件最新版-第7章-参数估计
(1 n
n i 1
Xi )2
1 n
n i 1
(Xi
X )2
结论: 不论总体服从什么分布,总体均值 与方差的矩估计量的表达式是相同的
概率统计
(2). Q X ~ N ( , 2 )
X 1 (1502 1453 1367 1650) 1493
4
1
n
n i 1
(Xi
X )2
1 [(1502 1493)2 4
定义直接寻求能使 L( ) 达到最大值的解作为
极大似然估计量。 ▲ 极大似然估计法适用于多个未知参数的情形。
概率统计
例3. 设 X ~ N (, 2 ), , 2 为未知参数,
x1 , x2 L xn 是 X 的一个样本值.
求: , 2 的极大似然估计量.
解: Q X 的密度函数为:f ( x ; , 2 )
是相应于样本 X1, X 2 , X n 的一组样本值。
n
作似然函数:L f ( x k ,1,2 ,L l ) 或 k 1
概率统计
n
或 L P( x k ,1,2 ,L l ) k 1
使得似然函数 L 达到极大值的 ˆ1,ˆ2,L ˆl
称为参数 1,2 ,L l 的极大似然估计值,记为: ˆi ( x1, x2 ,L xn ) (它与样本值有关),记统计量:
(1453 1493)2
(1367 1493)2 (1650 1493)2 ]
10551
某种灯泡寿命的均值与方差的 矩估计值分布为:
ˆ 1493, ˆ 2 10551
概率统计
例 2. 设 X1, X2, … Xn 是取自总体 X 的一个样本,
其概率密度为:
浙大版数理统计第七章
例 某种木材横纹抗压力的实验值 服从正态分布,对10个试件作横纹 抗压力试验,得数据如下(单位: 公斤/ 平方厘米): 482,493,457,471,510, 446,435,418,394,469 试例对P7该4例木1材平均横纹抗压力
进行区间估计( 0.05).
解 2未知,用区间
( X t /2 (n 1)
其中 1,试分别用矩估计法
0 其他
f
(
x)
(
1)x
,0
(
x 1
0)
例 设总体X的概率密度为
得的矩估计量为ˆ
1 2X
X。 1
令E( X
)
A1,即
2 1
X
,
0 1
(1
)
x
dx
1
2 1
,
E( X ) xf (x; )dx
解
d 1 i1 ln xi ,令 d 0
d ln L n
2
2
2
2
n i1
n
1 E(X ) 1 n E(X )
n
n i1
n i1
(2)E( X ) E( 1 X i ) 1 E( X i )
n
n
解 (1)E( X i ) E( X ) .
设
1( X1, X2 ,..., Xn ),2 ( X1, X2 ,..., Xn )
均为参数的无偏估计,如 果对于任意 ,有
2
2
(2) X是的无偏估计( );
(1) X i是的无偏√估√ 计(对 );
判断:
对
X的样本,E( X ) , D(否X ) 2
例 设X 1, X 2 ,...,X n是来否自总体
概率论与数理统计第七章
13
二、最大似然估计法
是在总体类型已知条件下使用的一种参数估计方法 . 它首先是由德国数学家高斯在 1821年提出的 ,
然而,这个方法常归功于英国 统计学家费歇 . 费歇在1922年重新发现了这一 方法,并首先研究了这种方法 的一些性质 .
Gauss
Fisher
信息管理学院 徐晔
选择适当的 i , i 1,2,, m
使得样本 ( X 1, X 2 ,, X n ) 作为一个随机变量,得 到观察值 ( x1, x2 ,, xn ) 的可能性最大。
信息管理学院 徐晔
17
当总体 X 为离散型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维离散型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是联合概率事件
14
最大似然估计法的基本思想
先看一个简单例子:
某位同学与一位猎人一起外出打猎 .
一只野兔从前方窜过 .
只听一声枪响,野兔应声倒下 .
如果要你推测, 是谁打中的呢? 你会如何想呢?
信息管理学院 徐晔
15
你就会想,只发一枪便打中,猎人命中的概率 一般大于这位同学命中的概率. 看来这一枪是猎人 射中的 . 这个例子所作的推断已经体现了最大似然估计 法的基本思想 .
信息管理学院 徐晔
18
n
当总体 X 为连续型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维连续型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是值对于一个极小的 ,联合 概率事件
A ( x1 X 1 x1 , x2 X 2 x2 ,, xn X n xn )
浙江大学概率论与数理统计第七章
点估计
一、点估计问题的提法
二、估计量的求法 三、小结
一、点估计问题的提法
设总体 X 的分布函数形式已知, 但它的一个 或多个参数为未知, 借助于总体 X 的一个样本来 估计总体未知参数的值的问题称为点估计问题. 例1
在某炸药制造厂, 一天中发生着火现象的
次数 X 是一个随机变量 , 假设它服从以 0 为参 数的泊松分布, 参数 为未知, 设有以下的样本值 , 试估计参数 .
n
(二) 取对数
n i 1
ln L( ) ln p( xi ; ) 或 ln L( ) ln f ( xi ; );
i 1
n
d ln L( ) d ln L( ) 对数似 (三) 对 求导 , 并令 0,然方程 d d ˆ. 解方程即得未知参数 的最大似然估计值
a b 2 A1 , 即 2 b a 12( A2 A1 ) .
解方程组得到a, b的矩估计量分别为
3 n 2 ( X X ) , ˆ A1 3( A2 A1 ) X a i n i 1
2
n 3 2 2 ˆ X ( X X ) . b A1 3( A2 A1 ) i n i 1
i 1 n
L( ) L( x1 , x2 ,, xn ; ) f ( xi ; ),
n
L( )称为样本的似然函数 . ˆ ) max L( x1 , x2 , , xn ; ). 若 L( x1 , x2 , , xn ;
i 1
ˆ ( x1 , x2 ,, xn ) 参数 的最大似然估计值 , ˆ ( X 1 , X 2 ,, X n ) 参数 的最大似然估计量 .
概率论与数理统计浙大四版习题答案第七章
第七章 参数估计1.[一] 随机地取8只活塞环,测得它们的直径为(以mm 计)求总体均值μ及方差σ2的矩估计,并求样本方差S 2。
解:μ,σ2的矩估计是 6122106)(1ˆ,002.74ˆ-=⨯=-===∑ni i x X n X σμ621086.6-⨯=S 。
2.[二]设X 1,X 1,…,X n 为准总体的一个样本。
求下列各总体的密度函数或分布律中的未知参数的矩估计量。
(1)⎩⎨⎧>=+-其它,0,)()1(cx x c θx f θθ其中c >0为已知,θ>1,θ为未知参数。
(2)⎪⎩⎪⎨⎧≤≤=-.,010,)(1其它x x θx f θ其中θ>0,θ为未知参数。
(5)()p p m x p px X P x m xmx,10,,,2,1,0,)1()(<<=-==- 为未知参数。
解:(1)X θcθθc θc θc θdx x c θdx x xf X E θθcθθ=--=-===+-∞+-∞+∞-⎰⎰1,11)()(1令,得cX Xθ-=(2),1)()(10+===⎰⎰∞+∞-θθdx xθdx x xf X E θ2)1(,1X X θX θθ-==+得令(5)E (X ) = mp令mp = X , 解得mXp=ˆ 3.[三]求上题中各未知参数的极大似然估计值和估计量。
解:(1)似然函数1211)()()(+-===∏θn θn nni ix x x c θx f θL0ln ln )(ln ,ln )1(ln )ln()(ln 11=-+=-++=∑∑==ni ini i xc n n θθd θL d x θc θn θn θL∑=-=ni icn xnθ1ln ln ˆ (解唯一故为极大似然估计量)(2)∑∏=--=-+-===ni i θn n ni ix θθnθL x x x θx f θL 112121ln )1()ln(2)(ln ,)()()(∑∑====+⋅-=ni ini ix nθxθθn θd θL d 121)ln (ˆ,0ln 2112)(ln 。
概率论与数理统计(浙大版)第七章第八章课件
n
解得p的极大似然估计量为:
1 n ˆ Xi p n i 1
说明:p的极大似然估计值为:
1 n ˆ xi p n i 1
例2: 设(X1,X2,…Xn )是来自总体X的一个样本,
x 1 , 0 x 1 X ~ f ( x ; ) , 其中 0未知 , 其它 0,
n
设总体X 的分布函数为F x;1 , 2 , , k , 1 , 2 , , k 是待 v 1, 2, , k , 对于样本X X 1 , X 2 , , X n , v 1, 2, , k
, , , A k 1 1 1 2 2 1, 2 , , k A2 用样本矩作为总体矩的估计,即令: , , , A k k k 1 2 1 , 2 , , ˆ 解此方程即得 1 , 2 , , k 的一个矩估计量 k
例1 : 设总体X的分布律为:
X pk 0 1-p 1 p
0<p<1, p未知 , 求参数p 的极大似然估计量. 解:总体X的分布律为:
P{ X x} p (1 p)
x
1 x
, x 0,1.
设(X1,X2,…,Xn)是来自总体X的样本。
似然函数为:
L( p) P ( X i , p)
例1:设总体X 的均值 和方差 2都存在,且 2 0, , 2均未知,
X 1 , X 2 ,, X n 是取自X 的一个样本,试求 , 2的矩估计。
解:先求总体矩:
1 E X , 2 E X 2 D X E 2 X 2 2
浙大版概率论与数理统计答案---第七章
第七章 参数估计注意: 这是第一稿(存在一些错误)1、解 由θθθμθ2),()(01===⎰d x xf X E ,204103)(2221θθθ=-==X D v ,可得θ的矩估计量为X 2^=θ,这时θθ==)(2)(^X E E ,nnX D D 5204)2()(22^θθθ=⋅==。
3、解 由)1(2)1(2)1(2)(21θθθθμ-=-+-==X E ,得θ的矩估计量为:3262121^=-=-=X θ。
建立关于θ的似然函数:482232)1(4)1())1(2()()(θθθθθθθ-=--=L令0148))1ln(4ln 8()(ln =--=∂-+∂=∂∂θθθθθθθL ,得到θ的极大似然估计值:32^=θ 4、解:矩估计:()1012122μθλθλθλ=⋅+⋅+⋅--=--,()()()()2222222121νθλθθλλθλθλ=--++-++--, 11A =,234B =, 故()()()()222ˆˆ221,3ˆˆˆˆˆˆˆˆˆˆ222121.4θλθλθθλλθλθλ⎧--=⎪⎨--++-++--=⎪⎩解得1ˆ,43ˆ.8λθ⎧=⎪⎪⎨⎪=⎪⎩为所求矩估计。
极大似然估计:(){}()33214526837,0,2,11L P X X X X X X X X θλθλθλ==========--,()()(),ln ,3ln 2ln 3ln 1l L θλθλθλθλ==++--,()(),330,1,230.1l l θλθθθλθλλλθλ∂⎧=-=⎪⎪∂--⎨∂⎪=-=⎪∂--⎩解得3ˆ,81ˆ.4θλ⎧=⎪⎪⎨⎪=⎪⎩即为所求。
5、解 由33)1(3)1(3)(222+-=-+-+=p p p p p p X E ,所以得到p 的矩估计量为^394(3)34322X X p -----==建立关于p 的似然函数:3210)1()2)1(3()()2)1(()(22n n n n p p p p p p p L ---= 令0)(ln =∂∂pp L ,求得到θ的极大似然估计值:n n n n p 22210^++=6、解:(1)()1112EX x x dx θθθθ+=+=+⎰, 由ˆ1ˆ2X θθ+=+得21ˆ1X X θ-=-为θ的矩估计量。
概率论与数理统计浙大四版 第七章 第七章3讲2
其误6 差 .20 2 不 .2 12 3 2 大 1 6 .6 5(于 克 1). 16
这个误差的可信度为95%.
2.方差2 的置信区间
根据实 ,只 际 介 需 未 绍 要 知.的情况 方差 2的置信 1的 度置 为信区间
( n 2/2 (1 n) S1 2), 1 (2 n /21 (n )S 21).
解 0.n 0 1 5 1,,5
附表3-1
查t(n1)分布表:可t0知 .02(1 5 )52.131,5
计算 x 5.7 0 得 ,5 3 s 6 .20 , 22
得 的置信 95% 度 的为 置信区间
50.7356.2106222.131 5即(50 .4,050 .1)7. 就是说估计袋装糖果重量的均值在500.4克与 507.1克之间, 这个估计的可信程度为95%.
1. 两个总1 体 2的 均置 值信 差区
(1) 12和 22均为已知
12 的一个 1置 的信 置度 信为 区
XYz/2
n112n222.
推导过程如下:
因X ,为 Y分别 1,2的 是无 , 偏估计
所X 以 Y是 12的无,偏估计
由X, Y的独立性及
XYz/2
n112n222.
(2) 12和22均为未 , 知
只 n 1 和 n 2 都 要 ( 实 很 5 即 用 0 大 )则 , 可 上 有
12的一个1 置 的信 近度 似为 置信
XYz/2
Sn112Sn222.
(3 )12222,但 2为,未知
推导过程如下:
因为 S2是2的无偏, 估计
根据第六章第二节定理二知
浙江大学《概率论与数理统计》配套题库【课后习题】(参数估计)
第7章参数估计1.随机地取8只活塞环,测得它们的直径为(以mm计)试求总体均值及方差的矩估计值,并求样本方差.解:由已知得总体均值及总体方差的矩估计值分别为样本方差.2.设为总体的一个样本,为一相应的样本值,求下列各总体的概率密度或分布律中的未知参数的矩估计量和矩估计值:(1),其中c>0为已知,为未知参数;(2),其中为未知参数;(3)其中为未知参数.解:(1)由已知得令,即,则的矩估计量为,矩估计值为.(2)由已知得令,即,则的矩估计量和矩估计值分别为(3)因,令,即,则的矩估计量和矩估计值分别为3.求上题中各未知参数的最大似然估计值和估计量.解:(1)由题意知,似然函数为对似然函数两边同时取对数得令得的最大似然估计值为的最大似然估计量为(2)由题意知,似然函数为对似然函数两边同时取对数得令得的最大似然估计值为得的最大似然估计量为(3)由已知得似然函数为对似然函数两边同时取对数得令得p的最大似然估计值为,其中p的最大似然估计量为4.(1)设总体X具有分布律其中为未知参数,已知取得了样本值;试求的矩估计值和最大似然估计值.(2)设是来自参数为的泊松分布总体的一个样本,试求的最大似然估计量及矩估计量.(3)设随机变量X服从以r,p为参数的负二项分布,其分布律为其中r已知,p未知;设有样本值,试求p的最大似然估计值.解:(1)①由已知得令,即,解得,故得的矩估计值为.今,故的矩估计值为.②由给定的样本值,得似然函数为对似然函数两边同时取对数得令,得的最大似然估计值为.(2)①设是相应于样本的样本值,则似然函数为对似然函数两边取对数得令,得的最大似然估计值为,最大似然估计量为.②因,故的矩估计量也是(3)由题意知似然函数为对似然函数两边同时取对数得,C为常数令,得p的最大似然估计值为.5.设某种电子器件的寿命(以h计)T服从双参数的指数分布,其概率密度为其中c为未知参数,自一批这种器件中随机地取n件进行寿命试验.设它们的失效时间依次为.(1)求与C的最大似然估计值.(2)求与C的矩估计量.解:(1)由题意知似然函数为由题设,故相当于,因而上式相当于。
概率论与数理统计第七章参数估计演示文档
概率论与数理统计第七章参数估计演示文档参数估计是概率论与数理统计中的重要内容之一,是通过样本数据来推断总体参数的方法。
在实际应用中,参数估计广泛应用于市场调查、医学研究、经济预测等领域。
本文将以一些常用的参数估计方法为例,进行演示说明。
首先,我们介绍最常见的点估计方法,矩估计。
矩估计是通过样本矩来估计总体矩。
以正态分布的均值和方差为例,假设我们有一个样本数据集,通过计算样本均值和样本方差,可以分别得到正态分布的均值和方差的矩估计值。
接下来我们介绍第二种常见的点估计方法,最大似然估计。
最大似然估计是通过找到使得观察到的样本数据出现的概率最大的参数值。
以二项分布的成功概率为例,假设我们有一组二项分布的观察数据,通过计算二项分布的似然函数,并求导得到其极大值点,可以得到二项分布的成功概率的最大似然估计值。
此外,假设检验是参数估计的重要应用。
在进行参数估计时,我们常常需要进行假设检验来判断参数估计是否具有统计意义。
以均值的假设检验为例,假设我们有两组样本数据,通过计算样本均值和样本方差,可以得到均值的矩估计值。
然后,我们可以利用假设检验的方法,比较这两个样本的均值,从而判断两个样本是否具有统计意义上的差异。
最后,我们介绍一种常用的参数区间估计方法,置信区间估计。
置信区间估计是通过样本数据得到一个区间,该区间内的参数值有一定的置信度。
以总体均值的置信区间估计为例,假设我们有一组样本数据,通过计算样本均值和样本标准差,可以得到总体均值的点估计值。
然后,我们可以利用参数估计的理论知识,计算得到总体均值的置信区间,从而对总体均值进行估计。
综上所述,参数估计是概率论与数理统计中的重要内容,应用广泛。
通过点估计方法可以从样本数据中推断总体参数的值,通过假设检验可以判断参数估计的统计意义,通过置信区间估计可以得到参数值的置信区间。
这些参数估计方法为我们提供了在实际问题中进行估计和推断的依据,使我们能够更好地理解和分析数据。
概率论与数理统计第七章 参数估计
第七章 参数估计参数估计是数理统计研究的主要问题之一. 假设总体X ~N (μ,σ2),μ,σ2是未知参数,X 1,X 2,…,X n 是来自X 的样本,样本值是x 1,x 2,…,x n ,我们要由样本值来确定μ和σ2的估计值,这就是参数估计问题,参数估计分为点估计(Point estimation )和区间估计(Interval estimation).第一节 点估计所谓点估计是指把总体的未知参数估计为某个确定的值或在某个确定的点上,故点估计又称为定值估计.定义7.1 设总体X 的分布函数为F (x ,θ),θ是未知参数,X 1,X 2,…,X n 是X 的一样本,样本值为x 1,x 2,…,x n ,构造一个统计量(X 1,X 2,…,X n ),用它的观察值 (x 1,x 2,…,x n )作为θ的估计值,这种问题称为点估计问题.习惯上称随机变量(X 1,X 2,…,X n )为θ的估计量,称(x 1,x 2,…,x n )为的估计值.构造估计量(X 1,X 2,…,X n )的方法很多,下面仅介绍矩法和极大似然估计法. 1.矩法矩法(Moment method of estimation )是一种古老的估计方法.它是由英国统计学家皮尔逊(K .Pearson )于1894年首创的.它虽然古老,但目前仍常用.矩法估计的一般原则是:用样本矩作为总体矩的估计,若不够良好,再作适当调整. 矩法的一般作法:设总体X ~F (X ;θ1,θ2,…,θl )其中θ1,θ2,…,θl 均未知. (1) 如果总体X 的k 阶矩μk =E (X k ) (1≤k ≤l)均存在,则μk =μk (θ1,θ2,…,θl ),(1≤k ≤l ).(2) 令⎪⎪⎩⎪⎪⎨⎧.),,,(,),,,(,),,,(2122121211l l l l l A A A θθθμθθθμθθθμ其中A k (1≤k ≤l )为样本k 阶矩.求出方程组的解,ˆ,,ˆ,ˆ21l θθθ 我们称),,,(ˆˆ21n k k X X X θθ=为参数θk (1≤k ≤l )的矩估计量, ),,,(ˆˆ21nk k x x x θθ=为参数θk 的矩估计值. 例7.1 设总体X 的密度函数为:f (x )=⎩⎨⎧-><<+.,0),1(,10,)1(其他αααx x其中α未知,样本为(X 1,X 2,…,X n ),求参数α的矩法估计.解 A 1=X .由μ1=A 1及μ1=E (X )=21)1()(1++=+=⎰⎰+∞∞-ααααx x x x x xf d d , 有21++=ααX ,得121ˆ--=X Xα.例7.2 设X ~N (μ,σ2),μ,σ2未知,试用矩法对μ,σ2进行估计. 解⎪⎪⎩⎪⎪⎨⎧======∑∑==.1)(,1)(12222111ni i ni i X n A X E X n A X E μμ 又 E (X )=μ, E (X 2)=D (X )+(EX )2=σ2+μ2,那么 .1ˆˆ,ˆ2222S nn A X -=-==μσμ. 例7.3 在某班期末数学考试成绩中随机抽取9人的成绩.结果如下:试求该班数学成绩的平均分数、标准差的矩估计值.解 设X 为该班数学成绩,μ=E (X ),σ2=D (X ))558994(919191+++==∑= i i x x =75;2/19122)(819898⎥⎦⎤⎢⎣⎡-⋅=∑=i i x x s =12.14.⎪⎪⎩⎪⎪⎨⎧======∑∑==.91)(,91)(9122229111i i i i X A X E X A X E μμ 由于E (X 2)=D (X )+(EX )2=σ2+μ2,那么,2222228ˆˆˆ,().9X A A x S μσμ==-=-= 所以,该班数学成绩的平均分数的矩估计值x =μˆ=75分,标准差的矩估计值298ˆs =σ=12.14. 作矩法估计时无需知道总体的概率分布,只要知道总体矩即可.但矩法估计量有时不惟一,如总体X 服从参数为λ的泊松分布时,X 和B 2都是参数λ的矩法估计.2.极(最)大似然估计法极大似然估计法(Maximum likelihood estimation)只能在已知总体分布的前提下进行,为了对它的思想有所了解,我们先看一个例子.例7.4 假定一个盒子里装有许多大小相同的黑球和白球,并且假定它们的数目之比为3∶1,但不知是白球多还是黑球多,现在有放回地从盒中抽了3个球,试根据所抽3个球中黑球的数目确定是白球多还是黑球多.解 设所抽3个球中黑球数为X ,摸到黑球的概率为p ,则X 服从二项分布P {X =k }=k 3C p k(1-p )3-k , k =0,1,2,3.问题是p =1/4还是p =3/4?现根据样本中黑球数,对未知参数p 进行估计.抽样后,共有4种可能结果,其概率如表7-1所示.假如某次抽样中,只出现一个黑球,即X =1,p =1/4时,P {X =1}=27/64;p =3/4时,P {X =1}=9/64,这时我们就会选择p =1/4,即黑球数比白球数为1∶3.因为在一次试验中,事件“1个黑球”发生了.我们认为它应有较大的概率27/64(27/64>9/64),而27/64对应着参数p =1/4,同样可以考虑X =0,2,3的情形,最后可得p =⎪⎩⎪⎨⎧==.3,2,43,1,0,41时当时当x x(1) 似然函数在极大似然估计法中,最关键的问题是如何求得似然函数(定义下文给出),有了似然函数,问题就简单了,下面分两种情形来介绍似然函数. (a ) 离散型总体设总体X 为离散型,P {X =x }=p (x ,θ),其中θ为待估计的未知参数,假定x 1,x 2,…,x n 为样本X 1,X 2,…,X n 的一组观测值.P {X 1=x 1,X 2=x 2,…,X n =x n }=P {X 1=x 1}P {X 2=x 2}…P {X n =x n }=p (x 1,θ)p (x 2,θ)…p (x n ,θ)=∏=ni ix p 1),(θ.将∏=ni ix p 1),(θ看作是参数θ的函数,记为L (θ),即 L (θ)=∏=ni ix p 1),(θ. (7.1)(b ) 连续型总体设总体X 为连续型,已知其分布密度函数为f (x ,θ),θ为待估计的未知参数,则样本(X 1,X 2,…,X n )的联合密度为:f (x 1,θ)f (x 2,θ)…f (x n ,θ)=∏=ni ix f 1),(θ.将它也看作是关于参数θ的函数,记为L (θ),即L (θ)=∏=ni ix f 1),(θ. (7.2)由此可见:不管是离散型总体,还是连续型总体,只要知道它的概率分布或密度函数,我们总可以得到一个关于参数θ的函数L (θ),称L (θ)为似然函数.(2) 极大似然估计极大似然估计法的主要思想是:如果随机抽样得到的样本观测值为x 1,x 2,…,x n ,则我们应当这样来选取未知参数θ的值,使得出现该样本值的可能性最大,即使得似然函数L (θ)取最大值,从而求参数θ的极大似然估计的问题,就转化为求似然函数L (θ)的极值点的问题,一般来说,这个问题可以通过求解下面的方程来解决0)(=θθd d L . (7.3)然而,L (θ)是n 个函数的连乘积,求导数比较复杂,由于ln L (θ)是L (θ)的单调增函数,所以L (θ)与ln L (θ)在θ的同一点处取得极大值.于是求解(7.3)可转化为求解0)(=θθd dln L .(7.4)称ln L (θ)为对数似然函数,方程(7.4)为对数似然方程,求解此方程就可得到参数θ的估计值.如果总体X 的分布中含有k 个未知参数:θ1,θ2,…,θk ,则极大似然估计法也适用.此时,所得的似然函数是关于θ1,θ2,…,θk 的多元函数L (θ1,θ2,…,θk ),解下列方程组,就可得到θ1,θ2,…,θk 的估计值,⎪⎪⎪⎩⎪⎪⎪⎨⎧=∂∂=∂∂=∂∂.0),,,(ln ,0),,,(ln ,0),,,(ln 21221121k k k k L L L θθθθθθθθθθθθ(7.5) 例7.5 在泊松总体中抽取样本,其样本值为:x 1,x 2,…,x n ,试对泊松分布的未知参数λ作极大似然估计.解 因泊松总体是离散型的,其概率分布为:P {X =x }=λλ-e !x x,故似然函数为:L (λ)=∏∏==∑--⋅⋅==ni ni i x nixx x ni ii11!1!1λλλλee. ln L (λ)=11ln ln (!)nniii i n x x λλ==-+-∑∏,∑=+-=ni i x n 11)ln(λλλd d . 令λλd d ln =0,得: ∑=+-ni i x n 11λ=0.所以x x n ni i L ==∑=11ˆλ,λ的极大似然估计量为X L=λˆ(为了和λ的矩法估计区别起见,我们将λ的极大似然估计记为Lλˆ). 例7.6 设一批产品含有次品,今从中随机抽出100件,发现其中有8件次品,试求次品率θ的极大似然估计值.解 用极大似然法时必须明确总体的分布,现在题目没有说明这一点,故应先来确定总体的分布.设 X i =,100,,2,1,0,1 =⎩⎨⎧i ,i ,i 次取正品第次取次品第则X i 服从两点分布:12100p (x i ,θ)=P {X i =x i }=θ xi (1-θ)1-xi ,x i =0,1,故似然函数为:L (θ)=∑-∑=-==-=-∏1001100110010011)1()1(i ii i iix x i x x θθθθ由题知:∑=1001i ix =8,所以 L (θ)=θ8(1-θ)92. 两边取对数得:ln L (θ)=8ln θ+92ln (1-θ).对数似然方程为:θθθθ--=1928)(ln d d L =0.解之得θ=8/100=0.08.所以Lθˆ=0.08. 例7.7 设x 1,x 2,…,x n 为来自正态总体N (μ,σ2)的观测值,试求总体未知参数μ,σ2的极大似然估计.解 因正态总体为连续型,其密度函数为f (x )=222)(21σμσ--x e π,所以似然函数为:L (μ,σ2)=⎭⎬⎫⎩⎨⎧--⎪⎭⎫ ⎝⎛=⎭⎬⎫⎩⎨⎧--∑∏==n i i nni i x x 122122)(21exp 212)(exp 21μσσσμσππ ln L (μ,σ2)=∑=----n i i x n n 1222)(21ln 22ln 2μσσπ. 故似然方程组为:⎪⎪⎩⎪⎪⎨⎧=-+-=∂∂=-=∂∂∑∑==.0)(212),(ln ,0)(1),(ln 124222122ni i ni i x n L x L μσσσσμμσμσμ 解以上方程组得:⎪⎪⎩⎪⎪⎨⎧=-=-===∑∑∑===.ˆ)(1)(1,12121221B x x n x n x x n ni i n i i ni i μσμ 所以 ⎩⎨⎧==.ˆ,ˆ22B X L σμ例7.8 设总体X 服从[0,θ]上的均匀分布,X 1,X 2,…,X n 是来自X 的样本,求θ的矩法估计和极大似然估计.解 因为E (X )=θ/2,令X =E (X ),得.2ˆX =矩θ 又 f (x )=⎪⎩⎪⎨⎧≤≤.,0,0,1其他θθx所以L (θ)=n θ1,0≤x i ≤θ. 要L (θ)最大,θ必须尽可能小,又θ≥x i ,i =1,2,…,n ,所以{}ini L X ≤≤=1max ˆθ.第二节 估计量的评价标准设总体X 服从[0,θ]上的均匀分布,由上节例7可知ˆ2X θ=矩,{}1ˆmax L ii nX θ≤≤ 都是θ的估计,这两个估计哪一个好?下面我们首先讨论衡量估计量好坏的标准问题.1.无偏性定义7.2 若估计量(X 1,X 2,…,X n )的数学期望等于未知参数θ,即:ˆ()E θθ=, (7.6) 则称ˆθ为θ的无偏估计量(Non -deviation estimator ).估计量ˆθ的值不一定就是θ的真值,因为它是一个随机变量,若ˆθ是θ的无偏估计,则尽管ˆθ的值随样本值的不同而变化,但平均来说它会等于θ的真值.例7.9 设X 1,X 2,…,X n 为总体X 的一个样本,E (X )=μ,则样本平均数11nii X X n ==∑是μ的无偏估计量.证 因为E (X )=μ,所以E (X i )=μ,i =1,2,…,n ,于是1111()()n ni i i i E X E X E X n n ==⎛⎫== ⎪⎝⎭∑∑=μ.所以X 是μ的无偏估计量.例7.10 设有总体X ,E (X )=μ,D (X )=σ2,(X 1,X 2,…,X n )为从该总体中抽得的一个样本,样本方差S 2及二阶样本中心矩B 2=11()ni i X X n =-∑是否为总体方差σ2的无偏估计?解 因为E (S 2)=σ2,所以S 2是σ2的一个无偏估计,这也是我们称S 2为样本方差的理由.由于B 2=21n S n -, 那么 E (B 2)=2211()n n E S n nσ--=, 所以B 2不是σ2的一个无偏估计.还需指出:一般说来无偏估计量的函数并不是未知参数相应函数的无偏估计量.例如,当X ~N (μ,σ2)时,X 是μ的无偏估计量,但2X 不是μ2的无偏估计量,事实上:22222()()().E X D X E X nσμμ⎡⎤=+=+≠⎣⎦2.有效性对于未知参数θ,如果有两个无偏估计量1ˆθ与2ˆθ,即E (1ˆθ)=E (2ˆθ)=θ,那么在1ˆθ,2ˆθ中谁更好呢?此时我们自然希望对θ的平均偏差E (ˆθ-θ)2越小越好,即一个好的估计量应该有尽可能小的方差,这就是有效性.定义7.3 设1ˆθ和2ˆθ都是未知参数θ的无偏估计,若对任意的参数θ,有 D (1ˆθ)≤D (2ˆθ), (7.7)则称1ˆθ比2ˆθ有效. 如果1ˆθ比2ˆθ有效,则虽然1ˆθ还不是θ的真值,但1ˆθ在θ附近取值的密集程度较2ˆθ高,即用1ˆθ估计θ精度要高些. 例如,对正态总体N (μ,σ2),11ni i X X n ==∑,X i 和X 都是E (X )=μ的无偏估计量,但D (X )=2nσ≤D (X i )=σ2,故X 较个别观测值X i 有效.实际当中也是如此,比如要估计某个班学生的平均成绩,可用两种方法进行估计,一种是在该班任意抽一个同学,就以该同学的成绩作为全班的平均成绩;另一种方法是在该班抽取n 位同学,以这n 个同学的平均成绩作为全班的平均成绩,显然第二种方法比第一种方法好.3.一致性无偏性、有效性都是在样本容量n 一定的条件下进行讨论的,然而(X 1,X 2,…,X n )不仅与样本值有关,而且与样本容量n 有关,不妨记为n ,很自然,我们希望n 越大时,n 对θ的估计应该越精确.定义7.4 如果n 依概率收敛于θ,即∀ε>0,有{}ˆlim 1,nn P θθε→∞-<=,(7.8) 则称ˆnθ是θ的一致估计量(Uniform estimator ). 由辛钦大数定律可以证明:样本平均数X 是总体均值μ的一致估计量,样本的方差S 2及二阶样本中心矩B 2都是总体方差σ2的一致估计量.第三节 区间估计1.区间估计的概念上节我们介绍了参数的点估计,假设总体X ~N (μ,σ2),对于样本(X 1,X 2,…,X n ),ˆX μ=是参数μ的矩法估计和极大似然估计,并且满足无偏性和一致性.但实际上X =μ的可能性有多大呢?由于X 是一连续型随机变量,P {X =μ}=0,即ˆμ=μ的可能性为0,为此,我们希望给出μ的一个大致范围,使得μ有较高的概率在这个范围内,这就是区间估计问题.定义7.5 设1ˆθ(X 1,X 2,…,X n )及2ˆθ (X 1,X 2,…,X n )是两个统计量,如果对于给定的概率1-α(0<α<1),有:P {1ˆθ<θ<2ˆθ}=1-α, (7.9) 则称随机区间(1ˆθ,2ˆθ)为参数θ的置信区间(Confidence interval ),1ˆθ称为置信下限,2ˆθ称为置信上限,1-α叫置信概率或置信度(Confidence level).定义中的随机区间(1ˆθ,2ˆθ)的大小依赖于随机抽取的样本观测值,它可能包含θ,也可能不包含θ,(7.9)式的意义是指(1ˆθ,2ˆθ)以1-α的概率包含θ.例如,若取α=0.05,那么置信概率为1-α=0.95,这时,置信区间(1ˆθ,2ˆθ)的意义是指:在100次重复抽样中所得到的100个置信区间中,大约有95个区间包含参数真值θ,有5个区间不包含真值θ,亦即随机区间(1ˆθ,2ˆθ)包含参数θ真值的频率近似为0.95. 例7.11 设X ~N (μ,σ2),μ未知,σ2已知,样本X 1,X 2,…,X n 来自总体X ,求μ的置信区间,置信概率为1-α.解 因为X 1,X 2,…,X n 为来自X 的样本,而X ~N (μ,σ2),所以uX ~N (0,1),对于给定的α,查附录中表2可得上分位点2z α,使得2P z α⎫<⎬⎭=1-α,即22P X z X z ααμ⎧-<<+⎨⎩=1-α. 所以μ的置信概率为1-α的置信区间为X z X z αα⎛-+ ⎝. (7.10) 由(7.10)式可知置信区间的长度为22z α,若n 越大,置信区间就越短;若置信概率1-α越大,α就越小,2z α就越大,从而置信区间就越长.2.正态总体参数的区间估计由于在大多数情况下,我们所遇到的总体是服从正态分布的(有的是近似正态分布),故我们现在来重点讨论正态总体参数的区间估计问题.在下面的讨论中,总假定X ~N (μ,σ2),X 1,X 2,…,X n 为其样本. (1) 对μ的估计 分两种情况进行讨论. (a ) σ2已知此时就是例7.11的情形,结论是:μ的置信区间为22X z X z αα⎛-+ ⎝, 置信概率为1-α.(b ) σ2未知当σ2未知时,不能使用(7.10)式作为置信区间,因为(7.10)式中区间的端点与σ有关,考虑到S 2=211()1n ii X X n =--∑是σ2X σ换成S 得 TX ~t (n -1).对于给定的α,查附录中t 分布表4可得上分位点t σ/2(n -1),使得2(1)P t n α⎫<-⎬⎭=1-α,即22(1)(1)P X t n X t n ααμ⎧⎫-<<-⎨⎬⎩⎭=1-α.所以μ的置信概率为1-α的置信区间为22(1),(1)X t n X t n αα⎛⎫-- ⎪⎝⎭. (7.11)=,S 0,所以μ的置信区间也可写成22(1),(1)X t n X t n αα⎛⎫-+- ⎪⎝⎭.(7.12) 例7.12 某车间生产滚珠,已知其直径X ~N (μ,σ2),现从某一天生产的产品中随机地抽出6个,测得直径如下(单位:毫米)14.6 15.1 14.9 14.8 15.2 15.1试求滚珠直径X 的均值μ的置信概率为95%的置信区间.解 111(14.615.114.914.815.215.1)6n i i x x n ===+++++∑=14.95,s 0, t α/2(n -1)=t 0.025(5)=2.571,所以2(t n α-=2.571=0.24, 置信区间为(14.95-0.24,14.95+0.24),即(14.71,15.19),置信概率为95%.σ2的置信区间我们只考虑μ未知的情形.此时由于S 2=211()1n i i X X n =--∑是σ2的无偏估计,我们考虑22(1)n S σ-,由于222(1)~(1)n S n χσ--,所以,对于给定的α,2122222(1)(1)(1)n S P n n ααχχσ-⎧⎫--<<-⎨⎬⎩⎭=1-α. 即222221(1)(1)(1)(1)n S n S P n n αασχχ-⎧⎫--⎪⎪<<⎨⎬--⎪⎪⎩⎭=1-α.所以σ2的置信区间为2222221(1)(1),(1)(1)n S n S n n ααχχ-⎛⎫-- ⎪ ⎪--⎝⎭(7.13) 或222200221,(1)(1)nS nS n n ααχχ-⎛⎫ ⎪ ⎪--⎝⎭, 其中S 02=211()ni i X X n =-∑. 例7.13 某种钢丝的折断力服从正态分布,今从一批钢丝中任取10根,试验其折断力,得数据如下:572 570 578 568 596 576 584 572 580 566试求方差的置信概率为0.9的置信区间.解 因为111(572570566)10n i i x x n ===+++∑=576.2,s 02=2211n i i x x n =-∑=71.56, α=0.10,n -1=9,查附表得:2220.05(1)(9)n αχχ-==16.919,220.951(1)(9)n αχχ--==3.325,22021071.56(1)16.919ns n αχ⨯=-=42.30,220211071.56(1) 3.325ns n αχ-⨯=-=215.22.所以,σ2的置信概率为0.9的置信区间为(42.30,215.22).以上仅介绍了正态总体的均值和方差两个参数的区间估计方法.在有些问题中并不知道总体X 服从什么分布,要对E (X )=μ作区间估计,在这种情况下只要X 的方差σ2已知,并且样本容量n 很大,X 准正态分布N (0,1),因而μ的置信概率为1-α的近似置信区间为X z X z αα⎛-+ ⎝.小 结参数估计问题分为点估计和区间估计.设θ是总体X 的待估计参数.用统计量ˆθ=ˆθ(X 1,X 2,…,X n )来估计θ称ˆθ是θ的估计量,点估计只给出未知参数θ的单一估计.本章介绍了两种点估计的方法:矩估计法和极大似然估计法.矩法的做法:设总体X ~F (X ;θ1,θ2,…,θl )其中θk (1≤k ≤l )为未知参数. (1) 求总体X 的k (1≤k ≤l )阶矩E (x k ); (2) 求方程组112112(,,,)(),(,,,)().l l l l l E X A E X A μθθθμθθθ==⎧⎪⎨⎪==⎩的一组解1ˆθ,2ˆθ,…, ˆl θ,那么ˆk θ=ˆk θ (X 1,X 2,…,X n )(1≤k ≤l)为k 的矩估计量. ˆkθ(x 1,x 2,…,x n )为θk 的矩估计值. 极大似然估计法的思想是若已观察到样本值为(x 1,x 2,…,x n ),而取到这一样本值的概率为P =P (θ1,θ2,…,θl ),我们就取θk (1≤k ≤l )的估计值使概率P 达到最大,其一般做法如下: (1) 写出似然函数L =L (θ1,θ2,…,θl ) 当总体X 是离散型随机变量时,L =121(;,,,)nil i P x θθθ=∏,当总体X 是连续型随机变量时L =121(;,,,)nil i f x θθθ=∏,(2) 对L 取对数ln L =121ln (;,,,)nil i f x θθθ=∑,(3) 求出方程组ln kLθ∂∂=0, k =1,2,…,l . 的一组解ˆk θ=ˆk θ (x 1,…,x n ) (1≤k ≤l )即k 为未知参数θ的极大似然估计值,ˆkθ=(X 1,X 2,…,X n )为θk 的极大似然估计量.在统计问题中往往先使用极大似然估计法,在此法使用不方便时,再用矩估计法进行未知参数的点估计.对于一个未知参数可以提出不同的估计量,那么就需要给出评定估计量好坏的标准.本章介绍了三个标准:无偏性、有效性、一致性.重点是无偏性.点估计不能反映估计的精度,我们就引人区间估计.设θ是总体X 的未知参数,1ˆθ,2ˆθ均是样本X 1,X 2,…,X n 的统计量,若对给定值α(0<α<1)满足P (1ˆθ<θ<2ˆθ)=1-α,称1-α为置信度或置信概率,(1ˆθ,2ˆθ)为θ的置信度为1-α的置信区间.参数的区间估计中一个典型、重要的问题是正态总体X (X ~N (μ,σ2))中μ或σ2的区间估计,其置信区间如表7-3所示.表7-3 正态总体的均值、方差的置信度为(1-α)的置信区间区间估计给出了估计的精度与可靠度(1-α),其精度与可靠度是相互制约的即精度越高(置信区间长度越小),可靠度越低;反之亦然.在实际中,应先固定可靠度,再估计精度. 重要术语及主题矩估计量 极大似然估计量估计量的评选标准:无偏性、有效性、一致性, 参数θ的置信度为(1-α)的置信区间, 单个正态总体均值、方差的置信区间.习 题 七1.设总体X 服从二项分布b (n ,p ),n 已知,X 1,X 2,…,X n 为来自X 的样本,求参数p 的矩法估计.2.设总体X 的密度函数f (x ,θ)=22(),0,0,.x x θθθ⎧-<<⎪⎨⎪⎩其他X 1,X 2,…,X n 为其样本,试求参数θ的矩法估计.3.设总体X 的密度函数为f (x ,θ),X 1,X 2,…,X n 为其样本,求θ的极大似然估计.(1) f (x ,θ)=,0,0,0.e x x x θθ-⎧≥⎨<⎩(2) f (x ,θ)=1,01,0,.x x θθ-⎧<<⎨⎩其他5.随机变量X 服从[0,θ]上的均匀分布,今得X 的样本观测值:0.9,0.8,0.2,0.8,0.4,0.4,0.7,0.6,求θ的矩法估计和极大似然估计,它们是否为θ的无偏估计.6.设X 1,X 2,…,X n 是取自总体X 的样本,E (X )=μ,D (X )=σ2,2ˆσ=k 1211()n i ii XX -+=-∑,问k 为何值时2ˆσ为σ2的无偏估计. 7.设X 1,X 2是从正态总体N (μ,σ2)中抽取的样本112212312211311ˆˆˆ;;;334422X X X X X X μμμ=+=+=+ 试证123ˆˆˆ,,μμμ都是μ的无偏估计量,并求出每一估计量的方差. 8.某车间生产的螺钉,其直径X ~N (μ,σ2),由过去的经验知道σ2=0.06,今随机抽取6枚,测得其长度(单位mm )如下:14.7 15.0 14.8 14.9 15.1 15.2 试求μ的置信概率为0.95的置信区间.9.总体X ~N (μ,σ2),σ2已知,问需抽取容量n 多大的样本,才能使μ的置信概率为1-α,且置信区间的长度不大于L ? 10.设某种砖头的抗压强度X ~N (μ,σ2),今随机抽取20块砖头,测得数据如下(kg ·cm -2):64 69 49 92 55 97 41 84 88 99 84 66 100 98 72 74 87 84 48 81 (1) 求μ的置信概率为0.95的置信区间. (2) 求σ2的置信概率为0.95的置信区间. 11.设总体X ~f (x )=(1),01;10,.x x θθθ⎧+<<>-⎨⎩其中其他 X 1,X 2,…,X n 是X 的一个样本,求θ的矩估计量及极大似然估计量. (1997年研考)12.设总体X ~f (x )= 36(),0;0,.xx x θθθ⎧-<<⎪⎨⎪⎩其他X 1,X 2,…,X n 为总体X 的一个样本(1) 求θ的矩估计量;(2) 求ˆ()D θ. (1999研考) 13.设某种电子元件的使用寿命X 的概率密度函数为f (x ,θ)= 2()2,0;0,.e x x x θθ--⎧>⎨≤⎩其中θ(θ>0)为未知参数,又设x 1,x 2,…,x n 是总体X 的一组样本观察值,求θ的极大似然估计值. (2000研考)估计值和极大似然估计值. (2002研考)15.设总体X 的分布函数为F (x ,β)=1,,0,.x xx ββααα⎧->⎪⎨⎪<⎩其中未知参数β>1,α>0,设X 1,X 2,…,X n 为来自总体X 的样本(1) 当α=1时,求β的矩估计量;(2) 当α=1时,求β的极大似然估计量;(3) 当β=2时,求α的极大似然估计量. (2004研考) 16.从正态总体X ~N (3.4,62)中抽取容量为n 的样本,如果其样本均值位于区间(1.4,5.4)内的概率不小于0.95,问n 至少应取多大?2/2()d zt z t ϕ-=⎰(1998研考)17. 设总体X 的概率密度为f (x ,θ)=,01,1,12,0,.x x θθ<<⎧⎪-≤<⎨⎪⎩其他 其中θ是未知参数(0<θ<1),X 1,X 2,…,X n 为来自总体X 的简单随机样本,记N 的样本值x 1,x 2,…,x n 中小于1的个数.求: (1) θ的矩估计;(2) θ的最大似然估计. (2006研考)。
浙江大学《概率论与数理统计》(第4版)【名校笔记+课后习题+考研真题】第7章 参数估计【圣才出品】
各总体的概率密度或分布律中的未知参数的矩估计量和矩估计值:
(1)
f
x
c
x 1
xc
,其中 c>0 为已知,θ>1,θ为未知参数;
0
其他
(2)
f
x
x 1
0 x 1
,其中θ>0,θ为未知参数;
0
其他
(3) PX
x
m x
p
x
1
p mx , x
0,1, 2,...m
,其中 0<p<1,p 为未知参数。
X
r i
替换总体矩
A1
1 (ˆ1 ,ˆ2
, ,ˆk
)
A2 2 (ˆ1,ˆ2 ,,ˆk )
Ak
k (ˆ1,ˆ2,,ˆk
)
③解方程组,得到 k 个参数的矩估计
未知参数的矩估计量为
i i ( A1, A2 , Ak )
矩估计量的观察值称为矩估计值。
2.最大似然估计法 (1)似然函数
1 / 40
3.求上题中各未知参数的最大似然估计值和估计量。
解:(1)由题意知,似然函数为
L L
x1, x2,..., xn;
n c xi 1 = c
i 1
n n
1
i1 xi
对似然函数两边同时取对数得
n
ln L n ln ln c 1 ln xi i 1
令
d
d
ln L
n
1
然估计,则
u
u(
)
是
u(
)
的最大似然估计。
二、估计量的评选标准
1.无偏性
若
E
(
)
存在,且∀
有
《概率论与数理统计》课件第七章 参数估计
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
浙江大学《概率论与数理统计》第7章
n 2 2
2
故S 2是 2的无偏估计.
36
例2:检验7.1节例6(即总体X 服从0, 上的均匀分布)
的矩估计量ˆ 2X 与 极大似然估计量ˆL Xn的无偏性。
解:Q X U 0, ,
E
X
2
,
由于X1,L , X n与X同分布
E ˆ E 2X
2 n
n
i 1
E
Xi
2 nΒιβλιοθήκη n2因此ˆ 2X 是的无偏估计
6
注:在实际应用时,为求解方便,也可以用
中心矩 i 代替原点矩i,相应地以样本中心矩Bi 估计 i .
7
例1:设总体X 服从均匀分布U (a,b),a和b是 未知参数,样本X1,L , Xn,求a和b的矩估计。
8
解(1)求矩关于参数的函数
1 E( X
)
a
2
b
,
2
(a b)2 12
(2)求参数关于矩的反函数
38
为考察ˆL Xn的无偏性,先求Xn的分布,
由第三章第5节知: FXn x F xn ,
于是
f Xn
x
nxn1
n
0
0 x
其它
因此有:E ˆL E Xn
0
x nxn1
n
dx
n
n
1
所以ˆL Xn是有偏的。
39
纠偏方法
如果 E ˆ a b, ,其中a,b是常数,且a 0
ˆ 0.4
7.2 估计量的评选准则
从前一节看到,对总体的未知参数可用不 同方法求得不同的估计量,如何评价好坏?
四条评价准则:
无偏性准则,有效性准则,均方误差准则和 相合性准则
概率论与数理统计 第7章 参数估计
p ˆ x /1 0 x 1 x 2 . .x .15 1 0 12 1 0 0 8% 0
15
15
7.1.2 矩估计
【例7.3】设总体X的概率密度为
f(x;) (1)x,
0,
0x1 其他
其中θ(θ > – 1)为待估参数,X1,X2,…,Xn为总
称 ˆi(x1,x2, ,xn) 为未知参数i的估计值.
在不会混淆的情况下 ˆi(X 1,X2, ,Xn)和 ˆi(x1,x2, ,xn)
均可称为i的估计.
7.1.1 点估计问题的一般提法
例 如 , 在 “ 装 配 线 的 平 衡 问 题 ” 中 , 若 以 X1 ,
X2,…,X30表示一个操作台的30次装配时间,可
第7章 参数估计
7.1 参数的点估计 7.2 参数的区间估计
第7章 参 数 估 计
统计推断是根据样本所提供的信息对总体的 特性作出种种推断,
参数估计是统计推断的重要问题之一,它是 在总体的分布类型已知时,利用观测数据对总体 中的未知参数进行估计.
本章学习总体参数的两种估计方法,点估计 和区间估计.
本,x1,x2,…,xn是样本观测值,构造的m个统
计量:
ˆ i(X 1 ,X 2 , ,X n ),i 1 ,2 ,.m .,.,
用 ˆi(X 1,X2, ,Xn)的观测值 ˆi(x1,x2, ,xn)法.
7.1.1 点估计问题的一般提法
称 ˆi(X 1,X2, ,Xn)为未知参数i的估计量,
参数θ1,θ2,…,θm的情形.此时,只需要求出似然函
数
L (1 ,2 ,.m . ) .L ( , x 1 ,x 2 ,.x n ; .1 , .2 ,.m . ).,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Gauss
费歇在1922年重新发现了这一方法,
并首先研究了这种方法的一些性质 .
Fisher
极大似然原理:一个随机试验有若干个可能结
果A,B,C,…。若在一次试验中,结果A发生,
则一般认为试验条件对A最有利,即A发生的
概率 P( A / )最大
条件
如, 甲199
红 黑,
乙199
估计的未知参数,假定总体X的k阶原点矩E X k 存在,
则有:E X v v 1,2, ,k v 1, 2, , k, 对于样本X X1, X 2,
其v阶样本矩是:Av
1 n
n i 1
X
v i
v 1, 2,
,k
1 1,2, ,k A1
用样本矩作为总体矩的估计,即令: 2 1,2, ,k A2
于是,样本 ( X1, X2 ,, Xn ) 落入点( x1, x2 ,, xn )
n
邻域内的概率为 f ( xi , )xi ,由极大似然原
理,最合理的
i1
的估计值
ˆ
应该是使
n
f ( xi , )xi 达到最大,由于xi是不依赖于
i1
的增量,所以我们只需求使
n
似然函数 L( ) f ( xi , ) 达到最大 i 1
i1
ln[L( )] n项相加,求导简单 对数似然函数
从而,
求的 L( ) 最大值点就转为求ln[L( )]的最大值点
方法二:
解方程
d
ln[L(
)]
0,
得 到ˆ
d
(2)连续型总体似然函数的求法
设X为连续型总体,其概率密度为:
f ( x; ) 其中 未知
对来自总体的样本 ( X1, X2 ,, Xn ) , 其观测值
P( A) P( X1 x1, X2 x2 ,, Xn xn )
独立
P( X1 x1 )P( X2 x2 )P( Xn xn )
Xi与X 同分布
P( X x1 )P( X x2 )P( X xn )
p( x1, ) p( x2, ) p( xn, )
n
p( xi , )
i1
n
对给定的样本值( x1 , x2 ,..., xn ), p( xi , )
i1
是参数 的函数,称为似然函数,记做 L( ).
n
即 L( ) p( xi; ) i 1
结构:n 项连乘,总体分布 p(x, ) 改 p( xi , )
i 1,2,, n
P( A) L( ), 随变而变, A已经发生,由极大
再求样本矩:
A1
1 n
n i 1
Xi
X,
A2
1 n
n i 1
X
2 i
令
12
An
n i 1
(Xi
X )2
二、 极大似然估计法 极大似然估计法是在总体的分布类型已知的
条件下所使用的一种参数估计方法. 它首先是由德国数学家
高斯在1821年提出的 . 然而,这个方法常归功于
似然原理, L( ) 达到最大,所以 的最合理 估计值ˆ 应满足:L(ˆ)为最大值
定义 对给定的样本值 x1, x2 ,, xn ,若
ˆ( x1, x2,, xn)满足
L(ˆ) max L( )
称 : ˆ( x1, x2,, xn )为的极大似然估计值 ˆ( X1, X2,, Xn )为的极大似然估计量
k 1,2, ,k Ak
解此方程即得1,2, ,k 的一个矩估计量 1, 2, ,ˆk
, Xn,
例1:设总体X的均值和方差 2都存在,且 2 0,, 2均未知,
X1, X 2, , X n 是取自X的一个样本,试求, 2的矩估计。
解:先求总体矩:
1 E X , 2 E X 2 D X E2 X 2 2
为 ( x1, x2 ,, xn ) ,作为与总体X同分布且相互
独立的n维随机变量,样本的联合概率密度为:
f ( x1, x2 ,, xn ) f X1 ( x1 ) f X2 ( x2 ) f Xn ( xn )
n
f ( x1, ) f ( x2, ) f ( xn , ) f ( xi , ) i 1
求ˆ 的步骤:
(1) 写出L( ) (2) 取对数ln L( ) (3) 解方程 d ln[L( )] 0, 得到ˆ
2 但参数, 2的值未知,要求估计, 2,有时还希望以一定的可靠性来 估计值是在某个范围内或者不低于某个数。
参数估计问题就是要求通过样本估计总体分布所包含的未知参数的值。
参数估计的两种方法:点估计法和区间估计法
§1 参数的点估计
点估计的问题就是根据样本 X1, X 2, , X n , 对每一个未知参数i i 1, 2, , k ,构造出一 个统计量ˆi i X1, X 2 , , X n ,作为参数i的估计,
如何求 ˆ ?即求 L( ) 的最大值点问题
方法一: 若 L( )为可导函数
解方程 dL( ) 0, d
得到ˆ ˆ( X1, X2 ,, Xn )
回忆:
(1) f ( x) 0, ln[ f ( x)]单调性相同,从而最大值 点相同.
n
(2) L( ) p( xi; ) n项连乘, 求导麻烦
红 黑
,
任 取1箱 从 中 任 取1球,
已知取到红球, 问最有可能从何箱取?
P(红球/甲) 0.99 P(红球/乙) 0.01
自然,认为从甲箱取更合理
又如,兔龟赛跑,得第一名的最有可能是谁?
极大似然估计法:
(1)X---离散型,已知 X的分布
P( X x) p( x, ), 未知
样本 ( X1, X2,, Xn ) 取到观测值( x1, x2,, xn ) 事件A
第七章 参数估计
﹜点估计 关键词: 矩估计法 极大似然估计法 ﹜区间估计 置信区间 置信度
问题的提出:
参数估计是统计推断的基本问题之一,实际工作中碰到的总体X , 它的分布类型往往是知道的,只是不知道其中的某些参数, 例如:产品的质量指标X 服从正态分布,其概率密度为:
x 2
f x; , 2 1 e 2 2 x
称为 的估计量。
i
点估计有两种方法:矩估计法和极大似然估计法
一. 矩估计法
矩思想: 利用样本矩作为相应总体矩的估计量
1 n
n i 1
X
k i
估计
E X k (n )
矩估计法: 总体X ~ f ( x;1,,k ), 1,,k未知,
一 矩估计法:
设总体X的分布函数为F x;1,2, ,k , 1,2, ,k 是待