概率论与数理统计_第七章__参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设X1,…Xn是取自N (, 2 )的样本, μ已知
求参数 2 的置信度为1 的置信区间.
确定分位数
2 1
/
2
(
n),
2
/
2
(n)
使
n
(Xi )2
P{12 2 (n) i1 2
2 2 (n)} 1
例4. 对飞机的飞行速度进行15次独立试验,测 得飞机的最大飞行速度(单位:m/s)如下:
如果只知道0<p<1,并且实 测记录是X=k (0 ≤ k≤ n),又 应如何估计p呢?
若总体分布已知,对于样本值,选取适当 的参数,使样本值出现的概率最大,这种 估计方法就是极大似然估计法。
➢极大似然估计法
设总体X的分布律或概率密度为f(x; Ө), θ=(θ1, θ2,…, θk)是未知参数, X1,X2, …,Xn是 总体X的样本,则称X1,X2, …,Xn的联合分布 律或概率密度函数
i 1
0
ˆ
ˆ
1n n i1 xi
2
1 n
n i 1
( xi
x
x )2
ˆ X
ˆ
2
n 1 n
S2
求极大似然估计量的步骤:
n
(1) 根据f(x; θ),写出似然函数 L( ) f (xi; )
n
i 1
(2) 对似然函数取对数 ln L( ) ln f (xi ; )
(3) 写出方程 ln L 0
X u 2
n
2.135
μ的置信区间为(2.115,2.135).
求置信区间的步骤
(1) 构造仅与待估参数θ 有关,但分布已知的 函数U;
(2) 给定置信度1-α,得常数a,b,使 P{a<U<b}= 1-α;
(3) 将a<U<b变形,使得:
ˆ1( X1, X 2,..., X n ) ˆ2 ( X1, X 2,..., X n )
)
1 12
(b
a)2
1 12
(bˆ
aˆ)2
M2
n 1 n
S2
aˆ X 3(n 1) S 2, bˆ X 3(n 1) S 2
n
n
矩法特点分析:
矩法的优点是简单易行,并不需要 事先知道总体是什么分布 .
缺点是,当总体类型已知时,没有 充分利用分布提供的信息 .
极大似然估计
例: 设一箱中装有若干个白色和黑色的球, 已知两种球的数目之比为3:1或1:3,现有放回 地任取3个球,有两个白球,问:白球所占的 比例p是多少?
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中 为未知参数 ( 可以是向量) .
现从该总体抽样,得到样本 X1,X2,…,Xn
设X1,…Xn是取自 N (, 2 )的样本, 2已知,
求参数 的置信度为1 的置信区间.
利用 X ~ N (0,1) / n
查正态分布表得 u 2,
使
P{|
X
n
|
u
2}
1
例1:随机地从一批服从正态分布N(μ,0.022)的零 件16个,分别测得其长度为:
2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10
0
2
1 X 2
ˆ1
2X 1
1 X
(2)极大似然估计
n
L( ) ( 1)n ( xi ) (0 xi 1) i 1 n
ln L( ) n ln( 1) ln xi i 1
令 d ln L( ) 0 d
1 n n
ln xi
i 1
ˆ2 1 n n
ln xi
i 1
§7.2 点估计量的评价标准
例2: 已知某产品的不合格率为p, 有简单随 机样本X1 ,X2 ,…, Xn 求p的矩估计量。
解:E(X)=p.
pˆ
1 n
n i 1
Xi
X
例3:设电话总机在某段时间内接到呼唤的次数 服从参数λ未知的泊松分布,现在收集了如下42 个数据:
接到呼唤次数 0 1 2 3 出现的频数 7 10 12 8
Ak
1 n
n i 1
X
k i
K.皮尔逊
n
X
k i
大数定律: lim P(| i1 E( X k ) | ) 1
n
n
矩估计基本思想: 用样本矩估计总体矩 .
设总体的分布函数中含有k个未知参数 1,,k
(1)它的前k阶原点矩都是这k个参数的函数,记为:
(2)用样本i阶原点矩替换总体i阶原点矩
(3) 解方程组,得 θi=hi (X1, X2,…, Xn) (i=1,2,…,k);
45 32
求未知参数λ 的矩估计。
ˆ x 80 40
42 21
例4. X~U(a,b),由简单随机样本X1 ,X2 ,…, Xn求 a,b的矩估计量。 解:E(X)=(a+b)/2, D(X)=(b-a)2/12.
E(X )
1 (a b) 2
1 (aˆ 2
bˆ)
1 n
n i 1
Xi
X
D( X
ˆ1
1 2
X1
1 3
X2
1 6
X
3
ˆ2
1 3
X1
1 3
X2
1 3
X3
ˆ3
1 6
X1
1 6
X2
2 3
X3
例2:设X1,X2,…, Xn是来自某总体X的样本,且
EX , DX 2 , 判断 , 2 的矩估计量是
否是无偏估计。
三、一致性(相合性)
设 ˆn ˆn (X1,, X n )是参数 的估计量,若有
(4) 结论
区间(ˆ1,ˆ2 )就是的一个 置信度为1 的置信区间.
方差未知,求期望的区间估计
例2:随机地从一批服从正态分布N(μ, σ2)的零件 16个,分别测得其长度为: 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 估计该批零件的平均长度μ,并求μ的置信区间 (α=0.05)
n
L(x1, x2,..., xn; ) f (xi; ) i 1
为样本的似然函数,简记为L(θ)。
对于固定的样本观测值x1,x2,…,xn。如果有
例1. 设总体X~N(μ,σ2),其中μ,σ2是 未知参数。求μ,σ2的极大似然估计。
f (x; , 2 )
1
2
exp[
1
2
2
(x
)2]
n
例4. 设X1,X2,…,Xn为取自总体X~U(a, b)的样 本, 求a, b的极大似然估计量.
回顾: 设X1,X2,…Xn是取自总体X的一个样本
X
~
f
(x)
(
1)x ,
0,
0 x 1 其它
其中 >0,
求 的矩估计量和极大似然估计量.
解:(1)矩估计
E(X )
xf (x)dx
1 x( 1)x dx 1
则以hi (X1, X2,…, Xn)作为θi 的估计量 ,并 称hi(X1, X2,…, Xn)为θi 的矩法估计量,而 称hi(x1, x2,…, xn) 为θi 的矩法估计值。
例1. 设总体X的数学期望和方差分别是μ, σ2 ,求μ , σ2的矩估计量。
总体期望、方差的矩估计量分别是样本均值和 样本二阶中心矩。
422.2 418.7 425.6 420.3 425.8 423.1 431.5 428.2
438.3 434.0 411.3 417.2 413.5 441.3 423.0
假设飞机最大飞行速度服从 N (424.93, 2 ) 求最
大飞行速度的方差的置信度为0.90的置信区间。
解:n 15, 424.93, 1 0.90 0.1
i 1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..., xn )
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
设X1,…Xn是取自 N (, 2 )的样本, 2未知,
求参数 的置信度为1 的置信区间.
查t分布表得 t 2,
使
P{|
X S
n
| t
2} 1
μ未知,求方差的区间估计
例1:用一个仪表测量某物理量9次,得到样本均 值为56.32,样本标准差为0.22. 测量标准差σ 反映了测量仪表的精度,试求σ的置信水平为 0.95的置信区间。
从样本出发构造适当的统计量
ˆ ˆ(X1, , Xn )
作为参数 的估计量,即点估计。 将 x1,, xn 代入估计量,得到 的估计值
ˆ ˆ(x1, , xn )
关键问题:如何构造统计量?
ˆ ˆ(X1, , Xn )
矩估计
点估计
极大似然估计
矩估计
总体k阶原点矩
k EX k
样本k阶原点矩
§7.4
单正态总体四种类型的区间估计
1. 期望的区间估计 σ2已知时μ的置信区间 σ2未知时μ的置信区间
2. 求方差的区间估计 μ已知时σ2的置信区间 μ未知时σ2的置信区间
已知方பைடு நூலகம்,求期望的区间估计
例1:随机地从一批服从正态分布N(μ,0.022)的零 件16个,分别测得其长度为: 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 估计该批零件的平均长度μ,并求μ的置信区间 (α=0.05)
P{
2 1
2 (n 1)
(n 1)S2
2
2
2 (n 1)}
1
例2:假设某地区18~25岁女青年身高 现抽取30名,样本均值为158cm,样本方差为 (5cm)2,求σ2的置信水平为95%的区间估计。
μ已知,求方差的区间估计
例3:随机地从一批服从正态分布N(2.12, σ2)的 零件16个,分别测得其长度为: 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 试求σ2的置信水平为0.95的置信区间。
设θ 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的两个统计量
ˆ1 ˆ1( X1, X2,, Xn ), ˆ2 ˆ2 ( X1, X2,, Xn )
(ˆ1 ˆ2 ) 满足 P(ˆ1 ˆ2 ) 1
则称区间 [ˆ1,ˆ2 ]是θ 的置信度为 1 的置
信区间.
ˆ1和ˆ2 分别称为置信下限和置信上限.
二、有效性
设 ˆ1 ˆ1( X1,, X n )和 ˆ2 ˆ2( X1,, Xn)
都是参数 的无偏估计量,若有
D(ˆ1) D(ˆ2 ) 则称 ˆ1 较 ˆ2 有效 .
如果对固定的n, D(ˆ1) min(D(ˆ)) 则称ˆ1是ˆ的有效估计。
例1:设X1,X2, X3是来自某总体X的样本,且 E(X)=μ,讨论μ的以下估计量的无偏性和一致性。
则称 ˆn 是参数 的一致估计量.
切比雪夫大数定律
lim
n
P(|
1 n
i
n 1
X
i
|
)
1
设样本X1, , Xn来自数学期望E(X ) ,方差D(X ) 2
的总体,则X 是的一致估计量。
伯努利大数定律
设总体为参数为p的0-1分布,X1,
,
X
为样本,
n
则X 是p的一致估计量。
§7.3
置信区间定义:
2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 估计该批零件的平均长度μ,并求μ的置信区间
(α=0.05)
解: X 2.14 ... 2.11 2.125 16
查表u 2 u0.025 1.96, 0.02, n 16, 代入得
X u 2
n
2.115,
评价一个估计量的好坏,不能仅仅依据一 次试验的结果,而必须由多次试验结果来衡量 . 即确定估计量好坏必须在大量观察的基础上从 统计的意义来评价。
常用的几条标准是:
1.无偏性 2.有效性 3.一致性
一、无偏性
设 ˆ( X1,, Xn)是未知参数 的估计量,若 E(ˆ)
则称 ˆ 为 的无偏估计 .
L(, 2)
i 1
1
2
exp[
1
2 2
( xi
)2 ]
(2
n
)2
(
)2
n 2
exp[
1
2
2
n
(xi )2 ]
i 1
ln
L(,
2
)
n 2
ln(
2
)
n 2
ln
2
1
2
2
n
( xi
i 1
)2
ln L
1
2
[
n i 1
xi
n ]
0
ln L
2
n
2 2
1
2( 2 )2
n
(xi n)2
例2:假设某地区18~25岁女青年身高X ~ N (, 2) 现抽取30名,样本均值为158cm,样本方差为 (5cm)2,求σ2的置信水平为95%的区间估计。
设X1,…Xn是取自 N (, 2 )的样本,
求参数 2 的置信度为 1 的置信区间.
确定分位数 12 / 2 (n 1), 2 / 2 (n 1) 使