概率论与数理统计---第七章参数估计}第三节:区间估计
区间估计
常见形式
间估计的区间上、下界通常形式为:“点估计±误差” “总体均值”的区间估计
总体均值:μ 总体方差:σ 样本均值:x =(1/n)×Σ(Xi) 样本方差:s =(1/(n-1))×Σ(Xi-x)^2 符号假设置信水平:1-α 显著水平:α
已知n个样本数据Xi (i=1,2,...,n),如何估计总体的均值? 首先,引入记号: 区间估计σ'=σ/sqrt(n) s'=s/sqrt(n) 然后,分情况讨论: 情况1 小样本(n<30),σ已知,此时区间位于 x ± z(α/2)×σ' 情况2 小样本(n<30),σ未知,此时区间位于 x ± t(α/2)×s' 区间估计情况3 大样本(n≥30),σ已知,此时区间位于 x ± z(α/2)×σ' 情况4 大样本(n≥30),σ未知,此时区间位于 x ± z(α/2)×s' 其中, z(α/2)表示:正态分布的水平α的分位数 t(α/2)表示:T分布的水平α的分位数
置信区间
区间估计有时,对所考虑的置信区间(或上、下限)加上某种一般性限制,在这个前提下寻找最优者。无偏 性是经常用的限制之一,如果一个置信区间(上、下限)包含真值θ的概率,总不小于包含任何假值θ┡的概率, 则称该置信区间(上、下限)是无偏的。同变性(见统计决策理论)也是一个常用的限制。
求置信区间的方法 最常用的求置信区间及置信上、下限的方法有以下几种。
即
费希尔把这个等式解释为:在抽样以前,对于θ落在区间内的可能性本来一无所知,通过抽样,获得了上述 数值,它表达了统计工作者对这个区间的"信任程度",若取b)=-α=uα/2,则得到区间,其信任程度为 1-α。即 当用上述区间作为θ的区间估计时,对于“它能包含被估计的θ”这一点可给予信任的程度为1-α。
概率论与数理统计第7章
x 0 , x 0 ,x 1 ,x 2 ,
,x n 为 总 体 X
的 一 个 样 本 ,则 未 知 参 数 的 矩 估 计 ˆ _ _ _ _ _ _ _ _ _ _ _ .
这个例子所作的推断已经体现了极大似然法 的基本思想 .
最大似然估计原理:
设X1,X2,…Xn是取自总体X的一个样本,样 本的联合密度(连续型)或联合分布律 (离散型)为
f (x1,x2,… ,xn ; ) .
当给定样本X1,X2,…Xn时,定义似然函数为:
L() f (x1, x2 ,…, xn; )
得
pˆ1Βιβλιοθήκη nn i 1xix
即为 p 的最大似然估计值 .
从而 p 的最大似然估计量为
p ˆ(X1,
1n ,Xn)ni1Xi X
求最大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合分布率(或联 合密度);
(2) 把样本联合分布率 ( 或联合密度 ) 中自变
量看成已知常数,而把参数 看作自变量,得到似然 函数L();
要求:领会
2.2 估计量的有效性、相合性, 要求:领会
3.区间估计
3.1 置信区间的概念,
要求:领会
3.2 求单个正态总体均值和方差的置信区间,要求:简单应用
参数估计
现在我们来介绍一类重要的统计推断问题
参数估计问题是利用从总体抽样得到的信息来估计总体 的某些参数或者参数的某些函数.
估计新生儿的体重
1 p
n
pxi (1p)1xi
i1
n
n
xi
n xi
pi1 (1p) i1
n
n
xi
n xi
L(p)pi1 (1p) i1
概率论与数理统计复习7章
( n − 1) S 2 ( n − 1) S 2 = 1 − α 即P 2 <σ2 < 2 χα 2 ( n − 1) χ1−α 2 ( n − 1) ( n − 1) S 2 ( n − 1) S 2 置信区间为: 2 , χα 2 ( n − 1) χ12−α 2 ( n − 1)
则有:E ( X v ) = µv (θ1 , θ 2 ,⋯ , θ k ) 其v阶样本矩是:Av = 1 ∑ X iv n i =1
n
估计的未知参数,假定总体X 的k阶原点矩E ( X k ) 存在,
µ θ , θ ,⋯ , θ = A k 1 1 1 2 µ2 θ1, θ 2 ,⋯ , θ k = A2 用样本矩作为总体矩的估计,即令: ⋮ µ θ , θ ,⋯ , θ = A k k k 1 2 ɵ ɵ ˆ 解此方程即得 (θ1 , θ 2 ,⋯ , θ k )的一个矩估计量 θ 1 , θ 2 ,⋯ , θ k
+∞
−∞
xf ( x ) dx = ∫ θ x θ dx =
1 0
令E ( X ) = X ⇒
θ +1
θ
ˆ = X ⇒θ =
( )
X 1− X
θ +1
2
θ
7.2极大似然估计法
极大似然估计法: 设总体X 的概率密度为f ( x,θ ) (或分布率p( x,θ )),θ = (θ1 ,θ 2 ,⋯ ,θ k ) 为 未知参数,θ ∈ Θ, Θ为参数空间,即θ的取值范围。设 ( x1 , x2 ,⋯ , xn ) 是 样本 ( X 1 , X 2 ,⋯ , X n )的一个观察值:
i =1 n
概率论与数理统计第7章参数估计PPT课件
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
概率论 第七章 参数估计
L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数
…
…
参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本
概率第7章 参数估计
Gauss
Fisher
基本思想
甲.乙两人比较射击技术,分别射击目标一次,甲中而乙未中, 可以认为:甲射击技术优于乙射击技术. 事件A发生的概率为0.1或0.9,观察一次,事件A发生了, 可以认为:事件A发生的概率为0.9. 实际问题(医生看病、公安人员破案、技术人员进行质量 检验等)尽管千差万别,但他们具有一个共同的规律,即在 获得了观察资料之后,给参数选取一个数值,使得前面的观 察结果出现的可能性最大. 最大似然估计就是通过样本值 x1 , , x n 等数求得总体的 分布参数,使得 X1 ,, X n 取值为 x1 , , x n 的概率最大.
i
L( ) L( x1 , , x n ; ) f ( x i ; ),
i 1
n
的最大值,这里 ( )称为样本的似然函数 L .
ˆ 若 L( x 1 , , x n ; ) max L( x 1 , , x n ; )
ˆ 则称 ( x1 , , xn )为 的极大似然估计值 .
i
xi
在得到观测值 x1 , x 2 , , x n 的前提下,自然 应当选取使得 n
f ( x ; )dx
i i 1
i
达到最大的 值作为未知参数 的估计值.
因为当未知参数 等于这个值时,出现给 定的那个 样本观测值的可能性最 大.
但 dxi 不随 而变,故只需考虑:
3.期望和方差的点估计 在实际中,常常以样本均值作为总体均值的 点估计,以样本方差作为总体方差的点估计. 期望的点估计: (1)无偏性 1 n 选择估计量 X X i n i 1 (2)样本容量越大,估计值 越有效 方差的点估计:
概率论与数理统计-参数估计
第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2
令
A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,
即
B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
《概率论与数理统计》7
未知参数 , ,, 的函数.分别令
12
k
L(1,,k ) 0,(i 1,2,...,k)
或令
i
ln L(1,,k ) 0,(i 1,2,...,k)
i
由此方程组可解得参数 i 的极大似然估计值 ˆi.
例5 设X~b(1,p), X1, X2 , …,Xn是来自X的一个样本,
求参数 p 的最大似然估计量.
解 E( X ) ,E( X 2 ) D( X ) [E( X )]2 2 2
由矩估计法,
【注】
X
1
n
n i 1
X
2 i
2
2
ˆ X ,
ˆ
2
1 n
n i 1
(Xi
X )2
对任何总体,总体均值与方差的矩估计量都不变.
➢常见分布的参数矩估计量
(1)若总体X~b(1, p), 则未知参数 p 的矩估计量为
7-1
第七章
参数估计
统计 推断
的 基本 问题
7-2
参数估 计问题
(第七章)
点估计 区间估 计
假设检 验问题 (第八章)
什么是参数估计?
参数是刻画总体某方面概率特性的数量.
当此数量未知时,从总体抽出一个样本, 用某种方法对这个未知参数进行估计就 是参数估计.
例如,X ~N ( , 2),
若, 2未知, 通过构造样本的函数, 给出
k = k(A1, A2 , …, A k)
用i 作为i的估计量------矩估计量.
例1 设总体X服从[a,b]上的均匀分布,a,b未知,
X1, X2 , …,Xn为来自总体X的样本,试求a,b的 矩估计量.
解 E(X ) a b , D(X ) (b a)2
中国矿业大学周圣武概率论与数理统计_图文
定义2 设 都是参数θ的无偏估计量,若有
则称
有效。
例:160页,例7、例8
定义3 设
为参数θ的估计量,
若对于任意θ∈Θ,当
则称
的一致估计量。
例:由大数定律知
一致性说明:对于大样本,由一次抽样得到的估 计量 的值可作θ的近似值
例5 设 X1, X2, …, Xn 是取自总体 X 的一个样本,
⑴ 验证
试求θ的极大似然估计值。 解
极大似然估计的不变性
练习
1.设总体X在
上服从均匀分布,
X1 , X 2 ,L X n是来自X的样本,试求 q 的矩估计量
和最大似然估计.
2.设X1,X2,…Xn是取自总体X的一个样本
其中 >0, 求 的极大似然估计.
课堂练习
P156:5,6
作业
P178:1,2,5,6
Fisher
最大似然法的基本思想:
问题:请推断兔子 是谁打中的?
例6 袋中放有白球和黑球共4个,今进行3次有放回 抽样,每次抽取1个,结果抽得2次白球1次黑球,试 估计袋中白球个数。 解 设袋中白球个数为m,
X为3次抽样中抽得的白球数,则
当袋中白球数m分别为1,2,3时, p对应的值分别为1/4,2/4,3/4, X对应的分布律见下表
中国矿业大学周圣武概率论与数理统计_图文 .ppt
第七章 参数估计
§7.1 点估计 §7.2 估计量的评选标准 §7.3 区间估计 §7.4 单个正态总体参数的区间估计 §7.4 两个正态总体参数的区间估计
统计推断
矩估计 点估计 最大似然估计
参数估计
最小二乘估计
区间估计
参数假设检验
假设检验 非参数假设检验
概率论第七章参数估计2区间估计
2 / 2 ( n 1)
即
置信区间:
标准差σ的一个置信水平为 1 的置信区间
2 (n 1) S , 2 (n 1) 2
(n 1) S 2 1 (n 1) 2
2
注意:在密度函数不对称时,如 2分布和F 分布,
置信度 1 下,来确定 的置信区间[ , ]
⑴ 已知方差 ,估计均值μ
2
n 1 2 设已知方差 2 0 ,且 X X i 是 的 n i 1 一个无偏点估计,
又
X ~ N (0 , 1) 0 / n
且 对于给定的置信度 查正态分布表,找出
临界值
使得:
2 1 2 2
一个无偏估计, 因为X与Y 相互独立,所以
X Y ~ N ( 1 2 ,
X Y ( 1 2 )
2 1
n1
2 2
n2
)
2 1
n1 n2 所以 1 2 的置信水平为1-α的置信区间为
2 2
~ N (0,1)
( X Y z / 2
已知
由样本值算得:
查表 t0.025 (6) 2.447
得区间:
对某种型号飞机的飞行速度进行15次试验, 测 例 5: 得最大飞行速度(单位: 米/秒)为 422.2, 417.2, 425.6 420.3, 425.8, 423.1, 418.7, 438.3, 434.0, 412.3, 431.5 413.5, 441.3, 423.0, 428.2, 根据长期经验, 可以认为 最大飞行速度服从正态分布. 求飞机最大飞行速度
第三节 区间估计 譬如,在估计湖中鱼数的问题中,若 我们根据一个实际样本,得到鱼数 N 的极 大似然估计为1000条.
统计学 第七章 参数估计
[
]
2 χα (n) (n)的α 分位数,记为k≜ n k≜
抽样分布
(3)性质 • 若X服从χ2 (n),则均值E(X)=n ,方差 D(X) =2n 。 • χ2分布具有可加性。若 X1,X2相互独立,
X1~ χ2(n1) ,X2~χ2(n2)
则(X1+X2)~χ2(n1+n2) • 当n→∞时,χ2分布渐进于正态分布
σ
2
~ χ (n −1)
2
第三节两个总体参数的区 间估计(112页)
• • • • • • • 一、两个总体均值之差的区间估计 (一)两个总体均值之差的估计:独立样本 大样本:近似于正态分布 小样本: (1)两个总体的方差均已知,近似于正态分布 (2)两个总体的方差均未知但相等,近似于t分布 (3)两个服从正态分布的总体的方差均未知且不等, 但样本容量相等,近似于t分布 • (4)两个总体的方差均未知且不等,样本容量也不 等,近似于t分布,自由度为V
• 解:求(3)的计算步骤: • ①求样本指标:
x =1000小时
σ=50 (小时)
µ x=
σ
n
=
50 100
=(小时) 5
• ②根据给定的F(t)=95%,查概率表得t=1.96。 • ③根据∆x=t×µx=1.96×5=9.8,计算总体平均耐 用时间的上、下限: x − ∆ x=1000-9.8=990.(小时) 2 • 下限 x +∆ x=1000+9.8=1009 .(小时) 8 • 上限 • 所以,以95%的概率保证程度估计该批产品的平均耐 用时间在990.2~1009.8小时之间。
f (x;θ ) 其中 θ
或概率密度为
是未知参数。 是未知参数。
如何求极大似然估 计量呢? 计量呢?
概率论与数理统计PDF版课件7-2
. 的一个合理解释. 但注意,并不要求包含真实值的区
间正好%,只要是大约%就是合理地,比如也可以.
第七章参数估计 §7.2 区间估计
求置信区间的步骤
=
, ⋯ , ,
(1)找一个与未知参数有关的统计量
11 0.248
3.816
第七章参数估计 §7.2 区间估计
注1 上述求解或 的置信区间时,我们选取的点估计
都是矩估计量或者最大似然估计量. 事实上,我们也可以用
贝叶斯估计量来构造置信区间.详细内容参考本章“重要补
充及扩展问题”的第五节(见教材P220)
注2 上述利用枢轴量进行区间估计的时候都要求总体服
从正态分布. 但实际中,我们考虑的总体经常不服从正态分
布. 这种情况下的区间估计采用的是大样本区间估计. 详细
内容参考本章“重要补充及扩展问题”的第六节(见教材
P220)
第七章参数估计 §7.2 区间估计
三、两个正态总体的区间估计
设 , ⋯ , 为来自正态总体 ∼ , 的简单随机
1. 当 和 已知时,求 − 的置信区间
ഥ−
ഥ 作为总体均值差 − 的点估计;
(1)选取样本均值差
X − Y − ( 1 − 2 )
(2)构造枢轴量
~ N ( 0,1) ;
2
2
(
)
1
n1
(3)选取 = − = Τ ;
+
2
n2
(4) − 的 − 的置信区间
.
n
n
2
2
第七章参数估计 §7.2 区间估计
例3( 见教材P213) 假设 轮胎的寿 命服从正 态分布
概率论与数理统计(叶慈南 刘锡平 科学出版社)第7章 参数估计教程
估计 θ ,故称这种估计为点估计.
5 6
,σ 2未知,
… 随机抽查100个婴儿 得100个体重数据 10,7,6,6.5,5,5.2, …
而全部信息就由这100个数组成. 据此,我们应如何估计 和 σ 呢?
我们知道,服从正态分布N ( , σ 2 )的r.v. X , E ( X ) = , 由大数定律, 样本体重的平均值 1 → ∑ X i P n i =1 自然想到把样本体重的平均值作为总体平均 体重的一个估计. X= 用样本体重的均值 X估计 , 类似地,用样本体重的方差 S 2估计 σ 2 . 1 n 1 n 2 X = ∑ Xi, S = ∑ ( X i X )2 n 1 i =1 n i =1
(一)矩估计法
基本思想:用样本矩估计总体矩
(二)最大似然估计法
基本思想:
15
16
最大似然估计法 (最大似然法)
它首先是由德国数学家 高斯在1821年提出的 , 然而,这个方法常归功于 英国统计学家费希尔(Fisher) . 费希尔在1922年重新发现了 这一方法,并首先研究了这 种 方法的一些性质 . Fisher
1. 矩估计法 2. 最大似然法 3. 最小二乘法 4. 贝叶斯方法 ……
(一) 矩估计法(简称"矩法")
它是基于一种简单的"替换"思想 建立起来的一种估计方法 . 英国统计学家 K. 皮尔逊 最早提出的 . 基本思想: 用样本矩估计总体矩 . 理论依据: 大数定律
Ak = 1 n k P ∑ X i → k = E ( X k ) n i =1
4
在参数估计问题中,假定总体分布 形式已知,未知的仅仅是一个或几个 参数.
第七章-参数估计
• 根据n2=36的样本估计总体参数μ: • 0.95的置信区间
78 1.961.18 79 1.961.18
76.7 81.3
• 0.99的置信区间
79 2.581.18 79 2.581.18
75.7 82.04
• 【例7-2】
• 有一个49名学生的班级,某学科历年考试成绩的
• 3.一致性 • 当样本容量无限增大时,估计值应能够越来越接
近它所估计的总体参数,估计值越来越精确,逐 渐趋近于真值。 n大, X • 4.充分性 • 一个容量为n的样本统计量,是否充分地反映了 全部n个数据所反映总体的信息。
三、区间估计
(一)区间估计的定义 1. 根据估计量以一定可靠程度推断总体参数所在的区
少?
• 解:平均数的标准误
sn1 1 s1 8 2.67
X1
n1
n1 1 10 1
sn2 1 s2 9 1.52
X2
n2
n2 1 36 1
• 0.95的置信区间 • 当n1=10时,df1=n-1=9,t0.05/2=2.262
78 2.262 2.67 78 2.262 2.67 71.96 84.04
•置著性水平
• 显著性水平:估计总体参数落在某一区间时,可能 犯错误的概率,用符号表示。
• 置信度:被估计参数落在置信区间内的概率, • 1-表示 • 例:0.95置信区间(1-)指总体参数落在该区间内
,估计正确的概率为95%,而估计错误的概率为 5%(=0.05)
7.07 2.24
X1
n1
10
7.07 1.18
X2
n2
36
• 用n1=10的样本估计总体参数μ: • 0.95的置信区间
《概率论与数理统计》课件第七章 参数估计
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
第七章__参数估计
三、区间估计与标准误
㈠区间估计的定义 是根据样本统计量,利用抽样分布的原理,在一定的
可靠程度上,估计出总体参数所在的范围,即以数 轴上的一段距离表示未知参数可能落入的范围。 ㈡置信区间与显著性水平 ⑴置信区间:也称置信间距,指在一定可靠程度上,总体参
数所在的区域距离或区域长度。
⑵置信界限(临界值):置信区间的上下两端点值。 ⑶显著性水平:指估计总体参数落在某一区间时,可能犯错
⑶区间估计的原理是样本分布理论。在计算区间估计值解释估 计的正确概率时,依据的是该样本统计量的分布规律及样本 分布的标准误。样本分布可提供概率解释,而标准误的大小 决定区间估计的长度。一般情况下,加大样本容量可使标准 误变小。
当总体方差已知时,样本平均数的分布为正态分布或
渐近正态分布,此时,样本平均数的平均数uX u, 平均数的离散程度即平均数分布的标准差(简称
例4
解:由题意知,其总体方差未知,但其总体分布为正态分布,
则此样本均数的分布服从t分布, 可以依t分布对总平 均身高μ进行估计。
SEX
S 4.8 0.81; df n 1 36 1 35 n 1 35
查t值表可知 : t0.05 230 2.042;t0.01 230 2.75
例2 已知某区15 岁男生立定跳远的方差 为 436.8cm ,现从该区抽取58名15岁男生, 测得该组男生立定跳远的平均数为198.4cm, 试求该区15岁男生立定跳远平均成绩的95%和 99%的置信区间。
例2
解:由题意知:由于样本容量(n=58)大于30 ,
该样本的抽样分布为渐进正态分布。
SEX
因此, 的95%的置信区间为 :
82 2.0211.12 82 2.0211.12
概率统计简明教程 第七章 参数估计
222第七章 参数估计统计推断是数理统计的重要内容,它是指在总体的分布完全未知或形式已知而参数未知的情况下,通过抽取样本对总体的分布或性质作出推断.大致可以分为估计问题和假设检验问题两大类. 本章重点介绍参数估计问题,即根据样本对总体分布中所包含的未知参数或总体的数字特征作出数值上的估计.主要内容包括:点估计和区间估计.§1 点估计概述1.1 点估计在许多实际问题中,可以认为总体X 分布的形式是已知的,它只依赖于一个或几个未知参数.如果能对分布中所含的参数作出推断,那么就可以确定总体分布.例如, 已知总体服从正态分布(),1N μ,μ未知,我们的目的是通过样本提供的信息对未知参数μ作出估计,也就是借助于样本对总体作出推断,这类问题就是参数估计问题.点估计问题的一般提法是:设总体X 的分布函数();F x θ类型已知,θ为未知参数,它的可能取值范围Θ是已知的,称Θ为参数空间,即θ∈Θ.这样,我们有一族分布函数(){};:F x θθ∈Θ.如果(){}2;,:,0F x μσμσ-∞<<+∞>是正态分布的分布函数族,其中()2,θμσ=.设12,,,n XX X 是X 的一个样本, 12,,,n x x x 为相应的样本值.我们构造一个统计量()12,,,n X X X θ ,以()12,,,n X X X θ 的值()12,,,n x x x θ 作为参数θ的真实值的估计.习惯上,称223()12,,,n X X X θ 为参数θ的估计量()12ˆ,,,n X X X θ ,称()12,,,n x x x θ 为θ的估计值为()12ˆ,,,n x x x θ .在不致混淆的情况下,估计量与估计值都简称为估计,简记为ˆθ.容易看出,对于不同的样本值来说,由同一个估计量得出的估计值一般是不相同的.在几何上一个数值是数轴上的一个点,用θ的估计值ˆθ作为θ的近似值就像用一个点来估计θ,故称为点估计.如果总体分布中含有k 个未知参数1,,k θθ ,则需要构造k 个统计量()()11212ˆˆ,,,,,,,,n k n X X X X X X θθ 分别作为1,,k θθ 的估计量.例1.1 设总体X 服从参数为λ的泊松分布, 0λ>为未知参数,现有以下样本值3,4,1,5,6,3,8,7,2,0,1,5,7,9,8试求未知参数λ的估计值.解:由于()E X λ=,自然地想到用样本均值11ni i X X n==∑作为λ的估计量,利用样本值得()1341563872015798 4.615x =++++++++++++++=.这样,我们获得了参数λ的估计量ˆX λ=与估计值ˆ 4.6x λ==. 在本例中,对于总体X 的一个样本12,,,n X X X ,()1i X i n ≤≤亦可以作为λ的估计量;同样地,()1X 和()n X 都应该可作为λ的估计量.这样,对于同一个参数,可以有许多不同的点估计;在这些估计中,我们自然地希望挑选一个最“优”的点估计.因此,有必要建立评价估计量优劣的标准.下面介绍几个常用的标准:无偏性、有效性和一致性.1.2 评价估计量的标准1. 无偏性224对于不同的样本值来说,由估计量()12ˆˆ,,,n X X X θθ= 得出的估计值一般是不相同的,这些估计只是在参数θ真实值的两旁随机地摆动.要确定估计量ˆθ的好坏,要求某一次抽样所得的估计值等于参数θ的真实值是没有意义的,但我们希望()ˆE θθ=,这是估计量所应该具有的一种良好性质,称之为无偏性,它是衡量一个估计量好坏的一个标准.定义 1.1 如果未知参数θ的估计量()12ˆˆ,,,n X X X θθ= 的数学期望()ˆE θ存在,且对任意θ∈Θ,都有()ˆE θθ= (1.1) 则称ˆθ是θ的无偏估计量.在科学技术中,称()ˆE θθ-是以ˆθ作为θ估计的系统误差. 无偏估计的实际意义就是无系统误差.例 1.2 设12,,,n X X X 是总体X 的一个样本, 总体X 的k 阶原点矩记为()kk E X μ=,样本原点k 阶矩记为11nkk i i A X n==∑,证明:k A 是k μ的无偏估计量.证明: 12,,,n X X X 是总体X 的一个样本,即12,,,n X X X 与X同分布,因此 ()(),1,2,,k ki k E X E X i n μ=== .即 11()()nk k ik i E A E X nμ===∑ .例1.3 设总体X 的均值μ和方差2σ都存在,证明:未修正样本方差2252211()nii S X X n==-∑不是2σ的无偏估计量.证明: 在第六章第二节中,我们证明了()22E S σ=,因此,修正的样本方差2S =211()1nii X X n =--∑是2σ的无偏估计量,也就是说20S 不是2σ的无偏估计量.我们以后一般取2S 作为2σ的估计量.例 1.4 设总体()X P λ ,12,,,n X X X 是X 的一个样本, 2S 为样本方差,01α≤≤,证明:()21L X S αα=+-是参数λ的无偏估计量.证明:易见()()()2,()E X E X E S D X λλ====,()()()()()211,E L E X E Sαααλαλλ=+-=+-=因此,估计量()21L X S αα=+-是λ的无偏估计.2. 有效性同一个参数可以有多个无偏估计量,那么用哪一个为好呢?设参数θ有两个无偏估计量1ˆθ和2ˆθ,在样本容量n 相同的情况下, 1ˆθ的观测值都集中在θ的真值附近,而2ˆθ的观测值较远离θ的真值,即1ˆθ的方差较2ˆθ的方差小,我们认为1ˆθ较2ˆθ好,由此有如下的定义:定义 1.2 设()1112ˆˆ,,,n X X X θθ= 和()2212ˆˆ,,,n X X X θθ= 都是参数θ的无偏估计量,若对任意θ∈Θ,都有12ˆˆ()()D D θθ≤ (1.2)226且至少存在一个0θ∈Θ使得上式中的不等号成立,则称1ˆθ较2ˆθ有效.例1.5 设12,,,n X X X 是总体X 的一个样本, X 的均值 μ和方差2σ都存在,且20σ>,记11ˆkk i i X kθ==∑,1,,k n = .易见,111ˆ()()kk i i E E X k kkθμμ===⋅=∑,1,,k n = .因此, 这些估计量都是μ的无偏估计量.由于 2222111ˆ()()kk ii D D Xk kkkσθσ===⋅=∑,从而ˆn X θ=最有效.3.一致性无偏性和有效性都是在假设样本容量n 固定的条件下讨论的.由于估计量是样本的函数,它依赖样本容量n ,自然地,我们希望一个好的估计量,当n 越来越大时,它与参数的真值几乎一致,这就是估计量的一致性或称之为相合性.定义1.3 设()12ˆˆ,,,n n X X X θθ= 为参数θ的一个估计量, n 为样本容量,如果对任意θ∈Θ,ˆn θ依概率收敛于θ,即对任意0ε>,有{}ˆlim 1n n P θθε→∞-<= (1.3)则称ˆn θ为参数θ的一致估计量.例 1.6 设总体X 的均值μ和方差2σ都存在,证明:样本均值11ni i X X n==∑是μ的一致估计量.证明:由切比雪夫大数定律可知,对任意0ε>,有22711lim 1ni n i P X nμε→∞=⎧⎫-<=⎨⎬⎩⎭∑因此,11ni i X X n==∑是μ的一致估计量.例1.7 设总体()2,X N μσ ,12,,,n X X X 是总体X 的一个样本,证明: 样本方差2S =211()1nii X X n =--∑是2σ的一致估计量.证明:由于()22211n S n χσ-- ,有 2212(1)n DS n σ-⎡⎤=-⎢⎥⎣⎦,因此, 22422212()11n D S D S n n σσσ⎛⎫-⎡⎤==⎪⎢⎥--⎣⎦⎝⎭.由切比雪夫不等式可知,对任意0ε>,有{}{}42222222120()()(1)P S E S P S D S n σεσεεε≤-≥=-≥≤=-.这样 {}22lim ()0n P S E S ε→∞-≥=,即 {}22lim 1n P S σε→∞-<=, 2S是2σ的一致估计量.§2 矩估计与最大似然估计本节我们介绍两种常用的构造估计量的方法,即矩估计法和最大似然估计法.2.1矩估计法228许多总体的未知参数与总体矩之间存在着函数关系,如在泊松总体()P λ中,它的参数λ就是总体的一阶矩,又如在正态总体()2,X N μσ中(),E X μ=()()222E XE X σ=-⎡⎤⎣⎦.若总体矩存在,我们很自然地想到用样本矩来估计相应的总体矩,从而可以获得未知参数的估计量,这种方法称之为矩估计法.设12,,,n X X X 是总体X 的一个样本,若X 是连续型随机变量,则其概率密度函数为();f x θ;若X 是离散型随机变量,则其分布律为();p x θ,()12,,,k θθθθ= ,θ∈Θ.假设总体X 的k 阶原点矩存在,记()ll E Xμ=,11nlli i AX n==∑,()1,2,,l k = .由辛钦大数定律可知,l A 依概率收敛于l μ,即可以用样本矩替换同阶的总体矩,我们称之为替换原则.替换原则是矩估计法的思想实质,这种方法只需假设总体矩存在,无需知道总体的分布类型.由于l μ依赖于参数12,,,k θθθ ,可设 1121212212(,,,),(,,,),(,,,).k k k k k μθθθμμθθθμμθθθμ=⎧⎪=⎪⎨⎪⎪=⎩将此方程组的解记为1112221212(,,,),(,,,),(,,,).k k kk k θθμμμθθμμμθθμμμ=⎧⎪=⎪⎨⎪⎪=⎩用l A 替换l μ()1,2,,l k = ,得到2291112221212ˆ(,,,),ˆ(,,,),ˆ(,,,).k k k k k A A A A A A A A A θθθθθθ⎧=⎪=⎪⎨⎪⎪=⎩并把它们分别作为参数12,,,k θθθ 的估计量,称之为矩估计量, 矩估计量的观测值称为矩估计值.例2.1 设总体X 的概率密度函数为()()101,;0x x f x θθθ⎧+<<=⎨⎩,,其他.1,θ>-求参数θ的矩估计量.解: ()()111011d 2E X xx θθμθθ++==+=+⎰,解得 11211μθμ-=-,因此, θ的矩估计量为 21ˆ1X Xθ-=-.如果我们获得一组样本观测值,其样本均值为0.65x =,则参数θ的矩估计值为20.651ˆ0.8610.65θ⨯-==-.例2.2 设总体X 的均值μ和方差2σ都存在,且20σ>,又设12,,,n X X X 是总体X 的一个样本,求μ和2σ的矩估计量.解:注意到()()()22E XD XE X =+⎡⎤⎣⎦,由方程组()()12222,.E X E X μμμσμ==⎧⎪⎨==+⎪⎩230解得1μμ=,2221σμμ=-.因此,μ和2σ的矩估计量分别为1ˆA X μ==, 22222211111()nniii i A A X XX X nnσ===-=-=-∑∑.此例表明, 总体X 均值和方差的矩估计量分别是样本均值与样本的二阶中心矩,而不依赖总体X 的分布.2.2 最大似然估计法由于矩估计法只需假设总体矩存在,没有充分利用总体分布提供的信息,为获得更理想的估计,需要引入最大似然估计法,它的一个直观想法是某个随机试验有若干个结果,,A B C 等,如果在一次试验中,出现结果A ,则认为事件A 发生的概率是最大的.例如,一只袋子里有黑白两种外形相同的球,这两种球的数量不详,只知道它们占总数的比例:一种球为10%,另一种球占90%.今从中任抽取一只球,取得白球,一种比较合理的想法是认为袋子里白球的数量较多, 占总数的90%,这就是最大似然估计法的基本思想.我们通过下面的例子说明最大似然估计法的原理.某工厂加工一批产品,现需要估计其不合格品率p ,今从中抽取一个容量为n 的样本值12,,,n x x x ,令1,0,i i X i ⎧=⎨⎩第次取到次品第次取到正品1,2,,i n = ,总体X 的分布律为()()1;1,0,1xxp x p pp x -=-=.取得样本获得观测值的概率为{}()()()1111111122,,,111==---====--∑∑=- nnnniii i x x x x n n x n x P X x X x X x pp pp pp ,()0,11,2,,i x i n == .显然{}1122,,,n n P X x X x X x === 是p 的函231数,记为()L p ,即()()111nnii i i x n x L p pp ==-∑∑=-.由于在一次取样中,样本值12,,,n x x x 出现,我们认为概率()L p 是最大的,选取使得()L p 达到最大的ˆp 作为参数p 的一个估计值,即()(){}ˆm ax p L pL p ∈Θ=.由微积分中求极大点的方法, p 可从方程()d 0d L p p=求出,又由于ln x 是x 的单调增函数,()ln L p 与()L p 在同一个p 处取极大值,p 也可从方程()d ln L p 0dp=求出,()()()11ln ln ln 1nni i i i L p x p n x p ===⋅+--∑∑,()11d ln 0d 1nniii i x n x L p ppp==-=-=-∑∑,解得: 1ˆn ii x pn==∑.容易验证, 1ˆn ii x pn==∑能使得()L p 达到最大,称之为参数p 的最大似然估计值,其对应的统计量称为参数p 的最大似然估计量.下面我们讨论最大似然估计法.设12,,,n X X X 是取自总体X 的一个样本, 12,,,n x x x 为样本值.如果总体X 是离散型的,其分布律为();p x θ,θ为未知参数,θ∈Θ. 样本12,,,n X X X 的联合分布律为232{}()11221,,,;nn n ii P X x X x X x p x θ=====∏ ,容易看出,当样本值12,,,n x x x 固定时上式是参数θ的函数,当θ取固定值时,上式是事件{}1122,,,n n X x X x X x === 发生的概率,记()()()121;,,,;nn ii L L x x x p x θθθ===∏ , (2.1)并称()L θ为样本的似然函数.若样本值12,,,n x x x 的函数()12ˆˆ,,,n x x x θθ=∈Θ 满足()(){}ˆm ax L L θθθ∈Θ=, (2.2)则称()12ˆˆ,,,n x x x θθ= 为θ的最大似然估计值,其相应的统计量()12ˆ,,,n X X X θ 称为θ的最大似然估计量.如果总体X 是连续型的,X 的概率密度为();f x θ,θ为未知参数,θ∈Θ.随机点12(,,,)n X X X 落在点12(,,,)n x x x 的边长为12,,,n x x x ∆∆∆ 的邻域内的概率近似为()1;ni i i fx x θ=∆∏.我们寻找使()1;ni i i f x x θ=∆∏达到最大的()12ˆˆ,,,n x x x θθ= ,但1ni i x =∆∏与它无关,故可取样本的似然函数为()()()121;,,,;nn ii L L x x x f x θθθ===∏ . (2.3)类似地, 若样本值12,,,n x x x 的函数()12ˆˆ,,,n x x x θθ=∈Θ 满足233()(){}ˆm ax L L θθθ∈Θ=则称()12ˆˆ,,,n x x x θθ= 为θ的最大似然估计值,其相应的统计量()12ˆ,,,n X X X θ 称为θ的最大似然估计量.获得样本的似然函数后,为求出未知参数θ的最大似然估计量,可以利用微积分中求函数极值的方法.假设();f x θ或();p x θ关于θ可微,由下面的似然方程()d 0d L θθ=,或对数似然方程()d ln 0d L θθ=,可求出最大似然估计θ.例2.3 设总体(),X P λ 求λ的最大似然估计量.解:似然函数为 ()1!ix ni i eL x λλλ-==∏,对数似然函数为 ()11ln ln ln(!)nni i i i L x n x λλλ===--∑∑ ,令()1d ln 0d nii xL n λλλ==-=∑,求得λ的最大似然估计值为 11nii xx n λ===∑,最大似然估计量为 11ni i X X nλ===∑.234例2.4 总体(),X E λ 求λ的最大似然估计量. 解: 总体X 的概率密度为(),0,0,x e x f x x λλλ-⎧>=⎨≤⎩.似然函数为 ()11niii nx x ni L eeλλλλλ=-=∑==∏,对数似然函数为()1ln ln ni i L n x λλλ==-∑,令()d ln 0d L λλ=,有10nii xnλ=-=∑,因此,λ的最大似然估计值为 11nii nxxλ===∑,最大似然估计量为 1Xλ=.假设总体的分布中含有k 个未知参数12,,,k θθθ ,类似地,写出似然函数()12,,,k L L θθθ= ,求解方程组()01,2,,iL i k θ∂==∂或()ln 01,2,,iL i k θ∂==∂可获得未知参数12,,,k θθθ 的最大似然估计.例2.5 总体()2,,X N μσ 求2,μσ的最大似然估计量.解: 似然函数为 ()()22212211,exp ()22n i n i L x μσμσπσ=⎧⎫=--⎨⎬⎩⎭∑235对数似然函数为()()222211ln ,ln 2ln ()222nii n nL xμσπσμσ==----∑分别求关于2μσ和的偏导数,得以下对数似然方程组()()221222241ln ,1()0,ln ,1()0.22n ii nii L xL n xμσμμσμσμσσσ==⎧∂⎪=-=∂⎪⎨∂⎪=-+-=⎪∂⎩∑∑解上述方程组得2μσ和的最大似然估计值分别为11ˆnii xx nμ===∑ ,2211(),nii x x nσ==-∑因此2μσ和的最大似然估计量分别为ˆX μ=和 2211()nii XX nσ==-∑.最大似然估计具有一个性质:如果ˆθ为总体X 未知参数θ的最大似然估计,函数()μμθ=具有单值反函数()θθμ=,则()ˆˆμμθ=为()μμθ=的最大似然估计.利用此性质,我们可获得例2.5中σ的最大似然估计量为ˆσ==例 2.6 设总体X 服从[]0,θ上的均匀分布,0θ>,求θ的最大似然估计值.解:记()()()()111min ,,,max ,,n n n x x x x x x == .236似然函数为 ()()()11,0,0,n n x x L θθθ⎧<<⎪=⎨⎪⎩其他注意到对于()()10,n x x θ≤≤有 ()()110nnn L x θθ<=≤.因此,取θ的最大似然估计值为()ˆn x θ=.最后我们给出求最大似然估计的一般步骤(有时候它并不适用,如上例):1、写出似然函数)(θL ,即由总体分布导出样本的联合分布律(或联合概率密度);2、令()d 0d L θθ=或()01,2,,iL i k θ∂==∂ ,求出驻点(常转化为求对数似然函数ln ()L θ的驻点:令()d ln 0d L θθ=或()ln 01,2,,iL i k θ∂==∂ );3、求出最大值点;4、求得参数的最大似然估计.§3 区间估计参数的点估计实质是用一个估计值来估计未知参数θ的真值,但估计值只是θ的一个近似值,它本身既没有反映这种近似的精度又没有给出误差的范围,因此,在实际问题的应用中意义有限.例如在一大批产品中,任意取出60件产品,经检验有3件为次品,按点估计的方法,我们获得次品率p的一个估计值为ˆp=0.05,但ˆp 与次品率p 的真值是有误差的,这个误差有237多大,点估计无法给予回答.我们希望给出一个区间()ˆˆ,pp -∆+∆,用它来估计次品率p 的真值,这样就产生了误差∆的大小及用区间()ˆˆ,pp -∆+∆估计次品率p 真值的可靠程度的问题.区间估计解决了上述问题,我们将介绍在区间估计理论中被广泛接受的置信区间.3.1 置信区间定义3.1设1,,n X X 是取自总体X 的一个样本, θ为总体分布中所含的未知参数, θ∈Θ.对于给定的α,01α<<,若存在两个统计量()1,,n X X θθ= 和()1,,n X X θθ= ,使得{}1P θθθα<<=- (3.1)则称随机区间(),θθ是θ的臵信水平为1α-的臵信区间,θ和θ分别称为θ的臵信下限和臵信上限.定义3.1表明置信区间(),θθ包含θ的真值的概率为1α-,它的两个端点是只依赖12,,,n X X X 的随机变量.设12,,,n x x x 为一个样本值,我们获得一个普通的区间()()1212(,,,,,,,)n n x x x x x x θθ 称之为置信区间(),θθ的一个实现,在不致引起误解的情形下,也简称为置信区间.对于一个实现,只有两种可能, 它要么包含θ的真值,要么不包含θ的真值.在重复取样下(各次取样的样本容量均为n ),我们获得许多不同的实现,根据伯努利大数定律,这些不同的实现中大约有100(1α-)%的实现包含θ的真值,而有100α%的实现不包含θ的真值.例 3.1 已知某产品的重量(单位:克)()2,X N μσ,其中8σ=,μ未知,现从中随机抽取9个样品,其平均重量为575.2x =克,试238求该产品的均值μ的臵信水平为95%的臵信区间.解:样本均值11ni i X X n==∑是未知参数μ的较优的点估计,同时有2,X N n σμ⎛⎫ ⎪⎝⎭ , 或()0,1N . 因此,我们构造一个枢轴量U =,选取区间()/2/2,u u αα-,使得/2/21P u u ααα⎧⎫-<<=-⎨⎬⎩⎭,即/2/21P X u X u ααμα⎧-<<+=-⎨⎩.这样我们得到μ的置信水平为1α-的置信区间为/2/2X u X u αα⎛-+ ⎝.由575.2x =,9n =,8σ=,1α-=95%,0.05α=,/2u α=1.96算得/2575.2 1.96569.976x u α-=-⨯=/2575.2 1.96580.424x u α+=+⨯=所以,μ的一个置信区间为()569.976,580.424.从此例可以看出, 寻求未知参数θ的置信区间的步骤为:(1) 选取θ的一个较优的点估计()12ˆˆ,,,n X X X θθ= ,一般是通过239最大似然估计法获得.(2) 以()1ˆˆ,,n X X θθ= 为基础, 寻求未知参数θ的一个枢轴量W ,即()1,,;n W W X X θ= 且W 的分布已知.(3)对于给定的置信水平(与θ无关)1α-,确定两个分位点,a b ,使得(){}1,,;1n P a W X X b θα<<=- .,a b 可通过(){}(){}11,,;,,;2n n P WX X a P W X X b αθθ≤=≥=确定.(4)求出θ的置信区间.3.2 单个正态总体均值与方差的置信区间以下我们将讨论正态总体的均值与方差的置信区间.设()2,X N μσ,12,,,n XX X 是取自总体X 的一个样本.1. 参数μ的置信区间关于参数μ的置信区间,我们分方差2σ已知和2σ未知两种情形. (1) 方差2σ已知的情形例3.1中,我们已经获得了在方差2σ已知的条件下, μ的置信区间为/2/2X u X u αα⎛-+ ⎝,简记为/2X u α⎛± ⎝.(2) 方差2σ未知的情形由于U =σ,又2S 是2σ的无偏估计量,因此,选取240随机变量X T -=.由第六章定理4.1可知(1)T t n - ,对于给定的置信水平1α-,有/2/2(1)(1)1P t n t n ααα⎧⎫--<<-=-⎨⎬⎩⎭,即/2/2(1)(1)1S S P X t n X t n ααμα⎧--<<+-=-⎨⎩,因此,μ的置信水平为1α-的置信区间为/2/2(1)(1)X t n X t n αα⎛--+- ⎝,(3.2)简记为/2(X t n α⎛±- ⎝. 例3.2 假设轮胎的寿命2(,)X N μσ .为估计它的平均寿命,现随机抽取12只,测得它们的寿命为(单位:万千米)4.68 4.85 4.32 4.85 4.615.02 5.20 4.60 4.58 4.72 4.38 4.70 求μ的臵信水平为0.95的臵信区间.解:12n =, 4.7092,x =20.0615s =,1α-=95%,0.05α=,()0.02511 2.2010t =算得μ的置信水平为0.95的置信区间为(()()0.0250.0251111 4.5516,4.8668x t x t ⎛-+= ⎝.2. 参数2σ的置信区间 (1) 均值μ已知的情形 由于()()2,1,2,,i X N i n μσ= ,即()0,1i X N μσ- ,241所以 ()()2221ni i X n μχσ=-∑.我们选取随机变量()2211ni i X μσ=-∑作为枢轴量, 对于给定的置信水平1α-,有()2221/2/2211()()1ni i P n X n ααχμχασ-=⎧⎫<-<=-⎨⎬⎩⎭∑,即()()2221122/21/21.()()n ni i i i X X P n n ααμμσαχχ==-⎧⎫--⎪⎪⎪⎪<<=-⎨⎬⎪⎪⎪⎪⎩⎭∑∑ 因此,2σ的置信水平为1α-的置信区间为()()221122/21/2,()()nnii i i XXn n ααμμχχ==-⎛⎫-- ⎪⎪ ⎪⎪⎝⎭∑∑. (3.3) 我们也得到σ的置信水平为1α-的置信区间为⎝⎭. (3.4) (2) 均值μ未知的情形 由于()()()2222221111nii n S XXn χχσσ=-=-=-∑ ,选取随机变量2χ作为枢轴量,类似地, 我们得到2σ的置信水平为1α-的置信区间为242()()221122/21/2,(1)(1)nn ii i i X X X X n n ααχχ==-⎛⎫-- ⎪ ⎪-- ⎪ ⎪⎝⎭∑∑,即()()2222/21/211,(1)(1)n S n S n n ααχχ-⎛⎫-- ⎪--⎝⎭, 和σ的置信水平为1α-的置信区间为⎛ ⎝⎭, (3.5) 即⎛ ⎝.例3.3 在例3.2中,求2σ的臵信水平为0.95的臵信区间. 解:12n =, 4.7092,x =20.0615s =,()210.6765n s -=1α-=95%,0.05α=,()20.0251121.920χ=,()20.97511 3.816χ=算得2σ的置信水平为0.95的置信区间为(0.03086,0.17728).3.3 两个正态总体均值差与方差比的置信区间设()211,X N μσ ,()222,Y N μσ ,从总体X 和Y 中,分别独立地取出样本12,,,n X X X 和12,,,m Y Y Y ,样本均值依次记为X 和Y ,样本方差依次记为21S 和22S .1. 设21σ和22σ已知,求12μμ-的置信区间243由第六章定理2.2可知()0,1X Y U N μμ---=.对于给定的置信水平1α-,有/2/21X Y P u u ααμμα⎧⎫⎪⎪---⎪⎪-<<=-⎨⎬⎪⎪⎪⎪⎩⎭,即/212/21,P X Y u X Y u ααμμα⎧⎪--<-<-+=-⎨⎪⎩因此,12μμ-的置信水平为1α-的置信区间为//X Y u X Y u αα⎛---+ ⎝. (3.6) 例3.4 分别从()1,4X N μ ,()2,6Y N μ 中独立地取出样本容量为16和24的两样本,已知16.9x =,15.3y =,求12μμ-的臵信水平为0.95的臵信区间.解:16,24n m ==, 16.9x =,15.3y =,1α-=95%,0.05α=, 214σ=22,6σ=,/20.025 1.96u u α==,因此12μμ-的置信水平为0.95的置信区间为()16.915.3 1.9615.3 1.960.214,2.986⎛--⨯-+⨯= ⎝由此可以认为,在置信水平为0.95的情形下12μμ>.2. 设22212σσσ==未知,求12μμ-的置信区间244记()()22122112wn S m S S n m -+-=+-,由第六章定理4.2可知()2X Y T t n m μμ---=+- .以T 为枢轴量,类似地,我们得到12μμ-的置信水平为1α-的置信区间为()()/2/222X Y t n m S X Y t n m S αα⎛--+--++- ⎝(3.7)例3.5 为了估计磷肥对某农作物增产的作用,现选用20块条件大致相同的地块进行对比试验.其中10块地施磷肥,另外10块地不施磷肥,得到单位面积的产量如下(单位:公斤):施磷肥:620, 570, 650, 600, 630, 580, 570, 600, 600, 580; 不施磷肥:560, 590, 560, 570, 580, 570, 600, 550, 570, 550. 设施磷肥的地块的单位面积的产量()21,X N μσ ,不施磷肥的地块的单位面积的产量()22,Y N μσ ,求12μμ-的臵信水平为0.95的臵信区间.解:10n m ==,1α-=95%,0.05α=,600x =,570y =,2164009s =,2224009s =,()()22122211222w n s m s s n m -+-==+-,0.025(18) 2.1010t =.因此,12μμ-的置信水平为0.95的置信区间为60057022 2.101060057022 2.1010⎛--⨯⨯-+⨯⨯⎝(9.23,50.77)=,即我们可以认为磷肥对此农作物增产有作用.2453. 设1μ和2μ已知,求2122σσ的置信区间因为()()212211ni i X n μχσ=-∑,()()222212mi i Y m μχσ=-∑且样本12,,,n X X X 与样本12,,,m Y Y Y 独立,所以有()2211222121(),()nii mii Xm F F n m n Yμσσμ==-=⋅⋅-∑∑ ,对于给定的置信水平1α-,有(){}1/2/2(,),1P F n m F F n m ααα-<<=-,即()22211111222/221/22211()()111,,(,)()()n ni i i i m m i i i i m X m X P F n m F n m n Y n Y ααμμσασμμ==-==⎧⎫--⎪⎪⎪⎪<<=-⎨⎬⎪⎪--⎪⎪⎩⎭∑∑∑∑因此,2122σσ的置信水平为1α-的置信区间为()22111122/21/22211()()11,,(,)()()n ni i i i m mi i i i m X m X F n m F n m n Y n Y ααμμμμ==-==⎛⎫-- ⎪⎪ ⎪--⎪⎝⎭∑∑∑∑. (3.8) 4.设1μ和2μ未知,求2122σσ的置信区间由于()221222211,1S F F n m Sσσ=⋅-- ,对于给定的置信水平1α-,有246(){}1/2/2(1,1)1,11P F n m F F n m ααα---<<--=-,即()222111222/2221/221111,1(1,1)S S P F n m S F n m S αασασ-⎧⎫⎪⎪⋅<<⋅=-⎨⎬----⎪⎪⎩⎭,从而2122σσ的置信水平为1α-的置信区间为()()221122/221/2211,1,11,1S S F n m S F n m S αα-⎛⎫⋅⋅ ⎪ ⎪----⎝⎭. (3.9) 例 3.6 某车间有甲,乙两台机床加工同类零件,假设此类零件直径服从正态分布.现分别从由甲机床和乙机床加工出的产品中取出5个和6个,进行检查,得其直径数据(单位:毫米)为甲: 5.06, 5.08, 5.03, 5.00, 5.07; 乙: 4.98, 5.03, 4.97, 4.99, 5.02, 4.95; 试求22σσ甲乙的臵信水平为0.95的臵信区间.解: 5,6n m ==,1α-=95%,0.05α=,20.00107,s =甲20.00092,s =乙()0.0254,57.39,F =于()()0.9750.025114,50.10685,49.36F F ===,因此22σσ甲乙的置信水平为0.95的置信区间为()0.0010710.001071,0.15738,10.88990.000927.390.000920.1068⎛⎫⋅⋅= ⎪⎝⎭.3.4 单侧置信区间前面讨论的参数θ的置信区间(),θθ是双侧置信区间,即有置信上限247θ和置信下限θ.有时在一些实际问题中,我们只关心参数θ的上限或下限,因此有必要讨论参数θ的单侧置信区间.定义3.2设1,,n X X 是取自总体X 的一个样本, θ为总体分布中所含的未知参数, θ∈Θ.对于给定的α(01α<<),若存在统计量()1,,n X X θθ= 或()1,,n X X θθ= ,使得{}1P θθα>=- (3.10)或{}1P θθα<=- (3.11)则称随机区间(),θ+∞(或(),θ-∞)是θ的臵信水平为1α-的单侧臵信区间,θ称为θ的单侧臵信下限(θ称为θ的单侧臵信上限).求参数θ的单侧置信区间的方法与求θ的置信区间(),θθ的方法是类似的,只需将步骤(3)中的(){}12,,,;n P a W X X X b θ<< 1α=-改为(){}1,,;1n P a W X X θα<=- 或(){}1,,;1n P W X X b θα<=- ,其中,,a b 可通过(){}(){}11,,;,,;n n P W X X a P W X X b θθα≤=≥= 确定.详细的结果看表7.2.例3.7 在例3.2中,求μ的臵信水平为0.95的单侧臵信下限.解:12n =, 4.7092,x =20.0615s =,1α-=95%,0.05α=,()0.0511 1.7960t =算得μ的置信水平为0.95的单侧置信下限为(0.0511 4.5806x t -=.表7.1 正态总体均值,方差的置信区间248表7.2 正态总体均值,方差的单侧置信上、下限249250251习题七( A )1、设总体X 服从参数为N 和p 的二项分布,n X X X ,,,21 为取自X 的一个样本,试求参数p 的矩估计量与极大似然估计量.2,、设n X X X ,,,21 为取自总体X 的一个样本,X 的概率密度为22,0(;)0,xx f x θθθ⎧<<⎪=⎨⎪⎩其它.其中参数0θ>,求θ的矩估计.3、设12,,,n X X X 总体X 的一个样本, X 的概率密度为⎪⎩⎪⎨⎧≤>=--0,0,0,);(1x x ex x f xαλαλαλ其中0>λ是未知参数,0>α是已知常数,求λ的最大似然估计.4、设总体X 服从几何分布 ,10,,2,1,)1()(1<<=-==-p k p p k X P k 试利用样本值n x x x ,,,21 ,求参数p 的矩估计和最大似然估计.5、设总体X 的概率密度为()1;exp ,2x f x σσσ⎧⎫=-⎨⎬⎩⎭0σ>为未知参数, n X X X ,,,21 为总体X 的一样本,求参数σ的最大似然估计.6、证明第5题中σ的最大似然估计量为σ的无偏估计量. 7,、设总体X 的概率密度为()222220;0x x e x f x σσσ-⎧⎪>=⎨⎪⎩,,,其它.,20σ>为未知参数, n X X X ,,,21 为总体X 的一个样本,求参数2σ的的矩估252计量和最大似然估计量.8、设总体),(~2σμN X ,μ已知,σ为未知参数, n X X X ,,,21 为X 的一个样本,∑=∧-=ni i X c 1||μσ, 求参数c ,使∧σ为σ的无偏估计.9、设θˆ是参数θ的无偏估计量,且有0)ˆ(>θD ,试证22)ˆ(ˆθθ=不是2θ的无偏估计量.10、设总体),(~2σμN X ,321,,X X X 是来自X 的样本,试证:估计量32112110351ˆX X X ++=μ;32121254131ˆX XX ++=μ;3213216131ˆX XX ++=μ都是μ的无偏估计,并指出它们中哪一个最有效.11,、设12,,,n X X X 是总体()20,X N σ 的一个样本,20σ>,证明:211ni i X n=∑是2σ的相合估计量.12、设总体X 的数学期望为μ,方差为2σ,分别抽取容量为1n 和2n 的两个独立样本,1X ,2X 分别为两样本均值,试证明:如果,a b 满足1a b +=,则12Y aX bX =+是μ的无偏估计量,并确定,a b ,使得()D Y最小.13、设12,,,n X X X 是总体X 的一个样本, X 的概率密度为();f x θ,0θ>,未知,已知()222nXn χθ,试求θ的置信水平为1α-的置信区间.14、从大批彩色显像管中随机抽取100只,其平均寿命为10000小时,253可以认为显像管的寿命X 服从正态分布.已知均方差40=σ小时,在置信水平0.95下求出这批显像管平均寿命的置信区间.15、设随机地调查26年投资的年利润率(%),得样本标准差(%)15=S ,设投资的年利润率X 服从正态分布,求它的方差的区间估计(置信水平为0.95).16,、从一批钉子中抽取16枚,测得其长度为(单位:厘米)2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11.设钉子的长度X 服从正态分布,试求总体均值μ的置信水平为0.90的置信区间.17、生产一个零件所需时间(单位:秒)),(~2σμN X ,观察25个零件的生产时间得5.5=x ,73.1=s .试求μ和2σ的置信水平为0.95的置信区间.18、产品的某一指标),(~2σμN X ,已知04.0=σ,μ未知.现从这批产品中抽取n 只对该指标进行测定,问n 需要多大,才能以95%的可靠性保证μ的置信区间长度不大于0.01?19、设A 和B 两批导线是用不同工艺生产的,今随机地从每批导线中抽取5根测量其电阻,算得721007.1-⨯=A s ,62103.5-⨯=B s ,若A 批导线的电阻服从),(211σμN ,B 批导线的电阻服从),(222σμN ,求2221σσ的置信水平为0.90的置信区间.20,、从甲乙两个蓄电池厂的产品中分别抽取6个产品,测得蓄电池的容量(A.h)如下:甲厂 140 , 138 , 143 , 141 , 144 , 137;乙厂135 , 140 , 142 , 136 , 138 , 140设蓄电池的容量服从正态分布,且方差相等,求两个工厂生产的蓄电池的容量均值差的95%置信区间.( B )1、设总体X 的概率分别为254其中102θθ⎛⎫<<⎪⎝⎭是未知参数,利用总体X 的如下样本值: 3, 1, 3, 0, 3, 1, 2, 3 求θ的矩估计值和最大似然估计值.2、设()111ˆˆ ,,n X X θθ= 和()221ˆˆ,,n X X θθ= 是参数θ的两个相 互独立的无偏估计量,且方差()()12ˆˆ2D D θθ=,试确定常数,a b ,使得12ˆˆa b θθ+是θ的无偏估计量,且在一切这样的线性估计类中方差最小.3、在测量反应时间中,一心理学家估计的标准差为0.05秒,为了以0.95的置信水平使他对平均反应时间的估计误差不超过0.01秒,应取多大的样本容量.【提供者:路磊】。
概率论与数理统计第七章参数估计
例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .
概率论与数理统计第七章
估计 为1.68,这是点估计.
估计在区间[1.57, 1.84]内,这是区间估计.
一、点估计概念及讨论的问题
例1 已知某地区新生婴儿的体重X~ N(,2),
, 2未知,
…
随机抽查100个婴儿
得100个体重数据
9, 7, 6, 6.5, 5, 5.2, … 而全部信息就由这100个数组成.
求:两个参数a,b的矩估计
解: 写出方 V E 程 (X a(X )r组 ) ˆˆ2
其 中uˆˆ2Xn1in1(Xi X)2
但是
E
(
X
)
Var ( X )
a
b 2 (b a)2
12
即有
(ab2ba)2 12
X
ˆ
2
由方程组求解出a,b的矩估计:
a ˆX 3 ˆ b ˆX 3 ˆ
其中 ˆ:ˆ2 n 1i n1 ( XiX)2
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
E(X1m)=E(X2m)==E(Xnm)= E(Xm)=am . 根据大数定律,样本原点矩Am作为 X1m,X2m, ,Xnm的算术平均值依概率收敛到均 值am=E(Xm).即:
n 1i n1Xim pE(Xm)am
例1 设总体X的概率密度为
f(x)(1)x,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a a a
f (u)
0.95
b
0.95
b
0.95
0b
我们总是希望置信区间尽可能短.
u
在概率密度为单峰且对称的情形,
u 当a=-b时求得的置信区间的长度为最短.
u a =-b
即使在概率密度不对称的情形,如 χ2分布,F分布, 习惯上仍取对称的分位点来计算未知参数的置信区间.
f (x)
X ~ 2 (n)
若我们能给出一个区间, 在此区间内我们合理地相信 N 的真值位于其中. 这样对鱼数的估计就有把握多了.
也就是说, 我们希望确定一个区间, 使我们能以比较高的可靠程度相信它包含真参数值.
湖中鱼数的真值
数理统计
[• ]
这里的“可靠程度”是用概率来度量的, 称为置信度或置信水平. 习惯上把置信水平记作 1- α, 这里 α是一个很小的正数.
使:P
X
n
u
2
1
从中解得:
P
X
n u 2
X
n
u
2
1
于是所求 μ的置信区间为:
X
n u 2 ,
X
n
u
2
也可简记为:
X
n
u
2
数理统计
2. 我们归纳出求置信区间的一般步骤如下:
数理统计
1) 明确问题, 是求什么参数的置信区间? 置信水平1-α是多少? 2) 寻找参数 θ的一个良好的点估计: f(X1,X2,…Xn); 3) 寻找一个待估参数θ和估计量 f的函数 G(f, θ), 且其分布为已知; 4) 对于给定的置信水平1-α, 根据G(f, θ)的分布, 确定常数a, b, 使:
数理统计
2 1
2 (n)
2 2 (n)
x
二、估计方法:
在求置信区间时, 要查表求分位点.
数理统计
1. 定义: 设 0<α<1 , 对随机变量X, 称满足:
P( X xα ) α P( X xα ) 1 α
的点 xα 为X的概率分布的上α分位点.
P(a X b) 1 α
c
P(X b) P(X a) 1 α
P(X b) 1 α 2 ,
F~ F(n1, n2)
P{F Fα (n1, n2 )} α
例1: 设 X1,…Xn是取自N(
解:选μ的点估计为 X,
寻找未知参数的
取:U X N (0,1) n
一个良好估计.
对给定的置信水平: 1-α, 查正态分布表得: uα/2,
第三节 区间估计
区间估计问题 估计方法
数理统计
一、区间估计(interval estimation)问题
数理统计
参数点估计是用样本算得的一个值去估计未知参数.
但是, 点估计值仅仅是未知参数的一个近似值,
它没有反映出这个近似值的误差范围, 使用起来把握不大.
区间估计正好弥补了点估计的这个缺陷 .
譬如, 在估计湖中鱼数的问题中, 若我们根据一个实际样本, 得到鱼数 N 的极大似然估计为1000条. 实际上, N的真值可能大于1000条, 也可能小于1000条.
置信水平的大小是根据实际需要选定的. 例如, 通常可取置信水平 1- α=0.95 或 0.9 等.
根据一个实际样本, 由给定的置信水平(degree of confidence), 我们求出一个尽可能小的区间 (θ, θ),—使:
—
P{θ < θ < θ}=1-α
—
称区间(θ, θ) 为 θ的置信水平为 1- α的置信区间(confidence interval).
P(a <G(f, θ)<b)=1-α; 5) 对“a<G(f, θ)<b” 作等价变形, 得到如下形式: θ< θ< θ,—
即: P{θ< θ< θ}=—1-α 于是(θ, θ)—就是 θ的100(1- α)%的置信区间.
可见, 关键的是寻找一个待估参数 θ和估计量 f 的函数 G(f, θ), 且 G(f, θ)的分布为已知, 不依赖于任何未知参数, 而这与总体分布有关,
P(X
a)
α 2
P( X b) 1 α 3 , P( X a) 2α 3
若 X为连续型随机变量, 则有:
a x1α 2 ,b xα 2
所求置信区间为: ( x1α 2 , xα 2 )
a x12α 3 ,b xα 3
所求置信区间为: ( x12α 3 , xα 3 )
数理统计
U
标准正态分布 的上α分位点 uα
U~N(0, 1)
P(U uα ) α
数理统计
自由度为n的χ2分布
的上α分位数
2
(n)
χ2~ χ2(n)
P( χ 2 χα2(n)) α
数理统计
T~t(n)
t分布的上α分位点 tα
T~t(n)
P{T tα (n)} α
数理统计
自由度为 n1, n2的F分布
的上α分位数 F (n1, n2 )
1.定义: 设 θ是 一个待估参数, 给定α>0,
数理统计
若由样本 X1, X2, … Xn确定的两个统计量:
θ=θ(X1, X2, … Xn)
——
—
θ=θ(X1, X2, … Xn) (θ<θ)
—
满足: P{θ< θ< θ}=1-α
—
则称区间 (θ, θ)是 θ的置信水平(置信度 )为1-α的置信区间.
θ和 θ分— 别称为置信下限和置信上限.
2. 这里有两个要求:
1) 要求 θ以很大的可能被包含在区间 (θ, θ)内—, 就是说, 概率 P{θ< θ <θ} 要— 尽可能大, 即要求估计尽量可靠.
2)
估计的精度要尽可能的高,
如要求区间长度
—
θ-
θ尽可能短,
或能体现该要求的其它准则.
可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下尽可能提高精度.
所以, 总体分布的形式是否已知, 是怎样的类型, 至关重要.
由: P(-1.75 ≤ U ≤ 2.33)=0.95
f (u)
数理统计
1.75
2.33 u
我们得到均值 μ的置信水平为1- α=0.95的置信区间为:
X 1.75 n , X 2.33 n 这个区间比前面一个要长一些.
类似地,我们可得到若干个不同的置信区间: