应用数理统计第二章参数估计(1)点估计
合集下载
数理统计: 参数估计方法
23
引例
设总体 X 服从参数为 的指数分布, 未知,
X1 , X 2 , , X n 是来自X的样本, x1 , x2 , , xn 是
相应的样本值,求 的矩估计量和矩估计值.
解 因为 E( X ) 所以 用样本矩替换总体矩, 得 的矩估计量
ˆ
1 n
n i 1
Xi
X
(
x)
1
e
x
,
x0
0,
其他.
但参数 未知。已知参数的取值范围,记为 。
给出样本的一组观察值,如何推断总体的分布?
【思路】给出 的估计,则得到对总体分布的推断。
【方法】根据一定的原则,从 中找到一个值(点) 作为的 估计。
点估计
2
点估计定义
设总体 X 的分布函数 F ( x; ) 的形式为已知,
的估计量.
4
二、估计量的评选标准 1. 无偏性
定义 若 X1, X 2 ,, X n 为总体 X 的一个样本,
是包含在总体 X 的分布中的待估参数, 若估计量ˆ ˆ( X1 , X 2 ,, X n )的数学期望 E(ˆ) 存在, 且对于任意 有
E(ˆ) 则称ˆ 是 的无偏估计量,否则称为有偏的.
(2) lim S 2 2 a.s. (强大数定律) n
即样本方差是总体方差2的强相合估计, 也是相合估计.
12
C. 样本标准差
其观察值:
S
S2
1 n1
n i 1
Xi
X
2
;
s
1 n1
n i 1
( xi
引例
设总体 X 服从参数为 的指数分布, 未知,
X1 , X 2 , , X n 是来自X的样本, x1 , x2 , , xn 是
相应的样本值,求 的矩估计量和矩估计值.
解 因为 E( X ) 所以 用样本矩替换总体矩, 得 的矩估计量
ˆ
1 n
n i 1
Xi
X
(
x)
1
e
x
,
x0
0,
其他.
但参数 未知。已知参数的取值范围,记为 。
给出样本的一组观察值,如何推断总体的分布?
【思路】给出 的估计,则得到对总体分布的推断。
【方法】根据一定的原则,从 中找到一个值(点) 作为的 估计。
点估计
2
点估计定义
设总体 X 的分布函数 F ( x; ) 的形式为已知,
的估计量.
4
二、估计量的评选标准 1. 无偏性
定义 若 X1, X 2 ,, X n 为总体 X 的一个样本,
是包含在总体 X 的分布中的待估参数, 若估计量ˆ ˆ( X1 , X 2 ,, X n )的数学期望 E(ˆ) 存在, 且对于任意 有
E(ˆ) 则称ˆ 是 的无偏估计量,否则称为有偏的.
(2) lim S 2 2 a.s. (强大数定律) n
即样本方差是总体方差2的强相合估计, 也是相合估计.
12
C. 样本标准差
其观察值:
S
S2
1 n1
n i 1
Xi
X
2
;
s
1 n1
n i 1
( xi
应用数理统计—参数估计
0
2
由矩法, 令
X 1 2
从中解得 ˆ 2X 1, 即为 的矩估计.
1 X
例2 设X1,X2,…,Xn是取自总体X的一个样本,
求总体均值 与方差 2的矩估计
解: 令
X
2
1 n
n
(Xi
i 1
X )2
得 与方差 2的矩估计为
ˆ X
ˆ 2
1 n
n i 1
(Xi
X )2
如果要估计的是标准差,则由
称其为基于样本(x1*,,xn*)的似然函数
这名称的意义,可根据上述分析得到理解:似
然函数对不同的(1,...,k)的取值,反映了在观察结 果(x1,...,xn)已知的条件下,(1,...,k)的各种值的“似
然程度”.
注意这里把:把观察值x1,...,xn看成结果而参数
值(1,...,k)看成是导致这结果的原因.现已有了结
固定样本观测值(x1,,xn),将上式作为1 ,,k的函
数,得到似然函数
n
L(1, ,k ; x1, , xn ) f (xi;1, ,k ) i 1
(2) 求似然函数L( ) 的最大值点(常常转化为求ln L( )的最大值点) ;
----- 的最大值点为 ln L( )的驻点, 不可导点, 边
数为P(X=x)=f(x; ) , x, { 可以是向量},
则 X 的 m 阶原点矩为
m xm f (x; ) x
X的 m 阶中心矩为
vm (x 1)m f (x; ) x
总体矩的计算方法
设总体X为连续型随机变量,其概率密
度为f(x; ) { 可以是向量},则X的m阶原点
矩为
m
xm f (x; )dx
点估计概述
(1) 无偏性 衡量统计量的好坏,有三条标准: (2) 有效性 (3) 相合性(一致性) 这里我们重点介绍前面两个标准 .
二、点估计的无偏性与有效性 ˆ ) , 1.无偏性 若 E (
ˆ是的无偏估计量 则称 . 定义的合理性 我们不可能要求每一次由样本得到的估计值与真值 都相等,但可以要求这些估计值的均值与真值相等.
例8 设总体 X 的均值 和方差 都存在, 且有
2
2 0, 但 和 2 均为未知, 又设 X 1 , X 2 ,, X n 是
一个样本, 求 和 2 的矩估计量. 解 1. EX ,EX 2 DX [ EX ]2 2 2 , X X 2.令 2 解得 2 2 2 2 2 X X ( X )
ab a b (a b) 2 2 , EX DX ( EX ) 解 1. EX 2 12 2 a b 2 X a b 2 X 2.令 即 2 2 2 2 (a b) a b X 2 b a 12 [ X ( X ) ] 12 2
49 1 9 1 )DX DX D( ˆ 2 ) ( 故 ˆ 3最有效. 72 9 16 144 7 1 1 1 27 DX ,D( ˆ 4 ) DX . D( ˆ 3 ) ( ) DX 18 4 9 36 50
1 无偏估计量 才可讨论有效性.
0
1 2 期望的点估计: X Xi n i 1 在无偏估计量中 X 最有效、 X也为相合估计量 .
2
2
解得 a X 3[ X 2 ( X )2 ] ,b X 3[ X 2 ( X )2 ]
参数估计-概率论重点内容
其中 为待估计的未知参数, 假定 x1 , x 2 , , x n 为样本 X 1 , X 2 , , X n的一组观察值 . PX 1 x1 , X 2 x 2, , X n xn P ( X 1 x1 ) P ( X 2 x 2 ) P ( X n x n ) p ( x1 , ) p ( x 2 , ) p ( x n , ) p ( xi , ).
的联合密度为 f (x f (x f (x 1,) f (x 2,) n,) i ,)
i 1
上一页
n
下一页
返回
将 f( x ) 看作是关 的 于 函 , 记 参 数 L 为 ( 数 ). i,
i 1
n
L ( ) f( x ) i,
i 1
1 1n 解 : 由 于 E ( X ), 记 T T i. n i 1
1 令 T,
ˆ 于 是 得 的 矩 估 计 值 t , 1 t t ˆ P T t e 矩 估 计 值 为 P T t . 的 e
上一页
下一页
返回
2、极(最)大似然估计 (1)似然函数 (a)离散型总体 设总体 X 为离散型总体 , PX x p ( x , ),
ˆ 则 称 是 的 一 致 估 计 量 .
上一页
下一页
返回
第三节 区间估计
1. 区间估计的概念 1(X1, X2, Xn)及 2(X1, X2, Xn) 定义5: 设
是两个统计量 ,如果对于给定的概率 1(0 1 ) 有 P1 2 1 则称随机区间 ( 1,2)为参数 的的置信区间, 1,2分别称为置信下限与置 信上限 .
数理统计——参数估计
ˆ θ j = θ j (a1,⋯, ak ),
其中
1 n xj aj = ∑ i n i=1
j = 1,⋯, k ,
第2章 参数估计
第22页 22页
例2.1.5 设总体服从指数分布,由于EX=1/λ, 即λ =1/ EX,故λ 的矩法估计为 另外,由于Var(X)=1/λ ,其反函数为 λ = 1/ Var( X ) 因此,从替换原理来看,λ的矩法估计也可取为 s 为样本标准差。这说明矩估计可能是不唯一的, 这是矩法估计的一个缺点,此时通常应该尽量采 用低阶矩给出未知参数的估计。
第2章 参数估计
2
第10页 10页
将 lnL(µ,σ ) 分别关于两个分量求偏导并令 其为0, 即得到似然方程组
∂ ln L(µ,σ 2 ) 1 n = 2 ∑ ( xi − µ ) = 0 ∂µ σ i =1 ∂ln L(µ,σ 2 ) 1 n n 2 = 4 ∑(xi − µ) − 2 = 0 2 ∂σ 2σ i=1 2σ
第2章 参数估计
第1页
第2章 参数估计
2.1 2.2 2.3 2.4 参数估计的几种方法 估计的评价标准 最小方差无偏估计 区间估计
第2章 参数估计
第2页
• 一般常用θ 表示参数,参数θ 所有可能取值
组成的集合称为参数空间,常用Θ表示。参 数估计问题就是根据样本对上述各种未知参 数作出估计。
• 参数估计的形式有两种:点估计与区间估计。
第2章 参数估计
第17页 17页
矩估计法
它是基于一种简单的“替换” 它是基于一种简单的“替换” 思想建立起来的一种估计方法 . 是英国统计学家K.皮尔逊最早提出的 是英国统计学家 皮尔逊最早提出的 . 其基本思想是用样本矩估计总体矩 .
应用统计方法第二章参数估计
2
1 1
2 x 1 1
2 2
2 dx
1 12
(
2
1 ) 2
令
X
S 2
1 2
(1
2
)
1 12
( 2
1)
解上述关于
1
,
2
的方程得
1 2
X X
3S 3S
8
.
Example 2.4 贝努利试验中,事件 A 发生的频率是该事件 发生概率的矩法估计。 Solution 此处,实际上我们视总体 X 为“唱票随机变量”, 即 X 服从两点分布:
此,必须采用求极值的办法,即对对数似然函数关于 i 求导, 再令之为 0,即得
ln L( ) i
(Xi
X )2
S2
记为ˆ 2 S 2 .第三步等号再一次用到习题 1.4.
7
.
Example 2.3 设 X 为[1, 2 ]上的均匀分布, X1, X 2 ,, X n
为样本,求1, 2 的矩估计。
Solution
a 1
2 xdx
1 2 1
2 2
12
2( 2 1 )
1 2
(
1
2)
2
.
Chapter 2 参数估计
(Parameter Estimation)
1
.
§2.1 点估计(Point Estimation) §2.2 估计量的评价准则 §2.3 区间估计(Interval Estimation)
2
.
§2.1 点估计(Point Estimation)
一、 矩估计法
若总体 X 的期望存在,E(X ) , X1, X 2 ,, X n 是出 自X 的样本,则由柯尔莫哥洛夫强大数定律,以
应用数理统计第二章
ˆ = ⎡ rs ⎤ . N ⎢ ⎥ ⎣x⎦
□
例2.1.11 总体 X ~ U (θ,θ +1) , θ 是未知参数, X1,…,Xn 是一组样本,求θ 的极大似然估计。 解. 总体的密度函数为: f(x,θ ) = 1, θ < x1,…,xn < θ +1 显然不能对参数 θ 求导,无法建立似然方程 注意到这个似然函数不是 0 就是 1 ,利用 顺序统计量,把似然函数改写成如下形式:
f(x,θ ) = 1, θ < x(1) <… < x(n) < θ +1 因此只要 θ < x(1) 并且 x(n) < θ +1 同时满足, 似然函数就可以达到极大值 1 。 所以 U (θ,θ +1) 中参数θ 的极大似然估计 可以是区间 ( x(n) - 1 ,x(1) ) 里的任意一个点 。 说明 MLE 可以不唯一,甚至有无穷多个 同理,总体 U (a,b) 左右端点 a 、b 的MLE 分别就是两个极值统计量 x(1) 、x(n) 。
k =1
n
注意这里总体参数 θ 是一个向量 (µ,σ2 ) , 因此对于似然函数取对数后分别对 µ,σ2 求导, 建立对数似然方程组:
1
σ
−
2
(x − µ) = 0 n + 1 2(σ 2 )2 ( xk − µ )2 = 0 ∑
k =1 n
2σ 2
解方程组得到正态总体两个参数的MLE
ˆ µ=X
1 n n−1 2 ˆ σ 2 = ∑ ( X k − X )2 = S n k =1 n
⎛ N ⎞ ∑ xk nN − ∑ xk L ( x ,θ ) = [ ∏ ⎜ ⎟ ] p (1 − p ) ⎝ xk ⎠
这里每一个 xk = 0、1、…、N 中的某个值
□
例2.1.11 总体 X ~ U (θ,θ +1) , θ 是未知参数, X1,…,Xn 是一组样本,求θ 的极大似然估计。 解. 总体的密度函数为: f(x,θ ) = 1, θ < x1,…,xn < θ +1 显然不能对参数 θ 求导,无法建立似然方程 注意到这个似然函数不是 0 就是 1 ,利用 顺序统计量,把似然函数改写成如下形式:
f(x,θ ) = 1, θ < x(1) <… < x(n) < θ +1 因此只要 θ < x(1) 并且 x(n) < θ +1 同时满足, 似然函数就可以达到极大值 1 。 所以 U (θ,θ +1) 中参数θ 的极大似然估计 可以是区间 ( x(n) - 1 ,x(1) ) 里的任意一个点 。 说明 MLE 可以不唯一,甚至有无穷多个 同理,总体 U (a,b) 左右端点 a 、b 的MLE 分别就是两个极值统计量 x(1) 、x(n) 。
k =1
n
注意这里总体参数 θ 是一个向量 (µ,σ2 ) , 因此对于似然函数取对数后分别对 µ,σ2 求导, 建立对数似然方程组:
1
σ
−
2
(x − µ) = 0 n + 1 2(σ 2 )2 ( xk − µ )2 = 0 ∑
k =1 n
2σ 2
解方程组得到正态总体两个参数的MLE
ˆ µ=X
1 n n−1 2 ˆ σ 2 = ∑ ( X k − X )2 = S n k =1 n
⎛ N ⎞ ∑ xk nN − ∑ xk L ( x ,θ ) = [ ∏ ⎜ ⎟ ] p (1 − p ) ⎝ xk ⎠
这里每一个 xk = 0、1、…、N 中的某个值
[教育]应用统计方法第二章参数估计
要正确理解区间估计的概念,学会求单个正态总体的均值和 方差的置信区间以及两个正态总体的均值差和方差比的置信 区间。了解贝叶斯估计法。
统计方法
统计方法
统计方法
统计方法 •2.3.3 Bayes估计
统计方法
统计方法
统计方法
•注:假如不用先验信息,只用样本和总体信息,那么事件A 发生的概率的最大似然估计为:
•例如:在产品抽检中,只区分合格品与不合格品,对质 量好的一批产品,抽检的产品常为合格品. • 但“抽检3个全为合格品” • “抽检的10个全为合格品”(更信得过)
本章中介绍了参数估计的基本方法。
参数的估计有点估计、贝叶斯估计和区间估计。矩估计法和 极大似然估计法是求参数的点估计量的两种最基本的方法, 务必牢固掌握。衡量估计量好坏的标准有无偏性,最小方差 无偏估计,有效性和相合性(一致性)等,要学会验证一个 估计量是符合哪种标准的估计量,这对了解估计量的特性是 非常重要的。
•(3)先验信息:抽样或试验之前有关统计问题的一些信息.一般说来,
•先验信息来自经验或历史资料.先验信息在日常生活和工作中是很 重要的
统计方法
•Bayes统计学:基于三种信息所进行的统计推断的统计学
•Bayes统计重视总体信息和样本信息的同时,还注意先验 信息的收集,挖掘和加工,使它数量化,形成先验分布,参加到 统计推断中来.以提高统计推断的质量,忽略先验信息的利 用,有时是一种浪费,有时还会导出不合理的结论. •Bayes学派的基本观点:任一未知参数都可以看成随机变量, 可用一个概率分布去描述,这个分布称为先验分布.在获得样 本之后,总体分布,样本,和先验分布通过Bayes公式结合起来 得到关于未知参数的新的分布…..后验分布
当样本符合或接近统计模型的假设时, 该估计应有好的或较好的估计效果;当 样本偏离偏离模型的假设时,即受到干 扰时,该估计量应具有一定的抗干扰能 力而不至于使估计效果变得太坏。
统计方法
统计方法
统计方法
统计方法 •2.3.3 Bayes估计
统计方法
统计方法
统计方法
•注:假如不用先验信息,只用样本和总体信息,那么事件A 发生的概率的最大似然估计为:
•例如:在产品抽检中,只区分合格品与不合格品,对质 量好的一批产品,抽检的产品常为合格品. • 但“抽检3个全为合格品” • “抽检的10个全为合格品”(更信得过)
本章中介绍了参数估计的基本方法。
参数的估计有点估计、贝叶斯估计和区间估计。矩估计法和 极大似然估计法是求参数的点估计量的两种最基本的方法, 务必牢固掌握。衡量估计量好坏的标准有无偏性,最小方差 无偏估计,有效性和相合性(一致性)等,要学会验证一个 估计量是符合哪种标准的估计量,这对了解估计量的特性是 非常重要的。
•(3)先验信息:抽样或试验之前有关统计问题的一些信息.一般说来,
•先验信息来自经验或历史资料.先验信息在日常生活和工作中是很 重要的
统计方法
•Bayes统计学:基于三种信息所进行的统计推断的统计学
•Bayes统计重视总体信息和样本信息的同时,还注意先验 信息的收集,挖掘和加工,使它数量化,形成先验分布,参加到 统计推断中来.以提高统计推断的质量,忽略先验信息的利 用,有时是一种浪费,有时还会导出不合理的结论. •Bayes学派的基本观点:任一未知参数都可以看成随机变量, 可用一个概率分布去描述,这个分布称为先验分布.在获得样 本之后,总体分布,样本,和先验分布通过Bayes公式结合起来 得到关于未知参数的新的分布…..后验分布
当样本符合或接近统计模型的假设时, 该估计应有好的或较好的估计效果;当 样本偏离偏离模型的假设时,即受到干 扰时,该估计量应具有一定的抗干扰能 力而不至于使估计效果变得太坏。
第二章点估计
(n1 ,2 ,..., ) ,满足关系式
ˆ ) limE ( n
ˆ 则称 n 是 的渐近无偏估计(量)。
一个估计量如果不是无偏估计量,就称 ˆ) 这个估计量是有偏的,且称 E( 为估 ˆ 的偏差。 计量
n
k 例1 设 总 体 的阶 k 矩 E (k 1 )存 在 , k
(这种方法称为无偏化).
n 2 n 2 2 E E ( ) . ˆ ˆ n 1 n 1
n 2 1 2 n 2 * (i ), ˆ S 因为 n n 1 i1 n 1
2 即 S 是 的无偏估计 , 故通常取 S作 的估计量 .
若 , , , 为 总 体 的 一 个 样 本 , 1 2 n
1、无偏估计
ˆ 定 义 6 .2 若 估 计 量 ( 1, , , 的 数 学 期 望 2 n) ˆ E ( ) 存 在 ,且 对 于 任 意 有 ˆ E ( ) , ˆ 无 则 称是的 偏 估 计 量 .
n , n1
1 n 故 有E , (n ) n
n 故 m a x (, , ,n ) 也 是 的 无 偏 估 计 量 . 12 n 1
例4
设总体 服从参数为 1/ 的指数分布 , 概率密 x 1 e , x 0, p ( x ; ) 度 其中参数 0, 又设 其它 0,
k .
故 有E ( )E ( ) ,i 1 , 2 , , n . k
n 1 k 即E ( k) E ( i ) n i 1
故 k 阶 样 本 矩 是 k 阶 总 体 矩 的 无 偏 估 计 . k
ˆ ) limE ( n
ˆ 则称 n 是 的渐近无偏估计(量)。
一个估计量如果不是无偏估计量,就称 ˆ) 这个估计量是有偏的,且称 E( 为估 ˆ 的偏差。 计量
n
k 例1 设 总 体 的阶 k 矩 E (k 1 )存 在 , k
(这种方法称为无偏化).
n 2 n 2 2 E E ( ) . ˆ ˆ n 1 n 1
n 2 1 2 n 2 * (i ), ˆ S 因为 n n 1 i1 n 1
2 即 S 是 的无偏估计 , 故通常取 S作 的估计量 .
若 , , , 为 总 体 的 一 个 样 本 , 1 2 n
1、无偏估计
ˆ 定 义 6 .2 若 估 计 量 ( 1, , , 的 数 学 期 望 2 n) ˆ E ( ) 存 在 ,且 对 于 任 意 有 ˆ E ( ) , ˆ 无 则 称是的 偏 估 计 量 .
n , n1
1 n 故 有E , (n ) n
n 故 m a x (, , ,n ) 也 是 的 无 偏 估 计 量 . 12 n 1
例4
设总体 服从参数为 1/ 的指数分布 , 概率密 x 1 e , x 0, p ( x ; ) 度 其中参数 0, 又设 其它 0,
k .
故 有E ( )E ( ) ,i 1 , 2 , , n . k
n 1 k 即E ( k) E ( i ) n i 1
故 k 阶 样 本 矩 是 k 阶 总 体 矩 的 无 偏 估 计 . k
参数估计——点估计
n
1 n 2 A2 X i n i 1 1 n 2 2 2 Xi n i 1
2
所以 X
பைடு நூலகம்
1 n 1 2 ( X i X )2 Xi X n i 1 n i 1
2
结论:不管总体X服从何种分布,总体期望和方差
的矩估计量分别为样本均值、样本二阶中心距,即
设总体的分布函数为F(x,)(未知),X1,X2,…,Xn
为样本,构造一个统计量 ( X1 , X 2 ,, X n ) 来估计 参数,则称 ( X1 , X 2 ,, X n ) 为参数的估计量。
点估计(point estimation) :如果构造一个统计量
1 n k 样本的 k 阶原点矩,记作 Ak X i n i 1 1 n 样本的 k 阶中心矩,记作 Bk ( X i X )k n i 1
参数的矩法估计
矩法估计:用样本的矩作为总体矩的估计量,即
1 n k Ak (1 , 2 ,, m ) X i n i 1
2
1 2
区间长度的矩估计量为 2 12A 12X 2 2 1 2
例3 对容量为n的子样,求下列密度函数中参数 a的
2 2 (a x), (0 x a) f ( x) a 0, 其它 a 2 a 解 由于 EX x (a x)dx 0 a 2 3 a 所以由矩法估计,得 X 3 3 n 解得 a 3 X X i n i 1 3 n 所以,参数 a 的矩估计量为 a X i n i 1
i 1
n
②若总体X为连续型随机变量
L( ) f ( x1 , x2 ,, xn , ) f ( xi , )
1 n 2 A2 X i n i 1 1 n 2 2 2 Xi n i 1
2
所以 X
பைடு நூலகம்
1 n 1 2 ( X i X )2 Xi X n i 1 n i 1
2
结论:不管总体X服从何种分布,总体期望和方差
的矩估计量分别为样本均值、样本二阶中心距,即
设总体的分布函数为F(x,)(未知),X1,X2,…,Xn
为样本,构造一个统计量 ( X1 , X 2 ,, X n ) 来估计 参数,则称 ( X1 , X 2 ,, X n ) 为参数的估计量。
点估计(point estimation) :如果构造一个统计量
1 n k 样本的 k 阶原点矩,记作 Ak X i n i 1 1 n 样本的 k 阶中心矩,记作 Bk ( X i X )k n i 1
参数的矩法估计
矩法估计:用样本的矩作为总体矩的估计量,即
1 n k Ak (1 , 2 ,, m ) X i n i 1
2
1 2
区间长度的矩估计量为 2 12A 12X 2 2 1 2
例3 对容量为n的子样,求下列密度函数中参数 a的
2 2 (a x), (0 x a) f ( x) a 0, 其它 a 2 a 解 由于 EX x (a x)dx 0 a 2 3 a 所以由矩法估计,得 X 3 3 n 解得 a 3 X X i n i 1 3 n 所以,参数 a 的矩估计量为 a X i n i 1
i 1
n
②若总体X为连续型随机变量
L( ) f ( x1 , x2 ,, xn , ) f ( xi , )
研究生应用数理统计参数估计(讲稿)
, X n )] ,则称$是的渐进
无偏估计量。
注:1 n n i1
Xi X
2不是D(X)的无偏估计量,但是
渐进无偏估计量。
例2.2.1 对任一总体,若E( X )=,D( X )= 2均存在
,且X1, X 2 ,L , X 2为X的样本,试证
(1)1 n
则称$1比$2有效。
注:方差越小越好。那么是否有下界?
例2.2.1 设对总体X : N (, 2 ),X1, X 2,L , X n
是来自总体X的样本,试证
(1)S12
1 n
n i 1
Xi
2 是 2的无偏估计量;
(2)S12是较S 2
1 n 1
n i 1
nI ( )
称为g( )的无偏估计的T的R C方差下界。
注1 对离散总体,将密度函数改为分布律即可;
注2 一般分布都满足正则条件;
注3 利用R-C不等式有时可以判断出一个无偏
估计是否是UMVUE,因为在满足定理条件下,如果
D(T ) g( )2 ,则T是g( )的UMVUE.但UMVUE的
n
试求p的极大似然估计量。
例2.1.5 设总体X的概率分布如下表,
X
012Fra bibliotek3P
2
2(1-) 2
1-2
0
1 2
是未知参数,利用总体X的如下观测值,
3,1,3,0,3,1,2,3
求的极大似然估计值。
例2.1.6 设总体X的分布函数为
F(x;
,
)=
1
第二章 参数估计
0
x 2de
x
2xe
x
dx
2
xde
x
0
x
0
0
2 e dx 2 2
0
9
例4:设X1, … , Xn为取自 N ( , 2 ) 总体的
样本,求参数 , 2 的矩估计。
: E( X ) D( X ) 2 E( X 2 ) [E( X )]2
极大似然法是由德国数学家G.F.Gauss在1821年提 出的.然而这个方法通常归于英国统计学家 R.A.Fisher,因为他在1912年里发现了这一方法,并 且首先研究了这种方法的性质.
设总体的密度函数为f(x,θ), θ为待估参数,θ∈Θ,Θ
为参数空间.当给定样本观察值 x (x1, x2 , xn )后,f(x,
以随便给的,所以根据统计思想建立各种点估计方法
和评价点估计的好坏标准便是估计问题的研究中心.
这里先介绍三个常用的标准:无偏性、有效性和一致
性.
1
有效性
^
^
设 i i ( X1,, X n ), i 1, 2分别是参数 的两个无偏估计,
^
^
^
^
若D 1 D 2 至少有一个n使 成立 , 则称 1比 2 有效.
总体k阶矩 样本k阶矩
k E(Xk )
Ak
1 n
n i 1
X
k i
的矩估计量是
约定:若
是未知参数的矩估计,则u()的矩
估计为u(
),
6
例2、:设X1, … , Xn为取自参数为的指数分布 总体的样本,求的矩估计。
应用统计学第二章参数估计
微,并且积分和微分可交换顺序,集合
ˆ {x | f (x;θ) > 0}与θ无 关时, 无偏估计量 θ 满足
ˆ D(θ) ≥ D (θ) 0
其中
1 D0 (θ ) = ∂ ln f ( X ,θ ) 2 nE( ) ∂θ
第二章 参数估计
第32页 32页
(三)一致性(相合性)
ˆ ˆ 定义 设θ 为未知参数, θ n = θ n ( X 1 ,L, X n ) 是θ 的一个估计量,n 是样本容量,若对任何一 个ε>0,有
θ
2
−
<0
ˆ 所以 θ 是极大值点。
第二章 参数估计
第18页 18页
例3 对正态总体N(µ,σ 2),θ=(µ,σ 2)是二维参数, 设有样本 x1, x2 , …, xn,则似然函数及其对数 分别为
L(µ,σ 2 ) = ∏
i =1 n
( xi − µ )2 1 exp − 2 2σ 2πσ
第二章 参数估计
第14页 14页
例1 设总体的分布密度为
(θα)x e , x >0 f (x) = 0, x ≤ 0
α −1 −θ xα
X1, X2 ,K, Xn 来自总体的样本
求参数 的极大似然估计
θ
第二章 参数估计
第15页 15页
解:
(1 L(θ ) = ∏(θα)xi )
例4 设 x1, x2 , …, xn 是来自均匀总体 U( ,θ ) θ1 2 的样本,试求 θ1,θ2的极大似然估计。
第二章 参数估计
第22页 22页
解:
ˆ θ1 = min(x1, x2 ,K, xn ) ˆ θ2 = max(x1, x2 ,K, xn )
ˆ {x | f (x;θ) > 0}与θ无 关时, 无偏估计量 θ 满足
ˆ D(θ) ≥ D (θ) 0
其中
1 D0 (θ ) = ∂ ln f ( X ,θ ) 2 nE( ) ∂θ
第二章 参数估计
第32页 32页
(三)一致性(相合性)
ˆ ˆ 定义 设θ 为未知参数, θ n = θ n ( X 1 ,L, X n ) 是θ 的一个估计量,n 是样本容量,若对任何一 个ε>0,有
θ
2
−
<0
ˆ 所以 θ 是极大值点。
第二章 参数估计
第18页 18页
例3 对正态总体N(µ,σ 2),θ=(µ,σ 2)是二维参数, 设有样本 x1, x2 , …, xn,则似然函数及其对数 分别为
L(µ,σ 2 ) = ∏
i =1 n
( xi − µ )2 1 exp − 2 2σ 2πσ
第二章 参数估计
第14页 14页
例1 设总体的分布密度为
(θα)x e , x >0 f (x) = 0, x ≤ 0
α −1 −θ xα
X1, X2 ,K, Xn 来自总体的样本
求参数 的极大似然估计
θ
第二章 参数估计
第15页 15页
解:
(1 L(θ ) = ∏(θα)xi )
例4 设 x1, x2 , …, xn 是来自均匀总体 U( ,θ ) θ1 2 的样本,试求 θ1,θ2的极大似然估计。
第二章 参数估计
第22页 22页
解:
ˆ θ1 = min(x1, x2 ,K, xn ) ˆ θ2 = max(x1, x2 ,K, xn )
第二章1-矩估计和极大似然估计
0
解法二
E
X
x
1
x
e dx
1
x
x e dx (2)
2
0
即 E|X|
1 n
用 n i1 X i
替换
EX
即得的另一矩估计量为
ˆ 1
n
n i 1
Xi
16
• 矩估计的优点 – 不依赖总体的分布,简便易行 – 只要n充分大,精确度也很高。
• 矩估计的缺点 – 矩估计的精度较差; – 要求总体的某个k阶矩存在; – 要求未知参数能写为总体的原点矩的函数形 式
得和2的估计值分别为13(mm)和 0.133(mm)2
12
例2 设总体X的概率密度为
f
( x;
)
x 1 ,
0,
0 x 1 其它
X1,X2,,Xn为来自于总体X的样本,x1,x2, ,xn 为样本值,求参数的矩估计。
解: 先求总体矩
1
1
E( X ) x x 1dx x dx
x 1 1
ˆ2 (x1, x2 ,, xn )
数值
ˆk (x1, x2 ,, xn )
称数ˆ1,ˆ2 ,,ˆk 为未知参数1,2 ,,k 的估计值 对应的统计量为未知参数1,2 ,,k 的估计量
问题 如何构造统计量?
6
二.点估计的方法
1、矩方法;(矩估计) 2、极大似然函数法(极大似然估计).
1. 矩方法
• 极大似然估计的缺点 要求必须知道总体的 分布函数形式
29
多参数情形的极大似然估计
若总体X的概率密度为:f (x;1,2 , ,k )
其中
1
,
2
,,
参数的点估计及区间估计
参数的点估计及区间估计1.点估计点估计是通过样本数据得出一个单一的数值作为参数的估计值。
常见的点估计方法有最大似然估计、矩估计等。
最大似然估计是通过寻找参数值,使得给定样本出现的可能性最大化,从而估计参数的值。
矩估计则是通过样本矩的估计值来估计参数的值。
点估计的优点是简单直观,计算方便,但它只给出了一个数值,无法反映参数估计的准确程度。
2.区间估计区间估计是通过样本数据得出一个区间,该区间内的值有一定概率包含着未知参数的真实值。
常见的区间估计方法有置信区间、预测区间等。
置信区间是通过样本数据得出一个区间,该区间内的值有一定程度的置信度来包含着未知参数的真实值。
预测区间是通过样本数据得出一个区间,该区间内的值有一定程度的置信度来包含着新的观测值。
区间估计的优点是可以反映参数估计的不确定性,给出了一个范围,但计算复杂,要求样本量较大。
对于点估计和区间估计,我们需要考虑一些概念和原则:1.无偏性:一个点估计量如果在大样本下的期望等于被估计参数的真实值,则称其为无偏估计量。
无偏估计量估计的是总体参数的中心值。
2.有效性:如果两个估计量都是无偏估计量,但一个估计量的方差较小,则称这个估计量为有效估计量。
3.一致性:一个估计量如果在样本量趋向于无穷大时,以概率1收敛于被估计参数的真实值,则称该估计量为一致估计量。
4.置信水平:置信区间是估计参数范围的一种方法,置信水平是指在重复抽样条件下,这个估计参数范围包含真实参数的概率。
总结起来,点估计提供了一个单一的参数估计值,简单直观,但没有反映参数估计的准确程度;区间估计提供了一个范围,可以反映参数估计的不确定性,但计算较复杂。
在实际应用中,可以根据问题的具体要求选择适当的估计方法,或者同时使用点估计和区间估计方法来对参数进行估计。
概率论与数理统计课件:参数估计
n
n
p( X xi; ) p(xi; ).
i 1
i 1
事实上,它们仅是参数 的函数,称为似然函数,记
为L( ) ,即 L( ) L(x1, x2,
或
n
, xn; ) f (xi; ), i 1
n
L( ) L( X x1, X x2, , X xn; ) p(xi; ). i 1
一个随机变量,其服从 0的泊松分布,即X ~ P(),
其中, 为未知参数. 已知在某小时进入该商场的人数的
样本值见表7.1,试求参数 的点估计值.
表7.1 在某小时进入某商场人数的统计情况
每分钟平均一秒钟进 入该商场的人数 0
1
2
3
4
5
6
7 8
分钟数
6 18 17 9 5 2 2 1 0
参数估计
解:因为X E( 1) ,所以 E( X ) .
由于仅有一个未知参数 ,故仅列一个方程
即可.
1( ) A1
因为1( ) E(X ) 和 A1 X ,所以ˆ X .
参数估计
首页 返回 退出
例7.1.3 设随机变量X在区间[a, b]中均匀取值,即 X U (a,b) ,其中,a 与 b均为未知参数,试求 a与 b的
i 1
i 1
参数估计
首页 返回 退出
(3) 似然函数 L( ) 与经自然对数变换后的函数 ln L( ) 等价,即求L( )的最大值点等价于求 ln L( )的最大值 点. 函数ln L( ) 对未知参数 求导数,并令其为0,即
d ln L( ) 0.
d
(4) 求解上述方程,得到参数 的最大似然估计值 ˆ(x1, x2 , , xn ),
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
又设 x1, x2 , …,xn为样本 X1, X2 , …,Xn的观察值,称
L( ) L( x1, x2 , xn ; ) p( xi ; ) ,
为样本的似然函数.
i 1
n
(2)如果总体X是连续型随机变量,其概率密度为f(x;),
样本的似然函数为:
L( ) L( x1, x 2 , x n ; )
,其中 事先给定。
ˆ ˆ } 1 P{ 1 2
3
2.1 点估计
设总体X的分布函数的形式为已知,为总体的待估计的参 数. X1, X2 ,..,Xn是X的一个样本,x1, x2, …,xn是相应的样本值. 点估计问题就是用样本X1, X2 , …,Xn构造一个适当的统 计量 (X1, X2 , …,Xn),用它的观察值 (x1, x2, …,xn)作为 未知参数 的近似值. 称 (X , X , …,X ) 为 的估计量.
2.1.1.矩法估计
样本矩是描述随机变量的最简单的数字特征,它在 一定程度上反映总体的特征.这种用样本(原点)矩作为 总体(原点)矩的估计量的方法称为矩估计法.
依据(原理): 柯尔莫哥洛夫强大数定理: 如果 E( X ) , X 1 , X 2 ,..., X n 为相互独立且与X 同分布,则 1 n X i , (a.s.) n i 1
1
认为 p=1/4 15
似然函数
(1)设总体X是离散型随机变量,其分布律P{X=x}=p(x;)的 形式为已知, 为待估参数, 是可能取值的范围。设 X1, X2 , …,Xn是来自X的样本,则 (X1, X2 , …,Xn )的联合分布 n 律为 p( x i , ) ,
i 1
1 2 称 (x1, x2, …,xn) 为的 估计值. n
在不致混淆的情况下,估计量和估计值统称估为估计,
并都简记为 .
参数 的估计量 是样本X1, X2 ,..,Xn的函数.
点估计常用方法: 矩估计法; 极大似然估计法.
4
通过总体的一个样本来估计总体未知参数的值 的问题称为参数的点估计问题。.
a1 , 由矩估计法,令 2 2 a2
ˆ A1 X 2 2 ˆ A2 A1
ˆ X, 2 1 n 2 2 ˆ ( X X ) s i n i 1
9
上述结果表明,总体均值与方差的矩估计量的表达式不 因不同的总体分布而不同.
2
S X ˆ ˆ 1 p ,N X X S2
11
【例2.5】 设总体的密度函数为
2 1 2 x exp( x ), x 0 (1 1 ) f ( x,1 , 2 ) 2 x0 0, 1 1 , 2 0
例2.1 (P30) 若是总体的原点矩,则相应的样本矩是其矩估计量。
8
例2.2 设总体X的均值E(X)=, 方差D(X)=2 都存在, 且2>0.但 ,2均为未知. X1, X2 , …,Xn为来自总体X的 样本, 求,2的矩估计量. 解 a E ( X ) 1 2 2 2 2 a E ( X ) D ( X ) [ E ( X )] 2
由矩估计法,得
ˆ A 3( A A 2 ) 1 2 1 1 ˆ A 3( A A 2 ) 1 2 1 2
ˆ X 3S, 1 ˆ X 3S 2
10
【例2.4】 贝努利试验
(1)若总体X~b(1, p), 则未知参数 p 的矩估计量为
例2.3 设总体X服从[θ1,θ2]上的均匀分布,θ1,θ2未知 ,X1, X2 , …,Xn为来自总体X的样本,试求θ1,θ2的矩估 计量. 解 a E ( X ) 1 2 , 1
2 2 2 ( ) ( ) a2 E ( X 2 ) D( X ) [ E ( X )]2 2 1 1 2 12 4
18
参数取这一数值时,观测结果出现的可能性为最大.
词义:最像什么就取什么。 原理(概率论):在一次试验中,已经发生(产 生),则其事件发生的概率应该很大! 小概率原理:小概率事件,在一次试验中(几乎) 不可能发生。如乘飞机旅行。
14
引例 设在罐中放有许多白球和黑球,已知两种球的数目之比 为1:3, 但不知哪种颜色的球多, 若采用有放回方式从罐中 取3个球, 发现有一只黑球,问在此情况下应估计哪种颜色的 球多?
6
若 E( X k ) ak(X的k阶矩存在),也有
a.e. 1 n k X i ak n i 1
亦即,当n较大时,样本原点矩与总体矩非常接 近。据此可得:
矩估计法:若总体X中含有m个参数
1 , 2 ,..., m
X的真实k阶矩 (k m) 存在,且为 ak , ak ak (1 ,2 ,...,m ), k 1,2,...,m为θ的函数。 显然,
回 顾
数理统计:由部分信息(带有随机性的数据) 推断出合理的结果——统计推断。
样本与总体
总体的分布——统计模型,统计建模的目的即 确定X的分布、参数等
参数与参数空间
直方图与经验分布函数
统计量及其分布 三种重要的抽样分布
1
参数估计与非参数估计
参数估计:先假定研究的问题具有某种数学模型, 如正态分布,二项分布,再用已知类别的学 习样本估计里面的参数。如:
5
注:随机序列的收敛定义
X n X , 是指
a.e.
P{lim X n , X} 1
n
(以概率1收敛,或几乎处处收敛a.s);
P X n X,
是指依概率P收敛;
n
0, lim P{| X n X | } 1
W 还有依分布F收敛 X n X , (弱收敛) 以概率1收敛一定依概率收敛,但反之不一定成 立。
1 2 n
ˆ( X , X , , X )为 的极大似然估计量. 称 1 2 n 如何求 L( )的最大值? 由于L( )与 lnL( )在上有相同的最大值点,所以 求L( ) 与 lnL( )的最大值点可以改为求 lnL( )的 最大值点. 当lnL( )关于 可微时,必满足方程:
罐中黑球数 解:设 p=黑球所占比例= 罐中全部球的数目
则 p=1/4或 p=3/4 又设X=“取出的3只球中黑球的数目” 则
X ~ b(3, p)
1 3 2 27 P{ X 1, p 1 / 4} C3 ( ) 4 4 64 9 1 3 1 2 P{ X 1, p 3 / 4} C3 ( ) 4 4 64
ln L( )d ln L( ) 0, ( i 1,2 ,..., k) -----对数似然方程 组 0 i d
17
例2.8 设总体X~N(,2),,2均未知,又设X1, X2,...,Xn 为总体X 的样本, x1, x2 ,…, xn为X的一组样本观测值, 试求,2 的极大似然估计值量. 1 ( x )2 2 exp 解 f ( x; , ) 2
似然函数为
2 ( x ) L( , 2 ) exp i 2 2 2 i 1 n 1 1 2 exp ( xi ) 2 n ( 2 ) 2 i 1 2
n
(1)方法基于n趋于无穷大时的情形; (2)只用到了总体的数字特征的信息,而分布形 式未用到(如例2.2),较粗糙。
13
2.1.2 极大似然估计法(MLE)
极大似然法的原理: 例如有一个事件,若知道它出 现的概率只能是0.01或0.99,而在一次观测中,此事件 出现,此时自然会说它的概率应为0.99,因此,极大似 然法是要选取这样的值来作为参数的估计值,使得当
7
k价样本矩
1 Ak n
i 1
n
X ik
ak E ( X k )
设总体X的分布函数为F(x; 1, 2, ...,m),其中 1, 2,... m为待估参数,如果 ak=E(X k) (k=1,2,..,m)存在, ak为 1, 2 , …, k的函数,记ak= ak( 1, 2 , …, k) (k=1,2,..,m), X1, X2 , …,Xn为总体X的样本,用Ak来估计E(X k),建立m个方程: 用 i 作为 i的估计量------矩估计量. A1= a1( 1, 2 , …, m) 1= 1(A1, A2 , …, A m) A2= a2( 1, 2 , …, m) 2= 2(A1, A2 , …, A m) ……………. ……………. Am= am( 1, 2 , …, m) m = m(A1, A2 , …, A m)
得不到解析解,求数值解。
【例2.6】 柯西分布,
f ( x, ) 1 , x 2 (1 ( x ) )
各阶矩不存在,不能用矩估计法。
12
评述:
点估计的矩法是由皮尔逊提出的,它直观、简 便,特别对总体期望合方差进行估计时不需要知 道总体的分布。但它要求总体原点矩存在,而有 些随机变量的原点矩不存在,就不能用此法进行 参数估计。此外,矩估计有时不唯一;再者它没 有利用总体分布函数所提供的信息,因此很难保 证它有优良的性质。
设 总体X 是 服从 参数 为 的指数分布,其中参数 未知, 0.
我们的任务是根据样本 ,来估计 的取值,从 而估计总体的分布.
非参数估计:不假定数学模型,直接用已知类别
的学习样本的先验知识直接估计数学模型。