第二章参数估计理论_2
数理统计: 参数估计方法
引例
设总体 X 服从参数为 的指数分布, 未知,
X1 , X 2 , , X n 是来自X的样本, x1 , x2 , , xn 是
相应的样本值,求 的矩估计量和矩估计值.
解 因为 E( X ) 所以 用样本矩替换总体矩, 得 的矩估计量
ˆ
1 n
n i 1
Xi
X
(
x)
1
e
x
,
x0
0,
其他.
但参数 未知。已知参数的取值范围,记为 。
给出样本的一组观察值,如何推断总体的分布?
【思路】给出 的估计,则得到对总体分布的推断。
【方法】根据一定的原则,从 中找到一个值(点) 作为的 估计。
点估计
2
点估计定义
设总体 X 的分布函数 F ( x; ) 的形式为已知,
的估计量.
4
二、估计量的评选标准 1. 无偏性
定义 若 X1, X 2 ,, X n 为总体 X 的一个样本,
是包含在总体 X 的分布中的待估参数, 若估计量ˆ ˆ( X1 , X 2 ,, X n )的数学期望 E(ˆ) 存在, 且对于任意 有
E(ˆ) 则称ˆ 是 的无偏估计量,否则称为有偏的.
(2) lim S 2 2 a.s. (强大数定律) n
即样本方差是总体方差2的强相合估计, 也是相合估计.
12
C. 样本标准差
其观察值:
S
S2
1 n1
n i 1
Xi
X
2
;
s
1 n1
n i 1
( xi
第二章多元正态分布的参数估计
就是剔除了 X2 Xk1, , X p 得(线性)影响之后,Xi和
Xj之间得协方差。
给定X2时Xi 和Xj得偏相关系数(partial correlation
coefficient)定义为: ij k1, , p
ij k1, , p
,
ii k1, , p jj k1, , p
其中 Σ11 2 ij k1, , p 。
μ12
μ1
Σ12
Σ
1 22
x2 μ2
Σ112
Σ11
Σ12
Σ
1 22
Σ
21
μ1·2和Σ11·2分别就是条件数学期望和条件协方差矩
阵,Σ11·2通常称为偏协方差矩阵。
这一性质表明,对于多元正态变量,其子向量得条件分布仍
就是(多元)正态得。
例5 设X~N3(μ, Σ),其中
1
16 4 2
μ
0 2
μ(1) μ(2)
11 Σ 21
31
12 22 32
13 23 33
Σ11
Σ
21
Σ12
22
则
X (1)
X1
X
2
~
N2 ( μ(1) ,
Σ11)
其中
μ (1)
1
2
Σ11
11 21
12
22
在此我们应该注意到,如果 X ( X1, X 2 , , X p ) 服从 p
aX
(0,1,
0)
X
2
X2
~
N (aμ, aΣa)
X3
1
aμ
(0,1,
0)
2
2
3
11 12 aΣa (0,1, 0) 21 22
第二章 多元正态分布及参数的估计
27
北大数学学院
第二章 多元正态分布及参数的估计
§2.2 多元正态分布的定义与基本性质—简单例子
y BxB
0 0 1
1 0 0
100 110
1 2 0
003 100
0 0 1
1 0 0
1 0 1
2 0 1
003 100
2
北大数学学院
第二章 多元正态分布及参数的估计
目录
§2.1 随机向量 §2.2 多元正态分布的定义与
基本性质
§2.3 条件分布和独立性 §2.4 随机矩阵的正态分布 §2.5 多元正态分布的参数估计
3
北大数学学院
第二章 多元正态分布及参数的估计
§2.1 随 机 向
本课程所讨论的是多变量总体.把 p个随机变量放在一起得
第二章 多元正态分布及参数的估计
§2.2 多元正态分布性质2的推论
例2.1.1
f (x1, x2
()X1,X212)的e联 12合( x12密 x22度) [1函数x为1 x2e
1 2
(
x12
x22
)
]
我们从后面将给出的正态随机向量的联合密
度函数的形式可知, (X1,X2)不是二元正态随机向 量.但通过计算边缘分布可得出:
本节有关随机向量的一些概念(联合分布, 边缘分布,条件分布,独立性;X的均值向量,X 的协差阵和相关阵,X与Y的协差阵)要求大家 自已复习.
三﹑ 均值向量和协方差阵的性质 (1) 设X,Y为随机向量,A,B为常数阵,则
E(AX)=A·E(X) E(AXB)=A·E(X)·B
6
第二章参数估计
第二章 参数估计【学习目标】1、掌握矩估计的替代原则;会求已知分布中未知参数的矩估计(值)2、熟练掌握极大似然估计的思想及求法3、估计量的评价标准:无偏性、有效性、相合性的定义4、统计量的无偏性的判断;两个无偏估计的有效性判断;会用Fisher 信息量及c-R 下界进行统计量的UMVUE 充分性判断5、掌握区间估计的定义6、单个正态总体均值的区间估计(包括方差已知、方差未知);单个正态总体方差的区间估计(包括均值已知、均值未知)7、两个正态总体均值差的区间估计(方差未知);两个正态总体方差比的区间估计 8、单侧置信区间的求法 【典型例题讲解】例1、设1,,n X X 是来自均匀分布(,1)U θθ+的总体的容量为n 的样本,其中θ-∞<<+∞为未知参数,试证:θ的极大似然估计量不止一个,例如1(1)ˆXθ=,2()ˆ1n X θ=-,3(1)()11ˆ()22n XXθ=+-都是θ的极大似然估计。
解:(,1)U θθ+分布的密度函数为11()0x f x θθ≤≤+⎧=⎨⎩其他似然函数(1)()11()0n x x L θθθ≤≤≤+⎧=⎨⎩其他由于在(1)()1n x x θθ≤≤≤+上()L θ为常数,所以凡是满足:(1)()ˆˆ1n x x θθ≤≤≤+的ˆθ均为θ的极大似然估计。
从而(1)1(1)ˆX θ=满足此条件,故1(1)ˆX θ=是θ的极大似然估计;(2)由于()(1)1n X X -≤,故2()(1)()2ˆˆ11n n X X X θθ=-≤≤=+,所以2()ˆ1n Xθ=-为θ的极大似然估计;(3)由于()(1)1n X X -≤,故(1)()(1)12n X X X +-≤,(1)()()12n n X X X ++≥,从而有3(1)()(1)()(1)()31111ˆˆ()()12222n n n XXXXXXθθ=+-≤≤≤++=+,故3ˆθ也为θ的极大似然估计。
应用数理统计第二章
□
例2.1.11 总体 X ~ U (θ,θ +1) , θ 是未知参数, X1,…,Xn 是一组样本,求θ 的极大似然估计。 解. 总体的密度函数为: f(x,θ ) = 1, θ < x1,…,xn < θ +1 显然不能对参数 θ 求导,无法建立似然方程 注意到这个似然函数不是 0 就是 1 ,利用 顺序统计量,把似然函数改写成如下形式:
f(x,θ ) = 1, θ < x(1) <… < x(n) < θ +1 因此只要 θ < x(1) 并且 x(n) < θ +1 同时满足, 似然函数就可以达到极大值 1 。 所以 U (θ,θ +1) 中参数θ 的极大似然估计 可以是区间 ( x(n) - 1 ,x(1) ) 里的任意一个点 。 说明 MLE 可以不唯一,甚至有无穷多个 同理,总体 U (a,b) 左右端点 a 、b 的MLE 分别就是两个极值统计量 x(1) 、x(n) 。
k =1
n
注意这里总体参数 θ 是一个向量 (µ,σ2 ) , 因此对于似然函数取对数后分别对 µ,σ2 求导, 建立对数似然方程组:
1
σ
−
2
(x − µ) = 0 n + 1 2(σ 2 )2 ( xk − µ )2 = 0 ∑
k =1 n
2σ 2
解方程组得到正态总体两个参数的MLE
ˆ µ=X
1 n n−1 2 ˆ σ 2 = ∑ ( X k − X )2 = S n k =1 n
⎛ N ⎞ ∑ xk nN − ∑ xk L ( x ,θ ) = [ ∏ ⎜ ⎟ ] p (1 − p ) ⎝ xk ⎠
这里每一个 xk = 0、1、…、N 中的某个值
2多元正态分布及参数估计
定X (2) X ,, X f x (2) 0 r 1 p 2
的条件下,
f x | x
(1)
(2)
f 2 x (2)
12
f x
4、独立性
设 X 1 , X 2 , , X p 是 p 个随机变量, Xi的分布函数记为 Fi(xi)
(i=1,2,…,p); F ( x1 , x2 ,, x p ) 是 ( X 1 , X 2 ,, X p ) ' 的联合分布
C OV X , Y X D X D D Y Y C OV Y , X
21
第二章 多元正态分布及参数的估计
§2.1 随 机 向 量
三﹑ 协方差阵的性质 (1) 设X,Y为随机向量(矩阵) D(AX+b)=A· D(X)· A' COV(AX,BY)=A· COV(X,Y)· B'
17
2、协方差矩阵
协方差定义为
Cov X , Y E ( X E ( X ))(Y E (Y ))
ห้องสมุดไป่ตู้
若Cov(X,Y)=0,则称X和Y不相关。 两个独立的随机变量必然不相关,但两个不相关的 随机变量未必独立。 当X=Y时,协方差即为方差,也就是
Cov X , X Var X D ( X ) 和Y Y ,Y ,,Y X X 1 , X 2 ,, X p 1 2 q 的协方差矩
19
X和Y的协方差矩阵与Y和X的协差阵互为转置关系,即有 若COV(X,Y)=0,则称X和Y不相关。 两个独立的随机向量必然不相关,但两个不相关的随机向量未必独 立。 X=Y时的协差阵COV(X,X)称为X的协差阵,记作D(X),即
第二章 参数估计
0
x 2de
x
2xe
x
dx
2
xde
x
0
x
0
0
2 e dx 2 2
0
9
例4:设X1, … , Xn为取自 N ( , 2 ) 总体的
样本,求参数 , 2 的矩估计。
: E( X ) D( X ) 2 E( X 2 ) [E( X )]2
极大似然法是由德国数学家G.F.Gauss在1821年提 出的.然而这个方法通常归于英国统计学家 R.A.Fisher,因为他在1912年里发现了这一方法,并 且首先研究了这种方法的性质.
设总体的密度函数为f(x,θ), θ为待估参数,θ∈Θ,Θ
为参数空间.当给定样本观察值 x (x1, x2 , xn )后,f(x,
以随便给的,所以根据统计思想建立各种点估计方法
和评价点估计的好坏标准便是估计问题的研究中心.
这里先介绍三个常用的标准:无偏性、有效性和一致
性.
1
有效性
^
^
设 i i ( X1,, X n ), i 1, 2分别是参数 的两个无偏估计,
^
^
^
^
若D 1 D 2 至少有一个n使 成立 , 则称 1比 2 有效.
总体k阶矩 样本k阶矩
k E(Xk )
Ak
1 n
n i 1
X
k i
的矩估计量是
约定:若
是未知参数的矩估计,则u()的矩
估计为u(
),
6
例2、:设X1, … , Xn为取自参数为的指数分布 总体的样本,求的矩估计。
参数估计2
n
e n
i
x !
i 1 n i 1
ii ) ln L( x1 , x 2 ,..., x n ; ) xi ln n ln xi !
i 1
xi ln L( x1 , x2 ,...,xn ; ) i 1 n 0 iii)令 : 1 n iv)解之得 : xi x为 的极大似然估计值 , n i 1 1 n X i X 为 的极大似然估计量 . n i 1
(1)正态分布N (u, 2 ) (2)指数分布Z ( ) (3)均匀分布U (a, b) (4)二项分布B(n, p) (3)泊松分布 ( ) 试求其中未知参数的矩 估计. 解 : (1)
因为X ~ N ( , 2 ), E ( X ) , D( X ) 2 故有 X ,
注2
若 为 的矩估计量, g ( )为 的连续函数, 亦称g ( )为g ( )
2 2 例如S n 为总体方差D( X )的矩估计量, 则S n S n 为标准差 D( X )
的矩估计量. 的矩估计量.
例1.1
设X 1 , X 2 ,..., X n为来自正态总体 X 的样本, X的分布为
i 1 n n
( X为连续型)
(1.4) (1.5)
或
L( x1 , x2 ,..., xn ) PX i xi ;
i 1
( X为离散型)
达到最大值
L( x1 , x2 ,..., xn ; ) max L( x1 , x2 ,..., xn ; )
(1) 利用求导法求极大然估 计步骤 i )建立似然函数: L( x1 , x 2 ,..., x n ; 1 , 2 ,..., r ) f ( xi ; 1 , 2 ,..., r )
第二章 参数估计2-3 区间估计
I=0.814
上页 下页 返回
钢厂铁水含碳量X 例3. 钢厂铁水含碳量 ~ N(µ,0.1082), 现在随机测定 该厂9炉铁水得 炉铁水得X=4.484,求在置信度为 求在置信度为0.95 的条件 该厂 炉铁水得 求在置信度为 下铁水平均含碳量的置信区间。 下铁水平均含碳量的置信区间。 解
置信区间为
上页
下页
返回
联合方差
上页
下页
返回
1、 µ1 - µ2的1-α置信区间 、 α (1)、 σ12 、σ22已知 、
由于 X −Y ~ N(µ1 − µ2 ,
选取
2 2 σ1 σ2
n1
+
n2
)
因此置信度为1-α 因此置信度为 α的µ1 - µ2置信区间可为
上页
下页
返回
(2)、σ12 、σ22未知,且n1,n2较大 如大于 、 未知, 较大(如大于 如大于50)
=27.5, ,
=6.26, ,
上页
下页
返回
测量一批铅锭的比重,设铅锭的比重X 例6. 测量一批铅锭的比重,设铅锭的比重 ~ N(µ, 现进行16次检测得铅锭的比重有 σ2),现进行 次检测得铅锭的比重有 现进行 次检测得铅锭的比重有X=2.705, , S2=0.0292,试求总体 的均值µ和方差 σ2置信度为 求总体X的均值 0.95 的置信区间。 的置信区间。 解 (1)求µ的置信区间 σ2未知 n=16,α=0.05. 求 的置信区间, 未知, α 选取 查表得 置信区间为
(二)、总体X数学期望 (二)、总体X数学期望µ未知 数学期望µ 样本X 的无偏估计. 样本 1,X2, • • • , Xn, 且S2是σ2的无偏估计
选取样本函数
二章节参数估计-精选
n1
E[C (Xi1Xi)2]
i1 n 1
C{D (X i 1X i) [E (X i 1X i)]2}
i 1
n1
C 2D(X) C 2 (n 1 )D (X )
i 1
n1
依题意,要求: E[C (Xi1Xi)2]D(X)
i1
D ( X i 1 即 X i C ) 2 D ( n ( X i 1 ) 1 D ) ( X D ) ( X D i ) ( X 2 ) D ( X )
点估计问题就一 是个 要适 构当 造的统计
ˆ(X1,X2,,Xn),用它的观ˆ(察 x1,x值 2,,xn) 来估计未知 . 参数
ˆ(X 1,X 2,,X n)称的 为估 .通计 称估量 计, ˆ(x1,x2,,xn)称为 的估 . 计 简记值 为ˆ.
例2 在某纺织厂细纱断机头上次的 X数 是一个
无偏估计的实际意义: 无系统误差.
若 l i m E ) , 则 称 ) 是 的 渐 近 无 偏 估 计 . n
例3 设总体X的X1, X2,L , Xn是X的一个样本,试证明不论
总体服从什么分布, k阶样本矩Ak
1 n ni1
Xik
是
k阶总体矩k的无偏估计.
E D ( (X X i )1 0X i ) E C( X 2i (1 n1) 1E ).( (X ii ) 1 ,2 0 , ,n )
注 一般地,一个参数 的无偏估计量不唯一.
如:设样本(X1, X2 , ···, Xn ) 来自总体X,E(X)=,
则X是 的无偏 . 此 估外 计,
随机变,假 量设它服从以 0为参数的泊松 , 分 参数 为未,知 现检查1了 5只 0 纱锭在某一时间 内断头的,次 数数 据如,试 下估计参 .数
《应用数理统计》吴翊李永乐第二章 参数估计课后习题参考答案
第二章 参数估计课后习题参考答案2.1 设总体X 服从二项分布()n X X X p p N B ,,,,11,,21 <<为其子样,求N 及p 的矩法估计。
解:()()()p Np X D Np X E -==1,令()⎪⎩⎪⎨⎧-==p Np S Np X 12解上述关于N 、p 的方程得:2.2 对容量为n 的子样,对密度函数22(),0(;)0,0x x f x x x ααααα⎧-⎪=⎨⎪≤≥⎩其中参数α的矩法估计。
解:122()()a E x xx dx ααα==-⎰22022()x x dx ααα=-⎰2321221333ααααααα=-=-= 所以 133a x α∧== 其中121,21(),,,n n x x x x x x x n=+++为n 个样本的观察值。
2.3 使用一测量仪器对同一值进行了12次独立测量,其结果为(单位:mm) 232.50,232.48,232.15,232.52,232.53,232.30 232.48,232.05,232.45,232.60,232.47,232.30 试用矩法估计测量的真值和方差(设仪器无系统差)。
⎪⎪⎩⎪⎪⎨⎧-=-==X S p S X X p X N 2221ˆˆˆ解:()()()∑∑====-====ni i ni i S X X n X D X X n X E 12210255.014025.23212.4 设子样1.3,0.6,1.7,2.2,0.3,1.1是来自具有密度函数()10,1,<<=βββx f 的总体,试用矩法估计总体均值、总体方差及参数β。
解:()()()()4.22ˆ2,1,407.012.1101221========-===⎰⎰∑∑==X Xdx xdx x xf X E x f XX n S X n X ni i ni i ββββββββ参数:总体方差:总体均值:2.5 设n X X X ,,,21 为()1N ,μ的一个字样,求参数μ的MLE ;又若总体为()21N σ,的MLE 。
第二章多元正态分布的参数估计
第二章多元正态分布的参数估计多元正态分布是在多个随机变量之间存在相互依赖关系时使用的一种概率分布。
它在许多统计分析和机器学习领域中都有广泛的应用。
在实际应用中,我们通常需要使用样本数据对多元正态分布的参数进行估计。
多元正态分布由均值向量和协方差矩阵两个参数来描述。
均值向量表示各个随机变量的平均值,而协方差矩阵表示各个随机变量之间的协方差。
参数估计的目标就是通过样本数据来估计这两个参数。
首先,我们需要收集一个具有充分样本量的数据集。
对于一个具有n个样本的多元正态分布,我们可以将样本数据表示为一个n行d列的矩阵X,其中每一行是一个d维的样本向量。
其中n表示样本数量,d表示随机变量的个数。
接下来,我们可以根据样本数据来估计多元正态分布的均值向量和协方差矩阵。
1.均值向量的估计:多元正态分布的均值向量可以通过样本均值向量来估计。
样本均值向量的计算公式如下:μ = (1/n) * Σxi其中μ是估计得到的均值向量,xi表示样本矩阵X的第i行。
2.协方差矩阵的估计:多元正态分布的协方差矩阵可以通过样本协方差矩阵来估计。
Σ=(1/(n-1))*(X-μ)'*(X-μ)其中Σ是估计得到的协方差矩阵,X是样本矩阵,μ是估计得到的均值向量。
需要注意的是,在计算协方差矩阵时,我们使用的是样本协方差矩阵而不是总体协方差矩阵。
这是因为样本协方差矩阵能更好地反映样本数据的真实情况。
以上就是多元正态分布的参数估计方法。
通过样本数据,我们可以使用样本均值向量和样本协方差矩阵来估计多元正态分布的参数。
这些参数估计能为我们提供关于多元正态分布的统计属性和特征,进而用于进一步的分析和应用。
应用数理统计(武汉理工大)2-参数估计
1
D(S 2 )nI (
2)
n 1 n
1,
n
故S 2是渐进有效的。
第二章 参数估计
例: 设总体X (), X1, X 2 , , X n是X的一个样本, 讨论的无偏估计X的有效性。
解:lnp( X
,)
ln
X e
X!
X
ln
ln( X
!)
区间估计的关键: 用合适的方法确定两个统计量
1(X1, X2 , , Xn), 2(X1, X2 , , Xn)
第二章 参数估计
1.区间估计的定义及计算步骤
3) 区间估计的例子
例1 设总体X~N(μ , σ2), σ2已知,μ未知,设X1,…,Xn是X的样本, 求μ的置信度为1-α的置信区间。
)
2
n
,
D(ˆ2 )
D(nZ )
n2D(Z )
n2
n
2
2
当n 1时,显然D(ˆ1) D(ˆ2 ),故ˆ1比ˆ2有效。
第二章 参数估计
最小方差无偏估计问题 设 若 及T对 任(g意X(1, , X)的2都,任有一 , XD无n()T是 偏) g估(D计()T的量')一, T '个 ( X无1, X偏2估 , 计, X量n ), 则 无称 偏T估(计X1,, X或2 ,者,称X为n )是最g优(无)的偏一估致计最。小方差
其它类型的估计,如 贝叶斯估计…
第二章 参数估计
2.1参数的点估计
1. 矩估计 2. 极大似然估计 3. 点估计量的评价
第二章 参数估计
ˆ = q ( X , K , X ) , q k k 1 n
k = 1, 2, L , m
(2.2)
ˆ 为 q 的矩估计, g ( x 若 q ) 为连续函数,则也称 g (qˆ k k k ) 为 g (q k ) 的矩估计.
【例 2.1】 设总体 X 服从参数为 l 的泊松分布,X 1 , K , X n 为来自总体的样本, 求l 的 矩估计. 解: a1 = EX = l
i =1
定义 2.1:设总体 X 的概率函数为 f ( x;q ) , x1 ,L , x n 是来自总体的样本,则称
n
L(q ) = Õ f ( xi ;q )
i =1
(2.4)
为总体 X 对应样本 x1 ,L , x n 的似然函数.
L(q ) 越大,越有利于样本 x1 ,K , x n 被观察到.
-l ì l x e ï f ( x 0,1, 2, L 其它
或简写为
f ( x) =
-l l x e
x !
x = 0,1, 2, L
§2.1 点估计
我们经常会遇到这样的问题: 总体 X 的分布函数 F ( x,q ) 的形式已知, 但其中的参数q 未知, 希望利用 X 的样本 x1 ,K , x 这类问题称为参数的点估计 (point n 对 q 的值进行估计, estimation)问题. 比如,已知某种电子元件的寿命 X ~ N ( m , s ) ,即 X 的分布密度
P( X = xi ) = p( xi ,q ), i = 1, 2,L ,
其中q 为未知参数,q Î Q . 设 X 1 , K , X n 是来自总体 X 的一组样本, 观察值为 x1 ,K , x n .我们把观察到的样本看成 结果,而需要判断的是未知参数q 的取值,根据最大似然原理,应该选取一个最有利于结 果的发生的q 值作为 qˆ .
应用数理统计吴翊李永乐第二章-参数估计课后习题参考答案
《应用数理统计》吴翊李永乐第二章-参数估计课后习题参考答案(总19页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--第二章 参数估计课后习题参考答案设总体X 服从二项分布()n X X X p p N B ,,,,11,,21 <<为其子样,求N 及p 的矩法估计。
解:()()()p Np X D Np X E -==1,令()⎪⎩⎪⎨⎧-==p Np S Np X 12 解上述关于N 、p 的方程得:对容量为n 的子样,对密度函数22(),0(;)0,0x x f x x x ααααα⎧-⎪=⎨⎪≤≥⎩其中参数α的矩法估计。
解:122()()a E x xx dx ααα==-⎰2222()x x dx ααα=-⎰2321221333ααααααα=-=-= 所以 133a x α∧== 其中121,21(),,,n n x x x x x x x n=+++为n 个样本的观察值。
使用一测量仪器对同一值进行了12次独立测量,其结果为(单位:mm) ,,,,,⎪⎪⎩⎪⎪⎨⎧-=-==X S p S X X p X N 2221ˆˆˆ,,,,,试用矩法估计测量的真值和方差(设仪器无系统差)。
解:()()()∑∑====-====ni ini i S XX nX D X X n X E 12210255.014025.2321设子样,,,,,是来自具有密度函数()10,1,<<=βββx f 的总体,试用矩法估计总体均值、总体方差及参数β。
解:()()()()4.22ˆ2,1,407.012.1101221========-===⎰⎰∑∑==X Xdx xdx x xf X E x f XX n S X n X ni i ni i ββββββββ参数:总体方差:总体均值:设n X X X ,,,21 为()1N ,μ的一个字样,求参数μ的MLE ;又若总体为()21N σ,的MLE 。
二参数估计PPT课件
N
(xi ) 0
i 1
L
2
N
2 2
1
2 4
N
(xi )2
i 1
0
解以上二方程,可得
ML
1 N
N
xi
i 1
_
x
ML
1 N
N
_
(xi x)2
i 1
与样本均值和方差的无偏估计比较,可知均值的估计是
无偏的,方差的估计是渐进无偏的。
J ( )
E
ln
f
(x
|
)
2
Fisher信息值越大,意味着相邻估计子的区分度越高。
Cramer-Rao不等式:令x=(x1,…,xN)为样本向量。若参
数
f (x | ) 2 f (x | )
估计 是真实参数 的无偏估计,且
2
2
(2
2
)
N
/
2
exp
(
1
2
2
N i 1
( xi
)2
)
从而有
L( ) ln[ f (x1,..., xN | , )]
N 2
ln(2 )
N 2
ln(
2
)
1
2
2
N
( xi
i 1
)2
分别求偏导,可得
L
1
2
2.1 估计子的性能
2.1.1 无偏估计与渐进无偏估计
参数估计:由N个样本数据推出p个参数的值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⎡ 1 p ( x A) p A ( A) = exp ⎢ − 2 2 (2πσ w )N / 2 ⎣ 2σ w 1
⎤ ⎡ ( A − μ A )2 ⎤ 1 exp ⎢ − ∑ [ x(n) − A] ⎥ ⋅ ⎥ 2 2 2σ A ⎦ n =0 ⎣ ⎦ 2πσ A
N −1 2
上式两边取对数,并对A求导使导数等于零得: ˆ AMAP
——最大后验概率(MAP)估计与MLE的关系
∂ ln p (θ ) = 0 ∂θ
⇒ ∂ ⎡ ln p ( x θ ) ⎤ = 0 ⎦ ∂θ ⎣ 似然函数
ˆ ⇒ θ = arg max p (θ x )
θ
∂ ⇒ ∂θ ∂ ⇒ ∂θ ∂ ⇒ ∂θ
当 θ 服从均匀分布,采用 均匀损失函数的Bayes估计 ln p (θ x ) = 0 (MAP)与最大似然估计 (MLE)等价! ⎡ln p ( x θ ) + ln p(θ ) − ln p ( x ) ⎤ = 0 ⎣ ⎦ 当 θ 服从均匀分布
⎬ ˆ −θ > δ ⎪ θ ⎭
ˆ θ −θ < δ ⎫ ⎪
ˆ Cunif ( θ , θ ) p ( x ,θ )dxdθ ∫ p(θ x ) = p ( x θ ) p(θ ) = p( x ) p ( x θ ) p (θ )
ˆ ⇒ θ = arg max p (θ x )
θ
ˆ ⇒ θ = arg max p ( x θ ) p(θ )
Bayes 估计(6)
1 ⎡ 1 N −1 2⎤ 1 − A2 / 2 exp ⎢ − ∑ [ x(n) − A] ⎥ e N /2 (2π ) ⎣ 2 n=0 ⎦ 2π p( A x ) = 1 ⎡ 1 N −1 2⎤ 1 − A2 / 2 ∫(2π )N / 2 exp ⎢ − 2 ∑ [ x(n) − A] ⎥ 2π e dA n=0 ⎣ ⎦
Bayes 估计(2)
因此,在Bayes估计中,假设所要估计的参数θ 是一个随机变量, Bayes估计的是该随机参数的一次实现的值。 ˆ 那么估计的均方误差mse(θ )定义为: ˆ ˆ mse(θ )=∫∫ (θ − θ ) 2 p ( x ,θ )dxdθ ˆ ∂mse(θ ) ∂ ˆ = ∫∫ (θ − θ ) 2 p ( x ,θ )dxdθ ⇒ ˆ ˆ ∂θ ∂θ 令其等于零 ∂ ˆ (θ − θ ) 2 p ( x ,θ )dxdθ=0 ˆ ∫∫ ∂θ ˆ ⇒ θ=g ( x ) 可以实现。 ⇒
2 2 σA σA 1 N −1 = 2 ∑ x ( n) + σ 2 + σ 2 / N μ A 2 σ A + σ w / N N n =0 A w
Bayes 估计(11)
最大后验概率估计 ˆ arg min Runif = E{Cunif ( θ ,θ )}
θˆ
p (θ x ) p( x ) = p( x θ ) p(θ )
当N趋于无穷时,估计子均方误差mse趋于零,相当于要求其 偏差和方差均趋于零,这时称该估计子为一致估计。 最小方差无偏估计器(MVU):对于确定性参数的估计,最理 想的情况是设计一个无偏估计器,使其估计方差最小,称MVU。
确定性参数与随机参数估计
确 定 性 参 数 的估计: ( x ; θ ) p 其中: θ 是一个确定性(非随机变量)但未知需要估计的参数 p ( x ; θ ) 是一个与 θ 有关的观测向量 x的概率密度函数 ( PDF ) 随机 参数的估计: ( x , θ ) p 其中: θ 是一个随机变量,且未知需要估计的参数 p ( x , θ ) 是一个与 θ 有关的观测向量 x和参数 θ 的 联 合 PDF p ( x , θ )= p ( x θ ) p (θ ) = p (θ x ) p ( x ) p ( x θ )是 θ 取 值 情 况 下 x的 条 件 PDF p (θ x )是 x取值情况下 θ 的条件 PDF 先验概率 后验概率
∫
Bayes 估计(4)
ˆ θ = ∫ θ p(θ x )dθ = E{θ x} 说明最小均方误差准则下的Bayes估计为:已知一个 观测向量x条件下的参数θ的条件期望值(条件均值)。后验均值
通常情况下,后验概率p(θ x ) 不容易获得,因此常用下式
p (θ x ) = p ( x θ ) p (θ ) p( x ) = p ( x θ ) p (θ )
∫ p( x
A) p A ( A) dA
1 ⎡ 1 N −1 2⎤ 1 − A2 / 2 exp ⎢ − ∑ [ x ( n ) − A] ⎥ e N /2 (2π ) ⎣ 2 n=0 ⎦ 2π = 1 ⎡ 1 N −1 2⎤ 1 − A2 / 2 ∫ (2π )N / 2 exp ⎢ − 2 ∑ [ x ( n) − A] ⎥ 2π e dA n=0 ⎣ ⎦
p(θ x ) = 0
最大似然估计(MLE)(1)
基本思想:在对被估计量没有任何先验知识的情况下, 利用已知的若干观测值来估计该参数。
似然函数定义: 考 虑 N 个 样 本 x1 ,..., x N , 或 用 随 机 向 量 x = ( x1 ,..., x N ) 表 示 。 设联合条件分布密度函数 f ( x θ )= f ( x1,..., x N θ ) 存 在 且 有 界 。 将 其 视 为 真 实 参 数 θ的 函 数 , 称 之 为 似 然 函 数 。
ˆ 最大似然估计——使似然函数最大的估计θ,即 ˆ θ = arg max p( x
常取对数似然函数作为似然函数 (θ) ln p ( x θ ) = L 此时,最大似然估计由 ∂ L(θ ) = 0 ∂θ 求得。
最大似然估计(MLE)(3)
最大似然估计的性质 1. 最大似然估计一般不是无偏的,但偏差可以通过对估 计值乘以一个合适常数消除。 2. 最大似然估计是一致估计。 3. 最大似然估计给出优效估计,如果存在的话。 4. 对于大的样本点数,最大似然估计为一高斯分布。
Bayes 估计(1)
ˆ 在经典的确定性参数估计中,利用均方误差mse(θ )最小化,可能得不到 可实现的估计器。因为θ 是确定量,不参与概率空间的运算,即 ˆ ˆ mse(θ )= (θ − θ ) 2 p( x;θ )dx
∫
ˆ ∂mse(θ ) ∂ ˆ = ∫ (θ − θ ) 2 p( x;θ ) dx ⇒ ˆ ˆ ∂θ ∂θ 令其等于零 ∂ ˆ ⇒ (θ − θ ) 2 p ( x;θ )dx=0 ˆ ∂θ ∫ ˆ ⇒ θ=g (θ ) 其中包含了待估计的参数,因此无法实现。
θ
∫ p( x θ ) p(θ )dθ
ˆ ⇒ θ = arg max [ln p ( x θ ) + ln p(θ )]
θ
例: 设观测值x(n) = A + w(n), n = 0,..., N − 1, ⎡ ( A − μ A )2 ⎤ p A ( A) = exp ⎢ − ⎥, 2 2 2σ A ⎦ 2πσ A ⎣ 1 1
仍为高 斯分布
⎡ 1 ( N + 1)1/ 2 NX 2 ⎤ exp ⎢ − ( N + 1)( A − ) ⎥ = 1/ 2 N +1 ⎦ (2π ) ⎣ 2
1 X= N
∑ x ( n)
n =0
N −1
NX NX ˆ ∴ A = E ( A x )=∫ Ap ( A x )dA = = N +1 N +1
Bayes 估计(7)
矢量情况
⎡ E{θ1 x} ⎤ ⎢ ⎥ ˆ = E{θ x} = ⎢ E{θ 2 x} ⎥ θ ⎢ ⎥ ⎢ ⎥ ⎢ E{θ N −1 x}⎥ ⎣ ⎦
Bayes 估计(8)
其它损失函数的情况
均匀损失函数
⎧0 ⎪ ˆ Cunif ( θ , θ ) = ⎨ ⎪1 ⎩ ⎬ ˆ θ −θ > δ ⎪ ⎭
∫ p( x θ ) p(θ )dθ
θx
此时,MMSE Bayes估计得到的最小均方误差为 ˆ Bmse(θ )= [ E (θ x ) − θ ]2 p ( x ,θ )dxdθ = C
∫∫
Cθ x为θ的条件协方差。
Bayes 估计(5)
例: 设观测值 x ( n ) = A + w( n ), n = 0,..., N − 1, 其中 w( n )为零均值 AWGN,方差为1,且估计量 A服从零均值方差 1 − a2 / 2 p A (a ) = e 为1的高斯分布,即 , 求参数A的估计 2π 1 ⎡ 1 N −1 2⎤ exp ⎢ − ∑ [ x ( n ) − A] ⎥ 解: p ( x A) = N /2 (2π ) ⎣ 2 n=0 ⎦ p ( A x )= p ( x A) p A ( A)
Bayes 估计(10)——最大后验概率(MAP)估计的例子
2 其中w(n)为零均值AWGN,方差为σ w,且估计量A服从如下高斯分布,
求参数A的MAP的Baye估计。
⎡ 1 N −1 2⎤ exp ⎢ − 2 ∑ [ x(n) − A] ⎥ 解: p ( x A) = 2 N /2 (2πσ w ) ⎣ 2σ w n =0 ⎦ ˆ A = arg max [ln p ( x A) + ln p( A)]
ML
1 N −1 1 N −1 ˆ E{ AML } = E{ ∑ x(n)} = E{ ∑ [ A + w(n) ]} N n =0 N n =0 1 N −1 ˆ = A + E{ ∑ w(n)} = A ⇒ AML是无偏估计 N n =0
∂2 −N 由上次课例题得知: ln f ( x A ) = 2 2 σ ∂A ⎡ ∂2 ⎤ N ⇒ I ( A ) = − E ⎢ 2 ln f ( x A ) ⎥ = 2 ⎣ ∂A ⎦ σ σ2 1 ˆ ˆ ⇒ var( A ) = E {( A − A ) 2 ≥ = I ( A) N ∂ ˆ ln f ( x A ) = K ( A )( A − A ), 而 事 实 上 , 有 等号成立条件是 ∂A 1 N −1 ∂ ln f ( x A )= 2 ∑ [ x ( n ) − A ] σ n=0 ∂A =