实验数据处理方法第三部分统计学方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
J :雅可比行列式
Vij (ˆ) (ˆi i )(ˆj j )L (ˆ | )dˆ
此式与上式等价。
3. 在给定的样本下,可认为 L (x | ) 是 的概率分布函数
Vij (ˆ)
(i ˆi )( j ˆj )L ( x | )d L (x | )d
分母为归一化因子。 Q L (x | )dx 1,而 L (x | )d 1
(Maximum Likelyhood Method)
12.3 ML估计式的特性
12.3 ML估计式的特性
1. 参数变换不变性
设 ˆ 是参数的ML估计值, ( ) 是θ的函数。如果用 ( ) 作为
参量来求LF的极大值,则所得θ的估计值亦为 ˆ
L
L
Q
|
ˆ
0
|
ˆ
如果
|
ˆ百度文库
0
,则有
L
L
| ˆ 0 | ˆ( )
n!
n!
n i 1
f (xi | )
广义似然函数, = ( )
优点:n对θ增加了附加的限制 条件:ν必须能够精确确定
12.2 用ML方法进行参数估计的步骤
2. 数据分类情况下的似然函数
对实验数据进行分间隔处理,(如作成直方图)然后用ML方法对分类 后的数据进行处理。
优点:减小了数据量,使得对L 的计算速度加快 缺点:由于将原 L 简化为少量的几个“平均”pdf的乘积,使得
2. 本底事例:相空间本底、粒子误判本底、其它衰变道本底等
fback (m, ) ~
f
ps
(m,
)
mm a x
1
mm in
1
Nb
bi
Pi
(
x)
i 1
fps(m,):相空间函数
Pi(x):i阶Legendre多项式
x 1 m mmin mmax mmin
bi:未知参数
12.2 用ML方法进行参数估计的步骤
k :第k个窄共振峰事例数/总事例数
:Namp个相干共振峰事例数/总事例数
BES分析软件BWFIT程序中使用的p.d.f
(二)构造似然函数
12.2 用ML方法进行参数估计的步骤
设对某物理系统进行了n次测量,x1、x2、…xn
n
ln L ( x | ) ln f ( xi | ) i 1
根据需要可对 L (x | ) 进行变化:
n
ln
i 1
f (xi , ) 0
极大值条件: 2 ln L(x |)
2
0
ˆ
如果有k个位置参数, = {1, 2, …, k} k阶似然方程
ln L(x | )
j
j
n
ln
i1
f (xi , ) 0
估计值: ˆ {ˆ1,ˆ2, ,ˆk}
j 1,2, , k
12.1 最大似然原理
2. 用CERN程序MINUIT求解函数f ln L 的极小值,得
θ的估计式 及ˆ 其误差
例:估计粒子的平均寿命
探测K0粒子的产生和衰变。假定探测器无限大,则K0粒子在
t时刻衰变的p.d.f
f (t | ) 1 et /
0t
12.2 用ML方法进行参数估计的步骤
τ:粒子的平均寿命,为未知参数。K0的飞行时间ti
实验数据处理方法
第三部分:统计学方法
第十二章 最大似然法
(Maximum Likelihood method)
第十二章 最大似然法
(Maximum Likelihood Method)
点估计的方法之一,是参数估计中常用的方法,具有以下的特点:
1. 在一定的条件下,ML估计式满足一致性、无偏性、有效 性等要求;
(1)如果较小
2 BW (m m0 )2 2 4
实验结果包含质量分辨率和探测效率的影响, ~ ,故 必须对理论公式进行修正
BW 2 BW 2(m)R(m, m)dm
12.2 用ML方法进行参数估计的步骤
其中:
(m):效率函数,因(m)随m的变化较小,故(m)~常数 R(m,m´):分辨率函数,真值为m时,获得测量值m´的概率
2
V (ˆ) (1 b )2
(
2 ln d
2
)
ˆ
ˆ
如果ˆ 是θ的无偏估计, b(θ)= 0
V (ˆ) 1
(
2 ln
L
2
)
ˆ
(三)大样本的ML估计式的方差
样本容量 n 时,ML估计值服从正态分布N(θ,MVB)
(Maximum Likelyhood Method)
12.4 ML估计式的方差
12.3 ML估计式的方差
对ML估计值的误差的估计依赖于p.d.f的性质和样本的大小,不同
的方法适用于不同的样本;大样本公式,小样本公式。
统计误差:如果p.d.f是纯理论公式,即没有对实验条件进行修正,
则由ML得到的误差为统计误差。
12.1 最大似然原理
12.1 最大似然原理
(一) 似然函数的定义
p.d.f:f(x|) 测量量:x = {x1, x2, …, xn }
n
L(x | ) f (xi | ) i 1
L(x | )d x 1
(二) 最大似然原理
未知参数的最佳估计值ˆ 应满足如下的条件:
i. ii.
对ˆ 位于于给定的的允一许组取测值量范值围,;ˆ使L取极大值:
12.2 用ML方法进行参数估计的步骤
(一)构造概率密度函数
物理系统的特性:某些量的理论概率分布函数 实验的条件:分辨率、探测效率
ML方法中所需的p.d.f
例:不变质量谱分析:e+e-J/K+K-
• 通过测量K+K-的动量,可得到K+K-的不变质量 分布,对该分布进行统计分析,可得到衰变过程 中产生的共振态的信息;
L(x |ˆ) L(x | )
12.1 最大似然原理
(三)估计值 ˆ的求法
似然方程:
L(x | )
n i 1
f (xi , ) 0
极大值条件: 2L(x |) 2
ˆ
0
因为lnL是L的单调上升函数,lnL和L具有相同的极大值点, 所以,LlnL, 求和运算比乘积运算容易处理
似然方程: ln L(x |)
如果θ的有效估计式t存在,则用ML方法一定能得到该估计式。
0 ln L = A( )[t b( )]
充分必要条件
6. 渐近正态性(Asympototic normality)
在样本容量很大时,θ的ML估计值满足渐近正态分布,其平均值
为θ的真值θ0,方差为最小方差限(MVB)。
第十二章 最大似然法
参数估计的精度下降。
设将x的变化范围分成了N个间隔
ni :第i个间隔内的事例数
N
ni n
i 1
pi :某事例落入第i个间隔的概率
N个事例分布于N个间隔内,每个间隔内的事例数为n1、n2、…nN 的概率满足多项式分布:
12.2 用ML方法进行参数估计的步骤
L
(n1, n2 K
nN
| ) n!
R(m, m)
1 2
exp[
1 2
(m
m)2
2]
:质量分辨率 因此,窄共振峰的p.d.f为
BW 2 R(m, m)dm
1 Re(w(z))
2
w(z) ez2 erfc(iz)
z m m0 i
2 2 2
12.2 用ML方法进行参数估计的步骤
(1)如果较大,宽共振峰
因为>> ,所以R(m,m´)~ (m-m´)
如果衰变过程中:NBW个窄共振峰、Namp个相干共振峰,则m的pdf
Nbw
f (m | ) m
k 1
1 2 m
Re(W
(z)) / CBW
N amp
BW1
e BW ik1
k 1
k
k2
2
Camp
N BW
(1 k ) fback Cback k 1
其中:CBW、Camp、Cback为归一化常数,保证 f (m | )dm 1
• 描述不变质量m的分布的p.d.f应包含对该分布有 贡献的物理过程
12.2 用ML方法进行参数估计的步骤
1. 信号事例: J X
KK
在不变质量为m0处出现共振态X的弹性散射振幅可用BreitWigner公式描述:
BW
m m0 i 2
:X的宽度,m0:X的静质量,m:K+K-的不变质量
极大值条件:二次矩阵U (ˆ)是负定的(Negative definite)
U ij
(ˆ)
2
ln L(x | i j
)
|
ˆ
第十二章 最大似然法
(Maximum Likelyhood Method)
12.2 用ML方法进行参数估计的步骤
12.2 用ML方法进行参数估计的步骤
1) 构造概率密度函数; 2) 构造似然函数; 3) 求似然函数的极大值。
如果在衰变过程中存在着多个宽共振,则可能存在仙湖干涉
的现象,设有Namp个相干的共振峰,则描述这些共振峰的
p.d.f为
N amp
2
~ BW1
e BW k1
k 1
k
k 2
BWk
k m m0k i
2
k-1:相位差
k-1:第k个相干的共振峰事例数/第一个相干的共振峰的
事例数
12.2 用ML方法进行参数估计的步骤
n i 1
1 ni
P ni i
Pi Pi ( ) xi f ( x | )dx
xi :间隔的宽度
取对数并只保留与θ有关的项 N lnL (n1, n2 K nN | ) ni Pi ( ) i 1 分间隔的似然函数(Binned Likelihood Function)
(1) N很大,xi 很小, L ( x | ) : L (n1, n2 K nN | )
(2) 如果在某一间隔内的变化不是很大,则用 L (n1, n2 K nN | )
得到的θ的精度是可接受的
12.2 用ML方法进行参数估计的步骤
(三)求似然函数的极大值
1. 求解似然方程:
ln L
i
=
i
n
ln f ( x j | ) 0,
i 1, 2K k
一般情况下无解析解,只能用数值解法。
1. 广义似然函数(Generalized Likelihood Function)
总事例数n也是随机变量,服从平均值为υ的泊松分布:
Q 在实验条件一定的条件下,事例的产生率为常数,
在时间t内获得n个事例的概率为泊松分布。
观测到n个事例,且测量量为x1、x2、…xn的联合概率为
L (n, x | ) ne L ( x | ) ne
12.3 ML估计式的方差
(二)充分ML估计式的方差
如果ˆ 是参数θ的充分估计式(从而也是有效估计式)。则 ˆ
的方差由MVB给出:
V (ˆ) (1 b )2
E
(
2 ln d
2
)
b(θ):偏差
由有效性条件 ln L A( )[t b( )]
E(
2 ln L
2
)
A( )(1
b )
2 ln L
否则:误差 统计误差+实验误差 (一)方差估计的一般方法(适合于任何容量的样本)
n
LF : L ( x | ) f ( xi | ), {1,2 K k}
i
通过求解似然方程
1
ln
L
i
0 ,得θi的估计式
ˆi i{x1, x2 K xn}
是随机变量 x1, x2 K xn 的函数
的真值: {1,2 K n}
n
故当样本容量 n 时,ML估计式总是无偏的。
12.3 ML估计式的特性
4. 充分性(sufficiency)
如果θ的充分估计式t存在,则用ML方法一定能得到该估计式。
L (x | ) G(t | )H(x)
充分必要条件
L = 0 G(t | ) = 0
即θ只依赖于t
5. 有效性(Efficiency)
ti
L
c
LE pc
L:飞行距离,p:动量,E:能量,c:光速
对于n个观测事例:
L (t | ) n 1 eti
i 1
ln L
=
n
( ln
i =1
ti
)
n i =1
( 1
ti
2
)
0
Q
ˆ
1 n
n i 1
ti
t
ln L
n
2 | ˆ ) ˆ2 0
当 ˆ 时,LF取极大值。
第十二章 最大似然法
2. 当样本容量n时,ML估计式满足正态分布方差容易 计算;
3. 用ML方法可较容易地得到参数的估计式;
本章内容:
1. 最大似然原理; 2. 用ML方法求解参数估计问题的步骤; 3. ML估计式的特性; 4. 如何计算ML估计值的方差; 5. 利用似然函数进行区间估计
第十二章 最大似然法
(Maximum Likelyhood Method)
12.3 ML估计式的方差
1. ˆi 和 ˆj 的协方差
Vij (ˆ) (ˆi i )(ˆj j )L (x | )dx1x2 K xn
如果p.d.f和 ˆi 的表达式已知,则无需任何数据就可求出 估计式的方差。
2. 由 L (x | ) 可导出 ˆ 的概率分布
L (ˆ | )dˆ : J L (x | )dx
ˆ( ) (ˆ)
2. 一致性(consistency)
在一般条件下,ML估计值满足一致性条件,即
ˆn ,当 n 时。 3. 无偏性(unbiassedness)
在某些特殊情况下,ML估计式是无偏的,即E(ˆ)
在一般条件下,ML估计式不满足无偏性:E(ˆ) ,但其偏差 : o( 1 )