充分统计量
1.2 充分统计量与完备统计量
1− p
∑ 若取
T ( x1,
x2 ,",
xn ) =
1 n
n i =1
xi ,
h ( x1, x2 ,", xn ) =1,
g
(T (
x1 ,
x2 ,",
xn);
p)
=
(1
−
p)n( p 1−
) nT p
,
则有 P{ X1 = x1, X 2 = x2 ,", X n = xn } =h ( x1, x2 ,", xn ) g(T ( x1, x2 ,", xn ) ;p),
Pθ {g1(T ) = g2(T )} =1, ∀ θ ∈ Θ
⇒ Eθ ⎡⎣g1(T )⎤⎦ = Eθ ⎡⎣g2 (T )⎤⎦ , ∀ θ ∈ Θ 但反之不一定成立,若 T 是完备统计量,即 T 的分布函
数族是完备分布函数族,则由定义 1.5 知,对于
Eθ ⎡⎣g1(T ) − g2(T )⎤⎦ =0, ∀ θ ∈ Θ
有关而与参数θ 无关,则称 f ( x,θ ) 为指数型分布族,对于
离散型总体,如果其样本的联合分布律可以表达成(1.8) 的形式,也同样称它为指数型分布族。
例 1(补充)正态分布族,二项分布族是指数型分布族。 例 2(补充)均匀分布族,二参数指数分布族(当位置参 数已知时)不是指数型分布族。
完备统计量的含义不如充分统计量那么明确,但由定
义可见它有如下特征:
Pθ {g1(T ) = g2(T )} =1, ∀ θ ∈ Θ
⇔ Eθ ⎡⎣g1(T )⎤⎦ = Eθ ⎡⎣g2(T )⎤⎦ ,{F(x; θ ),θ ∈ Θ} ∀ θ ∈ Θ (1.7) 对于一般的统计量T = T ( X1, X2,", Xn ) ,总有
充分统计量_完备统计量_指数分布族
对任给 X x1, xn 和 t ,满足 X At ,有
-1-
P X1 x1,, X n xn T t
P
X1
x1,, X n xn ,T
PT t;
t;
P
X1
x1,, X n
PT t;
xn ;
g t,
g t, h x1,, xn h y1,yn :T y1,yn t y1, yn
f x, g T x h x
(0.1)
对每一 与x X 成立.
注: h x不依赖于.
证:只对离散型情况给出证明.这时,
f x, P X x
对于T X 的值域中任意固定的 t ,定义集合
At x :T x t.
充分性 设 f x, 使因子分解式(1.1)成立.则对任意的 x At , T x t 成立,
X1, X 2 ,, X n 的条件与 无关.
即不包含关于参数的信息
2)定理 5.5.1(因子分解定理 Factorization Theorem):设总体概率函数为 f (x; ) ,
X1, X 2,, X n 为样本,则 T T ( X1, X 2 ,, X n ) 为充分统计量得充分必要条件是:存
2)定理(极小充分统计量的存在定理): 假定分解定理中的条件成立,且样本空间为欧
式的,则极小充分统计量存在.
3)要求:①信息损失越少越好
②统计量越简化越好
4.指数族:
1)定义:设 (, | p : |) 是可控参数统计结构,加入其密度函数可表示为如下形
k
式: p (x) c( ) exp{ cj ( )Tj (x)}h(x) i 1
期望)可以看作一个变换,且是一对一的变换.
5-5充分统计量
i 1 n 1 n
P ( X i t )
P( X
i 1
n 1
i 1
i
xi ) P(X n t xi )
t t Cn (1 )n t i 1
n 1
x 1 x (1 )
例3. 设总体X ~ P( ),即p( x; )
x
x! x1 , x2为样本,证明T =2x1 x2不是的充分统计量.
e , x 0,1,
二、因子分解定理
以下统称分布列和密度函数为概率函数. 定理2: 设总体的概率函数为p( x; ),x1 ,
, xn是样本,则
统计量T T ( x1 ,
例4 设x1 , x2……, xn是取自总体N(μ,1) 的样本, 令 Tx 证: , 则T 为μ 的充分 统计量.
n 1 2 2 (2 ) exp{ ( x ) } , xn ) i 2 i 1 n
n
p ( x1 ,
n i 1
而 ( xi )2 ( xi x)2 n( x )2
T (t1 , t2 ) ( xi , xi2 )
是θ的充分统计量. 进一步, 它的一一对应变换 ( x, s )仍 是充分统计量.
证:
i 1 i 1
2
n
n
p( x1 ,
, xn ; ) (2 2 )
n 2
n
2
exp{
1 2 2
n
2 ( x ) } i i 1
(1/ )n I{ x( n ) } I{ x(1) 0}
取T x( n) , 并令g (t , ) (1/ ) I{t } , h( x1 , , xn ) I{x(1) 0}
充分统计量举例说明
充分统计量举例说明
充分统计量是指能够包含样本中所有关于总体参数的信息的统计量。
它能够提供关于总体未知参数的最大可能的信息量,从而使得对总体参数的推断更加准确和可靠。
下面是一些充分统计量的例子:
1. 样本均值,对于总体均值的估计,样本均值是一个充分统计量。
它包含了样本中所有观测值的信息,并且是总体均值的无偏估计量。
2. 样本方差,对于总体方差的估计,样本方差也是一个充分统计量。
它包含了样本中所有观测值的离散程度的信息,并且是总体方差的无偏估计量。
3. 样本中位数,对于总体中位数的估计,样本中位数是一个充分统计量。
它能够提供总体分布的中心位置的信息,尤其在样本中存在异常值或者偏态分布的情况下更为有效。
4. 样本最大值和最小值,对于总体范围的估计,样本的最大值和最小值是充分统计量。
它们能够提供总体数据的上限和下限的信
息,对于描述总体数据的分布范围有重要意义。
5. 样本相关系数,对于总体相关关系的估计,样本相关系数是一个充分统计量。
它能够提供总体变量之间线性相关关系的信息,对于研究变量之间的相互关系非常有用。
需要注意的是,充分统计量的选择应该基于所研究问题的特点和目标,以及样本数据的性质。
以上只是一些常见的例子,实际应用中可能还会根据具体情况选择其他充分统计量。
充分统计量与完备统计量
完备统计量的含义不如充分统计量那么明确,但由
定义可见它有如下特征:
P g1 (T ) g2 (T ) 1, E g1 (T ) E g2 (T ), 。
(1.7)
对于一般的统计T T ( X 1 , X 2 , , X n ) ,总有
对统计量 T,如果已知它的值以后,样本的条件分布 与 无关,就意味着样本的剩余部分中已不再包含关于 的信息, 也就是在 T 中已包含有关 的全部信息。 因此, 对 的统计推断只需要从 T 出发即可, 不再需要样本数据。
二、 因子分解定理
根据充分统计量的含义,在对总体未知参数进 行推断时,应在可能的情况下尽量找出关于未知参 数的充分统计量。 但从定义出发来判别一个统计量是否是充分统 计量是很麻烦的。 为此,需要一个简单的判别准则。下面给出一 个定理——因子分解定理,运用这个定理,判别甚 至寻找一个充分统计量有时会很方便。
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1 n n xi n xi n p i 1 (1 p ) i 1 , 如 果 xi k, k k nk C n p (1 p ) i 1 n 0 , 如 果 xi k, i 1 n 1 C k , 如果 xi k, i 1 n n 0, 如果 xi k, i 1
其中 h( x1 , x2 ,, xn ) 1 ,
而 g (T ( x1 , x2 , , xn ); ) 显 然 是 T ( x , xi2 ) 和 ( , 2 ) 的函数。 故由因子分解定理知 T ( X , x i2 ) 是 ( , 2 )
充分统计量
充分统计量充分统计量又称足够的样本容量,是指一个总体能从各种可能中得到它所需要的资料。
这里需说明的是“全部”并不等于每个个体都被收集起来加以考察。
这也就是为什么有些人很忙,但工作成效却很低的原因。
只有对总体进行研究后才能发现其规律性和特征,而大量重复就会使统计工作变得无用,而且费力。
另外,抽样时还必须保证总体中每个个体都具有同质性或相似性。
根据这两点,充分统计量应该满足:(1)当总体中任何一个个体值均落入某一区间内时,则认定此数据已达到了充分统计量;(2)若总体中存在非随机误差项,那么在估算充分统计量时,将其剔除出去,再求解,直至误差消失为止。
我们在作调查时,常遇见这类问题:“你家几口人?”、“你今年多少岁啦!”…诸如此类的提问方式显然没有经过严格的科学论证,甚至连最基础的概率知识都未掌握。
试想,假设甲乙丙三位老师同时向100名小朋友询问上述问题,结果会怎样呢?答案肯定是令人吃惊的!由此看来,我们平日里做事情,尤其是搞社会调查活动,切忌凭主观臆断下结论,更不能道听途说,盲目地给别人贴标签。
俗话说:“凡事预则立,不预则废。
”正确运用好充分统计量,关系着整个调查报告的质量高低与否。
如果调查者缺乏专业素养,往往会导致错误的判断,造成决策失误。
例如,前面讲到的美国人口普查局的一次实验。
他们选择了一批6-10岁儿童,让他们填写自己父母亲的职业,并把这份表交回来,请他们的父母评价孩子的智商水平。
这个实验虽然取得了良好的效果,但是却留下了许多疑惑——为什么受测者的父母对孩子的智商竟毫无觉察呢?难道真像他们所宣传的那样,他们天生愚钝吗?通过仔细推敲,他们终于找到了症结所在:原来,这群孩子之所以智商偏低,完全是因为他们的父母压根儿就没有意识到自己的孩子智商比较低罢了。
6-充分统计量
解 (1) 即
19 S
2
( n 1) S
2
2
~ ( n 1)
2
1
2
2
X
i 1
20
i
X ~ (19)
2 2
故
1 2 2 2 P 0.37 X i X 1.76 20 i 1 20 1 2 P 7.4 2 X i X 35.2 i 1
1.设 X 1 , X 2 , , X m Y1 ,Y2 , ,Yn 分别是来 与 自正态总体 X ~ N ( 1 , 12 )与 Y ~ N ( 2 , 22 ) 的 相互独立的简单随机样本.
令
X
X m
i 1
1
m i
Y
Y n
j 1
1
n j
S1
2
1 m 1
m
(Xi X )
2 2 2
所服从的分布.
解 X 1 X 2 X 9 ~ N ( 0, 9 16 )
1 3 4 ( X 1 X 2 X 9 ) ~ N ( 0, 1 )
1 3
Yi ~ N (0,1) , i 1,2,,16
1 2 Yi ~ (16) i 1 3
充要条件是:存在两个 函数g( t , )和h( x1 , x 2 , , xn ) 使得对任意 和任一组观察值 1 , x 2 , , x n,有 x
相互独立的简单随机样本. 则
1 n ( X Y ) ( 1 2 ) 1 m ( n 1) S1 ( m 1) S 2
2 2
~ t (n m 2)
充分统计量
x )2
n (
2
x)2 }
(
1 2π )n
exp{
1 2
n i 1
( xi
x)2 }exp{
n (
2
x)2 }
其中T ( x1, x2 , , xn ) x,
h( x1, x2 ,
,
xn )
exp{
1 2
n i 1
( xi
x )2 }
g(T ( x1, x2 ,
, xn ), ) (
1 exp{ n ( T )2 },
g(T ( x1, x2 ,
, xn ), ) (
1
1
2π )n exp{ 2 2
n i 1
xi2
n 2
x
n 2
2 2
},因而,T
(
x1
,
x2
,
n
, xn ) ( x, xi2 )是充分统计向量。
i 1
进一步,我们指出这个统计量与 (x, s2 )
是一一对应的,这说明在正态总体场合
常用的 ( x , s2 ) 是充分统计量。
P(T t; )
t;
)
P(X1
x1,, X n
P(T t; )
xn; )
g(t, )
g(t, )h( x1,, xn )
h( x , , x ) {( x1,,xn ):T ( x1,,xn )t }
1
n
h( x1,, xn )
h( x , , x ) {( x1,,xn ):T ( x1,,xn )t }
,
xn ),
p)
(1
p)n ( p )nT 1 p
,
充分完备统计量总结(热门5篇)
充分完备统计量总结第1篇20xx年全所各项工作围绕我局目标管理责任状内容,结合省、市计量工作要点,对内抓好计量服务规范各项活动,不断提高工作效能;对外以强化民生计量为重点,以开展企业能源计量工作为切入点,将监督与服务有机地融为一体,使计量基础工作在新形势下得到了较快发展,圆满地完成上级交给的各项工作任务。
一、抓好机构建设增强核心竞争力1、坚持项目强所,抓好新上检定项目的建设。
省局20xx年已批建的项目出租车计价器、玻璃量具、水表检定装置已经申请考核验收,同时做好了标准镜片组检定装置、气体流量计检定装置、大衡检定装置的调研工作,大衡检定装置已于9月购置,标准镜片组检定装置、气体流量计检定装置11月底购置,明年四月申请考核验收。
同时,根据社会需求和所工作实际,对x光机、压力表、三表项目拟于20xx年进行技改。
2、加强人员的培训,打造学习型技术机构,全面推行一专多能,提高从业人员的业务素质,培养学科技术带头人,准备迎接计量授权考核工作;同时上报了专业技术人才引进工作,提高计量技术机构的核心竞争力。
今年共有29人次参加水表、加油机检、出租车计价器、玻璃量具、天平、x光机检定员培训,有11人次取得了新上项目检测资格证书。
3、对现有体系进一步完善、改进、保持,确保各项检测工作切实按《质量手册》及《程序文件》运行,使各项工作不断地规范有序。
在四月份对体系进行了内审和评审。
针对存在的设备更新送检等问题也进行逐项改进和落实。
确保新上项目考核验收通过。
4、进一步细化所内各项工作制度的考核办法,使各项考核工作落到实处,真正达到人人各司其职、各负其责,责权利相互挂钩的管理机制。
所里根据局考核方案制定了所内考核办法,细化了考核内容,高度体现了贡献与收入、权利和义务的合理利益分配原则。
明确各自的职责,增强了工作责任感。
5、营造一个和谐的浓厚的文明创建氛围,全面促进文明单位创建工作。
抓好宣传工作及文明创建工作。
按时报送信息稿件,见报30篇。
充分统计量_完备统计量_指数分布族
f ( X1,, X n )dF1( X1)dFn ( X n ) 0 f ( X (1) ,, X (n) )
定义(有界完全性):设变量 X 的样本空间为 (x, x ) ,分布族为{ p , }, t(x) 为定义
于 X 取 值 于 ( f , f ) 的 统 计 量 , 其 分 布 族 为 { pT , } , 若 对 任 何 满 足 条 件 ”
P
X
x
T
X
t
P
X P
x,T
T X
X t
t
P P T t
0.
也与 无关.因此,条件分布 f x t f x t 与无关,即T X 是的充分统计量.
必要性 设 T X 是 的充分统计量,由充分统计量的定义, P X x T X t 与
参数 无关,它是 x 的函数,记为 h x. 于是,对任意固定的 t ,当 x At 时,T x t
k
| (x) | exp{ wjTj (x)}d j 1
③ 设 X ( X1,, X n ) 是 来 自 指 数 型 分 布 标 准 形 式 的 一 个 样 本 , 则 有 统 计 量
n
n
(T1( X ),,Tk ( X )) ( T1(xi ),, Tk (xi )) 是指数型分布族的充分统计量.
记为 h x1, xn 或 h X ,令 At X :T X t,当 x At 时有
T t X1 x1,, X n xn,
故
P X1 x1,, X n xn; P X1 x1,, X n xn ,T t;
P X1 x1,, X n xn T t P T t;
其中是通过统计量的取值而依赖于样本的. 证明:一般性结果的证明超出本课程范围,此处我们将给出离散型随机变量下的证明,
5-5充分统计量解析
i 1 n 1 n
P ( X i t )
P( X
i 1
n 1
i 1
i
xi ) P(X n t xi )
t t Cn (1 )nt i 1
n 1
x 1 x (1 )
T (t1 , t2 ) ( xi , xi2 )
是θ的充分统计量. 进一步, 它的一一对应变换 ( x, s )仍 是充分统计量.
证:
i 1 i 1
2
n
n
p( x1 ,
, xn ; ) (2 2 )
n 2
n
2
exp{
1 2 2
n
2 ( x ) } i i 1
i i
n 1 i 1
t
xi
i 1
n1
(1 )
1t
xi
i 1
n1
t t Cn (1 ) n t
(1 ) 1 t t t n t Cn (1 ) Cn
t n t
该条件分布与θ 无关,因而T是充分统计量。 注1:用条件分布与未知参数无关来表示统计量不损失 样本中有价值的信息的方法是可行的. 2:充分统计量不唯一. 实际上, 样本本身就是参数的一 个充分统计量. 由此, 充分统计量总存在. 3:若样本容量为n, (在上例中)则T1=x1+x2不是充分统 计量. 显然,它浪费了n-2个样品的信息.
定义:
T和θ可以是向量, 维数不一定相同
设x1 , x2 ,
, xn是总体分布函数为F ( x; )的样本, , xn )称为的充分统计量(也称为
充分统计量
充分统计量⏹充分统计量的定义⏹充分统计量的验证⏹Neyman-Fisher因式分解定理1. 充分统计量的定义在前面的例题中我们看到, 样本均值是高斯白噪声中未知常数估计的有效估计量。
11ˆN ii A zN-==∑考虑如下数据集:1021{,,...,}N s z z z -=2011{,...,}N s z z z -=+130N i i s z -=⎧⎫=⎨⎬⎩⎭∑这些数据集都可以求得A 的有效估计量。
s 3仅有一个元素,称为充分统计量。
定义:对于未知参数θ的估计,如果统计量T (z)给定后,观测中将不再含有θ的信息,即()()00();()p T T p T T ===z z θz z 则称T (z)为充分统计量(ss, sufficient statistic)。
也就是说,观测中所有关于θ的信息都包含在充分统计量T (z)中。
2. 充分统计量的验证()()00();()p T T p T T ===z z θz z T (z)是不是充分统计量,也就是要判断下式是否成立:由贝叶斯公式:()()()000,();();();p T T p T T p T T ====z z θz z θz θ()00(;)(())();p T T p T T δ-==z θz z θ考虑高斯白噪声中未知常数的估计问题,观测的概率密度为:()122/22011(;)exp (2)2N i N i p A z A -=⎧⎫=--⎨⎬πσσ⎩⎭∑z 1()N ii T z -==∑z 2()~(,)T N NA N σz与未知参数A 无关,是充分统计量。
1()N i i T z -==∑z3. Neyman-Fisher 因式分解定理()()00();()p T T p T T ===z z θz z 在实际中要判断下式成立往往存在一定的困难:Neyman-Fisher 因式分解定理:T (z) 为参数θ的充分统计量的充要条件是p (z ;θ)能分解为(;)((),)()p g T h θ=θz z z例1:高斯白噪声中未知常数A 的估计122/22011222/22200(;)11exp ()(2)2111exp 2exp (2)22N i N i N N i i N i i p A z A NA A z z -=--==⎧⎫=--⎨⎬πσσ⎩⎭⎧⎫⎧⎫⎛⎫=---⎨⎬⎨⎬ ⎪πσσσ⎩⎭⎝⎭⎩⎭∑∑∑z ((),)g T A z ()h z T (z) is a ss1.6.3 Neyman-Fisher 因式分解定理例2:高斯白噪声中正弦信号相位的估计2011=π+φ+=-[]cos()[],,...,z n A f n w n n Nh z()((),(),)z zg T Tφ12如果12(;)((),(),...,(),)()r p g T T T h θ=θz z z z z 12(),(),...,()r T T T z z z 称为联合充分统计量小结:1. 充分统计量的定义()()00();()p T T p T T ===z z θz z 充分统计量一旦给定,观测中就不再含参数θ的任何信息。
充分统计量与完备统计量
例5
设( X 1 , X 2 , , X n )T 是来自正态总体N( , 2 )
n i 1
的一个样本,试证T(X 1 , X 2 , , X n ) ( X , X i2 )T 是参数 =( , 2 )T的联合充分统计量.
解 L( )
1
1 ( 2π )n
{
证明涉及测度论,从略 说明:
如果参数为向量时,统计量T也是随机向量,例如
( , ), 则相应的统计向量可以为T ( X , S ).
2 2 n
以下将通过几个例子来说明判别法则的应用
例2 根据因子分解定理证明例2.3 解
P{ X1 x1 , X 2 x2 , , X n xn }
x !
i 1 i
n
g (T ( x1 , x2 , , xn ), ) nT e n ,因而,X 是充分统计量.
例4 设( X 1 , X 2 , , X n )T 是来自正态总体N( ,1)的
1 n 一个样本,试证X X i 是参数的充分统计量. n i 1
k k 证 由于P{ X } P{nX k }=C n p k (1 p)n k ,因而 n n
k k p k 即对任意的0 p 1, g ( )C n ( n 1 p ) 0,而此式 k 0 p 是关于 的多项式,因而每项系数只能为0,则 1 p k k g( ) 0,因而满足Pp { g( ) 0} 1, 所以X 是完备 n n 统计量.
§2.3 充分统计量与完备统计量
一、充分统计量
二、因子分解定理
三、完备统计量 四、指数型分布族
一、充分统计量
1. 问题的引出
充分统计量与完备统计量
三、完备统计量
为了介绍完备统计量的概念,首先需要引入完备分 布函数族的概念。
定义 1.5 设总体 X 的分布函数族为F( x; ), ,
若对任意一个满足
E g( X ) 0,对一切
的随机变量 g( X ),总有
(1.5)
P g( X ) 0 1,对一切 , 则称F( x; ), 为完备的分布函数族。
族——指数型分布族。它包含了一些常用分布,如泊松
分布、正态分布、指数分布、二项分布和 分布等,对这
类分布族,寻找参数的充分完备统计量是方便的。
定理 1.5 设总体 X 的分布密度 f ( x; )为指数型分布
族,即样本的联合分布密度具有如下形式:
n i 1
f
( x;
)
C (
) exp
m j1
=T(X1,X2,…,Xn) 也有一个抽样分布FT(t) 。
当我们期望用统计量T 代替原始样本并且不
损失任何有关 的信息时,也就是期望抽样分布 FT(t) 像 F(x) 一样概括了有关 的一切信息。
这即是说在统计量T 的取值为 t 的情况下
样本 x 的条件分布F(x|T=t) 已不含 的信息,
bj (
)Tj ( x1 ,
x2 ,,
xn
)
h( x1 , x2 ,, xn ),
2.9
其中 (1,2 ,,m ), 。如果中包含有一个m 维矩形,
而且 B (b ( ),b ( ),,b ( ))的值域包含一个m 维开集,则
1
2
m
T (T ( X , X ,, X ),T ( X , X ,, X ),T ( X , X ,, X ))
完备统计量的含义不如充分统计量那么明确,但由
1.2 充分、完备统计量
f (t )是单 定理 设 T ( X 1 , X 2 , , X n )为 的一充分统计量,
值可逆函数,则 f (T ) 也是 的充分统计量 结论: 1 统计量用来推测参数的值; 2 充分统计量把可能丢失信息的统计量筛选; 3 最优统计量在充分统计量之中; 4 一个参数的充分统计量不唯一. 问题:在什么情况下,它是唯一的?
对于一般的统计量 T ( X1 , X 2 ,, X n )
P { g1 (T ) g2 (T )} 1, E ( g1 (T )) E ( g2 (T )),
( X1, X 2 ,, X n )T
• 例设 是来自总体 X 服从两点分布 B(1, p) 的样本 ,样本均值 X 是参数 p 的充分统计量, 验证 X 也是完备统计量 证明:由于 X ~ B(1, p),n X ~ B(n, p),
P{ X 1 x1 , X 2 x2 ,, X n t xi }
i 1
n 1
P{T t }
P( X
i 1
n 1
i
xi ) P ( X n t xi ) ( n ) n e t!
t i 1
n 1
x
i 1
n
i
t
e t! i 1 x i ! t ( n ) n n t n x ! e i i 1 t!
后,对 任意
x1, x2,, xn
有
x
i 1
t ,样本 ( X1 , X 2 ,, X n )T 的条件概
率密度为:
f ( x1 , x2 ,, xn | T t )
f ( x1 , x2 ,, xn1 , t xi )
充分统计量的证明方法及几个重要定理
充分统计量的证明方法及几个重要定理一、充分统计量的证明方法1. Fisher-Neyman因子分解定理:Fisher-Neyman因子分解定理是一种证明充分统计量的重要方法,其内容可以简述如下:设X1, X2, ..., Xn是来自总体X的一个样本,f(x,θ)是总体X的概率密度函数(或概率质量函数),T(X)是一个统计量。
如果存在函数g1(X), g2(X), ..., gm(X)和h(X),使得f(x,θ)=g1(x)g2(T(x),θ)h(x)那么统计量T(X)是总体X的一个充分统计量。
在实际应用中,通常可以通过一些常用的概率分布的特性,如指数分布、正态分布等,来确定T(X)是充分统计量。
2.因子分解定理:因子分解定理是另一种证明充分统计量的常用方法。
设X1,X2,...,Xn是来自总体X的一个样本,f(x,θ)是总体X的概率密度函数(或概率质量函数),T(X)是一个统计量。
如果存在函数g(T(X),θ)和h(x),使得f(x,θ)=g(T(x),θ)h(x)那么统计量T(X)是总体X的一个充分统计量。
这种方法的优点是不需要分解出g1(X), g2(X), ..., gm(X),即可以直接得到充分统计量。
1. Neyman的因子分解定理提出了充分统计量的概念和证明方法,即Fisher-Neyman因子分解定理。
2. Lehmann-Scheffé定理设X1,X2,...,Xn是来自总体X的一个样本,θ是总体X的未知参数,T(X)是θ的一个无偏估计量,且g(T(X))是对θ的无偏估计量φ(θ)的一个充分统计量。
那么对于任意的θ,对应的T(X)是φ(θ)的最小方差无偏估计量。
这个定理说明了充分统计量的重要性,因为对于最小方差无偏估计量的构造,充分统计量是必不可少的。
3. Rao-Blackwell定理设X1, X2, ..., Xn是来自总体X的一个样本,θ是总体X的未知参数,T(X)是θ的一个无偏估计量,W(X)是θ的另一个无偏估计量,且Var(T(X)) < ∞。
最小充分统计量
一、统计量
二、充分统计量
定义: 设 x1, x2, …, xn 是来自某个总体的样本,总 体分布函数为F ( x ; ), T = T(x1, x2, …, xn) 为一个(一维或者多维)的统计量,如果在给定T 的取值后,x1, x2,…, xn 的条件分布与无关,则 称T是的充分统计量
二、充分统计量
三、最小充分统计量
最小充分统统计量 2.充分统计量 3.最小充分统计量
LOGO
一、统计量
目的: 样本中含有总体信息但较为分散,一般不宜 直接用于统计推断,常常是把样本中的信息加工 处理,用样本的函数形式集中起来,这类函数在 统计中就是统计量。 定义: 统计量是统计理论中用来对数据进行分析、检 验的变量。
意义: 样本中包含关于总体分布中未知参数的信息 ,是因为样本的联合分布与有关。对于统计量T ,如果知道它的值以后,样本的条件分布与无关 ,就意味着样本的剩余部分中不再包含关于的信 息,换言之,就是在T中包含了关于的全部信息 ,因此,要做关于的统计推断只需从T出发即可
三、最小充分统计量
定义: 当且仅当对于任意充分统计量X,存在一个确定 函数f,使得对于任意的X,S=f(T),则S是最小 充分统计量。 简要来说,最小充分统计量是在不损失信息的前 提下,不能进一步压缩的充分统计量。 意义: 一个分布族的充分统计量往往不止一个,它 们在“不损失信息”方面功能是相同的,为了取舍 ,我们就要比较它们在“压缩数据”上功能的大小 ,愈能压缩数据的充分统计量愈好。
充分统计量
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§6.4 充分统计量
我们先分析一下上节中导出的罗—克拉美不等式中等号成立的充要条件(6.26)。
∑=n i 1θ
θξ∂∂)(log ;f i =K (η-θ) 其中K 不依赖于1ξ,2ξ,…,n ξ而可能依赖于θ。
对这等式两端求对θ的积分,
θθθξd ;f n
i i ⎰∑=∂∂1)(log =C B A ++)()(θηθ(1ξ,2ξ,…,n ξ) 或者
log L =log ∏=n i x ;
f 1)(θ=C B y A ++)()(θθ( x 1,x 2,… ,x n ) (6.43)
这里y =u (x 1,x 2,… ,x n )。
由此得出,似然函数L (x 1,x 2,… ,x n )有形状
L=e )()(θθB A y +h (x 1,x 2,… ,x n ) (6.44)
这里h (x 1,x 2,… ,x n )=)
,x C ((x,n e 不依赖于θ,A (θ)和B (θ)只是θ的函数,所以使罗—克拉美不等式中等号成立的条件有下列两个:
(1)似然函数L 能分解成两个因子,即
L (θ;x 1,…,x n )=g (y ;θ)h (x 1,x 2,… ,x n ) (6.45)
其中第一个因子只依赖于y 和θ,第二个因子在y 值已知时不依赖于θ;
(2)第一个因子有指数型分布
g (y ;θ)=)()(θθB A y e + (6.46)
满足条件(1)的统计量η称为参数θ的充分统计量。
满足条件(2)的η的分布为指数型分布。
反过来,如果一个无偏估计是充分的,且其分布为指数型,那么这个就是一个有效估计。
下面我们将分别研究充分统计量和指数型分布。
在引入充分统计量的概念以前,我们先说明了的直观含义。
我们知道统计量是子样的函数,它把子样中所含的有关所研究问题的信息集中起来作为我们进行统计推断的依据。
由于统计量有很多,那么怎样的统计量是最佳的呢?直观的想法是,一方面要尽可能地简单,另一方面又要能提供子样所含的“全部信息”。
怎样理解“全部信息”呢?在数理统计学中,子样1ξ,2ξ,…,n ξ给我们提供了母体的信息。
如果母体的概率函数依赖于参数θ,子样当然也包含θ的信息,但是依赖于子样的统计量η却不一定包含θ的全部信息。
例如在一般情形下,子样的联合概率函数(即似然函数)能分解成
L (θ;x 1,…,x n )=g (y ;θ)h (x 1,x 2,… ,x n )
h (x 1,x …,x n ;θ)是条件η=y 下的条件概率函数,它一般是依赖于θ的函数。
如果θ未知,h (x 1,x …,x n ;θ)也就不可能知道,这时统计量η并没有反映子样所含有的“全部信息”,只有在不依赖于θ时,统计量η才反映了子样的“全部信息”。
正因为这一点,费歇命名这种反映“全部信息”的统计量为充分统计量。
例6.15(略)
从上面(6.44)式和例6.15看到,η为θ的一个充分统计量,子样的联合概率函数L 应该分解成两个因子,一个因子与η的概率函数有关,它可以依赖于未知参数θ,而另一个因子应该是η条件下子样1ξ,2ξ,…,n ξ的条件概率函数,它与θ无关。
由此我们引出充分统计量的定义。
定义6.7 设1ξ,2ξ,…,n ξ是取自具有概率函数);(θx f ,θ∈Θ的母体ξ
的一个容量为n 的子样。
设η=u (1ξ,2ξ,…,n ξ)是一个统计量,有概率函数);(θy g 。
若
]
);,,([);();();(121θθθθn n x x u g x f x f x f =h (x 1,…,x n ) (6.47) 成立,且每当y=u (x 1,… ,x n )取一固定值时,η=y 发生条件下的条件概率函数h
(x 1,x …,x n )不依赖于θ,则称η为θ的一个充分估计量。
例6.16 设母体ξ有密度函数
⎩
⎨⎧∞-∞=Θ∈∞<<=--其他,0),(,,);()(θθθθx e x f x 和)1(ξ<)2(ξ<…<)(n ξ是取自这个母体的子样的次序统计量。
由第五章定理5.5系2知最小次序统计量)1(ξ的密度函数为
);(θy g =⎩
⎨⎧∞<<--其他,0,)(y ne y n θθ 于是
)(min 1
)(1
21);();();();(i x n n i i y n n i i n ne x e ne n x e y g x f x f x f -=--=∑∑-=+-=θθθθθθ ,(1<i <n ) (6.48)
由于对一切i,i=1,2, …,n ,x i ≥y=min x j ,所以当y=min x j 取固定值时,(6.48)右端的式子不依赖于θ,且x i 的值域x i ≥y 也不依赖于θ。
从而证明了η=)1(ξ是θ的充分统计量。
例6.17(略)
定理6.2 设1ξ,2ξ,…,n ξ是取自具有概率函数);(θx f ,θ∈Θ的母体ξ的一个子样,则统计量η=u 1(1ξ,…,n ξ)一是个充分统计量的充要条件是存在两个非负函数K 1和K 2,使得等式
);(1θx f );(2θx f …);(θx f
= K 1[ u 1( x 1… ,x n );θ] K 2( x 1… ,x n ) (6.48) 成立,并且当y 1=u 1(x 1,… ,x n )取一定值时,函数K 2( x 1… ,x n )不依赖于θ。
(证明略)
例6.18(略)
例6.19(略)
我们知道达到罗—克拉美不等式下界的统计量的分布有指数形状。
下面我们来研究形式略为普遍一点的的指数分布族。
这种分布族包括正态分布族,二分布族,单参数分布族等许多常见的重要分布族,而且以后还会见到它们所含的参数具有充分统计量,因此在许多近代数理统计理论中起着重要作用。
在这里我们只介绍单参数情形。
一个分布族{}Θ∈θθ:x f );(,Θ={
}δθϑ<<:r ,其中r 和δ是常数,称做单参数指数族分布,如果存在定义在Θ上的实值函数c (θ)、d (θ)和定义在空间a <x <b 上的实值函数T (x)、S (x)使得
⎩⎨⎧<<++=其他,0)],()()()(exp[);(b x a x S d x T c x f θθθ (6.52) 这里);(θx f 为概率函数。
注意:这里T (x)和S (x)可以不唯一,但要强调的是a 和b 不能依赖于参数θ。
例6.20(略)
例6.21(略)
定理6.3 设随机变量ξ具有单参数指数族分布(6.52)。
1ξ,2ξ,…,n ξ为取自母体ξ的一个子样,则统计量∑=n
i i
T 1)(ξ是参数θ充分统计量。
(证明书略) 定理 6.4 设母体ξ具有概率函数);(θx f ,θ∈Θ,1ξ,2ξ,…,n ξ为取自这一母体的子样。
若未知参数θ有一个充分统计量η=u (1ξ,2ξ,…,n ξ)存在,
则似然方程
0log =∂∂θ
L (6.53) 的解一定是y=u (x 1,x 2,… ,x n )的函数。
(证明略)。