充分统计量

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n
P( xi , ) h( x1, x2 ,L , xn )g(T ( x1, x2 ,L , xn ), )
i 1
其中h是x1, x2 ,L , xn的非负函数且与无关,g仅通
过T依赖于x1, x2 ,L , xn .
证明:对离散随机变量证明.
必要性 即已知 P( X1 x1, , Xn xn | T t)与无关
2π )n
2
因而,X 是充分统计量
例 设总体有概率分布
f
(x;
)
e
x!
x
,
0,
x
0,1,
2L
0 , 其它
从中取得样本(1,2 ),其观测值为(1, 2) .问
=21+2 是否 的充分统计量?
解:
当1=1,2 2 时,=21+2 4 ,而=4 时的概
率函数
g(4, ) P(1 0,2 4) P(1 1,2 2) P(1 2,2 0)
n1
P( X 1 x1 , , X n1 xn1, X n t xi )
i 1 n
P( X i t)
i 1
n1
n1
P( Xi xi ) P( X n t xi)
i1
i 1
n t
t
(1
)nt
n 1
n 1
n1
t xi
1t xi
xi (1 )1xi i1 (1 ) i1
i1
n t
t
(1
)
nt
t (1 )nt
n t
t
(1
)
n
t
1
n t
该条件分布与
无关
P( X1 x1, , X n xn | S s x1 x2 )
P( X 1 x1, X 2 s x2 , X 3 x3 , X n xn , ) P(X1 X 2 s)
n
n
s xi
n
一个样本,试证 T(X1, X2 ,L , Xn ) ( X ,
X
2 i
)
i 1
是参数 =(, 2)的联合充分统计量.

L( )
1
e
{
1 2
2
n
( xi )2 }
i 1
( 2π )n
(
1
1
2π )n exp{ 2 2
n i 1
xi2
n 2
n 2 x 2 2 }
n
其中T ( x1, x2 ,L , xn ) ( x, xi2 ) , h( x1, x2 ,L , xn ) 1, i 1
是一个样本,T ( X1, X2 ,L , Xn )是一个统计量,则T
是的充分统计量的充要条件是:样本的联合分布
密度可以分解为
n
L( ) f ( xi , ) h( x1, x2 ,L , xn )g(T ( x1, x2 ,L , xn ), ) i 1
其中h是x1, x2 ,L , xn的非负函数且与无关,g仅通
, xn ),
p) (1
p)n ( p )nT , 1 p
因而,X 是充分统计量
例 设( X1, X2 ,L , Xn )T 是来自泊松分布P()的一个样本,
试证X
1 n
n i 1
X i是参数的充分统计量.
n
xi

i1
P{ X1 x1, X 2 x2 ,L , X n xn } n
统计量,当给定T
t时,若样本(X1 , X2 ,L
,
X
)T的
n
条件分布(离散总体为条件概率,连续总体为条件密度)与参
数 无关,则称T为的充分统计量.
例 设总体为泊松分布 P(),X1, , X n 为样本,令
T X1 Xn
则在给定 T 的取值后,对任意的一组
n
x1, , xn ( xi t) i 1
n
n
xi
n xi
p i1 (1 p) i1 (1 p)n (
p xi ) i1
1 p
n
xi
1g(1 p)n (
p
n i1
)n
1g(1 p)n(
p )nX
1 p
1 p
其中T ( x1, x2 ,L , xn ) X , h( x1, x2 ,L , xn ) 1,
g(T ( x1, x2 ,L
P( X1 x1, , X n xn | T t)
n1
P( X 1 x1 , , X n1 xn1, X n t xi )
i 1 n
P( X i t)
i 1
n 1
e e n1 xi
(t xi )
i 1
i1 xi!
n1
(t xi )!
i 1
(n)t en
n1
i1
充分性 P(T t , )
P( X , , X ; {( x1, ,xn ):T ( x1, ,xn )t }
1
n
)
g(t ,
{( x1, ,xn ):T ( x1, ,xn )t }
)h( x1,
, xn )
P( X1 x1, , Xn xn | T t)
P(X1
x1, , X n xn ,T
例如,设总体服从N (, 2 ),用X , S2 ,
去估计总体的和 2, X , S 2是否将和 2的信息完全提
炼出来呢?
设样本 x=(x1,x2,…,xn) 分布F (x),
统计量T =T (x1,x2,…,xn) 抽样分布FT(t) ,
分析两个分布的区别:
1.抽样分布 FT(t) 有可能包含有关的信息; 2. F(x) 概括了有关 的一切信息。
取T =x(n),并令 g(t ; )= (1/)nIt, h(x)=1, 由因子分解定理知T =x(n) 是 的充分统计量。
P(T t; )
t;
)
P(X1
x1, , X n
P(T t; )
xn; )
g(t, )h( x1, , xn )
g(t, )
h( x , , x ) {( x1, ,xn ):T ( x1, ,xn )t }
1
n
h( x1, , xn )
h( x , , x ) {( x1, ,xn ):T ( x1, ,xn )t }
x )2
n (
2
x)2 }
(
1 2π )n
exp{
1 2
n i 1
( xi
x)2 }exp{
n (
2
Fra Baidu bibliotek
x)2 }
其中T ( x1, x2 ,L , xn ) x,
h( x1, x2 ,L
,
xn
)
exp{
1 2
n
( xi
i 1
x )2 }
g(T ( x1, x2 ,L , xn ), ) (
1 exp{ n ( T )2 },
e 4e e 2e e 2e
4!
2!
2!
e2 ( 4 3 2 )
4! 2! 2!
f (1, ) f (2, ) e2 2
e2 (4
3
2
)
g(4, )
2
4! 2! 2!
12
12 12
2
由充分统计量的定义知,=21+2 不是 的
充分统计量.

设( X1, X2 ,L , Xn ) 是来自正态总体N(, 2 )的
1 xi! (t
1
n1
xi )!
i 1
(n)t
t!
t!
该分布与参数 无关。说明T是 的充分统计量。
同理:T/n也是 的充分统计量。
二、因子分解定理
1. 充分统计量的判别准则 定理2.3(因子分解定理)(Fisher-Nerman准则) (1) 连续型情况
设总体X具有分布密度f ( x, ),( X1, X2 ,L , X n )T
g(T ( x1, x2 ,L , xn ), ) (
1
1
2π )n exp{ 2 2
n i 1
xi2
n 2
x
n 2
2 2
},因而,T
(
x1
,
x2
,L
, xn ) ( x,
n i 1
xi2 )是充分统计向量。
进一步,我们指出这个统计量与 (x, s2 )
是一一对应的,这说明在正态总体场合
常用的 ( x , s2 ) 是充分统计量。
令A(t) {X :T(X ) t},则当X A(t)时
{T t} {X1 x1, , Xn xn }
P( X1 x1, , Xn xn; ) P( X1 x1, , Xn xn ,T t; ) P(X1 x1, , Xn xn | T t)P(T t; ) h(x1, , xn )g(t, )
例5.5.4 设x1, x2, …, xn是取自总体U(0, )的样本,
即总体的密度函数为
1/ , 0 x
p(x ; )=
0,
其他
于是样本的联合密度函数为
(1/)n, 0minximaxxi
p(x1;)…p(xn;)= 0,
其它
由于诸xi0,所以我们可将上式改写为
p(x1;)…p(xn;) = (1/)nIx(n)
ns xi
i3 (1 ) i3
2 s
t
(1
)2t
n
n
xi
n2 xi
i3
(1 )
i3
2
s
该条件分布与 有关。
2. 定义
1922年英国统计学家Fisher提出了描述总体信息 是否被完全提炼的概念—充分统计量.
定义 设X1 , X2 ,L , Xn是来自总体X具有分布函数
F ( x, )的一个样本,T T ( X1 , X2 ,L , Xn )为一个
1
n
与无关
说明:
如果参数为向量时,统计量T也是随机向量,例如
(, 2 ),则相应的统计向量可以为T (X, S2).
以下将通过几个例子来说明判别法则的应用
例 根据因子分解定理证明
X是两点分布b(1, p)的充分统计量。
解 P{ X1 x1, X 2 x2 ,L , X n xn }
n
(1) 打靶10次命中8次;
(2) 2次不命中分别出现在第3次和第6次 打靶上。
第二种信息对了解该运动员的命中率是没有什 么帮助的。
设我们对该运动员进行n 次观测,得到 x1, x2,…, xn,
每个xj 取值非0即1,命中为1,不命中为0。 令 T = x1+…+xn ,
T为观测到的命中次数。
统计上将这种“样本加工不损失信息”称为“充分性”
§5.5 充分统计量
样本中所包含的关于总体分布的信息分为两部分: ➢ 总体结构的信息; ➢ 总体分布中未知参数的信息;
一个“好”的统计量,应该能把样本中包含总 体的信息全部提炼出来,即不损失信息的统计 量——充分统计量。
5.5.1 充分性的概念
例5.5.1 为研究某个运动员的打靶命中率,我们 对该运动员进行测试,观测其10次,发现除第 三、六次未命中外,其余8次都命中。这样的 观测结果包含了两种信息:
e n
n
xi
xi ! i 1
1
n
1 n i1 n
n
e n
nX e n
xi !
xi !
其中T ( x1,ix12 ,L , xn ) X , h( xi1,1x2 ,L , xn )
1
n
,
xi !
i 1
g(T ( x1, x2 ,L , xn ), ) e nT n ,
因而,X 是充分统计量
在统计量T 的取值为 t 的情况下样本 x 的条件 分布F(x|T=t) 已不含 的信息,这正是统计量
具有充分性的含义。
设总体为二点分布 b(1, ) ,X1, , X n 为样本,令
T X1 Xn
则在给定 T 的取值后,对任意的一组
n
x1, , xn ( xi t) i 1
P( X1 x1, , X n xn | T t)

设( X1, X2 ,L , Xn )T 是来自正态总体
N(,1)的一个样本,试证X
1 n
n i 1
X i是参数的充
分统计量. 解
L( )
(
1
{ 1
e 2
n i 1
(
xi
)2
}
2π )n
(
1 2π )n
exp{
1 2
n i 1
( xi
x
x
)2
(
1 2π )n
exp{
1 2
n i 1
( xi
过T依赖于x1, x2 ,L , xn .
(2) 离散型情况
设总体X的分布律P{ X xi } p( xi , ),(i 1, 2,L ),
( X1, X 2 ,L , X n )T 是一个样本,T ( X1, X 2 ,L , X n )是一
个统计量,则T是的充分统计量的充要条件是:
样本的联合分布律可以分解为
相关文档
最新文档