充分统计量

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§6.4 充分统计量

我们先分析一下上节中导出的罗—克拉美不等式中等号成立的充要条件(6.26)。

=n

i 1

θ

θξ∂∂)

(log ;f i =K (η-θ)

其中K 不依赖于1ξ,2

ξ

,…,n

ξ

而可能依赖于θ。对这等式两端求对θ的积分,

θθ

θξd ;f n

i i ⎰∑

=∂∂1

)

(log =C B A ++)()(θηθ(1ξ,2ξ

,…,n

ξ

或者

log L =log ∏=n

i x ;f 1

)(θ=C B y A ++)()(θθ( x 1,x 2,… ,x n ) (6.43)

这里y =u (x 1,x 2,… ,x n )。由此得出,似然函数L (x 1,x 2,… ,x n )有形状

L=e

)

()

(θθB A y

+h (x 1,x 2,… ,x n ) (6.44)

这里h (x 1,x 2,… ,x n )=)

,x C ((x,

n e

不依赖于θ,A (θ)和B (θ)只是θ的函

数,所以使罗—克拉美不等式中等号成立的条件有下列两个: (1)似然函数L 能分解成两个因子,即

L (θ;x 1,…,x n )=g (y ;θ)h (x 1,x 2,… ,x n ) (6.45)

其中第一个因子只依赖于y 和θ,第二个因子在y 值已知时不依赖于θ;

(2)第一个因子有指数型分布

g (y ;θ)=)

()(θθB A y e

+ (6.46)

满足条件(1)的统计量η称为参数θ的充分统计量。满足条件(2)的η的分布为指数型分布。反过来,如果一个无偏估计是充分的,且其分布为指数型,那么这个就是一个有效估计。

下面我们将分别研究充分统计量和指数型分布。

在引入充分统计量的概念以前,我们先说明了的直观含义。 我们知道统计量是子样的函数,它把子样中所含的有关所研究问题的信息集中起来作为我们进行统计推断的依据。由于统计量有很多,那么怎样的统计量是最佳的呢?直观的想法是,一方面要尽可能地简单,另一方面又要能提供子样所含的“全部信息”。 怎样理解“全部信息”呢?在数理统计学中,子样1ξ,2

ξ

,…,n

ξ

给我们提供了母

体的信息。如果母体的概率函数依赖于参数θ,子样当然也包含θ的信息,但是依赖于子样的统计量η却不一定包含θ的全部信息。例如在一般情形下,子样的联合概率函数(即似然函数)能分解成

L (θ;x 1,…,x n )=g (y ;θ)h (x 1,x 2,… ,x n )

h (x 1,x …,x n ;θ)是条件η=y 下的条件概率函数,它一般是依赖于θ的函数。如

果θ未知,h (x 1,x …,x n ;θ)也就不可能知道,这时统计量η并没有反映子样所含有的“全部信息”,只有在不依赖于θ时,统计量η才反映了子样的“全部信息”。正因为这一点,费歇命名这种反映“全部信息”的统计量为充分统计量。

例6.15(略)

从上面(6.44)式和例6.15看到,η为θ的一个充分统计量,子样的联合概率函数L 应该分解成两个因子,一个因子与η的概率函数有关,它可以依赖于未知参数θ,而另一个因子应该是η条件下子样1ξ,2ξ,…,n

ξ

的条件概率函数,它与θ无关。由此我们

引出充分统计量的定义。

定义6.7 设1ξ,2

ξ

,…,n

ξ

是取自具有概率函数);(θx f ,θ∈Θ的母体ξ

的一个容量为n 的子样。设η=u (1ξ,

2

ξ,…,

n

ξ)是一个统计量,有概率函数);(θy g 。

]

);,,([)

;();();(121θθθθn n x x u g x f x f x f =h (x

1

,…,x n ) (6.47)

成立,且每当y=u (x 1,… ,x

n

)取一固定值时,η=y 发生条件下的条件概率函数h

(x 1,x …,x n )不依赖于θ,则称η为θ的一个充分估计量。 例6.16 设母体ξ有密度函数

⎨⎧∞-∞=Θ∈∞<<=--其他,0)

,(,,);()(θθθθx e x f x

和)

1(ξ

<)2(ξ<…<)(n ξ是取自这个母体的子样的次序统计量。

由第五章定理5.5系2知最小次序统计量)

1(ξ

的密度函数为

);(θy g =⎩

⎧∞

<<--其他

,0,)

(y ne

y n θθ

于是

)

(min 1

)

(1

21)

;()

;();();(i x n n

i i

y n n

i i n ne

x e ne

n x e y g x f x f x f -=--=∑

-=

+-=

θθ

θθθθ ,(1

由于对一切i,i=1,2, …,n ,x i ≥y=min x j ,所以当y=min x j 取固定值时,(6.48)右端的式子不依赖于θ,且x i 的值域x i ≥y 也不依赖于θ。从而证明了η=)

1(ξ

是θ的充分统计量。

例6.17(略)

定理6.2 设1ξ,2

ξ

,…,n

ξ

是取自具有概率函数);(θx f ,θ∈Θ的母体ξ

的一个子样,则统计量η=u 1(1ξ,…,n

ξ)一是个充分统计量的充要条件是存在两个非

负函数K 1和K 2,使得等式

);(1θx f );(2θx f …);(θx f

= K 1[ u 1( x 1… ,x n );θ] K 2( x 1… ,x n ) (6.48) 成立,并且当y 1=u 1(x 1,… ,x n )取一定值时,函数K 2(

x

1

… ,x n )不依赖于θ。

(证明略)

例6.18(略) 例6.19(略)

我们知道达到罗—克拉美不等式下界的统计量的分布有指数形状。下面我们来研究形式略为普遍一点的的指数分布族。这种分布族包括正态分布族,二分布族,单参数分布族等许多常见的重要分布族,而且以后还会见到它们所含的参数具有充分统计量,因此在许多近代数理统计理论中起着重要作用。在这里我们只介绍单参数情形。 一个分布族{}Θ∈θθ:x f );(,Θ={}δθϑ<<:r

,其中r 和δ是常数,称做单参

数指数族分布,如果存在定义在Θ上的实值函数c (θ)、d (θ)和定义在空间a

⎨⎧<<++=其他,0)],()()()(exp[);(b

x a x S d x T c x f θθθ (6.52)

这里);(θx f 为概率函数。

注意:这里T (x)和S (x)可以不唯一,但要强调的是a 和b 不能依赖于参数θ。

例6.20(略) 例6.21(略)

定理6.3 设随机变量ξ具有单参数指数族分布(6.52)。1ξ,2

ξ

,…,n

ξ

为取

自母体ξ的一个子样,则统计量∑=n

i i T 1

)(ξ是参数θ充分统计量。(证明书略)

定理 6.4 设母体ξ具有概率函数);(θx f ,θ∈Θ,1ξ,2

ξ

,…,n

ξ

为取

自这一母体的子样。若未知参数θ有一个充分统计量η=u (1ξ,2

ξ

,…,n

ξ

)存在,