充分统计量与完备统计量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总有
P g1 (T ) g2 (T ) 0 1, ,
即式(1.7)成立。
例 1.8 设 X 1 , X 2 ,, X n 是来自两点分布 B(1, p)的样本。
1 n 由例 1.3 知 X X i 是的 p 充分统计量。 下面验证 X 也 n i 1
i 1
i 1 n
n
的一个联合充分统计量。此时,显然不能说 x i2 是 2 的
i 1
n
充分统计量。
定理 1.4 设T T ( X 1 , X 2 ,, X n )是 的一个充分统计量,
f (t )是单值可逆函数,则 f (T ) 也是 的充分统计量。
三、完备统计量
为了介绍完备统计量的概念,首先需要引入完备分 布函数族的概念。
其中 h( x1 , x2 ,, xn ) 1 ,
而 g (T ( x1 , x2 , , xn ); ) 显 然 是 T ( x , xi2 ) 和 ( , 2 ) 的函数。 故由因子分解定理知 T ( X , x i2 ) 是 ( , 2 )
完备统计量的含义不如充分统计量那么明确,但由
定义可见它有如下特征:
P g1 (T ) g2 (T ) 1, E g1 (T ) E g2 (T ), 。
(1.7)
对于一般的统计T T ( X 1 , X 2 , , X n ) ,总有
P g1 (T ) g2 (T ) 1 , E g1 (T ) E g2 (T ), ,
若T 是完备统计量,即T 的分布函数族是 但反之不成立, 完备分布函数族,则有由定义 1.5 知,对于
E g1 (T ) g2 (T ) 0 , ,
nT
n
x!
i i 1
则 P X 1 x1 , X 2 x2 , , X n xn
h( x1 , x2 , , xn ) g (T ( x1 , x2 , , xn ); )
T ( X 1 , X 2 , , X n ) X 是 的充分统计量。 由因子分解定理知,
第二种信息对了解该运动员的命中率是没有 什么帮助的。
一般地,设我们对该运动员进行n 次观测,得
到 x1, x2,…, xn,每个xj 取值非0即1,命中1,不 命中为0。 令 T = x1+…+xn ,T为观测到的命中次数。
在这种场合仅仅记录使用T 不会丢失任何与命中
率 有关的信息。 显然,一个“好”的统计量应该能够将样本 中所包含的关于未知参数的信息全部提炼出来, 而不没有任何有用信息损失,这就是英国著名统
例1.4 根据因子分解定理证明例1.3。 证明 样本的联合分布律为
PX 1 x1 , X 2 x2 ,, X Βιβλιοθήκη Baidu xn p
I 1 N
xi
(1 p)
n
n
x
i 1
n i i 1
n
i
若取
1 n T ( x1 , x2 , , xn ) xi n i 1
i 1 n
,
(1.3) 其中 h 是 x1 , x2 ,, xn 的非负函数且 无关, g 仅通过 T 依赖 于 x1 , x2 ,, xn 。
2)离散型情况:设总体 X 的分布律为 P X xi p(xi ; )(i 1,2,),T(X1 , X2 ,, Xn ) 一个统计量, 则T 是 的充 分统计量的充要条件是:样本的联合分布律可表示为
定义 1.5 设总体 X 的分布函数族为F ( x; ), , 若对任意一个满足
E g( X ) 0 ,对一切
(1.5) (1.6)
的随机变量 g( X ),总有
P g( X ) 0 1,对一切 ,
则称F ( x; ), 为完备的分布函数族。
定义 1.6
设 ( X 1 , X 2 ,, X n ) 为来自总体 F ( x; )( )
的一个样本,若统计量T T ( X 1 , X 2 ,, X n ) 的分布函数 族 FT ( x; ), 是 完 备 的 分 布 函 数 族 , 则 称
T T ( X 1 , X 2 ,, X n )为完备统计量。
为了推断总体分布的未知参数,需要把样本中
关于未知参数的信息“提炼“出来,即构造合适
的统计量——样本的函数 f(X1,X2,…,Xn)
例 为研究某个运动员的打靶命中率,我们对该 运动员进行测试,观测其10次,发现除第三、六 次未命中外,其余8次都命中。这样的观测结果包 含了两种信息:
(1)打靶10次命中8次; (2)2次不命中分别出现在第3次和第6次打靶上。
P X 1 x1 , X 2 x2 , , X n xn
1 n 若取 T ( x1 , x2 ,, xn ) xi h( x1 , x2 , , xn ) n i 1
i 1
n i 1
n
xi e n
i
n
x !
1
g(T ( x1 , x2 ,, xn ); ) e
定理 1.3 (因子分解定理) (1)连续型情况:设总体 X 具有分布密度
f ( x; ), ( X 1 , X 2 ,, X n ) 是一样本,T ( X 1 , X 2 ,, X n ) 是一个统
计量,则T 为 的充分统计量的充要条件是:样本的联合分布 密度函数可以分解为
L( ) f ( xi ; ) h( x1 , x2 , , xn ) g (T ( x1 , x2 , , xn ); )
与 p 无关,所以 X 为 p 的充分统计量.
定义
设 X 1 , X 2 ,, X n 为来自总体 X 的样本,X 的分
布函数为 F x; ,T=T( X 1 , X 2 ,, X n )为一个统计量, 当给定 T=t 时,如果样本( X 1 , X 2 ,, X n )的条件分布 (离散总体时为条件概率,连续总体时为条件密度) 与参数 无关,则称 T 为参数 的充分统计量。
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1 n n xi n xi n p i 1 (1 p ) i 1 , 如 果 xi k, k k nk C n p (1 p ) i 1 n 0 , 如 果 xi k, i 1 n 1 C k , 如果 xi k, i 1 n n 0, 如果 xi k, i 1
例 1.7 设 X 1 , X 2 ,, X n 是来自正态总体 N ( , 2 ) 的一个 样 本 , 试 证 T ( X 1 , X 2 , , X n ) ( X , X i2 ) 是 关 于
i 1 n
( , 2 )的联合充分统计量。
证明 样本的联合分布密度为
1 n p 由因子分解定理知,T ( X 1 , X 2 , , X n ) X i X 是 n i 1
的
充分统计量。
例 1.5
设 X 1 , X 2 ,, X n 是来自泊松分布 P( ) 的一个样本,
试证明样本均值 X 是 的充分统计量。
证明
样本( X 1 , X 2 , , X n ) 的联合分布律为
1
n 1 2 L( ) exp ( xi ) n 2 ( 2 ) 2 i 1
n 2 1 n 2 n exp xi 2 x n 2 2 ( 2 ) 2 2 i 1 1
h( x1 , x2 , , xn ) g (T ( x1 , x2 , , xn ); ) ,
对统计量 T,如果已知它的值以后,样本的条件分布 与 无关,就意味着样本的剩余部分中已不再包含关于 的信息, 也就是在 T 中已包含有关 的全部信息。 因此, 对 的统计推断只需要从 T 出发即可, 不再需要样本数据。
二、 因子分解定理
根据充分统计量的含义,在对总体未知参数进 行推断时,应在可能的情况下尽量找出关于未知参 数的充分统计量。 但从定义出发来判别一个统计量是否是充分统 计量是很麻烦的。 为此,需要一个简单的判别准则。下面给出一 个定理——因子分解定理,运用这个定理,判别甚 至寻找一个充分统计量有时会很方便。
X
i 1
n
i
B ( n, p ) ,即有
k P(nX k ) Cn pk (1 p)nk , k 0,1,, n.
设 x1 , x 2 , , x n ,为样本观测值,其中 x i 0 ,1 . 如果已
k 知 X 则样本 X 1 , X 2 , , X n 的条件概率 n
p x (1 p ) ( ) 1 p
h( x1 , x2 ,, xn ) 1
n
p nT g(T ( x1 , x2 ,, xn ); p) (1 p) ( ) 1 p
则有 PX 1 x1 , X 2 x2 ,, X n xn
h( x1 , x2 , , xn ) g (T ( x1 , x2 , , xn ); p )
P X 1 x1 , X 2 x2 , , X n xn P X xi
i 1 n
h( x1 , x2 ,, xn ) g(T ( x1 , x2 ,, xn ); )
(1.4)
其中 h 是 x1 , x2 ,, xn 的非负函数且与 无关,g 仅通过 T 依 赖于 x1 , x2 ,, xn 。
P ( X 1 x1 , X
2
x 2 , , X
2
n
xn
n
k X ) n
P ( X 1 x1 , X
x 2 , , X k P(X ) n
k xn , X ) n
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1
计学家Fisher于1922年提出的一个重要的概念----充分统计量。
样本X1,X2,…,Xn 有一个样本分布F(x),这个 分布包含了样本中一切有关的信息。统计量T
=T(X1,X2,…,Xn) 也有一个抽样分布FT(t) 。
当我们期望用统计量T 代替原始样本并且不 损失任何有关 的信息时,也就是期望抽样分布 FT(t) 像 F(x) 一样概括了有关 的一切信息。 这即是说在统计量T 的取值为 t 的情况下 样本 x 的条件分布F(x|T=t) 已不含 的信息, 这正是统计量具有充分性的含义。
例. 设总体 X 服从两点分布 B(1, p) ,即
x 1 x p (1 p ) P(X=x)= ,x=0,1,
其中 0<p<1, ( X 1 , X 2 ,, X n ) 为来自总体 X 一个样本,
1 研究统计量 X n
X
i 1
n
i
。
因为 X i B(1, p) ,所以 n X
§1.2 充分统计量与完备统计量
一 充分统计量
在数理统计中,由样本来推断总体的前提是:样本 包含了总体分布的信息。样本中包含的关于总体分布 的信息可分为:
1、关于总体结构的信息,即反映总体分布的类型。 如总体服从正态分布,则来自该总体的样本相互独 立并均服从该正态分布,即样本包含了总体分布为 正态分布的信息。 2、关于总体未知参数的信息,这是由于样本的分 布中包含了总体分布中的未知参数。