充分统计量与完备统计量
数理统计定理及公式
3、贝叶斯风险
风险函数(, ) = ,(, )- = ∫ (, )(|)关于 再求期望,得
() = ∫ (, ) π() = ∬ (, )(|)π()
= ∬ (, )() (|) = ∫ () ∫ (, ) (|)
1、假设检验的基本概念
(1)拒绝域: = {: ∈ Ω,使0 否定}
1, ∈
(2)检验函数δ() = {
0, ∉
(3)两类错误的概率及检验水平
①第一类错误(弃真)②第二类错误(存伪)
③检验水平:检验犯第一类错误的概率
(4)势函数()
{
() = , ∈ 0
(1)矩估计法(以样本 k 阶矩估计总体 k 阶矩)
= ∫ () = ̅
1
2 = ∫ 2 () = ∑ 2 = 2 + ̅ 2
=1
{
⋮
(2)极大似然估计法
似然函数(联合密度)() = ∏=1 ( ; )
()
= 0,解得̂即为最大似然估计量,当求导无解时,结合次序统计量的概念及的
4、有效估计(方差达到罗-克拉默下界的估计)
(1)信息不等式
2
ln(; )
2 ln(; )
() = E *
+ = −E *
+
2
(2)罗-克拉默下界
D(()) ≥
1
()
(3)有效估计⇒最小方差无偏估计;但最小方差无偏估计⇏有效估计
5、区间估计
(1)置信度:1 −
①~(0,1),Y~ 2 ()且独立,则 =
√/
~()
② = 0, = −2
太原理工大学数理统计课件第1.2节 充分统计量与完备统计量教材
解 P { X1 x1 , X 2 x2 ,
1
n
, X n xn }
n
n
i
i 1
xi
x !
i 1 i
e n
x !
i 1 i
n
n
i 1
n
e
1
x !
i 1 i
n
nX e n
1 , g(T ( x1 ,
其中T ( x1 , x2 , x2 ,
例5(p9 例1.7) 设( X1 , X 2 ,
n
, X n )T 是来自正态总体 , Xn ) (X ,
N( , 2 )的一个样本,试证T(X 1 , X 2 ,
i 1
2 T 2 T X ) 是参数 =( , ) 的联合充分统计量. i
解 L( )
1
1 ( 2π )n
k P{ X1 x1 , X 2 x2 , , X n xn | X } n k P{ X1 x1 , X 2 x2 , , X n xn , X } n k P{ X } n P{ X1 x1 , X 2 x2 , , X n xn , nX k } P{nX k } n P{ X1 x1 , X 2 x2 , , X n xn , X i k } i 1 n P { X i k }
n i 2 i 1
( 2 π )n 1 1 n 2 exp{ ( x x x ) i n 2 ( 2π ) i 1 1 1 n n 2 2 exp{ ( x x ) ( x ) } i n 2 i 1 2 ( 2π )
1 n n 2 2 exp{ ( x x ) }exp{ ( x ) } i n 2 i 1 2 ( 2π ) 1
充分统计量与完备统计量
T=( X , ∑ X i2 )是 θ = ( µ ,σ 2 ) 的一个联合充分统计量.此时,显
i =1
然不能说 ∑ X i2 是 σ 2 的充分统计量.(因在估计 σ 2 时,仅
i =1
n
用 ∑ X i2 是不够的)
i =1
n
定理 1.4 设 T= T ( X 1 , X 2 ," , X n ) 是 θ 的一个充分统计 量,f(t)是单值可逆函数, 则 f(T)也是 θ 的充分统计量. 本定理说明,一个参数的充分统计量是不唯一的. 三、完备统计量 为了介绍完备统计量的概念,首先需要引入完备分 布函数族的概念。1 Nhomakorabea i ≤ n
例 1.7
设 ( X 1 ,..., X n )T 是来自正态总体 N( µ ,σ 2 )的一个样
n
本 , 试 证 明 T ( X 1 , X 2 ," , X n ) =( X , ∑ X i2 ) 是 关 于
i =1
θ = ( µ ,σ 2 ) 的联合充分统计量.
证明
L(θ ) =
1 n ∑ xi , n i =1
h ( x1 , x2 ," , xn ) = 1 / ∏ xi !
i =1
n
g(T ( x1 , x2 ," , xn ) ; λ )= λnT e − nλ , 则
P{ X 1 = x1 , X 2 = x2 ," , X n = xn }
= h ( x1 , x2 ," , xn ) g(T ( x1 , x2 ," , xn ) ; λ ). 由因子分解定理知,T ( X 1 , X 2 ," , X n ) = X 是 λ 的充分统计量. 例 1.6 设 ( X 1 ,..., X n )T 是来自正态总体 N( µ ,1)的一个样本,
充分统计量与完备统计量
完备统计量的含义不如充分统计量那么明确,但由
定义可见它有如下特征:
P g1 (T ) g2 (T ) 1, E g1 (T ) E g2 (T ), 。
(1.7)
对于一般的统计T T ( X 1 , X 2 , , X n ) ,总有
对统计量 T,如果已知它的值以后,样本的条件分布 与 无关,就意味着样本的剩余部分中已不再包含关于 的信息, 也就是在 T 中已包含有关 的全部信息。 因此, 对 的统计推断只需要从 T 出发即可, 不再需要样本数据。
二、 因子分解定理
根据充分统计量的含义,在对总体未知参数进 行推断时,应在可能的情况下尽量找出关于未知参 数的充分统计量。 但从定义出发来判别一个统计量是否是充分统 计量是很麻烦的。 为此,需要一个简单的判别准则。下面给出一 个定理——因子分解定理,运用这个定理,判别甚 至寻找一个充分统计量有时会很方便。
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1 n n xi n xi n p i 1 (1 p ) i 1 , 如 果 xi k, k k nk C n p (1 p ) i 1 n 0 , 如 果 xi k, i 1 n 1 C k , 如果 xi k, i 1 n n 0, 如果 xi k, i 1
其中 h( x1 , x2 ,, xn ) 1 ,
而 g (T ( x1 , x2 , , xn ); ) 显 然 是 T ( x , xi2 ) 和 ( , 2 ) 的函数。 故由因子分解定理知 T ( X , x i2 ) 是 ( , 2 )
充分统计量_完备统计量_指数分布族
为T X 的函数,而另一个仅为 x 的函数,与参数 无关,则T X 是 的充分统计量.
2.完备性
1)定义: F { p(x; ), },设 g(x) 是定义在样本空间 上的一个实函数,一般来
说,积分(如果存在) E[g(x)] g(x) p(x; )dx ( ),因此上述积分(数学
}
exp{
x2 2 2
x 2}
其中 c(, )
1 2
exp{
2 2 2
},
c1
(
,
)
2
, c2 (,
)
1 2
2
h(x) 1,T1(x) x,T2 (x) x2
伽玛分布族:
p ,
(x)
( )
x 1ex
exp{ x ( 1) ln x} ( )
c( , ) exp{c1( , )x c2 ( , ) ln x}, x 0
计 量 T T (X1, X2,, Xn ) 称 为 的 充 分 统 计 量 , 如 果 在 给 定 T 的 取 值 后 ,
X1, X 2 ,, X n 的条件与 无关.
即不包含关于参数的信息
2)定理 5.5.1(因子分解定理 Factorization Theorem):设总体概率函数为 f (x; ) ,
P
X
x
T
X
t
P
X P
x,T
T X
X t
t
P P T t
0.
也与 无关.因此,条件分布 f x t f x t 与无关,即T X 是的充分统计量.
必要性 设 T X 是 的充分统计量,由充分统计量的定义, P X x T X t 与
参数 无关,它是 x 的函数,记为 h x. 于是,对任意固定的 t ,当 x At 时,T x t
完备统计量的定义
完备统计量的定义
完备统计量是数理统计的一个概念。
它满足以下两个条件:
1. 完全由样本决定:即当样本含量大于等于3时,任何可以由样本统计量所决定的统计量都可以由完备统计量所决定。
2. 独立于样本:即当样本含量为偶数时,样本中所有数据被独立随机选取一次,则所有数据均被独立地赋予一个样本数据,统计量与样本无关。
在数理统计中,统计量是一类基于样本数据的数学工具,通常用于描述样本数据的特征。
它通常由样本中的一些数值型变量(如平均值、方差、比例等)来定义。
与随机变量相比,统计量更加直观,也更易于理解。
在实际应用中,根据统计量的不同形式,可以通过一定的算法来处理数据并进行分类、预测等工作。
充分完备统计量
(X1, …, Xn )为一个样本,则 T=T(X1,… Xn) 为充分统
计量的充分必要条件是:样本的联合分布密度函数 可以分解为 f(x1, x2,…, xn; ) =g(T(x1,x2,…,xn); )h(x1,x2,…,xn) 其中g(t, )是通过统计量 T 的取值而依赖于样本的。
例 设x1, x2, …, xn是取自总体U(0, )的样本,即总
第二种信息对了解该运动员的命中率是没有什 么帮助的。一般地,设我们对该运动员进行n 次观
测,得到 x1, x2,…, xn,每个xj 取值非0即1,命中为
1,不命中为0。令 T = x1+…+xn ,T为观测到的命 中次数。在这种场合仅仅记录使用T 不会丢失任何 与命中率 有关的信息,统计上将这种“样本加 工不损失信息”称为“充分性”。
本(X1, X2,…, Xn )的条件分布与参数 无关.
对于统计量 T 在已知它的值后,样本的条件分
布与参数 无关,就意味着样本的剩余部分中不包
含 的信息;换言之,在T 中包含了 的全部信息。 因此,要做关于则 在统计学中有一个基本原则--在充分 统计量存在的场合,任何统计推断都可以基于充 分统计量进行,这可以简化统计推断的程序。 定理 设总体 X 概率具有分布密度函数为 f(x ; ),
是一一对应的,这说明在正态总体场合
常用的 ( x , s2 ) 是充分统计量。
§1.3 充分与完备统计量
一.充分统计量 引例: 为研究某个运动员的打靶命中率,我们 对该运动员进行测试,观测其10次,发现除第三、
六次未命中外,其余8次都命中。这样的观测结果
包含了两种信息: (1) 打靶10次命中8次; (2) 2次不命中分别出现在第3次和第6次打靶 上。
充分统计量
充分统计量充分统计量又称足够的样本容量,是指一个总体能从各种可能中得到它所需要的资料。
这里需说明的是“全部”并不等于每个个体都被收集起来加以考察。
这也就是为什么有些人很忙,但工作成效却很低的原因。
只有对总体进行研究后才能发现其规律性和特征,而大量重复就会使统计工作变得无用,而且费力。
另外,抽样时还必须保证总体中每个个体都具有同质性或相似性。
根据这两点,充分统计量应该满足:(1)当总体中任何一个个体值均落入某一区间内时,则认定此数据已达到了充分统计量;(2)若总体中存在非随机误差项,那么在估算充分统计量时,将其剔除出去,再求解,直至误差消失为止。
我们在作调查时,常遇见这类问题:“你家几口人?”、“你今年多少岁啦!”…诸如此类的提问方式显然没有经过严格的科学论证,甚至连最基础的概率知识都未掌握。
试想,假设甲乙丙三位老师同时向100名小朋友询问上述问题,结果会怎样呢?答案肯定是令人吃惊的!由此看来,我们平日里做事情,尤其是搞社会调查活动,切忌凭主观臆断下结论,更不能道听途说,盲目地给别人贴标签。
俗话说:“凡事预则立,不预则废。
”正确运用好充分统计量,关系着整个调查报告的质量高低与否。
如果调查者缺乏专业素养,往往会导致错误的判断,造成决策失误。
例如,前面讲到的美国人口普查局的一次实验。
他们选择了一批6-10岁儿童,让他们填写自己父母亲的职业,并把这份表交回来,请他们的父母评价孩子的智商水平。
这个实验虽然取得了良好的效果,但是却留下了许多疑惑——为什么受测者的父母对孩子的智商竟毫无觉察呢?难道真像他们所宣传的那样,他们天生愚钝吗?通过仔细推敲,他们终于找到了症结所在:原来,这群孩子之所以智商偏低,完全是因为他们的父母压根儿就没有意识到自己的孩子智商比较低罢了。
充分统计量的定义
充分统计量的定义
充分统计量对于给定的统计推断问题,包含了原样本中关于该问题的全部有用信息的统计量。
对于未知参数的估计问题,保留了原始样本中关于未知参数θ的全部信息的统计量,就是充分统计量。
如样本均值X是总体数学期望的充分统计量。
数学上,设(X₁,…,Xₑ)是来自总体X的一个随机样本,T=T(X₁,…,Xₑ)是一统计量。
若在T=t 的条件下,样本的条件分布与未知参数θ无关,则称统计量T是θ的充分统计量。
充分统计量的基本介绍:
样本中包含关于总体的信息可分为两部分:其一是关于总体结构的信息,即反映总体分布的结构;其二是关于总体中未知参数的信息,这是由于样本的分布中包含了总体分布中的未知信息。
我们对信息的加工只会减少,不会增多,即统计量具有压缩数据功能,但会凸显我们需要的信息。
那么一个好的统计量应该能将样本中包含未知参数的全部信息提取出来,即样本加工不损失未知参数的信息称为充分性。
如何将这一想法用数学形式表示呢?费希尔在1922年提出了一个重要概念——充分统计量计量。
粗略地说,充分统计量就是不损失信息的统计量,在简化统计问题中是非常重要的概念,也是经典统计和贝叶斯统计中为数不多的相一致的观点之一。
充分 完备
一.充分性充分性和完备性是数理统计中两个很重要的基本概念,它也有助于寻找一致最小方差无偏估计。
例1设总体ξ服从正态分布N(μ,1),要求估计均值。
在例2.5中已经指出样本均值是μ的一个有效估计。
由于一个容量为n的样本包含了n个值。
而现在估计μ时,对这n个资料进行了“压缩”和“精简”,仅用一个单值函数,这里自然的会提出一个问题,这种压缩是否合理?也就是说,是否已经包含了样本关于μ的全部信息?用样本的个别值或其它形式能否更多地知道μ呢?下面就回答这个问题。
由于是n维空间中的一个点,而当已知时,样本是n-1维空间中的点,因而上面提出的问题就归结为假若已知时,进一步知道样本在这n-1维空间中的位置,关于μ能否获得更多的信息?为说明简便,对n=2时进行考虑。
此时样本空间可以用平面来表示,表示该平面中的一条直线。
在这平面上,服从二元正态分布,它的分布密度函数是在直线上,的分布可以用条件分布密度函数描写这里所以由上式可见条件密度函数与μ无关,这说明在已知时,如果再进一步知道样本点在这条直线上的位置,关于μ已不能再给出任何新的信息。
换句话说,已充分的提出了样本中所包含的关于μ的全部信息。
所以关于μ的任何推断,不需要记录全部数据,只需记录就足够了,基于关于μ的任何分析与基于全部=样本数据关于μ的分析是同等有效的。
此时称是μ的充分统计量。
下面给出充分统计量的一般定义。
定义 3.3.1 设是从具有分布族为的总体中抽取的一个样本,是一统计量(可以是向量)。
如果给定,的条件分布(离散型变量为条件概率,连续型变量为条件密度)与参数θ无关,则称统计量是分布族的充分统计量。
或称是θ的充分统计量。
按照定义3.3.1,显然是一个充分性统计量,但它没有起到“压缩”数据的作用,因此是没有价值的。
例2设总体ξ服从贝努里分布b(1,p),是一样本。
,其中ν表示中取值为1的频数。
下面计算关于的条件概率是(若设)它与p无关,所以是p的充分统计量。
充分统计量与完备统计量
三、完备统计量
为了介绍完备统计量的概念,首先需要引入完备分 布函数族的概念。
定义 1.5 设总体 X 的分布函数族为F( x; ), ,
若对任意一个满足
E g( X ) 0,对一切
的随机变量 g( X ),总有
(1.5)
P g( X ) 0 1,对一切 , 则称F( x; ), 为完备的分布函数族。
族——指数型分布族。它包含了一些常用分布,如泊松
分布、正态分布、指数分布、二项分布和 分布等,对这
类分布族,寻找参数的充分完备统计量是方便的。
定理 1.5 设总体 X 的分布密度 f ( x; )为指数型分布
族,即样本的联合分布密度具有如下形式:
n i 1
f
( x;
)
C (
) exp
m j1
=T(X1,X2,…,Xn) 也有一个抽样分布FT(t) 。
当我们期望用统计量T 代替原始样本并且不
损失任何有关 的信息时,也就是期望抽样分布 FT(t) 像 F(x) 一样概括了有关 的一切信息。
这即是说在统计量T 的取值为 t 的情况下
样本 x 的条件分布F(x|T=t) 已不含 的信息,
bj (
)Tj ( x1 ,
x2 ,,
xn
)
h( x1 , x2 ,, xn ),
2.9
其中 (1,2 ,,m ), 。如果中包含有一个m 维矩形,
而且 B (b ( ),b ( ),,b ( ))的值域包含一个m 维开集,则
1
2
m
T (T ( X , X ,, X ),T ( X , X ,, X ),T ( X , X ,, X ))
完备统计量的含义不如充分统计量那么明确,但由
数理统计9:完备统计量,指数族,充分完备统计量法,CR不等式
数理统计9:完备统计量,指数族,充分完备统计量法,CR不等式昨天我们给出了统计量是UMVUE的⼀个必要条件:它是充分统计量的函数,且是⽆偏估计,但这并⾮充分条件。
如果说⼀个统计量的⽆偏估计函数⼀定是UMVUE,那么它还应当具有完备性的条件,这就是我们今天将探讨的内容。
由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:完备统计量完备统计量跟充分统计量从名字上看是相对应的,但是完备统计量的意义不像充分统计量那么明确——充分统计量代表能“完全包含”待估参数信息的统计量,⽽完备统计量则是使得不同的参数值对应不同的统计量分布。
具体说来,完备统计量的定义是这样的:设总体分布族的密度函数为\(f(x;\theta)\),这⾥\(\theta\in \Theta\)是待估参数,称\(\Theta\)为参数空间(其实我们之前接触过但没有专门提过参数空间的概念)。
设\(T=T(\boldsymbol{X})\)为⼀统计量,若对任何可测函数\(\varphi(\cdot)\)具有以下的条件:\[\mathbb{E}[\varphi(T(\boldsymbol{X}))]=0\Rightarrow \mathbb{P}(\varphi(T(\boldsymbol{X}))=0)=1,\quad \forall\theta\in\Theta, \]就称\(T(\boldsymbol{X})\)是完备统计量。
如果放宽条件,当\(\varphi(\cdot)\)是有界函数时上式成⽴,则称此统计量是有界完备统计量。
显然,有界完备统计量必是完备统计量。
从线性代数的⾓度来看,可以把函数空间视为⼀个⽆限维向量空间,那么取期望就可以视为该向量空间上的⼀个映射,容易验证此映射具有线性映射的性质:\[\mathbb{E}[f(T(\boldsymbol{X}))+g(T(\boldsymbol{X}))]=\mathbb{E}[f(T(\boldsymbol{X}))]+\mathbb{E}[g(T(\boldsymbol{X}))],\\ \mathbb{E}[\lambdaf(T(\boldsymbol{X}))]=\lambda\mathbb{E}[f(T(\boldsymbol{X}))], \]完备性就要求\(T(\boldsymbol{X})\)的选择,会使得期望映射成为⼀个单射(可以回顾单射的条件是\(\mathrm{null}\mathbb{E}=\{0\}\),可参考此),也就意味着每⼀个期望值都对应唯⼀的可测函数\(\varphi(\cdot)\)。
数理统计第二章抽样分布2.8节完全统计量
( )=0,对一切 0
即 (t )=0,对一切t 0
因此T ( X )=X ( n )是完全(完备)统计量.
8
2.8.2 指数族中统计量的完全性
定理2.8.1:设样本X ( X1 , X 2 , , X n )的概率函数为
f ( x , ) C ( )exp{ iTi ( x )}h( x )
证明:显然T ( X )= X i ~ b( n, )
n k n k P (T ( X ) k ) (1 ) , k 0,1, , n k 设 (t )是任一实函数,满足
E (T ( X )) 0, 对一切0< 1
4
n
i 1
E (T ( X )) 0, 对一切0< 1
但是 (T ) 0,a.e. P 是不成立的即可.
13
令Yi X i ( 1/ 2), i 1, 2,
,n
则 Y1 , Y2 ,
, Yn i .i .d .~U (0,1)
与 无关
而
Z X ( n ) X (1) Y(n ) Y(1)
找常数a b, 使得
5
n k ( k ) 0, 0< k 0 k
n
上式左边是 的多项式,因此必然有
n ( k ) =0,k 0,1, , n k
即 (k ) 0, k 0,1,
n
,n
因此T ( X )= X i 是完全(完备)统计量.
i 1
6
例2.8.2设X=(X1,X2,…,Xn)是从均匀分布 U (0, ) 中抽取的样本,则 T ( X )=X ( n ) 是完全统计量.
充分统计量与完备统计量
例5 设( X1, X 2 , , X n )T 是来自正态总体N(, 2 )
n
的一个样本,试证T(X1, X 2 , , Xn ) ( X ,
X
2 i
)T
i 1
是参数 =(, 2)T的联合充分统计量.
解 L( )
1
e
{
1 2
2
n
( xi )2 }
i 1
( 2π )n
(
1
1
2π )n exp{ 2 2
一个样本,试证X
1 n
n i 1
X i是参数的充分统计量.
解
L( )
1
{ 1
e 2
n i 1
(
xi
)2
}
( 2π )n
(
1 2π )n
exp{
1 2
n i 1
( xi
x
x
)2
(
1 2π )n
exp{
1 2
n i 1
( xi
x )2
n (
2
x)2 }
(
1 2π )n
exp{
1 2
n i 1
N(, 2 )的一个样本,试证T(X1, X2 , , Xn ) ( X ,
F ( x, )的一个样本,T T ( X1 , X2 , , Xn )为一个(一维或多
维)统计量,当给定T t时,若样本(X1 , X2 ,
,
X
)T的
n
条件分布(离散总体为条件概率,连续总体为条件密度)
F ( x1 , x2 , , xn | t)与参数 无关,则称T为的充分统计量.
3. 充分统计量的意义
例6(p11 例1.8) 设总体X服从两点分布B(1, p),即 P{ X x} px (1 p)1x , x 1, 0,
西北工业大学2024年研究生初试考试大纲 432统计学
题号:432《统计学》考试大纲考试内容一、概率论部分(50分)(一) 随机事件与概率1.随机现象与统计规律性2.样本空间与事件3.古典概型4.几何概率5.概率空间(二)条件概率与统计独立性1.条件概率,全概率公式,贝叶斯公式2.事件独立性3.二项分布与泊松分布(三) 随机变量与分布函数1.随机变量及其分布2.随机向量,随机变量的独立性3.随机变量的函数及其分布(四) 数字特征与特征函数1.数学期望2.方差,相关系数,矩3.熵与信息4.母函数5.特征函数6.多元正态分布(五) 极限定理1.伯努利试验场合的极限定理2.收敛性3.独立同分布场合的极限定理4.强大数定律5.中心极限定理二、数理统计部分(100分)(一)统计量与抽样分布1. 总体,样本与经验分布函数2. 充分统计量与完备统计量3. 三大抽样分布4. 次序统计量,最小最大次序统计量的分布(二)参数估计1. 无偏估计,相合估计,均方误差,渐近正态估计2. 矩估计,最大似然估计,3. 最小方差无偏估计和有效估计4. 区间估计(三)统计决策与贝叶斯估计1. 统计决策的基本概念2. 贝叶斯估计(四)假设检验1. 假设检验的基本思想与基本概念,两类错误,功效函数2. 正态总体均值与方差的假设检验3. 拟合优度检验,柯尔莫哥洛夫检验与斯米尔诺夫检验(五)方差分析与试验设计1.单因素方差分析2. 两因素非重复试验的方差分析(六)回归分析1. 回归分析的基本概念,2. 一元线性回归方程参数的最小二乘估计,估计量的分布与性质,回归方程的显著性检验,利用回归方程进行预测3. 多元线性模型参数的最小乘估计、估计量的分布与性质、回归方程与回归系数的显著性检验参考书:1. 李贤平,《概率论基础》(第三版),北京:高等教育出版社,2010.2.陈家鼎,孙山泽,李东风,刘力平,《数理统计学讲义》(第三版),北京:高等教育出版社,20153.师义民,徐伟,秦超英,许勇,《数理统计》(第四版),北京:科学出版社,2015.。
1.2 充分、完备统计量
f (t )是单 定理 设 T ( X 1 , X 2 , , X n )为 的一充分统计量,
值可逆函数,则 f (T ) 也是 的充分统计量 结论: 1 统计量用来推测参数的值; 2 充分统计量把可能丢失信息的统计量筛选; 3 最优统计量在充分统计量之中; 4 一个参数的充分统计量不唯一. 问题:在什么情况下,它是唯一的?
对于一般的统计量 T ( X1 , X 2 ,, X n )
P { g1 (T ) g2 (T )} 1, E ( g1 (T )) E ( g2 (T )),
( X1, X 2 ,, X n )T
• 例设 是来自总体 X 服从两点分布 B(1, p) 的样本 ,样本均值 X 是参数 p 的充分统计量, 验证 X 也是完备统计量 证明:由于 X ~ B(1, p),n X ~ B(n, p),
P{ X 1 x1 , X 2 x2 ,, X n t xi }
i 1
n 1
P{T t }
P( X
i 1
n 1
i
xi ) P ( X n t xi ) ( n ) n e t!
t i 1
n 1
x
i 1
n
i
t
e t! i 1 x i ! t ( n ) n n t n x ! e i i 1 t!
后,对 任意
x1, x2,, xn
有
x
i 1
t ,样本 ( X1 , X 2 ,, X n )T 的条件概
率密度为:
f ( x1 , x2 ,, xn | T t )
f ( x1 , x2 ,, xn1 , t xi )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
显然,一个“好”的统计量应该能够将样本 中所包含的关于未知参数的信息全部提炼出来, 而不没有任何有用信息损失,这就是英国著名统 计学家Fisher于1922年提出的一个重要的概念----充分统计量。
样本X1,X2,…,Xn 有一个样本分布F(x),这个
分布包含了样本中一切有关的信息。统计量T
n
0,如 果 xi k,
i 1
n i 1
xi
k,
n
n
xi
n x i
p i 1 (1 p ) i 1
C
k n
p
k
(1
p )nk
,如 果
n i 1
xi
k,
n
0,如 果 xi k,
i 1
1 Cnk
0,
n
, 如果
xi k,
i 1
n
如果
xi k,
i 1
与 p 无关,所以 X 为 p 的充分统计量.
=T(X1,X2,…,Xn) 也有一个抽样分布FT(t) 。
当我们期望用统计量T 代替原始样本并且不
损失任何有关 的信息时,也就是期望抽样分布 FT(t) 像 F(x) 一样概括了有关 的一切信息。
x 的条件分布F(x|T=t) 已不含 的信息,
但从定义出发来判别一个统计量是否是充分统 计量是很麻烦的。
为此,需要一个简单的判别准则。下面给出一 个定理——因子分解定理,运用这个定理,判别甚 至寻找一个充分统计量有时会很方便。
定理 1.3 (因子分解定理) (1)连续型情况:设总体 X 具有分布密度
f ( x; ),( X1 , X2 , , Xn )是一样本,T ( X1 , X2 , , Xn )是一个统 计量,则T 为 的充分统计量的充要条件是:样本的联合分布
§1.2 充分统计量与完备统计量
一 充分统计量
在数理统计中,由样本来推断总体的前提是:样本 包含了总体分布的信息。样本中包含的关于总体分布 的信息可分为:
1、关于总体结构的信息,即反映总体分布的类型。 如总体服从正态分布,则来自该总体的样本相互独 立并均服从该正态分布,即样本包含了总体分布为 正态分布的信息。
12
n
12
n
(1.4)
其中h是 x1, x2 , , xn的非负函数且与 无关,g 仅通过 T 依
赖于 x1 , x2 , , xn 。
例1.4 根据因子分解定理证明例1.3。
证明 样本的联合分布律为
N
n
xi
n xi
P X x , X x , , X x p I1 (1 p) i1
对统计量 T,如果已知它的值以后,样本的条件分布
与 无关,就意味着样本的剩余部分中已不再包含关于
的信息,也就是在 T 中已包含有关 的全部信息。因此,
对 的统计推断只需要从 T 出发即可,不再需要样本数据。
二、 因子分解定理
根据充分统计量的含义,在对总体未知参数进 行推断时,应在可能的情况下尽量找出关于未知参 数的充分统计量。
(1)打靶10次命中8次; (2)2次不命中分别出现在第3次和第6次打靶上。
第二种信息对了解该运动员的命中率是没有 什么帮助的。
一般地,设我们对该运动员进行n 次观测,得 到 x1, x2,…, xn,每个xj 取值非0即1,命中1,不 命中为0。
令 T = x1+…+xn ,T为观测到的命中次数。 在这种场合仅仅记录使用T 不会丢失任何与命中
1
1
2
2
n
n
若取
p(xi;)(i 1, 2,L ),T(X1, X2,L , Xn ) 一个统计量,则T 是 的充
分统计量的充要条件是:样本的联合分布律可表示为
n
PX x , X x , , X x PX x
1
1
2
2
n
n
i
i 1
h( x , x , , x )g(T( x , x , , x ); )
P(nX k) Cnk pk (1 p)nk ,k 0,1,L ,n.
设 x1 , x2 , , xn ,为样本观测值,其中 xi 0 ,1 . 如果已
知X
k n
则样本
X
1
,
X
2
,
, X n 的条件概率
P ( X 1 x1 , X 2 x2 ,L
, X n xn
X
k) n
P ( X 1 x1 , X 2 x2 ,L
2、关于总体未知参数的信息,这是由于样本的分 布中包含了总体分布中的未知参数。
为了推断总体分布的未知参数,需要把样本中 关于未知参数的信息“提炼“出来,即构造合适 的统计量——样本的函数 f(X1,X2,…,Xn)
例 为研究某个运动员的打靶命中率,我们对该 运动员进行测试,观测其10次,发现除第三、六 次未命中外,其余8次都命中。这样的观测结果包 含了两种信息:
密度函数可以分解为
n
L( ) f ( xi ; ) h( x1 , x2 , , xn )g(T ( x1 , x2 , , xn ); ), i 1 (1.3)
其中 h是 x1, x2 , , xn的非负函数且 无关, g 仅通过 T 依赖
于 x1 , x2 , , xn 。
2)离散型情况:设总体 X 的分布律为 PX xi
定义 设 X1 , X2 , , Xn为来自总体 X 的样本,X 的分
布函数为F x; ,T=T( X1 , X2 , , Xn)为一个统计量,
当给定 T=t 时,如果样本( X , X , , X )的条件分布
1
2
n
(离散总体时为条件概率,连续总体时为条件密度)
与参数 无关,则称 T 为参数 的充分统计量。
这正是统计量具有充分性的含义。
例. 设总体 X 服从两点分布 B(1, p) ,即
P(X=x)= px (1 p)1x ,x=0,1,
其中 0<p<1, ( X , X , , X )为来自总体 X 一个样本,
1
2
n
研究统计量 X
1 n
n i 1
Xi 。
n
: 因为 X i B(1, p) ,所以 n X X i : B(n, p) ,即有 i 1
, X n xn, X
k) n
P(X k )
n
P(X1
x1 , X 2 x2 ,L , X n xn ) , 如 果 P(n X k )
n
0,如 果 xi k,
i 1
n i 1
xi
k,
P(X1
x1 , X 2 x2 ,L , X n xn ) , 如 果 P(n X k )