一充分统计量

合集下载

充分统计量_完备统计量_指数分布族

充分统计量_完备统计量_指数分布族

对任给 X x1, xn 和 t ,满足 X At ,有
-1-
P X1 x1,, X n xn T t
P
X1
x1,, X n xn ,T
PT t;
t;
P
X1
x1,, X n
PT t;
xn ;
g t,
g t, h x1,, xn h y1,yn :T y1,yn t y1, yn
f x, g T x h x
(0.1)
对每一 与x X 成立.
注: h x不依赖于.
证:只对离散型情况给出证明.这时,
f x, P X x
对于T X 的值域中任意固定的 t ,定义集合
At x :T x t.
充分性 设 f x, 使因子分解式(1.1)成立.则对任意的 x At , T x t 成立,
X1, X 2 ,, X n 的条件与 无关.
即不包含关于参数的信息
2)定理 5.5.1(因子分解定理 Factorization Theorem):设总体概率函数为 f (x; ) ,
X1, X 2,, X n 为样本,则 T T ( X1, X 2 ,, X n ) 为充分统计量得充分必要条件是:存
2)定理(极小充分统计量的存在定理): 假定分解定理中的条件成立,且样本空间为欧
式的,则极小充分统计量存在.
3)要求:①信息损失越少越好
②统计量越简化越好
4.指数族:
1)定义:设 (, | p : |) 是可控参数统计结构,加入其密度函数可表示为如下形
k
式: p (x) c( ) exp{ cj ( )Tj (x)}h(x) i 1
期望)可以看作一个变换,且是一对一的变换.

充分统计量_完备统计量_指数分布族

充分统计量_完备统计量_指数分布族

03充分统计量与完备性(补充)-教学辅导一、【内容提要】1.充分统计量(sufficient statistic )1)定义5.5.1 : 设 12 ,,, n X X X 是来自某个总体的样本,总体分布函数为(;) Fx θ,统 计量 12 (,,,) n T T X X X = 称为的充分统计量,如果在给定T 的取值后,12 ,,, n X X X 的条件与θ无关2)定理5.5.1(因子分解定理Factorization Theorem ):设总体概率函数为(;) f x θ,12 ,,, n X X X 为样本,则 12 (,,,) n T T X X X = 为充分统计量得充分必要条件是:存在两个函数(,) g t θ和 12 (,,,) n h X X X 使得对任意的θ和任意组观测值 12 ,,, n X X X ,有 12 (,,,;) n f X X X θ= 1212 ((,,,),)(,,,) n ng T X X X h X X X θ, 其中是通过统计量的取值而依赖于样本的.证明:一般性结果的证明超出本课程范围,此处我们将给出离散型随机变量下的证明, 此时, ()()111 ,,;,;. n n nf x x P X x X x θθ ===先证必要性.设T 使充分统计量,则在Tt=下, ) 11 ,, n n P X x X x T t === 与无关,记为 () 1 , n h x x 或 () h X ,令 ()()}: A t X T X t ==,当 ()x A t ∈时有 { 11 ,,, n n T tX x X x =⊃==故()() () () ()()1111 11 1,,;,,,;,,; ,,,,n n n n n n n P X x X x P X x X x T tP X x X x T t P T t h x x g t θθ θ θ ====== ===== =其中 ()() ,;,g t P Tt θθ==而 ()) 11 ,, n n h X PX x X x T t ==== 与θ无关,必要 性得证.对充分性,由于()) ()(){} ()() ()(){} 11 11 11 ,:,1 ,:,;,;,,, n n n n nn x x T x x tn x x T x x t P T t P X x X x g t h x x θθ θ = = ==== = ∑∑对任给 () 1, n X x x = 和t ,满足 () X A t ∈,有()()()()()()() ()() ()(){}()() ()(){}11 11 11 11 11 1 1 ,:, 1 1 ,:,,, ,,,; ; ,,; ; ,,, ,,,, , , n n n n n n n n n n n n y y T y y t n n y y T y y t P X x X x T t P X x X x T t P T t P X x X x P T t g t h x x g t h y y h x x h y y θ θ θ θ θ θ = = === ===== === = ==∑ ∑该分布与无关,这证明了充分性.3)充分性判别法则定理 4.1 设样本分布密度函数族(连续或离散)为() } () ,:, Ff x TT X θθ=∈Θ=为统计量.则:T 为充分统计量的充分必要条件为:存在关于t 的可测函数 () g t θ 与关于x 的非负可测函数 () h x ,使得()))() , f x g T x h xθ θ= (0.1)对每一. x Xθ∈Θ∈与成立注: () . h x θ 不依赖于证:只对离散型情况给出证明.这时,()[] , f x P X xθ θ== 对于 () T X 的值域中任意固定的t ,定义集合()()} :.A t x T x t== 充分性 设 () , f x θ θ使因子分解式(1.1)成立.则对任意的(), x A t ∈ () T x t =成立,条件概率() () () [] [] () () () ()()() ()()() ()()() ()() () ()() (), , , , u A t u A t u A t u A t P X x T X t P X x T X t P T X tg T x h x P X x f x P T t f u g T u h u g t h x h x g t h u h u θ θ θ θ θθ θ θ θ θ ∈∈ ∈∈==⎡⎤⎣⎦⎡==⎤= ⎣⎦ =⎡⎤ ⎣⎦ = === = =∑∑ ∑∑它与参数无关.又若()) ,, x A t T x t ∉≠则() ) () [][], 0.P X x T X t P X x T X t P T X tP P T t θ θ θ θ == ⎡⎤ ⎣⎦ ⎡==⎤=⎣⎦ =⎡⎤⎣⎦ ∅ === 也与无关.因此,条件分布 ))() . f x t f x t T X θ θθ =与无关,即是的充分统计量必要性 设 () T X 是θ的充分统计量,由充分统计量的定义, () P X x T X tθ ⎡==⎤⎣⎦ 与 参数无关,它是的函数,记为() . h x 于是,对任意固定的t ,当 () x A t ∈时, () T x t = 成立;这时()) ()() ()()()() ()()(),,, T x P X x P X x T X t P T X t P X x T X t P T X t h x g t h x g T x h x θθ θθ θθ θ θ===== ⎡⎤ ⎣⎦ ==⎡==⎤⎡⎤ ⎣⎦⎣⎦ === ⎡⎤ ⎣⎦ =式中 ()() . g t P T X t θθ ==⎡⎤ ⎣⎦ 因而(1.1)成立. 由因子分解定理,若样本的密度函数 () , f x θ能分解成两个因子的乘积,其中一个为 () T X 的函数,而另一个仅为的函数,与参数θ无关,则 () T X 是的充分统计量.2.完备性 1)定义:{(;),} Fp x θθ=∈Θ ,设()g x 是定义在样本空间Ω上的一个实函数,一般来 说,积分(如果存在)[()]()(;) E g x g x p x dx θΩ = ⎰(θ∈Θ),因此上述积分(数学 期望)可以看作一个变换,且是一对一的变换. 即对θ∀∈Θ, 1212 ()()1[()][()]g g g x g x E g x E g x ==⇔=12 0 g g g =-=, 12 ()0 g E g g -= ,则{()0}1[()]0 g p g x E g x θ ==⇔= 英文注释:Definition (Complete Statistic) : Let be a family of pdfs of pmfs for a statistic .The family of probability distributions is called complete if for all implies for all . Equivalently, is called a complete statistic . 2)分布族的完备性: 定义:{(;),} Fp x θθ=∈Θ对于任何一个可测函数() g x ,由[()]()()(;)0 g E g x g x p x dx πϕθθ === ⎰ 对θ ∀有{{()}0}1 g p g x ==or ()0(..) g x a e p = 等价的, 12[()][()] g E g x E g x θ =对 θ∀∈Θ成立,可推出 12 {()()}1p g x g x θ == 3)完备性意义:① 积分变换(数学期望)的唯一性. ② 常用的积分变换.a . 傅里叶变换 ()() itx f x e f xdx +∞ -∞ → ⎰ 特征函数,它在(,) t ∈-∞+∞上 都存在且有 唯一性.b . laplas 变换 ()() sxf x e f x dx+∞- -∞ → ⎰ ,该式在s=0存在至少在s=0某个领域内有 定义,则有唯一性.4)完备充分统计量(complete sufficient statistic )定义:设(;) p x θ是一概率密度函数且是指数族的正规案,设1 ,, n X X 是具有p.d.f(;) p x θ的分配的随机样本.则统计量 1ni i T X = = ∑ 是的完备充分统计量.5) 某些完全性定理(指数族的完全性):设X 的样本空间为(,) x x β,分布族为指数族,对θ∈Θ,有θ∈Θ 1 ()()exp[()]() ki i i dp x c T x du x θ θθ = = ∑ ,此处Θ为 k R 之一子集,若Θ(作为 k R 的子 集)由内点,则统计量 1()((),,()) k t x T x T x = 是完全统计量. 定理(次序统计量的完全性): 设分布族f 满足以下两个条件:(a )若12,F f F f ∈∈,则对任何 1212 0,0,1, P P P P >>+= 有 1122 PF P F f +∈.(b )若,[,), F f S a b a b ∈=-∞<<<+∞,而()0 F s ≠,则 B F f ∈,则次序统计量(1)() ,, n X X 是完全的(对任何自然数n ).引理 :设分布族满足上面的条件(a ),1 (,,) n f X X 为Bore (可测得对称函数),满足条件11(1)() (,,)()()0(,,) n n n f X X dF X dF X f X X +∞+∞-∞-∞= ⎰⎰,对任何F f ∈, 则对F 中的任意n 个分布 1,, n F F ,必有 111(1)() (,,)()()0(,,) n n n nf X X dF X dF X f X X +∞+∞-∞-∞ = ⎰⎰定义(有界完全性):设变量X 的样本空间为(,) x x β,分布族为{,} pθ θ∈Θ,() t x 为定义 于X 取值于(,) f f β的统计量,其分布族为{,} Tp θ θ∈Θ,若对任何满足条件” ()()0 xf x dp x θ = ⎰ ,对一切θ∈Θ”的有界 x β可测函数() f x ,必有 {()0}0 p X f x θ =≠=,对一切θ∈Θ,则称分布族{,} p θ θ∈Θ为有界完全的.若 {,} T p θθ∈Θ为有界完全的,则称t 为有界完全统计量.3.极小充分统计量(minimal sufficient statistic )1)定义: 设() t x 为(,) x x β上的一个充分统计量,取值于(,) f f β,β上的分布族为 {,} p θ θ∈Θ.若对任何定义于,取值于某可测空间(,) s S β的充分统计量.必存在由(,) s S β到(,) f f β的可测变换()t q s =,以及 x A β ∈,满足条件()0 p A θ =对任何θ∈Θ, 致()(())t x q S x =,对任何x A ∈,则称唯一极小充分统计量. 2)定理(极小充分统计量的存在定理): 假定分解定理中的条件成立,且样本空间为欧式的,则极小充分统计量存在.3)要求:①信息损失越少越好 ②统计量越简化越好4.指数族:1)定义:设(,|:|) p θ θ X B ∈Θ是可控参数统计结构,加入其密度函数可表示为如下形 式: 1()()exp{()()}() kjji p x c c T x h xθ θθ = = ∑ 并且它的支撑{:()0} x p x θ >不依赖于,则称此结构为指数型的统计结构,简称指数结构,其中的分布族为指数族,这里的1 0(),(),,(),() k jc c c T x θθθ <<∞ 都与θ无关,且取有限值的B 可测函数,k 为正整数,()0 h x >.2)定理:① 自然参数空间Ω为凸集②() x Φ是X 上的B 可测函数,且对一切 1 (,,) k w w w =∈Ω有 1|()|exp{()} kj jj x w T x dμ = Φ<∞∑ ⎰ ③ 设 1(,,) n X X X = 是来自指数型分布标准形式的一个样本,则有统计量 11 11((),,())((),,()) nnk i k ii i T X T X T x T x == = ∑∑ 是指数型分布族的充分统计量.ln 1 ()(1)(1) x x n x n n n p x e x x θ θ θ θθθ - - ⎛⎫⎛⎫ =-=- ⎪ ⎪ ⎝⎭⎝⎭1 ()exp{()}(),0,1,, c c x h x x nθθ==其中 1 ()(1),()ln ,() 1 n n c c x h xx θ θθθ θ ⎛⎫ =-== ⎪ - ⎝⎭22 , 222()}exp{} 22 u x xp x σ μμ σσσ=--+ 其中 2 12 2221(,)},(,),(,) 22c c c μμμσμσμσσσσ=-==2 12()1,(),() h x T x x T x x ===1 , 12 () () exp{(1)ln } () (,)exp{(,)(,)ln },0x p x x ex x c c x c x x α αλαλ αλ α λ λα α αλαλαλ --= Γ =-+- Γ =+< 其中 12(,),(,),(,)(1) () c c c α λ αλαλλαλα α ==-=-Γ注:如果Gammar 分布中引入第三个参数——门限参数,其密度函数为1() ,, ()(), () x p x x e x α αλμ μαλ λ μμ α --- =->Γ5.辅助统计量(ancillary statistic ): 1)定义: 设~{(;),}Xf x θθ∈Θ,若统计量() A A X =的分布与θ无关,则称() A X 为辅助统计量(即()A X 中不包含关于的信息)英文注释:Definition (Ancillary Statistic) : A statistic () S X whose distribution does notdepend on the parameter θ is called an ancillary statistic . Alone, an ancillary statistic contains no information about θ.An ancillary statistic is an observation on a random variable whose distribution is fixed and known, unrelated to .Paradoxically, an ancillary statistic, when used in conjunction with otherstatistics, sometimes does contain valuable information for inferences about θ.二、【释疑解难】1.对上述充分统计量的证明*b (1,p ) 设 12 ,,, n X X X 使来自二点分布) 1,b p 的一个样本,其中01,2 p n <<>,现在我们来考 察如下两个统计量:12121 ,.ni iT X T X X = ==+∑ 我们知道,样本()12 ,,, n X X X 的联合分布是()()1 1 1122 ,,,1, nn i i i i X n X n n P X x X x X x p p = = - ∑ ∑ ====-其中,诸 i x 非0即1.而统计量 1 1nii T X = =∑ 的分布为二项分布 () ,b n p ,即()() 1,0,1,,.n t t n P T t p p t n t - ⎛⎫ ==-= ⎪ ⎝⎭而在给定 1 T t =下,样本的条件分布为()()()()()()1122111221111111111,,,,,,,,,,1.1n nn nnn n n iin ttn ttP X x X x X x T tP X x X x X x T tP T tP X x X x X t xP T tnp pn tp pt---=---==========⎛⎫===-⎪⎝⎭==-⎛⎫== ⎪⎛⎫⎝⎭-⎪⎝⎭∑计算结果表明,这个条件分布与参数p无关.它已不含有参数p的有关信息了.样本中有关p的信息都含在统计量1T中.另外,统计量212T X X=+的分布仍是二次分布)2,b p,即()()2221,0,1,2.ttP T t p p tt-⎛⎫==-=⎪⎝⎭于是在给定2T t=下,样本的条件分布为()()()()()()3333112221121332212,,,,,,12121.nniiiinniiiin nn nt xn t xttxn xP X x X x X x T tP X x X t x X x X xP T tp pp ptp pt====+------======-====∑∑-=⎛⎫-⎪⎝⎭∑⎛⎫∑=-⎪⎝⎭可见,这个条件分布与参数有关.这意味着,这个条件分布还含有参数的信息,而样本中有关的信息没有完全包含在统计量2T之中.注:从上例可以直观地看出,用条件分布与参数无关来表示不损失样本中有价值的信息室妥当的.一般的充分统计量的定义也正是这样给出的.(数理统计_茆诗松王静龙P46/Ex 1.6.2)()Pλ(书P283/E x5.5.2):设1,,nx x是来自泊松分布)Pλ的样本,则1niiT x==∑是充分统计量解:(;)exp{(ln )ln(!)},0,1, !x p x e x x x x λλ λθθ- ==--= 且 1,, n X X 独立同分布,根据充分完备统计量定义可得, 1n T x x =++ 为其充分统计量.令解:由泊松分布性质知, ) T P n λ在给定T的取值后,对任意的一组1 1 ,, n n i i x x x t = ⎛⎫= ⎪⎝⎭∑ ,有 ()1 1111 1 11 1 ,,, ,, n n n n i i n n n i i P X x X x X t x P X x X x T t P x t - -- = = ⎛⎫==-=⎪⎝⎭==== ⎛⎫ = ⎪ ⎝⎭∑ ∑() () 11 1 1 e ! n n i i n i i i tn P X x PX t x n t λ λ -- = = - ⎛⎫ ==- ⎪ ⎝⎭= ∑ ∏() 1 1 1 1 1 1 e e! ! e !n i i i t x x n n i i i i tn x t x n t λλλ λλ λ - = -- --- = = -∑ ⎛⎫ - ⎪⎝⎭ = ∏ ∑() 1 e! e ! t n ni i t n x n t λ λ λλ - = -= ∏1! ! nt i i t n x= =⋅ ∏ 与无关,是充分统计量.()Ge θ (书P 283/E x 5.5.1):设 1 ,, n x x 是来自几何分布 ()() 1,0,1,2,xP X x x θθ ==-=的样本,则1niiT x==∑是充分统计量.解:()()1exp{ln ln(1)},0,1,2,xP X x x xθθθθ==-=+-=且1,,nX X独立同分布,则由充分完备统计量定义得,1nT x x=++为其充分统计量.令解:由几何分布性质知,),T Nb nθ其分布列为()()11,0,1,2,tnn tP T t ttθθ+-⎛⎫==-=⎪⎝⎭在给定T的取值后,对任意的一组11,,nn iix x x t=⎛⎫=⎪⎝⎭∑,有()111111 111,,,,,nn n n iin n niiP X x X x X t x P X x X x T tP x t---==⎛⎫==-=⎪⎝⎭====⎛⎫=⎪⎝⎭∑∑()()111111n ni i n iiitnP X x P X t xn ttθθ--==⎛⎫==-⎪⎝⎭=+-⎛⎫-⎪⎝⎭∑∏()()()11111111nt x iiinxitnn ttθθθθθθ--∑=-=⎛⎫-⋅-⎪⎝⎭=+-⎛⎫-⎪⎝⎭∏()()111tntnn ttθθθθ-=+-⎛⎫-⎪⎝⎭11n tt=+-⎛⎫⎪⎝⎭与无关,是充分统计量.E x p(l)设1,,nx x是来自指数分布E x p(l)的样本,则1niiT x==∑是充分统计量.解:(;)exp{ln},0,1,xp x e x xλλλλλ-==-=且 1,, n X X 独立同分布,则由充分完备统计量定义得, 1n T x x =++ 为其充分统计量.令解:由泊松分布性质知, () , T Ga n λ其分布函数为() ()() 11; 1! n n n t n t p t t e t e n nλλλλλ ---- == Γ-在给定T的取值后,对任意的一组1 1 ,, n n i i x x x t = ⎛⎫= ⎪⎝⎭∑ ,有 ()1 1111 1 11 1 ,,, ,, n n n n i i n n n i i P X x X x X t x P X x X x T t P x t - -- = = ⎛⎫==-=⎪⎝⎭==== ⎛⎫ = ⎪⎝⎭∑ ∑() ()11 1 1 1 1! n n i i n i i i nn tP X x PX t x t e n λ λ -- = = -- ⎛⎫ ==- ⎪ ⎝⎭= - ∑ ∏() 1 1 1 1 1 1! n i i it x n x i n n t e et en λ λ λ λλ λ - = ⎛⎫⎪ -- - ⎪ - ⎝⎭= -- ∑ ⎛⎫ ⋅ ⎪ ⎝⎭ = - ∏()1 1! n t nn te t e n λ λ λ λ - -- = -) 1 1!n n t- - =与无关,是充分统计量.*对于非指数族用其因子分解定理来求充分统计量,以下就是典型的例子(0,) U θ(书P 282/E g5.5.4):设 1 ,, n x x 是取自总体(0,) U θ的样本,即总体的密度函数为() 1,0 ; 0x p x θ θ⎧ << ⎪ = ⎨ ⎪ ⎩ 其他 解:于是样本的联合密度函数为()() {}{} 1 1 ,0min max ;; 0n i i n x x p x p x θ θθ θ ⎧ ⎛⎫<≤< ⎪ ⎪ = ⎨ ⎝⎭⎪ ⎩ 其他由于诸0 i x >,所以我们可将上式改写()() () {} 1 1 ;;,n n n x p x p x I θ θθ θ < ⎛⎫=⎪ ⎝⎭取 () , n T x =并令 () {} () 1 ,,1, nt g t I h X θ θ θ < ⎛⎫==⎪ ⎝⎭由因子分解定理知, () n T x =是的充分统计量.12(,) U θθ (书P 283/E x 5.5.10):设 1 ,, n x x 是来自均匀分布 12 (,)U θθ的样本,试给出一个充 分统计量.解:总体的密度函数为 () 1221 12 1, ;, 0 x p x θθ θθ θθ ⎧ << ⎪ - = ⎨ ⎪ ⎩其他 于是样本的联合密度函数为()() {}{} 11212 21 1 ,0min max ;,;, 0n i i n x x p x p x θ θθθθ θθ ⎧ ⎛⎫⎪<≤< ⎪ = - ⎨ ⎝⎭⎪⎩ 其他 由于诸0i x >,所以我们可将上式改写为 ()() ()() {} 12 1 11212 21 1 ;,;, n n n x x p x p x I θθ θθθθ θθ <≤< ⎛⎫= ⎪ - ⎝⎭取 ()() 12 1 , n t x t x ==,并令 () {} () 1122 1212 21 1 ,,,,1, nt t g t t I h X θθθθ θθ <≤< ⎛⎫== ⎪ - ⎝⎭由因子分解定理知, () ()() ()121 ,, n T t t x x ==是12 , θθ的充分统计量. (,2)U θθ (书P 283/E x 5.5.11):设 1 ,, n x x 是来自均匀分布(,2) U θθ的样本,试给出一个充分统计量.解:总体的密度函数为 () 1,2; 0 x p x θθ θ θ ⎧ <<⎪ = ⎨ ⎪ ⎩其他于是样本的联合密度函数为()() {}{} 1 1 ,min max 2 ;; 0n i i n x x p x p x θθ θθ θ ⎧ ⎛⎫<≤<⎪ ⎪ = ⎨ ⎝⎭⎪ ⎩ 其他由于诸 0 i x >,所以我们可将上式改写为()() ()() {}1 12 1 ;; n nn x x p x p x I θθ θθ θ <≤< ⎛⎫= ⎪ ⎝⎭取 ()() 121 , n t x t x ==,并令 (){} () 12 122 1 ,,,1 nt t g t t I h X θθ θ θ <≤<⎛⎫== ⎪ ⎝⎭由因子分解定理知, () ()() )12 1 ,, n T t t x x ==是的充分统计量.*均匀分布族不是指数型分布族 () 2, N μσ(书P 282/E g5.5.5):设 1 ,, n x x 是取自总体 ()2 , N μσ的样本, ) 2 , θμσ =是未知的,解:联合密度函数为 ()()22212 11 ,,;2exp(())2 nn n i p x x x θπσμ σ- = =-- ∑()2 22 222 111 2exp()exp2 22 n n ni i i n x x μπσμ σσ - == ⎧⎫ ⎛⎫ =--+ ⎨⎬ ⎪⎝⎭⎩⎭∑∑ 取 212 11,,nni ii i t x t x == == ∑∑ 并令 () () 2 2 21221 22 1 (,,)2exp()exp 2,() 1 22 nn g t t t t h X μ θπσμ σσ- ⎧⎫=--+=⎨⎬ ⎩⎭由因子分解定理知, () 2 12 11 ,, n n i i i i T t t x x == ⎛⎫ == ⎪ ⎝⎭∑∑ 是充分统计量. 进一步,我们指出这个统计量与 () 2, x s 是一一对应的,这明在正态总体场合常用的 () 2, x s 是充分统计量.解1:样本联合密度函数为 () 11 1 ,,; nn i i p x x x θ θθ - = = ∏ 1 1 n n i i x θ θ - = ⎛⎫ = ⎪⎝⎭∏ 取 1ni i t x = =∏ ,并令()) 1 ;,1ng t t h X θ θθ - == 由因子分解定理知, 1ni i T x = =∏ 是充分统计量. 解2:样本联合密度函数为() 11 1,,; nn ii p x x x θ θθ - = = ∏ 11 n ni i x θ θ - = ⎛⎫ = ⎪ ⎝⎭∏1 1 exp ln n n i i x θ θ - = ⎧⎫ ⎡⎤ ⎛⎫⎪⎪ = ⎢⎥ ⎨⎬ ⎪ ⎝⎭ ⎢⎥ ⎪⎪ ⎣⎦ ⎩⎭∏() 1 exp ln 1 n ni i x θθ= ⎧⎫ =⋅-⎨⎬ ⎩⎭∑1 ln 1 e n i i x n e θ θ = - ∑ =取 1ln nii t x= =∑ ,并令 ))1;e ,1n t g t e h X θ θθ -== 由因子分解定理知, 1ln nii T x = = ∑ 是充分统计量.(书P 284/x 5.5.12):设 1,, n x x 是来自双参数指数分布 () 1 ;,,,0 xp x e x μ θ θμμθ θ- - =>> 的样本,证明 () ()1 , x x 是分统计量.解:样本联合密度函数为() () {} 1 1 1 1 ,,;, ix nn x i p x x e I μ θ μ θμ θ- - > = = ∏() {} 1 1 1()1 n i i nx x e I μ θμ θ = -- > ⎛⎫ = ⎪ ⎝⎭() () {} 1 1 1 n n n x e I μ θμ θ -- > ⎛⎫ = ⎪ ⎝⎭取 () 121 ,t x t x==并令 () () () {} () 1 1 12 1 ,;,,1 nn x n x g t t e I h X μ θ μ θμ θ --> ⎛⎫ ==⎪⎝⎭由因子分解定理知, () () ()121 ,, T t t x x ==是充分统计量. G a (a ,l )解:样本联合密度函数为 () 1 1 1 ,,;, () i nx a n ii p x x x e α λ λ αλ α - - ==Γ ∏1 1() i n x a i i x e α λ λ α - - = = Γ ∏1 11 () n i i a nx i i x e αλ λ α = - - = ∑ ⎛⎫ = ⎪ Γ ⎝⎭∏ 取 12 11 , nni i i it x t x == == ∑∏ ,并令 ()()()1 1 122 ,;,,1 () a t g t t t e h X αλλ αλ α - - == Γ 由因子分解定理知, () 12 11 ,, n n i i i i T t t x x == ⎛⎫== ⎪ ⎝⎭∑ ∏ 是充分统计量.() 2, LN μσ设 1 ,, n x x 是取自总体 () 2, LN μσ的样本, ) 2 , θμσ =是未知的,解:联合密度函数为 ()()22212 11,,;2exp((ln )) 2 n n n i p x x x θπσμσ - = =--∑()() 2 2 2 222 111 2exp()exp ln 2ln 22 n n ni ii i n x x μ πσμ σσ - == ⎧⎫ ⎛⎫=--+⎨⎬ ⎪⎝⎭⎩⎭∑∑取()212 11ln ,ln , nni ii i t x t x== == ∑∑并令 ()() 2 2 21221 22 1 (,,)2exp()exp 2,() 1 22 n n g t t t t h X μ θπσμ σσ - ⎧⎫ =--+=⎨⎬ ⎩⎭由因子分解定理知, ()() 2 12 11 ,ln ,ln n n i i i i T t t x x == ⎛⎫== ⎪ ⎝⎭∑∑ 是充分统计量.B e (a ,b )解:样本联合密度函数为 () 111 1 1 ,,;,(1) (,)na b n i ii p x x a b x x B a b -- = =-∏1111 (1) (,) n a b i i i x x B a b -- = =-∏111 1ex p ln (1) (,)n a b i i i x x B a b -- =⎧⎫ ⎛⎫=-⎨⎬ ⎪ ⎝⎭⎩⎭∏11 111 exp ln ln (1) (,) n n a b i i i i x x B a b -- == ⎧⎫ ⎛⎫⎛⎫=+-⎨⎬ ⎪ ⎪ ⎝⎭⎝⎭⎩⎭∏∏ ()() 111 exp ln 1ln (1) 1 (,) n n i ii i x a x b B a b == ⎧⎫ ⎛⎫⎛⎫ =-+--⎨⎬ ⎪ ⎪ ⎝⎭⎝⎭ ⎩⎭∏∏ ()() 11 1 exp ln 1ln(1) 1 (,) nn i ii i x a x b B a b == ⎧⎫ =-+--⎨⎬ ⎩⎭∑∑ 取 1211ln ,ln(1) nniii i t x t x == ==-∑∑ ,并令 ()()(){}() 1212 1,;,exp 11,1 (,)g t t a b t a t b h X B a b =-+-=由因子分解定理知,() 1211 ,ln ,ln(1) nn i i i i T t t x x == ⎛⎫==- ⎪ ⎝⎭∑∑ 是充分统计量. 2.常用分布族的完备性{(,)}F vλ =Γ的完备性若有 10 (,)()0,(,) () v x v v h x e x dx v v λ λ ϕλλ∞--==∀Γ⎰ , 则对任何(,) v λ有 10()0 x v h x e x dx λ ∞ -- = ⎰ ;该式左端可视为 1 () v h x x - 的拉氏变换,因此有 拉氏变换的唯一性,可以推出 1 ()0(..) v h x x a e - =, 1 0 v x - ≠,即得()0(..) h x a e ≠.类似的,分布族0 {(,}F vλ=Γ也完备. 2 0 {(,)} N μσ =的完备性1) 1 {(,1),(,)} F N μμ=∈-∞+∞完备. 解:因为对任何,由 2 1 2 () [()](0 x E h X h x dx μ μ ∞-- -∞==⎰可以推得 2 1 2 ()()0 x x h x e e dx μ ϕμ ∞- -∞== ⎰ 有拉氏变换唯一性可知: 2 1 2 ()0(..) xh x e a e - =,即可得()0(..) h x a e =. 2) 20{(,),(,)} F N μσμ =∈-∞+∞完备.与1)类似. 3) 223 {(0,),0} F N σσ=> 不完备.因为(),[()]0 h x x E h X σ==,但()0(..) h xa e ≠ 4) 22 40 {(,),0} F N μσσ=>不完备.与3)类似. 5) 2 {(,),,} FN μσμσ=∀ 完备.因为若对任何(,) μσ有 , ()()0 h x x dx μσ ϕ= ⎰,其中 , () x μσ ϕ为正态分布 2 (,) N μσ的密度函数,必有 ,1()()0h x x dx μ ϕ= ⎰ ,μ ∀,由(1)知()0(..) h x a e =. {(,),(0,1)} b n θθ=∈的完备性若对任何有 ()[()]0 E h X θ ϕθ== ,即 0 ()()(1)0 nx n x x n h x x ϕθθθ - = ⎛⎫=-= ⎪⎝⎭∑ 由此可推出0 ()()0 1 nx x n h x x θ θ = ⎛⎫ = ⎪ - ⎝⎭∑ ,该式为 1 y θθ = - 的n 次多项式,它对一切0y >为 零,则其系数必为零,即()0 n h x x ⎛⎫= ⎪ ⎝⎭,所以()0,0,1,, h x x n == .{(0,),0} R θθ=>的完备性若对任何θ有 10 [()]()0 E h X h x dx θθ θ - == ⎰ ,则()()0 h x dx θϕθ== ⎰ .由于() h x 可测,其 不连续点为零测集,在() h x 的连续点处,() ϕθ可导,因此对任何() h x 的连续点θ处有'()()0 h x ϕθ==,即()0 h θ=,(..)a e θ ∀,因此有()(..) h x a e = 3.因子分解定理中的是不是向量统计量? 答:假如存在充分统计量()T X ,那么样本分布() f x θ 一定可以分解为两个因子的乘积, 其中一个因子与θ无关,仅与样本有关,另一个因子与有关,但与样本的关系可以通过充分统计量() T X 表现出来.所以,应该指出,这个定理中的() T X 可以是向量统计量.4.用指数族去解决问题的完全性有多大的作用?答:我们通过学习,可以总结出指数族的三个优点:1)是它包含了很多常见的分布.2)其次是它有良好的分析性质.3)是它有(在定理条件下)完全充分统计量.这后两条性质决定了许多问题在这个族中有满意的解决,因此,指数族的重要性就可想而知了.5.分布族要有怎样的性质,才能使次序统计量有完全性?答:先引进若干有关的记号,设12,,F F Fγ为个一维概率测度,0,1,2,,iP iγ≥= 而11P Pγ++=,则1i iiF PFγ==∑理解为一概率测度,定义为1()()i iiF S PF Sγ==∑,对任何1Sβ∈,又若F为一概率测度,1Sβ∈而()0F S≠,则记号SF表示一个概率测度定义为1()()/(),SF A F S A F S Aβ=∈.6.充分统计量的函数是不是充分统计量?答:设2~(,)X Nμσ,2σ已知,1(,,)nX X X= 是抽自X的iid样本,则依因子分解可知X是的充分统计量,但2X不是的充分统计量,事实上212211{()}(,,|)()n nniinExp xf X X X tf tσμ=--===∑与有关,故2X不是的充分统计量因为222)~()(,){}2nnX t N Expσμϕμσ-==-2~()(({X f t t Exp Expϕϕ=+7.指数族分布表达式中的是不是充分完全统计量?答:我们可以给出一个指数族分布,其中并不是参数的充分完全统计量.设2~(,)X Nμσ,其中0σ>是未知参数,1(,)nX X X= 是抽自其中的iid样本,则211()(,)n ni ii iT X X X===∑∑是的充分统计量.但不是的完全充分统计量,事实上,因为2~(,)X Nμσ,所以,子样1(,)nX X X= 的联合分布为222211111111(;)(;){()}){} 222nnnnnni i i ii i i i n L x f x Exp x Exp x x θθσσσσ==== ==--=-+-∑∑∑∏ 令()1 h X = 22 111 ((),){} 22n n n i i i i ng T X Exp x x θσ == =-+-∑∑ 则(;)((),)()L X g T X h X θθ = 所以,根据Fisher-Neyman 因子分解定理得 211()(,)nni ii i T X x x == = ∑∑ 是的充分统计量,记 211()(,)(,) nni ii i T X x x u v == ==∑∑则 1()() ni E u E X n σ = ==∑ 21()() nii Varu Var x n σ = ==∑ 所以, 222()()(())(1) E u Var u E u n n σ =+=+因为, 222 11()()(()())2 nnii i i i E v E x Var x E x n σ== ==+= ∑∑ 令 2()2(1) g T u n v =-+22(())2(1)(1)20 E g T n n n n σσ=+-+= 但 2 n ≥时,()0 g T ≠,故0σ>不是的完全统计量那么,为什么会出现这种情况呢?原因是上述定理中 12 2 11(,)(, 2 θθθ σσ==-的值域应包含一个二维开集的条件得不到满足进一步的讨论,得注:设 1 ,, n X X 是抽自 2 (,) N ασσ分布族的iid 样本,其中是已知的实数,0 σ> 是 未知参数,则同样可知, 211()(,)nni ii i T X x x == = ∑∑ 是的充分统计量,但不是的完全统计量注:设 2 1 ~(,) X N μσ , 2 2 ~(,) Y N μσ 其中 22 12 (,,) μσσ是未知参数又设 12 (,,)m X X X ,12 (,,) m Y Y Y 是分别从, X Y 母体中抽取的iid 样本,可证明 221111(,)(,,,) mnmni i ii i j i j T X Y X Y X Y ==== = ∑∑∑∑是 2212 (,,) u σσ的充分统计量,但不是完全统计量,原因是上述定理中1234 2222 1212 1111 (,,,)(,,,) 22 Q Q Q Q Q σσσσ == -- 的值域应包含一个四维井集的条件 得不到满足.三、【典型例题和研究生试题】1.(充分统计量) (1)设 1 ,, n x x是来自() 1;,01,0p x x x θ θθθ - =⋅<<>的样本,试给出一个充分统计量.解:样本的联合密度函数为()()1 11212 1,,,;,n n nn n ii p x x x x x x x θ θ θθθ - - = ⎛⎫== ⎪ ⎝⎭∏ 令 1ni i T x = =∏ ,取 ()()11 ;,,,1 n n gt t h x x θ θθ - == ,由因子分解定理, 1ni i T x = = ∏ 为θ的充 分统计量.另外,T 的一一变换得到的统计量,如1 ,, n x x 的几何平均 () 1 1 nn x x 或其对数11 ln ni i x n = ∑ ,都是的充分统计量.注:(概率论与数理统计教程 习题与解答--茆诗松 程依明 濮晓龙)P257~261(2)设 1 ,, n x x 是来自正态分布 ) 2, N μσ的样本.(1) 在已知时给出 2σ的一个充分统计量;(2) 在 2σ已知时给出的一个充分统计量.解:(1)在已知时,样本联合密度函数为()()() 22 22 12 2 1 1 ,,,;2exp . 2 n n n ii p x x x x σπσμσ - = ⎧⎫ =--⎨⎬ ⎩⎭∑ 令 () 21ni i T x μ= =- ∑ ,取()()() 22 2 ;2exp ,1 2 n t g t h x σπσ σ - ⎧⎫ =-= ⎨⎬ ⎩⎭,由因子分解定理, () 21ni i T x μ = =- ∑ 为 2 σ的充分统计量.(2)在 2σ已知时,样本联合密度函数为() () () () 22 2 1 2 1 2 222 22 111 ,,;2exp2 11 2exp exp 2. 22 n n n ii n n n i ii i p x x x x n x μπσμ σ πσμμ σσ - = - == ⎧⎫ =-- ⎨⎬ ⎩⎭⎧⎫ ⎧⎫⎛⎫ =--- ⎨⎬⎨⎬ ⎪ ⎩⎭⎝⎭ ⎩⎭∑ ∑∑ 令 11 ni i x x n = = ∑ ,取()() ()()2 222221 11;exp 2,2exp , 22n n i i g x n n x h x x μμμπσσσ- = ⎧⎫ ⎧⎫ =--=- ⎨⎬⎨⎬⎩⎭ ⎩⎭∑ 由因子分解定理,x 为的充分统计量.注:(概率论与数理统计教程 习题与解答--茆诗松 程依明 濮晓龙)P257~261(3)设 ) 2 01 ,,1,2,,, i i Y N x i n ββσ+=诸i Y 独立, 1,, n x x 是已知常数,证明 2 111 ,, n n n i i i i i i i Y x Y Y === ⎛⎫⎪ ⎝⎭∑∑∑ 是充分统计量. 证: 1,, n Y Y 的联合密度函数为()()() () () 2 101 2 1 2 2 2 01 2 1 2 22222 010101 2 11111 1 ,, 2 1 2exp 2 1 2exp 222. 2 nn i i i n n i ii n n n n n n i i i i i i i i i i i p y y y x y x y n x y x y x ββ σ πσββ σ πσββββββ σ = - = - ===== ⎧⎫ ⎧⎫ =--- ⎨⎬⎬ ⎩⎭ ⎭⎧⎫ =--- ⎨⎬ ⎩⎭⎧⎫ ⎛⎫=-++--+ ⎨⎬⎪⎝⎭⎩⎭∏ ∑ ∑∑∑∑∑注意到 1 ,, n x x 是已知常数,令 () 2 123 111 ,,,, n n n i i i i i i i t t t t y x y y === ⎛⎫ == ⎪ ⎝⎭∑∑∑ ,取()() () 222222010101 2 11301122 1 ,,,2exp 2 2 1 exp 22, 2 n nn i ii i g t n x x t t t σββπσββββ σ ββ σ - == ⎧⎫ ⎛⎫=-++⋅⎨⎬ ⎪⎝⎭⎩⎭⎧⎫--- ⎨⎬ ⎩⎭∑∑() 1 ,, 1. n h y y =由因子分解定理, 2 111 ,, n n n i i i i i i i Y x Y Y === ⎛⎫ ⎪⎝⎭∑∑∑ 是 ) 2 01 ,, ββσ的充分统计量.注:(概率论与数理统计教程 习题与解答--茆诗松 程依明 濮晓龙)P257~261(4)设 1 ,, n x x 是来自正态总体 )21 , N μσ的样本, 1 ,, n y y 是来自另一正态总体()2 2 , N μσ的样本,这两个样本相互独立,试给出 ) 22 12,, μσσ的充分统计量. 解:样本 1,, n x x ,的联合密度函数为 () ()()() () 2222 12 222 222222 121212 11 11 22 11 11 11 2 2222 1211 ,,,,, 2 i i n m i i i i nm x y n m i i nx my n m x y n m n m p x x y y e μμ σσ μμ σσσσσσ πσσ == ---- == ⎧⎫ ⎛⎫⎛⎫ ⎪⎪-+-+++ ⎪ ⎪ ⎨⎬ ⎪ ⎪ -+ --⎪⎪ ⎝⎭⎝⎭⎩⎧⎫⎧⎫⎪⎪ = ⎬⎬ ⎪⎪ ⎭⎭∑∑ = ∏∏ 其中 11 11 , n m i i i i x x y y n m == == ∑∑ ,令 () 22 1234 11,,,,, n m i i i i t t t t t x y x y == ⎛⎫== ⎪ ⎝⎭∑∑ ,取() () () () 23412222222 121212 112 2222 22 121211 ,,,2,,,,,,1,n m n m t t t t n m n m n mg t e h x x y y μμσσσσσσ μσσπσσ ⎧⎫⎛⎫⎛⎫ ⎪⎪ -+-+++ ⎪ ⎪ ⎨⎬ ⎪ ⎪ -+ --⎪⎪⎝⎭⎝⎭⎩= =由因子分解定理, () 22 1234 11 ,,,,, n m i i i i t t t t t x y x y == ⎛⎫ == ⎪ ⎝⎭∑∑ 是 ) 22 12 ,, μσσ的充分统计量. 注:(概率论与数理统计教程 习题与解答--茆诗松 程依明 濮晓龙)P257~2612.(完全性) 证(,) Gaαλ具有完全性.证: 1 0 ()(,)0 () x g x x e dx α αλ λ ϕαλ γα +∞--== ⎰ ,对(,) αλ ∀,有 1 0()0x g x x e dx αλ +∞--= ⎰ 有拉式变换唯一性知 1()0()0 g x xg x α-=⇒= .3.(辅助统计量)设 1,, n X X 独立同分布, 1 ~(,1) X N θ,则 21()nii S X X = =- ∑ 为辅助统计量. 解:因为 2 ~(1) S n χ-与θ无关, ()(1) n T X X =-亦为辅助统计量,因为()(1)()(1) ()() n n T X X Y Y θθ =---=-,而~(0,1) i i Y X Nθ =-,其分布与无关4.(极小充分统计量)设 1 ,, n X X 为相互独立的样本,且 2 ~(0,) j X N σ一切j i≠,求完备的极小充分统计量. (1) 若 2~(,) i X N γσ (2) 若 12 ~(0,) i X N ωσ - 其中R γ∈,0 ω>, 2σ都是未知参数证:(1) 1(,,) T n X X X = 的联合分布可表示为 22 22222 11 (,){log(2)} 2222 n j i j n f x Exp X X γγ θπσσσσ = =+--- ∑ 其中 2 1 1()nj i T X X = = ∑ , 1 2 1 () 2 Q θ σ =-; 2 () i T X X =, 2 2 () Q X γ σ ==; 22 () 2 b n γ θσ =+,因此,为 2 1(,) n j i j X X = ∑ 完备的极小充分统计量 (2) 类似的, 1(,,) T n X X X = 的联合分布可表示为 22222 11(,){log(2)log()} 2222 j i j in f x Exp X X ω θπσω σσ ≠ =--+-∑ 其中, 2 1 ()j j i T X X ≠ = ∑ , 1 2 1 () 2 Q X σ =-; 2 2 () i T X X =, 2 2 () 2 Q X ω σ =-1()log 2b n θω=-,因此, 2 (,) nj i j iX X ≠ ∑ 为完备的极小充分统计量.5.(完备性的极小充分统计量)1 ,, n X X 独立同分布, 1 ~(0,) X R θ,则 ()n X 为完备的极小充分统计量. 证:() ~(,1) n X Be n θ ,故有 11 (){0} ~(,)( n n tt X f t n I θ θθ θ-- ≤≤ = 若[()]0 E h T θ =,则 1()0 n h t tdt θ- = ⎰ ,该式在 () h t 的连续处对θ,求导可得1 ()0 n h θθ - =,所以()0 h θ=,即()0 h t =.因此, () n T X =为完备的极小充分统计量注:若 1 ,, n X X 独立同分布, 112~(,) X R θθ,则 (1)()(,) n T X X =为完备的极小充分统计量.6.(完备性)设总体X 在 12 (,) θθ上服从均匀分布,概率密度函数为 1221 12 1(,,) 0 x f x θθθθ θθ ⎧ << ⎪- = ⎨ ⎪ ⎩其它1 ,, n X X 为子样,顺序统计量为 (1)() n X X ≤≤ ,当 12 0, 2 θθθθ =>=时,试证 (1) X 及 () n X 都为充分统计量,但并非完备统计量. 证:子样的联合密度函数为:(1)()1(02)(,,,) n n n X X f X X I θ θθ - <<< =可见 (1) X 及 () n X 都为的充分统计量. 总体X 的概率密度函数及分布函数为12 (,) 0 x f x θθ θ θ ⎧ << ⎪= ⎨ ⎪ ⎩ 其它0 F(,)0 2 12x x x xx θθθθ ≤ ⎧ ⎪ ⎪=<< ⎨ ⎪ ≥ ⎪ ⎩(1) X 的分布函数为1(1)(1) 1 ()()1()1[1()]1(2) nni v F v P X v P X v F v θ = =<=-≥=--=-- ∏,02v θ <<密度函数为 1 1()(2)/ n n f v n v θθ - =-,02v θ << 2 1 11 1(1) ()()[12(1)] 1 n n E X vf v n θθθ - +- ==+-++ ⎰ ()n X 的分布函数为 1() 1()()()(1) nn n i i uF u P X u P X u θ = =<=<=- ∏,02u θ <<密度函数为 1()()/ n n n f u n u θθ- =-,02u θ << 2 1 1(1) ()()[12(1)] 1 n n n n E X uf u n θθθ - +- ==+-+ + ⎰记 (1)()(,) n T X X = 又 1111(1)() 1(1)1(1) ()[12(1)[12(1) 11n nnnn g T X X n n ---- +-+- =+-+-+-+ ++ 则 [()]0 E g T = ,但 ()0 g T ≠ ,于是由 (1) X 及 ()n X 组成的统计量是非完备的.7.(英文习题)(1).Let X be one observation from a () 2 0, n σpopulation. Is X a sufficient statistic? 解:By the Factorization Theorem, X is sufficient because the pdf of X is()()()22 222 222 1 x xh x f x g x σ σ σσ - - ===⋅中文注释:随机变量X 是来自总体 ()20,n σ的一个样本.X 是一个充分统计量吗? 解:由因子分解定理知,X 的密度函数为()()()2 2 222 222 1 x xh x f x g x σ σ σσ - - ===⋅所以,X 是充分统计量.注:E02 Statistical Inference(2ed) by George Casella(2).Let 1 ,, n X X be independent random wariables with densities()0 i x i e x i fx x x i θ θ θ θ -⎧≥ = ⎨ < ⎩Prove that () min i i T X=is a sufficient statistic for .。

太原理工大学数理统计课件第1.2节 充分统计量与完备统计量教材

太原理工大学数理统计课件第1.2节  充分统计量与完备统计量教材
n
解 P { X1 x1 , X 2 x2 ,
1
n
, X n xn }
n

n
i
i 1
xi
x !
i 1 i
e n
x !
i 1 i
n

n
i 1
n
e

1
x !
i 1 i
n
nX e n
1 , g(T ( x1 ,
其中T ( x1 , x2 , x2 ,
例5(p9 例1.7) 设( X1 , X 2 ,
n
, X n )T 是来自正态总体 , Xn ) (X ,
N( , 2 )的一个样本,试证T(X 1 , X 2 ,
i 1
2 T 2 T X ) 是参数 =( , ) 的联合充分统计量. i
解 L( )
1
1 ( 2π )n
k P{ X1 x1 , X 2 x2 , , X n xn | X } n k P{ X1 x1 , X 2 x2 , , X n xn , X } n k P{ X } n P{ X1 x1 , X 2 x2 , , X n xn , nX k } P{nX k } n P{ X1 x1 , X 2 x2 , , X n xn , X i k } i 1 n P { X i k }
n i 2 i 1
( 2 π )n 1 1 n 2 exp{ ( x x x ) i n 2 ( 2π ) i 1 1 1 n n 2 2 exp{ ( x x ) ( x ) } i n 2 i 1 2 ( 2π )
1 n n 2 2 exp{ ( x x ) }exp{ ( x ) } i n 2 i 1 2 ( 2π ) 1

第1.2节 充分统计量与完备统计量

第1.2节  充分统计量与完备统计量

k k k p (1 p)n k ,因而 证 由于P{ X } P{nX k }=C n n n
ห้องสมุดไป่ตู้
k k p k 即对任意的0 p 1, g( )C n ( ) 0,而此式 n 1 p k 0 p 是关于 的多项式,因而每项系数只能为0,则 1 p k k g( ) 0,因而满足Pp { g( ) 0} 1, 所以X 是完备 n n 统计量.
n n
xi
n
其中T ( x1 , x2 , x2 ,
, xn ) X , h( x1 , x2 ,
n
, xn ) 1, g(T ( x1 ,
p nT , xn ), ) (1 p) ( ) ,因而,X 是充分统计量 1 p
例3(p8 例1.5)设( X1 , X 2 ,
, X n )T 是来自泊松分
, X n ) 是来自正态总体
T
1 n N( ,1)的一个样本,试证X X i 是参数的充 n i 1 分统计量. 1 { ( x ) } 1 2 解 L( ) e
n i 2 i 1
( 2 π )n 1 1 n 2 exp{ ( x x x ) i n 2 ( 2π ) i 1 1 1 n n 2 2 exp{ ( x x ) ( x ) } i n 2 i 1 2 ( 2π )
的随机变量g( X ), 总有
P { g( X ) 0} 1, 对一切 ,
则称{F ( x, ), }的完备的分布函数族.
定义 1.6 设X 1 , X 2 , , X n是来自总体X 具有分布函数 F ( x , )的一个样本,T T ( X 1 , X 2 , , X n )的分布函数族 { FT ( x , ), }是完备的分布函数族,则称T T ( X 1 ,

充分统计量举例说明

充分统计量举例说明

充分统计量举例说明
充分统计量是指能够包含样本中所有关于总体参数的信息的统计量。

它能够提供关于总体未知参数的最大可能的信息量,从而使得对总体参数的推断更加准确和可靠。

下面是一些充分统计量的例子:
1. 样本均值,对于总体均值的估计,样本均值是一个充分统计量。

它包含了样本中所有观测值的信息,并且是总体均值的无偏估计量。

2. 样本方差,对于总体方差的估计,样本方差也是一个充分统计量。

它包含了样本中所有观测值的离散程度的信息,并且是总体方差的无偏估计量。

3. 样本中位数,对于总体中位数的估计,样本中位数是一个充分统计量。

它能够提供总体分布的中心位置的信息,尤其在样本中存在异常值或者偏态分布的情况下更为有效。

4. 样本最大值和最小值,对于总体范围的估计,样本的最大值和最小值是充分统计量。

它们能够提供总体数据的上限和下限的信
息,对于描述总体数据的分布范围有重要意义。

5. 样本相关系数,对于总体相关关系的估计,样本相关系数是一个充分统计量。

它能够提供总体变量之间线性相关关系的信息,对于研究变量之间的相互关系非常有用。

需要注意的是,充分统计量的选择应该基于所研究问题的特点和目标,以及样本数据的性质。

以上只是一些常见的例子,实际应用中可能还会根据具体情况选择其他充分统计量。

充分统计量与完备统计量

充分统计量与完备统计量

完备统计量的含义不如充分统计量那么明确,但由
定义可见它有如下特征:
P g1 (T ) g2 (T ) 1, E g1 (T ) E g2 (T ), 。
(1.7)
对于一般的统计T T ( X 1 , X 2 , , X n ) ,总有
对统计量 T,如果已知它的值以后,样本的条件分布 与 无关,就意味着样本的剩余部分中已不再包含关于 的信息, 也就是在 T 中已包含有关 的全部信息。 因此, 对 的统计推断只需要从 T 出发即可, 不再需要样本数据。
二、 因子分解定理
根据充分统计量的含义,在对总体未知参数进 行推断时,应在可能的情况下尽量找出关于未知参 数的充分统计量。 但从定义出发来判别一个统计量是否是充分统 计量是很麻烦的。 为此,需要一个简单的判别准则。下面给出一 个定理——因子分解定理,运用这个定理,判别甚 至寻找一个充分统计量有时会很方便。
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1 n n xi n xi n p i 1 (1 p ) i 1 , 如 果 xi k, k k nk C n p (1 p ) i 1 n 0 , 如 果 xi k, i 1 n 1 C k , 如果 xi k, i 1 n n 0, 如果 xi k, i 1
其中 h( x1 , x2 ,, xn ) 1 ,
而 g (T ( x1 , x2 , , xn ); ) 显 然 是 T ( x , xi2 ) 和 ( , 2 ) 的函数。 故由因子分解定理知 T ( X , x i2 ) 是 ( , 2 )

第1.2节 充分统计量与完备统计量

第1.2节  充分统计量与完备统计量
T 维 )统计量,当给定T = t时,若样本(X 1 , X 2 ,L , X n)的
条件 分 布 (离 散 总体 为 条 件概 率 , 连续 总 体 为条 件 密 度) 与 参 数θ 无关 , 则 称T 为 θ 的充 分 统 计量 .
3. 充分统计量的意义 如果知道了统计量T的观察值以后, 如果知道了统计量 的观察值以后,样本的条 的观察值以后 件分布与θ无关, 件分布与θ无关,也就是样本的剩余部分不再包含 关于θ的信息,换言之, 关于θ的信息,换言之,在T中包含了关于θ的全部 中包含了关于 信息,因此要做关于θ的统计推断,只需用统计量T 信息, 的统计推断, 就足够啦. 就足够啦. 1.3) 例1(p6 例1.3 设总体X 服从两点分布B(1, p),即
例4(p9 例1.6) 设( X1 , X 2 ,L , X n )T 是来自正态总体 1.6
1 n ,1)的 N(µ ,1)的一个样本,试证X = ∑ X i 是参数µ的充 n i =1 分统计量. 1 −{ ∑ ( x − µ ) } 1 2 解 L( µ ) = e
n 2 i i =1
( 2 π )n 1 1 n exp{ − ∑ ( x i − x + x − µ ) 2 = 2 i =1 ( 2 π )n 1 1 n n 2 exp{ − ∑ ( x i − x ) − ( µ − x ) 2 } = 2 i =1 2 ( 2 π )n
= h( x1 , x2 ,L , xn ) g( f −1 ( f (T ( x1 , x2 ,L , xn ))), θ ) = h( x1 , x2 ,L , xn )q( f ( x1 , x2 ,L , xn ), θ )
i =1
由因子分解定理可知,f ( x1 , x2 ,L , xn )是θ的充分统 计 量 , 因 而 充分 统 计 量 不 唯 一 .

充分统计量

充分统计量

充分统计量充分统计量又称足够的样本容量,是指一个总体能从各种可能中得到它所需要的资料。

这里需说明的是“全部”并不等于每个个体都被收集起来加以考察。

这也就是为什么有些人很忙,但工作成效却很低的原因。

只有对总体进行研究后才能发现其规律性和特征,而大量重复就会使统计工作变得无用,而且费力。

另外,抽样时还必须保证总体中每个个体都具有同质性或相似性。

根据这两点,充分统计量应该满足:(1)当总体中任何一个个体值均落入某一区间内时,则认定此数据已达到了充分统计量;(2)若总体中存在非随机误差项,那么在估算充分统计量时,将其剔除出去,再求解,直至误差消失为止。

我们在作调查时,常遇见这类问题:“你家几口人?”、“你今年多少岁啦!”…诸如此类的提问方式显然没有经过严格的科学论证,甚至连最基础的概率知识都未掌握。

试想,假设甲乙丙三位老师同时向100名小朋友询问上述问题,结果会怎样呢?答案肯定是令人吃惊的!由此看来,我们平日里做事情,尤其是搞社会调查活动,切忌凭主观臆断下结论,更不能道听途说,盲目地给别人贴标签。

俗话说:“凡事预则立,不预则废。

”正确运用好充分统计量,关系着整个调查报告的质量高低与否。

如果调查者缺乏专业素养,往往会导致错误的判断,造成决策失误。

例如,前面讲到的美国人口普查局的一次实验。

他们选择了一批6-10岁儿童,让他们填写自己父母亲的职业,并把这份表交回来,请他们的父母评价孩子的智商水平。

这个实验虽然取得了良好的效果,但是却留下了许多疑惑——为什么受测者的父母对孩子的智商竟毫无觉察呢?难道真像他们所宣传的那样,他们天生愚钝吗?通过仔细推敲,他们终于找到了症结所在:原来,这群孩子之所以智商偏低,完全是因为他们的父母压根儿就没有意识到自己的孩子智商比较低罢了。

充分统计量例题

充分统计量例题

充分统计量例题一、概述在统计学中,充分统计量(sufficient statistic)是指能够包含样本中所有关于未知参数的信息的统计量。

它们能够有效地减少样本数据的维度,并且在推断未知参数时提供足够的信息。

充分统计量在统计推断和参数估计中起着重要的作用。

它们能够帮助我们从样本中推断出总体参数的值,而无需关注整个样本的数据。

在许多情况下,通过使用充分统计量,我们可以简化推断过程,减少计算的复杂性,并获得更精确和可靠的估计结果。

二、定义充分统计量的定义是基于条件概率。

对于一个参数θ的统计模型,我们可以将观测数据表示为X = x,其中X表示从总体中抽取的随机样本,x表示观测到的样本数据。

给定样本X = x,一个统计量T(X)称为充分统计量,如果对于所有可能的样本X,给定充分统计量T(X)后,样本的条件分布不依赖于待估参数θ。

换句话说,充分统计量能够保留样本中所有关于待估参数θ的信息,而无需知道样本中每个观测值的具体取值。

三、寻找充分统计量的方法寻找充分统计量的方法有多种,常用的有因子分解定理、最大似然估计和贝叶斯估计等。

1. 因子分解定理因子分解定理是寻找充分统计量的经典方法之一。

其基本思想是将样本的联合概率密度函数(或概率质量函数)分解为两个函数的乘积。

其中一个函数是与参数θ无关的函数,另一个函数只是依赖于θ。

通过因子分解定理,我们可以找到一组与θ无关的函数h(x)和依赖θ的函数g(x;θ),使得联合概率密度函数(或概率质量函数)可以表示为:p(x;θ) = h(x)g(x;θ)其中,h(x)称为充分统计量的底层函数。

2. 最大似然估计最大似然估计是寻找充分统计量的另一种常用方法。

最大似然估计的目标是找到使得样本出现的概率最大的参数值。

在最大似然估计中,我们首先构造样本的似然函数,然后通过最大化似然函数来得到参数的估计值。

如果我们能找到一个统计量,它的分布与待估参数的似然函数相同,那么这个统计量就是充分统计量。

充分统计量

充分统计量

x )2
n (
2
x)2 }
(
1 2π )n
exp{
1 2
n i 1
( xi
x)2 }exp{
n (
2
x)2 }
其中T ( x1, x2 , , xn ) x,
h( x1, x2 ,
,
xn )
exp{
1 2
n i 1
( xi
x )2 }
g(T ( x1, x2 ,
, xn ), ) (
1 exp{ n ( T )2 },
g(T ( x1, x2 ,
, xn ), ) (
1
1
2π )n exp{ 2 2
n i 1
xi2
n 2
x
n 2
2 2
},因而,T
(
x1
,
x2
,
n
, xn ) ( x, xi2 )是充分统计向量。
i 1
进一步,我们指出这个统计量与 (x, s2 )
是一一对应的,这说明在正态总体场合
常用的 ( x , s2 ) 是充分统计量。
P(T t; )
t;
)
P(X1
x1,, X n
P(T t; )
xn; )
g(t, )
g(t, )h( x1,, xn )
h( x , , x ) {( x1,,xn ):T ( x1,,xn )t }
1
n
h( x1,, xn )
h( x , , x ) {( x1,,xn ):T ( x1,,xn )t }
,
xn ),
p)
(1
p)n ( p )nT 1 p
,

充分统计量例题

充分统计量例题

充分统计量例题充分统计量是指在给定总体分布下,能够包含全部信息的统计量。

在统计学中,充分统计量是非常重要的概念,它可以帮助我们更好地理解总体分布,并且可以用来进行参数估计和假设检验等统计分析。

下面我们来看一个例题,通过这个例题来理解什么是充分统计量。

假设我们有一个总体分布,它的概率密度函数为f(x;θ)=θx^(θ-1),其中θ>0,0<x<1。

现在我们从这个总体中随机抽取了n个样本,样本值为x1,x2,…,xn。

我们的目标是找到一个充分统计量。

首先,我们需要根据样本数据来构造一个统计量T(x1,x2,…,xn),这个统计量应该能够包含全部信息。

我们可以尝试构造如下的统计量:T(x1,x2,…,xn)=∏(i=1 to n)x_i这个统计量的意义是将所有样本值相乘,它能够包含全部信息吗?我们可以使用因子分解定理来验证一下。

因为总体分布的概率密度函数可以写成如下形式:f(x;θ)=exp{ln(θ)+ln(x^(θ-1))}所以,我们可以将样本的联合概率密度函数写成如下形式:L(x1,x2,…,xn;θ)=exp{ln(θ)+∑(i=1 to n)ln(x_i^(θ-1))}根据因子分解定理,我们可以将上式分解成如下形式:L(x1,x2,…,xn;θ)=h(x1,x2,…,xn)g(θ)其中,h(x1,x2,…,xn)=∏(i=1 to n)x_i^(θ-1),g(θ)=exp{ln(θ)}。

我们可以看到,h(x1,x2,…,xn)与T(x1,x2,…,xn)是等价的,因此,T(x1,x2,…,xn)是一个充分统计量。

接下来,我们可以使用这个充分统计量来进行参数估计。

假设我们要估计总体分布的参数θ,我们可以使用最大似然估计法。

根据最大似然估计法的原理,我们需要找到一个参数θ的值,使得样本的联合概率密度函数L(x1,x2,…,xn;θ)最大。

因为h(x1,x2,…,xn)与θ无关,所以我们只需要最大化g(θ)即可。

正态分布的充分统计量

正态分布的充分统计量

正态分布的充分统计量正态分布是统计学中最常见的分布之一,它具有许多重要的性质,例如对称性、峰度和偏度等。

在实际应用中,我们经常需要对正态分布进行参数估计和假设检验等统计分析。

而为了进行这些分析,我们需要选择一些充分的统计量来描述正态分布的特征。

本文将介绍正态分布的充分统计量。

我们需要了解什么是充分统计量。

充分统计量是指在给定总体分布下,能够完全描述样本信息的统计量。

也就是说,如果我们知道了充分统计量的取值,就能够推断出总体分布的所有信息。

因此,充分统计量是进行参数估计和假设检验等统计分析的重要工具。

对于正态分布,最常用的充分统计量是样本均值和样本方差。

样本均值是指样本中所有观测值的平均值,而样本方差是指样本中所有观测值与样本均值之差的平方和除以样本容量减一。

这两个统计量可以完全描述正态分布的特征,因为正态分布的均值和方差是其唯一的两个参数。

除了样本均值和样本方差,正态分布还有其他一些充分统计量。

例如,样本中位数和样本四分位数也可以用来描述正态分布的特征。

样本中位数是指将样本观测值按大小排序后,位于中间位置的观测值。

而样本四分位数是指将样本观测值按大小排序后,分别位于四分之一和四分之三位置的观测值。

这些统计量可以在一定程度上反映正态分布的偏度和峰度等特征。

除了上述充分统计量,正态分布还有一些其他的统计量,例如样本偏度和样本峰度等。

这些统计量可以用来描述正态分布的偏度和峰度等特征,但它们并不是充分统计量,因为它们不能完全描述正态分布的特征。

正态分布的充分统计量是样本均值和样本方差。

除此之外,样本中位数和样本四分位数等统计量也可以用来描述正态分布的特征。

在进行参数估计和假设检验等统计分析时,我们应该选择合适的充分统计量来描述正态分布的特征,以获得更准确的结果。

完全充分统计量定义

完全充分统计量定义

完全充分统计量定义完全充分统计量是指一个观测数据的函数,它包含了样本中所有对参数的信息,能够完全确定参数的取值。

在统计推断中,完全充分统计量是非常重要的概念。

为了更好地理解完全充分统计量的定义,我们需要先了解一些基本的统计概念。

首先,我们有一个总体,总体中的每一个个体都有一个或多个待估计的参数,比如平均值、方差等。

我们通常无法获得整个总体的数据,因此我们通过对总体进行抽样来获取一部分数据。

抽样是指从总体中随机地选择出一部分观测数据。

样本是我们从总体中抽取的这部分数据,可以看作是总体的一个子集。

样本中的观测值被用来作为对总体的估计。

在统计推断中,我们需要根据样本数据对总体参数进行估计。

估计可以分为点估计和区间估计。

点估计是指用一个值来估计总体参数,而区间估计是指用一个区间来估计总体参数。

一个估计量的好坏可以通过其偏差和方差来评估。

偏差是估计值与真实值之间的差异,方差是估计值在重复抽样中的变动程度。

我们希望估计量的偏差较小,方差较小。

完全充分统计量是为了满足某种优良性质的统计量。

它是一个函数,将每个样本映射到一个数值。

这个函数的构造需要同时满足充分性和完全性的条件。

充分性是指统计量包含了样本中的所有信息,即样本观测值所包含的参数信息都能够通过统计量获得。

充分性的定义可以理解为,如果两个样本在所有参量下有相同的统计量值,那么这两个样本是等价的,即它们包含了相同的信息。

完全性是指统计量含有的信息与总体的参数是一致的。

如果一个估计量是充分的,并且其他充分统计量的函数,那么它就是完全充分的。

完全充分统计量的重要性在于,它能够最大程度地利用样本数据中的信息,提供最优的参数估计。

如果一个统计量是完全充分的,那么在给定这个统计量的情况下,其他统计量都是冗余的。

完全充分统计量在统计推断中有着广泛的应用。

在构造置信区间、检验假设等方面,完全充分统计量起到了关键作用。

通过使用完全充分统计量,我们可以在减小样本数据的维度的情况下,获得对参数更准确的估计。

充分统计量与完备统计量

充分统计量与完备统计量

例5
设( X 1 , X 2 , , X n )T 是来自正态总体N( , 2 )
n i 1
的一个样本,试证T(X 1 , X 2 , , X n ) ( X , X i2 )T 是参数 =( , 2 )T的联合充分统计量.
解 L( )
1
1 ( 2π )n
{
证明涉及测度论,从略 说明:
如果参数为向量时,统计量T也是随机向量,例如
( , ), 则相应的统计向量可以为T ( X , S ).
2 2 n
以下将通过几个例子来说明判别法则的应用
例2 根据因子分解定理证明例2.3 解
P{ X1 x1 , X 2 x2 , , X n xn }
x !
i 1 i
n
g (T ( x1 , x2 , , xn ), ) nT e n ,因而,X 是充分统计量.
例4 设( X 1 , X 2 , , X n )T 是来自正态总体N( ,1)的
1 n 一个样本,试证X X i 是参数的充分统计量. n i 1
k k 证 由于P{ X } P{nX k }=C n p k (1 p)n k ,因而 n n
k k p k 即对任意的0 p 1, g ( )C n ( n 1 p ) 0,而此式 k 0 p 是关于 的多项式,因而每项系数只能为0,则 1 p k k g( ) 0,因而满足Pp { g( ) 0} 1, 所以X 是完备 n n 统计量.
§2.3 充分统计量与完备统计量
一、充分统计量
二、因子分解定理
三、完备统计量 四、指数型分布族
一、充分统计量
1. 问题的引出

充分统计量与完备统计量

充分统计量与完备统计量

三、完备统计量
为了介绍完备统计量的概念,首先需要引入完备分 布函数族的概念。
定义 1.5 设总体 X 的分布函数族为F( x; ), ,
若对任意一个满足
E g( X ) 0,对一切
的随机变量 g( X ),总有
(1.5)
P g( X ) 0 1,对一切 , 则称F( x; ), 为完备的分布函数族。
族——指数型分布族。它包含了一些常用分布,如泊松
分布、正态分布、指数分布、二项分布和 分布等,对这
类分布族,寻找参数的充分完备统计量是方便的。
定理 1.5 设总体 X 的分布密度 f ( x; )为指数型分布
族,即样本的联合分布密度具有如下形式:
n i 1
f
( x;
)
C (
) exp
m j1
=T(X1,X2,…,Xn) 也有一个抽样分布FT(t) 。
当我们期望用统计量T 代替原始样本并且不
损失任何有关 的信息时,也就是期望抽样分布 FT(t) 像 F(x) 一样概括了有关 的一切信息。
这即是说在统计量T 的取值为 t 的情况下
样本 x 的条件分布F(x|T=t) 已不含 的信息,
bj (
)Tj ( x1 ,
x2 ,,
xn
)
h( x1 , x2 ,, xn ),
2.9
其中 (1,2 ,,m ), 。如果中包含有一个m 维矩形,
而且 B (b ( ),b ( ),,b ( ))的值域包含一个m 维开集,则
1
2
m
T (T ( X , X ,, X ),T ( X , X ,, X ),T ( X , X ,, X ))
完备统计量的含义不如充分统计量那么明确,但由

1.2 充分、完备统计量

1.2 充分、完备统计量

f (t )是单 定理 设 T ( X 1 , X 2 , , X n )为 的一充分统计量,
值可逆函数,则 f (T ) 也是 的充分统计量 结论: 1 统计量用来推测参数的值; 2 充分统计量把可能丢失信息的统计量筛选; 3 最优统计量在充分统计量之中; 4 一个参数的充分统计量不唯一. 问题:在什么情况下,它是唯一的?
对于一般的统计量 T ( X1 , X 2 ,, X n )
P { g1 (T ) g2 (T )} 1, E ( g1 (T )) E ( g2 (T )),
( X1, X 2 ,, X n )T

• 例设 是来自总体 X 服从两点分布 B(1, p) 的样本 ,样本均值 X 是参数 p 的充分统计量, 验证 X 也是完备统计量 证明:由于 X ~ B(1, p),n X ~ B(n, p),

P{ X 1 x1 , X 2 x2 ,, X n t xi }
i 1
n 1
P{T t }
P( X
i 1
n 1
i
xi ) P ( X n t xi ) ( n ) n e t!
t i 1
n 1
x
i 1
n
i
t
e t! i 1 x i ! t ( n ) n n t n x ! e i i 1 t!
后,对 任意
x1, x2,, xn

x
i 1
t ,样本 ( X1 , X 2 ,, X n )T 的条件概
率密度为:
f ( x1 , x2 ,, xn | T t )
f ( x1 , x2 ,, xn1 , t xi )

充分统计量_完备统计量_指数分布族

充分统计量_完备统计量_指数分布族

i 1
i 1
3)常见指数分布族 二项分布族:
p
(x)
n x
x (1 )nx
n x
(1
)n
e
x
ln
1
c( ) exp{c1( )x}h(x), x 0,1,, n
其中
c(
)
(1
)n ,
c1 (
)
x
ln
1
,
h(x)
n x
二元正态分布族:
pu, (x)
1 2
exp{
2 2 2
h x1,, xn h y1,yn :T y1,yn t
y1, yn
,
该分布与 无关,这证明了充分性.
3)充分性判别法则
定理 4.1 设样本分布密度函数族(连续或离散)为 F f x, : ,T T X
为统计量.则:T 为充分统计量的充分必要条件为:存在关于 t 的可测函数 g t 与关 于 x 的非负可测函数 h x ,使得
-4-
X (1) ,, X (n) 是完全的(对任何自然数 n).
引理 :设分布族满足上面的条件(a), f ( X1,, X n ) 为 Bore(可测得对称函数),满足条

f
( X1,,
X n )dF ( X1)dF ( X n )
0f
( X (1) ,,
X(n) )
,对任何
F
f

则对 F 中的任意 n 个分布 F1,, Fn ,必有
x f (x)dp (x) 0 , 对 一 切 ” 的 有 界 x 可 测 函 数 f (x) , 必 有
p {X f (x) 0} 0 ,对一切 ,则称分布族 { p , } 为有界完全的.若
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( X1, X 2 , , X n )T 是来自总体X的一个样本,试证
? X
?
1 n
n i?1
X
是参数
i
p的充分统计量
.
证 利用定义证明其是充分统计量
k
P{X 1 ? x1, X 2 ? x2 ,
,Xn
?
xn
|X
?
} n
k
P{X1 ? x1, X 2 ? x2 , ?
,Xn
?
xn, X
?
} n
k
P{X ? }
n
? P{X 1 ? x1, X 2 ? x2 , , X n ? x n , nX ? k }
P{nX ? k }
n
? P{X 1 ? x1, X 2 ? x2 , , X n ? xn , X i ? k }
?
i?1 n
P{? X i ? k }
i?1
?
P{X1 ?
x1, X 2 ?
n
x2,
, Xn ? xn}
如果知道了统计量 T的观察值以后,样本的条 件分布与 ?无关,也就是样本的剩余部分不再包含 关于?的信息,换言之,在 T中包含了关于 ?的全部 信息,因此要做关于 ?的统计推断,只需用统计量 T 就足够啦 .
例1(p6 例1.3) 设总体X 服从两点分布B(1, p),即
P{X ? x }? p x (1? p)1? x , x ? 1, 0,
设总体X 具有分布密度 f ( x ,? ),( X1, X 2 , , X n )T
是一个样本, T ( X1, X 2 , , X n )是一个统计量,则 T
是? 的充分统计量的充要条件是:样本的联合分布
密度可以分解为
n
? L(? ) ? f ( xi ,? ) ? h( x1, x2, , xn )g(T ( x1, x2 , , xn ),? ) i?1
例如,设总体服从
N
(?
,?
2 ),在上一节中,用
X
,
S
2 n
,
去估计总体的 ? 和? 2, X , S n2是否将 ? 和? 2的信息完全提
炼出来呢?
2. 定义 1922 年英国统计学家 Fisher 提出了描述总体信息 是否被完全提炼的概念 —充统计量 .
定义 1.4 设X 1 , X 2 , , X n是来自总体 X 具有分布函数
P{? X i ? k }
i?1
?
P{X1 ?
x1}P{X 2
n
?
x2}
P{X n ? xn }
P{? X i ? k }
i?1
?
n
? xi
n
? n? xi
? ?
?? ? ?
p i?1 Cnk
(1 ? p) i?1 pk (1 ? p)n? k
n
, xi ? k,
i?1
?? 0,
其他,
?1
?
? ?
x2,
, xn ),? ) ?
(1?
p)n ( p )nT 1? p
,因而,X 是充分统计量
例3(p8 例1.5)设( X1 , X 2 , , X n )T 是来自泊松分
? 布P(? )的一个样本,试证 X
?
1 n
n i?1
X i是参数?的充
分统计量 . 解 P{X 1 ? x1, X 2 ? x2,
n
n
n
? xi
? n? xi
? p i?1 (1 ? p) i?1 ? (1 ? p)n (
p ? xi ) i?1
n
1? p
? xi
? 1 (1? p)n (
n i?1
p) n
? 1 (1? p)n (
p )nX
1? p
1? p
其中T ( x1, x2 , , xn ) ? X , h( x1, x2 , , xn ) ? 1, g(T ( x1,
,X n ? xn}?
n
? xi
? i?1
n
e? n?
1 ?n
n
? xi
? e ? n i?1 n
? n?
1
n
? xi! i ?1
? e nX ? n?
? xi !
? xi !
其中 T ( x1 , x 2 ,
i?1
, xn ) ? X ,h( x1, x2,
i?1
1
, xn) ? n
, g(T ( x1 ,
证明涉及测度论,从略
说明:
如果参数 ? 为向量时,统计量 T 也是随机向量,例如
?
?
(? ,?
2 ),则相应的统计向量可以为
T
?
(X
,
S
2 n
).
以下将通过几个例子来说明判别法则的应用
例2(p8 例1.4) 根据因子分解定理证明例 2.3
解 P{X1 ? x1, X 2 ? x2, , X n ? xn }
第1.2节 充分统计量与完备统计量
一、充分统计量 二、因子分解定理 三、完备统计量 四、指数型分布族
一、充分统计量
1. 问题的引出
由于样本来自总体,抽取出来的样本包含有总体 的信息。数理统计主要是利用样本信息推断总体的信 息,如何将样本中包含总体的信息提取出来?以及是 否将样本中包含总体的信息完全提取出来?这些都是 数理统计需要解决的问题。
其中h是x1, x2 , , xn的非负函数且与? 无关,g仅通
过T 依赖于x1, x2 , , xn .
(2) 离散型情况
设总体X的分布律P{X ? x (i) } ? p( x (i) ,? ),( i ? 1, 2, ),
( X1, X 2 , , X n )T 是一个样本, T ( X1, X 2 , , X n )是一
个统计量,则 T 是?的充分统计量的充要条件是:
样本的联合分布律可以分解为
n
? P( x (i) ,? ) ? h( x1, x2 , , xn )g(T ( x1, x2 , , xn ),? )
i?1
其中h是x1, x2, , xn的非负函数且与? 无关,g仅通
过T 依赖于x1, x2 , , xn .
F ( x ,? )的一个样本, T ? T ( X 1 , X 2 , , X n )为一个(一维或多 维)统计量,当给定 T ? t时,若样本( X 1 , X 2 , , X n)T的
条件(离散总体为条件概率,连续总体为条件密度 )与参
数? 无关,则称 T 为? 的充分统计量 .
3. 充分统计量的意义
? xi !
i?1
x 2 , , x n ), ? ) ? ? nT e ? n? ,因而, X 是充分统计量
例4(p9 例1.6) 设( X1, X 2 , , X n )T 是来自正态总体
C
k n
,
? ?
0,
n
? xi ? k,
i ?1
其他,
显然该条件分布与 p无关,因而 X 是p的充分统计量 .
说明 利用定义判别充分统计量比较麻烦,因而需 要需求更好的判别准则。
二、因子分解定理
1. 充分统计量的判别准则 定理1.3(因子分解定理 )(Fisher-Nerman 准则)
(1) 连续型情况
相关文档
最新文档