数理统计第二章抽样分布2.7节充分统计量
概率论与数理统计教案统计量和抽样分布
概率论与数理统计教案-统计量和抽样分布一、教学目标1. 理解统计量的概念,掌握常见统计量的计算方法。
2. 了解抽样分布的定义,掌握正态分布、t分布、卡方分布等常见抽样分布的特点及应用。
3. 学会使用抽样分布进行假设检验和置信区间的估计。
二、教学内容1. 统计量的概念及计算方法统计量的定义样本均值、样本方差、样本标准差等常见统计量2. 抽样分布的定义及特点抽样分布的定义正态分布、t分布、卡方分布等常见抽样分布的特点3. 抽样分布的应用假设检验置信区间的估计三、教学方法1. 讲授法:讲解统计量的概念、计算方法,抽样分布的定义及特点。
2. 案例分析法:通过具体案例,让学生学会使用抽样分布进行假设检验和置信区间的估计。
3. 互动教学法:引导学生参与课堂讨论,提问、解答问题,提高学生的积极性和主动性。
四、教学步骤1. 引入统计量的概念,讲解样本均值、样本方差、样本标准差等常见统计量的计算方法。
2. 讲解抽样分布的定义,介绍正态分布、t分布、卡方分布等常见抽样分布的特点及应用。
3. 通过具体案例,让学生学会使用抽样分布进行假设检验和置信区间的估计。
五、课后作业1. 复习本节课的内容,整理笔记。
2. 完成课后习题,加深对统计量和抽样分布的理解。
3. 选择一个感兴趣的话题,运用抽样分布进行实际问题的分析。
六、教学评估1. 课堂提问:通过提问了解学生对统计量和抽样分布的理解程度。
2. 课后习题:检查学生对课堂内容的掌握情况。
3. 实际案例分析:评估学生运用抽样分布解决实际问题的能力。
七、拓展与延伸1. 引导学生探讨抽样分布在其他领域的应用,如经济学、生物学等。
2. 介绍与抽样分布相关的高级主题,如非参数统计、贝叶斯统计等。
3. 鼓励学生参加相关竞赛、研究项目,提高实践能力。
八、教学资源1. 教材:概率论与数理统计相关教材。
2. 课件:PPT课件,辅助学生理解统计量和抽样分布的概念及应用。
3. 案例资料:提供具体案例,方便学生学会使用抽样分布进行假设检验和置信区间的估计。
数理统计学:统计量与抽样分布
1.1 总体和样本 1.2 统计量与估计量 1.3 抽样分布 1.4 次序统计量 1.5 充分统计量 1.6 常用的概率分布族
数理统计学 是探讨随机现象统计规律性的一门学科, 它以概率论为理论基础,研究如何以有效的方式收集、 整理和分析受到随机因素影响的数据,从而对所研究对 象的某些特征做出判断。
1.1.2 样本
(2) 抽样, 即从总体抽取若干个个体进行检查或观察,用所 获得的数据对总体进行统计推断。 由于抽样费用低,时间 短,实际使用频繁。本书将在简单随机抽样的基础上研究各 种合理的统计推断方法,这是统计学的基本内容。应该说, 没有抽样就没有统计学
1.1.2 样本
• 从总体中抽出的部分(多数场合是小部分)个体组成的集合 称为样本。
(2)
(n 1)s2
2
~χ2(n-1);
(3) x与s2相互独立。
1.3.2 样本方差的抽样分布
例1.3.3
分别从正态总体N(μ1,σ2)和N(μ2,σ2)中抽取容
量为n1和n2的两个独立样本,其样本方差分别
为
s2 1
和
s2 2
。
(1)证明:对α∈(0,1),
s s s 2 2 (1) 2
Fn(x)依概率收敛于F(x)
1.2.3 样本的经验分布函数及样本矩
定理1.2.1(格里汶科定理)
对任给的自然数n,设x1,x2,…,xn是取自总体分布函数F(x) 的一组样本观察值,Fn(x)为其经验分布函数,记
则有
Dn sup Fn x F x
x
P
lim
n
Dn
0
1
1.2.3 样本的经验分布函数及样本矩
0
Fn x k / n
充分统计量 ppt课件
充分性 P(T t , )
P( X , , X ; {( x1,,xn ):T ( x1,,xn )t }
1
n
)
g(t,
{( x1,,xn ):T ( x1,,xpnpt)课件t }
)h( x1,, xn )
15
P( X1 x1,, Xn xn | T t)
n 2
x
n 2
2 2
},因而,T
(
x1
,
x2
,
n
, xn ) ( x, xi2 )是充分统计向量。
i 1
ppt课件
26
进一步,我们指出这个统计量与 (x, s2 )
是一个样本,T ( X1, X2 是:样本的联合分布
密度可以分解为
ppt课件
12
n
L( ) f ( xi , ) h( x1, x2 , , xn )g(T ( x1, x2 , , xn ), ) i 1
其中h是x1, x2 , , xn的非负函数且与无关,g仅通
T X1 Xn
则在给定 T 的取值后,对任意的一组
n
x1,, xn ( xi t) i 1
P( X1 x1,, X n xn | T t)
n1
P( X 1 x1 ,, X n1 xn1, X n t xi )
i 1 n
P( X i t)
(
1
{ 1
e 2
n i 1
(
xi
)2
}
2π )n
(
1 2π )n
exp{
充分统计量与完备统计量
完备统计量的含义不如充分统计量那么明确,但由
定义可见它有如下特征:
P g1 (T ) g2 (T ) 1, E g1 (T ) E g2 (T ), 。
(1.7)
对于一般的统计T T ( X 1 , X 2 , , X n ) ,总有
对统计量 T,如果已知它的值以后,样本的条件分布 与 无关,就意味着样本的剩余部分中已不再包含关于 的信息, 也就是在 T 中已包含有关 的全部信息。 因此, 对 的统计推断只需要从 T 出发即可, 不再需要样本数据。
二、 因子分解定理
根据充分统计量的含义,在对总体未知参数进 行推断时,应在可能的情况下尽量找出关于未知参 数的充分统计量。 但从定义出发来判别一个统计量是否是充分统 计量是很麻烦的。 为此,需要一个简单的判别准则。下面给出一 个定理——因子分解定理,运用这个定理,判别甚 至寻找一个充分统计量有时会很方便。
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1 n n xi n xi n p i 1 (1 p ) i 1 , 如 果 xi k, k k nk C n p (1 p ) i 1 n 0 , 如 果 xi k, i 1 n 1 C k , 如果 xi k, i 1 n n 0, 如果 xi k, i 1
其中 h( x1 , x2 ,, xn ) 1 ,
而 g (T ( x1 , x2 , , xn ); ) 显 然 是 T ( x , xi2 ) 和 ( , 2 ) 的函数。 故由因子分解定理知 T ( X , x i2 ) 是 ( , 2 )
充分统计量
充分统计量ppt课件
ln xi
都是θ的充分统
常见分布的充分统计量
分布
两点分布b(1, p) Poisson分布P(λ) 几何分布Ge(θ) 均匀分布U(0, θ) 均匀分布U(θ1, θ2) 均匀分布U(θ, 2θ) 正态分布N(μ,σ 2) 指数分布Exp(λ) 伽玛分布Ga(α ,λ)
参数 p
λ θ θ (θ1,θ2) θ (μ,σ 2) λ (α ,λ)
i 1
(2
2
)
n
2
exp{
n 2 2 2
}exp{
1
2
2
(t2
2t1)}
h(x1, , xn ) 1 即可.
注:若θ是参数向量,T是随机向量,且满足因子分 解定理的条件,则T是θ的充分统计量. 但不能由T 关于θ是充分的, 推出T 的第i 个分量关于θ的第i 个 分量也是充分的.
和任一组观测值x1, , xn ,有
p(x1,..., xn; ) g[T (x1, , xn ), ] h(x1, , xn )
其中g( t,θ)是通过统计量T 的取值而依赖于样本的, 而h(x1,…,xn)不依赖于θ.
例4 设x1 , x2……, xn是取自总体N(μ,1) 的样本,
,
xn ;
)
(2
2
n
)
2
exp{
1
2
2
n
( xi )2}
i 1
(2
n
)2
2 2
}
exp{
1
2
2
(
n i 1
xi 2
2
n i 1
xi )}
数理统计的基本概念与抽样分布
第二章 数理统计的基本概念 与抽样分布
§2.1 §2.2 §2.3 §2.4 数理统计的基本概念 经验分布函数与直方图 常用的概率分布 抽样分布
2019/1/1
福州大学
1
第二章 数理统计的基本概念与抽样分布
§2.1
数理统计的基本概念
一、总体与样本 总体:研究的问题所涉及的对象的全体
1. 设X1,X2, …,Xn是取自总体X的样本,对应的 次序统计量为X(1) X(2) … X(n) ,观测值为x(1) x(2) … x(n)。 2.选取a(略小于x(1) )和b(略大于x(n)),则所有样 本观测值全部落入区间[a , b]内,将区间[a , b] 等分成m个小区间(ai , ai+1](i=1,2,…,m), a1=a, am+1=b,每个小区间的长度h=(b-a)/m称为组距。
n 1X 1
X
i 2
n
2 i
服从什么分布?
解: X i ~ N (0,4), i 2
n 1X 1
2 X i i 2 n
2 X i
n
4
n
X1 ~ (n 1), ~ N (0,1) 2
2
X1 2
2 X i i 2
~ t (n 1)
2019/1/1
4 福州大学
2019/1/1
福州大学
12
第二章 数理统计的基本概念与抽样分布
定理(格列汶科定理)
设总体X的分布函数是F(x) ,经验分布函数是 Fn(x),则有
P{lim sup Fn ( x) F ( x) 0} 1
n x
2019/1/1
数理统计第二章抽样分布2.7节充分统计量
I
n1
t
n
例2.7.4 设X=(X1,X2,…,Xn)是从正态总体 N ( ,1) 中抽取的样本,则 T ( X ) X1 不是充分统计量 证明:在 T ( X ) X 1 条件下,
X1,X2,…,Xn的条件密度为 f ( x1 , , xn , T ( x ) x1 ) f (x1 , x2 , , xn | T ( x ) x1 ) fT ( x1 ) n 1 1 2 f (x2 , , xn ) exp ( xi ) 2 2 i 2 与 有关. 因此T ( X ) X1不是充分统计量. 18
n
,n
9
由定理2.2.3的证明过程可知
Y X
2 i 1 i i 1
n
n
2 i
且Y1 ,Y2 , , Yn相互独立,其中
Y1 ~ N ( n ,1)
Yi ~ N (0,1), i 2, 3, , n
显然,X 对原样本X ( X 1 , X 2 , , X n )的充分性
等价于Y1对样本Y1 , Y2 , , Yn的充分性 因此只要证明给定Y1 =y1时(Y1 , Y2 , , Yn )
n1
n 1 n exp( t ),当yi 0, yi t , i 1, 2, , n 1 i 1 0, 其它
14
由于
T ( X ) X i ~ G ( n, )
i 1
n
因此 T ( X )
n
n n 1 t fT ( t ) t e I[ t 0] t e I[ t 0] ( n) ( n 1)!
n
n
i 1
n
充分统计量
下面我们给出几个例子, 根据定义5.5.1 下面我们给出几个例子, 根据定义5.5.1 来验证一个统计量是不是充分的. 来验证一个统计量是不是充分的. 例5.5.2 设总体为二点分布 b(1,θ ), X1,L, Xn 为样本,令 为样本 令 T = X1 +L+ X n , 则T是θ 的充分 是 统计量;若令 统计量 若令 S = X1 + X 2 ,S不是θ 的充分统计量 不是 的充分统计量.
例 5.5.3
设 x1 , x 2 , L , x n 是 来 自 N ( µ ,1)的 样 本 ,
令 T = x , 则 T 是 µ的 充 分 统 计 量 。
• 在一般场合直接由定义 在一般场合直接由定义5.5.1出发验证一个统计 出发验证一个统计 量是充分统计量比较困难. 奈曼(Neyman)给出 量是充分统计量比较困难 奈曼 给出 了一个简单的判别方法---因子分解定理 因子分解定理. 了一个简单的判别方法 因子分解定理 首先我们给出两类随机变量概率函数的定义. 随机变量X的概率函数 的概率函数f(x),在连续型场合 f(x) 在连续型场合, 随机变量 的概率函数 在连续型场合 表示X的概率密度函数 在离散型场合, 的概率密度函数;在离散型场合 表示 的概率密度函数 在离散型场合 f(x)表示 表示 X的分布列 的分布列. 的分布列
进一步, 进一步,我们指出这个统计量与 (x, s2 ) 是一一对应的,这说明在正态总体场合 是一一对应的, 常用的 ( x , s2 ) 是充分统计量。 是充分统计量。
§5.5 充分统计量
5.5.1 充分性的概念
为研究某种产品的合格品率, 例5.5.1 为研究某种产品的合格品率,我们对该产 品进行检查,从该产品中随机抽取10件进行观测, 10件进行观测 品进行检查,从该产品中随机抽取10件进行观测, 发现除第三、六件产品不合格外,其余8件产品都 发现除第三、六件产品不合格外,其余 件产品都 是合格品。这样的观测结果包含了两种信息: 是合格品。这样的观测结果包含了两种信息: (1) 10件产品有 件是合格品 件产品有8件是合格品 件产品有 件是合格品; (2) 2 件不合格品分别是第三和第六件。 件不合格品分别是第三和第六件。
数理统计CH2抽样分布ppt课件
2020/12/21
王玉顺:数理统计02_抽样分布
28
2.2.1 2 分布
(4) 2统计量的概率密度
2 统计量的概率密度是观测x和自由度n的函数
df n
x z12 z22 zn2
f
x;n
2(x;n)
2n
1
2n
2
xn21e2x,x
0
0, x0
2020/12/21
王玉顺:数理统计02_抽样分布
2020/12/21
王玉顺:数理统计02_抽样分布
8
2.1 总体和样本
(1)总体(Population)
➢由于随机变量X代表所有可能的观察值,即 它代表所研究问题的总体,故常称总体X ➢今后,所研究问题的总体常用随机变量X来
指代,即采用下面的陈述: 总体 X ~ B n , p 总体 X ~ P
率密度称作抽样分布。
2020/12/21
王玉顺:数理统计02_抽样分布
2
2 抽样分布
复习两个概念
样本空间(Sample Space)
随机试验的所有可能结果所组成的集 合称为样本空间,样本空间里的元素,即 随机试验的每一个结果,称为样本点。
(sample point)
2020/12/21
王玉顺:数理统计02_抽样分布
总体 X ~ N , 2
2020/12/21
王玉顺:数理统计02_抽样分布
9
2.1 总体和样本
(2)个体(Individual, Unit)
➢构成研究对象整体的一个分割单位(单位) ➢随机试验的一个可能结果(样本点) ➢随机变量X的一个可能观察值(变量值) ➢个体有数值型和非数值型两种
总体和个体是彼此对立的两个概念
充分统计量与完备统计量
三、完备统计量
为了介绍完备统计量的概念,首先需要引入完备分 布函数族的概念。
定义 1.5 设总体 X 的分布函数族为F( x; ), ,
若对任意一个满足
E g( X ) 0,对一切
的随机变量 g( X ),总有
(1.5)
P g( X ) 0 1,对一切 , 则称F( x; ), 为完备的分布函数族。
族——指数型分布族。它包含了一些常用分布,如泊松
分布、正态分布、指数分布、二项分布和 分布等,对这
类分布族,寻找参数的充分完备统计量是方便的。
定理 1.5 设总体 X 的分布密度 f ( x; )为指数型分布
族,即样本的联合分布密度具有如下形式:
n i 1
f
( x;
)
C (
) exp
m j1
=T(X1,X2,…,Xn) 也有一个抽样分布FT(t) 。
当我们期望用统计量T 代替原始样本并且不
损失任何有关 的信息时,也就是期望抽样分布 FT(t) 像 F(x) 一样概括了有关 的一切信息。
这即是说在统计量T 的取值为 t 的情况下
样本 x 的条件分布F(x|T=t) 已不含 的信息,
bj (
)Tj ( x1 ,
x2 ,,
xn
)
h( x1 , x2 ,, xn ),
2.9
其中 (1,2 ,,m ), 。如果中包含有一个m 维矩形,
而且 B (b ( ),b ( ),,b ( ))的值域包含一个m 维开集,则
1
2
m
T (T ( X , X ,, X ),T ( X , X ,, X ),T ( X , X ,, X ))
完备统计量的含义不如充分统计量那么明确,但由
数理统计第二章抽样分布2.8节完全统计量
( )=0,对一切 0
即 (t )=0,对一切t 0
因此T ( X )=X ( n )是完全(完备)统计量.
8
2.8.2 指数族中统计量的完全性
定理2.8.1:设样本X ( X1 , X 2 , , X n )的概率函数为
f ( x , ) C ( )exp{ iTi ( x )}h( x )
证明:显然T ( X )= X i ~ b( n, )
n k n k P (T ( X ) k ) (1 ) , k 0,1, , n k 设 (t )是任一实函数,满足
E (T ( X )) 0, 对一切0< 1
4
n
i 1
E (T ( X )) 0, 对一切0< 1
但是 (T ) 0,a.e. P 是不成立的即可.
13
令Yi X i ( 1/ 2), i 1, 2,
,n
则 Y1 , Y2 ,
, Yn i .i .d .~U (0,1)
与 无关
而
Z X ( n ) X (1) Y(n ) Y(1)
找常数a b, 使得
5
n k ( k ) 0, 0< k 0 k
n
上式左边是 的多项式,因此必然有
n ( k ) =0,k 0,1, , n k
即 (k ) 0, k 0,1,
n
,n
因此T ( X )= X i 是完全(完备)统计量.
i 1
6
例2.8.2设X=(X1,X2,…,Xn)是从均匀分布 U (0, ) 中抽取的样本,则 T ( X )=X ( n ) 是完全统计量.
数理统计第二章抽样分布2.3节次序统计量的分布
n 1
1 I[(0, )] ( x)
最大次序统计量X(n)的密度函数为
nx n1 f n ( x) n I[(0, )] ( x)
11
( X (1) , X (n ) )的联合密度函数为
n(n 1)( y x) n 2 , 0 x y , n f1,n ( x, y ) 0, 其它.
pq (2 q q )
n
n1
n1
n=1,2,…
22
n Fm ( x) P( X ( m) x) ( F ( x))i (1 F ( x)) ni i m i
n
5
因此
利用恒等式
n i n p m1 n i nm p (1 p ) i t (1 t ) dt 0 i m i i
极差R X ( n ) X (1)的密度函数为
n(n 1)( r )r n 2 , n f R (r ) 0, 0 r , 其它.
12
统 L1 , L2 例2 设系统 L 由两个相互独立的子系 联接而成, 连接的方式分别为 (i) 串联, (ii) 并联, 如图所示.
f n ( x) nF ( x)n1 f ( x)
7
二 次序(顺序)统计量的联合分布
(1)次序统计量( X (1) , X ( n) )的联合分布为
n n [ F ( y )] [ F ( y ) F ( x )] , 当x y, F1,n ( x, y ) n [ F ( y )] , 当x y.
βe ,x0 , fY ( y ) x0 0,
《数理统计》教案——抽样分布
lim
n
Cnk
pk (1
p)nk
k e
k!
注意到:
ke 1
k0 k !
该实数序列可构成一分布列
3. 泊松分布( The Poisson Distribution )
若随机变量 X 的概率分布列是
PX k k e , k 0,1, 2,,
k!
则称 X 服从参数为的泊松分布,记为 X ~ P()
盖洛普 预测 51% 59.5% 51% 64% 43% 62% 48.0% 47.0%
实际 得票 55.4% 57.8% 50.1% 61.3% 43.5% 61.8% 50.1% 50.8%
误差 -4.4% +1.7% +0.9% +2.7% -0.5% +0.2% -2.1% -3.8
2)康泰克为什么可以重来
1936年民主党人罗斯福任美国总统第一任满。共和党 人兰登与他竞争总统。《文学摘要》杂志根据有约二百 四十万人参加的民意测验,预测:
兰登的得票率:57% 罗斯福的得票率:43% 样本:240万
1936年盖洛普刚刚设立起他的调查机构,他根据一个约五 万人的样本,预测:
兰登得票率:44%
罗斯福得票率:56%
《文学摘要》杂志选取调查对象的方法有误。尽管他的调 查数据非常多,但有偏差。他选取的样本不能代表总体。
《文学摘要》杂志的调查对象选择了共和党人兰登,而全 体选民却选择了民主党人罗斯福。
尽管盖洛普的样本只有五万人,但他的样本能比较好地代表 总体。盖洛普用的是“定额抽样法” 。
所谓定额抽样法可简单地用下面的例子加以说明。若某地区 有40万选民,其中黑人与白人选民分别有15%与85%。若计 划在该地区调查20个选民,则定额抽样法就要求调查员访问 的20个选民中有3个黑人选民与17个白人选民。调查对象的性 别、收入高低、年龄等有类似的要求。
数理统计CH抽样分布00002
10
2.3.1 Z统计量分位数
(1)Z统计量分位数zα
PZz 1z
zα蕴含 统计量观察值zα 事件Z>zα 概率α
事件Z≤zα 分布函数F(zα)
五方面的信息
2019/9/19
王玉顺:数理统计02_抽样分布
11
2.3.1 Z统计量分位数
(3)分位数zα的对称性 z1 z 1 z 1 1
(a)
n1S2
2
~2n1
(b) X 与S2独立
其中:X1 ni n1Xi
S21 n n1i1
2
XiX
定理二的证明详见教材P172的附录
2019/9/19
王玉顺:数理统计02_抽样分布
34
2.4 抽样分布定理
(3)正态总体样本方差及分布
2019/9/19
2019/9/19
王玉顺:数理统计02_抽样分布
15
2.3.2 χ2统计量分位数
(1)χ2统计量分位数χα2(n) P2 2 n 1 F2 n
χα2(n)蕴含 观察值χα2(n) 事件χ2>χα2(n) 概率α
事件χ2≤χα2(n) 分布函数F(χα2(n))
n1S2 1 n
2
2
2 i1 Xi X
王玉顺:数理统计02_抽样分布
14
2.3.2 χ2统计量分位数
(1)χ2统计量分位数χα2(n)
设χ2~χ2(n),并χ2统计量分位数记作χα2(n) 则分位数χα2(n)、事件χ2>χα2(n)、尾概率α、 事件χ2≤χα2(n)、分布函数F{χα2(n)}五者满足下 面的关系:
P2 2n 1F2n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n1
n 1 n exp( t ),当yi 0, yi t , i 1, 2, , n 1 i 1 0, 其它
14
由于
T ( X ) X i ~ G ( n, )
i 1
n
因此 T ( X )
n
n n 1 t fT ( t ) t e I[ t 0] t e I[ t 0] ( n) ( n 1)!
证明:样本X ( X1 , X 2 , , X n )的联合密度为
f ( x , )= I[0 x( n ) ] g(t ( x ), )h( x )
n
其中h(x)=1
根据因子分解定理,知 T ( X ) X ( n ) 为充分统计量.
25
例2.7.8 设X=(X1,…,Xn)是从均匀分布 U ( 1/ 2, 1/ 2), 其中 , 中抽取的样本,利用因子分解定理验证 X 不是充分统计量.
因此T ( X ) X 是充分统计量.
11
n 1 1 n/2 2 2 f ( y1 , y2 , , yn )=(2 ) exp yi ( y1 n ) 2 2 i2 1 Y1的边缘密度为 1 2
例2.7.3设X=(X1,X2,…,Xn)是从指数分布 Exp( ) 中抽取的样本,则
P ( X 1 x1 , X 2 x2 , , X n xn , T t0 ) P (T ( x ) t0 ) P ( X 1 x1 , X 2 x2 , , X n xn ) P (T ( x ) t0 ) t0 n t0 1 (1 ) n n t0 n t0 (1 ) t0 t 0
g(t ( x ), )h( x )
其中h(x)=1
22
根据因子分解定理,知
T ( X ) ( X i , X )
为充分统计量. 由于 (
n n i 1 i 1 i 1 2 i i 1 2 i
n
n
Xi , X )
与 (X , S2)
为一一对应的变换. 根据推论2.7.1可知 ( X , S 2 ) 也为充分统计量.
3
2.7.1 充分统计量的定义 定义2.7.1 设样本分布族为F ( x), , 是参数空间 设T=T(X)为一统计量,若在T已知的条件下, 样本X的条件分布与参数 无关,则称T(X) 为充分统计量. 充分统计量必存在! 顺序(次序)统计量是充分统计量.
4
例2.7.1设X=(X1,X2,…,Xn)是从0-1分布中抽取 的样本,则
作变换
Y1 X 1 Yn 1 X n 1 Yn X 1 X 2
Xn t
变换的雅可比行列式为|J|=1 这是一个一一对应的变换.
T ( X ) X i 对原样本 X=(X1,X2,…,Xn)
i 1 n
的充分性等价于
Yn
对 (Y1,Y2,…,Yn)的充分性
因此T ( X ) X i 是充分统计量.
i 1 n
7
例2.7.2设X=(X1,X2,…,Xn)是从正态总体N ( ,1) 中抽取的样本,则
1 n T ( X ) X i X 为充分统计量 n i 1
证明:记T=T(X),按照定义只要证明给定T 时X的概率分布与参数 无关.但是计算复 杂.采取如下正交变换方法进行.
23
例2.7.6设X=(X1, X2,…,Xn)是从总体 b(1, ) 中抽取的样本,则
T ( X ) X i 为充分统计量
证明:样本X ( X1 , X 2 , , X n )的联合分布列为
f ( x, )=P ( X1 x1 , ,X n xn )
= i1 (1 ) xi
(Y1 , Y2 , , Yn )'=A(X1 , X 2 , , X n )'
其中A是正交阵,为
8
1 1n n a21 a22 A a n1 an 2
a2 n ann
1 n
因此
1 Y Xi nX 1 n i =1 n Y a X , j 2,3, j jk k k 1
n
,n
9
由定理2.2.3的证明过程可知
Y X
2 i 1 i i 1
n
n
2 i
且Y1 ,Y2 , , Yn相互独立,其中
Y1 ~ N ( n ,1)
Yi ~ N (0,1), i 2, 3, , n
显然,X 对原样本X ( X 1 , X 2 , , X n )的充分性
等价于Y1对样本Y1 , Y2 , , Yn的充分性 因此只要证明给定Y1 =y1时(Y1 , Y2 , , Yn )
的条件密度与 无关即可.
10
Y1 , Y2 ,
, Yn的联合密度为
exp ( y1 n ) 2 2 给定Y1 =y1时(Y1 , Y2 , , Yn )的条件密度 f ( y1 , y2 , , yn ) f ( y1 , y2 , , yn | y1 )= fY1 ( y1 ) n 1 ( n 1)/ 2 2 =(2 ) exp yi 与 无关. 2 i 2 fY1 ( y1 )=
I
n1
t
n
例2.7.4 设X=(X1,X2,…,Xn)是从正态总体 N ( ,1) 中抽取的样本,则 T ( X ) X1 不是充分统计量 证明:在 T ( X ) X 1 条件下,
X1,X2,…,Xn的条件密度为 f ( x1 , , xn , T ( x ) x1 ) f (x1 , x2 , , xn | T ( x ) x1 ) fT ( x1 ) n 1 1 2 f (x2 , , xn ) exp ( xi ) 2 2 i 2 与 有关. 因此T ( X ) X1不是充分统计量. 18
T ( X ) X i 为充分统计量
证明:X1的概率密度函数为
i 1
n
e x , x 0 f ( x , ) x0 0,
则X=(X1,X2,…,Xn)的联合密度为
f ( x, ) ne
xi
i 1
n
I[ xi 0,i 1,2,
,n]
12
21
例2.7.5设X=(X1,…,Xn)是从正态总体N ( , 2 ) 中抽取的样本,令 ( , 2 ) 则
T ( X ) ( X i , X ) 为充分统计量
i 1 i 1 2 i
nቤተ መጻሕፍቲ ባይዱ
n
证明:样本X ( X1 , X 2 , , X n )的联合密度为
n 1 n/ 2 n 2 f ( x , )=(2 ) exp 2 ( xi ) 2 i 1 n n 1 n/ 2 n 2 2 =(2 ) exp 2 xi 2 xi n i 1 2 i 1
26
证明:记 X (1) min{ X 1 , , X n },X (n ) max{X 1 , , X n },
( n 1)! e I =
n t yi 0, yi t ,i 1,2, ,n 1 i 1 n n 1 t [ t 0]
n1
t e I
( n 1)! I I
n1
=
yi 0, yi t ,i 1,2, ,n 1 i 1 n 1 [ t 0]
2.7.2 充分性的判别准则——因子分解定理 因子分解定理首先是由R.A.Fisher在20世纪 20年代提出来,最一般形式和严格数学证明 是由Halmos和Savage在1949年给出.
19
定理2.7.1 (因子分解定理):
设样本X ( X1 ,X 2, , X n )的概率函数为f ( x, ) 依赖于参数,T T ( X )是一个统计量,则
n
n
i 1
n
xi
i 1
n
g(t ( x ), )h( x )
其中h(x)=1
n
根据因子分解定理,知 T ( X ) X i i 1 为充分统计量.
24
例2.7.7设X=(X1,…,Xn)是从均匀分布 U (0, ) 中抽取的样本,则
T ( X ) X ( n ) max{X 1 , , X n } 为充分统计量
给定 T t (Y1,Y2,…,Yn)的条件密度为
i 1 n 1 t
X 的密度函数为
i
n
f ( y1 , , yn1 , t ) f ( y1 , y2 , , yn | T t )= fT ( t )
15
f ( y1 , , yn1 , t ) f ( y1 , y2 , , yn | T t )= fT ( t )
第二章 抽样分布 及若干预备知识
2.7 充分统计量
1
2.7 充分统计量
统计推断的目的:对总体的分布(参数)进行推断. 样本带有总体分布(参数)的信息.
统计量集中了样本中关于总体分布(参数)的某部分 信息. 集中了样本中关于总体分布(参数)的全部信息的 统计量,即不损失信息的统计量——充分统计量. 问题:如何定义一个统计量是充分统计量?
T ( X ) X i 为充分统计量
证明:记T=T(X),按照定义只要证明下列条 件概率与参数 无关.
i 1
n
当 xi t0时,有
i =1
n
P( X1 x1 , X 2 x2 , , X n xn | T t0 )