数理统计第二章抽样分布2.7节充分统计量

合集下载

概率论与数理统计教案统计量和抽样分布

概率论与数理统计教案统计量和抽样分布

概率论与数理统计教案-统计量和抽样分布一、教学目标1. 理解统计量的概念,掌握常见统计量的计算方法。

2. 了解抽样分布的定义,掌握正态分布、t分布、卡方分布等常见抽样分布的特点及应用。

3. 学会使用抽样分布进行假设检验和置信区间的估计。

二、教学内容1. 统计量的概念及计算方法统计量的定义样本均值、样本方差、样本标准差等常见统计量2. 抽样分布的定义及特点抽样分布的定义正态分布、t分布、卡方分布等常见抽样分布的特点3. 抽样分布的应用假设检验置信区间的估计三、教学方法1. 讲授法:讲解统计量的概念、计算方法,抽样分布的定义及特点。

2. 案例分析法:通过具体案例,让学生学会使用抽样分布进行假设检验和置信区间的估计。

3. 互动教学法:引导学生参与课堂讨论,提问、解答问题,提高学生的积极性和主动性。

四、教学步骤1. 引入统计量的概念,讲解样本均值、样本方差、样本标准差等常见统计量的计算方法。

2. 讲解抽样分布的定义,介绍正态分布、t分布、卡方分布等常见抽样分布的特点及应用。

3. 通过具体案例,让学生学会使用抽样分布进行假设检验和置信区间的估计。

五、课后作业1. 复习本节课的内容,整理笔记。

2. 完成课后习题,加深对统计量和抽样分布的理解。

3. 选择一个感兴趣的话题,运用抽样分布进行实际问题的分析。

六、教学评估1. 课堂提问:通过提问了解学生对统计量和抽样分布的理解程度。

2. 课后习题:检查学生对课堂内容的掌握情况。

3. 实际案例分析:评估学生运用抽样分布解决实际问题的能力。

七、拓展与延伸1. 引导学生探讨抽样分布在其他领域的应用,如经济学、生物学等。

2. 介绍与抽样分布相关的高级主题,如非参数统计、贝叶斯统计等。

3. 鼓励学生参加相关竞赛、研究项目,提高实践能力。

八、教学资源1. 教材:概率论与数理统计相关教材。

2. 课件:PPT课件,辅助学生理解统计量和抽样分布的概念及应用。

3. 案例资料:提供具体案例,方便学生学会使用抽样分布进行假设检验和置信区间的估计。

数理统计学:统计量与抽样分布

数理统计学:统计量与抽样分布
主要内容
1.1 总体和样本 1.2 统计量与估计量 1.3 抽样分布 1.4 次序统计量 1.5 充分统计量 1.6 常用的概率分布族
数理统计学 是探讨随机现象统计规律性的一门学科, 它以概率论为理论基础,研究如何以有效的方式收集、 整理和分析受到随机因素影响的数据,从而对所研究对 象的某些特征做出判断。
1.1.2 样本
(2) 抽样, 即从总体抽取若干个个体进行检查或观察,用所 获得的数据对总体进行统计推断。 由于抽样费用低,时间 短,实际使用频繁。本书将在简单随机抽样的基础上研究各 种合理的统计推断方法,这是统计学的基本内容。应该说, 没有抽样就没有统计学
1.1.2 样本
• 从总体中抽出的部分(多数场合是小部分)个体组成的集合 称为样本。
(2)
(n 1)s2
2
~χ2(n-1);
(3) x与s2相互独立。
1.3.2 样本方差的抽样分布
例1.3.3
分别从正态总体N(μ1,σ2)和N(μ2,σ2)中抽取容
量为n1和n2的两个独立样本,其样本方差分别

s2 1

s2 2

(1)证明:对α∈(0,1),
s s s 2 2 (1) 2
Fn(x)依概率收敛于F(x)
1.2.3 样本的经验分布函数及样本矩
定理1.2.1(格里汶科定理)
对任给的自然数n,设x1,x2,…,xn是取自总体分布函数F(x) 的一组样本观察值,Fn(x)为其经验分布函数,记
则有
Dn sup Fn x F x
x
P
lim
n
Dn
0
1
1.2.3 样本的经验分布函数及样本矩
0
Fn x k / n

充分统计量 ppt课件

充分统计量  ppt课件
h(x1,, xn )g(t, )
充分性 P(T t , )
P( X , , X ; {( x1,,xn ):T ( x1,,xn )t }
1
n
)

g(t,
{( x1,,xn ):T ( x1,,xpnpt)课件t }
)h( x1,, xn )
15
P( X1 x1,, Xn xn | T t)

n 2
x

n 2
2 2
},因而,T
(
x1
,
x2
,
n
, xn ) ( x, xi2 )是充分统计向量。
i 1
ppt课件
26
进一步,我们指出这个统计量与 (x, s2 )
是一个样本,T ( X1, X2 是:样本的联合分布
密度可以分解为
ppt课件
12
n
L( ) f ( xi , ) h( x1, x2 , , xn )g(T ( x1, x2 , , xn ), ) i 1
其中h是x1, x2 , , xn的非负函数且与无关,g仅通
T X1 Xn
则在给定 T 的取值后,对任意的一组
n
x1,, xn ( xi t) i 1
P( X1 x1,, X n xn | T t)
n1
P( X 1 x1 ,, X n1 xn1, X n t xi )

i 1 n
P( X i t)
(
1
{ 1
e 2
n i 1
(
xi
)2
}
2π )n

(
1 2π )n
exp{

充分统计量与完备统计量

充分统计量与完备统计量

完备统计量的含义不如充分统计量那么明确,但由
定义可见它有如下特征:
P g1 (T ) g2 (T ) 1, E g1 (T ) E g2 (T ), 。
(1.7)
对于一般的统计T T ( X 1 , X 2 , , X n ) ,总有
对统计量 T,如果已知它的值以后,样本的条件分布 与 无关,就意味着样本的剩余部分中已不再包含关于 的信息, 也就是在 T 中已包含有关 的全部信息。 因此, 对 的统计推断只需要从 T 出发即可, 不再需要样本数据。
二、 因子分解定理
根据充分统计量的含义,在对总体未知参数进 行推断时,应在可能的情况下尽量找出关于未知参 数的充分统计量。 但从定义出发来判别一个统计量是否是充分统 计量是很麻烦的。 为此,需要一个简单的判别准则。下面给出一 个定理——因子分解定理,运用这个定理,判别甚 至寻找一个充分统计量有时会很方便。
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1 n n xi n xi n p i 1 (1 p ) i 1 , 如 果 xi k, k k nk C n p (1 p ) i 1 n 0 , 如 果 xi k, i 1 n 1 C k , 如果 xi k, i 1 n n 0, 如果 xi k, i 1
其中 h( x1 , x2 ,, xn ) 1 ,
而 g (T ( x1 , x2 , , xn ); ) 显 然 是 T ( x , xi2 ) 和 ( , 2 ) 的函数。 故由因子分解定理知 T ( X , x i2 ) 是 ( , 2 )

充分统计量

充分统计量
充分统计量是统计学中的一个重要概念,它包含了原样本中关于某一特定问题的全部有用信息。对于未知参数的估计问题,充分统计量能够保留原始样本中关于这些参数的所有பைடு நூலகம்息。经典统计中,如果给定某个统计量的条件下,样本的分布与未知参数无关,那么这个统计量就被称为充分统计量。例如,样本均值就是总体数学期望的充分统计量。充分统计量的存在能够大大简化统计问题,因为它们具有压缩数据的功能,同时又能凸显出我们需要的信息。判断一个统计量是否是充分统计量,通常使用因子分解定理这一充要条件。此外,在贝叶斯统计中,充分统计量也扮演着重要角色,它们能够确保使用样本分布计算得到的后验分布与使用充分统计量计算得到的后验分布是一致的。这进一步简化了后验分布的计算过程,因为充分统计量通常具有更低的维度。总的来说,充分统计量是统计学中一个非常有用的工具,它们能够帮助我们更有效地从数据中提取信息,进而做出更准确的推断。

充分统计量ppt课件

充分统计量ppt课件

ln xi
都是θ的充分统
常见分布的充分统计量
分布
两点分布b(1, p) Poisson分布P(λ) 几何分布Ge(θ) 均匀分布U(0, θ) 均匀分布U(θ1, θ2) 均匀分布U(θ, 2θ) 正态分布N(μ,σ 2) 指数分布Exp(λ) 伽玛分布Ga(α ,λ)
参数 p
λ θ θ (θ1,θ2) θ (μ,σ 2) λ (α ,λ)

i 1
(2
2

)
n
2
exp{
n 2 2 2
}exp{
1
2
2
(t2

2t1)}
h(x1, , xn ) 1 即可.
注:若θ是参数向量,T是随机向量,且满足因子分 解定理的条件,则T是θ的充分统计量. 但不能由T 关于θ是充分的, 推出T 的第i 个分量关于θ的第i 个 分量也是充分的.
和任一组观测值x1, , xn ,有
p(x1,..., xn; ) g[T (x1, , xn ), ] h(x1, , xn )
其中g( t,θ)是通过统计量T 的取值而依赖于样本的, 而h(x1,…,xn)不依赖于θ.
例4 设x1 , x2……, xn是取自总体N(μ,1) 的样本,
,
xn ;
)

(2
2
n
)
2
exp{
1
2
2
n
( xi )2}
i 1

(2
n
)2

2 2
}
exp{
1
2
2
(
n i 1
xi 2

2
n i 1
xi )}

数理统计的基本概念与抽样分布

数理统计的基本概念与抽样分布
第二章 数理统计的基本概念与抽样分布
第二章 数理统计的基本概念 与抽样分布
§2.1 §2.2 §2.3 §2.4 数理统计的基本概念 经验分布函数与直方图 常用的概率分布 抽样分布
2019/1/1
福州大学
1
第二章 数理统计的基本概念与抽样分布
§2.1
数理统计的基本概念
一、总体与样本 总体:研究的问题所涉及的对象的全体
1. 设X1,X2, …,Xn是取自总体X的样本,对应的 次序统计量为X(1) X(2) … X(n) ,观测值为x(1) x(2) … x(n)。 2.选取a(略小于x(1) )和b(略大于x(n)),则所有样 本观测值全部落入区间[a , b]内,将区间[a , b] 等分成m个小区间(ai , ai+1](i=1,2,…,m), a1=a, am+1=b,每个小区间的长度h=(b-a)/m称为组距。
n 1X 1
X
i 2
n
2 i
服从什么分布?
解: X i ~ N (0,4), i 2
n 1X 1
2 X i i 2 n
2 X i
n
4
n
X1 ~ (n 1), ~ N (0,1) 2
2

X1 2
2 X i i 2
~ t (n 1)
2019/1/1
4 福州大学
2019/1/1
福州大学
12
第二章 数理统计的基本概念与抽样分布
定理(格列汶科定理)
设总体X的分布函数是F(x) ,经验分布函数是 Fn(x),则有
P{lim sup Fn ( x) F ( x) 0} 1
n x
2019/1/1

数理统计第二章抽样分布2.7节充分统计量

数理统计第二章抽样分布2.7节充分统计量

I
n1
t
n
例2.7.4 设X=(X1,X2,…,Xn)是从正态总体 N ( ,1) 中抽取的样本,则 T ( X ) X1 不是充分统计量 证明:在 T ( X ) X 1 条件下,
X1,X2,…,Xn的条件密度为 f ( x1 , , xn , T ( x ) x1 ) f (x1 , x2 , , xn | T ( x ) x1 ) fT ( x1 ) n 1 1 2 f (x2 , , xn ) exp ( xi ) 2 2 i 2 与 有关. 因此T ( X ) X1不是充分统计量. 18
n
,n
9
由定理2.2.3的证明过程可知
Y X
2 i 1 i i 1
n
n
2 i
且Y1 ,Y2 , , Yn相互独立,其中
Y1 ~ N ( n ,1)
Yi ~ N (0,1), i 2, 3, , n
显然,X 对原样本X ( X 1 , X 2 , , X n )的充分性
等价于Y1对样本Y1 , Y2 , , Yn的充分性 因此只要证明给定Y1 =y1时(Y1 , Y2 , , Yn )

n1
n 1 n exp( t ),当yi 0, yi t , i 1, 2, , n 1 i 1 0, 其它
14
由于
T ( X ) X i ~ G ( n, )
i 1
n
因此 T ( X )
n
n n 1 t fT ( t ) t e I[ t 0] t e I[ t 0] ( n) ( n 1)!
n
n
i 1
n

充分统计量

充分统计量

下面我们给出几个例子, 根据定义5.5.1 下面我们给出几个例子, 根据定义5.5.1 来验证一个统计量是不是充分的. 来验证一个统计量是不是充分的. 例5.5.2 设总体为二点分布 b(1,θ ), X1,L, Xn 为样本,令 为样本 令 T = X1 +L+ X n , 则T是θ 的充分 是 统计量;若令 统计量 若令 S = X1 + X 2 ,S不是θ 的充分统计量 不是 的充分统计量.
例 5.5.3
设 x1 , x 2 , L , x n 是 来 自 N ( µ ,1)的 样 本 ,
令 T = x , 则 T 是 µ的 充 分 统 计 量 。
• 在一般场合直接由定义 在一般场合直接由定义5.5.1出发验证一个统计 出发验证一个统计 量是充分统计量比较困难. 奈曼(Neyman)给出 量是充分统计量比较困难 奈曼 给出 了一个简单的判别方法---因子分解定理 因子分解定理. 了一个简单的判别方法 因子分解定理 首先我们给出两类随机变量概率函数的定义. 随机变量X的概率函数 的概率函数f(x),在连续型场合 f(x) 在连续型场合, 随机变量 的概率函数 在连续型场合 表示X的概率密度函数 在离散型场合, 的概率密度函数;在离散型场合 表示 的概率密度函数 在离散型场合 f(x)表示 表示 X的分布列 的分布列. 的分布列
进一步, 进一步,我们指出这个统计量与 (x, s2 ) 是一一对应的,这说明在正态总体场合 是一一对应的, 常用的 ( x , s2 ) 是充分统计量。 是充分统计量。
§5.5 充分统计量
5.5.1 充分性的概念
为研究某种产品的合格品率, 例5.5.1 为研究某种产品的合格品率,我们对该产 品进行检查,从该产品中随机抽取10件进行观测, 10件进行观测 品进行检查,从该产品中随机抽取10件进行观测, 发现除第三、六件产品不合格外,其余8件产品都 发现除第三、六件产品不合格外,其余 件产品都 是合格品。这样的观测结果包含了两种信息: 是合格品。这样的观测结果包含了两种信息: (1) 10件产品有 件是合格品 件产品有8件是合格品 件产品有 件是合格品; (2) 2 件不合格品分别是第三和第六件。 件不合格品分别是第三和第六件。

数理统计CH2抽样分布ppt课件

数理统计CH2抽样分布ppt课件

2020/12/21
王玉顺:数理统计02_抽样分布
28
2.2.1 2 分布
(4) 2统计量的概率密度
2 统计量的概率密度是观测x和自由度n的函数
df n
x z12 z22 zn2
f
x;n
2(x;n)
2n
1
2n
2
xn21e2x,x
0
0, x0
2020/12/21
王玉顺:数理统计02_抽样分布
2020/12/21
王玉顺:数理统计02_抽样分布
8
2.1 总体和样本
(1)总体(Population)
➢由于随机变量X代表所有可能的观察值,即 它代表所研究问题的总体,故常称总体X ➢今后,所研究问题的总体常用随机变量X来
指代,即采用下面的陈述: 总体 X ~ B n , p 总体 X ~ P
率密度称作抽样分布。
2020/12/21
王玉顺:数理统计02_抽样分布
2
2 抽样分布
复习两个概念
样本空间(Sample Space)
随机试验的所有可能结果所组成的集 合称为样本空间,样本空间里的元素,即 随机试验的每一个结果,称为样本点。
(sample point)
2020/12/21
王玉顺:数理统计02_抽样分布
总体 X ~ N , 2
2020/12/21
王玉顺:数理统计02_抽样分布
9
2.1 总体和样本
(2)个体(Individual, Unit)
➢构成研究对象整体的一个分割单位(单位) ➢随机试验的一个可能结果(样本点) ➢随机变量X的一个可能观察值(变量值) ➢个体有数值型和非数值型两种
总体和个体是彼此对立的两个概念

充分统计量与完备统计量

充分统计量与完备统计量

三、完备统计量
为了介绍完备统计量的概念,首先需要引入完备分 布函数族的概念。
定义 1.5 设总体 X 的分布函数族为F( x; ), ,
若对任意一个满足
E g( X ) 0,对一切
的随机变量 g( X ),总有
(1.5)
P g( X ) 0 1,对一切 , 则称F( x; ), 为完备的分布函数族。
族——指数型分布族。它包含了一些常用分布,如泊松
分布、正态分布、指数分布、二项分布和 分布等,对这
类分布族,寻找参数的充分完备统计量是方便的。
定理 1.5 设总体 X 的分布密度 f ( x; )为指数型分布
族,即样本的联合分布密度具有如下形式:
n i 1
f
( x;
)
C (
) exp
m j1
=T(X1,X2,…,Xn) 也有一个抽样分布FT(t) 。
当我们期望用统计量T 代替原始样本并且不
损失任何有关 的信息时,也就是期望抽样分布 FT(t) 像 F(x) 一样概括了有关 的一切信息。
这即是说在统计量T 的取值为 t 的情况下
样本 x 的条件分布F(x|T=t) 已不含 的信息,
bj (
)Tj ( x1 ,
x2 ,,
xn
)
h( x1 , x2 ,, xn ),
2.9
其中 (1,2 ,,m ), 。如果中包含有一个m 维矩形,
而且 B (b ( ),b ( ),,b ( ))的值域包含一个m 维开集,则
1
2
m
T (T ( X , X ,, X ),T ( X , X ,, X ),T ( X , X ,, X ))
完备统计量的含义不如充分统计量那么明确,但由

数理统计第二章抽样分布2.8节完全统计量

数理统计第二章抽样分布2.8节完全统计量
n 1
( )=0,对一切 0
即 (t )=0,对一切t 0
因此T ( X )=X ( n )是完全(完备)统计量.
8
2.8.2 指数族中统计量的完全性
定理2.8.1:设样本X ( X1 , X 2 , , X n )的概率函数为
f ( x , ) C ( )exp{ iTi ( x )}h( x )
证明:显然T ( X )= X i ~ b( n, )
n k n k P (T ( X ) k ) (1 ) , k 0,1, , n k 设 (t )是任一实函数,满足
E (T ( X )) 0, 对一切0< 1
4
n
i 1
E (T ( X )) 0, 对一切0< 1
但是 (T ) 0,a.e. P 是不成立的即可.
13
令Yi X i ( 1/ 2), i 1, 2,
,n
则 Y1 , Y2 ,
, Yn i .i .d .~U (0,1)
与 无关

Z X ( n ) X (1) Y(n ) Y(1)
找常数a b, 使得
5
n k ( k ) 0, 0< k 0 k
n
上式左边是 的多项式,因此必然有
n ( k ) =0,k 0,1, , n k
即 (k ) 0, k 0,1,
n
,n
因此T ( X )= X i 是完全(完备)统计量.
i 1
6
例2.8.2设X=(X1,X2,…,Xn)是从均匀分布 U (0, ) 中抽取的样本,则 T ( X )=X ( n ) 是完全统计量.

数理统计第二章抽样分布2.3节次序统计量的分布

数理统计第二章抽样分布2.3节次序统计量的分布
x f1 ( x) n 1
n 1
1 I[(0, )] ( x)
最大次序统计量X(n)的密度函数为
nx n1 f n ( x) n I[(0, )] ( x)
11
( X (1) , X (n ) )的联合密度函数为
n(n 1)( y x) n 2 , 0 x y , n f1,n ( x, y ) 0, 其它.
pq (2 q q )
n
n1
n1
n=1,2,…
22
n Fm ( x) P( X ( m) x) ( F ( x))i (1 F ( x)) ni i m i
n
5
因此
利用恒等式
n i n p m1 n i nm p (1 p ) i t (1 t ) dt 0 i m i i
极差R X ( n ) X (1)的密度函数为
n(n 1)( r )r n 2 , n f R (r ) 0, 0 r , 其它.
12
统 L1 , L2 例2 设系统 L 由两个相互独立的子系 联接而成, 连接的方式分别为 (i) 串联, (ii) 并联, 如图所示.
f n ( x) nF ( x)n1 f ( x)
7
二 次序(顺序)统计量的联合分布
(1)次序统计量( X (1) , X ( n) )的联合分布为
n n [ F ( y )] [ F ( y ) F ( x )] , 当x y, F1,n ( x, y ) n [ F ( y )] , 当x y.
βe ,x0 , fY ( y ) x0 0,

《数理统计》教案——抽样分布

《数理统计》教案——抽样分布

lim
n
Cnk
pk (1
p)nk
k e
k!
注意到:
ke 1
k0 k !
该实数序列可构成一分布列
3. 泊松分布( The Poisson Distribution )
若随机变量 X 的概率分布列是
PX k k e , k 0,1, 2,,
k!
则称 X 服从参数为的泊松分布,记为 X ~ P()
盖洛普 预测 51% 59.5% 51% 64% 43% 62% 48.0% 47.0%
实际 得票 55.4% 57.8% 50.1% 61.3% 43.5% 61.8% 50.1% 50.8%
误差 -4.4% +1.7% +0.9% +2.7% -0.5% +0.2% -2.1% -3.8
2)康泰克为什么可以重来
1936年民主党人罗斯福任美国总统第一任满。共和党 人兰登与他竞争总统。《文学摘要》杂志根据有约二百 四十万人参加的民意测验,预测:
兰登的得票率:57% 罗斯福的得票率:43% 样本:240万
1936年盖洛普刚刚设立起他的调查机构,他根据一个约五 万人的样本,预测:
兰登得票率:44%
罗斯福得票率:56%
《文学摘要》杂志选取调查对象的方法有误。尽管他的调 查数据非常多,但有偏差。他选取的样本不能代表总体。
《文学摘要》杂志的调查对象选择了共和党人兰登,而全 体选民却选择了民主党人罗斯福。
尽管盖洛普的样本只有五万人,但他的样本能比较好地代表 总体。盖洛普用的是“定额抽样法” 。
所谓定额抽样法可简单地用下面的例子加以说明。若某地区 有40万选民,其中黑人与白人选民分别有15%与85%。若计 划在该地区调查20个选民,则定额抽样法就要求调查员访问 的20个选民中有3个黑人选民与17个白人选民。调查对象的性 别、收入高低、年龄等有类似的要求。

数理统计CH抽样分布00002

数理统计CH抽样分布00002

10
2.3.1 Z统计量分位数
(1)Z统计量分位数zα
PZz 1z
zα蕴含 统计量观察值zα 事件Z>zα 概率α
事件Z≤zα 分布函数F(zα)
五方面的信息
2019/9/19
王玉顺:数理统计02_抽样分布
11
2.3.1 Z统计量分位数
(3)分位数zα的对称性 z1 z 1 z 1 1
(a)
n1S2
2
~2n1
(b) X 与S2独立
其中:X1 ni n1Xi
S21 n n1i1
2
XiX
定理二的证明详见教材P172的附录
2019/9/19
王玉顺:数理统计02_抽样分布
34
2.4 抽样分布定理
(3)正态总体样本方差及分布
2019/9/19
2019/9/19
王玉顺:数理统计02_抽样分布
15
2.3.2 χ2统计量分位数
(1)χ2统计量分位数χα2(n) P2 2 n 1 F2 n
χα2(n)蕴含 观察值χα2(n) 事件χ2>χα2(n) 概率α
事件χ2≤χα2(n) 分布函数F(χα2(n))
n1S2 1 n
2
2
2 i1 Xi X
王玉顺:数理统计02_抽样分布
14
2.3.2 χ2统计量分位数
(1)χ2统计量分位数χα2(n)
设χ2~χ2(n),并χ2统计量分位数记作χα2(n) 则分位数χα2(n)、事件χ2>χα2(n)、尾概率α、 事件χ2≤χα2(n)、分布函数F{χα2(n)}五者满足下 面的关系:
P2 2n 1F2n
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


n1
n 1 n exp( t ),当yi 0, yi t , i 1, 2, , n 1 i 1 0, 其它
14
由于
T ( X ) X i ~ G ( n, )
i 1
n
因此 T ( X )
n
n n 1 t fT ( t ) t e I[ t 0] t e I[ t 0] ( n) ( n 1)!
证明:样本X ( X1 , X 2 , , X n )的联合密度为
f ( x , )= I[0 x( n ) ] g(t ( x ), )h( x )
n
其中h(x)=1
根据因子分解定理,知 T ( X ) X ( n ) 为充分统计量.
25
例2.7.8 设X=(X1,…,Xn)是从均匀分布 U ( 1/ 2, 1/ 2), 其中 , 中抽取的样本,利用因子分解定理验证 X 不是充分统计量.
因此T ( X ) X 是充分统计量.
11
n 1 1 n/2 2 2 f ( y1 , y2 , , yn )=(2 ) exp yi ( y1 n ) 2 2 i2 1 Y1的边缘密度为 1 2
例2.7.3设X=(X1,X2,…,Xn)是从指数分布 Exp( ) 中抽取的样本,则
P ( X 1 x1 , X 2 x2 , , X n xn , T t0 ) P (T ( x ) t0 ) P ( X 1 x1 , X 2 x2 , , X n xn ) P (T ( x ) t0 ) t0 n t0 1 (1 ) n n t0 n t0 (1 ) t0 t 0
g(t ( x ), )h( x )
其中h(x)=1
22
根据因子分解定理,知
T ( X ) ( X i , X )
为充分统计量. 由于 (
n n i 1 i 1 i 1 2 i i 1 2 i
n
n
Xi , X )
与 (X , S2)
为一一对应的变换. 根据推论2.7.1可知 ( X , S 2 ) 也为充分统计量.
3
2.7.1 充分统计量的定义 定义2.7.1 设样本分布族为F ( x), , 是参数空间 设T=T(X)为一统计量,若在T已知的条件下, 样本X的条件分布与参数 无关,则称T(X) 为充分统计量. 充分统计量必存在! 顺序(次序)统计量是充分统计量.
4
例2.7.1设X=(X1,X2,…,Xn)是从0-1分布中抽取 的样本,则
作变换
Y1 X 1 Yn 1 X n 1 Yn X 1 X 2
Xn t
变换的雅可比行列式为|J|=1 这是一个一一对应的变换.
T ( X ) X i 对原样本 X=(X1,X2,…,Xn)
i 1 n
的充分性等价于
Yn
对 (Y1,Y2,…,Yn)的充分性
因此T ( X ) X i 是充分统计量.
i 1 n
7
例2.7.2设X=(X1,X2,…,Xn)是从正态总体N ( ,1) 中抽取的样本,则
1 n T ( X ) X i X 为充分统计量 n i 1
证明:记T=T(X),按照定义只要证明给定T 时X的概率分布与参数 无关.但是计算复 杂.采取如下正交变换方法进行.
23
例2.7.6设X=(X1, X2,…,Xn)是从总体 b(1, ) 中抽取的样本,则
T ( X ) X i 为充分统计量
证明:样本X ( X1 , X 2 , , X n )的联合分布列为
f ( x, )=P ( X1 x1 , ,X n xn )
= i1 (1 ) xi
(Y1 , Y2 , , Yn )'=A(X1 , X 2 , , X n )'
其中A是正交阵,为
8
1 1n n a21 a22 A a n1 an 2
a2 n ann
1 n
因此
1 Y Xi nX 1 n i =1 n Y a X , j 2,3, j jk k k 1
n
,n
9
由定理2.2.3的证明过程可知
Y X
2 i 1 i i 1
n
n
2 i
且Y1 ,Y2 , , Yn相互独立,其中
Y1 ~ N ( n ,1)
Yi ~ N (0,1), i 2, 3, , n
显然,X 对原样本X ( X 1 , X 2 , , X n )的充分性
等价于Y1对样本Y1 , Y2 , , Yn的充分性 因此只要证明给定Y1 =y1时(Y1 , Y2 , , Yn )
的条件密度与 无关即可.
10
Y1 , Y2 ,
, Yn的联合密度为
exp ( y1 n ) 2 2 给定Y1 =y1时(Y1 , Y2 , , Yn )的条件密度 f ( y1 , y2 , , yn ) f ( y1 , y2 , , yn | y1 )= fY1 ( y1 ) n 1 ( n 1)/ 2 2 =(2 ) exp yi 与 无关. 2 i 2 fY1 ( y1 )=
I
n1
t
n
例2.7.4 设X=(X1,X2,…,Xn)是从正态总体 N ( ,1) 中抽取的样本,则 T ( X ) X1 不是充分统计量 证明:在 T ( X ) X 1 条件下,
X1,X2,…,Xn的条件密度为 f ( x1 , , xn , T ( x ) x1 ) f (x1 , x2 , , xn | T ( x ) x1 ) fT ( x1 ) n 1 1 2 f (x2 , , xn ) exp ( xi ) 2 2 i 2 与 有关. 因此T ( X ) X1不是充分统计量. 18
T ( X ) X i 为充分统计量
证明:X1的概率密度函数为
i 1
n
e x , x 0 f ( x , ) x0 0,
则X=(X1,X2,…,Xn)的联合密度为

f ( x, ) ne
xi
i 1
n
I[ xi 0,i 1,2,
,n]
12
21
例2.7.5设X=(X1,…,Xn)是从正态总体N ( , 2 ) 中抽取的样本,令 ( , 2 ) 则
T ( X ) ( X i , X ) 为充分统计量
i 1 i 1 2 i
nቤተ መጻሕፍቲ ባይዱ
n
证明:样本X ( X1 , X 2 , , X n )的联合密度为
n 1 n/ 2 n 2 f ( x , )=(2 ) exp 2 ( xi ) 2 i 1 n n 1 n/ 2 n 2 2 =(2 ) exp 2 xi 2 xi n i 1 2 i 1
26
证明:记 X (1) min{ X 1 , , X n },X (n ) max{X 1 , , X n },
( n 1)! e I =
n t yi 0, yi t ,i 1,2, ,n 1 i 1 n n 1 t [ t 0]

n1
t e I
( n 1)! I I
n1
=
yi 0, yi t ,i 1,2, ,n 1 i 1 n 1 [ t 0]
2.7.2 充分性的判别准则——因子分解定理 因子分解定理首先是由R.A.Fisher在20世纪 20年代提出来,最一般形式和严格数学证明 是由Halmos和Savage在1949年给出.
19
定理2.7.1 (因子分解定理):
设样本X ( X1 ,X 2, , X n )的概率函数为f ( x, ) 依赖于参数,T T ( X )是一个统计量,则
n
n
i 1
n
xi
i 1
n
g(t ( x ), )h( x )
其中h(x)=1
n
根据因子分解定理,知 T ( X ) X i i 1 为充分统计量.
24
例2.7.7设X=(X1,…,Xn)是从均匀分布 U (0, ) 中抽取的样本,则
T ( X ) X ( n ) max{X 1 , , X n } 为充分统计量
给定 T t (Y1,Y2,…,Yn)的条件密度为
i 1 n 1 t
X 的密度函数为
i
n
f ( y1 , , yn1 , t ) f ( y1 , y2 , , yn | T t )= fT ( t )
15
f ( y1 , , yn1 , t ) f ( y1 , y2 , , yn | T t )= fT ( t )
第二章 抽样分布 及若干预备知识
2.7 充分统计量
1
2.7 充分统计量
统计推断的目的:对总体的分布(参数)进行推断. 样本带有总体分布(参数)的信息.
统计量集中了样本中关于总体分布(参数)的某部分 信息. 集中了样本中关于总体分布(参数)的全部信息的 统计量,即不损失信息的统计量——充分统计量. 问题:如何定义一个统计量是充分统计量?
T ( X ) X i 为充分统计量
证明:记T=T(X),按照定义只要证明下列条 件概率与参数 无关.
i 1
n
当 xi t0时,有
i =1
n
P( X1 x1 , X 2 x2 , , X n xn | T t0 )
相关文档
最新文档