6-充分统计量

合集下载

充分统计量与完备统计量

充分统计量与完备统计量

完备统计量的含义不如充分统计量那么明确,但由
定义可见它有如下特征:
P g1 (T ) g2 (T ) 1, E g1 (T ) E g2 (T ), 。
(1.7)
对于一般的统计T T ( X 1 , X 2 , , X n ) ,总有
对统计量 T,如果已知它的值以后,样本的条件分布 与 无关,就意味着样本的剩余部分中已不再包含关于 的信息, 也就是在 T 中已包含有关 的全部信息。 因此, 对 的统计推断只需要从 T 出发即可, 不再需要样本数据。
二、 因子分解定理
根据充分统计量的含义,在对总体未知参数进 行推断时,应在可能的情况下尽量找出关于未知参 数的充分统计量。 但从定义出发来判别一个统计量是否是充分统 计量是很麻烦的。 为此,需要一个简单的判别准则。下面给出一 个定理——因子分解定理,运用这个定理,判别甚 至寻找一个充分统计量有时会很方便。
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1 n n xi n xi n p i 1 (1 p ) i 1 , 如 果 xi k, k k nk C n p (1 p ) i 1 n 0 , 如 果 xi k, i 1 n 1 C k , 如果 xi k, i 1 n n 0, 如果 xi k, i 1
其中 h( x1 , x2 ,, xn ) 1 ,
而 g (T ( x1 , x2 , , xn ); ) 显 然 是 T ( x , xi2 ) 和 ( , 2 ) 的函数。 故由因子分解定理知 T ( X , x i2 ) 是 ( , 2 )

充分统计量

充分统计量

充分统计量充分统计量又称足够的样本容量,是指一个总体能从各种可能中得到它所需要的资料。

这里需说明的是“全部”并不等于每个个体都被收集起来加以考察。

这也就是为什么有些人很忙,但工作成效却很低的原因。

只有对总体进行研究后才能发现其规律性和特征,而大量重复就会使统计工作变得无用,而且费力。

另外,抽样时还必须保证总体中每个个体都具有同质性或相似性。

根据这两点,充分统计量应该满足:(1)当总体中任何一个个体值均落入某一区间内时,则认定此数据已达到了充分统计量;(2)若总体中存在非随机误差项,那么在估算充分统计量时,将其剔除出去,再求解,直至误差消失为止。

我们在作调查时,常遇见这类问题:“你家几口人?”、“你今年多少岁啦!”…诸如此类的提问方式显然没有经过严格的科学论证,甚至连最基础的概率知识都未掌握。

试想,假设甲乙丙三位老师同时向100名小朋友询问上述问题,结果会怎样呢?答案肯定是令人吃惊的!由此看来,我们平日里做事情,尤其是搞社会调查活动,切忌凭主观臆断下结论,更不能道听途说,盲目地给别人贴标签。

俗话说:“凡事预则立,不预则废。

”正确运用好充分统计量,关系着整个调查报告的质量高低与否。

如果调查者缺乏专业素养,往往会导致错误的判断,造成决策失误。

例如,前面讲到的美国人口普查局的一次实验。

他们选择了一批6-10岁儿童,让他们填写自己父母亲的职业,并把这份表交回来,请他们的父母评价孩子的智商水平。

这个实验虽然取得了良好的效果,但是却留下了许多疑惑——为什么受测者的父母对孩子的智商竟毫无觉察呢?难道真像他们所宣传的那样,他们天生愚钝吗?通过仔细推敲,他们终于找到了症结所在:原来,这群孩子之所以智商偏低,完全是因为他们的父母压根儿就没有意识到自己的孩子智商比较低罢了。

充分统计量例题

充分统计量例题

充分统计量例题一、概述在统计学中,充分统计量(sufficient statistic)是指能够包含样本中所有关于未知参数的信息的统计量。

它们能够有效地减少样本数据的维度,并且在推断未知参数时提供足够的信息。

充分统计量在统计推断和参数估计中起着重要的作用。

它们能够帮助我们从样本中推断出总体参数的值,而无需关注整个样本的数据。

在许多情况下,通过使用充分统计量,我们可以简化推断过程,减少计算的复杂性,并获得更精确和可靠的估计结果。

二、定义充分统计量的定义是基于条件概率。

对于一个参数θ的统计模型,我们可以将观测数据表示为X = x,其中X表示从总体中抽取的随机样本,x表示观测到的样本数据。

给定样本X = x,一个统计量T(X)称为充分统计量,如果对于所有可能的样本X,给定充分统计量T(X)后,样本的条件分布不依赖于待估参数θ。

换句话说,充分统计量能够保留样本中所有关于待估参数θ的信息,而无需知道样本中每个观测值的具体取值。

三、寻找充分统计量的方法寻找充分统计量的方法有多种,常用的有因子分解定理、最大似然估计和贝叶斯估计等。

1. 因子分解定理因子分解定理是寻找充分统计量的经典方法之一。

其基本思想是将样本的联合概率密度函数(或概率质量函数)分解为两个函数的乘积。

其中一个函数是与参数θ无关的函数,另一个函数只是依赖于θ。

通过因子分解定理,我们可以找到一组与θ无关的函数h(x)和依赖θ的函数g(x;θ),使得联合概率密度函数(或概率质量函数)可以表示为:p(x;θ) = h(x)g(x;θ)其中,h(x)称为充分统计量的底层函数。

2. 最大似然估计最大似然估计是寻找充分统计量的另一种常用方法。

最大似然估计的目标是找到使得样本出现的概率最大的参数值。

在最大似然估计中,我们首先构造样本的似然函数,然后通过最大化似然函数来得到参数的估计值。

如果我们能找到一个统计量,它的分布与待估参数的似然函数相同,那么这个统计量就是充分统计量。

充分完备统计量总结(热门5篇)

充分完备统计量总结(热门5篇)

充分完备统计量总结第1篇20xx年全所各项工作围绕我局目标管理责任状内容,结合省、市计量工作要点,对内抓好计量服务规范各项活动,不断提高工作效能;对外以强化民生计量为重点,以开展企业能源计量工作为切入点,将监督与服务有机地融为一体,使计量基础工作在新形势下得到了较快发展,圆满地完成上级交给的各项工作任务。

一、抓好机构建设增强核心竞争力1、坚持项目强所,抓好新上检定项目的建设。

省局20xx年已批建的项目出租车计价器、玻璃量具、水表检定装置已经申请考核验收,同时做好了标准镜片组检定装置、气体流量计检定装置、大衡检定装置的调研工作,大衡检定装置已于9月购置,标准镜片组检定装置、气体流量计检定装置11月底购置,明年四月申请考核验收。

同时,根据社会需求和所工作实际,对x光机、压力表、三表项目拟于20xx年进行技改。

2、加强人员的培训,打造学习型技术机构,全面推行一专多能,提高从业人员的业务素质,培养学科技术带头人,准备迎接计量授权考核工作;同时上报了专业技术人才引进工作,提高计量技术机构的核心竞争力。

今年共有29人次参加水表、加油机检、出租车计价器、玻璃量具、天平、x光机检定员培训,有11人次取得了新上项目检测资格证书。

3、对现有体系进一步完善、改进、保持,确保各项检测工作切实按《质量手册》及《程序文件》运行,使各项工作不断地规范有序。

在四月份对体系进行了内审和评审。

针对存在的设备更新送检等问题也进行逐项改进和落实。

确保新上项目考核验收通过。

4、进一步细化所内各项工作制度的考核办法,使各项考核工作落到实处,真正达到人人各司其职、各负其责,责权利相互挂钩的管理机制。

所里根据局考核方案制定了所内考核办法,细化了考核内容,高度体现了贡献与收入、权利和义务的合理利益分配原则。

明确各自的职责,增强了工作责任感。

5、营造一个和谐的浓厚的文明创建氛围,全面促进文明单位创建工作。

抓好宣传工作及文明创建工作。

按时报送信息稿件,见报30篇。

充分统计量与完备统计量

充分统计量与完备统计量

T
, X n )是一
个统计量,则T 是的充分统计量的充要条件是: 样本的联合分布律可以分解为
(i) P ( x , ) h( x1 , x2 ,
n
i 1
, xn ) g(T ( x1 , x2 ,
, xn ), )
其中h是x1 , x2 ,
, xn的非负函数且与 无关,g仅通 , xn .
, xn ), )
其中h是x1 , x2 ,
, xn的非负函数且与 无关,g仅通 , xn .
(i ) (i )
过T 依赖于x1 , x2 ,
(2) 离散型情况
设总体X的分布律P{ X x } p( x , ),(i 1, 2, ),
( X1 , X 2 ,
, X n ) 是一个样本,T ( X1 , X 2 ,
k k k p (1 p)n k ,因而 证 由于P{ X } P{nX k }=C n n n
k k p k 即对任意的0 p 1, g( )C n ( ) 0,而此式 n 1 p k 0 p 是关于 的多项式,因而每项系数只能为0,则 1 p k k g( ) 0,因而满足Pp { g( ) 0} 1, 所以X 是完备 n n 统计量.
n
解 P { X1 x1 , X 2 x2 ,
1
n
, X n xn }
n

n
i
i 1
xi
x !
i 1 i
e n
x !
i 1 i
n

n
i 1
n
e

1
x !
i 1 i
n
nX e n

充分统计量

充分统计量
2019年1月15日星期二
第五章 统计量及其分布
第15页
什么样的充分统计量才是最有价值的呢? 显然,充分统计量的维数越小就越有价值,因为我们 用尽可能少的量概括了样本中提供的信息。
在大多数情形下,我们都能看到: 维数与未知参数 维数相等的充分统计量是存在的,即我们经常都能 对T = (x1, x2, …, xn) 作降维处理。但在某些场合,降 维的充分统计量并不存在。如著名的威布尔分布
其中 h(x)=1, 由因子分解定理,T=(xi , xi2) 是充分统计量。
2019年1月15日星期二
第五章 统计量及其分布
第12页
进一步,我们指出这个统计量与 (x, s2 ) 是一一对应的,这说明在正态总体场合 常用的 ( x , s2 ) 是充分统计量。
2019年1月15日星期二
第五章 统计量及其分布
2019年1月15日星期二
第五章 统计量及其分布
第5页
定义5.5.1 设 x1, x2, …, xn 是来自某个总体 的样本,总体分布函数为F ( x ; ),统计 量 T = T(x1, x2, …, xn) 称为 的充分统计 量,如果在给定T 的取值后,x1, x2,…, xn 的条件分布与 无关. 说明:参数θ和充分统计量 T = T(x1, x2, …, xn)并不 一定是一维的。
第7页
5.5.2 因子分解定理
充分性原则: 在统计学中有一个 基本原则-在充分统计量存在的场合,任何统计推断都 可以基于充分统计量进行,这可以简化统计 推断的程序。
充分性原则和另外一个完备性原则在我们寻求对 总体中的未知参数作统计推断时扮演者重要角色。
2019年1月15日星期二
第五章 统计量及其分布

充分统计量与完备统计量

充分统计量与完备统计量

例1.4 根据因子分解定理证明例1.3。 证明 样本的联合分布律为
PX 1 x1 , X 2 x2 ,, X n xn p
I 1 N
xi
(1 p)
n
n
x
i 1
n i i 1
n
i
若取
1 n T ( x1 , x2 , , xn ) xi n i 1
n P ( X 1 x1 , X 2 x 2 , , X n x n ) , 如 果 x i k, P (n X k ) i 1 n 0, 如 果 x i k , i 1 n n xi n xi n p i 1 (1 p ) i 1 , 如 果 xi k, k k nk C n p (1 p ) i 1 n 0 , 如 果 xi k, i 1 n 1 C k , 如果 xi k, i 1 n n 0, 如果 xi k, i 1
例 1.7 设 X 1 , X 2 ,, X n 是来自正态总体 N ( , 2 ) 的一个 样 本 , 试 证 T ( X 1 , X 2 , , X n ) ( X , X i2 ) 是 关 于
i 1 n
( , 2 )的联合充分统计量。
证明 样本的联合分布密度为
与 p 无关,所以 X 为 p 的充分统计量.
定义
设 X 1 , X 2 ,, X n 为来自总体 X 的样本,X 的分
布函数为 F x; ,T=T( X 1 , X 2 ,, X n )为一个统计量, 当给定 T=t 时,如果样本( X 1 , X 2 ,, X n )的条件分布 (离散总体时为条件概率,连续总体时为条件密度) 与参数 无关,则称 T 为参数 的充分统计量。

充分统计量与完备统计量

充分统计量与完备统计量

研究统计量 X

1 n
n i 1
Xi 。
n
因为 X i B(1, p) ,所以 n X X i B(n, p) ,即有 i 1
P(nX k) Cnk pk (1 p)nk ,k 0,1, ,n.
设 x1 , x2 ,, xn ,为样本观测值,其中 xi 0 ,1 . 如果已
知X

k n
则样本
X
1
,
X
2
,,
X
n

的条件概率
P ( X 1 x1 , X 2 x2 ,
,Xn
xn
X

k) n
P ( X 1 x1 , X 2 x2 ,
, X n xn, X

k) n
P(X k )
n


P(X1

x1 , X 2 x2 , , X n xn ) , 如 果 P(n X k )
p i 1 (1 p ) i 1
C
k n
p
k
(1

p )nk
,如 果
n i 1
xi

k,

n

0,如 果 xi k,

i 1


1 Cnk
0,
n
, 如果
xi k,
i 1
n
如果
xi k,
i 1
与 p 无关,所以 X 为 p 的充分统计量.
定义 设 X1 , X2 ,, Xn为来自总体 X 的样本,X 的分
证明
样本( X , X ,, X )的联合分布律为

充分统计量的定义

充分统计量的定义

充分统计量的定义
充分统计量对于给定的统计推断问题,包含了原样本中关于该问题的全部有用信息的统计量。

对于未知参数的估计问题,保留了原始样本中关于未知参数θ的全部信息的统计量,就是充分统计量。

如样本均值X是总体数学期望的充分统计量。

数学上,设(X₁,…,Xₑ)是来自总体X的一个随机样本,T=T(X₁,…,Xₑ)是一统计量。

若在T=t 的条件下,样本的条件分布与未知参数θ无关,则称统计量T是θ的充分统计量。

充分统计量的基本介绍:
样本中包含关于总体的信息可分为两部分:其一是关于总体结构的信息,即反映总体分布的结构;其二是关于总体中未知参数的信息,这是由于样本的分布中包含了总体分布中的未知信息。

我们对信息的加工只会减少,不会增多,即统计量具有压缩数据功能,但会凸显我们需要的信息。

那么一个好的统计量应该能将样本中包含未知参数的全部信息提取出来,即样本加工不损失未知参数的信息称为充分性。

如何将这一想法用数学形式表示呢?费希尔在1922年提出了一个重要概念——充分统计量计量。

粗略地说,充分统计量就是不损失信息的统计量,在简化统计问题中是非常重要的概念,也是经典统计和贝叶斯统计中为数不多的相一致的观点之一。

充分统计量

充分统计量

充分统计量⏹充分统计量的定义⏹充分统计量的验证⏹Neyman-Fisher因式分解定理1. 充分统计量的定义在前面的例题中我们看到, 样本均值是高斯白噪声中未知常数估计的有效估计量。

11ˆN ii A zN-==∑考虑如下数据集:1021{,,...,}N s z z z -=2011{,...,}N s z z z -=+130N i i s z -=⎧⎫=⎨⎬⎩⎭∑这些数据集都可以求得A 的有效估计量。

s 3仅有一个元素,称为充分统计量。

定义:对于未知参数θ的估计,如果统计量T (z)给定后,观测中将不再含有θ的信息,即()()00();()p T T p T T ===z z θz z 则称T (z)为充分统计量(ss, sufficient statistic)。

也就是说,观测中所有关于θ的信息都包含在充分统计量T (z)中。

2. 充分统计量的验证()()00();()p T T p T T ===z z θz z T (z)是不是充分统计量,也就是要判断下式是否成立:由贝叶斯公式:()()()000,();();();p T T p T T p T T ====z z θz z θz θ()00(;)(())();p T T p T T δ-==z θz z θ考虑高斯白噪声中未知常数的估计问题,观测的概率密度为:()122/22011(;)exp (2)2N i N i p A z A -=⎧⎫=--⎨⎬πσσ⎩⎭∑z 1()N ii T z -==∑z 2()~(,)T N NA N σz与未知参数A 无关,是充分统计量。

1()N i i T z -==∑z3. Neyman-Fisher 因式分解定理()()00();()p T T p T T ===z z θz z 在实际中要判断下式成立往往存在一定的困难:Neyman-Fisher 因式分解定理:T (z) 为参数θ的充分统计量的充要条件是p (z ;θ)能分解为(;)((),)()p g T h θ=θz z z例1:高斯白噪声中未知常数A 的估计122/22011222/22200(;)11exp ()(2)2111exp 2exp (2)22N i N i N N i i N i i p A z A NA A z z -=--==⎧⎫=--⎨⎬πσσ⎩⎭⎧⎫⎧⎫⎛⎫=---⎨⎬⎨⎬ ⎪πσσσ⎩⎭⎝⎭⎩⎭∑∑∑z ((),)g T A z ()h z T (z) is a ss1.6.3 Neyman-Fisher 因式分解定理例2:高斯白噪声中正弦信号相位的估计2011=π+φ+=-[]cos()[],,...,z n A f n w n n Nh z()((),(),)z zg T Tφ12如果12(;)((),(),...,(),)()r p g T T T h θ=θz z z z z 12(),(),...,()r T T T z z z 称为联合充分统计量小结:1. 充分统计量的定义()()00();()p T T p T T ===z z θz z 充分统计量一旦给定,观测中就不再含参数θ的任何信息。

充分统计量

充分统计量

下面我们给出几个例子, 根据定义5.5.1 下面我们给出几个例子, 根据定义5.5.1 来验证一个统计量是不是充分的. 来验证一个统计量是不是充分的. 例5.5.2 设总体为二点分布 b(1,θ ), X1,L, Xn 为样本,令 为样本 令 T = X1 +L+ X n , 则T是θ 的充分 是 统计量;若令 统计量 若令 S = X1 + X 2 ,S不是θ 的充分统计量 不是 的充分统计量.
例 5.5.3
设 x1 , x 2 , L , x n 是 来 自 N ( µ ,1)的 样 本 ,
令 T = x , 则 T 是 µ的 充 分 统 计 量 。
• 在一般场合直接由定义 在一般场合直接由定义5.5.1出发验证一个统计 出发验证一个统计 量是充分统计量比较困难. 奈曼(Neyman)给出 量是充分统计量比较困难 奈曼 给出 了一个简单的判别方法---因子分解定理 因子分解定理. 了一个简单的判别方法 因子分解定理 首先我们给出两类随机变量概率函数的定义. 随机变量X的概率函数 的概率函数f(x),在连续型场合 f(x) 在连续型场合, 随机变量 的概率函数 在连续型场合 表示X的概率密度函数 在离散型场合, 的概率密度函数;在离散型场合 表示 的概率密度函数 在离散型场合 f(x)表示 表示 X的分布列 的分布列. 的分布列
进一步, 进一步,我们指出这个统计量与 (x, s2 ) 是一一对应的,这说明在正态总体场合 是一一对应的, 常用的 ( x , s2 ) 是充分统计量。 是充分统计量。
§5.5 充分统计量
5.5.1 充分性的概念
为研究某种产品的合格品率, 例5.5.1 为研究某种产品的合格品率,我们对该产 品进行检查,从该产品中随机抽取10件进行观测, 10件进行观测 品进行检查,从该产品中随机抽取10件进行观测, 发现除第三、六件产品不合格外,其余8件产品都 发现除第三、六件产品不合格外,其余 件产品都 是合格品。这样的观测结果包含了两种信息: 是合格品。这样的观测结果包含了两种信息: (1) 10件产品有 件是合格品 件产品有8件是合格品 件产品有 件是合格品; (2) 2 件不合格品分别是第三和第六件。 件不合格品分别是第三和第六件。

充分统计量与完备统计量

充分统计量与完备统计量

三、完备统计量
为了介绍完备统计量的概念,首先需要引入完备分 布函数族的概念。
定义 1.5 设总体 X 的分布函数族为F( x; ), ,
若对任意一个满足
E g( X ) 0,对一切
的随机变量 g( X ),总有
(1.5)
P g( X ) 0 1,对一切 , 则称F( x; ), 为完备的分布函数族。
族——指数型分布族。它包含了一些常用分布,如泊松
分布、正态分布、指数分布、二项分布和 分布等,对这
类分布族,寻找参数的充分完备统计量是方便的。
定理 1.5 设总体 X 的分布密度 f ( x; )为指数型分布
族,即样本的联合分布密度具有如下形式:
n i 1
f
( x;
)
C (
) exp
m j1
=T(X1,X2,…,Xn) 也有一个抽样分布FT(t) 。
当我们期望用统计量T 代替原始样本并且不
损失任何有关 的信息时,也就是期望抽样分布 FT(t) 像 F(x) 一样概括了有关 的一切信息。
这即是说在统计量T 的取值为 t 的情况下
样本 x 的条件分布F(x|T=t) 已不含 的信息,
bj (
)Tj ( x1 ,
x2 ,,
xn
)
h( x1 , x2 ,, xn ),
2.9
其中 (1,2 ,,m ), 。如果中包含有一个m 维矩形,
而且 B (b ( ),b ( ),,b ( ))的值域包含一个m 维开集,则
1
2
m
T (T ( X , X ,, X ),T ( X , X ,, X ),T ( X , X ,, X ))
完备统计量的含义不如充分统计量那么明确,但由

充分统计量——精选推荐

充分统计量——精选推荐

充分统计量
充分统计量不就是在统计量的前⾯加了⼀个充分⼆字么,⾸先它是⼀个统计量,所谓的统计量本质就是样本的函数,即给定⼀上具体的样本,就会有⼀个统计量这个函数值与之对应。

每⼀个函数都有特定的意义,统计量这个函数是为了从样本中得到我们要得到的信息,⽐如你可能想知道⼤家的平均⽔平,那求个平均值就好了,那么在实际当中我们在构造不同的函数,即构造不同的统计量时,必然会考虑⼏个问题。

1.你想得到什么
2.你统计量构有没有损失信息。

⼀定要注意所谓的有没有损失信息是相对于你研究的问题来说的
对样本加⼯必然会损失信息,只想是不对你想求的东西不损失,这时我们就称你构造的这个函数或者说是⼀个统计量就是⼀个充分统计量
举例说明
给你⼀个样本,这个样本是,记录了10次运动员的成绩,如10次中1次与5次运动员没有命中⽬标,你要求的东西是运动员的命中率。

析:命中率这个东西,显然是针对总体才有的,⽽在实际中你不可能得到所有的总体,所以你只能通过样本,以此来推出
那么你可能会这样构造,x 命中记为1,没命中记为0.那么t=x1+x2++xn
⽤t 来记录来得到你要的命中率,显然,没有能说明是第⼏次没命中这⼀信息,但这⼀信息并不是我们要求的,所以这个统计量还是充分统计量。

充分统计量_完备统计量_指数分布族

充分统计量_完备统计量_指数分布族

-4-
X (1) ,, X (n) 是完全的(对任何自然数 n).
引理 :设分布族满足上面的条件(a), f ( X1,, X n ) 为 Bore(可测得对称函数),满足条

f
( X1,,
X n )dF ( X1)dF ( X n )
0f
( X (1) ,,
X(n) )
,对任何
F
f

则对 F 中的任意 n 个分布 F1,, Fn ,必有
f ( X1,, X n )dF1( X1)dFn ( X n ) 0 f ( X (1) ,, X (n) )
定义(有界完全性):设变量 X 的样本空间为 (x, x ) ,分布族为{ p , }, t(x) 为定义
于 X 取 值 于 ( f , f ) 的 统 计 量 , 其 分 布 族 为 { pT , } , 若 对 任 何 满 足 条 件 ”
定义: F {p(x; ), }
对于任何一个可测函数 g(x) ,由 Eg [g(x)] ( )
g(x) p(x; )dx 0
对 有 { pg{g(x)} 0} 1 or g(x) 0(a.e.p) 等 价 的 , E [g1(x)] Eg[g2 (x)] 对
成立,可推出 p {g1(x) g2 (x)} 1
f x, g T x h x
(0.1)
对每一 与x X 成立.
注: h x不依赖于.
证:只对离散型情况给出证明.这时,
f x, P X x
对于T X 的值域中任意固定的 t ,定义集合
At x :T x t.
充分性 设 f x, 使因子分解式(1.1)成立.则对任意的 x At , T x t 成立,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20
解 (1) 即
19 S
2
( n 1) S
2


2
~ ( n 1)
2
1

2

2
X
i 1
20
i
X ~ (19)
2 2

1 2 2 2 P 0.37 X i X 1.76 20 i 1 20 1 2 P 7.4 2 X i X 35.2 i 1
1.设 X 1 , X 2 , , X m Y1 ,Y2 , ,Yn 分别是来 与 自正态总体 X ~ N ( 1 , 12 )与 Y ~ N ( 2 , 22 ) 的 相互独立的简单随机样本.

X
X m
i 1
1
m i
Y
Y n
j 1
1
n j
S1
2
1 m 1
m
(Xi X )
2 2 2
所服从的分布.
解 X 1 X 2 X 9 ~ N ( 0, 9 16 )
1 3 4 ( X 1 X 2 X 9 ) ~ N ( 0, 1 )
1 3
Yi ~ N (0,1) , i 1,2,,16
1 2 Yi ~ (16) i 1 3
充要条件是:存在两个 函数g( t , )和h( x1 , x 2 , , xn ) 使得对任意 和任一组观察值 1 , x 2 , , x n,有 x
相互独立的简单随机样本. 则
1 n ( X Y ) ( 1 2 ) 1 m ( n 1) S1 ( m 1) S 2
2 2
~ t (n m 2)
nm2
例2设
X ~ N (72 ,100) ,为使样本均值大于70
的概率不小于90%,则样本容量至少取多少?
Cov( X 1 , X 2 ) Var( X 1 ) Cov( X 2 , X 1 ) Var( X 2 ) Cov( X n , X 1 ) Cov( X n , X 2 )

T

Cov( X 1 , X n ) Cov( X 2 , X n ) Var( X n )
样本X 1,X 2, ,X 10提供了两种信息:
(1)10件检验中,不合格品出 现了几次。
(2)10 件检验中,不合格品出 现在哪几次试验上。
样本加工不损失信息 统计上称为充分性
~ 样本X ( X 1,X 2, ,X n )的分布:
n
~ Fθ ( x ) Fθ ( x i )
X 1 ,X 2 , ,X n的条件分布与 无关.
下面我们给出例子,利 用定义来证明一个 统计量是否充分 .
例1 设X 1,X 2, ,X n 是取自总体 (1, )的样本, b
考查两个统计量 1 X 1 X 2 X n,T2 X 1 X 2 T
则T1是充分统计量, 2 不是充分统计量 T .
2 2

Y ~ (2) 3
2
1
因此 c 1/ 3.
§5.5 充分统计量
构造统计量的目的: 对样本X 1, ,X n进行加工
这种加工就是把原来为 数众多的且杂乱无章的 样本
观察值用少数几个经过 加工后的统计量的值来 代替.
在以后的统计推断中, 是用统计量来推断,而 不是用 样本观察值进行推断 .
i 1
这个分布包含了样本中 一切有关的信息
统计量T T ( X 1,X 2, ,X n )的抽样分布: Fθ ( t ) - -这个分布包含了统计量 中一切有关 的信息 T
T
~ 注:在统计推断中用统 计量T代替原始样本 时,希望 X
T
~ 抽样分布 θ ( t )像Fθ ( x )一样概括了有关 的一切信息, F
在下面的定理证明过程 中用到的关于 元 n 正态分布的一些结论
设随机向量 ( X 1 ,X 2 , ,X n ) ~ N ( EX , B ) X
T
其中随机向量的数学期 EX ( EX 1 ,EX 2 , ,EX n ) 望
T
协方差矩阵
B E ( X - EX )( X - E X )
16 2
从而
X1 X 2 X 9 Y1 Y2 Y16
2 2 2
1 3 4
X1 X 2 X 9
1 3 Yi i 1 16
16 2
~ t (16)
例5 设总体 X ~ N (0,1) , X1 ,, X 6 为总体 X 2 2 Y 的样本, ( X 1 X 2 X 3 ) ( X 4 X 5 X 6 ) 2 试确定常数 c , 使 cY 服从 分布. 解
20
1 P 2
查表
X
20 i 1
i
X

2
1 35 .2 P 2
X
20 i 1
i
X

2
7.4
0.99 0.01 0.98
(表见P.426)
(2) 故
Xi 2 ~ ( 20) i 1
所以取 n 42
例3 从正态总体 X ~ N ( , ) 中,抽取了 n = 20的样本 ( X1 , X 2 ,, X 20 )
2
(1) (2)
2 2 2 求P 0.37 X i X 1.76 20 i 1
1
20
1 2 求P 0.37 X i 2 1.76 2 20 i 1
X 1 X 2 X 3 ~ N (0,3) , X 4 X 5 X 6 ~ N (0,3) 1 1 X 1 X 2 X 3 , X 4 X 5 X 6 ~ N (0,1) 3 3
1 1 X1 X 2 X 3 X 4 X5 X 6 3 3
在一般场合下,直接由 定义出发验证一个统计 量 是充分统计量比较困难 Neyman给出了一个简单的 , 判别方法- -因子分解定理 .
2、因子分解定理
f 定理 1 设总体概率函数为 ( x ; ), X 1 ,X 2 , ,X n为
为样本,则 T ( X 1 , X 2 , , X n )为充分统计量的 T
T
若Y AX,则有 E (Y ) AE ( X ), Var (Y ) AVar( X ) A ,
T
且Y ~ N ( E (Y ), Var (Y ))
4、抽样分布的某些结论 (Ⅰ) 一个正态总体 设总体 X ~ N ( , ) ,样本为(
2
),则
( n 1) S
2
X ~ N ( ,
一个好的统计量应该把 含在样本中有关总体的 (或有关 参数)的信息一点都不损失的 提取出来。
1、充分性的概念
考虑统计量
10
某厂要了解某产品的不 合格率 , 现检查了 件产品, 10 引例
T1
X
i 1
i
T2 X 1 X 2
1 第i件为合格品 , Xi 0, 第i件为不合格品
i 1
2S2 2源自 (Y n 1j 1
1
n j
Y )
2
S1
2

F
1
2
S2
2
~ F ( m 1 , n 1)
2
2
2.设 X 1 , X 2 , , X m Y1 ,Y2 , ,Yn 分别是来 与 2 自正态总体 X ~ N (1 , ) 与 Y ~ N (2 , 2 ) 的
20
2
2 2 2 P 0.37 X i 1.76 20 i 1 2 20 Xi P 7.4 35.2 i 1
1
20
20 X 20 X i i P 35 .2 P 7.4 i 1 i 1
证明: 由于s (t )是单值可逆函数,
所以事件 S s" 事件 T t" " "
n
例: T 若
X
X
i 1
i
是的充分统计量,则
X 也是的充分统计量 n
i i 1
1
n
统计的一个基本原则: 在充分统计量存在时, 任何统计推断可以基于 充分 统计量进行,这可以简 化统计推断的程序,通 常将该原 则称为充分性原则 .
A 1 n 1 2 1 1 n( n 1)
T
,

1 n 1
T
令Y AX , A如下
1 n 0 1 n( n 1) n 0 n 1 n( n 1) 1

2 1 1

一些结论:
1、X i的边际分布还是正态分 布,且 X i ~ N (E( X i ), Var( X i )).
2、若 B E ( X - EX )( X - E X )

T

2
I
则X 1,X 2, ,X n 相互独立,且 i ~ N ( EX i ,1). X
3、随机向量 ( X 1 ,X 2 , ,X n ) ~ N ( EX , B ) X

2
)
X
n
( n 1) S
2

n
2
~ N ( 0 ,1)
相关文档
最新文档