充分统计量

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

取 t1= ∑xi , t2= ∑xi2, 并令 g(t1, t2,θ ) = (2πσ2)-n/2exp{-nµ 2/(2σ2)} π { } − } × exp{(t2−2µ t1)/(−2σ2)} , { =1, 其中 h(x)=1, =1 是充分统计量。 由因子分解定理, 由因子分解定理,T=(∑xi , ∑xi2) 是充分统计量。 ∑
定义5.5.1 (充分统计量 设 x1, x2, …, xn 是来自 充分统计量) 定义 充分统计量 某个总体的样本,总体分布函数为F 某个总体的样本,总体分布函数为 ( x ;θ ), , 统计 量 T = T(x1, x2, …, xn) 称为 θ 的充分统计 如果在给定T 的取值后, 量,如果在给定 的取值后,x1, x2,…, xn 的条 件分布与θ 无关. 无关.
例 5.5.3
设 x1 , x 2 , L , x n 是 来 自 N ( µ ,1)的 样 本 ,
令 T = x , 则 T 是 µ的 充 分 统 计 量 。
• 在一般场合直接由定义 在一般场合直接由定义5.5.1出发验证一个统计 出发验证一个统计 量是充分统计量比较困难. 奈曼(Neyman)给出 量是充分统计量比较困难 奈曼 给出 了一个简单的判别方法---因子分解定理 因子分解定理. 了一个简单的判别方法 因子分解定理 首先我们给出两类随机变量概率函数的定义. 随机变量X的概率函数 的概率函数f(x),在连续型场合 f(x) 在连续型场合, 随机变量 的概率函数 在连续型场合 表示X的概率密度函数 在离散型场合, 的概率密度函数;在离散型场合 表示 的概率密度函数 在离散型场合 f(x)表示 表示 X的分布列 的分布列. 的分布列
第二种信息对了解该产品合格品率是没有什么帮助 一般地,设我们对该产品进行n 次观测, 的。一般地,设我们对该产品进行 次观测,得到 x1, x2,…, xn,每个 j 取值非 即1,合格为 ,不合 每个x 取值非0即 ,合格为1, 格为0。 为观测到的合格品数。 格为 。令 T = x1+…+xn ,T为观测到的合格品数。 为观测到的合格品数 在这种场合仅仅记录使用T 在这种场合仅仅记录使用 不会丢失任何与合格品 有关的信息,统计上将这种“ 率 θ 有关的信息,统计上将这种“样本加工不损 失信息”称为“充分性” 失信息”称为“充分性”。 有一个样本分布F 样本 x=(x1,x2,…,xn) 有一个样本分布 θ (x), , 的信息。 这个分布包含了样本中一切有关θ的信息。
下面我们给出几个例子, 根据定义5.5.1 下面我们给出几个例子, 根据定义5.5.1 来验证一个统计量是不是充分的. 来验证一个统计量是不是充分的. 例5.5.2 设总体为二点分布 b(1,θ ), X1,L, Xn 为样本,令 为样本 令 T = X1 +L+ X n , 则T是θ 的充分 是 统计量;若令 统计量 若令 S = X1 + X 2 ,S不是θ 的充分统计量 不是 的充分统计量.
其中g(t, 是通过统计量 的取值而依赖于样本的。 其中 θ )是通过统计量 T 的取值而依赖于样本的
是取自总体U(0,θ )的样本, 的样本, 例5.5.4 设x1, x2, …, xn是取自总体 的样本 即总体的密度函数为 1/θ , 0 < xΒιβλιοθήκη Baidu< θ
p(x ;θ )=
0 ,
其他
于是样本的联合密度函数为 p(x1;θ)…p(xn;θ)= (1/θ)n, 0<min{xi}< < { }<max{xi}<θ { 0, 其它
§5.5 充分统计量
5.5.1 充分性的概念
为研究某种产品的合格品率, 例5.5.1 为研究某种产品的合格品率,我们对该产 品进行检查,从该产品中随机抽取10件进行观测, 10件进行观测 品进行检查,从该产品中随机抽取10件进行观测, 发现除第三、六件产品不合格外,其余8件产品都 发现除第三、六件产品不合格外,其余 件产品都 是合格品。这样的观测结果包含了两种信息: 是合格品。这样的观测结果包含了两种信息: (1) 10件产品有 件是合格品 件产品有8件是合格品 件产品有 件是合格品; (2) 2 件不合格品分别是第三和第六件。 件不合格品分别是第三和第六件。
= (1/θ)nI{x(n) <θ} 取T =x(n),并令 g(t ;θ )= (1/θ)nI{t<θ}, h(x)=1, , 的充分统计量。 由因子分解定理知T 由因子分解定理知 =x(n) 是θ 的充分统计量。
是取自总体N( 例5.5.5 设x1, x2, …, xn 是取自总体 µ, σ2)的样 的样 本, θ =(µ, σ2)是未知的,则联合密度函数为 是未知的, 是未知的
5.5.2 因子分解定理
充分性原则: 在充分统计量存在的场合, 充分性原则: 在充分统计量存在的场合,任何统计 推断都 可以基于充分统计量进行,这可以简化统计 可以基于充分统计量进行, 推断的程序,称该原则为充分性原则 称该原则为充分性原则. 推断的程序 称该原则为充分性原则 定理5.5.1 设总体概率函数为 p(x ;θ ), X1, …, Xn 定理 , 为样本, 为样本,则 T=T(X1,… Xn) 为充分统计量的充分 必要条件是:存在两个函数g(t; θ)和h(x1, …, xn), 必要条件是:存在两个函数 和 , 使得对任意的θ 和任一组观测值 x1, x2,…, xn,有 p(x1, x2,…, xn; θ ) =g(T(x1,x2,…,xn);θ )h(x1,x2,…,xn) (5.5.1)
统计量T 统计量 =T (x1,x2,…,xn) 也有一个抽样分布 FθT(t) ,这个分布包含了统计量 中一切有关θ的信 包含了统计量T中一切有关 当我们期望用统计量T 息. 当我们期望用统计量 代替原始样本且不损 的信息时, 失任何有关 θ 的信息时,也就是期望抽样分 布 FθT(t) 像 Fθ(x) 一样概括了有关 θ 的一切 信息. 信息 这即是说在统计量 T 取值为 t 的情况下 的条件分布F 的信息, 样本 x 的条件分布 θ(x|T=t) 已不含 θ 的信息, 这正是统计量具有充分性的含义。 充分性的含义 这正是统计量具有充分性的含义。
进一步, 进一步,我们指出这个统计量与 (x, s2 ) 是一一对应的,这说明在正态总体场合 是一一对应的, 常用的 ( x , s2 ) 是充分统计量。 是充分统计量。
1 n 2 −n /2 2 p(x1,L, xn;θ ) = (2πσ ) exp − 2 ∑(xi − µ) 2σ i=1
n nµ2 1 n 2 2 −n /2 = (2πσ ) exp − 2 exp − 2 ∑xi − 2µ∑xi i=2 2σ 2σ i=1
相关文档
最新文档