同济概率统计第八章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
无偏估计。比较他们方差的大小。
1 n 2 ˆ σ = ∑ X i 具有无偏性,而样本方差 S 2 也是 σ 2 的 n i =1
2
X 例8.14 设 ( X 1 ,… , X n ) 是取自总体X的一个样本, ~ R (0,θ ) 其中θ未知,θ>0。由例8.11知道,θ的矩估计 2X 是无偏估计,且方差为
i =1
n
n
n
xi + ε i
i =1
xi −ε i
f (t ;θ ) dt
≈ ∏ f ( xi ;θ ) ⋅ 2ε i = L(θ )∏ 2ε i
i =1 i =1
n
( 似然函数 L (θ )反映了获得样本观测值 x1 ,… , xn ) 的概率。
定义8.2 设 ( X 1 ,… , X n ) 是取自总体X的一个样本,如果存 ˆ 在 θˆ = θˆ( x1 ,… , xn ) ,使得 L(θ ) = max L(θ ) ,那么, θ ∈Θ ˆ( x ,… , x )为θ的极大似然估计值,称相应的θ ( X ,… , X ) ˆ 称θ 1 n 1 n 为θ的极大似然估计量。 如果总体参数由k个,它们是θ1 ,… ,θ k ,那么,记总体 X的密度函数(或概率函数)为 f ( x;θ1 ,… ,θ k ) ,似然函 数为 n
§8.1 参数估计问题
在数理统计中,总体X的分布永远是未知的,因而X的 数字特征往往也是未知值,这些未知值通常称为参数。 通常强调其未知性,称为未知参数。(注意数理统计和 概率论中参数概念的区别) 标记总体分布的未知参数称为总体参数,总体参数的取 值范围称为参数空间,记做 Θ 。 如何根据样本来对未知参数进行估计?这就是数理统计 中的参数估计问题。参数估计有两类:一是点估计,一 是区间估计。
n →∞ 1 n
ˆ 那么,称θ 为θ的渐进无偏估计(量)。
有效性和相合性
ˆ 定义8.4(有效性) 设 θ 与θˆ∗ 都是未知参数θ的无偏估 ˆ 计。如果D (θˆ∗ ) < D (θˆ) 那么称, ˆ∗ 比 θ 有效。 θ 定义8.5(相合性) 如果未知参数θ的估计量 θˆ( X 1 ,…, X n ) P 满足θˆ ⎯⎯ θ ,即对任意ε>0, →
定理8.1 设 ( X 1 ,… , X n )是取自总体X的一个样本,E ( X ) = µ 2 ,µ 和 σ 2 都未知 D( X ) = σ (ⅰ) X 是未知参数 µ 的矩估计;
2 (ⅱ) S n 是未知参数 σ 2 的矩估计, S n 是未知参数 σ 的 矩估计。
ˆ 证:(ⅰ)由于 µ = α1 ,因此,µ 的矩估计 µ = A1 = X 。
如果需要估计的未知参数 θ = g (θ1 ,… ,θ k ) 那么,称
θˆ = g (θˆ1 ,… ,θˆk )
为θ的极大似然估计。
2 例8.7 设 ( X 1 ,… , X n ) 是取自正态总体 N ( µ , σ ) 的一个样 σ 2 均未知,-∞<μ<∞, 似然函数为 本,其中,μ与
L( µ , σ ) = (2πσ )
二、极大似然估计
设( X 1 ,… , X n ) 是取自总体X的一个样本,X的密度函数 (或概率函数)为 f ( x;θ ),θ ∈Θ ,其中θ是总体参数, Θ 是参数空间。称自变量为θ,定义域为 Θ 的非负 n 函数 L(θ ; x1 ,… , xn ) ∏ f ( xi ;θ ),θ ∈Θ 为似然函数。在似然函数中把 x1 ,… , xn 视作常数,所 以似然函数可简记为 L (θ ) 。 当X为离散型随机变量时,
4 4 θ2 θ2 = D (2 X ) = 4 D ( X ) = D ( X ) = ⋅ n n 12 3n
定理8.2
设θˆ( X 1 ,…, X n )是未知参数θ的一个无偏估计,如 ˆ lim 果, D[θˆ( X 1 ,… , X n )] = 0 那么,θ 是θ的相合估计量。
n →∞
证: 由于 E (θˆ) = θ ,因此,由切比雪夫不等式推得,对任
1.d究竟取多大才比较合理? 2.这样给出的区间的可信程度如何? 从直观上想象,d越大可信程度越高,但过宽的区间是 没有实际意义的;反之,d越小,表面上区间估计相当 精确,但可信度却很低! 在抽样前,区间估计[ x − d , x + d ] 是一个随机区间,反映 区间可信度的量是这个随机区间覆盖未知数μ的概率
2
2 −n / 2
exp{−
1 2σ 2
( xi − µ ) 2 } ∑
i =1
n
例8.8 在例8.2中,似然函数为
⎧θ − n , 0 ≤ x1 ,… , xn ≤ θ ; L(θ ) = ⎨ 其余 ⎩ 0,
§8.3
估计量的评选标准
在众多估计中,我们希望挑选出最“优”的估计。这需要 一个评选标准。 ˆ ˆ 如果我们用 θ 来估计未知参数θ,那么 θ − θ 便反映了 估计的误差。通常要求 E (θˆ − θ ) = 0 ,因此有: 定义8.3 如果未知参数θ的估计量 θˆ( X 1 ,…, X n ) 满足 E[θˆ( X 1 ,… , X n )] = θ 那么就称为θ的无偏估计(量); ˆ ˆ 如果 θ 满足 lim E[θ ( X ,… , X )] = θ
lim P[| θˆ( X 1 ,… ห้องสมุดไป่ตู้ X n ) − θ |> ε ] = 0
n →∞
ˆ 那么,称θ 为θ的相合估计量(或一致估计量)。
例8.12 ( X 1 ,… , X n ) 是取自正态总体 N ( µ ,1) 的一个样本, 其中,μ未知,-∞<μ<∞,记
1 k ˆ µ k = ∑ X i , k = 1, k i =1
L(θ1 ,… ,θ k ) = ∏ f ( xi ;θ1 ,… ,θ k ),(θ1 ,… ,θ k ) ∈Θ
i =1
这是一个多元函数,称满足
L(θˆ1 ,… ,θˆk ) = max L (θ1 ,… ,θ k )
(θ1 ,…,θ k )∈Θ
ˆ ˆ 的 θ1 ,…,θ k 分别是 θ1 ,… ,θ k 的极大似然估计。
其中λ未知,λ>0。由于 1 = E ( X ) = λ ,因此 λ = α1 α 的矩估计为 X 。
设一升水中含有的大肠杆菌个数 X ~ P (λ ) ,其中λ未知, 例8.1(续 ) λ>0。为了检查水消毒设备的效果,从消毒后的水中随机 地抽取了50次,每次1升。化验得到每升水中大肠杆菌个数 如表8.1所示,试估计平均每升水中大肠杆菌个数?
大肠杆菌个数/L 出现的次数
0 17
1 20
2 10
3 2
4 1
X 例8.2 设 ( X 1 ,… , X n ) 是取自总体X的一个样本, ~ R (0,θ ) 其中θ未知,θ>0.由于,
α1 = E ( X ) = θ
2
θ 因此, = 2α1 的矩估计为 2 X
例8.3 ( X 1 ,… , X n ) 是取自总体X的一个样本,X的密度函 数为 ⎧(θ + 1) xθ , 0 < x < 1; f ( x) = ⎨ 其余 ⎩ 0, 其中,θ未知,θ>-1。求θ矩估计?
第八章 参数估计
§8.1 §8.2 §8.3 §8.4 §8.5 §8.6 参数估计问题 两种常用的点估计(矩估计和极大似然估计) 估计量的评选标准 置信区间 正态总体下未知参数的置信区间 0-1分布中未知概率的置信区间
第八章 参数估计
根据样本所提供的信息对总体分布的某些未知值作统计 推断是数理统计的基本内容。这在现代市场调查以及公 司决策中发挥了很大的作用,同学们可以自己查找相关 资料详细了解。统计推断的形式主要有两大类——估计 与检验。本章主要介绍统计方法和一些简单的估计理 论。
ˆ 意ε>0, P (| θ − θ |> ε ) ≤
D (θˆ)
ε2
ˆ p→ 于是,由D (θˆ) → 0 得到 θ ⎯⎯ θ 。
§8.4
置信区间
置信区间是区间估计中应用最广泛的一种类型。 我们先通过一个例子了解基本概念: 例8.15 为了考察某厂生产的水泥构件的抗压强度,抽取 25件样品进行测试,得到25个数据 x1 ,… , x25 ,并由此
i =1
L( xi ;θ )
∏ f ( x ;θ ) = P ( X
i =1 i
n
1
= x1 ,
, X n = xn )
当X为连续型随机变量时,
P( x1 − ε1 < X 1 ≤ x1 + ε1 ,… , xn − ε n < X n ≤ xn + ε n )
= ∏ P ( xi − ε i < X i ≤ xi + ε i ) = ∏ ∫
P ( X − d ≤ µ ≤ X + d ) = P (| X − µ |≤ d )
定义8.6 设 ( X 1 ,… , X n ) 是取自总体X的一个样本。对于未知 参数θ,给定α,0<α<1,如果存在统计量θ ( X 1 ,… , X n ) θ , ( X 1 ,… , X n ) ,使得
点估计 —— 点估计就是依据样本估计未知参数为某个值,这 在数轴上表现为一个点。 例如,要估计某未知参数θ,要求θ的点估计就是要设法 根据样本 ( X 1 ,… , X n ) 构造一个统计量 h( X 1 ,… , X n ) ,在 通过抽样获得样本观测值 ( x1 ,… , xn )之后,便用 h( x1 ,… , xn ) 的值来估计未知参数θ的值。称 h( X 1 ,… , X n ) 为θ的估 ˆ 计量,记做 θˆ( X 1 ,…, X n ) 或 θ ;称 h( x1 ,… , xn ) 为θ的 ˆ 估计值,记做 θˆ( x1 ,…, xn ) ,或也记做 θ 。不致引起误 解时,估计量和估计值都可以称为点估计。
§8.2 两种常用的点估计(矩估计和极大似然估计)
一、矩估计 当n较大时可以用频率分布(把它看作是某个随即变量 的函数)的数字特征来估计总体X相对应的数字特征。 频率分布的各阶矩恰是相应的样本矩的观测值。这种估 计方法称为矩法。 定义8.1 设 ( X 1 ,… , X n )是取自总体X的一个样本,记 α k E ( X k ), k = 1, 2, 如果未知参数 θ = ϕ (α1 ,… , α m ) ,那 么,称估计量 θˆ = ϕ ( A1 ,… , Am ) 为θ的矩估计量。
σ 2 = E ( X 2 ) − [ E ( X )]2 = α 2 − α12 ,因此, 2 的矩估 (ⅱ)由于 σ 计 n
1 ˆ σ = A2 − A = ∑ ( X i − X )2 = Sn2 n i =1
2 2 1
例8.1
设( X 1 ,… , X n ) 是取自总体X的一个样本,X ~ P (λ ) ,
区间估计—— 区间估计就是依据样本估计未知参数在某一 范围内,这在数轴上表现为一个区间。 假定要估计某个未知参数θ,要求θ的区间估计就是要设 法根据样本 ( X 1 ,… , X n ) 构造两个统计量 h1 ( X 1 ,… , X n ) , h2 ( X 1 ,… , X n ) 在通过抽样获得样本观测值 ( x1 ,… , xn ) 之 后,便用一个具体的区间 [ h1 ( X1 ,…, X n ), h2 ( X1 ,…, X n )] 来估计未知参数θ的取值范围。
1 25 算得 x = ∑ xi = 415 用点估计得观点看,415是该厂生 25 i =1
产的水泥构件的平均抗压强度的平均值。 如果从历史资料获悉,该厂水泥构件抗压强度 X ~ N ( µ , 400) 其中μ未知。现在希望通过抽样信息给出μ的一个区间 估计。一个合理的区间估计应该是 [ x − d , x + d ] ,这里就 存在两个问题:
1 n , n; 与 = ∑ X i , n i =1
k
ˆ 例8.12(续)对任意常数 c1 ,… , cn 记 µ = ∑ ci X i
i =1

ˆ E ( µ ) = ∑ ci E ( X i ) = µ ∑ ci
i =1 i =1
n
n
例8.13 设 ( X 1 ,… , X n ) 是取自正态总体 N (0, σ ) 的一个样 2 本,其中,σ 2 未知,σ > 0 。 σ 2 的极大似然估计
P (θ ( X 1 ,… , X n )) ≤ θ ≤ θ ( X 1 ,… , X n ) ≥ 1 − α
相关文档
最新文档