第六章参数估计

合集下载

第六章参数估计

第六章参数估计

113第六章 参数估计一、 知识点1. 点估计的基本概念2. 点估计的常用方法(1) 矩估计法① 基本思想:以样本矩作为相应的总体矩的估计,以样本矩的函数作为相应的总体矩的同一函数的估计。

(2) 极大似然估计法设总体X 的分布形式已知,其中),,,(21k θθθθΛ=为未知参数,),,(21n X X X Λ为简单随机样本,相应的),,,(21n x x x Λ为它的一组观测值.极大似然估计法的步骤如下:① 按总体X 的分布律或概率密度写出似然函数∏==ni i n x p x x x L 121);();,,,(θθΛ (离散型)∏==ni i n x f x x x L 121);();,,,(θθΛ (连续型)若有),,,(ˆ21nx x x Λθ使得);,,,(max )ˆ;,,,(2121θθθn n x x x L x x x L ΛΛΘ∈=,则称这个θˆ为参数θ的极大似然估计值。

称统计量),,,(ˆ21nX X X Λθ为参数θ的极大似然估计量。

② 通常似然函数是l θ的可微函数,利用高等数学知识在k θθθ,,,21Λ可能的取值范围内求出参数的极大似然估计k l x x x nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 将i x 换成i X 得到相应的极大似然估计量k l X X X nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 注:当);,,,(21θn x x x L Λ不可微时,求似然函数的最大值要从定义出发。

3. 估计量的评选标准(1) 无偏性:设),,(ˆˆ21nX X X Λθθ=是参数θ的估计量,如果θθ=)ˆ(E ,则称θˆ为θ的无偏估计量。

(2) 有效性:设1ˆθ,2ˆθ是θ的两个无偏估计,如果)ˆ()ˆ(21θθD D ≤,则称1ˆθ较2ˆθ更有效。

4. 区间估计114 (1) 定义 设总体X 的分布函数族为{}Θ∈θθ),;(x F .对于给定值)10(<<αα,如果有两个统计量),,(ˆˆ111n X X Λθθ=和),,(ˆˆ122n X X Λθθ=,使得{}αθθθ-≥<<1ˆˆ21P 对一切Θ∈θ成立,则称随机区间)ˆ,ˆ(21θθ是θ的双侧α-1置信区间,称α-1为置信度;分别称1ˆθ和2ˆθ为双侧置信下限和双侧置信上限. (2) 单侧置信区间(3) 一个正态总体下未知参数的双侧置信区间(置信度为α-1)二、 习题 1. 选择题(1) 设n X X X ,,,21Λ是来自总体X 的一个样本,则以下统计量①)(211n X X + ②)2(14321n X X X X X n ++++-Λ ③)2332(101121n n X X X X +++-作为总体均值μ的估计量,其中是μ的无偏估计的个数是A.0B.1C.2D.3(2) 设321,,X X X 是来自正态总体)1,(μN 的样本,现有μ的三个无偏估计量321332123211216131ˆ;1254131ˆ;2110351ˆX X X X X X X X X ++=++=++=μμμ其中方差最小的估计量是A.1ˆμB.2ˆμC. 3ˆμD.以上都不是 (3) 设0,1,0,1,1为来自0-1分布总体B(1,p)的样本观察值,则p 的矩估计值为 。

第六章 参数估计

第六章  参数估计

总体均值 在置信度 下的置信区间为: 55000 x z 135000 1 . 96 113440 , 156560 • = 。 n 25 • 即在95%的概率可靠程度下,此次抽样得该地区 企业总经理的年平均收入的置信区间为 (113440,156560)
2
第二节 区间估计
第二节 区间估计
• 点估计的优点是简洁明了,给出了具体的估 计值;缺点是无法提供估计量的精度和概率可靠 程度,这便是区间估计解决的问题。
以下我们从一个实际问题的解决,了解 区间估计的概念。
第二节 区间估计
• 【例6-3】 已知某企业生产的灯管寿命服从 正态分布,现从一大批灯管中随机抽取 n=16只,分别测得寿命(单位:小时)如 下:
• 3510 3450 3480 3460 3520 3496 3490 3460 • 3464 3526 3530 3470 3516 3520 3494 3470
• 在概率可靠程度1-α=95%下,求这批灯管平 均寿命 的区间估计。
第二节 区间估计
• 该例是总体服从正态分布,总体方差未知 ,小样本的情况。 • 此时,可算得总体均值点估计量 x ,样本 标准差s, x t ~ t (n 1) • 对 x 进行标准化,即 ,对于概 s n 率可靠程度 1 ,有: • P t t 2 (n 1) 1 (6.1)
2
n
16
• 即在概率可靠程度95%下,此次抽样得该批灯管 平均寿命的区间估计为(3476.8, 3503.2)小时 之间。
第二节 区间估计
• 一 、区间估计的概念
从例6-3可看出,区间估计就是总体参数θ落 在区间估计量 (ˆ ,ˆ ) 内的概率为1-α,即 ˆ ˆ 1 。称区间 (ˆ ,ˆ ) 为总体参数 P 1 2 θ的置信度为 1 的置信区间。

第六章 参数值的估计

第六章 参数值的估计
均值的间距估计
百分率的间距估计
第三节 决定样本的大小
决定样本大小的准则
在能够付出的研究代价限度内,选取最大的样本量 我们愿意容忍多少错误?(正比) 所研究的个案间的相互差异的大小,即标准差大小 (反比)
样本大小计算公式
S为总体保准差 e为允许的估测错误
置信水平/可信度
总体参数落在一既定置信区间的估测概率 如,我们可以说“有95%的样本会落在40-60%之间”
置信区间/可信间距
估测总体参数值的范围,如前面说的40-60%
置信区间与置信水平
当置信区间扩大时,置信水平将会相应增加
第二节 间距估计: 均值、百分率、积距相关
第六章 参数值的估计
第一节 点值估计与间距估计
点值估计
即根据样本统计值来直接估测总体参数取值 通常不采用,因无法知道正确或错误的概率
间距估计
就是以两个数值之间的间距来估计参数值 间距大小,取决于我们在估计时所要求的可信程度 在样本大小一定的情况下,要求的可信度越大,则间 距就会越大

第六章 参数估计

第六章 参数估计

第六章 参数估计§6.1 点估计的几种方法6.1.1 替换原理和矩法估计 一、矩法估计替换原理:(1)用样本矩去替换总体矩,这里的矩可以是原点矩也可以是中心矩;(2)用样本矩的函数去替换相应的总体矩的函数。

举例二、概率函数);(θx p 已知时未知参数的矩法估计设总体具有已知的概率函数),,;(1k x p θθ ,∈),,(1k θθ Θ是未知参数或参数向量,n x x x ,,21 是样本,假定总体的k 阶原点矩k μ存在,则对所有j ,,0k j <<j μ都存在,若假设k θθ,,1 能够表示成k μμ,,1 的函数),,(1k j j μμθθ =,则可给出诸j θ的矩法估计:k j a a kj j ,1),,,(ˆ1==θθ 其中k a a ,,1 是前k 个样本原点矩:∑==n i ji j x n a 11,进一步,如果要估计k θθ,,1 的函数),(1k g θθη =,则可直接得到η的矩法估计)ˆ,ˆ(ˆ1kg θθη=。

例1 设总体为指数分布,其密度函数为x e x p λλλ-=);(,0>xn x x x ,,21 是样本,此处1=k ,由于λ/1=EX ,亦即EX /1=λ,故λ的矩法估计为x /1ˆ=λ另外,由于2/1)(λ=X Var ,其反函数为)(/1X Var =λ,因此,从替换原理来看,λ的矩法估计也可取为s /1ˆ1=λ, s 样本标准差。

这说明矩估计可能是不唯一的,这是矩法估计的一个缺点,此时通常应该尽量采用低阶矩给出未知参数的估计。

例2设n x x x ,,21 是来自),(b a 上的均匀分布的样本,a 与b 均是未知参数,这里2=k 其密度函数为⎪⎩⎪⎨⎧≤≤-=0,1),;(bx a a b b a x p ,求a ,b 的矩估计.解 由2)(121)(,2)(a b X D b a X E -=+= 得方程组:⎪⎪⎩⎪⎪⎨⎧-==-=+∑=n i i X X n X V a r a b X b a 122.)(1)()(121,2解此方程组,得到矩估计量: .)(3ˆ , )(3ˆX Var X b X Var X a+=-= 6.1.2最大似然估计定义6.1.1 设总体的概率函数为);(θx p ,Θ∈θ,其中θ是一个未知参数或几个未知参数组成的参数向量,Θ是参数θ可能取值的参数空间,n x x x ,,21 是来自该总体的样本,将样本的联合概率函数看成θ的函数,用),,;(21n x x x L θ表示,简记为)(θL ,);();();(),,;()(2121θθθθθn n x p x p x p x x x L L ==)(θL 称为样本的似然函数。

西北工业大学《概率论与数理统计》课件-第六章 参数估计

西北工业大学《概率论与数理统计》课件-第六章 参数估计
最大概率的思想就是最大似然法的基本思想 .
(2) 似然函数
定义6.1 设总体X的分布密度(或分布律)为 p(x; ), 其中 (1, 2, ,m )为未知参数. 又设
( x1, x2,, xn ) 为自总体X的样本(X1,X2,…,Xn) 的一 个观察值,则称样本的联合分布
n
L( ) p(x1, x2, … , xn; ) p( xi; )
2º似然估计方程组与最大似然估计之间没有必 然
从中解得 pˆ k n
参数 p的估计值
这时, 对一切 0< p <1, 均有
P{Y k; pˆ } P{Y k; p}
综上所述: 设某试验的可能结果为: A1, A2 , ···, Ai , ···
若在一次试验中,某结果 Ai 出现,则应选择参 数使Ai 出现的概率最大.
以上这种选择一个参数使得实验结果具有
(k 1,2,, m)
(4) 求最大似然估计(MLE)的步骤:
1 写出似然函数
(1, 2 , ,m )
n
L( ) L( x1, x2,, xn; ) p( xi; )
n
i 1
2 取对数 ln L( ) ln p( xi; )
i 1
3 解似然方程(组)
ln L

ln L
2
为来自总体X的简单随机样本. 矩估计法的具体步骤:
1 求出k E( X k ) (1,2,,m ), k 1,2,,m;
2 要求k Ak , k 1,2,, m
这是一个包含 m个未知参数1,2 ,,m的方程组.
3 解出其中1,2,,m , 用ˆ1,ˆ2,,ˆm表示.
4 用方程组的解ˆ1, ˆ2 , ,ˆm 分别作为 1,2 ,,m的估计量,这个估计量称为

第六章 时间序列分析-参数估计

第六章 时间序列分析-参数估计
3
例:求MA(1)模型系数的矩估计
MA(1)模型 方程 xt t 1 t 1
0 (1 12 ) 2 1 1 1 2 矩估计 0 1 12 1 1
ˆ 1 1 4 12 ˆ1 ˆ 2 1
f X1 , X 2 , X3 x1 , x2 , x3 ; , 2 f X1 , X 2 x1 , x2 ; , 2 f X3 X 2 , X1 x3 x2 , x1 ; , 2
24
极大似然估计
一般地,样本中第 t 个 X t 在前 t-1 个已知的条件下,由于模 型的特点,实际上前 t-1 个 X t 1 ,, X1 只有 X t 1 作用于 X t ,因此 有
ˆ 其中 k y
ˆˆ ˆ
i 0 j 0 i
p
p
j i j k
, k 0,1,, q
13
对矩估计的评价
优点
估计思想简单直观 不需要假设总体分布 计算量小(低阶模型场合)
缺点
信息浪费严重 只用到了p+q个样本自相关系数信息,其他信息都被忽
15
极大似然估计
本节将要讨论的是根据极大似然原理,给出模型参数 1 ,, p ,
1 ,,q 和白噪声方差 2 的极大似然估计。为此,首先需要给定样本
x1,, xT 的联合分布,
F x1,, xT ; θ
θ 1 , , p , 1 , , q , 2 。 其中
3. ARMA模型的矩估计 第一步,先给出AR部分的参数 估计。
1 ,, p
的矩
q1 q 12 q p 1 p q 1 q 1 1 q 2 q p 2 p q 2 q p 11 q p 22 q p q p

第6章 参数估计

第6章 参数估计
P( ˆ )
较 的样本容量
θ
B A
较 的样本容量
θ
ˆ θ
一致性: 一致性:
随着样本容量增大, 随着样本容量增大,估计量会越来越接近被估计 的参数。 的参数。即对任意的
→∞→ n
ε >0
,有
ˆ lim P{| θ −θ |< ε} =1
则称 θ 是参数θ的一致估计量。 ˆ 是参数θ的一致估计量。
X
µ -1.96 σx
+1.96σ µ +1.96σx
90%的样本 90%的样本 95% 的样本 99% 的样本
置信水平
1. 将构造置信区间的步骤重复很多次,置信 将构造置信区间的步骤重复很多次, 区间包含总体参数真值的次数所占的比例 称为置信水平. 称为置信水平. 2. 表示为 1 - a 是总体参数未在区间内的比例 3. a是总体参数未在区间内的比例 是总体参数未在区间内的比例 常用的置信水平值有 99%,
• 如某班级平均分数在75~85之间,置信水平是95% 如某班级平均分数在75~85之间,置信水平是95% 75 之间 95
5.1.3. 评价估计量的标准
1.无偏性: 无偏性:
ˆ ˆ 如果 E(θ ) =θ ,即估计量 θ 的数学 期望等于被估计的总体参数, 期望等于被估计的总体参数,我们称估计量
(35)4 35) (45)4.5 45) (55)5 55)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数. 估计的总体参数 .
ˆ P(θ)
偏 偏
A
B
ˆ θ
θ
样本平均数是总体平均数的无偏估 样本平均数是总体平均数的无偏估 计量。 计量。
以无偏性来评判估计量是很合理的。一 以无偏性来评判估计量是很合理的。 个好的估计量就某一个具体的估计值而言 可能不等于总体参数值, ,可能不等于总体参数值,但平均来看有 向估计的总体参数集中的趋势。 向估计的总体参数集中的趋势。

第六章参数估计基础

第六章参数估计基础
正态近似法:当n足够大时,且样本频率p不太接近0或1时,p的抽样分布接近正态分布,此时,总体概率的置信区间为p+-Zα/2 * Sp.
1总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响?
从正态分布的总体中随机抽样,样本均数呈正态分布;从非正态分布的总体中随机抽样,样本量n较小时,样本均数的分布仍呈非正态分布,当样本量n足够大时,样本均数的分布近似正态哦分布。
计算:σXbar=σ/√n.在实际应用中,总体标准差σ常常未知,需要用样本标准差S来估计。此时,均数标准误的估计值为SXbar=S/√n.由此式可见,若增加样本含量n可减小样本均数的抽样误差。
主要应用:1估计总体均数的置信区间。 2均数的假设检验。
样本频率的抽样分布和抽样误差:频率的标准误用符号σp表示,它反映了样本频率之间以及样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。
1.点估计:直接用随机样本的样本均数Xbar作为总体均数μ的估计值或用样本频率p作为总体概率π的估计值的方法称为点估计。这是一种没有考虑抽样误差的简单估计方法。
2.区间估计:用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间,,是一个开区间,这一估计可相信的程度称为置信度或置信水平。若标准差不变,置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降。
计算:σp=√(π(1-π)/n)。在实际应用中,总体概率π常常未知,需要用样本频率p来估计。因此频率标准误的估计值为Sp=√(p(1-p)/n-1)约等于 √(p(1-p)/n)。由此式可见,增加样本含量n可减小样本频率的抽样误差。
主要应用:1估计总体概率的置信区间 2频率指标的假设检验。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、极大似然估计法(Maximum
Likelihood Estimator ) 极大似然估计法的思想源于极大似然
原理。 先看一个例子,理解其中的道理。
某位同学与一位猎人一起外出打猎。 只听一声枪响,野兔应声倒下。如果 要你推测,是谁打中的呢?你会如何 想呢?
极大似然原理:如果一个随机试验E所有可能结果为 A,B,C,…,在一次试验中,出现结果A出现,则 随机试验E的条件对结果A出现更为有利,即可认为A 出现的概率最大。
点估计法称为矩估计法
2.矩估计法得一般步骤
(1)建立待估参数与总体矩的关系式;
(2)用矩估计法建立矩估计方程,解矩估计方程;
(3)写出参数的矩估计量。
例6.1 设总体X在[a , b]上服从均匀分布,其中a , b未知,
是来自X1X, 的,样Xn本 , 试求a , b的矩估计量。
解:由题设条件
μ1
值点;如行不通,就用分析的方法。
(2)由对数函数的单调性,求L(x1, x2, , xn; )最大值点, 等价与求ln L(x1, x2, , xn; )最大值点。
3.极大似然估计求解的一般步骤
(1)求似然函数L(x1, x2, , xn; ); (2)求L(x1, x2, , xn; )得最大值点ˆ; (3)ˆ角色替换获得加大似然估计量。
这就需要讨论以下几个问题: (1) 我们希望一个“好的”估计量具有什么特性? (2) 怎样决定一个估计量是否比另一个估计量“好”? (3) 如何求得合理的估计量? 因为估计量是样本的函数,是随机变量,因此,由不同的 观测结果,就会求得不同的参数估计值,因此一个好的估 计,应在多次试验中体现出优良性。 常用的几条标准是:

E

X


ab 2
μ2 E X 2 D( X ) [E( X )]2
(b a)2 (a b)2


12
4
总体矩
即有
a b

b a

2 μ1 12(
μ2

μ12
)
总体矩
a μ1 3( μ2 μ12 ) b μ1 3( μ2 μ12 )
i1
对L(x1, x2, , xn; , 2 )取对数,便有
ln L(x1, x2,
,
xn
;

,
2
)


n 2
(ln
2

ln

2
)

1
2
2
n
(xi )2
i 1
关于, 2求偏导,并令其等于零,则有
1
2
n
(
i 1
xi
n)
0
n

2 2
1
2( 2 )2
在的范围,这种估计称为区间估计。
点估计
由点估计的概念知点估计的关键是由样本出发构造总
体参数得估计量,构造估计量的方法很多,这里我们只 介绍1894年K.Pearson所提出的矩估计法和德国数学家 C.F.Gauss于1821年首次提出,1912年英国的统计学家 R.A.Fisher在一项工作中重新提出的极大似然估计法。 一、矩估计法(the method of moments Estimator )
称为似然函数。显然,这种情况下似然函数是样本
取得x1, x2 , , xn的概率密度。
2.极大似然估计法
极大似然估计法:
参数的估计值ˆ应使样本的实现x1, x2, , xn被观
测到的概率最大,即有
L(x1, x2 ,
,
xn
;ˆ)

max
L(
x1,
x2
,
, xn; )
两点说明:
(1)L(x1, x2, , xn; )可导时,用求稳定点方法求最大
例6.7设总体X ~ e(1/ ),X1, X 2, , X n为抽自总体的iid
样本,比较X 和nZ n minX1, X 2, , X n作为参数的估
计量何者更有效?
解:由例6.6知 X 和nZ是无偏估计量且 D( X ) 2
从而有
2
D(X )
n
2
D(Z) n2
fZ

z;



n

enz

z0
0
其它
从而有E Z E nZ
n
这说明X 是参数的无偏估计量。
从该例可看出:一个参数 往往不止一个无偏估计量,
如果ˆ1和ˆ2都是参数的无偏估计量,那么怎样比较
它们呢?
二、有效性
Def 设ˆ1,ˆ2为参数的无偏估计量,若ˆ1,ˆ2满足 效D(。ˆ1) D(ˆ2 ),则称ˆ1比ˆ2在估计为参数时更为有
μ2 E X 2 D( X ) [E( X )]2 σ2 μ2
解得 μ μ1 σ2 μ2 μ12
于是 μ ,σ 2 的矩估计量为
μˆ
σˆ 2


A1
A2
X
A12

1 n
n i 1
X
2 i

X2

1 n
n i 1
(Xi

样本矩 X )2
矩法的优点是简单易行,并不需要事先知道总体是什么 分布;缺点是当总体类型已知时,没有充分利用分布提供 的信息;一般场合下,矩估计量不具有唯一性。其主要原 因在于建立矩法方程时,选取那些总体矩用相应样本矩代 替带有一定的随意性。
二、参数估计的类型
点估计(Point Estimation):对于总体参数构造统计 量ˆ( X1, X 2, , X n )作为其估计量,并以估计量的实
现作为其估计值,这种估计称为点估计。
区间估计(Interval Estimation):对于总体参数构造两 个统计量ˆ1( X1, X 2 , , X n ),ˆ2 ( X1, X 2 , , X n ),以区 间[ˆ1( X1, X 2 , , X n ),ˆ2 ( X1, X 2 , , X n )]作为参数 所
1.似然函数
设总体X 概率函数为PX x px,
X1, X 2, , X n为抽自总体X的iid样本,
x1, x2, , xn为样本的一个实现,则
L(x1, x2 , , xn; )
P( X1, X 2, , X n ) (x1, x2, , xn )
n

pxi
i 1
例6.6设总体X ~ e(1/ ),X1, X2,
样本,证明X 和nZ n minX1, X2,
偏估计量。
证:总体X的概率密度为
f
x
1 Nhomakorabeaex

x0
0 其它
, Xn为抽自总体的iid
, Xn都是参数的无
从而有E X E X
又因为Z minX1, X2, , Xn的概率密度为
于是a , b的矩估计量为
a X
3 n
n i 1
(Xi

X )2
b X
3 n
n i 1
(Xi

X )2
样本矩
例6.2 设总体X的均值 μ 和方差σ 2( 0)都存在且未知, 来自X的iid样本X1, , Xn , 试求 μ , σ 2 的矩估计量。
解:由题设条件
μ1 E X μ
i 1
i 1
值的估计量何者更有效?
解:易知 X 和XW是无偏估计量
又有 D(X ) D(X )
n
n
n
而D(XW )=

2 i
D(
X
i
)

D(
X
)
i2

D(X ) n
i 1 n
n i2
i 1

1 n
D(
X
)

i 1 n
ai
i 1
2

D(X ) n
所以 D( X ) D( XW )
第六章 参数估计 参数估计的概念 点估计与估计量的评价 区间估计 常用总体参数的估计方法
数理统计
参数估计的概念
一、参数估计的概念
由样本对总体参数进行估计,这类统计推断问题为参数估计 (Parametric Estimation)。
用于对总体参数进行估计的统计量称为估计量(Statistic); 估计量的一个实现称为总体参数的估计值; 确定估计量和估计值的方法称为估计法。
称为似然函数。显然,这种情况下
似然函数是样本取得x1, x2, , xn的概率。
设总体X的概率密度函数为fX (x; ),X1, X 2,
,
X

n
抽自总体X的iid样本,则
n
L(x1, x2 , , xn; ) f (x1, x2, , xn; ) fXi (xi; ) i 1
xi
1 (n 1 p
n i 1
xi )
0
解得参数p的极大似然估计值为


1 n
n i 1
xi

x
所以,参数p的极大似然估计量为


1 n
n i 1
Xi

X
例6.4 设总体X ~ N (, 2 ),X1, X 2,
,
X
为抽自总体的
n
iid样本,x1, x2, , xn为样本的一个实现,求参数, 2的极
n
( xi
i 1
)2
0
解得参数, 2的极大似然估计值为
ˆ
相关文档
最新文档