李沐阳论文gai

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

目录
1. 引言 (1)
2. 点估计 (1)
2.1矩法估计 (2)
2.2最大似然估计 (2)
2.3矩估计法与最大似然估计法的比较 (3)
3. 区间估计 (4)
3.1常见正态总体的参数估计 (5)
3.2.常见非正态总体参数估计 (7)
4. 点估计与区间估计的比较 (9)
结束语: (9)
参考文献: (10)
致谢 (11)
浅谈参数估计的几种方法
数学与应用数学 07404312
指导老师:李建丽
[摘要] 参数估计作为数理统计中一种很重要的估计方法,数学领域以及生活中都有很广泛的应用。

在本文将主要介绍参数估计的两种方法即点估计与区间估计以及探讨这两种方法之间的区别与联系,而求点估计的常用方法有矩估计法和最大似然估计法,点估计的这两种方法又各有异同,这也是本文将要探讨的重点内容。

[关键词] 点估计;矩法估计;最大似然估计;区间估计;
1. 引言
参数估计是数理统计中根据理论研究和实际应用需要对未知参数或未知参数的函数进行估计或者对总体的数字特征进行估计的一种方法,它在数理统计中占有极其重要的地位,目前国内外许多学者对参数估计做了一些相关的研究,比如说,段福林等人在《参数的区间估计与假设检验方法的讨论》一文中详细介绍了非正态总体参数的估计问题。

本文将主要介绍参数估计的几种方法,即点估计与区间估计以及探讨这两种方法的区别与联系。

重点与难点是对参数估计的几种方法的理解以及对各种方法联系与区别的把握。

通过本文对参数估计几种方法的介绍、整理,有助于人们对参数估计有一个更好的理解。

2. 点估计
点估计问题就是要构造一个适当的统计量∧
θ()n X X X ,,,21 ,用它的观察值来

θ()n x x x ,,,21 来估计未知参数θ。

定义 设()n X X X ,,,21 为取自总体X 的样本,
()n θθθ,,,21 为总体分布中的未知参数,若构造统计量()n X X X ,,,211 ∧θ, ,()n l X X X ,,,21 ∧
θ 对于抽样实施后的样本观测值()n x x x ,,,21 ,将统计量的观测值∧
1θ()n x x x ,,2,1 , ,∧
l θ()n x x x ,,,21 作为未
知参数l θθ,,1 的估计,则称∧1θ()n x x x ,,2,1 , ,∧
l θ()n x x x ,,,21 为()n θθθ,,,21 的点估计值;而称统计量∧
1θ()n X X X ,,,21 ,...,()n l X X X ,,,21 ∧
θ为θθ,,1 的点估计量,这种对总体分布中未知参数进行定值的估计,这叫做参数的点估计。

2.1 矩法估计
矩法估计的基本思想是替换原则,即用样本矩替换总体矩,用样本矩的函数替换总体矩的函数。

矩估计法就是以样本矩作为相应总体矩的估计量,以样本矩函数作为相应总体矩函数的估计量,从而确定待估参数的方法。

定义 设X 的分布中含有未知参数m θθ,,1 。

假定总体X 的k 阶矩
()
()m k k g X E θθθ,,,21 = 存在
()
m k ,,2,1 = ,令()k
n
i i m k X n g ∑==1
211,,,θθθ
()m k ,,2,1 =,解得()n k k X X X ,,,21 ∧
=θθ ()m k ,,2,1 = ,分别取 m ∧


θθθ,,,21 作为
m θθ,,1 的估计量。

这种球估计量的方法叫矩估计法,所得估计量叫矩估计量。

2.2 最大似然估计
定义 若总体X 分布形式已知,但含未知参数l θθθ,,,21 ,n x x x ,,,21 是总体X 的一个样本观察值,若在l θθθ,,,21 的取值范围内确定l ∧
∧∧θθθ,,,21 ,使似然函数L (l θθθ,,,21 ;n
x x x ,,,21 )
L (l θθθ,,,21 ;n x x x ,,,21 )=L
m ax (l ∧


θθθ,,,21 ;n x x x ,,,21 ),则称i ∧
θ(n x x x ,,,21 )为参数i θ的最大似然估计值,其相应的统计量i ∧
θ()n X X X ,,,21 称为i θ的最大似然估计量,简记为MLE 。

这种确定未知参数的方法称为最大似然估计法。

最大似然估计法求估计量得步骤:
1.构造似然函数L ()l θθθ,,,21 =()∏=n
i i x f 1;θ;(()θ;i x f 为概率函数)(概率函数()θ;i x f :
当总体是离散型时为事件的概率;当总体是连续型时为密度函数值。

);
2.求∧
θ,使得L ()θθθL L H
∈∧
=⎪⎭⎫
⎝⎛sup ,∧θ为θ的极大似然估计;
1)取对数L ln ()l θθθ,,,21 =()∑n
i x f 1
;ln θ;
2)令
()s j L j
s ,,2,1,0,,ln 1 ==∂∂θθθ;
3)解上式得驻点,检验各驻点是否为最大值,若是,则该驻点为所求;
最大似然估计不具备唯一性:求参数的最大似然估计,按定义实际上是依据样本观察值
n
x x x ,...,,21 构造出似然函数式,再求出使似然函数达到最大值的参数θ的值,而使
函数值达到最大值的点有时不止一个,如取常数值的函数,因此参数的最大似然估计不具备唯一性。

最大似然估计不一定存在:最大似然估计就是求似然函数的极大值点,似然函数是样本的联合分布密度,似然方程是似然函数的导函数为零的函数。

导函数为零的点只是函数的驻点,而驻点未必是函数的极大值点,所以似然方程的解未必是最大似然估计也即最大似然估计不一定存在。

因此通过解似然方程的方法求最大似然估计时,需要验证似然方程的解是否是似然函数的极大值点。

因此最大似然估计不一定存在。

最大似然估计的性质:不变性
如果∧
θ是θ的最大似然估计,函数g 有单值反函数,则)(∧
θg 是)(θg 的最大似然估计。

2.3 矩估计法与最大似然估计法的比较
矩法估计原理简单、使用方便,使用时可以不知母体的分布,而且具有一定的优良性质(如矩估计-
ξ为Eξ的一致最小方差无偏估计),因此在实际问题,特别是在教育统计问题中被广泛使用。

但在寻找参数的矩法估计量时,对母体原点矩不存在的分布如柯西分布等不能用,另一方面它只涉及母体的一些数字特征,并未用到母体的分布,因此矩法估计量实际上只集中了母体的部分信息,这样它在体现母体分布特征上往往性质较差,只有在样本容量较大时,才能保障它的优良性,因而理论上讲,矩法估计是以大样本为应用对象的。

一般估计法与最大似然估计法所得结果不一定完全一致。

矩估计法比较直观,简便,不必解似然方程(组),但当样本容量较大时,所得估计值的精度一般不太高,而极大似然估计法理论上比较优良,使用范围比较广泛,只要样本容量足够大,极大似然估计和未知参数的真值可以相差任意小,另外,极大似然估计具有不变性。

即若∧
θ为总体X
分布中参数θ的极大似然估计,而θ的函数()θu u =具有单值反函数()u θθ=,则⎪


⎝⎛=∧∧
θu u 便是()θu 的极大似然估计,这一点矩估计一般不具备。

但是极大似然估计要写出似然函数与解似然方程(组),这一点往往比较困难。

矩估计是法是用样本矩估计相应的总体矩,因此,当总体矩不存在时就不能用此方法。

例如,若总体X 的概率密度为()[]
2
)
(11
,θπθ-+=x x f ,+∞<<∞-θ,则不能用矩估计法来估计θ,因为X 的各阶矩都不存在。

用矩估计法估计同一参数,估计可能不唯一。

例如,设总体X 服从()λπ,用矩估计法来估计λ,设n X X X ,,,21 为取自X 的一
个样本,可令()∑==n
i i X n X E 1
1。

因为()λ=X E ,所以得到一个λ的矩估计为:∑=∧
=n
i i X n 1

另外令()
∑==n i i X n X E 1
22
1 又因为()()
()X E X E X D 22-==λ
所以又得λ的一个矩估计为:2
12
111⎪⎭

⎝⎛-=∑∑==∧
n i i n i i X n X n λ
但是前一矩估计是λ的一致无偏估计,而后者不是。

3. 区间估计
由于未知参数θ的估计量()n X X X ,,,21 ∧
∧=θθ是样本()n X X X ,,,21 的函数,它是一个随机变量,在由具体的样本观测值()n x x x ,,,21 处求得θ的点估计值
()n x x x ,,,21 ∧
∧=θθ 时,肯定有波动,于是人们自然希望了解这种估计的波动范围及其可
信度,这就是区间估计 。

定义 设总体X 的概率分布中含未知参数θ,如果对于给定的()1,0∈α,存在统计
量L ∧
θ=L ∧
θ()n x x x ,,,21 与U ∧
θ=U ∧
θ()n x x x ,,,21 ,使得对一切θ有αθθθ-≥⎪⎭

⎝⎛≤≤∧
∧1U L P 。

则称[U L ∧∧θθ,]为参数的置信水平为1-α置信区间,L ∧
θ,U ∧
θ分别称为θ的置信下限与置信
上限。

称p θ
inf ⎪⎭

⎝⎛≤≤∧
∧U L θθθ为[U L ∧∧θθ,]的置信系数,当这个下确界恰好是1-α时,称1-α
为[U L ∧

θθ,]的置信系数,求未知参数的置信区间就是对未知参数进行区间估计。

在这里要求θ以很大的可能被包含在区间[U L ∧

θθ,]内,就是说概率⎪⎭

⎝⎛≤≤∧
∧U L P θθθ要尽可
能大,即要求估计尽量可靠;估计的精度要尽可能的高,如要求区间长度U ∧θ-L ∧
θ尽可能短或能体现该要求的其他准则。

3.1 常见正态总体的参数估计 1. 单正态总体均值的置信区间
设总体),,(~2
σμN X 其中2
σ已知, 而μ为未知参数, n X X X ,,,21 是取自总体X 的
一个样本. 对给定的置信水平α-1, 由上节例1已经得到μ的置信区间
,,2/2/⎪⎭⎫ ⎝

⋅+⋅-n u X n u X σσαα
2. 单正态总体均值的置信区间
设总体),,(~2
σμN X 其中μ,2σ未知, n X X X ,,,21 是取自总体X 的一个样本. 此时可用2σ的无偏估计2S 代替2
σ, 构造统计量
n S X T /μ-=
,
由).
1(~/--=
n t n S X T μ
对给定的置信水平α-1, 由
α
μαα-=⎭⎬⎫⎩⎨⎧-<-<--1)1(/)1(2/2/n t n S X n t P ,
即 ,
1)1()1(2/2/αμαα-=⎭⎬⎫
⎩⎨⎧⋅-+<<⋅--n S n t X n S n t X P
因此, 均值μ的α-1置信区间为
.
)1(,)1(2/2/⎪⎪⎭⎫ ⎝⎛⋅-+⋅--n S n t X n S n t X αα
3. 单正态总体方差的置信区间
上面给出了总体均值μ的区间估计,在实际问题中要考虑精度或稳定性时,需要对
正态总体的方差2
σ进行区间估计.
设总体),,(~2σμN X 其中μ,2
σ未知,n X X X ,,,21 是取自总体X 的一个样本. 求方差
2σ的置信度为α-1的置信区间. 2σ的无偏估计为2S , 从第五章第三节的定理知,
)1(~122
2
--n S n χσ
对给定的置信水平α-1, 由
,1)1()1()1()1(,1)1(1)1(22/122
22/22
2
/2222/1αχσχαχσχαααα-=⎪⎭
⎪⎬⎫⎪⎩⎪⎨⎧--<<---=⎭
⎬⎫⎩⎨⎧-<-<---n S n n S n P n S n n P
于是方差2
σ的α-1置信区间为

⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(22/1222/2n S n n S n ααχχ
而方差σ的α-1置信区间
.)1()1(,)1()1(2
2/1222/2
⎪⎪⎭⎫ ⎝⎛-----n S n n S n ααχχ
4. 双正态总体均值差的置信区间
在实际问题中,往往要知道两个正态总体均值之间或方差之间是否有差异,从而要研究两个正态总体的均值差或者方差比的置信区间。

设X 是总体),(2
11σμN 的容量为1n 的样本均值, Y 是总体),(2
22σμN 的容量为2n 的样本
均值, 且两总体相互独立, 其中2
221,σσ已知.
因X 与Y 分别是1μ与2μ的无偏估计, 从第五章第三节的定理知
),
1,0(~//)
()(2
2
2
12121N n n Y X σσμμ+---
对给定的置信水平α-1, 由
,
1//)()(2/22212121ασσμμα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<+---u n n Y X P
可导出21μμ-的置信度为α-1的置信区间为
.,2221212/2221212/⎪
⎪⎭⎫ ⎝⎛+⋅+-+⋅--n n u Y X n n u Y X σσσσαα
5. 双正态总体均值差的置信区间
设X 是总体),(21σμN 的容量为1n 的样本均值, Y 是总体
),(2
2σμN 的容量为2n 的样本均值, 且两总体相互独立, 其中1μ,2μ及σ未知.又由
).
2(~/1/1)()(212
121-++---=
n n t n n S Y X T w μμ
其中
.
21212
2212212112
S n n n S n n n S w -+-+-+-=
对给定的置信水平α-1, 根据t 分布的对称性, 由 ,1)}2(|{|212/αα-=-+<n n t T P
可导出21μμ-的α-1置信区间为
.11))2()(,11))2()(21212/21212/⎪⎪⎭⎫+⋅-++- ⎝⎛+⋅-+--n n S n n t Y X n n S n n t Y X w w αα
6. 双正态总体方差比的置信区间
设21S 是总体),(211σμN 的容量为1n 的样本方差, 22S 是总体),(2
22σμN 的容量为2n 的样本方差, 且两总体相互独立, 其中2
22211,,,σμσμ未知. 21S 与22S 分别是21σ与22σ的无偏估
计, 从第五章第三节的定理知
),
1,1(~2122
2
12
12--⎪⎪⎭⎫ ⎝⎛=n n F S S F σσ
对给定的置信水平α-1, 由
,1)}1,1()1,1({212/212/1ααα-=--<<---n n F F n n F P ,1)1,1(1)1,1(12221212/12221222121
2/ασσαα-=⎭⎬⎫⎩⎨⎧⋅--<<⋅---S S n n F S S n n F P
可导出方差比2
221/σσ的α-1置信区间为
.)1,1(1,)1,1(12221212/1222121
2/⎪⎪⎭⎫ ⎝⎛⋅--⋅---S S n n F S S n n F αα
3.2. 常见非正态总体参数估计
对于非正态总体参数区间估计的问题,一般指出,在样本容量足够大的情况下,根据中心极限定理,非正态总体的抽样分布与正态总体的抽样分布差异较小,因此在大样本情况下,可以把非正态总体问题转化为正态总体问题。

1. 指数分布参数的区间估计
设总体服从指数分布,密度函数为()⎩⎨
⎧≤>=-0
0x x e x f x
λλ,其中()0>λλ未知,
n X X X ,...,,21是来自总体X 的样本,
n
x x x ,...,,21是样本观测值,求λ的1-α置信区间。

解:由于-x
1
是λ的一个点估计,因此λ的置信区间可以通过-
x 而依赖于样本,注意到2-
x
λ
的概率密度为()⎪⎩⎪
⎨⎧≤>=-0
0212y y e
y g y
;它与λ无关,且正好是()22x 的密度函数。

又根据2x 分布的可加性,2--
x n λ()n x 22
,可见-
x n λ2符合枢轴量的条件,故取枢轴量=T -
x n λ2。

对给定的正数α有:
()()⎭
⎬⎫⎩⎨⎧≤≤--n x x n x p n 2222
2221ααλ=α-1 (1)
其中()n x
22
2

-
和()n x 222
α是()n x 22分布的α分位点。

由(1)式得()()αλαα-=⎪⎭

⎬⎫⎪⎩⎪⎨⎧≤≤---122222
2221x n n x x n n x p
于是λ的α-1置信区间为()()⎥⎥⎥⎦

⎢⎢⎢⎣⎡---x n n x x
n n x 22,2222
221αα
2. 泊松分布总体参数的近似区间估计
设总体X 服从泊松分布()λp ,其中λ未知()0>λ,n X X X ,,,21 是来自总体X 的样本,样本观测值为n x x x ,,,21 ,求λ的α-1置信区间。

因n X X X ,,,21 相互独立都服从同一分布,且()()λλ==i i X D X E ,()n i ,,2,1 =根据独立
同分布中心极限定理和分位点定义,当n 比较大时,αλ
λ-≈⎪⎪⎭

⎪⎬⎫
⎪⎪⎩

⎪⎨⎧
≤⎪⎭⎫
⎝⎛-≤
--12/2/a a z
x n z p ,于是λ近似的α-1置信区间的上下限为:
2
4222
2
2/2/12---
∧-⎪⎭⎫ ⎝⎛+±+=x n z x n z x a a λ
3. 几何分布总体参数的近似区间估计 引理1 对常数n a ->,p 的方程a p
x n
p
=---
11
在()1,0内有唯一正根。

引理 2 当n a <<0时,关于p 的方程a p x n
p
=---11
和a p
x n p -=---
11的两根为12p 2
2
2
2
4
22442---
-
+-±-=
x
n a x n a x n a a x n 。

由引理1,2可知,几何分布()p G 中参数p 的置信水平为α-1的近似区间估计
[,
24422
2
2
2
4
2---
-
+---x
n a
x n a x n a a x n 2
2
2
2
4
22442---
-
+-+-x
n a x n a x n a a x n ]
4. 点估计与区间估计的比较
参数估计是用极大似然估计或矩估计等方法求得参数θ的估计量()n X X X ,,,21 ∧
θ之后,将样本观察值n x x x ,,,21 代入得一数值()n x x x ,,,21 ∧
θ,然后用这个数值去猜θ的
真值。

显然参数点估计回答的问题是未知参数“等于什么”的问题。

它能给人们一个明确的数值。

因而在实际中,常常使用点估计对客观事物作出判断。

然而“猜”是容易犯错误的。

猜的精度如何,可靠性有多大?点估计本身并没有告诉我们,这正是点估计的不足之处。

参数的区间估计是用两个统计量()n X X X ,,,211 ∧θ,()n X X X ,,,212 ∧θ(∧
∧<21θθ) 构成一个随机区间(∧
∧21,θθ)去套未知数θ的真值。

如果进行N 次随机抽样,每次得到样本点为()nk k k χχχ,,,21 ,N k ,,2,1 =,相应得到N 个区间(∧

k k 21,θθ)
N k ,,2,1 =。

这N 个区间中,有的套用了θ的真值,有的没有套用住,区间估计告诉我们,在置信度为α-1的情况下套住θ真值的区间大约有()N α-1个。

这里置信区间的长度表示了估计结果的精度,而置信度则表示这一结果的可信度。

结束语:
参数估计的方法主要有点估计和区间估计,通过以上对参数估计方法的探讨,我们可以根据不同的情况可以采取不同的方法,点估计是利用样本数据对未知参数进行估计得到的是一个具体的数据而区间估计是通过样本数据估计未知参数在置信度下的最可能的存在区间得到的结果是一个区间,当总体参数不清楚时,用一个特定值,一般常用
样本统计量,进行估计,这类问题就用点估计。

区间估计是用数轴上的一段距离表示未知参数可能落入的范围,它虽不具体指出总体参数等于什么,但能指出总体的未知参数落入某一区间的概率有多大。

上文虽然对参数估计的方法进行了比较系统的总结但是还有待进一步研究。

参考文献:
[ 1 ] 肖果能唐立陈亚利杨文胜.概率论与数理统计[ M] .湖南科学技术出版社, 2002.
[ 2 ] 戴朝寿.数理统计简明教程[ M] .北京: 高等教育出版社, 2004.
[ 3 ] 范正森童仕宽.概率统计方法与应用[ M] .科学出版社,2001.
[ 4]汪荣鑫.数理统计[ M].西安交通大学出版社,1986.
[5 ] 段福林徐健.参数的区间估计与假设检验方法的讨论[J].上饶师范学院学
报,2008,06:8-11.
[6] 黄杏模.谈谈点估计与区间估计[J].南京林校,1994-2010,4-8
[ 7 ] 杨海岳.参数估计中几个问题的分析[J].承德民族师专学报, 1996,02:25-27.
[ 8] 邹小云.极大似然估计的性质探讨[J].湖北职业技术学院学报,2007,06:94-97.
[ 9 ]冯翠莲. 常用点估计的方法及比较[J] . 经济管理与干部教育,1997,45-52 .
[ 9 ] 夏慧异唐梅. 参数估计方法的比较[J] . 安庆师范学院学报,2008,05;80-88.
Discusses several methods of parameter estimate
Fundamental and Applied Mathematics No. 07404312 Li mu yang
Tutor: lijianli
parameter estimation as an important mathematical statistics, mathematics estimating method and life are very widely. In this paper, we introduce the two parameters estimation method, the point estimation and interval estimation and explore the two methods, the differences and relations between the point estimation for commonly used method have moment estimators method and the maximum likelihood estimation method, the point estimation and the two methods has similarities and differences, this is also the paper will explore the key content.
致谢
四年的读书生活在这个季节即将划上一个句号,而对于我的人生却只是一个逗号,我将面临又一次征程的开始。

在师长、亲友的大力支持下,四年的求学生涯走得辛苦却也收获满囊,在论文即将付梓之际,思绪万千,心情久久不能平静。

伟人、名人为我所崇拜,可是我更急切地要把我的敬意和赞美献给一位平凡的老师,我的指导老师——李建丽老师。

您治学严谨,学识渊博,思想深邃,视野雄阔,为我营造了一种良好的精神氛围。

授人以鱼不如授人以渔,置身其间,耳濡目染,潜移默化,使我不仅接受了全新的思想观念,树立了宏伟的学术目标,领会了基本的思考方式,从论文题目的选定到论文写作的指导,经由您悉心的点拨,再经思考后的领悟,常常让我“山重水复疑无路,柳暗花明又一村”。

我要感谢我的父母,焉得谖草,言树之背,养育之恩,无以回报,你们永远健康快乐是我最大的心愿。

在论文即将完成之际,我的心情无法平静,从开始进入课题到论文的顺利完成,有多少可敬的师长、同学、朋友给了我无言的帮助,在这里请接受我诚挚的谢意!
同时也感谢学院为我提供良好的做毕业论文的环境。

最后再一次感谢所有在毕业论文中曾经帮助过我的良师益友和同学,以及在论文中被我引用或参考的论著的作者。

李沐阳
2011.05.12。

相关文档
最新文档