第六章参数估计
第六章参数估计
113第六章 参数估计一、 知识点1. 点估计的基本概念2. 点估计的常用方法(1) 矩估计法① 基本思想:以样本矩作为相应的总体矩的估计,以样本矩的函数作为相应的总体矩的同一函数的估计。
(2) 极大似然估计法设总体X 的分布形式已知,其中),,,(21k θθθθΛ=为未知参数,),,(21n X X X Λ为简单随机样本,相应的),,,(21n x x x Λ为它的一组观测值.极大似然估计法的步骤如下:① 按总体X 的分布律或概率密度写出似然函数∏==ni i n x p x x x L 121);();,,,(θθΛ (离散型)∏==ni i n x f x x x L 121);();,,,(θθΛ (连续型)若有),,,(ˆ21nx x x Λθ使得);,,,(max )ˆ;,,,(2121θθθn n x x x L x x x L ΛΛΘ∈=,则称这个θˆ为参数θ的极大似然估计值。
称统计量),,,(ˆ21nX X X Λθ为参数θ的极大似然估计量。
② 通常似然函数是l θ的可微函数,利用高等数学知识在k θθθ,,,21Λ可能的取值范围内求出参数的极大似然估计k l x x x nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 将i x 换成i X 得到相应的极大似然估计量k l X X X nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 注:当);,,,(21θn x x x L Λ不可微时,求似然函数的最大值要从定义出发。
3. 估计量的评选标准(1) 无偏性:设),,(ˆˆ21nX X X Λθθ=是参数θ的估计量,如果θθ=)ˆ(E ,则称θˆ为θ的无偏估计量。
(2) 有效性:设1ˆθ,2ˆθ是θ的两个无偏估计,如果)ˆ()ˆ(21θθD D ≤,则称1ˆθ较2ˆθ更有效。
4. 区间估计114 (1) 定义 设总体X 的分布函数族为{}Θ∈θθ),;(x F .对于给定值)10(<<αα,如果有两个统计量),,(ˆˆ111n X X Λθθ=和),,(ˆˆ122n X X Λθθ=,使得{}αθθθ-≥<<1ˆˆ21P 对一切Θ∈θ成立,则称随机区间)ˆ,ˆ(21θθ是θ的双侧α-1置信区间,称α-1为置信度;分别称1ˆθ和2ˆθ为双侧置信下限和双侧置信上限. (2) 单侧置信区间(3) 一个正态总体下未知参数的双侧置信区间(置信度为α-1)二、 习题 1. 选择题(1) 设n X X X ,,,21Λ是来自总体X 的一个样本,则以下统计量①)(211n X X + ②)2(14321n X X X X X n ++++-Λ ③)2332(101121n n X X X X +++-作为总体均值μ的估计量,其中是μ的无偏估计的个数是A.0B.1C.2D.3(2) 设321,,X X X 是来自正态总体)1,(μN 的样本,现有μ的三个无偏估计量321332123211216131ˆ;1254131ˆ;2110351ˆX X X X X X X X X ++=++=++=μμμ其中方差最小的估计量是A.1ˆμB.2ˆμC. 3ˆμD.以上都不是 (3) 设0,1,0,1,1为来自0-1分布总体B(1,p)的样本观察值,则p 的矩估计值为 。
第六章 参数估计
总体均值 在置信度 下的置信区间为: 55000 x z 135000 1 . 96 113440 , 156560 • = 。 n 25 • 即在95%的概率可靠程度下,此次抽样得该地区 企业总经理的年平均收入的置信区间为 (113440,156560)
2
第二节 区间估计
第二节 区间估计
• 点估计的优点是简洁明了,给出了具体的估 计值;缺点是无法提供估计量的精度和概率可靠 程度,这便是区间估计解决的问题。
以下我们从一个实际问题的解决,了解 区间估计的概念。
第二节 区间估计
• 【例6-3】 已知某企业生产的灯管寿命服从 正态分布,现从一大批灯管中随机抽取 n=16只,分别测得寿命(单位:小时)如 下:
• 3510 3450 3480 3460 3520 3496 3490 3460 • 3464 3526 3530 3470 3516 3520 3494 3470
• 在概率可靠程度1-α=95%下,求这批灯管平 均寿命 的区间估计。
第二节 区间估计
• 该例是总体服从正态分布,总体方差未知 ,小样本的情况。 • 此时,可算得总体均值点估计量 x ,样本 标准差s, x t ~ t (n 1) • 对 x 进行标准化,即 ,对于概 s n 率可靠程度 1 ,有: • P t t 2 (n 1) 1 (6.1)
2
n
16
• 即在概率可靠程度95%下,此次抽样得该批灯管 平均寿命的区间估计为(3476.8, 3503.2)小时 之间。
第二节 区间估计
• 一 、区间估计的概念
从例6-3可看出,区间估计就是总体参数θ落 在区间估计量 (ˆ ,ˆ ) 内的概率为1-α,即 ˆ ˆ 1 。称区间 (ˆ ,ˆ ) 为总体参数 P 1 2 θ的置信度为 1 的置信区间。
第六章 参数值的估计
百分率的间距估计
第三节 决定样本的大小
决定样本大小的准则
在能够付出的研究代价限度内,选取最大的样本量 我们愿意容忍多少错误?(正比) 所研究的个案间的相互差异的大小,即标准差大小 (反比)
样本大小计算公式
S为总体保准差 e为允许的估测错误
置信水平/可信度
总体参数落在一既定置信区间的估测概率 如,我们可以说“有95%的样本会落在40-60%之间”
置信区间/可信间距
估测总体参数值的范围,如前面说的40-60%
置信区间与置信水平
当置信区间扩大时,置信水平将会相应增加
第二节 间距估计: 均值、百分率、积距相关
第六章 参数值的估计
第一节 点值估计与间距估计
点值估计
即根据样本统计值来直接估测总体参数取值 通常不采用,因无法知道正确或错误的概率
间距估计
就是以两个数值之间的间距来估计参数值 间距大小,取决于我们在估计时所要求的可信程度 在样本大小一定的情况下,要求的可信度越大,则间 距就会越大
第六章 参数估计
第六章 参数估计§6.1 点估计的几种方法6.1.1 替换原理和矩法估计 一、矩法估计替换原理:(1)用样本矩去替换总体矩,这里的矩可以是原点矩也可以是中心矩;(2)用样本矩的函数去替换相应的总体矩的函数。
举例二、概率函数);(θx p 已知时未知参数的矩法估计设总体具有已知的概率函数),,;(1k x p θθ ,∈),,(1k θθ Θ是未知参数或参数向量,n x x x ,,21 是样本,假定总体的k 阶原点矩k μ存在,则对所有j ,,0k j <<j μ都存在,若假设k θθ,,1 能够表示成k μμ,,1 的函数),,(1k j j μμθθ =,则可给出诸j θ的矩法估计:k j a a kj j ,1),,,(ˆ1==θθ 其中k a a ,,1 是前k 个样本原点矩:∑==n i ji j x n a 11,进一步,如果要估计k θθ,,1 的函数),(1k g θθη =,则可直接得到η的矩法估计)ˆ,ˆ(ˆ1kg θθη=。
例1 设总体为指数分布,其密度函数为x e x p λλλ-=);(,0>xn x x x ,,21 是样本,此处1=k ,由于λ/1=EX ,亦即EX /1=λ,故λ的矩法估计为x /1ˆ=λ另外,由于2/1)(λ=X Var ,其反函数为)(/1X Var =λ,因此,从替换原理来看,λ的矩法估计也可取为s /1ˆ1=λ, s 样本标准差。
这说明矩估计可能是不唯一的,这是矩法估计的一个缺点,此时通常应该尽量采用低阶矩给出未知参数的估计。
例2设n x x x ,,21 是来自),(b a 上的均匀分布的样本,a 与b 均是未知参数,这里2=k 其密度函数为⎪⎩⎪⎨⎧≤≤-=0,1),;(bx a a b b a x p ,求a ,b 的矩估计.解 由2)(121)(,2)(a b X D b a X E -=+= 得方程组:⎪⎪⎩⎪⎪⎨⎧-==-=+∑=n i i X X n X V a r a b X b a 122.)(1)()(121,2解此方程组,得到矩估计量: .)(3ˆ , )(3ˆX Var X b X Var X a+=-= 6.1.2最大似然估计定义6.1.1 设总体的概率函数为);(θx p ,Θ∈θ,其中θ是一个未知参数或几个未知参数组成的参数向量,Θ是参数θ可能取值的参数空间,n x x x ,,21 是来自该总体的样本,将样本的联合概率函数看成θ的函数,用),,;(21n x x x L θ表示,简记为)(θL ,);();();(),,;()(2121θθθθθn n x p x p x p x x x L L ==)(θL 称为样本的似然函数。
西北工业大学《概率论与数理统计》课件-第六章 参数估计
(2) 似然函数
定义6.1 设总体X的分布密度(或分布律)为 p(x; ), 其中 (1, 2, ,m )为未知参数. 又设
( x1, x2,, xn ) 为自总体X的样本(X1,X2,…,Xn) 的一 个观察值,则称样本的联合分布
n
L( ) p(x1, x2, … , xn; ) p( xi; )
2º似然估计方程组与最大似然估计之间没有必 然
从中解得 pˆ k n
参数 p的估计值
这时, 对一切 0< p <1, 均有
P{Y k; pˆ } P{Y k; p}
综上所述: 设某试验的可能结果为: A1, A2 , ···, Ai , ···
若在一次试验中,某结果 Ai 出现,则应选择参 数使Ai 出现的概率最大.
以上这种选择一个参数使得实验结果具有
(k 1,2,, m)
(4) 求最大似然估计(MLE)的步骤:
1 写出似然函数
(1, 2 , ,m )
n
L( ) L( x1, x2,, xn; ) p( xi; )
n
i 1
2 取对数 ln L( ) ln p( xi; )
i 1
3 解似然方程(组)
ln L
ln L
2
为来自总体X的简单随机样本. 矩估计法的具体步骤:
1 求出k E( X k ) (1,2,,m ), k 1,2,,m;
2 要求k Ak , k 1,2,, m
这是一个包含 m个未知参数1,2 ,,m的方程组.
3 解出其中1,2,,m , 用ˆ1,ˆ2,,ˆm表示.
4 用方程组的解ˆ1, ˆ2 , ,ˆm 分别作为 1,2 ,,m的估计量,这个估计量称为
第六章 时间序列分析-参数估计
例:求MA(1)模型系数的矩估计
MA(1)模型 方程 xt t 1 t 1
0 (1 12 ) 2 1 1 1 2 矩估计 0 1 12 1 1
ˆ 1 1 4 12 ˆ1 ˆ 2 1
f X1 , X 2 , X3 x1 , x2 , x3 ; , 2 f X1 , X 2 x1 , x2 ; , 2 f X3 X 2 , X1 x3 x2 , x1 ; , 2
24
极大似然估计
一般地,样本中第 t 个 X t 在前 t-1 个已知的条件下,由于模 型的特点,实际上前 t-1 个 X t 1 ,, X1 只有 X t 1 作用于 X t ,因此 有
ˆ 其中 k y
ˆˆ ˆ
i 0 j 0 i
p
p
j i j k
, k 0,1,, q
13
对矩估计的评价
优点
估计思想简单直观 不需要假设总体分布 计算量小(低阶模型场合)
缺点
信息浪费严重 只用到了p+q个样本自相关系数信息,其他信息都被忽
15
极大似然估计
本节将要讨论的是根据极大似然原理,给出模型参数 1 ,, p ,
1 ,,q 和白噪声方差 2 的极大似然估计。为此,首先需要给定样本
x1,, xT 的联合分布,
F x1,, xT ; θ
θ 1 , , p , 1 , , q , 2 。 其中
3. ARMA模型的矩估计 第一步,先给出AR部分的参数 估计。
1 ,, p
的矩
q1 q 12 q p 1 p q 1 q 1 1 q 2 q p 2 p q 2 q p 11 q p 22 q p q p
第6章 参数估计
较 的样本容量
θ
B A
较 的样本容量
θ
ˆ θ
一致性: 一致性:
随着样本容量增大, 随着样本容量增大,估计量会越来越接近被估计 的参数。 的参数。即对任意的
→∞→ n
ε >0
,有
ˆ lim P{| θ −θ |< ε} =1
则称 θ 是参数θ的一致估计量。 ˆ 是参数θ的一致估计量。
X
µ -1.96 σx
+1.96σ µ +1.96σx
90%的样本 90%的样本 95% 的样本 99% 的样本
置信水平
1. 将构造置信区间的步骤重复很多次,置信 将构造置信区间的步骤重复很多次, 区间包含总体参数真值的次数所占的比例 称为置信水平. 称为置信水平. 2. 表示为 1 - a 是总体参数未在区间内的比例 3. a是总体参数未在区间内的比例 是总体参数未在区间内的比例 常用的置信水平值有 99%,
• 如某班级平均分数在75~85之间,置信水平是95% 如某班级平均分数在75~85之间,置信水平是95% 75 之间 95
5.1.3. 评价估计量的标准
1.无偏性: 无偏性:
ˆ ˆ 如果 E(θ ) =θ ,即估计量 θ 的数学 期望等于被估计的总体参数, 期望等于被估计的总体参数,我们称估计量
(35)4 35) (45)4.5 45) (55)5 55)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数. 估计的总体参数 .
ˆ P(θ)
偏 偏
A
B
ˆ θ
θ
样本平均数是总体平均数的无偏估 样本平均数是总体平均数的无偏估 计量。 计量。
以无偏性来评判估计量是很合理的。一 以无偏性来评判估计量是很合理的。 个好的估计量就某一个具体的估计值而言 可能不等于总体参数值, ,可能不等于总体参数值,但平均来看有 向估计的总体参数集中的趋势。 向估计的总体参数集中的趋势。
第六章参数估计基础
1总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响?
从正态分布的总体中随机抽样,样本均数呈正态分布;从非正态分布的总体中随机抽样,样本量n较小时,样本均数的分布仍呈非正态分布,当样本量n足够大时,样本均数的分布近似正态哦分布。
计算:σXbar=σ/√n.在实际应用中,总体标准差σ常常未知,需要用样本标准差S来估计。此时,均数标准误的估计值为SXbar=S/√n.由此式可见,若增加样本含量n可减小样本均数的抽样误差。
主要应用:1估计总体均数的置信区间。 2均数的假设检验。
样本频率的抽样分布和抽样误差:频率的标准误用符号σp表示,它反映了样本频率之间以及样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。
1.点估计:直接用随机样本的样本均数Xbar作为总体均数μ的估计值或用样本频率p作为总体概率π的估计值的方法称为点估计。这是一种没有考虑抽样误差的简单估计方法。
2.区间估计:用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间,,是一个开区间,这一估计可相信的程度称为置信度或置信水平。若标准差不变,置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降。
计算:σp=√(π(1-π)/n)。在实际应用中,总体概率π常常未知,需要用样本频率p来估计。因此频率标准误的估计值为Sp=√(p(1-p)/n-1)约等于 √(p(1-p)/n)。由此式可见,增加样本含量n可减小样本频率的抽样误差。
主要应用:1估计总体概率的置信区间 2频率指标的假设检验。
第六章 参数值的估计
第六章 参数值的估计 第一节 参数估计的一般问题一、估计量与估计值参数估计就是用样本统计量去估计总体参数,如用X 估计μ,用S2估计2σ,用p 估计π等。
总体参数可以笼统地用一个符号θ表示。
参数估计中,用来估计总体参数的统计量的名称,称为估计量,用θ表示,如样本均值、样本比例等就是估计量。
用来估计总体参数时计算出来的估计量的具体数值,叫做估计值。
二、点估计与区间估计——参数估计的两种方法 1、点估计用样本估计量θ的值直接作为总体参数θ的估计量值。
2、区间估计它是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。
这个区间通常是由样本统计量加减抽样误差而得到。
以样本均值的区间估计来说明区间估计原理:根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在μ的两侧任何一个标准误差范围内的概率(根据已知的μ,σ计算)。
但实际估计时,μ是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。
例如:约有95%的样本均值会落在距μ的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括μ。
在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。
例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。
构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:α称为显著性水平,表示用置信区间估计的不可靠的概率,1-为置信水平。
如何解释置信区间:如用95%的置信水平得到某班学生考试成绩的置信区间为(60,80),即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩,(60,80)这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。
统计学总体参数估计
配对号
来自总体A 旳样本
来自总体B旳样本
1
2
0
2
5
7
3
10
6
4
8
5
第六章 总体参数估计
第六章 总体参数估计
1、假定条件两个总体服从二项分布能够用正态分布来近似两个样本是独立旳2、两个总体百分比之差P1-P2在1- 置信水平下旳置信区间为
第六章 总体参数估计
【例】在某个电视节目旳收视率调查中,农村随机调查了400人,有32%旳人收看了该节目;城市随机调查了500人,有45%旳人收看了该节目。试以95%旳置信水平估计城市与农村收视率差别旳置信区间
【例】一家瓶装饮料制造商想要估计顾客对一种新型饮料认知旳广告效果。他在广告前和广告后分别从市场营销区各抽选一种消费者随机样本,并问询这些消费者是否据说过这种新型饮料。这位制造商想以10%旳误差范围和95%旳置信水平估计广告前后懂得该新型饮料消费者旳百分比之差,他抽取旳两个样本分别应涉及多少人?(假定两个样本容量相等)
10名学生两套试卷旳得分
学生编号
试卷A
试卷B
差值d
1
78
71
7
2
63
44
19
3
72
61
11
4
89
84
5
6
91
74
17
5
49
51
-2
7
68
55
13
8
76
60
16
9
85
77
8
10
55
39
16
第六章 总体参数估计
解: 根据样本数据计算得
两种试卷所产生旳分数之差旳置信区间为6.33分~15.67分
第六章 时间序列分析-参数估计
ˆ0 y
112 L
2 q
2M
ˆk y k k 1 1 L qqk 2 , k 1, 2,L q
pp
其中 ˆk y
ˆiˆjˆi jk , k 0,1,K , q
i0 j0
13
对矩估计的评价
▪ 优点
➢ 估计思想简单直观 ➢ 不需要假设总体分布 ➢ 计算量小(低阶模型场合)032源自条件极大似然估计ˆ
T t2
xt xt1
T
x2 t 1 t2
T
ˆ 2 1
T 1 t2
xt
ˆxt1
2
为参数 θ 的条件极大似然估计。
33
对极大似然估计的评价
▪ 优点
➢ 极大似然估计充分应用了每一个观察值所提供 的信息,因而它的估计精度高
➢ 同时还具有估计的一致性、渐近正态性和渐近 有效性等许多优良的统计性质
▪ 残差平方和方程
n
n
t
Q(%)
2 t
[xt
i xt1]2
▪ 解法
i 1
i 1
i 1
➢ 迭代法
36
对最小二乘估计的评价
▪ 优点
➢ 最小二乘估计充分应用了每一个观察值所提供 的信息,因而它的估计精度高
➢ 条件最小二乘估计方法使用率最高
▪ 缺点
➢ 需要假定总体分布
37
例2.5续
▪ 确定1950年——1998年北京市城乡居民定 期储蓄比例序列拟合模型的口径
▪ 缺点
➢ 信息浪费严重
只用到了p+q个样本自相关系数信息,其他信息都被忽 略
➢ 估计精度差
▪ 通常矩估计方法被用作极大似然估计和最小二乘 估计迭代计算的初始值
第六章 参数估计
宁波工程学院
理学院
第六章 参数估计
第12页 12页
6.1.2 极(最)大似然估计
定义6.1.1 设总体的概率函数为P(x;θ ),将样本 的联合概率函数看成θ 的函数
L (θ ) = L (θ ; x1 ,⋯ , xn ) = p ( x1 ; θ ) ⋅ p ( x2 ; θ ) ⋅⋯ ⋅ p ( xn ; θ )
宁波工程学院
理学院
第六章 参数估计
第9页
例6.1.3 x1, x2, …, xn 是来自(a,b)上的均匀分布 U(a,b)的样本,a与b均是未知参数,这里k=2, 由于
a+b EX = , 2 (b − a ) 2 Var( X ) = , 12
不难推出
a = EX − 3Var( X ), b = EX + 3Var( X ),
第7页
二、概率函数P 二、概率函数P(x,θ)已知时未知参数的矩法估计 设总体的分布含有k个未知参数 θ ,⋯,θ ,那么 1 k 它的前k阶矩 µ1, µ2 ,⋯, µk 都是这k个参数的函数
µi = gi (θ1,⋯,θk ) 从这k个方程中解出 θ = θ (µ ,⋯, µ ) j j 1 k
4 December 2010
宁波工程学院
理学院
第六章 参数估计
第20页 20页
§6.2 点估计的评价标准
6.2.1 相合性
点估计量不可能等同于参数的真实取值。但根据 格里纹科定理,完全可以要求估计量随着样本量 的不断增大而逼近参数真值,这就是相合性
ˆ ˆ 定义6.2.1 θn = θn ( x1,⋯, xn ) 是θ 的一个估计量,若对 任何一个ε>0,有
第六章---参数估计ppt课件
1、条件分析:总体分布为正态,且总体方差已 知,用正态法进行估计。 2、计算标准误 3、确定置信水平为0.95,查表得
51
4、计算置信区间 D=0.95时 D=0.99时
52
解释:总体均数μ落在75.61-84.39之间的可 能性为95%,超出这一范围的可能只有5%。而 作出总体μ落在74.22-85.78之间结论时的正 确概率为99%,犯错误的可能性为1%。
38
( 二)、 分布法, 未知 1、前提条件: 总体正态分布, n不论大小,
2、使用 t分布统计量
D=0.95时 D=0.99时
39
例:总体正态, 未知,
,
,
,
,
平均数0.95的置信区间是多少?
,
,试问总体
40
解: 1、条件分析:总体正态, 未知,
小
于30,只能用 分布
2、计算标准误
3、计算自由度
9
一、点估计
(一)意义 含义:直接用样本统计量的值作为总体参数的估 计值 无偏估计量:恰好等于相应总体参数的统计量。
例8-1;假设某市六岁男童平均身高110.7cm,随机 抽取113人测得平均身高110.70cm.总体的平均数, 标准差是多少
10
(二)良好点估计的条件
无偏性: 一致性: 有效性: 无偏估计量的变异性问题。
47
1 、条件分析:总体分布为非正态, 未知, >30,只能用近似正态估计法。
2、计算标准误
3、确定置信水平为0.95,查表得
48
4、计算置信区间
5、结果解释:该校的平均成绩有95%的可能落 在50.2~54.0之间。
49
课堂练习
已知某总体为正态分布,其总体标准差为10。 现从这个总体中随机抽取n1=20的样本,其平 均数分别80。试问总体参数μ在0.95和0.99的 置信区间是多少。
第6章 参数估计
是取自总体 X 的样本 ,
n
则样本的联合分布律
P{ X 1 x1 ,, X n xn } p ( xi , ),
i 1
对确定的样本观察值 x1 , x2 ,, xn , 它是未知参数
的函数, 记为
L( ) L( x1 , x2 ,, xn , ) p ( xi , ),
这位同学命中的概率, 故一般会猜测这一枪是猎人 射中的. 最大似然估计法的思想: 在已得到试验结果的情况 下, 应寻找使这个结果出现的可能性最大的那个
值作为 的估计 ˆ.
第28页
离散型总体的情形:
P{ X x} p( x, ),
x1 , x2 , , xn
设总体 X 的概率分布为 其中 为未知参数. 如果
本, 试求 , 2 的矩估计量. 1 E ( X ) , 解
2 E ( X 2 ) D( X ) [ E ( X )]2 2 2 ,
X 令 2 2 n 1 2 2 S X n
X 2 n 1 2 S n
2 (n / 2)
可以证明,当n时, 有cn1. 这说明 s 是 的渐近无偏估计。
教材P304例6.1.3(Jackknife)
第7页
设 T ( x) 是基于样本x ( x1 , x2 ,, xn ) 的关于参数 g ( )
1 的估计量,且满足 E T ( x) g ( ) O( ). 如以 x( i )表示从 n 样本中删去 xi 后的向量,则 T ( x) 的刀切统计量为
6.2.1替换原理和矩法估计
替换原理是指用样本矩及其函数去替换相应的总 体矩及其函数,譬如: ˆ • 用样本均值估计总体均值E(X),即 E( X ) x ; ˆ • 用样本方差估计总体方差Var(X),即 Var( X ) s 2 • 用样本的 p 分位数估计总体的 p 分位数, • 用样本中位数估计总体中位数。
06参数估计与假设检验(医学统计学)
三、总体均数的区间估计
(一) 已知
95%可信区间:
一般情况
其中 为标准正态分布的双侧界值。
(二) 未知
Confidence interval
通常未知,这时可以用其估计量S 代替,但
已不再服从标准正态分布,而是服从
著名的t 分布。
William Gosset
图6-1 不同自由度的 t 分布图
t分布
四、两总体均数差的区间估计
实际中,有时需要计算两个总体均数差值的可信 区间,例如通过计算两种降压药物平均降压的差 值比较两种药物的差别,其双侧 100(1 )%可信 区间的计算公式为 ( X1 X 2 ) t /2, SX1X2 其中, n1 n2 2 为自由度,SX1X2 为两样本均数之 差的标准误。
样本率来代替总体率,其估计值为:
p(1 p)
Sp
n
二、参数估计
点估计: 是使用单一的数值直接作为总体参数的估 计值,如用估计相应的,用估计相应的。该法表 达简单,但未考虑抽样误差的影响,无法评价参 数估计的准确程度。
区间估计(interval estimation)是指按预先给定的概 率,计算出一个区间,使它能够包含未知的总体 均数。事先给定的概率称为可信度,计算得到的 区间称为可信区间(confidence interval,CI)。
n
250
六、两总体率差值的区间估计
在大样本情况下,可采用正态近似法对两总体率 差值进行可信区间估计,其计算公式为:
( p1 p2 ) z S /2 )( n1
1 n2
),pc =
X1 n1
X2 n2
X1和X2分别表示两组中某事件发生的例数。
例6-7 某医院口腔科医生用极固宁治疗牙本质过 敏症,以双氟涂料作对照,进行了1年的追踪观察 ,结果见表6-1所示,试估计两组有效率差别95% 的可信区间。
参数估计
§4 均值的置信区间的分析(2):一对矛盾
区间估计中的一对矛盾
精度
区间长度越长,精度越低 区间长度越短,精度越高 n越大,精度越高
置信度越高,区间长度越长 置信度越低,区间长度越短
置信度
样本容量n固定时,精度与置信度不能同时提高!
先保证置信度,再提高精度
§4 均值的置信区间的分析(3):一个特殊应用
§3 参数的区间估计:引例
抛一枚均匀的硬币10000次, ?问题1:出现正面的次数可能达到5500次吗?
可能。但可能性非常小,与摸彩票(36选7)中特等奖的 概率类似的小。 有68.3%的可能在(4950,5050)之间; 有95.4%的可能在(4900,5100)之间; 有99.7%的可能在(4850,5150)之间;
§3 参数的区间估计
在估计参数 时,构造一个置信区间,其置信系 数为95%,下面哪一种说法最正确( ) A.落在该置信区间的概率为95% B.不落在该区间的风险为5% C. 有95%的随机置信区间会包括 D. 这一估计的误差不超过5%
§4 均值的区间估计——大样本结果
x z / 2 n
在参数估计中利用t分布构造置信区间的条件是 ( ) A. 总体分布需服从正态分布且方差已知 B. 总体分布为正态分布,方差未知 C. 总体不一定是正态分布但须大样本 D. 总体不一定是正态分布,但需要方差已知
§4 正态总体均值的区间估计
为管理的需要,银行要测定在业务柜台上每笔业 务平均所需的时间。假设每笔业务所需时间服从 正态分布,现随机抽取样本量为16,测得平均时 间为13分钟,标准差为5.6分钟,要求以99%的 置信系数确定置信界限。若置信系数改为90%, 其置信界限有何区别?
《卫生统计学》第六章 参数估计基础
二、总体概率可信区间的计算
1.查表法:n≤50,特别是p接近0或100%时,可查 附表6(P478-480),二项分布概率的置信区间表, 例6-4。
注意:附表6中X值只列出了X≤n/2部分,当X>n/2 时,应以n - X值查表,然后用100减去查得的数 值,即为所求的区间。
2.正态近似法**:当n较大且np和n(1-p)均大于5 时,二项分布接近正态分布,则总体率的双侧 (1-α)可信区间为: P ± Ζα/2· Sp
f(t)
0.4
υ=∞
υ=5
0.3
υ=1
0.2
0.1
0.0
t
-5 -4 -3 -2 -1 0 1 2 3 4 5
图6-4 自由度为1、5、∞的t分布
.
t分布的特征:只有一个参数ν 以0为中心,左右对称的单峰分布; t分布是一簇曲线,形态变化与n(即自由度)大
小有关。自由度ν越小,t分布曲线越低平;自 由度ν越大,t分布曲线越接近标准正态分布 (Ζ分布)曲线。 t分布峰部较矮,尾部翘得较高,说明远侧的t值 的个数相对较多,即尾部面积(概率P)较大。 自由度ν越小这种情况越明显,ν渐大时,t分 布渐逼近标准正态分布;当ν=∞时,t分布就成 为标准正态分布了。 附表2,t界值表P467
.
均数的抽样误差——指由抽样而造成的样本均数 与总体均数之间的差异。
x 称标准误,它说明均数抽样误差的大小。
x / n
n越大,标准误越小,样本均数的抽样误差亦越小 实际工作中,σ常未知,而是用样本标准差s来估
计,则有 sx s/ n
常用来说明均数的抽样误差的大小。
.
即使从偏态总体抽样,当n足够大时, 样本均数也近似正态分布(见实验6-2, 观察图6-1及图6-2的变化)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 参数估计
1.填空题
(1)设总体,),(~p N B X p 未知,是来自总体),,,(21n X X X "X 的样本,则参
数p 的矩估计量是 ;最大似然估计量是 。
(2)设是来自均匀分布),,,(21n X X X ")0)(1,(>+θθθU 总体的一个样本,
则θ的矩估计量是 ;θ的最大似然估计量是 。
2.设总体X 的概率密度为
⎩⎨⎧<<=−其它,010),(1
x x x p θθθ
其中θ为未知参数,是从总体),,(1n X X "X 中抽取的一个样本,求θ的矩估计和最大似然估计。
3.设总体X 的分布密度为 +∞<<∞−=−x e x p x
,21);(σσσ ),,,(21n X X X "是来自总体X 的样本,试求σ的矩估计和最大似然估计。
4.设总体X 的分布密度为
0, ,1
)(21221>+∞<<=−−θθθθθx e x p x
),,,(21n X X X "为来自总体X 的样本,试求1θ和2θ的矩估计。
5.设总体服从对数正态分布,其分布密度为
0,0 ,2)(ln exp 21
)(22>>⎭⎫⎩⎨⎧−−=σσσπx u x x x p ),,,(21n X X X "是来自总体X 的一个样本,试求参数µ和的最大似然估计。
2σ6.设总体X 的分布密度为 ⎩⎨⎧<≥=−−θθθx x e x p x ,
0,)()(),,,(21n X X X "是来自总体X 的一个样本,试求参数θ的最大似然估计。
7.填空题
(1)设总体,是它的一个样本,则当常数
),(~2σµN X ),,,(21n X X X "=C 时,为的无偏估计。
∑−=+−1121)(n i i i X X
C 2σ(2)设总体)(~λP X ,是它的一个样本,则的一个无偏估计
量为 ),,,(21n X X X "2λ。
8.设和都是参数1ˆθ2ˆθθ的两个独立的无偏估计量,且,试求常数2
1ˆ2ˆθθD D =α和β,使是21ˆˆθβθα+θ的无偏估计,且在形如的无偏估计中方差最小。
21ˆˆθβθα+9.设总体,是它的一个样本,试求的最大似然估计,是否为的有效估计? ),1(~2σN X ),,,(21n X X X "2
σ2ˆσ
2ˆσ2
σ10.设总体X 的分布密度为
⎪⎩
⎪⎨⎧<<−=其它,00),(6)(3
θθθx x x x p ),,,(21n X X X "是它的一个样本,试求参数θ的矩估计量,是否是θˆθˆθ的相合估计?
11.设总体X 服从正态分布N (),(X 2,σµ1,…, X n ,…X 2n )为来自X 的一个样本, ∑==n
i i X n X 1
1 (1)求常数C 使统计量 为∑=Λ−=n n i i X C 2||µσσ的无偏估计,并求的效率e().
ΛσΛ
σ(2)当1,0==σµ 时,求2)(X 与||X 的协方差。
12. 设总体X 的概率分布为
X 0 1 2 3
P 2θ )1(2θθ− 2θθ21−
其中θ是未知参数,利用X 的如下样本值: )2
10(<<θ3,1,3,0,3,1,2,3. 求θ的矩估计值和最大似然估计值。
13.设总体X 服从均匀分布U ()2,2+−θθ, θ>0, 是来自X 的样本。
(1) 证明θ的一个最大似然估计量为
),,,(21n X X X "
)],,,min(),,,[max(2
12121n n L X X X X X X ""+=Λ
θ
(2) 判断是否是θ的相合估计。
ΛL θ14.从大批彩色显像管中随机取100只,其平均寿命为10000小时,可以认为显像管
的寿命服从正态分布,已知均方差σ=40小时,以置信度95%求出整批显像管平均寿命µ的置信区间。
15.一批钢件的20件样品屈服点(吨/厘米2)为:
4.98;
5.11;5.20;5.20;5.11;5.00;5.61;4.88;5.27;5.38
5.46;5.27;5.23;4.96;5.35;5.15;5.35;4.77;5.38;5.54
设屈服点服从正态分布。
求:
(1)屈服点总体均值µ的置信度为0.95的置信区间;
(2)屈服点总体标准差σ的置信度为0.95的置信区间。
16.设为总体的样本,其中),,,(21n X X X "),(~2σµN X µ和为未知参数,
设随机变量是关于2σL µ的置信度为α−1的置信区间的长度,求。
)(2L E 17.两种机床生产同一个型号的滚珠,从甲机床生产的滚珠中抽取8个,从乙机床生
产的滚珠中抽取9个,测得这些滚珠的直径(单位:mm )如下:
甲机床:15.0,14.8,15.2,15.4,14.9,15.1,15.2,14.8
乙机床:15.2,15.0,14.8,15.1,14.6,14.8,15.1,14.5,15.0
设两台机床生产的滚珠直径均服从正态分布。
(1)若时,求2221σσ=21µµ−的置信度为95%的置信区间。
(2)求方差比的置信度为95%的置信区间。
2221/σσ18.设0.50,1.25,0.80,2.00是来自总体X 的样本,已知X Y ln =服从正态分布)1,(µN .
(1) 求X 的数学期望EX (记EX 为b )
, (2) 求µ的置信度为0.95的置信区间,
(3) 利用上述结果求b 的置信度为0.95的置信区间。