第六章 参数估计基础

合集下载

第六章系统辨识与参数估计-数据预处理及相容性检验(精品)

第六章系统辨识与参数估计-数据预处理及相容性检验(精品)

1第六章 数据预处理及相容性检验6.1 前言航行器航行试验数据用于参数辨识之前,需要对试验数据进行预处理和数据相容性检验,目的在于尽可能消除含在数据中的各种噪声和系统误差,以提高辨识结果的准确度。

数据预处理包括:数据野值的识别、剔除与补正;数据加密;数据平滑与微分平滑;滤除高频噪声及以传感器位置校正等。

数据相容性检验的主要功能是将数据中的常值误差,特别是零位漂移误差辨识出来并重新建立没有常值误差的试验数据。

本章还以某型航行器的实测数据预处理为例,给出了具有实际应用意义的数据处理技术及结果。

6.2 数据处理的理论基础6.2.1 信号的分类用数学来描述待辨识系统的某一组输入和某一组输出时间函数间的关系是辨识的基础。

在选择信号的描述方法时,必须考虑信号表示的两个方面:①要表现出信号载有信息的属性;②要给出研究过程信息传递特性的方法。

按时间函数的特点来表达信息,可将信号分为连续信号和采样信号。

在许多情况下,信号的记录可以采用这两种信号中的任一种。

两种信号的记录均有各自的特点,但是利用计算机对记录的信号作处理时,往往需要采样信号,即使采用连续信号,也必须对信号作采样处理。

采样运算是线性运算,即当我们用算子ψ(.)表示这一运算时,对一切α和β,信号u(t)和y(t)均有ψαβαψβψ[()()][()][()]u t y t u t y t +=+(6-2-1)按幅度划分,信号可以分为模拟信号、量化信号和二进制信号。

二进制信号是量化信号的极限情况,量化运算是非线性运算。

因此,在处理量化信号时,这种非线性造成许多数学上的困难。

确定性信号与随机信号也是系统建模和参数辨识中常用的信号分析方式。

由于工程的实际环境,对随机信号的讨论更具有实际意义。

6.2.2 随机信号的描述为了讨论问题的方便,在此我们首先介绍随机信号的一些统计性质。

与确定性信号不一样,对随机信号询问其幅度的瞬时值是没有多少意义的,所以最有用的量是那些关于统计性质的量,如谱密度、数学期望值、方差和相关函数等。

第六章 参数估计

第六章 参数估计

第六章 参数估计§6.1 点估计的几种方法6.1.1 替换原理和矩法估计 一、矩法估计替换原理:(1)用样本矩去替换总体矩,这里的矩可以是原点矩也可以是中心矩;(2)用样本矩的函数去替换相应的总体矩的函数。

举例二、概率函数);(θx p 已知时未知参数的矩法估计设总体具有已知的概率函数),,;(1k x p θθ ,∈),,(1k θθ Θ是未知参数或参数向量,n x x x ,,21 是样本,假定总体的k 阶原点矩k μ存在,则对所有j ,,0k j <<j μ都存在,若假设k θθ,,1 能够表示成k μμ,,1 的函数),,(1k j j μμθθ =,则可给出诸j θ的矩法估计:k j a a kj j ,1),,,(ˆ1==θθ 其中k a a ,,1 是前k 个样本原点矩:∑==n i ji j x n a 11,进一步,如果要估计k θθ,,1 的函数),(1k g θθη =,则可直接得到η的矩法估计)ˆ,ˆ(ˆ1kg θθη=。

例1 设总体为指数分布,其密度函数为x e x p λλλ-=);(,0>xn x x x ,,21 是样本,此处1=k ,由于λ/1=EX ,亦即EX /1=λ,故λ的矩法估计为x /1ˆ=λ另外,由于2/1)(λ=X Var ,其反函数为)(/1X Var =λ,因此,从替换原理来看,λ的矩法估计也可取为s /1ˆ1=λ, s 样本标准差。

这说明矩估计可能是不唯一的,这是矩法估计的一个缺点,此时通常应该尽量采用低阶矩给出未知参数的估计。

例2设n x x x ,,21 是来自),(b a 上的均匀分布的样本,a 与b 均是未知参数,这里2=k 其密度函数为⎪⎩⎪⎨⎧≤≤-=0,1),;(bx a a b b a x p ,求a ,b 的矩估计.解 由2)(121)(,2)(a b X D b a X E -=+= 得方程组:⎪⎪⎩⎪⎪⎨⎧-==-=+∑=n i i X X n X V a r a b X b a 122.)(1)()(121,2解此方程组,得到矩估计量: .)(3ˆ , )(3ˆX Var X b X Var X a+=-= 6.1.2最大似然估计定义6.1.1 设总体的概率函数为);(θx p ,Θ∈θ,其中θ是一个未知参数或几个未知参数组成的参数向量,Θ是参数θ可能取值的参数空间,n x x x ,,21 是来自该总体的样本,将样本的联合概率函数看成θ的函数,用),,;(21n x x x L θ表示,简记为)(θL ,);();();(),,;()(2121θθθθθn n x p x p x p x x x L L ==)(θL 称为样本的似然函数。

总体均数估计

总体均数估计
0.50
5.00
0.0920
0.0913
3个抽样实验结果图示
各样本均数未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本对称。 样本均数的变异范围较之原变量的变异范围大大缩小。
本均数的抽样分布具有如下特点
从总体均数为μ,标准差为σ的正态总体中抽取例数为n的样本,样本均数的总体均数为μ,标准差为 。
例6-7 某医院用某药治疗脑动脉硬化症22例,其中显效者10例。问该药总显效率的95%置信区间为多少?
本例n=22, X=10, 查附表6(478页),得此两数相交处的数值为24~68,即该药总显效率的95%置信区间为(24%,68%)。
(三)置信区间的确切涵义
01
02
03
95%的置信区间的理解:
For example
例6-6 用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。 95%的置信区间为: 该仪器乳腺癌总体检出率的95%置信区间 ( 70.9%,85.7% )
04
03
01
02
查表法
当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的置信区间可据二项分布的理论求得。
当n确定时,上述两者互相矛盾。 提高准确度(可信度),则精确度降低 (置信区间会变宽),势必降低置信区间的实际应用价值,故不能笼统认为99%置信区间比95%置信区间要好。 相反,在实际应用中,95%置信区间更为常用。
感谢观看
添加副标题
汇报人姓名
2.区间估计(interval estimation):
通常有两类方法:

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。

第六章参数估计基础

第六章参数估计基础
正态近似法:当n足够大时,且样本频率p不太接近0或1时,p的抽样分布接近正态分布,此时,总体概率的置信区间为p+-Zα/2 * Sp.
1总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响?
从正态分布的总体中随机抽样,样本均数呈正态分布;从非正态分布的总体中随机抽样,样本量n较小时,样本均数的分布仍呈非正态分布,当样本量n足够大时,样本均数的分布近似正态哦分布。
计算:σXbar=σ/√n.在实际应用中,总体标准差σ常常未知,需要用样本标准差S来估计。此时,均数标准误的估计值为SXbar=S/√n.由此式可见,若增加样本含量n可减小样本均数的抽样误差。
主要应用:1估计总体均数的置信区间。 2均数的假设检验。
样本频率的抽样分布和抽样误差:频率的标准误用符号σp表示,它反映了样本频率之间以及样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。
1.点估计:直接用随机样本的样本均数Xbar作为总体均数μ的估计值或用样本频率p作为总体概率π的估计值的方法称为点估计。这是一种没有考虑抽样误差的简单估计方法。
2.区间估计:用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间,,是一个开区间,这一估计可相信的程度称为置信度或置信水平。若标准差不变,置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降。
计算:σp=√(π(1-π)/n)。在实际应用中,总体概率π常常未知,需要用样本频率p来估计。因此频率标准误的估计值为Sp=√(p(1-p)/n-1)约等于 √(p(1-p)/n)。由此式可见,增加样本含量n可减小样本频率的抽样误差。
主要应用:1估计总体概率的置信区间 2频率指标的假设检验。

第六章 参数值的估计

第六章 参数值的估计

第六章 参数值的估计 第一节 参数估计的一般问题一、估计量与估计值参数估计就是用样本统计量去估计总体参数,如用X 估计μ,用S2估计2σ,用p 估计π等。

总体参数可以笼统地用一个符号θ表示。

参数估计中,用来估计总体参数的统计量的名称,称为估计量,用θ表示,如样本均值、样本比例等就是估计量。

用来估计总体参数时计算出来的估计量的具体数值,叫做估计值。

二、点估计与区间估计——参数估计的两种方法 1、点估计用样本估计量θ的值直接作为总体参数θ的估计量值。

2、区间估计它是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。

这个区间通常是由样本统计量加减抽样误差而得到。

以样本均值的区间估计来说明区间估计原理:根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在μ的两侧任何一个标准误差范围内的概率(根据已知的μ,σ计算)。

但实际估计时,μ是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。

例如:约有95%的样本均值会落在距μ的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括μ。

在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。

例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。

构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:α称为显著性水平,表示用置信区间估计的不可靠的概率,1-为置信水平。

如何解释置信区间:如用95%的置信水平得到某班学生考试成绩的置信区间为(60,80),即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩,(60,80)这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。

第六章参数估计范文

第六章参数估计范文

第六章参数估计范文第六章是统计学中的重要章节,讨论了参数估计的原理和方法。

参数估计是根据样本数据推断总体参数值的过程,它是统计推断的基础和核心。

在参数估计中,我们常常面临两个问题:点估计和区间估计。

点估计是通过样本数据得到总体参数的一个估计值,例如样本均值可以估计总体均值。

区间估计是在点估计的基础上,给出一个参数估计的区间,用于描述参数估计的不确定性。

常用的点估计方法有矩估计法和最大似然估计法。

矩估计法基于样本矩的性质,将样本矩和总体矩进行匹配,得到参数的估计值。

最大似然估计法是利用已知样本数据求取未知参数值,使样本观察到的概率最大化。

这两种方法都是有效的参数估计方法,但在特定情况下可能会有一定差异。

区间估计是对参数估计值的不确定性的度量,它给出了一个信任水平下参数取值的范围。

常用的区间估计方法有置信区间和预测区间。

置信区间是在给定置信水平下,对参数范围进行估计。

置信水平是指对总体参数落在区间内的置信程度,通常使用95%或99%。

预测区间是对未来观测值的取值范围进行估计,它比置信区间更宽泛。

在实际应用中,我们会根据问题的性质和数据的特点选择适合的参数估计方法。

参数估计方法的选择是统计分析的基础,它直接影响着最后结果的可靠性和准确性。

因此,正确选择和应用参数估计方法对于准确推断总体参数具有重要意义。

总结起来,第六章参数估计是统计推断的重要内容,包括点估计和区间估计两个方面。

点估计是通过样本数据得到总体参数的一个估计值,常用的方法有矩估计法和最大似然估计法。

区间估计是对参数估计值的不确定性的度量,常用的方法有置信区间和预测区间。

正确选择和应用参数估计方法对于准确推断总体参数具有重要意义。

统计学总体参数估计

统计学总体参数估计
第六章 总体参数估计
例题:一家保险公司收集到由36投保人组成的随机样本,得到每个投保人的年龄数据如表所示。试建立投保人年龄90%的置信区间。样本标准差: 表:36个投保人年龄的数据 S=
23
35
39
27
36
44
36
42
46
43
31
33
42
53
45
54
第六章 总体参数估计
1 12, 22已知时,两个总体均值之差1-2在1- 置信水平下的置信区间为 2
2 12、 22未知时,两个总体均值之差1-2在1- 置信水平下的置信区间为
第六章 总体参数估计
例1 某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表 ,建立两所中学高考英语平均分数之差95%的置信区间
第六章 总体参数估计
例题: 一家食品生产企业以生产袋装食品为主,每天的产量大约为8000袋左右。按规定每袋的重量应为100g。为对产量质量进行监测,企业质监部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量(单位:g)如表所示。
第六章 总体参数估计
二、总体比例的区间估计(大样本) 总体比例P在 置信水平下的置信区间 当P未知时,用p来代替P
第六章 总体参数估计
例题: 某城市要估计下岗职工中女性所占的比例,随机抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。
A
B
较小的样本容量
较大的样本容量
P( )
第六章 总体参数估计
第二节 一个总体参数的区间估计

第六章 参数估计

第六章  参数估计
4 December 2010
宁波工程学院
理学院
第六章 参数估计
第12页 12页
6.1.2 极(最)大似然估计
定义6.1.1 设总体的概率函数为P(x;θ ),将样本 的联合概率函数看成θ 的函数
L (θ ) = L (θ ; x1 ,⋯ , xn ) = p ( x1 ; θ ) ⋅ p ( x2 ; θ ) ⋅⋯ ⋅ p ( xn ; θ )
宁波工程学院
理学院
第六章 参数估计
第9页
例6.1.3 x1, x2, …, xn 是来自(a,b)上的均匀分布 U(a,b)的样本,a与b均是未知参数,这里k=2, 由于
a+b EX = , 2 (b − a ) 2 Var( X ) = , 12
不难推出
a = EX − 3Var( X ), b = EX + 3Var( X ),
第7页
二、概率函数P 二、概率函数P(x,θ)已知时未知参数的矩法估计 设总体的分布含有k个未知参数 θ ,⋯,θ ,那么 1 k 它的前k阶矩 µ1, µ2 ,⋯, µk 都是这k个参数的函数
µi = gi (θ1,⋯,θk ) 从这k个方程中解出 θ = θ (µ ,⋯, µ ) j j 1 k
4 December 2010
宁波工程学院
理学院
第六章 参数估计
第20页 20页
§6.2 点估计的评价标准
6.2.1 相合性
点估计量不可能等同于参数的真实取值。但根据 格里纹科定理,完全可以要求估计量随着样本量 的不断增大而逼近参数真值,这就是相合性
ˆ ˆ 定义6.2.1 θn = θn ( x1,⋯, xn ) 是θ 的一个估计量,若对 任何一个ε>0,有

第六章参数估计

第六章参数估计

第六章参数估计参数估计是指在统计学中,根据从总体中获取的样本数据,对总体参数的值进行估计的一种方法。

参数估计是统计推断的基础,它通过样本数据来推断总体的特征,并给出一个接近总体参数真值的估计值。

在本章中,我们将介绍参数估计的方法和一些常用的估计量。

一、点估计点估计是参数估计的一种方法,它是通过一个单一的数值来估计总体参数的值。

在点估计中,我们通过样本数据计算出一个估计量,作为总体参数的估计值。

点估计的关键是选择一个合适的估计量,这个估计量应当是无偏的、一致的以及有效的。

1.无偏性在参数估计中,无偏性是指估计量的期望值等于被估计的参数的真值。

如果一个估计量的期望值等于被估计参数的真值,则称该估计量是无偏的。

例如,对于总体均值的估计,样本均值是一个无偏估计量。

2.一致性在参数估计中,一致性是指随着样本容量的增加,估计量的值趋于总体参数的真值。

如果一个估计量的值在样本容量趋向无穷时收敛到被估计参数的真值,则称该估计量是一致的。

一致性是估计量的重要性质,它保证了估计量在大样本情况下的准确性。

3.有效性在参数估计中,有效性是指估计量的方差最小。

如果一个估计量的方差比其他估计量的方差都小,则称该估计量是有效的。

有效性是估计量的理想性质,它表示估计量具有较好的精确性。

二、区间估计区间估计是参数估计的另一种方法,它不仅给出了总体参数的一个点估计,还给出了一个置信区间。

置信区间是总体参数的一个估计范围,反映了总体参数的不确定性。

1.置信水平在区间估计中,置信水平是指在一次次重复取样中,估计的置信区间包含总体参数的比例。

通常使用95%或99%的置信水平。

2.置信区间的构造构造置信区间的方法有多种,常见的有正态分布的置信区间、t分布的置信区间以及bootstrap的置信区间等。

其中,正态分布的置信区间适用于大样本情况,t分布的置信区间适用于小样本情况,bootstrap的置信区间则是一种非参数方法。

3.置信区间的解释置信区间的解释是指一个置信区间中的统计学意义。

第六章 抽样与总体参数的估计

第六章 抽样与总体参数的估计

两个结论 :
2 (1)设有两个总体X和Y, X ~ N( µ1 , σ 12 ), Y ~ N( µ 2 , σ 2 ), 且X和Y相互
独立。X 1 , X 2 ,..., X n1 是来自总体X的样本容量为n 1 , Y1 , Y2 ,..., Yn 2 是 来自总体Y样本容量为n 2的随机样本,
6.1 抽样与抽样分布 6.1.1 总体、个体和样本
总体(Population)--要研究的事物或现象的总体。 个体(Item unit)--组成总体的每个元素(成员)。 总体容量(Population size)--一个总体中所含个体的数量。 (Sample)-样本(Sample)--从总体中抽取的部分个体。 样本容量(Sample size)--样本中所含个体的数量。 抽样(Sampling)--为推断总体的某些重要特征,需要从总体 中按一定抽样技术抽取若干个体的过程。 统计量(Statistic)--由样本构造,用来估计总体参数的函数。统 计量是样本的函数,只依赖于样本;统计量不含任何参数。 样本均值、样本方差等都是统计量。
2)
4) E ( χ 2 ( n )) = n ,
D ( χ 2 ( n )) = 2 n
卡方分布表给出了卡方变 量在不同自由度下的临界 值. 2 2
P ( χ > χα (n)) = α
0
2 χα ( n)
当n很大时,
2 χ 2 ( n)
近似服从 N ( 2n − 1,1)
2 p
1 实用上,n>45时, χ (n) ≈ (u p + 2n − 1) 2 2
态变量的个数.
卡方分布的特点: 1)卡方分布是一个正偏态分布。随自由度n的不同,其分布曲 线的形状不同, n小,分布偏斜; n很大,接近于正态分布。 当自由度df=n +∞时,卡方分布即为正态分布。

参数估计

参数估计

第六章 参数估计一、教材说明本章内容包括参数估计中基本的概念、参数估计的两种方法及评价估计量的四个标准.它们是参数估计最基本的内容,是以后学习参数估计其他内容的基础.1、 教学目的与教学要求(1) 使学生了解参数估计中最基本的点估计及相关概念; (2) 使学生掌握矩估计及最大似然估计的方法;(3) 使学生掌握评价估计量优劣的四个标准,尤其是前三个标准; (4) 使学生了解矩估计、最大似然估计的原理. 2、 本章的重点本章重点是求未知参数的矩估计与最大似然估计的方法以及如何对求出的估计量的优良性进行评价.二、教学内容本章主要分2节来讲述.一、参数估计问题这里所指的参数是指如下三类未知参数:1、 类型已知的分布中所含的未知参数θ.如二点分布b(1, p )中的概率p ;正态分布),(2σμN 中的μ和2σ;2、 分布中所含的未知参数θ的函数:如正态分布),(2σμN 的变量X 不超过给定值a 的概率)()(σμ-Φ=≤a a X P 是未知参数σμ,的函数;3、 分布的各种特征数也都是未知参数,如均值EX ,方差VarX ,分布中位数等等. 一般场合,常用θ表示参数,参数θ所有可能取值的集合称为参数空间,记为Θ.参数估计问题就是根据样本对上述各种参数做出估计.二、概率函数总体X 的概率函数),(θx p 是指:当X 为离散型总体时,),(θx p 就是总体的分布列;当X 为连续性总体时,),(θx p 就是总体的密度函数.三、参数估计形式分为点估计与区间估计.设n x x x ,,,21 是来自总体的样本,我们用一个统计量),,(1^^n x x θθ=的取值作为θ的估计值,^θ称为θ的点估计量,简称估计.若给出参数θ的估计是一个随机区间),(θθ,使这个区间),(θθ包含参数真值的概率大到一定程度,此时称),(θθ为参数θ的区间估计.§6.1点估计的几种方法教学目的:要求学生了解参数点估计的基本思想,理解参数点估计的基本概念,熟练运用替换原理、矩法估计和最大似然估计对参数进行估计.教学重点:矩法估计、最大似然估计.教学难点:运用矩法估计、最大似然估计对参数进行估计.教学内容:本节内容包括替换原理及矩法估计,最大似然估计.6.1.1 替换原理及矩法估计用样本矩去替换总体矩(矩可以是原点矩也可以是中心矩),用样本矩的函数去替换总体矩的函数,这就是替换原理.用替换原理得到的未知参数的估计量称为矩法估计.注 矩法估计适用于总体分布形式未知场合,因此只要知道总体相应的矩即可,而不必知道其具体分布. 一 矩法估计在总体分布位置的情况下,用样本矩去替换总体矩 如 用样本均值x 估计总体均值()E X ,即^()=E X x . 用样本方差2n s 估计总体方差Var()X ,即^2ar()=s n V X用事件A 出现的频率 估计事件A 发生的概率用样本p 分位数估计总体的p 分位数,特别地,用样本中位数去估计总体中位数. 例6.1.1 对某型号的20辆汽车记录其每5L 汽油的行驶里程,观测数据如下: 29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7 28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9经计算可得=28.695x ,2=0.9185n s ,0.5=28.6m ,由此给出总体均值,方差和中位数的估计分别为28.695,0.9185,28.6.二 概率函数),(θx p 已知时未知参数的矩法估计设总体的概率函数)(1k x p θθ,,; ,Θ∈),,(1k θθ 是未知参数,n x x x ,,,21 是 总体X 的样本,若)(kX E 存在,则)(jX E k j ,<∀存在.设k j X E k j j j ,,2,1),,,(1 ===θθνμ)(,如果k θθ,,1 也能够表示成k μμ,,1 的函数k j k j j ,,2,1),,,(1 ==μμθθ,则可给出j θ的矩估计量为k j a a k j j ,,2,1),,,(ˆˆ1 ==θθ,其中k j x n a n i ji j ,,2,1,11==∑=设),,(1k g θθη =是k θθ,,1 的函数,则利用替换原理可得到η的矩估计量)ˆ,,ˆ(ˆ1kg θθη =,其中j θˆ是j θ的矩估计,k j ,,2,1 =. 例6.1.2 设总体为指数分布,其密度函数为0,);(>=-x e x p xλλλ,n x x x ,,,21 为样本,0>λ为未知参数,求λ的矩估计.解 λλ1),(~=∴EX Exp X ,EX 1=∴λ,x1ˆ=∴λ为λ的矩估计. 注 21),(~λλ=∴VarX Exp X ,VarX1=∴λ SS 11ˆ2==∴λ也为λ的矩估计.因此矩估计不唯一,此时,尽量采用低阶矩给出未知参数的估计.例6.1.3 设总体],[~b a U X ,n x x x ,,,21 为样本,求b a ,的矩估计.解 12)(,2],,[~2a b VarX b a EX b a U X -=+=∴ 由⎪⎩⎪⎨⎧-=+=12)(22a b VarX b a EX ,得⎩⎨⎧+=-=VarX EX b VarX EX a 33, 所以b a ,的矩估计为ˆˆax b x ⎧=-⎪⎨=⎪⎩三 矩估计的步骤(1)计算总体的各阶矩jEX ,k j ,,2,1 =,令k j EX k j j j ,,2,1),,,(1 ===θθνμ;(2)解出j θ,即k j k j j ,,2,1),,,(1 ==μμθθ;(3)令k j a a k j j ,,2,1),,,(ˆˆ1 ==θθ,其中k j x n a n i ji j ,,2,1,11==∑=;(4)若),,(1k g θθη =,则)ˆ,,ˆ(ˆ1k g θθη =为η的矩估计量. 6.1.2 最大似然估计最大似然原理一个试验有若干个可能的结果A ,B ,C , ,若在一次试验中结果A 出现,则一般认为试验条件对结果A 出现有利,也即A 出现的概率最大.例6.1.4 设有外形完全相同的两个箱子,甲箱有99个白球和一个黑球,乙箱有99个黑球和一个白球,今随机抽取一箱,并从中随机抽取一球,如果取出白球,问这球是从哪一箱取出的?解 从甲乙两箱均可取出白球,但计算得P (取出白球甲箱)10099=〉〉P (取出白球乙箱)1001= 据最大似然原理,则认为该球是从甲箱取出的.例 6.1.5 产品分为合格品和不合格品两类,用随机变量X 表示某个产品是否合格,0=X 表示合格品,1=X 表示不合格品,从而),1(~p b X ,其中p 未知是不合格品率,现抽取n 个产品看是否合格,得到样本n x x x ,,,21 ,这批观测值发生的概率为:∑-∑=-=========-=-=∏∏ni ini iiix n x ni x x ni i i n n p pp p x X p x X x X x X p p L 11)1()1()(),,,()(1112211当n x x x ,,,21 已知时,)(p L 仅是p 的函数,既然一次抽样观测到n x x x ,,,21 ,此时应认为试验条件对该组样本的出现有利,即该组样本出现的概率最大,从而可求出当p =?时)(p L 达到最大,此时把求出的p =?做为参数p 的估计就得到p 的最大似然估计,问题转化为求)(p L 的最大值点.如果总体为连续型的,求未知参数的最大似然估计仍可转化为求)(p L 的最大值点问题.为此给出似然函数与最大似然估计的定义. 似然函数与最大似然估计定义 6.1.1 设总体X 的概率函数为Θ∈θθ),;(x p 是一个未知参数或几个未知参数组成的参数向量, n x x x ,,,21 为来自总体X 的样本,称样本的联合概率函数为似然函数,用),,;(1n x x L θ表示,简记为)(θL ,即∏===ni i n x p x x L L 11),(),,;()(θθθ如果统计量),,,(ˆˆ21nx x x θθ=满足 )(max )ˆ(θθθL L Θ∈= 则称),,,(ˆˆ21nx x x θθ=是θ的最大似然估计,简记为MLE. 由于x ln 是x 的单调增函数,因此对数似然函数)(ln θL 达到最大与似然函数)(θL 达到最大是等价的.求最大似然估计的两种方法 (1)似然方程法当)(θL 是可微函数时,)(θL 的极大值点一定是驻点,从而求最大似然估计往往借助于求下列似然方程(组)0)(ln =∂∂θθL 的解得到,而后利用最大值点的条件验证求出的是最大值点.例6.1.6 设一个试验有三种可能结果,其发生概率分别为23221)1(),1(2,θθθθ-=-==p p p ,现做了n 次实验,观测到三种结果发生的次数分别是321,,n n n ,求θ的最大似然估计.解 略.例6.1.7对正态总体),(2σμN ,),(2σμθ=是二维参数, n x x x ,,,21 为其样本,求2,σμ的最大似然估计.解:R x ex f X x ∈=--222)(21),;(~σμσπσμ所以似然函数为:∏=----∑===-ni x ni i ni x eeL 1)(22122212222)()2(21),(μσσμπσσπσμ取对数:∑=--+-=ni ixn L 12222)(21)ln 2(ln 2),(ln μσσπσμ分别对μ,2σ求导数:⎪⎪⎩⎪⎪⎨⎧=-+-=∂∂=-=∂∂∑∑==n i i ni i x n L x L 12422120ˆ)(212)(ln 0ˆ)(1)(ln μσσσμσμ )2()1(由(1)11n i i x x n =⇒μ==∑,代入(2)2221111()()n n i i i i x x x n n ==⇒σ=-μ=-∑∑∴2,σμ的极大似然估计值分别为: x x n n i i ==∑=11ˆμ;∑=-=n i i x x n 122)(1ˆσ 2,μσ的极大似然估计量分别为:11ˆn i i X x n μ===∑,222*11ˆ(-)n i i x x s n σ===∑ (2)定义法虽然求导函数是求最大似然估计量最常用的方法,但并不是所有场合求导都是有效的. 例6.1.8 设n x x x ,,,21 是均匀分布),0(~θU X 的样本,求θ的最大似然估计. 解:由已知X 概率函数为10(,)=0x p x θθθ⎧<≤⎪⎨⎪⎩,,其它(θ>0)设n x x x ,,,21 为取自X 的样本则,()11,0<()=;0,ni ni i x L f x θθθθ=⎧≤⎪=⎨⎪⎩∏其它⎪⎩⎪⎨⎧≤≤<=≤≤≤≤其它,0}{}{min 0111θθi ni i ni n x man x ,由于(,)p x θ与θ有关,不存在易解的似然方程,我们由定义,找)(θL 的最大值点,由)(θL 的表达式,θ越小nL θθ1)(=就越大因)(}{max n i L x x =≥θ,所以)(n x =θ时)(θL 达极大. 最大似然估计的不变性性质 如果θˆ是θ的最大似然估计,则对任一函数)(θg ,)ˆ(θg 是)(θg 的最大似然估计. 注 上述性质称为最大似然估计的不变性,从而使求复杂结构的参数的最大似然估计变得容易,具体应用略.例6.1.9 对正态总体),(2σμN ,),(2σμθ=是二维参数, n x x x ,,,21 为其样本,已知2,σμ的最大似然估计:11ˆn i i X x n μ===∑,222*11ˆ(-)n i i x x s n σ===∑,有最大似然估计的不变性可得标准差σ的MLE 为2*ˆs σ=, 概率3-(<3)=()P X μσΦ的MLE 为*3-()xsΦ, 总体0.90分位数0.900.90=+x u μσ⋅的MLE 为*0.90+x s u ⋅.§6.2点估计的评价标准教学目的:要求学生了解相合性、无偏性、有效性和均方误差的基本思想,理解相合性、无偏性、有效性和均方误差的基本概念,熟练掌握相合性、无偏性和有效性的判别方法.教学重点:相合估计、无偏估计和有效性.教学难点:如何确定相合估计、无偏估计和有效性.教学内容:本节内容包括相合性,无偏性,有效性和均方误差.我们已经看到,点估计有各种不同的求法,为了在不同的点估计间进行比较选择,就必须对各种点估计的好坏给出评价标准.数理统计中给出了众多的估计量评价标准,对同一估计量使用不同的评价标准可能会得到完全不同的结论,因此,在评价某一个估计好坏时,首先要说明是在哪一个标准下,否则所论好坏则毫无意义.但不管怎么说,有一个基本标准是所有的估计都应该满足的,它是衡量估计是否可行的必要条件,这就是估计的相合性.6.2.1 相合性定义6.2.1 设Θ∈θ为未知参数,),,,(ˆˆ21nn n x x x θθ=是θ的一个估计量,n 是样本容量,若对任一0>ε 有0)ˆ(lim =>-∞→εθθnn P 即),,,(ˆˆ21n n n x x x θθ=依概率收敛于θ,则称),,,(ˆˆ21nn n x x x θθ=为θ的相合估计. 相合性被认为是对估计的一个最基本要求,如果一个估计量在样本量不断增大时,它都不能把被估参数估计到任意指定的精度,那么这个估计是很值得怀疑的,通常,不满足相合性要求的估计一般不予考虑.注 证明估计的相合性一般可应用大数定律或直接用定义来证,有时借助于依概率收敛的性质.例6.2.1设n x x x ,,,21 是来自正态总体),(2σμN 的样本,则由辛钦大数定律及依概率收敛的性质知 :x 是μ的相合估计,*2s 是2σ的相合估计,2s 也是2σ的相合估计.相合性的判别定理定理6.2.1 设),,,(ˆˆ21nn n x x x θθ=是θ的一个估计量,若 0ˆlim ,ˆlim ==∞→∞→nn n n Var E θθθ 则),,,(ˆˆ21nn n x x x θθ=是θ的相合估计. 证明 由切比雪夫不等式知:0>∀ε有22)ˆ()ˆ(εθθεθθ-≤≥-nnE P222ˆ2ˆ)ˆ(θθθθθθ+-=-)()(n n n E E E 22ˆ2)ˆˆθθθθθ+-+=)(()(n n n E E Var=-∴∞→2)ˆ(lim θθn n E ]ˆ2)ˆ(ˆ[lim 22θθθθθ+-+∞→nn n n E E Var 02022=+⨯-+=θθθθ 所以 0)ˆ(lim )ˆ(lim 022=-≤≥-≤∞→∞→εθθεθθn n n n E P 所以0)ˆ(lim =≥-∞→εθθnn P .例 6.2.2 设n x x x ,,,21 是均匀分布),0(~θU X 的样本,证明:θ的最大似然估计)(ˆn x =θ是θ的相合估计. 分析 直接验证定理6.2.1的条件.证明 略.定理 6.2.2 若nk n n θθθˆ,,ˆ,ˆ21 分别是k θθ,,1 的相合估计,),,(1k g θθη =是k θθ,,1 的连续函数,则)ˆ,,ˆ(ˆ1nkn n g θθη =是),,(1k g θθη =的相合估计, 证明 略.例 6.2.3 设一个试验有三种可能结果,其发生概率分别为23221)1(),1(2,θθθθ-=-==p p p ,现做了n 次实验,观测到三种结果发生的次数分别是321,,n n n ,n n n n =++321证明:n n 11ˆ=θ,,1ˆ32n n -=θnn n 2ˆ213+=θ均是θ的相合估计.分析 直接验证定理6.2.2的条件. 证明 略.6.2.2 无偏性定义6.2.2 ),,,(ˆˆ21nx x x θθ=是θ的一个估计,Θ∈θ,若对Θ∈∀θ,有θθ=ˆE ,则称),,,(ˆˆ21nx x x θθ=是θ的无偏估计,否则称为有偏估计. 注 相合性是大样本所具有的性质,而无偏性对一切样本均可以用.无偏性可以改写成0)ˆ(=-θθE ,这表明无偏估计没有系统偏差,当我们使用),,,(ˆˆ21n x x x θθ=估计θ时,由于样本的随机性,),,,(ˆˆ21nx x x θθ=与θ总是有偏差的,这种偏差时而正,时而负,时而大,时而小,无偏性表示,把这些偏差平均起来其值为零,这就是无偏性的含义.例6.2.4 对任一总体而言,当总体的k 阶矩k μ存在时,样本的k 阶原点矩k a 是总体的k 阶矩k μ的无偏估计.当总体的2阶矩存在时,样本方差∑=--=ni i x x n S 122)(11是总体方差VarX 的无偏估计,但∑=-=ni i x x n S122*)(1不是总体方差VarX 的无偏估计. 注 无偏性不具有不变性,即若),,,(ˆˆ21nx x x θθ=是θ的一个无偏估计,一般而言)ˆ(θg 不是)(θg 的无偏估计,除非)ˆ(θg 是θˆ的线性函数.例6.2.5 设正态总体~X ),(2σμN ,,n x x x ,,,21 为其样本,∑=--=ni i x x n S 122)(11是2σ的无偏估计,证明:2S S =不是σ的无偏估计.证明 略.注 (1)无偏估计可以不存在;(2)无偏估计可以不唯一;(3)无偏估计未必是一个好的估计.具体例子略.6.2.3 有效性参数的无偏估计可以有很多,如何在无偏估计中进行选择?直观的想法是希望该估计围绕在参数真值的波动越小越好,波动大小可用方差来衡量,因此人们常用无偏估计的方差的大小作为度量无偏估计优劣的标准,这就是有效性.定义6.2.3 设21ˆ,ˆθθ是θ的两个无偏估计,如果对任意的Θ∈θ,有 )ˆ()ˆ(21θθVar Var ≤ 且至少有一个Θ∈θ使得上述不等式严格成立,则称1ˆθ比2ˆθ有效.例 6.2.6 设n x x x ,,,21 为取自某总体的样本,记总体均值为μ,总体方差为2σ,则11ˆx =μ,x =2ˆμ都是μ的无偏估计,且1ˆμ比2ˆμ有效. 证明 略.例 6.2.7 设n x x x ,,,21 为取自),0(~θU X 总体的样本,对θ的两个无偏估计)(211ˆ,2ˆn x nn x +==θθ,证明:1ˆθ比2ˆθ有效. 证明 略.6.2.4 均方误差无偏估计是估计的一个优良性质,对无偏估计我们还可以通过其方差进行有效性的比较,然而不能由此认为:有偏估计一定是不好的估计,在有些场合,有偏估计比无偏估计更优,这就涉及如何对有偏估计进行评价.一般而言,在样本量一定时,评价一个点估计的好坏使用的度量指标总是点估计值),,,(ˆˆ21nx x x θθ=与参数真值θ的距离的函数,最常用的函数是距离的平方.由于具有随机性,可以对该函数求期望,这就是下式给出的均方误差2)ˆ()ˆ(θθθ-=E MSE 简单的推导可得到2)ˆ()ˆ()ˆ(θθθθ-+=E Var MSE 若θθ=ˆE ,则)ˆ()ˆ(θθVar MSE =.当),,,(ˆˆ21n x x x θθ=不是θ的无偏估计时,对均方误差)ˆ(θMSE ,不仅要看其方差的大小,还要看偏差大小.在均方误差的标准下,有些有偏估计优于无偏估计.例 6.2.8 设n x x x ,,,21 为取自),0(~θU X 总体的样本,在均方误差的标准下,)(012ˆn x n n ++=θ是θ的有偏估计,但)(012ˆn x n n ++=θ要优于)(11ˆn x nn +=θ这个无偏估计. 证明 略.§6.3 最小方差无偏估计教学目的:要求学生了解最小方差无偏估计的基本思想,理解最小方差无偏估计的基本概念,能用零无偏估计法判别最小方差无偏估计.能计算总体分布的Fisher 信息量和待估参数的C-R 下界,能用C-R 不等式判别有效估计.掌握最大似然估计相合渐近正态性.教学重点:最小方差无偏估计、C-R 不等式.教学难点:零无偏估计法判断最小方差无偏估计和C-R 不等式.教学内容:本节内容包括:Rao-Blackwell 定理,最小方差无偏估计,Cramer-Rao 不等式.6.3.1 Rao-Blackwell 定理定理6.3.1 (Rao-Blackwell 定理)设X 和Y 是两个随机变量,(X)=,(X)>0E Var μ,我们用条件期望构造一个新的随机变量()Y ϕ,其定义为()=E(X|Y=y)Y ϕ,则有(())=,Var((Y))Var(X)E Y ϕμϕ≤.其中等号成立的充分必要条件是X 和()Y ϕ 几乎处处相等. 将定理6.3.1应用到参数估计问题中可得定理 6.3.2 设总体概率密度函数是(;)p x θ,12,,,n x x x 是其样本,12=(,,,)n T T x x x 是θ的充分统计量,则对θ的任一无偏估计^^12=(,,,)n x x x θθ,令~^=(|)E T θθ,则~θ也是θ的无偏估计,且~^Var()Var()θθ≤. 6.3.2 最小方差无偏估计定义6.3.1 对参数估计问题,设^θ是θ的无偏估计,若对θ的任一个无偏估计量~θ,在参数空间Θ上都有~~()()Var Var θθθθ≤则称^θ为θ的一致最小方差无偏估计,简记为UMVUE.如果UMVUE 存在,则它一定是充分统计量的函数.一般来说,如果依赖充分统计量的无偏估计只有一个,则它就是UMVUE. 下面给出一个UMVUE 的判断准则.定理6.3.3 设12=(,,,)n X x x x 是来自某总体的一个样本,^^=)X θθ(是θ的一个无偏估计,^<+Var θ∞(),若对任意一个满足(()=0E X ϕ)的()X ϕ都有 ^(,)=0,Cov θθϕθ∀∈Θ,则^θ是θ的UMVUE.例6.3.26.3.3 Gramer-Rao 不等式定义6.3.2 设总体的概率函数(;),,p x θθ∈Θ满足下列条件: (1) 参数空间Θ是直线上的一个开区;(2) 支撑{:(;)>0}S x p x θ=与θ无关; (3) 导数(;)p x θθ∂∂对一切,θ∈Θ都存在; (4) 对(;),p x θ积分与微分运算可交换次序,即(;)(;)p x dx p x dx θθθθ+∞+∞-∞-∞∂∂=∂∂⎰⎰(5) 期望2[ln (;)]E p x θθ∂∂存在.则称2()[ln (;)]I E p x θθθ∂=∂为总体分布的费希尔(Fisher )信息量. 例6.3.3定理6.3.4 (Gramer-Rao 不等式) 设定义6.3.2的条件满足,12,,,n x x x 是来自该总体X 的一个样本,12=(,,,)n T T x x x 为()g θ的任一无偏估计,若'()()=g g θθθ∂∂存在,且对一切,θ∈Θ对11--=1()=,,);)nn i n i g T x x p dx dx θθ∞∞∞∞∏⎰⎰((x 的微分可在积分号下进行,即'11--=1111--=1=1()=,,)(;))=,,)[ln ;)];))nn i ni nnn i i ni i g T x x p dx dx T x x p p dx dx dx θθθθθθ∞∞∞∞∞∞∞∞∂∂∂∂∏⎰⎰∏∏⎰⎰((x ((x (x对离散总体,则将上述积分改为求和符号后,等式仍然成立,则有'2[()]()()g Var T nI θθ≥ (6.3.9)该式称为克拉美-罗(C-R )不等式,'2[()]()g nI θθ称为()g θ的无偏估计的方差的C-R 下界,简称()g θ C-R 下界.特别,对θ的无偏估计^θ,有^1()()Var nI θθ≥.§6.4 贝叶斯估计教学目的:要求学生了解贝叶斯估计的相关内容. 教学重点:贝叶斯估计的思想和简单贝叶斯估计的计算.教学难点:贝叶斯估计的思想.教学内容:本节内容包括统计推断的基础,贝叶斯公式的密度函数形式,贝叶斯估计,共轭先验分布6.4.1 统计推断的基础统计推断是根据样本信息对总体分布或总体的特征数进行推断.统计推断用到两种信息:总体信息和样本信息,而贝叶斯学派则认为统计推断还用到第三种信息:先验信息. (1) 总体信息总体信息即总体分布或总体所属分布族提供的信息. (2) 样本信息样本信息即抽取样本所得观测值提供的信息.(3) 先验信息先验信息就是抽样之前有关统计问题的一些信息.例6.4.1基于上述三种信息进行统计推断的统计学称为贝叶斯统计学.贝叶斯学派的基本观点是:任一未知量θ都可看作随机变量,可用一个概率分布去描述,这个分布称为先验分布.6.4.2 贝叶斯公式的密度函数形式(1)总体依赖于参数θ的概率函数在经典统计中记为(;)p x θ,它表示参数空间Θ中不同的θ对应不同的分布.在贝叶斯统计学中记为(|)p x θ,它表示在随机变量θ取某个给定值时总体的条件概率函数.(2)根据参数 θ的先验信息确定先验分布πθ(). (3)从贝叶斯观点来看,样本的产生要分两步,首先设想从先验分布)(θπ产生一个样本0θ.第二步从)|(0θX p 中产生一组样本,这时样本),,(1n x x X =的联合条件概率函数为)|()|,()|(01010θθθi ni n x p x x p X p =∏== ,这个分布综合了总体信息和样本信息.(4) 由于0θ是设想出来的,故要用πθ()进行综合,样本X 和参数θ的联合分布为)()|(),(θπθθX p X h =.(5)有了样本观察值),,(1n x x X =后,对),(θX h 作如下分解:)()|(),(X m X X h θπθ=,)(X m 是X 的边际概率函数:⎰⎰ΘΘ==θθπθθθd X p d X h X m )()|(),()(,⎰Θ==θθπθθπθθθπd X p X p X m X h X )()|()()|()(),()|(,称为θ的后验分布.6.4.3 贝叶斯估计由后验分布)|(X θπ估计θ有三种常用方法:(1) 使用后验分布的密度函数最大值点作为θ的点估计的最大后验估计; (2) 使用后验分布的中位数作为θ的点估计的后验中位数估计; (3) 使用后验分布的均值作为θ的点估计的后验期望估计. 用的最多的是后验期望估计,一般简称贝叶斯估计,记为^B θ.例6.4.2 例6.4.36.4.4 共轭先验分布定义6.4.1 设θ是总体参数,)(θπ是其先验分布,若对任意的样本观测值得到的后验分布)|(X θπ与)(θπ属于同一分布族,则称该分布族是θ的共轭先验分布族。

第6章 参数估计

第6章 参数估计

是取自总体 X 的样本 ,
n
则样本的联合分布律
P{ X 1 x1 ,, X n xn } p ( xi , ),
i 1
对确定的样本观察值 x1 , x2 ,, xn , 它是未知参数
的函数, 记为
L( ) L( x1 , x2 ,, xn , ) p ( xi , ),
这位同学命中的概率, 故一般会猜测这一枪是猎人 射中的. 最大似然估计法的思想: 在已得到试验结果的情况 下, 应寻找使这个结果出现的可能性最大的那个

值作为 的估计 ˆ.
第28页
离散型总体的情形:
P{ X x} p( x, ),
x1 , x2 , , xn
设总体 X 的概率分布为 其中 为未知参数. 如果
本, 试求 , 2 的矩估计量. 1 E ( X ) , 解
2 E ( X 2 ) D( X ) [ E ( X )]2 2 2 ,
X 令 2 2 n 1 2 2 S X n
X 2 n 1 2 S n
2 (n / 2)
可以证明,当n时, 有cn1. 这说明 s 是 的渐近无偏估计。
教材P304例6.1.3(Jackknife)
第7页
设 T ( x) 是基于样本x ( x1 , x2 ,, xn ) 的关于参数 g ( )
1 的估计量,且满足 E T ( x) g ( ) O( ). 如以 x( i )表示从 n 样本中删去 xi 后的向量,则 T ( x) 的刀切统计量为
6.2.1替换原理和矩法估计
替换原理是指用样本矩及其函数去替换相应的总 体矩及其函数,譬如: ˆ • 用样本均值估计总体均值E(X),即 E( X ) x ; ˆ • 用样本方差估计总体方差Var(X),即 Var( X ) s 2 • 用样本的 p 分位数估计总体的 p 分位数, • 用样本中位数估计总体中位数。

第六章估计基本理论—参数估计

第六章估计基本理论—参数估计

Cramer-Rao下界定义:任何一个无偏估计子方差 的下界常叫做Cramer-Rao下界。
第六章估计基本理论—参数估计
8/58
第六章 估计的基本理论—参数估计 6.1估计子的性能
主讲:刘颖 2009年秋
定理1.1:令 X( x1,x2, ,xN)为 一 个 样 fX 本 /是 向 量
X的 条 件 密 ˆ是 度 的一个。 无偏若 估计子,且
即 ln fX|Kˆ
其K 中 ( )是 的某个 x的 不正 包整 含数。
主讲:刘颖 2009年秋
1.1估计子的性能 令x(t)是一个与未知参数θ有关的随机信号,
x1,x2,,xN 是采样值,
θ的估计子记为 ˆg(x1,x2, ,xN )
其g中 (x1,x2, ,xN)是用来 的估 一计 个样本函
1. 无偏性
无偏估计定义:若Eˆ,则 ˆ就是 的一个无
否则就是有偏估计子。
参数估计:利用样本数据来估计待定的参数。 参数估计方法: (1)点估计:需求一个估计子,它将给出待定参数的单个估 计值,这个估计值叫点估计值。 (2)区间估计:确定的是待定参数可能位于某个区间,这个 区间叫做置信区间估值。
第六章估计基本理论—参数估计
3/58
第六章 估计的基本理论—参数估计 6.1估计子的性能
主讲:刘颖 2009年秋
渐进无偏估计定义:
ˆ是 的一个有l偏 ib m 估 ˆ0 , 计则 ˆ子 是 称 ,若
N
的渐进无偏估计子。
例题6.2 线性平稳过程的自相关函数的估计子为
R ˆ(m)1Nmx(n)x(nm)
Nn1 若假设观测数据 x(m)是独立的。判断它是否为无偏估 计,若是有偏估计,再判断是否为渐进无偏估计。

《卫生统计学》第六章 参数估计基础

《卫生统计学》第六章  参数估计基础
.
二、总体概率可信区间的计算
1.查表法:n≤50,特别是p接近0或100%时,可查 附表6(P478-480),二项分布概率的置信区间表, 例6-4。
注意:附表6中X值只列出了X≤n/2部分,当X>n/2 时,应以n - X值查表,然后用100减去查得的数 值,即为所求的区间。
2.正态近似法**:当n较大且np和n(1-p)均大于5 时,二项分布接近正态分布,则总体率的双侧 (1-α)可信区间为: P ± Ζα/2· Sp
f(t)
0.4
υ=∞
υ=5
0.3
υ=1
0.2
0.1
0.0
t
-5 -4 -3 -2 -1 0 1 2 3 4 5
图6-4 自由度为1、5、∞的t分布
.
t分布的特征:只有一个参数ν 以0为中心,左右对称的单峰分布; t分布是一簇曲线,形态变化与n(即自由度)大
小有关。自由度ν越小,t分布曲线越低平;自 由度ν越大,t分布曲线越接近标准正态分布 (Ζ分布)曲线。 t分布峰部较矮,尾部翘得较高,说明远侧的t值 的个数相对较多,即尾部面积(概率P)较大。 自由度ν越小这种情况越明显,ν渐大时,t分 布渐逼近标准正态分布;当ν=∞时,t分布就成 为标准正态分布了。 附表2,t界值表P467
.
均数的抽样误差——指由抽样而造成的样本均数 与总体均数之间的差异。
x 称标准误,它说明均数抽样误差的大小。
x / n
n越大,标准误越小,样本均数的抽样误差亦越小 实际工作中,σ常未知,而是用样本标准差s来估
计,则有 sx s/ n
常用来说明均数的抽样误差的大小。
.
即使从偏态总体抽样,当n足够大时, 样本均数也近似正态分布(见实验6-2, 观察图6-1及图6-2的变化)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章参数估计基础习题
一、是非题
1.总体率的区间估计中, 值越大,置信度越低.( )
2.样本率的标准误越小,抽样误差越大.( )
3.对同一样本资料来说,总体均数的置信区间宽度通常会小于医学参考值范围的宽度.()
4.置信度由99%下降到95%,置信区间估计的准确度也下降.( )
5.在t值相同时,双侧概率正好是单侧格率的2倍.( )
二、选择题
1.均数的标准误反映了( ).
A.个体变异程度B.集中趋势的位置
C.指标的分布特征D.样本均数与总体均数的差异
E.频数分布规律
2.用于描述均数的抽样误差大小的指标是( ).
A.S B.S C.CV D.R E.S2
3.抽样误差产生的原因是( ).
A.观察对象不纯B.非正态分布
C.个体差异D.非分类变量资料E.随机抽样方法错误4.均数95%置信任区间主要用于().
A.估计“正常人群”某指标95%观察值所在范围
B.反映总体均数有95%的可能在某范围内
C.反映某指标的可能取值范围
D.反映某措标的观察值波动范围
E.反映95%的样本均数在此范围内
5.以下关于参数估计的说法正确的是( ).
A.区间估计优于点估计B.样本含量越大,置信区间范围越大
C.样本含量越小,参数估计越精确D.对于一个参数可以获得几个估计值E.标准差大小与置信区间范围无关
三、筒答题
1.已知某地正常成年女性的平均空腹血糖值为 4.95mmol/L,标淮差为 1.03 mmol/L,某医疗机构从该地随机抽取40名正常成年女性,测得其平均空腹血糖值为5.17 mmol/L,试指出5.17 mmol/L与4.95 mmol/L不同的原因是什么?应该用什么指标来表示两者间的差别?
2.样本均数的抽样分布有哪些特点?
3.t分布与Z(标准正态分布)分布相比有什么特点?。

相关文档
最新文档