2019-2020年整理第六章 参数估计汇编
参数估计方法与实例例题和知识点总结
参数估计方法与实例例题和知识点总结在统计学中,参数估计是一项重要的任务,它帮助我们通过样本数据来推断总体的特征。
这一过程对于做出合理的决策、进行科学研究以及解决实际问题都具有关键意义。
接下来,让我们深入探讨参数估计的方法,并通过实例例题来加深理解,同时对相关知识点进行总结。
一、参数估计的基本概念参数估计,简单来说,就是根据样本数据对总体参数进行推测和估计。
总体参数是描述总体特征的数值,例如总体均值、总体方差等。
而我们通过抽样得到的样本数据则是进行参数估计的基础。
二、参数估计的方法(一)点估计点估计是用一个数值来估计总体参数。
常见的点估计方法有矩估计法和极大似然估计法。
矩估计法的基本思想是利用样本矩来估计总体矩,从而得到总体参数的估计值。
例如,对于正态分布,我们可以用样本均值来估计总体均值,用样本二阶中心矩来估计总体方差。
极大似然估计法则是基于这样的思想:在给定样本观测值的情况下,找到使样本出现的概率最大的总体参数值。
(二)区间估计区间估计是给出一个区间,认为总体参数有一定的概率落在这个区间内。
常用的区间估计有置信区间。
置信区间的构建基于样本统计量的分布,以及给定的置信水平。
例如,对于总体均值的估计,我们可以构建一个置信水平为 95%的置信区间。
三、实例例题假设我们对某工厂生产的灯泡寿命进行抽样调查。
抽取了 50 个灯泡,其寿命的样本均值为 1000 小时,样本标准差为 100 小时。
(一)点估计我们可以用样本均值 1000 小时作为总体均值的点估计值。
(二)区间估计若要构建 95%的置信区间,由于样本量较大,我们可以使用正态分布近似。
标准正态分布的 95%置信区间对应的 z 值约为 196。
则总体均值的 95%置信区间为:\\begin{align}&1000 196 \times \frac{100}{\sqrt{50}}\\&1000 + 196 \times \frac{100}{\sqrt{50}}\end{align}\计算可得置信区间约为(9608,10392)。
应用统计学第六章抽样与参数估计-学生版
经济类管理类
基础课程
需要知道Mean 的抽样分布!
x_
- 2.58x
-1.65 x
+1.65x
+ 2.58x
X
-1.96 x
+1.96x
90%的样本 95% 的样本
何为? 为何?
99% 的样本
z z P 1 - 7
2
x
x
2
1
x
经济类管理类
基础课程
统计推断的过程
总体
基础课程
2004年,珠海地区的移动通信市场已近饱和,移动电话 普及率已经超过100%。为保有存量市场的占有率, 要求运营商通过提供新的服务产品捆绑客户,提高客 户忠诚度。
珠海地区的通信市场除了存量市场激烈竞争外,也依然存 在广阔的增量市场前景。珠海市毗邻港澳,地理位置 优越;通过工业西进、大学园区、科技创新、旅游文 化的城市发展定位,造就了珠海通信市场高、新、快 的发展新特点。目前6000多家大型企业融入了珠海工 业园区的建设大潮、17所知名学府在珠海办学,被评 为全国旅游40佳之一。这些属性都是珠海公司推出创 新服务手段的依据所在,也是珠海移动在本地信息化 建设扮演重要角色的关键所在。
间估计 5. 掌握运用总体均值、总体比例和总体方差
的区间估计方法解决实际问题
1 - 10
经济类管理类
基础课程
第一节 参数估计基本方法
一. 点估计 二. 点估计的优良性准则 ג- 区间估计
1 - 11
经济类管理类
基础课程
估计方法
点估计
区间估计
1 - 12
经济类管理类
基础课程
1 - 13
P
2
1 2
2019-2020年高考数学新增分大一轮新高考专用课件:第六章 微专题七
(4)真分式ba的放缩: 若 a>b>0,m>0,则ba<ab++mm.
另外,利用重要不等式放缩、导数应用中有关ln x型的放缩(如:ln(1+x)<x, x>0)等也是常见的放缩方式. 利用放缩法证明不等式的难点是放缩的“度”不好把握,放大了或放小了都 得不出所证不等式,这样需要回头调整,留一项或几项不放缩逐步试验向所 证结论靠扰,下面举例说明.
2019/7/18
最新中小学教学课件
17
thank
you!
2019/7/18
最新中小学教学课件
18
编后语
• 同学们在听课的过程中,还要善于抓住各种课程的特点,运用相应的方法去听,这样才能达到最佳的学习效果。 • 一、听理科课重在理解基本概念和规律 • 数、理、化是逻辑性很强的学科,前面的知识没学懂,后面的学习就很难继续进行。因此,掌握基本概念是学习的关键。上课时要抓好概念的理解,
同时,大家要开动脑筋,思考老师是怎样提出问题、分析问题、解决问题的,要边听边想。为讲明一个定理,推出一个公式,老师讲解顺序是怎样的, 为什么这么安排?两个例题之间又有什么相同点和不同之处?特别要从中学习理科思维的方法,如观察、比较、分析、综合、归纳、演绎等。 • 作为实验科学的物理、化学和生物,就要特别重视实验和观察,并在获得感性知识的基础上,进一步通过思考来掌握科学的概念和规律,等等。 • 二、听文科课要注重在理解中记忆 • 文科多以记忆为主,比如政治,要注意哪些是观点,哪些是事例,哪些是用观点解释社会现象。听历史课时,首先要弄清楚本节教材的主要观点,然 后,弄清教材为了说明这一观点引用了哪些史实,这些史料涉及的时间、地点、人物、事件。最后,也是关键的一环,看你是否真正弄懂观点与史料间 的关系。最好还能进一步思索:这些史料能不能充分说明观点?是否还可以补充新的史料?有无相反的史料证明原观点不正确。 • 三、听英语课要注重实践 • 英语课老师往往讲得不太多,在大部分的时间里,进行的师生之间、学生之间的大量语言实践练习。因此,要上好英语课,就应积极参加语言实践活 动,珍惜课堂上的每一个*,求证:
概率论与数理统计(理工类-第四版)吴赣昌主编课后习题答案第六章【范本模板】
第六章参数估计6.1 点估计问题概述习题1总体X在区间[0,θ]上均匀分布,X1,X2,⋯,Xn是它的样本,则下列估计量θ是θ的一致估计是().(A)θ=Xn;(B)θ=2Xn;(C)θ=X¯=1n∑i=1nXi;(D)θ=Max{X1,X2,⋯,Xn}。
解答:应选(D).由一致估计的定义,对任意ɛ>0,P(∣Max{X1,X2,⋯,Xn}—θ∣〈ɛ)=P(-ɛ+θ〈Max{X1,X2,⋯,Xn}<ɛ+θ)=F(ɛ+θ)—F(-ɛ+θ).因为FX(x)={0,x〈0xθ,0≤x≤θ1,x〉θ,及F(x)=FMax{X1,X2,⋯,Xn}(x)=FX1(x)FX2(x)⋯FXn(x),所以F(ɛ+θ)=1,F(-ɛ+θ)=P(Max{X1,X2,⋯,Xn}〈—ɛ+θ)=(1—xθ)n,故P(∣Max{X1,X2,⋯,Xn}-θ∣〈ɛ)=1-(1-xθ)n→1(n→+∞).习题2设σ是总体X的标准差,X1,X2,⋯,Xn是它的样本,则样本标准差S是总体标准差σ的()。
(A)矩估计量;(B)最大似然估计量;(C)无偏估计量; (D)相合估计量。
解答:应选(D).因为,总体标准差σ的矩估计量和最大似然估计量都是未修正的样本标准差;样本方差是总体方差的无偏估计,但是样本标准差不是总体标准差的无偏估计.可见,样本标准差S是总体标准差σ的相合估计量.习题3设总体X的数学期望为μ,X1,X2,⋯,Xn是来自X的样本,a1,a2,⋯,an是任意常数,验证(∑i=1naiXi)/∑i=1nai(∑i=1nai≠0)是μ的无偏估计量。
解答:E(X)=μ,E(∑i=1naiXi∑i=1nai)=1∑i=1nai⋅∑i=1naiE(Xi) (E(Xi)=E(X)=μ)=μ∑i=1nai∑i=1n=μ,综上所证,可知∑i=1naiXi∑i=1nai是μ的无偏估计量。
习题4设θ是参数θ的无偏估计,且有D(θ)〉0, 试证θ2=(θ)2不是θ2的无偏估计.解答:因为D(θ)=E(θ2)-[E(θ)]2,所以E(θ2)=D(θ)+[E(θ)]2=θ2+D(θ)〉θ2,故(θ)2不是θ2的无偏估计。
第6章 参数估计课后习题答案(高教出版社,浙江大学)
16.0, 15.2, 12.0, 16.9, 14.4, 16.3, 15.6, 12.9, 15.3, 15.1 15.8, 15.5, 12.5, 14.5, 14.9, 15.1, 16.0, 12.5, 14.3, 15.4 15.4, 13.0, 12.6, 14.9, 15.1, 15.3, 12.4, 17.2, 14.7, 14.8 设样本来自正态总体,均未知。 (1) 求的无偏估计值。 (2) 求的置信水平为90%的置信区间。 解:(1)的无偏估计值为
。 令对数似然函数对的一阶导数为零,得到的最大似然估计值为
。 (2)根据(1)中结论,的最大似然估计值为。
5,(1)设服从参数为的几何分布,其分布律为。参数未知。设是一个 样本值,求的最大似然估计值。 (2)一个运动员,投篮的命中率为,以表示他投篮直至投中为止所需 的次数。他共投篮5次得到的观察值为
, , 相应的对数似然函数为 , , 令对数似然函数分别对和的一阶导数为零,得到 , 算出最大似然估计量分别为,。
10,(1)验证均匀分布中的未知参数的矩估计量是无偏估计量。 (2)设某种小型计算机一星期中的故障次数,设是来自总体的样本。 ①验证是的无偏估计量。②设一星期中故障维修费用为,求。 (3)验证是的无偏估计量。 解:(1)均匀分布中的未知参数的矩估计量为
。
16,Macatawa湖(位于密歇根湖的东侧)分为东、西两个区域。下面的 数据是取自西区的水的样本,测得其中的钠含量(以ppm计)如下: 13.0, 18.5, 16.4, 14.8, 19.4, 17.3, 23.2, 24.9,
20.8, 19.3, 18.8, 23.1, 15.2, 19.9, 19.1, 18.1, 25.1, 16.8, 20.4, 17.4, 25.2, 23.1, 15.3, 19.4, 16.0, 21.7, 15.2, 21.3, 21.5, 16.8, 15.6, 17.6 设样本来自正态总体,均未知。求的置信水平为0.95的置信区间。 解:根据题中数据,计算可得样本均值,样本方差。 的置信水平为0.95的置信区间为
统计学课后习题参考答案
思考题与练习题参考答案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。
回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。
学而不思则罔,如果直接抄答案,对学习无益,危害甚大。
想抄答案者,请三思而后行!第一章绪论思考题参考答案1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。
即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。
2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。
3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。
练习题参考答案一、填空题1.调查。
2.探索、调查、发现。
3. 目的。
二、简答题1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。
2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
三、案例分析题1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。
第六章估计基本理论—参数估计
Cramer-Rao下界定义:任何一个无偏估计子方差 的下界常叫做Cramer-Rao下界。
第六章估计基本理论—参数估计
8/58
第六章 估计的基本理论—参数估计 6.1估计子的性能
主讲:刘颖 2009年秋
定理1.1:令 X( x1,x2, ,xN)为 一 个 样 fX 本 /是 向 量
X的 条 件 密 ˆ是 度 的一个。 无偏若 估计子,且
即 ln fX|Kˆ
其K 中 ( )是 的某个 x的 不正 包整 含数。
主讲:刘颖 2009年秋
1.1估计子的性能 令x(t)是一个与未知参数θ有关的随机信号,
x1,x2,,xN 是采样值,
θ的估计子记为 ˆg(x1,x2, ,xN )
其g中 (x1,x2, ,xN)是用来 的估 一计 个样本函
1. 无偏性
无偏估计定义:若Eˆ,则 ˆ就是 的一个无
否则就是有偏估计子。
参数估计:利用样本数据来估计待定的参数。 参数估计方法: (1)点估计:需求一个估计子,它将给出待定参数的单个估 计值,这个估计值叫点估计值。 (2)区间估计:确定的是待定参数可能位于某个区间,这个 区间叫做置信区间估值。
第六章估计基本理论—参数估计
3/58
第六章 估计的基本理论—参数估计 6.1估计子的性能
主讲:刘颖 2009年秋
渐进无偏估计定义:
ˆ是 的一个有l偏 ib m 估 ˆ0 , 计则 ˆ子 是 称 ,若
N
的渐进无偏估计子。
例题6.2 线性平稳过程的自相关函数的估计子为
R ˆ(m)1Nmx(n)x(nm)
Nn1 若假设观测数据 x(m)是独立的。判断它是否为无偏估 计,若是有偏估计,再判断是否为渐进无偏估计。
生物统计学经典习题个人整理
第二节样本平均数与总体平均数差异显著性检验【例5.1】母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?根据题意,本例应进行双侧t检验。
1.提出无效假设与备择假设:=114,:≠1142、计算值经计算得:=114.5,S=1.581所以===1.000=10-1=93、查临界值,作出统计推断由=9,查值表(附表3)得=2.262,因为|t|<,P>0.05,故不能否定:=114,表明样本平均数与总体平均数差异不显著,可以认为该样本取自母猪怀孕期为114天的总体。
【例5.2】按饲料配方规定,每1000kg某种饲料中维生素C不得少于246g,现从工厂的产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素C 含量服从正态分布,问此产品是否符合规定要求?按题意,此例应采用单侧检验。
1、提出无效假设与备择假设:=246,:>246、计算值经计算得:=252,S=9.115所以===2.281=12-1=113、查临界值,作出统计推断因为单侧=双侧=1.796,|t|>单侧t0.05(11),P<0.05,否定:=246,接受:>246,表明样本平均数与总体平均数差异显著,可以认为该批饲料维生素C含量符合规定要求。
第三节两个样本平均数的差异显著性检验【例5.3】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表5-3所示。
设两品种后备种猪90kg时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg时的背膘厚度有无显著差异?表5-3长白与蓝塘后备种猪背膘厚度品种头数背膘厚度(cm )长白121.20、1.32、1.10、1.28、1.35、1.08、1.18、1.25、1.30、1.12、1.19、1.05蓝塘112.00、1.85、1.60、1.78、1.96、1.88、1.82、1.70、1.68、1.92、1.801、提出无效假设与备择假设:=,:≠2、计算值此例=12、=11,经计算得=1.202、=0.0998、=0.1096,=1.817、=0.123、=0.1508、分别为两样本离均差平方和。
概率论与数理统计参数估计小结
概率论与数理统计第6章参数估计
本章小结
01 知识点归纳
02 教学要求与学习建议
01 矩估计最大似然估计点估计地评价标准点估计
无偏性有效性相合性
参数
估计单个正态总体下地区间估计
区
间估计两个正态总体下地
区间估计3
01 知识点归纳
02 教学要求与学习建议
理解参数地点估计,估计量与估计值地概念.ꢀ 1.
掌握矩估计法(一阶矩,二阶矩)与最大似然估计法.了解估计量地无偏性,有效性与相合性(一致性)ꢀ 2.
ꢀ 3.地概念,并会验证估计量地无偏性.
理解区间估计地概念,会求单个正态总体地均值ꢀ 4.
与方差地置信区间,会求两个正态总体地均值差与差比地置信区间.
5
矩估计
考研重点最大似然估计点估计无偏性点估计地评价标准有效性相合性参数
估计
单个正态总体下地区间估计
区间估计
两个正态总体下地区间估计记忆为主
会求参数地点估计区间估计会判断估计量地无偏性
6
概率论与数理统计
学海无涯,祝你成功!。
第六参数估计演示文稿
i gi (1, ,k )
从这k个方程中解出 j j (1, , k )
则可给出诸j 的矩法估计为
ˆj j(a1, ,ak ), j 1, ,k ,
其中
a j
1 n
n i1
xij
例6.1.2 设总体服从指数分布,由于EX=1/, 即 =1/ EX,故 的矩法估计为
sn2 0.9185,
m0.5 28.6
由此给出总体均值、方差和中位数的估计分别
为: 28.695, 0.9185 和 28.6。
矩法估计的实质是用经验分布函数去替换总体 分布,其理论基础是格里纹科定理。
二、概率函数P(x,θ)已知时未知参数的矩法估计
设总体的分布含有k个未知参数 1, ,k ,那么它
第六章 参数估计
第1页
第六参数估计演示文稿
1 November 2020
宁波工程学院 理学院
第六章 参数估计
第2页
(优选)第六参数估计
1 November 2020
宁波工程学院 理学院
• 构造出适当的样本的函数 ˆ ˆ(x1,是当, xn务)
之急。
如何构造统计量 ˆ并没有明确的规定,只要
它满足一定的合理性即可。这就涉及到两个 问题:
例6.1.6 设一个试验有三种可能结果,其发生概率
分别为 p 2 , p 2 (1 ), p (1 )2
1
2
3
现做了n次试验,观测到三种结果发生的次数分别
为 n1 , n2 , n3 (n1+ n2+ n3 = n),则似然函数为
L(
)
(
2
ห้องสมุดไป่ตู้
2019-2020学年度新人教A版必修第二册第6章 6.3.4 平面向量数乘运算的坐标表示课件
法二:可先利用坐标形式的等价条件求k,再利用b=λa判定同 向还是反向.
栏目导航
[解] 法一:(共线向量定理法)ka+b=k(1,2)+(-3,2)=(k-3,2k +2),
a-3b=(1,2)-3(-3,2)=(10,-4), 当ka+b与a-3b平行时,存在唯一实数λ, 使ka+b=λ(a-3b). 由(k-3,2k+2)=λ(10,-4), 所以k2-k+3= 2=10-λ,4λ,
栏目导航
2.下列各对向量中,共线的是( ) A.a=(2,3),b=(3,-2) B.a=(2,3),b=(4,-6) C.a=( 2,-1),b=(1, 2) D.a=(1, 2),b=( 2,2) D [A,B,C中各对向量都不共线,D中b= 2 a,两个向量共 线.]
栏目导航
3.已知a=(-3,2),b=(6,y),且a∥b,则y=________. -4 [∵a∥b,∴-63=2y,解得y=-4.]
栏目导航
2.平面向量共线的坐标表示 (1)设a=(x1,y1),b=(x2,y2),其中b≠0,a,b共线的充要条 件是存在实数λ,使a=λb. (2)如果用坐标表示,向量a,b(b≠0)共线的充要条件是 _x_1y_2_-__x_2y_1_=__0__.
栏目导航
思考:两向量a=(x1,y1),b=(x2,y2)共线的坐标条件能表示成 xx12=yy12吗?
[证明] A→B=8-1,12+3=7,72,A→C=(9-1,1+3)=(8,4), ∵7×4-72×8=0, ∴A→B∥A→C,且A→B,A→C有公共点A, ∴A,B,C三点共线.
统计学第六章参数估计
第五节 必要样本容量的确定
一、平均数的必要样本容量 二、成数的必要样本容量 三、影响必要样本容量的因素
特点
抽样推断方法与其它统计调查方法相 比,具有省时、省力、快捷的特点,能以 较小的代价及时获得总体的有关信息。
1. 根据样本资料对总体的数量特征作出具有一定 可靠性的估计和推断 2. 按照随机性原则从全部总体中抽取样本单位 3. 抽样推断必然会产生抽样误差
参参第数数六估估章计计
本章内 容
一、抽样推断的基本概念与原理
二、参数估计中的点估计
三、参数估计中的区间估计
四、抽样组织方式及其参数估计
五、必要样本容量的确定
第一节 抽样推断的基本概念与原理 一、抽样推断的特点和作用 二、重复抽样与不重复抽样 三、抽样误差与抽样平均误差 四、抽样推断的理论基础 (大数法则、中心极限定理) 五、参数估计的基本步骤
3. 根据所要求的置信水平,查正态分布表、t分布 表或其他分布表获得对应的概率度,然后再计算出抽 样极限误差,最后对总体参数作出区间推断。
点估计
点估计,也称定值估计,就是以样本估计量 直接代替总体参数的一种推断方法。 点估计常用方法:矩估计法、极大似然估计法。
点估计量的优良标准
1. 无偏性
E(x); E(p)
数落在抽样平均数 x 的范围之内;总体成 x
数落在抽样成数 pp 的范围之内。
例题2
概率度
总体参数的区间估计
例题3
开头例题
例题3
例题3
开头例题
简单随机抽样
简单随机抽样又叫纯随机抽样, 是最简单、最普遍的抽样组织方法。 它是按照随机性原则直接从总体的全 部单位中,抽取若干个单位作为样本 单位,保证总体中每个单位在抽选中 都有同等被抽中的机会。
ARMA模型的参数估计主要内容(精)
第六章 ARMA 模型的参数估计—主要内容 §6.1 AR(p)模型的参数估计 问题: 已知p 的AR(p):1,0pt j t j t j X a X t ε-==+≥∑,2~WN(0,)t εσ.(1.1)由12{,,,}N x x x 去估计12(,,,)T p a a a =a 和2σ.1. AR(p)模型的Yule-Walker 估计自回归系数p a 由自协方差函数{}k γ惟一确定.111121022120p p p p p p a a a γγγγγγγγγγγγ----⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦ 白噪声的方差2σ由20Tp p σγ=-γa 决定. 现获12{,,,}N x x x , N p >, 则作(1) ,1~t t N y x x t N =-=;(2) 11ˆ,0,1,,N k k jj k j yy k p Nγ-+===∑;(3) 只要12,,,N x x x 不全同, 则ˆpΓ正定, 得惟一 1ˆˆˆp p p -=a Γγ, 2100ˆˆˆˆˆˆˆˆT T p p p p p σγγ-=-=-γa γΓγ.实用中, Levinson 递推公式(无需求逆, 快):(1)2001,1102221,1,11,21,1,101,12,2,1,,1,1,1ˆˆˆˆˆˆˆˆ(1)ˆˆˆˆˆˆˆ...ˆˆˆˆˆˆˆˆ...ˆˆˆˆ,1,k k kk k k k k k k k k k k k k k k k j k j k k k k j a a a a a a a a a aa a a j k k p σγγγσσγγγγγγγγ-+-++++++-⎧=⎪=⎪⎪=-⎪⎨----⎪=⎪----⎪=-≤≤≤⎪⎩(2) 12,1,2,ˆˆˆˆˆˆ(,,,)(,,,)p p p p p a a aa a a =,22ˆˆp σσ=.以上Yule-Walker 估计的最大优点是:1ˆˆ()10,when ||1pj j j Az a z z ==-≠≤∑ 即最小相位(只要1ˆp +Γ正定). 定理 1.1(参见[18]) 若2~WN(0,)t εσ独立同分布,4E t ε<∞, 则当N →∞时, 有(1) 22ˆˆ,,..,1j j a a a s j p σσ→→≤≤;(2) 2111ˆˆ(,,)(0,)T p p p N a a a a N σ---−−−→Γ依分布(3)1ˆsup ||(lnln ),a.s.j j j pN aa O N ≤≤-=, 221ˆsup ||(lnln ),a.s.j j j pN O N σσ≤≤-=. 由上(2)得:,ˆ()(0,)T j j j j N a a N σ-−−−→依分布.(其中,j j σ是21p σ-Γ中相应元素)置信水平0.95的j a 渐近区间:,,ˆˆ[ 1.96, 1.96]j j j j j j aN a N σσ-+.2. AR(p)模型的最小二乘估计 设12,,,p d d d 是12,,,p a a a 的估计, 称使残差1122ˆ()j j j j p j p y d y d y d y ε---=-+++的2121ˆ(,,,)Np jj p S d d d ε=+=∑最小的ˆ{}jd 为最小~. 记1111122212,,p p p p p p p N N N p N y y y y d y y y d y d y y y y -+++---⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦Y X d 当T X X 正定时, 有惟一的112ˆˆˆ(,,,)()T T T p aa a -=X X X Y 22121||ˆˆˆˆ(,,,)p X S aa a N pN pσ-==--Y a .理论表明:1ˆˆp Y W O N -⎛⎫-= ⎪⎝⎭d a 最小二乘估计估计,N →∞. 即两种估计差别不大. 对二乘估计,也有大样本性质定理1.2若4E t ε<∞,2~WN(0,)t εσ独立同分布,12ˆˆˆ,,,p a a a是最小二乘估计, 则当N →∞时, 有2111ˆˆ(,,)(0,)T p p p N a a a a N σ---−−−→Γ依分布3. AR(p)模型的最大似然法 设模型的 21~(0,)pt t j t jj X a XN εσ-==-∑, 则212111(,,)~exp 22N pN t N t t p ϕεεεσπσ-+=+⎛⎫⎛⎫- ⎪ ⎪⎝⎭⎝⎭∑从而得关于12,,,N x x x 的似然函数为2(,)L σa 221111exp 22N pp N t j t j t p j x a x σπσ--=+=⎛⎫⎛⎫⎛⎫ ⎪=-- ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭∑∑通过解似然方程222(ln (,))(ln (,))0,0,L L σσσ∂∂==∂∂a a a结果2,σa 同最小二乘法.例1.1 设白噪声{}~(0,1)t N ε, 模型为12341.160.370.110.18t t t t t t x x x x x ε----=--++分别用Yule-Walkey 法和最小二乘法估计参数2,σa . 结果见程序ese6_1_1.m 4. AR(p)模型的定阶问题若偏相关系数ˆˆ,,0,0k pk pk k k k a a =>≠≈, 则认为ˆp p=. ,11011,22102120,ˆˆˆˆˆˆˆˆˆˆˆˆk k k k k k k k k a a a γγγγγγγγγγγγ----⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦,1,2,1[][...0...0]T T k k k k p a a a a a =以上结果由以下定理保证.定理1.3 若AR(p)中2~WN(0,)t εσ是独立同分布, 则对任何k p >, 有,,ˆlim 0,j k j N a j pa j p→∞≤⎧=⎨>⎩.为了检验0,:0k k H a =, 可借助,,ˆk k k k aa -极限分布. 定理1.4 若AR(p)中2~WN(0,)t εσ是独立同分布的, 4E t ε<∞, 则对确定的k p >, 有21,1,1,,ˆˆ(,,)(0,)T k k k k k k k N a a a a N σ---−−−→Γ依分布推论1.5 在定理1.4的条件下, 对k p >, 有,ˆ(0,1)k k Na N −−−→依分布.(证明略见196页)故,ˆk k a有95%的概率落在 ( 1.96,1.96)N N -.因此取p 的估计, 1.96ˆˆsup{:||,110}j j pj a j k N=>≤≤≈ 可能较高.实际中, 常用AIC 准则: (1) 分别取00,1,,p k P ==(上界或较大数);(2) 求AR(k )时的2ˆk σ; (3) 计算 202ˆAIC()ln ,0,1,,k kk k P Nσ=+= (4) ˆmin{|[AIC()]}kpk k = 称为AIC 定阶. 注1: 一般ˆpp ≥(真), 并无ˆp p −−−→依概率, 即不相合; 注2: 通常, 略高的阶数比低的阶数要好. 有利历史数据利用, 等.为克服不相合, 改用BIC(k )函数定阶.20ln ˆBIC()ln ,0,1,,k k Nk k P Nσ=+=(上界) 注3: 若2~WN(0,)t εσ是独立同分布的, 则BIC(k )是强相合的;注4: 当N 不大, BIC 定阶偏低,会失真, 宜取AIC.5. AR(p) 模型的拟合检验 设由12{,,,}N x x x 已得ˆp, 12ˆˆˆ(,,,)p a a a , 2ˆσ, 对残差:ˆ1ˆˆˆ,1~pt t j t j j y a y t p N ε-==-=+∑, 用§4.3白噪声检验: 若符, 则认可, 并用于预测,否则重估、改用MA(q), ARMA(p,q).6. AR(p)序列的谱密度的估计ˆp,12ˆˆˆ(,,,)p a a a ,2ˆσ代入2i 2()2|(e )|f A λσλπ=.注5: 若t ε是独立同分布的2WN(0,)σ,ˆp是由AIC 或BIC 定阶的, 则ˆ()fλ一致收敛到()f λ.例1.2 {}t x 取附录B7 中的300个数据, 对 AR 模型的阶数分别 为01~10p P ==上界, 解Y-W 方程, 4截尾的.2468100.020.040.060.080.10.120.142468100.060.080.10.120.140.160.18246810-0.4-0.200.20.40.60.81kγAICBIC所以用B7数据拟合出AR 模型的阶数应为4, 即 12341.1490.3150.1300.196t t t t t t X X X X X ε----=--++通常AIC 定阶略高, 下图即为用以上模型产生的300个数据, 重复1000次中定阶的结果, 定阶有别.1234567891020040060080012345678910100200300400500600700AICBIC但充分多数据和大数重复后, 定阶的情况很接近.123456789100200400600800123456789102004006008001000例1.3 对用B7数据拟合出的模型, 进行拟合检验. (1) 中心化: t t N y x x =-;AICBIC(2) 计算残差:41234ˆ 1.1490.3150.1300.196t t t t t t y y y y y ε-----=-++-; (5~296t =)(3) 计算ˆ:1296t t ε≤≤的自相关系数 ˆ{},1~k k M ρ=; (4) 计算卡方值: (假设是白噪声的统计量)222212ˆˆˆˆ()296()m m χρρρ=+++;(5) 计算临界值()chi2inv(0.95,),1~20m m m λ==(6) 判断: 所有2ˆ()(),1~20m m m χλ<=, 则不能拒绝残差是独立的白噪声的假设, 即认可.5101520051015202530350123402468101214160.05()m λ临界值2ˆ()m χ()fλ实线ˆ()fλ虚线§6.2 MA(q)模型的参数估计 MA(1)模型: 1,t t t X b t εε-=+∈, ||1b <.不难得: 22201(),b b γσσγσ=+=,于是得: 121b b ρ=+, 即2110b b ρρ-+=, 可解得: 2111142b ρρ--=, (112ρ<,||1b <时).估计值: 211 a.s.ˆ114ˆˆ2b b ρρ--=−−−→,(t ε独立白噪声).1. 一般可逆MA(q)模型的矩估计及其计算 若先知1,qt t j t jj X b t εε-==+∈∑,2~WN(0,)t εσ,则有{:0}k k q γ≤≤及1q +个非线性方程2011()k k k q k q b b bb b b γσ+-=+++ (01b =)反之, 若先知{}k γ, 由上方程, 可解得21~{,}q b σ.线性迭代法求解法: (1) 用12,,,N x x x 求0ˆˆ~q γγ;(2) 初值: 任取212(0),(0)[(0),(0),,(0)]T q b b b σ=b(3) 迭代:202211122ˆ(),1(1)(1)ˆ()[(1)(1)()(1)(1)],ˆ().(11)()q kk k q k q k q j b j b j b j b j b j j b j b j b j k q j γσγσγσ+-⎧=⎪+-++-⎪⎪=---+⎪⎨⎪+--⎪⎪=↑≤≤-⎪⎩(4) 停止:2ˆ|()()()|()qq kkt t k k t j b j b j γσδ-+==-<∑∑某.(5) 检验可逆条件, 不满足, 重取初值, 重算.也可用§3.1中的方法(MA(q)的k γ是q 截尾的) (1) 用12,,,N x x x 求0ˆˆ~q γγ;(2) 作,1~ˆ,0,()0,k k k l j l j k k qk q γγΓγ-=≤≤⎧==⎨>⎩(3) 分别计算1ˆˆˆlim T k k kk ∏ΩΓΩ-→∞=和 2021ˆˆˆˆˆ,()ˆT q C C A C σγ∏∏σ=-=-b γ 其中:1010001001000,0000001000000q q qA C ⨯⨯⎛⎫⎛⎫ ⎪ ⎪==⎪ ⎪⎪ ⎪⎪⎝⎭⎝⎭1212312111ˆ,k k k q q q q q k q q qγγγγγγγγΩγγγγ+++-⨯⨯⎛⎫⎛⎫ ⎪⎪==⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭γ12ˆˆˆˆ(,,,)T qb b b =b . 合理性由以下定理给出. 定理2.1若MA(q)中t ε是独立同分布的2WN(0,)σ,则当N 充分大后,1ˆˆ,,qb b 几乎必然满足可逆条件. 实用可逆充分条件是: i ˆe0,[,]qk kk qλγλππ-=->∈-∑.2. MA(q)模型的逆相关函数法—简介 想法: 视 MA 模型 AR 模型,故先求AR 模型参数, 而后求MA 模型参数, 即1qt t j t j j X b εε-==+∑1()()t t t t X B z X B z εε⇔=⇔=1(1)jj t t j a z X ε∞=⇔-=∑1(1)pj j t t j a z X ε=⇔-≈∑:AR(p)方法步骤:(1) 用1~N x ,求ˆ{}k γ,用AIC 等法定出AR(p)的阶N p ;(2) 取N p p =, 用Y-W 方程确定2,1,2,ˆˆˆˆ,,,,p p p p p a a a σ;(3) 用引理2.2, 计算ˆ()y k γ, 即(,01p a =-),,201ˆˆ,0ˆ()ˆ0,p kp jp j k j y paak p k k pγσ-+=⎧≤≤⎪=⎨⎪>⎩∑,(4) 利用Y-W 方程12ˆˆˆˆˆ(1)(0)(1)(1)ˆˆˆˆˆ(2)(1)(0)(2)ˆˆˆˆˆ()(1)(2)(0)y y y y y y y y y y y y q q b q b q q q b γγγγγγγγγγγγ⎡⎤--⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥---⎣⎦⎣⎦⎣⎦和212ˆˆˆˆˆˆˆˆ(0)(1)(2)()p y y y q yb b b q σγγγγ-=++++ 求得(12ˆˆˆ,,,qb b b )和2ˆσ.3. MA(q)模型的新息估计方法—简介设1ˆ0X =, 111ˆ(|,,)k k k X L X X X ++=;则样本新息: 1111ˆ(|,,)k k k k X L X X X ε+++=-; 预测均方差: 21ˆE k k νε+=; 前证可表: 1,11ˆˆ,qm m j m j j X m q θε++-==≥∑, ,m j θ递推得,当m 较大时, 得: 新息m ε的估计ˆˆm m mX X ε=-, 由此对较大的t , 得近似MA(q)模型11ˆˆˆˆqqt t j t j t t j t j j j X b X X b εεε--==≈+=-+∑∑从而有1ˆˆqt j t j j X b ε-=≈∑与1,1ˆˆqm m j m j j X θε+-==∑比; 合理的估计: 2,ˆˆ,1~,j m jm b j q θσν===; 具体的新息估计步骤: (1) 用12,,,N x x x , 取1/3()m o N =, 计0ˆˆ~m γγ;(2) 用递推公式 约定10()0j -=∑,001,,,0120,0ˆˆˆˆˆˆˆˆ,01ˆˆˆˆ,1k n n k n k k k j n n j j k j n n n n j j j k n n mνγθγθθνννγθν-----=--==⎡⎤=-≤≤-⎢⎥⎣⎦=-≤≤∑∑ (3) 取2,ˆˆˆˆ,1~,j m jm b j q θσν===. 方法的理论依据为定理2.3([18]) 略.4. MA(q)模型的定阶方法—(q 后截尾特点)⎧⎪⎪⎨⎪⎪⎩(1) 0ˆˆˆˆ{/}k k qk ργγ==使开始明显变小的 (2) AIC 定阶1) 假设已获得q 的上界0Q ;2) 逐个计算MA(m )(00,1,2,,m Q =)的2ˆm σ; 3) 计算20ˆAIC()ln()2/,0,1,2,,m m m N m Q σ=+=4) 比出最小值的最小m 作为q 的估计.5. MA(q)模型的拟合检验设由12{,,,}N x x x 已得ˆq , 12ˆˆˆ(,,,)qb b b , 2ˆσ,令 ˆˆ120ˆˆˆ0,q q t t N y x x εεε--=====- 和 ˆ1ˆˆˆ,1~q t t j t j j y b t N εε-==-=∑,对1/3()L O N =, 若 ˆ{:,1,,}t t L L N ε=+为白噪声, 则认可模型, 否则重新估计拟合模型. 或改用AR(p), ARMA(p,q)例2.1设{}t x 是§3.1例1.1中197个化学浓度的数据, 对数据1t t t y x x -=-建立MA(1)模型为10.5276,t t t Y t εε-=+∈拟合检验步骤:(1) 取3[197]16L =+=; (2) 计算残差: 令1ˆ0ε=, 1ˆˆ0.5276,2~197t t t y t εε-=+= (3) 计算ˆ{:~197}t t L ε=的自相关系数; (4) 计算0ˆ:{:~197}t H t L ε=是白噪声的统计量 222212ˆˆˆˆ()192()m m χρρρ=+++;(5) 计算临界值()chi2inv(0.95,),1~15m m m λ==(6) 判断: 若所有2ˆ()()m m χλ<, 1~15m =, 则不能拒绝残差是独立的白噪声的假设.0510150510152025模型通过检验.6. MA(q)序列的谱密度的估计把ˆq ,12ˆˆˆ(,,,)q b b b ,2ˆσ代入2i 2()|(e )|2f B λσλπ= 得谱估计: 2ˆˆ()2f σλπ=2ˆi 0ˆ1e q j jj b λ=+∑. 若参数是相合估计, 则ˆ()fλ是()f λ的相合估计.例2.2 模拟计算MA(2)模型120.360.85,t t t t X t εεε--=-+∈.分别用(1) 矩估计方法;(2) 逆相关函数方法;(3) 新息估计方法;对来上述模型100个(或300个)数据进行参数估计. 结果见程序tse6_2_2.m。
第6章参数估计1
表5-3 10人中有放回抽二人的全部可能样本
第二次抽取可能被抽中的人员
1
2
3
4
5
6
7
8
9
10
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
1,10
(1)
(1.5)
(2)
(2.5)
(3)
(3.5)
(4)
(4.5)
(5)
(5.5)
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
第六章 参数估计
第一节 抽样的基本概念与数学原理 第二节 名词解释 第三节 参数的点 第四节 抽样分布 第五节 正态总体的区间估计 第六节 大样本区间估计
5-1
第一节 统计推论
一、什么是统计推论 特点:资料来源于实践、抽样结果不唯一 二、统计推论的内容 1.参数估计 2.假设检验
第三节 参数的点估计
一、总体参数的点估计 均值、方差、成数的点估计 二、评价估计值的标准 1.无偏性 2.有效性 3.一致性
5-28
一、总体参数的点估计 1.总体均值的点估计 2.总体比例的点估计 3.总体方差的点估计
5-29
(一)参数估计的定义与种类 所谓参数估计,就是用样本统计量去估
5-12
【例 5-2】 对某公司 10 名推销员用放回抽样方式抽取容量为 n=2
n
的样本(y1,y2),构造统计量 Y
( i1
yi
)
/
n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 参数估计题型归类与解题方法1. 点估计1.1 矩估计法设总体X 的分布形式已知,m θθθ,,,21 是总体分布中的未知参数,n X X X ,,,21 是来自总体X 的一个样本,求m θθθ,,,21 的矩估计的步骤如下:(1)总体X 的前m 阶矩⎪⎪⎩⎪⎪⎨⎧======),,,()(),,,()(),,,()(21212222111m m m mmm X E X E X E θθθμμθθθμμθθθμμ (2)解(1)中的m 个方差得未知参数m θθθ,,,21⎪⎪⎩⎪⎪⎨⎧===),,,(),,,(),,,(2121222111m m m mm μμμθθμμμθθμμμθθ (3)用样本矩∑==n i ki k X n A 11代替相应的总体k 阶矩k μ,得到m θθθ,,,21 的矩估计⎪⎪⎩⎪⎪⎨⎧===),,,(),,,(),,,(21^212^2211^1m m m m m A A A A A A A A A θθθθθθ 例6.1 设总体X 以等概率θ/1取值θ,,2,1 ,求未知参数θ的矩估计量 解 由2/)1()/1()/1(2)/1(1)(1θθθθθμ+=⨯++⨯+⨯== X E 得121-=μθ,故θ的矩估计量为 12122^-=-=X A θ 例6.2 设总体X 的概率密度为)0(,010,),(1>⎩⎨⎧<<=-θθθθ其它x x x f求未知参数θ的矩估计量解 1)(111+===⎰-θθθμθdx x x X E ,解得 111μμθ-=,故θ的矩估计量为 XXA A -=-=1111^θ 例6.3 设总体X 的概率密度为⎩⎨⎧<<-=其它,00,/)(6),(3θθθθx x x x f 求未知参数θ的矩估计量 解 2/)(6)(131θθθμ=-⋅==⎰dx x x x X E解得12μθ=,故θ的矩估计量为X A 221^==θ例6.4 设总体X 的概率密度为}exp{1),,(21221θθθθθ--=x x f )0,(21+∞<<+∞<<<-∞θθx求21,θθ的矩估计量解2121211}e x p {1)(θθθθθμθ+=--⋅==⎰+∞dx x x X E ,)(2}exp{1)(212212122221θθθθθθθμθ++=--⋅==⎰+∞dx x x X E ,解得 2122μμθ-=,21211μμμθ--=,故21,θθ的矩估计量分别为∑=--=--=n i i X X n X A A A 122121^1)(1θ,∑=-=-=n i i X X n A A 12212^2)(1θ 1.2 极大似然估计法设总体X 的分布形式已知,m θθθ,,,21 是总体分布中的未知参数,),,,(21n x x x 为样本),,,(21n X X X 的观测值,求m θθθ,,,21 的极大似然估计的步骤如下:(1) 求似然函数),,,;,,,(2121n m x x x L θθθ,若总体X 为离散型,其分布律为 ),2,1)(;,,,(}{21 ===k x P x X P k m k θθθ 则 );,,,(),,,;,,,(2112121i m ni n m x P x x x L θθθθθθ ∏==若总体X 为连续型,其概率密度为);,,,(21x f m θθθ ,则);,,,(),,,;,,,(2112121i m ni n m x f x x x L θθθθθθ ∏==(2) 求似然函数),,,;,,,(2121n m x x x L θθθ的极大值点或最大值点,若似然函数L 是关于m θθθ,,,21 的可微函数,则解以下对数似然方程组0)(ln =∂∂iL θ ),,2,1(m i = 所得解即为待估参数的极大似然估计值,若似然方程无解或似然函数不可微,则利用似然函数的性质和最大值点的意义求似然函数的最大值点(3) 用样本),,,(21n X X X 代替(2)中结果的),,,(21n x x x ,得到mθθθ,,,21 的极大似然估计量.例6.5 设总体),(~λπX n x x x ,,,21 是来自总体X 的一个样本,求未知参数λ的极 大似然估计量解 因X 的分布律为),2,1,0(!}{ ===-k k e k X P k λλ故似然函数为∏=-=ni i x x e L i1!)(λλλ两边取对数得 )!l n (ln )()(ln 11∑∏==-+-=ni ni iix x n L λλλ, 令 0/))((ln 1=+-=∑=n x n d L d ni i λλ,解得 x x n ni i ==∑=11λ,故λ的极大似然估计值为x =^λ,极大似然估计量为X =^λ例6.6 设总体X 的概率密度为)0(0,00,),(>⎩⎨⎧<≥=-θθθθx x e x f x今从X 中抽取10个个体,得数据如下:1050,1100,1080,1200,1300,1250,1340,1060,1150,1150.试求θ的极大似然估计值.解 似然函数为 )0()(1≥=∏=-i ni x x e L iθθθ两边取对数得 ∑=-=ni ixn L 1ln )(ln θθθ,令 0))((ln 1=-=∑=ni i x n d L d θθθ,解得θ的极大似然估计值为 xxnni i11^==∑=θ 例6.7 求例6.4中21,θθ的极大似然估计量 解 似然函数为 )}(exp{1),(1211221θθθθθθ>--=∏=i i ni x x L两边取对数得 ∑=-+-=ni ixn n L 12212211ln ),(ln θθθθθθ,0),(ln 2121≠=∂∂θθθθnL注意到1θ>i x ,故i i x θθ≤≤=1^min 时,),(ln 21θθL 达到最大.令 01),(ln 1222212221=+--=∂∂∑=ni ixn n L θθθθθθθ,解得 11121θθθ-=-=∑=x x n ni i ,故21,θθ的极大似然估计量分别为i ni X ≤≤=1^1min θ,i ni X X ≤≤-=1^2min θ2. 点估计的评价标准2.1 无偏估计量的判断与证明例 6.8 设总体X 的期望为μ,方差为2σ,n X X X ,,,21 ;m Y Y Y ,,,21 分别是来自总体X 的两个样本,证明 ])()([2121212Y Y X X m n S mi i n i i -+--+=∑∑==是2σ的无偏估计量,其中Y X ,分别为两个样本的样本均值.证 由 =--∑=])(11[21n i i X X n E 221])(11[σ=--∑=m i i Y Y m E ,]})([])([{21)(21212Y Y E X X E m n S E mi i n i i -+--+=∑∑== 222])1()1[(21σσσ=-+--+=m n m n故2S 是2σ的无偏估计量.例6.9 设随机变量X 在区间],0[θ上服从均匀分布,θ未知, n X X X ,,,21 是来自X 的一个样本,令),,,max(21)(n n X X X X =,试证明)(n X 是θ的有偏估计量,而)(1n X nn +是θ的无偏估计量. 证 由题设知X 的概率密度为⎪⎩⎪⎨⎧≤≤=其他,00,1)(θθx x f ,的分布函数为 ⎪⎩⎪⎨⎧>≤≤<=θθθx x x x x F ,,10/0,0)(故)(n X 的分布函数为 ⎪⎩⎪⎨⎧>≤≤<=θθθx x x x x F nn n ,,10/0,0)()()(n X 的概率密度为 ⎪⎩⎪⎨⎧≤≤==-其他,00,)()(1')()(θθx x n x F x f n nn n 因01)(10)(≠+=⋅=-⎰θθθn ndx x nx X E n nn ,故)(n X 是θ的有偏估计量,因 θ=+=+)(1]1[)()(n n X E n n X n n E ,故)(1n X nn +是θ的无偏估计量.例6.10 设总体),(~2σμN X ,n X X X ,,,21 是来自X 的一个样本,试确定常数C ,使∑-=+-1121)(n i i i X XC是2σ的无偏估计量.解 因)1,,2,1)(2,0(~21-=-+n i N X X i i σ,故)1,0(~21N X X ii σ-+从而 )1(~2)(2221χσi i X X -+,由2χ分布的可加性得)1(~)(21211212--∑-=+n X Xn i i i χσ因 =-∑-=+])([1121n i i i X XCE CE X X CE n i i i 211212])([σ=-∑-=+])(21[11212∑-=+-n i ii X Xσ 22)1(2σσ=-=n C 故 )1(21-=n C2.2 有效性的判断与证明例6.11 设总体)1,(~μN X ,21,X X 是X 的样本,验证21^13132X X +=μ, 21^24341X X +=μ,21^32121X X +=μ都是μ的无偏估计量,并问哪一个更有效.解 μμμμ=+=+=+=3132)(31)(32)3132()(2121^1X E X E X X E Eμμμμ=+=+=+=4341)(43)(41)4341()(2121^2X E X E X X E Eμμμμ=+=+=+=2121)(21)(21)2121()(2121^3X E X E X X E E故^1μ,^2μ,^3μ都是μ的无偏估计量.95)(91)(94)3132()(2121^1=+=+=X D X D X X D D μ 85)(169)(161)4341()(2121^2=+=+=X D X D X X D D μ 21)(41)(41)2121()(2121^3=+=+=X D X D X X D D μ因219585>>,故^3μ最有效. 2.3 一致性的判断与证明通常利用大数定理、切比雪夫不等式及极限的性质来证明一致性例6.13 设总体的期望μ和方差2σ均存在,证明:(1)样本均值∑==ni i X n X 11是μ的一致估计;(2)若总体服从正态分布,则样本方差212)(11∑=--=ni i X X n S 是2σ的一致估计. 证 (1)因 n X X X ,,,21 独立同分布,且),2,1()(n i X E i ==μ,故由辛钦大数定理得 μP ni i X n X →=∑=11,即X 是μ的一致估计.(2)由抽样分布定理得)1(~)1(222--n S n χσ,故)1(2)1(22-=⎥⎦⎤⎢⎣⎡-n S n D σ, 于是 =)(2S D 24222)1()1(1-=⎥⎦⎤⎢⎣⎡-⋅-n S n n D σσσ12)1(422-=⎥⎦⎤⎢⎣⎡-n S n D σσ 注意到22)(σ=S E ,由切比雪夫不等式得)(1)1(21)(1}|{|1242222∞→→--=-≥<-≥n n S D S P εσεεσ 由极限的夹逼准则得1}|{|22→<-εσS P ,所以2S 是2σ的一致估计.3. 区间估计设θ是总体分布中的未知参数,n X X X ,,,21 是来自总体X 的一个样本,在给定置信水平为α-1下求置信区间的步骤如下:(1)构造一个样本函数);,,,(21θn X X X W W =,W 中除包含待估参数θ外,不能含有其他任何未知参数,并且W 的分布是已知的且不依赖于任何未知参数;(2)根据W 的分布确定常数b a ,使α-=<<1}{b W a P ;(3)对不等式b W a <<进行恒等变形得等价不等式^2^1θθθ<<,则),(^2^1θθ即为所求置信区间.下面的讨论仅限于总体是正态总体的情形.3.1 2σ已知,求μ的置信区间例6.14 一个车间生产滚珠,滚珠直径服从正态分布,从某天的产品里随机抽出5个,量得直径如下(单位:mm ):14.6, 15.1, 14.9 , 15.2, 15.1. 如果知道该天生产的滚珠的直径的方差是0.05,试求平均直径的置信区间.)05.0(=α解 样本均值为98.14)1.152.159.141.156.14(51=++++=x 由975.0025.01)(025.0=-=Φz ,反查标准正态分布表得96.1025.0=z ,故平均直径的置信度为95%置信区间为)176.15,784.14(505.096.198.14,505.096.198.14=⎪⎪⎭⎫ ⎝⎛⨯+⨯- 3.2 2σ未知,求μ的置信区间例6.15 已知某种木材横纹抗压力的实验值服从正态分布,对10个试件做横纹抗压力实验得数据如下(单位:2/cm kg ):482, 493, 457, 510, 446, 435, 418, 394, 469 试对该木材平均横纹抗压力进行区间估计.)05.0(=α解 样本均值为5.457)469493482(101=+++=x 样本方差 3.1240])5.457469()5.457493()5.457482[(912222=-++-+-= S 样本均方差 218.352==S S 查t 分布表得2622.2)9(025.0=t ,故平均横纹抗压力的置信度为95%置信区间为)69.482,3.432(10218.352622.25.457,10218.352622.25.457=⎪⎪⎭⎫⎝⎛⨯+⨯-3.3 μ未知,求2σ的置信区间例6.16 岩石密度的测量误差服从正态分布),(2σμN ,随机抽测12个样品得2.0=S ,求2σ的置信区间. )1.0(=α解 查表得575.4)11(,675.19)11(295.0205.0==χχ,故2σ的置信度为0.9的置信区间 为 )10.0,02.0(575.42.0)112(,675.192.0)112(22=⎪⎪⎭⎫⎝⎛⨯-⨯- 3.4 2221σσ=未知,求21μμ-的置信区间例6.17 随机地从A 批导线中抽取4根,从B 批导线中抽取5根,测得其电阻(单位:Ω)为 A 批导线:0.143, 0.142, 0.143, 0.137B 批导线:0.140, 0.142, 0.136, 0.138, 0.140设测试数据分别服从正态分布),(21σμN ,),(22σμN ,且它们相互独立,又221,,σμμ未知,试求21μμ-的置信度为95%的置信区间.解A 批导线的样本均值为14125.0)137.0143.0142.0143.0(41=+++=x 样本方差 6211024.8-⨯=SB 批导线的样本均值为1392.0)140.0138.0136.0142.0140.0(51=++++=x 样本方差 6221092.5-⨯=S查t 分布表得 3646.2)7(025.0=t0042.02541092.5)15(1024.8)14(3646.2116621025.0=-+⨯⨯-+⨯⨯-⨯=+--n n S t w故21μμ-的置信度为95%的置信区间为⎪⎪⎭⎫⎝⎛+-+±-21212/11)2(n n S n n t y x w α)00625.0,00214.0(= 3.5 21,μμ未知,求2221/σσ的置信区间例6.18 设两化验员B A ,独立地对某种聚合物含氯量用相同的方法各作10次测定,其测定值的样本方差依次为6065.0,5419.022==B A S S ,设22,B A σσ分别为B A ,所测定的测定值总体的方差,设总体服从正态分布,求方差比22/BA σσ的置信度为95%的置信区间 解 查F 分布表得03.4)9,9(025.0=F ,从而2481.0)9,9(1)9,9(025.0975.0==F F , 故22/BA σσ的置信度为95%的置信区间为 )601.3,222.0(03.4,2481.02222=⎪⎪⎭⎫ ⎝⎛B A B A S S S S。