概率统计2估计量的评价标准规定
概率论与数理统计、概率论03-第46讲 估计量的评价准则,无偏性_47
例1:设总体X的一阶和二阶矩存在,
E X , DX 2.
(1)证明:样本均值X和样本方差S 2分别是
和 2的无偏估计; (2)判断:B2是否为 2的无偏估计?
是否为 2的渐近无偏估计?
7
(1)证:因X1, X2 ,, Xn与X同分布,故有:
E
X
E
1 n
n i 1
X
i
1 n
n i1
由ˆ X1 ,, X n 给出的估计的平均恰是,
从 而 无 偏 性 保 证 了 ˆ没 有 系 统 误 差 .
5
例如,工厂长期为商家提供某种商品, 假设生产过程相对稳定,产品合格率为 θ,虽然一批货的合格率可能会高于θ , 或低于θ ,但无偏性能够保证在较长一 段时间内合格率接近θ,所以双方互不 吃亏。但作为顾客购买商品,只有二种 可能,即买到的是合格品或不合格品, 此时无偏性没有意义。
E
Xi
1 n
n
故X 是的无偏估计.
E S2 2 ——见第42讲例2
故 S 2是 2的 无 偏 估 计 .
8
(2) B2
n 1S2 n
E(B2)
n 1 n
E
S2
n
1 n
2
2
故B2不是 2的无偏估计.
故lnimBE2是(B2
) lim n 的 n渐 近
2
无n1偏
2
估计
2
.
9
例2:设总体X 服从均匀分布U (0, ),是
则称ˆ是的一个无偏估计量.
若E ˆ ,那么 E ˆ 称为估计量ˆ的偏差, 若 lim E ˆ ,则称ˆ是的渐近无偏估计量.
n
3
• 无偏性:E ˆ
估计量的评价标准
例 6.19 若总体 X 的 E( X )和 D(X )存在,则样 本均值是总体均值 X 的相合估计.
解: E( X ) E( X )
lim D( X ) lim D( X ) 0
n
n n
一般地,样本的 k 阶原点矩
Ak
1 n
n i 1
X
k i
是总体
X
的 k 阶原点矩 E( X k ) 的相合估计.由此可见,矩
(1) 试证明:的矩估计量ˆ1 2X 和修正的最大似
然估计量ˆ2
n n
1
X(n)
均是
的无偏估计;
(2) 问:ˆ1 和ˆ2 哪一个更有效?
(1) 证 E(ˆ1) E(2X ) 2E( X ) 2E( X )
2 ,
2
2X 是 的无偏估计量.
X ~ U[0, ]
p(
x)
1
,
x [0, ]
证 因为 E( X ) E( X ) , 所以 X 是 的无偏估计量.
而
X (1)
min(X1,
X2 ,,
Xn
)
服从参数为 的指数分布,
n
概率密度
pmin
(
x;
)
n
e
nx
,
故知
E( X(1) )
,
n
0, E(nX (1) ) ,
x0 其它
所以 nX (1) 也是 的无偏估计量.
由以上两例可知,一个参数可以有不同的无偏 估计量.
i 1
D(
X
i
1
X 即
i
) C
2D(n( Xi1)1D) ( XD)(XDi )(X2)
D(
高等教育自学考试 概率论与数理统计期末自学 复习重要知识点
概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布): 若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x p p ====-<<,则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =-(2)二项分布:若一个随机变量X 的概率分布由式{}(1),0,1,...,.k kn k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)).两点分布的概率分布:{}(1),0,1,...,.k k n kn P x k C p p k n -==-= 二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k ek k λλλ-==>=,则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k ek k λλλ-==>=泊松分布的期望:()E X λ=;泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt-∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布: (1)均匀分布:若连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a a b x f ,则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度:⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a a b x f 均匀分布的期望:()2a bE X +=;均匀分布的方差:2()()12b a D X -= (2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩,则称X 服从参数为λ的指数分布,记为X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩指数分布的期望:1()E X λ=;指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X的概率密度为22()2()x f x x μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()2()x f x x μσ--=-∞<<+∞正态分布的期望:()E X μ=;正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==,2222()()x t xx x e dtϕφ---∞=标准正态分布表的使用: (1)()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数: 设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
概率论与数理统计二
内容串讲第一章 随机事件及其概率1. 事件的关系与运算必然事件:Ω—随机试验全部结果构成的集合。
不可能事件:φ 一般事件A :A φ⊂⊂Ω若A 、B 为两事件 若B A ⊂,则其蕴含:“A 发生导致B 发生”。
若φ=⋂=B A AB ,这表示A 发生时,B 必不发生,反之亦然。
若 A-B=A ,则AB=φ; 若 AB=A ,则B A ⊂; 若A ∪B =A ,则B ⊂A 。
若n A A A ,,21为n 个事件,由它们的运算可产生诸多新事件,如1111,,nnni i i i i i i i A A A A ∞=====等等。
例1 事件ni iA 1=发生等于“nAA A ,,21至少有1个发生”。
2.常用概率公式(1)1)(≤≤A P O ,1)(=ΩP ,0)(=φP (2)若B A ⊂,则)()(B P A P ≤(3))()()()(AB P B P A P B A P -+=⋃;当φ=AB ,则)()()(B P A P B A P +=⋃ (4))(1)(A P A P -=(5))()()(AB P A P B A P -=-(6)若n A A A ,,21两两互不相容,则∑===ni in i iA P A P 11)()((7)若n A A A ,,21相互独立,则例2 设1.0)(,4.0)(,2.0)(===AB P B P A P则5.0)()()(1)(1)(=+--=⋃-=⋃AB P B P A P B A P B A P3.古典概型古典概型:当随机试验的结果为有限个且诸结果等可能发生时,任一事件A 的概率为例3 从五个球(其中两个白球、三个红球)中任取两球,设A :取到两个白球;B :一白一红球,求)(),(B P A P(1)无放回抽样:(2)有放回抽样:每次有放回的取一球,连取两次 [注]:若设X 为两次有放回取球中取到白球数,则X ~)52,2(B ,从而12122)521()52()2()(--===C X P A P4.条件概率(1)若0)(>B P ,则)()()(B P AB P B A P =,其中A 为任一事件。
概率统计教学大纲(2013版)
山西财经大学《概率论与数理统计》教学大纲山西财经大学应用数学系概率论与数理统计教研室2013/9/2目录一、前言 (1)1.课程性质 (1)2.教学目的 (1)3.使用对象 (1)4.基本教学要求 (1)5.要求先修课程 (2)二、教学内容 (2)第1章概率论的基本概念 (3)第2章随机变量及其分布 (5)第3章二维随机变量及其分量 (8)第4章随机变量的数字特征 (11)第5章大数定律与中心极限定理 (15)第6章样本与与抽样分布 (17)第7章参数估计 (19)第8章假设检验 (20)三、课程教材及教学参考资料 (22)四、学时分配建议表 (22)山西财经大学《概率论与数理统计》教学大纲英文名称:probability theory & mathematical statistics课程代码:一、前言为适应中国特色市场经济建设和当今科学技术发展对培养高素质宽口径的新型复合型人才的需要,规范我校《概率论与数理统计》课程的教学工作,特制定本大纲。
1.课程的性质《概率论与数理统计》是研究随机现象数量规律的数学分支,是我校经济学、管理学、理学、工学、文学本科各专业(政治经济学、统计学、数学与应用数学三个专业除外)学生必修的一门重要的基础课,是培养学生认识数学、理解数学以及运用数学知识解决实际问题(如经济问题)的基本环节之一。
2.教学目的(1)使学生掌握概率论与数理统计的基本概念、基本理论、基本方法和简单应用。
(2)学习处理随机现象的基本思想和基本方法,培养学生用这些思想和方法解决实际问题(如经济问题)的能力。
(3)为相关的后续课程提供必要的基础。
3.使用对象本大纲使用对象为我校经济学、管理学、理学、工学、文学本科各专业(政治经济学、统计学、数学与应用数学三个专业除外)的全日制本科生。
4.基本教学要求(1)对基础的要求:学习本课程之前,要求学生具备排列组合、一元函数微积分学、多元函数微积分学、无穷级数等方面的基础知识。
统计学智慧树知到答案章节测试2023年河南大学
第一章测试1.在相同或近似相同的时间点搜集的数据成为()A:截面数据B:实验数据C:时间序列数据D:观测数据答案:A2.只能归于某一有序类别的非数字型数据成为()A:数值型变量B:数值型数据C:分类数据D:顺序数据答案:D3.最近发表的一份报告称,“由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车”。
这项结论属于()A:对总体的描述B:对总体的推断C:对样本的描述D:对样本的推断答案:B4.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是()A:所有在网上购物的消费者的平均花费金额B:1000个消费者的平均花费C:所有在网上购物的消费者D:1000个消费者答案:A5.某年全国汽车总产量(万辆)是()A:随机变量B:离散变量C:连续变量D:任意变量答案:A6.统计数据的研究的基本方法()A:统计分组法B:综合指标法C:统计推断法D:大量观察法答案:ABCD7.以下信息是通过描述统计取得的有()A:调查某些班学生统计学考试分数而得到的全校学生的平均成绩B:调查某班统计学分数而得到的优秀比例C:一幅表示某班学生统计学考试分数的统计图D:调查某班学生统计学考试分数而得到的该班学生的平均成绩答案:BCD8.下面属于顺序数据的有()A:学生对考试成绩的满意度B:学生的智商等级C:学生到达教室的距离D:学生按出生地的分组答案:AB9.统计推断学研究的主要问题是()A:如何科学的从总体中抽取样本B:如何科学的确定总体C:怎么科学控制样本对总体的代表性误差D:如何由所抽样本去推断总体特征答案:ABD10.大数据按存在形态不同,大数据可以分为()A:非结构型数据B:流程型数据C:交易型数据D:结构型数据答案:AD11.统计量是不包含任何未知参数的样本的函数()A:错B:对答案:B12.变量按其所受影响因素不同,可以分为确定性变量和随机性变量()A:错B:对答案:B13.按指标的性质不同,可以分为数量指标和质量指标()A:错B:对答案:B14.统计指标和标志是同一个概念()A:对B:错答案:B15.按照统计数据的收集方法,可以将其分为观测数据和实验数据()A:对B:错答案:A第二章测试1.如果一个样本因人为故意操纵而出现偏差,这种误差属于()A:实验误差B:设计误差C:非抽样误差D:抽样误差答案:C2.对一批牛奶的质量进行调查,应该采用()A:典型调查B:普查C:重点调查D:抽样调查答案:D3.抽样误差产生的原因()A:测量误差造成的B:抽样框误差产生的C:抽样的随机性产生的D:人为因素产生的答案:C4.抽样误差的特点()A:不可以计算的B:不可以控制C:和样本多少无关D:不可避免答案:D5.为了掌握商品销售情况,对占该地区商品销售额70%的十家大型商场进行调查,这种调查方式属于()A:抽样调查B:重点调查C:非抽样调查D:统计报表答案:B6.不同的调查问卷在具体结构、题型、措词、版式设计上会有所不同,但在结构上一般都由( )A:问卷标题B:问卷说明C:主体内容成D:填写要求答案:ABCD7.重点调查的特点( )A:有意识地选取若干具有典型意义的单位进行的调查B:属于范围较小的全面调查,即对所有重点单位都要进行观测C:解剖麻雀式D:以客观原则来确定观测单位答案:ABCD8.简单随机抽样的特点()A:抽样方法保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相近B:抽选的概率相同,用样本统计量对总体参数进行估计及计算估计量误差都比较方便C:每个单位的入样概率是相等的D:可以对各层的目标量进行估计答案:BC9.根据封闭性问题的回答方法可分为()A:两项选择法B:顺序选择法C:评定尺度法D:多项选择法答案:ABCD10.搜集数据的方式有()A:访问B:统计调查方式C:实验方式D:网络数据采集方式答案:ABCD11.普查是根特定研究目的而专门组的一次性的全面调查,以搜集研究对象的全面资料数据()A:对B:错答案:A12.统计报表是指按照国家统一规定的表格形式、指标内容、报送程序和报送时间,由填报单位自下而上逐级提供统计资料的一种统计调查方式。
估计量的评选标准
估计量的评选标准估计量是指在缺乏准确数据的情况下,根据一定的方法和经验,对某一现象或数值进行估算的过程。
在实际生活和工作中,我们经常需要对各种各样的数据进行估计,比如市场需求量、产品销售额、人口数量等等。
而估计量的准确性和可靠性对于决策和规划具有重要意义。
因此,对估计量的评选标准也显得尤为重要。
首先,估计量的评选标准应当包括准确性。
准确性是估计量的基本要求,也是最为重要的一个方面。
一个准确的估计量应当尽可能接近真实数值,能够反映出实际情况。
在评选估计量时,需要对比不同估计量的准确度,选择最为接近真实情况的估计量作为最终结果。
其次,估计量的评选标准还应当考虑到可靠性。
可靠性是指估计量的稳定性和一致性,即在不同条件下得到的估计量应当是相近的。
一个可靠的估计量应当具有较小的误差范围,能够在不同情况下保持一致性。
在评选估计量时,需要对其可靠性进行充分的考量,选择稳定性和一致性较高的估计量作为最终结果。
此外,估计量的评选标准还应当考虑到数据来源和方法的科学性和合理性。
一个科学合理的估计量应当基于充分的数据支撑和合理的估算方法,能够经得起推敲和验证。
在评选估计量时,需要对其数据来源和估算方法进行审查,选择数据充分、方法科学的估计量作为最终结果。
最后,估计量的评选标准还应当考虑到应用的实际性和适用性。
一个优秀的估计量应当能够满足实际应用的需求,能够为决策和规划提供有力支持。
在评选估计量时,需要对其实际应用价值进行评估,选择能够最大程度满足实际需求的估计量作为最终结果。
综上所述,估计量的评选标准应当包括准确性、可靠性、数据来源和方法的科学性和合理性,以及应用的实际性和适用性。
只有在综合考量这些方面的因素之后,我们才能够选择出最为合适的估计量,为决策和规划提供可靠的支持。
因此,在进行估计量的评选时,需要全面考量各方面因素,以确保选择出最为优秀的估计量。
概率统计简明教程(同济)Chapter10
第二节 估计方法
方法1: 矩估计法(K. 方法1: 矩估计法(K. Pearson). X : X1, X2, …, Xn.
µk = E( X k ), k =1,2,3,L
1 k k k Ak = X1 + X2 +L+ Xn , k =1,2,3,L n
(
)
Clearly,
1 A = ( X1 + X2 +L+ Xn ) = X 1 n
ˆ = 1 = 1 = 1 ≈ 0.0077 λ m x 130.55 1
例6(P114) X ~ N(µ, σ2): -1.20, 0.82, 0.12, N( 0.45, -0.85, -0.30. Solution 两个参数待估计. 两个参数待估计.
µ1 = E( X ) = µ
µ2 = E( X 2 ) = D( X ) + (E( X ))2 = σ 2 + µ2
1 k k k mk = x1 + x2 +L+ xn , k =1,2,3,L n 1 m = ( x1 + x2 +L+ xn ) = x 1 n
(
)
1 k P k k X1 + X2 +L+ Xn →µk , k =1,2,3,L n
(
)
(θ1,θ2,...,θk )?
假定总体X的前k 假定总体X的前k阶矩 µ1, µ2 ,L, µk已知(?): 已知(
例2(P112) X ~ E(λ), λ(?) : X1, X2, …, Xn.
例3(P113) X ~ N(µ, σ2)(?) : X1, X2, …, Xn. N(
概率论与数理统计--- 估计量的评选标准
15
例3 设总体 X 的均值和方差均存在 ,nX1, „, Xn 是总体 X 的样本, C1 , C2 ,„ ,Cn 为不全相同且满足 C i 1 的任一组常数,
证明: (1) 样本的线性函数 Ci X i 是总体均值 的无偏估计量 ; i 1 n n 1 X 较 C X 有效. (2) 总体均值的无偏估计量 X n i i i i 1 i 1 n n n 证(1) E ( C i X i ) C i EX i C i
24
譬如,在估计湖中鱼数的问题中, 若我们根据一个 实际样本得到鱼数 N 的极大似然估计为 1000 条.
但实际上, N 的真值可能大于 1000 条, 也可能小于1000条. 若我们能给出一个区间, 在此区间内我们合 理地相信 N 的真值位于其中, 这样对鱼数的估计就有 把握多了.
也就是说, 我们希望确定一个尽可能小的区间, 使我们能以 • 比较高的可靠程度相信它包含真参数值.
i 1 j 1
n
m
解:(1) E(T)=an+bm =(na+mb) 当na+mb=1时, E(T)=
此时,T是的无偏估计
(2) D(T)=a2n+b24m
1 na 2 na 4m( ) m 2 4(1 na ) 2 na m 8n(1 na ) dD 0 0 2na 令 m da 4 (4n+m)a=4 a 4n m D(a)>0 此时D(T)最小,即T最有效 4 1 a , b 4n m 4n m
定义:设ˆ (X1,X2,…,Xn)为的估计量,若E(ˆ) 存在,且有 ˆ E ( ) , 则称ˆ 为的无偏估计量
概率论与数理统计课程教学大纲
《概率论与数理统计》课程教学大纲一、课程基本信息二、课程目标(一)总体目标:概率论与数理统计是研究随机现象客观规律性的数学学科,在高等工科学校教学计划中是一门基础理论课。
通过本课程的学习,使学生掌握概率论与数理统计的基本概念,基本理论和方法,从而使学生初步掌握处理随机现象的基本思想和方法,培养学生运用概率统计方法分析和解决实际问题的能力。
(二)课程目标:课程目标1:知识目标通过本课程的学习,学生系统掌握随机变量及其分布、参数估计与假设检验等重要知识。
课程目标2:技能目标通过本课程的基本概念、基本理论和基本方法的讲授及学生的练习,培养学生的数学推理,数理逻辑,演绎归纳,数据分析,假设论证能力。
课程目标3:素质培养(1) 通过本课程的教学,培养和提高学生对所学知识进行整理、概括、消化吸收能力,以及围绕教学内容阅读参考资料,自我扩充知识领域的能力。
(2) 通过作业和课堂讨论,培养学生口头表达能力,做到思路清晰,层次分明。
(3)通过作业,培养学生独立思考,深入钻研问题的习惯以及一题多解,举一反三的能力,应用数学的意识以及运用数学知识分析问题的良好品质。
(4)具有自主学习和终身学习的意识,有不断学习和适应发展的能力。
(三)课程目标与毕业要求、课程内容的对应关系三、教学内容第一章随机事件及其概率1.教学目标理解随机事件和样本空间的概念;熟练掌握事件之间的关系与基本运算。
理解事件频率的概念;了解随机现象的统计规律性。
知道概率的公理化定义;理解古典概率的概念;了解几何概率;掌握概率的基本性质;会应用这些性质进行概率计算。
理解条件概率的概念;掌握乘法定理、全概率公式和贝叶斯公式,并会应用这些公式进行概率计算。
理解事件独立性的概念;会应用事件的独立性进行概率计算。
2.教学重难点本节是基础知识,在高中阶段大部分已经学过,都是重点内容。
教学的重难点在于事件的三种关系:互斥,独立和包含,事件概率的两个公式:加法公式和乘法公式,以及全概率和贝叶斯公式的应用。
计量经济学之-概率论和统计学知识习题解析复习资料
随机变量标准化:
2
Ch2:概率统计复习 概率论复习
随机变量的统一定义:(1)取一切实数;(2)用概率函数描述概率分布 概率函数:
F(x) P( x)
连续随机变量:
离散随机变量:
3
Ch2:概率统计复习 概率论复习
随机变量的数字特征: 数学期望(Expectation,mean)Ec:随机变量取值的概率加权平均。 方差(Variance) Var(c):随机变量的随机性。方差等于0?
联合密度函数 (2)矩
数学期望向量:
方差-协方差矩阵:
概率论复习
8
Ch2:概率统计复习
随机向量: 协方差和相关系数:
概率论复习
相关系数等于0意味着什么?相关系数等于1呢? (3)条件分布
条件概率分布函数: 条件概率密度函数: 乘法公式:
9
Ch2:概率统计复习
随机向量: (3)条件分布 条件矩: 条件数学期望:
14
Ch2:概率统计复习
参数估计:
总体
X ~ F(x, )
统计学复习
θ为未知参数,用样本提供的信息估计出θ
(1)矩估计:
1
n
n i1
X
r i
p E( X r ) r ( ),
r 1,2,
,k
令
1
n
n i1
X
r i
ˆr ( )
r (ˆ),
r 1,2, , k
从中解出估计量ˆ
15
Ch2:概率统计复习
条件方差:
概率论复习
条件数学期望和条件方差都是条件随机变量(ξ)的函数,是随机变量。
10
Ch2:概率统计复习 概率论复习
概率论与数理统计期末考试复习辅导
3
三、重要知识考点
1、事件的关系及其运算,概率计算的加法公式,乘法公式,全概率 公式和Bayes公式。 2、古典概型,Bernoulli概型,条件概率,事件的独立性。 3、随机变量的分布函数,随机变量函数的分布。 4、常用的两点分布、二项分布、泊松分布、指数分布、均匀分 布 和正态分布。 5、多维随机变量的分布,边沿分布、条件分布、随机变量独立性。 6、二维随机变量的和、差、积等常见函数的分布。 7、随机变量的数字特征计算:期望、方差、协方差与相关系数。 8、统计量的概念及其三个常用分布,正态总体抽样分布定理结 论。 9、参数的矩估计与最大似然估计,参数的区间估计。 10、估计量的评价标准:无偏性、有效性、相合性。 4 11、单正态总体参数的假设检验:三类检验。
。
瘦者患高血压的概率为10%,瘦者患高血压的概率为5%,试求:
13
3、分布函数及其性质
1)2004期末(12分)设随机变量X 的概率密度函数 Ae2 x , x 0 f ( x) 0, x 0 求(1)常数A,(2)分布函数F(x),(3)P{1 X 4} 2 5期末(18分)设随机变量X的概率密度函数 )200 Ae 3 x , x 0 f X ( x) 0, x 0 (1)确定常数A(4分), (2)求X 的分布函数F(x)(4分), (3)求Y =e X 的概率密度fY ( y )(4分), (4)计算E(Y )和D(-3Y -1)(6分)
15
5)2007冬季期末(12分)设X 的密度函数为 Ax 2 , 1 x 1 f ( x) 0, 其它 试求:(1)常数A, (2)E ( X )、D( X ), (3)X 的分布函数F(x)。
16
6)2008期末 (1)(3分)下列函数中,为某随机变量X 的概率密度的是( 3 3 sin x, x cos x, x (A)f1 ( x) (B)f 2 ( x) 2 2 0, 其它 0, 其它 3 3 sin x, x 1 cos x, x (C)f3 ( x) 2 (D)f 4 ( x) 2 0, 其它 0, 其它 (2)(12分)已知随机变量X 的概率密度为 Ae 2 x , x 0 f ( x) 0, x 0 求:1)常数A的值; 2)X 的分布函数;
估计量的评选标准
估计量的评选标准估计量是指在缺乏完全准确数据的情况下,根据一定的方法和标准,对某一特定数量进行估算的过程。
在实际生活和工作中,估计量的使用是非常普遍的,比如市场调研中对某一产品的销量进行估计、工程项目中对材料和人工成本的估算等。
因此,对估计量的评选标准进行明确和规范,对于保证估计结果的准确性和可靠性具有重要意义。
首先,估计量的评选标准应当包括数据来源的可靠性。
数据来源的可靠性是估计量准确性的基础,只有在数据来源可靠的前提下,才能得到准确可靠的估计结果。
因此,在评选估计量时,需要对数据来源进行严格的审核和验证,确保数据的真实性和可靠性。
其次,估计量的评选标准还应当考虑估计方法的科学性和合理性。
不同的估计方法可能会得到不同的估计结果,因此在评选估计量时,需要对所采用的估计方法进行评估和比较,选择科学合理的估计方法,并对其进行合理性验证,以确保估计结果的准确性和可靠性。
另外,估计量的评选标准还应当考虑估计结果的稳定性和可靠性。
估计结果的稳定性是指在不同条件下得到的估计结果是否具有一致性和可比性,而可靠性则是指估计结果是否能够得到重复验证和确认。
在评选估计量时,需要对估计结果的稳定性和可靠性进行评估和验证,确保估计结果具有一定的稳定性和可靠性。
最后,估计量的评选标准还应当考虑估计结果的可比性和适用性。
估计结果的可比性是指在不同条件下得到的估计结果是否可以进行比较和分析,而适用性则是指估计结果是否能够满足具体的应用需求。
在评选估计量时,需要对估计结果的可比性和适用性进行评估和验证,确保估计结果具有一定的可比性和适用性。
综上所述,估计量的评选标准应当包括数据来源的可靠性、估计方法的科学性和合理性、估计结果的稳定性和可靠性,以及估计结果的可比性和适用性。
只有在这些方面都得到合理的保证和验证,才能够确保估计结果的准确性和可靠性,从而为实际生活和工作提供有力的支持和保障。
概率统计期末考试复习卷
<概率论与数理统计>2011-2012 第一学期期末考试预测卷姓名 —————— 学号 —————— 班级————— 一、选择题1.如果P(AB)=0 , 则( )(A) A 和B 不相容 (B) A 与B 不相容 (C) P(A –B)=P(A) (D)P(A –B)=P(A )–P(B) 2.设P(A )+P(B)=1,则( )(A ) P (A ∪B )=1 (B )P(A ∩B )=0(C )P (A ∩B )=P(A ∩B ) (D )P (A ∩B )= P (A ∪B ) 3.10件产品中有3件次品,从中随机抽取2件,至少抽到1件次品的概率是() (A ) 1/3 (B )2/5 (C ) 7/15 (D )8/15 4.下列命题中错误的是()(A )若X ~P(λ) ,则E(X)=D(X) = λ. (B )若X ~b(1,θ),则E(X)= θ,D(X)= θ(1-θ)(C )若X 服从参数为λ的指数分布,则E(X)=D(X)= 1λ(D )若X 服从区间[a,b]上的均匀分布,则E(X)= 2a b +,D(X)=2()12b a -。
5. 设(X,Y )服从二维正态分布,则下列条件中不是X,Y 相互独立的充分必要条件是( )(A )X,Y 不相关 (B )E(X)=E(Y)=0 (C ) COV(X,Y) =0 (D )E(XY)=E(X)E(Y) 6. 已知总体X 服从[0,λ]上的均匀分布(λ未知),12,,...,n X X X 为X 的样本,则( )(A )112n i i X n λ=-∑ 是一个统计量 (B )211()n i i X D X n =-∑ 是一个统计量 (C )11()ni i X E X n =-∑ 是一个统计量 (D )12X X +是一个统计量 7. 对于给定的正数a (0<a<1),设a u ,2()a n χ,()a t n ,12(,)a F n n 分别是标准正态分布,2()n χ,()t n ,12(,)F n n 分布的上侧a 分位数,则下面的结论中不正确的是()(A )112211(,)(,)a a F n n F n n -=(B )1()()a a t n t n -=-(C )221()()a a n n χχ-=- (D )1a a u u -=-8.设总体X 服从正态分布N(m,1), (12,X X ) 是总体X 的样本,以下哪个估计量更有效( )(A )1122133m X X =+ (B )2121344m X X =+ (C )3121122m X X =+ (D )4122355m X X =+9. 对参数的一种区间估计及一组样本观察值12(,,...,)n x x x 来说, 下列结论中正确的是( )(A ) 置信度越大,对参数取值范围估计越准确 (B )置信度越大,置信区间越短 (C )置信度大小与置信区间的长度无关 (D )置信度越大,置信区间越长 10. 设(1θ,2θ)是参数θ的置信度为1-α的区间估计,则以下结论正确的是( )(A )参数θ落在区间(1θ,2θ)之内的概率为1-α(B )参数θ落在区间(1θ,2θ)之外的概率为α(C ) 对不同的样本观察值,区间(1θ,2θ)的长度相同(D )区间(1θ,2θ)包含参数θ的概率为1-α11 样本容量n 确定后,在一定假设检验中,给定显著性水平为α,设此第二类错误的概率为β,则必有( )(A )α+β=1 (B )α+β>1 (C ) α+β<2 (D )α+β<1 二、填空题2.X 是连续型随机变量,f(x)是其对应的密度函数,则f(x)满足的性质:—————,—————。
统计学期末考试试题(含答案)
西安交大统计学考试试卷一、单项选择题(每小题2分,共20分)1。
在企业统计中,下列统计标志中属于数量标志的是(C)A、文化程度B、职业C、月工资D、行业2.下列属于相对数的综合指标有(B )A、国民收入B、人均国民收入C、国内生产净值D、设备台数3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量?A、0个B、两个C、1个D、3个4。
下列变量中属于连续型变量的是(A )A、身高B、产品件数C、企业人数D、产品品种5。
下列各项中,属于时点指标的有(A )A、库存额B、总收入C、平均收入D、人均收入6。
典型调查是(B )确定调查单位的A、随机B、主观C、随意D盲目7.总体标准差未知时总体均值的假设检验要用到( A ):A、Z统计量B、t统计量C、统计量D、X统计量8. 把样本总体中全部单位数的集合称为(A )A、样本B、小总体C、样本容量D、总体容量9.概率的取值范围是p(D )A、大于1B、大于-1C、小于1D、在0与1之间10. 算术平均数的离差之和等于(A )A、零B、1C、-1D、2二、多项选择题(每小题2分,共10分。
每题全部答对才给分,否则不计分)1。
数据的计量尺度包括(ABCD ):A、定类尺度B、定序尺度C、定距尺度D、定比尺度E、测量尺度2。
下列属于连续型变量的有(BE ):A、工人人数B、商品销售额C、商品库存额D、商品库存量E、总产值3。
测量变量离中趋势的指标有(ABE )A、极差B、平均差C、几何平均数D、众数E、标准差4.在工业企业的设备调查中(BDE )A、工业企业是调查对象B、工业企业的所有设备是调查对象C、每台设备是填报单位D、每台设备是调查单位E、每个工业企业是填报单位5。
下列平均数中,容易受数列中极端值影响的平均数有(ABC )A、算术平均数B、调和平均数C、几何平均数D、中位数E、众数三、判断题(在正确答案后写“对”,在错误答案后写“错”。
概率统计简明教程 第七章 参数估计
222第七章 参数估计统计推断是数理统计的重要内容,它是指在总体的分布完全未知或形式已知而参数未知的情况下,通过抽取样本对总体的分布或性质作出推断.大致可以分为估计问题和假设检验问题两大类. 本章重点介绍参数估计问题,即根据样本对总体分布中所包含的未知参数或总体的数字特征作出数值上的估计.主要内容包括:点估计和区间估计.§1 点估计概述1.1 点估计在许多实际问题中,可以认为总体X 分布的形式是已知的,它只依赖于一个或几个未知参数.如果能对分布中所含的参数作出推断,那么就可以确定总体分布.例如, 已知总体服从正态分布(),1N μ,μ未知,我们的目的是通过样本提供的信息对未知参数μ作出估计,也就是借助于样本对总体作出推断,这类问题就是参数估计问题.点估计问题的一般提法是:设总体X 的分布函数();F x θ类型已知,θ为未知参数,它的可能取值范围Θ是已知的,称Θ为参数空间,即θ∈Θ.这样,我们有一族分布函数(){};:F x θθ∈Θ.如果(){}2;,:,0F x μσμσ-∞<<+∞>是正态分布的分布函数族,其中()2,θμσ=.设12,,,n XX X 是X 的一个样本, 12,,,n x x x 为相应的样本值.我们构造一个统计量()12,,,n X X X θ ,以()12,,,n X X X θ 的值()12,,,n x x x θ 作为参数θ的真实值的估计.习惯上,称223()12,,,n X X X θ 为参数θ的估计量()12ˆ,,,n X X X θ ,称()12,,,n x x x θ 为θ的估计值为()12ˆ,,,n x x x θ .在不致混淆的情况下,估计量与估计值都简称为估计,简记为ˆθ.容易看出,对于不同的样本值来说,由同一个估计量得出的估计值一般是不相同的.在几何上一个数值是数轴上的一个点,用θ的估计值ˆθ作为θ的近似值就像用一个点来估计θ,故称为点估计.如果总体分布中含有k 个未知参数1,,k θθ ,则需要构造k 个统计量()()11212ˆˆ,,,,,,,,n k n X X X X X X θθ 分别作为1,,k θθ 的估计量.例1.1 设总体X 服从参数为λ的泊松分布, 0λ>为未知参数,现有以下样本值3,4,1,5,6,3,8,7,2,0,1,5,7,9,8试求未知参数λ的估计值.解:由于()E X λ=,自然地想到用样本均值11ni i X X n==∑作为λ的估计量,利用样本值得()1341563872015798 4.615x =++++++++++++++=.这样,我们获得了参数λ的估计量ˆX λ=与估计值ˆ 4.6x λ==. 在本例中,对于总体X 的一个样本12,,,n X X X ,()1i X i n ≤≤亦可以作为λ的估计量;同样地,()1X 和()n X 都应该可作为λ的估计量.这样,对于同一个参数,可以有许多不同的点估计;在这些估计中,我们自然地希望挑选一个最“优”的点估计.因此,有必要建立评价估计量优劣的标准.下面介绍几个常用的标准:无偏性、有效性和一致性.1.2 评价估计量的标准1. 无偏性224对于不同的样本值来说,由估计量()12ˆˆ,,,n X X X θθ= 得出的估计值一般是不相同的,这些估计只是在参数θ真实值的两旁随机地摆动.要确定估计量ˆθ的好坏,要求某一次抽样所得的估计值等于参数θ的真实值是没有意义的,但我们希望()ˆE θθ=,这是估计量所应该具有的一种良好性质,称之为无偏性,它是衡量一个估计量好坏的一个标准.定义 1.1 如果未知参数θ的估计量()12ˆˆ,,,n X X X θθ= 的数学期望()ˆE θ存在,且对任意θ∈Θ,都有()ˆE θθ= (1.1) 则称ˆθ是θ的无偏估计量.在科学技术中,称()ˆE θθ-是以ˆθ作为θ估计的系统误差. 无偏估计的实际意义就是无系统误差.例 1.2 设12,,,n X X X 是总体X 的一个样本, 总体X 的k 阶原点矩记为()kk E X μ=,样本原点k 阶矩记为11nkk i i A X n==∑,证明:k A 是k μ的无偏估计量.证明: 12,,,n X X X 是总体X 的一个样本,即12,,,n X X X 与X同分布,因此 ()(),1,2,,k ki k E X E X i n μ=== .即 11()()nk k ik i E A E X nμ===∑ .例1.3 设总体X 的均值μ和方差2σ都存在,证明:未修正样本方差2252211()nii S X X n==-∑不是2σ的无偏估计量.证明: 在第六章第二节中,我们证明了()22E S σ=,因此,修正的样本方差2S =211()1nii X X n =--∑是2σ的无偏估计量,也就是说20S 不是2σ的无偏估计量.我们以后一般取2S 作为2σ的估计量.例 1.4 设总体()X P λ ,12,,,n X X X 是X 的一个样本, 2S 为样本方差,01α≤≤,证明:()21L X S αα=+-是参数λ的无偏估计量.证明:易见()()()2,()E X E X E S D X λλ====,()()()()()211,E L E X E Sαααλαλλ=+-=+-=因此,估计量()21L X S αα=+-是λ的无偏估计.2. 有效性同一个参数可以有多个无偏估计量,那么用哪一个为好呢?设参数θ有两个无偏估计量1ˆθ和2ˆθ,在样本容量n 相同的情况下, 1ˆθ的观测值都集中在θ的真值附近,而2ˆθ的观测值较远离θ的真值,即1ˆθ的方差较2ˆθ的方差小,我们认为1ˆθ较2ˆθ好,由此有如下的定义:定义 1.2 设()1112ˆˆ,,,n X X X θθ= 和()2212ˆˆ,,,n X X X θθ= 都是参数θ的无偏估计量,若对任意θ∈Θ,都有12ˆˆ()()D D θθ≤ (1.2)226且至少存在一个0θ∈Θ使得上式中的不等号成立,则称1ˆθ较2ˆθ有效.例1.5 设12,,,n X X X 是总体X 的一个样本, X 的均值 μ和方差2σ都存在,且20σ>,记11ˆkk i i X kθ==∑,1,,k n = .易见,111ˆ()()kk i i E E X k kkθμμ===⋅=∑,1,,k n = .因此, 这些估计量都是μ的无偏估计量.由于 2222111ˆ()()kk ii D D Xk kkkσθσ===⋅=∑,从而ˆn X θ=最有效.3.一致性无偏性和有效性都是在假设样本容量n 固定的条件下讨论的.由于估计量是样本的函数,它依赖样本容量n ,自然地,我们希望一个好的估计量,当n 越来越大时,它与参数的真值几乎一致,这就是估计量的一致性或称之为相合性.定义1.3 设()12ˆˆ,,,n n X X X θθ= 为参数θ的一个估计量, n 为样本容量,如果对任意θ∈Θ,ˆn θ依概率收敛于θ,即对任意0ε>,有{}ˆlim 1n n P θθε→∞-<= (1.3)则称ˆn θ为参数θ的一致估计量.例 1.6 设总体X 的均值μ和方差2σ都存在,证明:样本均值11ni i X X n==∑是μ的一致估计量.证明:由切比雪夫大数定律可知,对任意0ε>,有22711lim 1ni n i P X nμε→∞=⎧⎫-<=⎨⎬⎩⎭∑因此,11ni i X X n==∑是μ的一致估计量.例1.7 设总体()2,X N μσ ,12,,,n X X X 是总体X 的一个样本,证明: 样本方差2S =211()1nii X X n =--∑是2σ的一致估计量.证明:由于()22211n S n χσ-- ,有 2212(1)n DS n σ-⎡⎤=-⎢⎥⎣⎦,因此, 22422212()11n D S D S n n σσσ⎛⎫-⎡⎤==⎪⎢⎥--⎣⎦⎝⎭.由切比雪夫不等式可知,对任意0ε>,有{}{}42222222120()()(1)P S E S P S D S n σεσεεε≤-≥=-≥≤=-.这样 {}22lim ()0n P S E S ε→∞-≥=,即 {}22lim 1n P S σε→∞-<=, 2S是2σ的一致估计量.§2 矩估计与最大似然估计本节我们介绍两种常用的构造估计量的方法,即矩估计法和最大似然估计法.2.1矩估计法228许多总体的未知参数与总体矩之间存在着函数关系,如在泊松总体()P λ中,它的参数λ就是总体的一阶矩,又如在正态总体()2,X N μσ中(),E X μ=()()222E XE X σ=-⎡⎤⎣⎦.若总体矩存在,我们很自然地想到用样本矩来估计相应的总体矩,从而可以获得未知参数的估计量,这种方法称之为矩估计法.设12,,,n X X X 是总体X 的一个样本,若X 是连续型随机变量,则其概率密度函数为();f x θ;若X 是离散型随机变量,则其分布律为();p x θ,()12,,,k θθθθ= ,θ∈Θ.假设总体X 的k 阶原点矩存在,记()ll E Xμ=,11nlli i AX n==∑,()1,2,,l k = .由辛钦大数定律可知,l A 依概率收敛于l μ,即可以用样本矩替换同阶的总体矩,我们称之为替换原则.替换原则是矩估计法的思想实质,这种方法只需假设总体矩存在,无需知道总体的分布类型.由于l μ依赖于参数12,,,k θθθ ,可设 1121212212(,,,),(,,,),(,,,).k k k k k μθθθμμθθθμμθθθμ=⎧⎪=⎪⎨⎪⎪=⎩将此方程组的解记为1112221212(,,,),(,,,),(,,,).k k kk k θθμμμθθμμμθθμμμ=⎧⎪=⎪⎨⎪⎪=⎩用l A 替换l μ()1,2,,l k = ,得到2291112221212ˆ(,,,),ˆ(,,,),ˆ(,,,).k k k k k A A A A A A A A A θθθθθθ⎧=⎪=⎪⎨⎪⎪=⎩并把它们分别作为参数12,,,k θθθ 的估计量,称之为矩估计量, 矩估计量的观测值称为矩估计值.例2.1 设总体X 的概率密度函数为()()101,;0x x f x θθθ⎧+<<=⎨⎩,,其他.1,θ>-求参数θ的矩估计量.解: ()()111011d 2E X xx θθμθθ++==+=+⎰,解得 11211μθμ-=-,因此, θ的矩估计量为 21ˆ1X Xθ-=-.如果我们获得一组样本观测值,其样本均值为0.65x =,则参数θ的矩估计值为20.651ˆ0.8610.65θ⨯-==-.例2.2 设总体X 的均值μ和方差2σ都存在,且20σ>,又设12,,,n X X X 是总体X 的一个样本,求μ和2σ的矩估计量.解:注意到()()()22E XD XE X =+⎡⎤⎣⎦,由方程组()()12222,.E X E X μμμσμ==⎧⎪⎨==+⎪⎩230解得1μμ=,2221σμμ=-.因此,μ和2σ的矩估计量分别为1ˆA X μ==, 22222211111()nniii i A A X XX X nnσ===-=-=-∑∑.此例表明, 总体X 均值和方差的矩估计量分别是样本均值与样本的二阶中心矩,而不依赖总体X 的分布.2.2 最大似然估计法由于矩估计法只需假设总体矩存在,没有充分利用总体分布提供的信息,为获得更理想的估计,需要引入最大似然估计法,它的一个直观想法是某个随机试验有若干个结果,,A B C 等,如果在一次试验中,出现结果A ,则认为事件A 发生的概率是最大的.例如,一只袋子里有黑白两种外形相同的球,这两种球的数量不详,只知道它们占总数的比例:一种球为10%,另一种球占90%.今从中任抽取一只球,取得白球,一种比较合理的想法是认为袋子里白球的数量较多, 占总数的90%,这就是最大似然估计法的基本思想.我们通过下面的例子说明最大似然估计法的原理.某工厂加工一批产品,现需要估计其不合格品率p ,今从中抽取一个容量为n 的样本值12,,,n x x x ,令1,0,i i X i ⎧=⎨⎩第次取到次品第次取到正品1,2,,i n = ,总体X 的分布律为()()1;1,0,1xxp x p pp x -=-=.取得样本获得观测值的概率为{}()()()1111111122,,,111==---====--∑∑=- nnnniii i x x x x n n x n x P X x X x X x pp pp pp ,()0,11,2,,i x i n == .显然{}1122,,,n n P X x X x X x === 是p 的函231数,记为()L p ,即()()111nnii i i x n x L p pp ==-∑∑=-.由于在一次取样中,样本值12,,,n x x x 出现,我们认为概率()L p 是最大的,选取使得()L p 达到最大的ˆp 作为参数p 的一个估计值,即()(){}ˆm ax p L pL p ∈Θ=.由微积分中求极大点的方法, p 可从方程()d 0d L p p=求出,又由于ln x 是x 的单调增函数,()ln L p 与()L p 在同一个p 处取极大值,p 也可从方程()d ln L p 0dp=求出,()()()11ln ln ln 1nni i i i L p x p n x p ===⋅+--∑∑,()11d ln 0d 1nniii i x n x L p ppp==-=-=-∑∑,解得: 1ˆn ii x pn==∑.容易验证, 1ˆn ii x pn==∑能使得()L p 达到最大,称之为参数p 的最大似然估计值,其对应的统计量称为参数p 的最大似然估计量.下面我们讨论最大似然估计法.设12,,,n X X X 是取自总体X 的一个样本, 12,,,n x x x 为样本值.如果总体X 是离散型的,其分布律为();p x θ,θ为未知参数,θ∈Θ. 样本12,,,n X X X 的联合分布律为232{}()11221,,,;nn n ii P X x X x X x p x θ=====∏ ,容易看出,当样本值12,,,n x x x 固定时上式是参数θ的函数,当θ取固定值时,上式是事件{}1122,,,n n X x X x X x === 发生的概率,记()()()121;,,,;nn ii L L x x x p x θθθ===∏ , (2.1)并称()L θ为样本的似然函数.若样本值12,,,n x x x 的函数()12ˆˆ,,,n x x x θθ=∈Θ 满足()(){}ˆm ax L L θθθ∈Θ=, (2.2)则称()12ˆˆ,,,n x x x θθ= 为θ的最大似然估计值,其相应的统计量()12ˆ,,,n X X X θ 称为θ的最大似然估计量.如果总体X 是连续型的,X 的概率密度为();f x θ,θ为未知参数,θ∈Θ.随机点12(,,,)n X X X 落在点12(,,,)n x x x 的边长为12,,,n x x x ∆∆∆ 的邻域内的概率近似为()1;ni i i fx x θ=∆∏.我们寻找使()1;ni i i f x x θ=∆∏达到最大的()12ˆˆ,,,n x x x θθ= ,但1ni i x =∆∏与它无关,故可取样本的似然函数为()()()121;,,,;nn ii L L x x x f x θθθ===∏ . (2.3)类似地, 若样本值12,,,n x x x 的函数()12ˆˆ,,,n x x x θθ=∈Θ 满足233()(){}ˆm ax L L θθθ∈Θ=则称()12ˆˆ,,,n x x x θθ= 为θ的最大似然估计值,其相应的统计量()12ˆ,,,n X X X θ 称为θ的最大似然估计量.获得样本的似然函数后,为求出未知参数θ的最大似然估计量,可以利用微积分中求函数极值的方法.假设();f x θ或();p x θ关于θ可微,由下面的似然方程()d 0d L θθ=,或对数似然方程()d ln 0d L θθ=,可求出最大似然估计θ.例2.3 设总体(),X P λ 求λ的最大似然估计量.解:似然函数为 ()1!ix ni i eL x λλλ-==∏,对数似然函数为 ()11ln ln ln(!)nni i i i L x n x λλλ===--∑∑ ,令()1d ln 0d nii xL n λλλ==-=∑,求得λ的最大似然估计值为 11nii xx n λ===∑,最大似然估计量为 11ni i X X nλ===∑.234例2.4 总体(),X E λ 求λ的最大似然估计量. 解: 总体X 的概率密度为(),0,0,x e x f x x λλλ-⎧>=⎨≤⎩.似然函数为 ()11niii nx x ni L eeλλλλλ=-=∑==∏,对数似然函数为()1ln ln ni i L n x λλλ==-∑,令()d ln 0d L λλ=,有10nii xnλ=-=∑,因此,λ的最大似然估计值为 11nii nxxλ===∑,最大似然估计量为 1Xλ=.假设总体的分布中含有k 个未知参数12,,,k θθθ ,类似地,写出似然函数()12,,,k L L θθθ= ,求解方程组()01,2,,iL i k θ∂==∂或()ln 01,2,,iL i k θ∂==∂可获得未知参数12,,,k θθθ 的最大似然估计.例2.5 总体()2,,X N μσ 求2,μσ的最大似然估计量.解: 似然函数为 ()()22212211,exp ()22n i n i L x μσμσπσ=⎧⎫=--⎨⎬⎩⎭∑235对数似然函数为()()222211ln ,ln 2ln ()222nii n nL xμσπσμσ==----∑分别求关于2μσ和的偏导数,得以下对数似然方程组()()221222241ln ,1()0,ln ,1()0.22n ii nii L xL n xμσμμσμσμσσσ==⎧∂⎪=-=∂⎪⎨∂⎪=-+-=⎪∂⎩∑∑解上述方程组得2μσ和的最大似然估计值分别为11ˆnii xx nμ===∑ ,2211(),nii x x nσ==-∑因此2μσ和的最大似然估计量分别为ˆX μ=和 2211()nii XX nσ==-∑.最大似然估计具有一个性质:如果ˆθ为总体X 未知参数θ的最大似然估计,函数()μμθ=具有单值反函数()θθμ=,则()ˆˆμμθ=为()μμθ=的最大似然估计.利用此性质,我们可获得例2.5中σ的最大似然估计量为ˆσ==例 2.6 设总体X 服从[]0,θ上的均匀分布,0θ>,求θ的最大似然估计值.解:记()()()()111min ,,,max ,,n n n x x x x x x == .236似然函数为 ()()()11,0,0,n n x x L θθθ⎧<<⎪=⎨⎪⎩其他注意到对于()()10,n x x θ≤≤有 ()()110nnn L x θθ<=≤.因此,取θ的最大似然估计值为()ˆn x θ=.最后我们给出求最大似然估计的一般步骤(有时候它并不适用,如上例):1、写出似然函数)(θL ,即由总体分布导出样本的联合分布律(或联合概率密度);2、令()d 0d L θθ=或()01,2,,iL i k θ∂==∂ ,求出驻点(常转化为求对数似然函数ln ()L θ的驻点:令()d ln 0d L θθ=或()ln 01,2,,iL i k θ∂==∂ );3、求出最大值点;4、求得参数的最大似然估计.§3 区间估计参数的点估计实质是用一个估计值来估计未知参数θ的真值,但估计值只是θ的一个近似值,它本身既没有反映这种近似的精度又没有给出误差的范围,因此,在实际问题的应用中意义有限.例如在一大批产品中,任意取出60件产品,经检验有3件为次品,按点估计的方法,我们获得次品率p的一个估计值为ˆp=0.05,但ˆp 与次品率p 的真值是有误差的,这个误差有237多大,点估计无法给予回答.我们希望给出一个区间()ˆˆ,pp -∆+∆,用它来估计次品率p 的真值,这样就产生了误差∆的大小及用区间()ˆˆ,pp -∆+∆估计次品率p 真值的可靠程度的问题.区间估计解决了上述问题,我们将介绍在区间估计理论中被广泛接受的置信区间.3.1 置信区间定义3.1设1,,n X X 是取自总体X 的一个样本, θ为总体分布中所含的未知参数, θ∈Θ.对于给定的α,01α<<,若存在两个统计量()1,,n X X θθ= 和()1,,n X X θθ= ,使得{}1P θθθα<<=- (3.1)则称随机区间(),θθ是θ的臵信水平为1α-的臵信区间,θ和θ分别称为θ的臵信下限和臵信上限.定义3.1表明置信区间(),θθ包含θ的真值的概率为1α-,它的两个端点是只依赖12,,,n X X X 的随机变量.设12,,,n x x x 为一个样本值,我们获得一个普通的区间()()1212(,,,,,,,)n n x x x x x x θθ 称之为置信区间(),θθ的一个实现,在不致引起误解的情形下,也简称为置信区间.对于一个实现,只有两种可能, 它要么包含θ的真值,要么不包含θ的真值.在重复取样下(各次取样的样本容量均为n ),我们获得许多不同的实现,根据伯努利大数定律,这些不同的实现中大约有100(1α-)%的实现包含θ的真值,而有100α%的实现不包含θ的真值.例 3.1 已知某产品的重量(单位:克)()2,X N μσ,其中8σ=,μ未知,现从中随机抽取9个样品,其平均重量为575.2x =克,试238求该产品的均值μ的臵信水平为95%的臵信区间.解:样本均值11ni i X X n==∑是未知参数μ的较优的点估计,同时有2,X N n σμ⎛⎫ ⎪⎝⎭ , 或()0,1N . 因此,我们构造一个枢轴量U =,选取区间()/2/2,u u αα-,使得/2/21P u u ααα⎧⎫-<<=-⎨⎬⎩⎭,即/2/21P X u X u ααμα⎧-<<+=-⎨⎩.这样我们得到μ的置信水平为1α-的置信区间为/2/2X u X u αα⎛-+ ⎝.由575.2x =,9n =,8σ=,1α-=95%,0.05α=,/2u α=1.96算得/2575.2 1.96569.976x u α-=-⨯=/2575.2 1.96580.424x u α+=+⨯=所以,μ的一个置信区间为()569.976,580.424.从此例可以看出, 寻求未知参数θ的置信区间的步骤为:(1) 选取θ的一个较优的点估计()12ˆˆ,,,n X X X θθ= ,一般是通过239最大似然估计法获得.(2) 以()1ˆˆ,,n X X θθ= 为基础, 寻求未知参数θ的一个枢轴量W ,即()1,,;n W W X X θ= 且W 的分布已知.(3)对于给定的置信水平(与θ无关)1α-,确定两个分位点,a b ,使得(){}1,,;1n P a W X X b θα<<=- .,a b 可通过(){}(){}11,,;,,;2n n P WX X a P W X X b αθθ≤=≥=确定.(4)求出θ的置信区间.3.2 单个正态总体均值与方差的置信区间以下我们将讨论正态总体的均值与方差的置信区间.设()2,X N μσ,12,,,n XX X 是取自总体X 的一个样本.1. 参数μ的置信区间关于参数μ的置信区间,我们分方差2σ已知和2σ未知两种情形. (1) 方差2σ已知的情形例3.1中,我们已经获得了在方差2σ已知的条件下, μ的置信区间为/2/2X u X u αα⎛-+ ⎝,简记为/2X u α⎛± ⎝.(2) 方差2σ未知的情形由于U =σ,又2S 是2σ的无偏估计量,因此,选取240随机变量X T -=.由第六章定理4.1可知(1)T t n - ,对于给定的置信水平1α-,有/2/2(1)(1)1P t n t n ααα⎧⎫--<<-=-⎨⎬⎩⎭,即/2/2(1)(1)1S S P X t n X t n ααμα⎧--<<+-=-⎨⎩,因此,μ的置信水平为1α-的置信区间为/2/2(1)(1)X t n X t n αα⎛--+- ⎝,(3.2)简记为/2(X t n α⎛±- ⎝. 例3.2 假设轮胎的寿命2(,)X N μσ .为估计它的平均寿命,现随机抽取12只,测得它们的寿命为(单位:万千米)4.68 4.85 4.32 4.85 4.615.02 5.20 4.60 4.58 4.72 4.38 4.70 求μ的臵信水平为0.95的臵信区间.解:12n =, 4.7092,x =20.0615s =,1α-=95%,0.05α=,()0.02511 2.2010t =算得μ的置信水平为0.95的置信区间为(()()0.0250.0251111 4.5516,4.8668x t x t ⎛-+= ⎝.2. 参数2σ的置信区间 (1) 均值μ已知的情形 由于()()2,1,2,,i X N i n μσ= ,即()0,1i X N μσ- ,241所以 ()()2221ni i X n μχσ=-∑.我们选取随机变量()2211ni i X μσ=-∑作为枢轴量, 对于给定的置信水平1α-,有()2221/2/2211()()1ni i P n X n ααχμχασ-=⎧⎫<-<=-⎨⎬⎩⎭∑,即()()2221122/21/21.()()n ni i i i X X P n n ααμμσαχχ==-⎧⎫--⎪⎪⎪⎪<<=-⎨⎬⎪⎪⎪⎪⎩⎭∑∑ 因此,2σ的置信水平为1α-的置信区间为()()221122/21/2,()()nnii i i XXn n ααμμχχ==-⎛⎫-- ⎪⎪ ⎪⎪⎝⎭∑∑. (3.3) 我们也得到σ的置信水平为1α-的置信区间为⎝⎭. (3.4) (2) 均值μ未知的情形 由于()()()2222221111nii n S XXn χχσσ=-=-=-∑ ,选取随机变量2χ作为枢轴量,类似地, 我们得到2σ的置信水平为1α-的置信区间为242()()221122/21/2,(1)(1)nn ii i i X X X X n n ααχχ==-⎛⎫-- ⎪ ⎪-- ⎪ ⎪⎝⎭∑∑,即()()2222/21/211,(1)(1)n S n S n n ααχχ-⎛⎫-- ⎪--⎝⎭, 和σ的置信水平为1α-的置信区间为⎛ ⎝⎭, (3.5) 即⎛ ⎝.例3.3 在例3.2中,求2σ的臵信水平为0.95的臵信区间. 解:12n =, 4.7092,x =20.0615s =,()210.6765n s -=1α-=95%,0.05α=,()20.0251121.920χ=,()20.97511 3.816χ=算得2σ的置信水平为0.95的置信区间为(0.03086,0.17728).3.3 两个正态总体均值差与方差比的置信区间设()211,X N μσ ,()222,Y N μσ ,从总体X 和Y 中,分别独立地取出样本12,,,n X X X 和12,,,m Y Y Y ,样本均值依次记为X 和Y ,样本方差依次记为21S 和22S .1. 设21σ和22σ已知,求12μμ-的置信区间243由第六章定理2.2可知()0,1X Y U N μμ---=.对于给定的置信水平1α-,有/2/21X Y P u u ααμμα⎧⎫⎪⎪---⎪⎪-<<=-⎨⎬⎪⎪⎪⎪⎩⎭,即/212/21,P X Y u X Y u ααμμα⎧⎪--<-<-+=-⎨⎪⎩因此,12μμ-的置信水平为1α-的置信区间为//X Y u X Y u αα⎛---+ ⎝. (3.6) 例3.4 分别从()1,4X N μ ,()2,6Y N μ 中独立地取出样本容量为16和24的两样本,已知16.9x =,15.3y =,求12μμ-的臵信水平为0.95的臵信区间.解:16,24n m ==, 16.9x =,15.3y =,1α-=95%,0.05α=, 214σ=22,6σ=,/20.025 1.96u u α==,因此12μμ-的置信水平为0.95的置信区间为()16.915.3 1.9615.3 1.960.214,2.986⎛--⨯-+⨯= ⎝由此可以认为,在置信水平为0.95的情形下12μμ>.2. 设22212σσσ==未知,求12μμ-的置信区间244记()()22122112wn S m S S n m -+-=+-,由第六章定理4.2可知()2X Y T t n m μμ---=+- .以T 为枢轴量,类似地,我们得到12μμ-的置信水平为1α-的置信区间为()()/2/222X Y t n m S X Y t n m S αα⎛--+--++- ⎝(3.7)例3.5 为了估计磷肥对某农作物增产的作用,现选用20块条件大致相同的地块进行对比试验.其中10块地施磷肥,另外10块地不施磷肥,得到单位面积的产量如下(单位:公斤):施磷肥:620, 570, 650, 600, 630, 580, 570, 600, 600, 580; 不施磷肥:560, 590, 560, 570, 580, 570, 600, 550, 570, 550. 设施磷肥的地块的单位面积的产量()21,X N μσ ,不施磷肥的地块的单位面积的产量()22,Y N μσ ,求12μμ-的臵信水平为0.95的臵信区间.解:10n m ==,1α-=95%,0.05α=,600x =,570y =,2164009s =,2224009s =,()()22122211222w n s m s s n m -+-==+-,0.025(18) 2.1010t =.因此,12μμ-的置信水平为0.95的置信区间为60057022 2.101060057022 2.1010⎛--⨯⨯-+⨯⨯⎝(9.23,50.77)=,即我们可以认为磷肥对此农作物增产有作用.2453. 设1μ和2μ已知,求2122σσ的置信区间因为()()212211ni i X n μχσ=-∑,()()222212mi i Y m μχσ=-∑且样本12,,,n X X X 与样本12,,,m Y Y Y 独立,所以有()2211222121(),()nii mii Xm F F n m n Yμσσμ==-=⋅⋅-∑∑ ,对于给定的置信水平1α-,有(){}1/2/2(,),1P F n m F F n m ααα-<<=-,即()22211111222/221/22211()()111,,(,)()()n ni i i i m m i i i i m X m X P F n m F n m n Y n Y ααμμσασμμ==-==⎧⎫--⎪⎪⎪⎪<<=-⎨⎬⎪⎪--⎪⎪⎩⎭∑∑∑∑因此,2122σσ的置信水平为1α-的置信区间为()22111122/21/22211()()11,,(,)()()n ni i i i m mi i i i m X m X F n m F n m n Y n Y ααμμμμ==-==⎛⎫-- ⎪⎪ ⎪--⎪⎝⎭∑∑∑∑. (3.8) 4.设1μ和2μ未知,求2122σσ的置信区间由于()221222211,1S F F n m Sσσ=⋅-- ,对于给定的置信水平1α-,有246(){}1/2/2(1,1)1,11P F n m F F n m ααα---<<--=-,即()222111222/2221/221111,1(1,1)S S P F n m S F n m S αασασ-⎧⎫⎪⎪⋅<<⋅=-⎨⎬----⎪⎪⎩⎭,从而2122σσ的置信水平为1α-的置信区间为()()221122/221/2211,1,11,1S S F n m S F n m S αα-⎛⎫⋅⋅ ⎪ ⎪----⎝⎭. (3.9) 例 3.6 某车间有甲,乙两台机床加工同类零件,假设此类零件直径服从正态分布.现分别从由甲机床和乙机床加工出的产品中取出5个和6个,进行检查,得其直径数据(单位:毫米)为甲: 5.06, 5.08, 5.03, 5.00, 5.07; 乙: 4.98, 5.03, 4.97, 4.99, 5.02, 4.95; 试求22σσ甲乙的臵信水平为0.95的臵信区间.解: 5,6n m ==,1α-=95%,0.05α=,20.00107,s =甲20.00092,s =乙()0.0254,57.39,F =于()()0.9750.025114,50.10685,49.36F F ===,因此22σσ甲乙的置信水平为0.95的置信区间为()0.0010710.001071,0.15738,10.88990.000927.390.000920.1068⎛⎫⋅⋅= ⎪⎝⎭.3.4 单侧置信区间前面讨论的参数θ的置信区间(),θθ是双侧置信区间,即有置信上限247θ和置信下限θ.有时在一些实际问题中,我们只关心参数θ的上限或下限,因此有必要讨论参数θ的单侧置信区间.定义3.2设1,,n X X 是取自总体X 的一个样本, θ为总体分布中所含的未知参数, θ∈Θ.对于给定的α(01α<<),若存在统计量()1,,n X X θθ= 或()1,,n X X θθ= ,使得{}1P θθα>=- (3.10)或{}1P θθα<=- (3.11)则称随机区间(),θ+∞(或(),θ-∞)是θ的臵信水平为1α-的单侧臵信区间,θ称为θ的单侧臵信下限(θ称为θ的单侧臵信上限).求参数θ的单侧置信区间的方法与求θ的置信区间(),θθ的方法是类似的,只需将步骤(3)中的(){}12,,,;n P a W X X X b θ<< 1α=-改为(){}1,,;1n P a W X X θα<=- 或(){}1,,;1n P W X X b θα<=- ,其中,,a b 可通过(){}(){}11,,;,,;n n P W X X a P W X X b θθα≤=≥= 确定.详细的结果看表7.2.例3.7 在例3.2中,求μ的臵信水平为0.95的单侧臵信下限.解:12n =, 4.7092,x =20.0615s =,1α-=95%,0.05α=,()0.0511 1.7960t =算得μ的置信水平为0.95的单侧置信下限为(0.0511 4.5806x t -=.表7.1 正态总体均值,方差的置信区间248表7.2 正态总体均值,方差的单侧置信上、下限249250251习题七( A )1、设总体X 服从参数为N 和p 的二项分布,n X X X ,,,21 为取自X 的一个样本,试求参数p 的矩估计量与极大似然估计量.2,、设n X X X ,,,21 为取自总体X 的一个样本,X 的概率密度为22,0(;)0,xx f x θθθ⎧<<⎪=⎨⎪⎩其它.其中参数0θ>,求θ的矩估计.3、设12,,,n X X X 总体X 的一个样本, X 的概率密度为⎪⎩⎪⎨⎧≤>=--0,0,0,);(1x x ex x f xαλαλαλ其中0>λ是未知参数,0>α是已知常数,求λ的最大似然估计.4、设总体X 服从几何分布 ,10,,2,1,)1()(1<<=-==-p k p p k X P k 试利用样本值n x x x ,,,21 ,求参数p 的矩估计和最大似然估计.5、设总体X 的概率密度为()1;exp ,2x f x σσσ⎧⎫=-⎨⎬⎩⎭0σ>为未知参数, n X X X ,,,21 为总体X 的一样本,求参数σ的最大似然估计.6、证明第5题中σ的最大似然估计量为σ的无偏估计量. 7,、设总体X 的概率密度为()222220;0x x e x f x σσσ-⎧⎪>=⎨⎪⎩,,,其它.,20σ>为未知参数, n X X X ,,,21 为总体X 的一个样本,求参数2σ的的矩估252计量和最大似然估计量.8、设总体),(~2σμN X ,μ已知,σ为未知参数, n X X X ,,,21 为X 的一个样本,∑=∧-=ni i X c 1||μσ, 求参数c ,使∧σ为σ的无偏估计.9、设θˆ是参数θ的无偏估计量,且有0)ˆ(>θD ,试证22)ˆ(ˆθθ=不是2θ的无偏估计量.10、设总体),(~2σμN X ,321,,X X X 是来自X 的样本,试证:估计量32112110351ˆX X X ++=μ;32121254131ˆX XX ++=μ;3213216131ˆX XX ++=μ都是μ的无偏估计,并指出它们中哪一个最有效.11,、设12,,,n X X X 是总体()20,X N σ 的一个样本,20σ>,证明:211ni i X n=∑是2σ的相合估计量.12、设总体X 的数学期望为μ,方差为2σ,分别抽取容量为1n 和2n 的两个独立样本,1X ,2X 分别为两样本均值,试证明:如果,a b 满足1a b +=,则12Y aX bX =+是μ的无偏估计量,并确定,a b ,使得()D Y最小.13、设12,,,n X X X 是总体X 的一个样本, X 的概率密度为();f x θ,0θ>,未知,已知()222nXn χθ,试求θ的置信水平为1α-的置信区间.14、从大批彩色显像管中随机抽取100只,其平均寿命为10000小时,253可以认为显像管的寿命X 服从正态分布.已知均方差40=σ小时,在置信水平0.95下求出这批显像管平均寿命的置信区间.15、设随机地调查26年投资的年利润率(%),得样本标准差(%)15=S ,设投资的年利润率X 服从正态分布,求它的方差的区间估计(置信水平为0.95).16,、从一批钉子中抽取16枚,测得其长度为(单位:厘米)2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11.设钉子的长度X 服从正态分布,试求总体均值μ的置信水平为0.90的置信区间.17、生产一个零件所需时间(单位:秒)),(~2σμN X ,观察25个零件的生产时间得5.5=x ,73.1=s .试求μ和2σ的置信水平为0.95的置信区间.18、产品的某一指标),(~2σμN X ,已知04.0=σ,μ未知.现从这批产品中抽取n 只对该指标进行测定,问n 需要多大,才能以95%的可靠性保证μ的置信区间长度不大于0.01?19、设A 和B 两批导线是用不同工艺生产的,今随机地从每批导线中抽取5根测量其电阻,算得721007.1-⨯=A s ,62103.5-⨯=B s ,若A 批导线的电阻服从),(211σμN ,B 批导线的电阻服从),(222σμN ,求2221σσ的置信水平为0.90的置信区间.20,、从甲乙两个蓄电池厂的产品中分别抽取6个产品,测得蓄电池的容量(A.h)如下:甲厂 140 , 138 , 143 , 141 , 144 , 137;乙厂135 , 140 , 142 , 136 , 138 , 140设蓄电池的容量服从正态分布,且方差相等,求两个工厂生产的蓄电池的容量均值差的95%置信区间.( B )1、设总体X 的概率分别为254其中102θθ⎛⎫<<⎪⎝⎭是未知参数,利用总体X 的如下样本值: 3, 1, 3, 0, 3, 1, 2, 3 求θ的矩估计值和最大似然估计值.2、设()111ˆˆ ,,n X X θθ= 和()221ˆˆ,,n X X θθ= 是参数θ的两个相 互独立的无偏估计量,且方差()()12ˆˆ2D D θθ=,试确定常数,a b ,使得12ˆˆa b θθ+是θ的无偏估计量,且在一切这样的线性估计类中方差最小.3、在测量反应时间中,一心理学家估计的标准差为0.05秒,为了以0.95的置信水平使他对平均反应时间的估计误差不超过0.01秒,应取多大的样本容量.【提供者:路磊】。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
2
1
n
n 2 2
1
,
故 S 不是 的无偏估计量 ,
n
2
1
n
1
2
n 2
S
是
的无偏估计量.
例4 设总体 X 在 [0, ]上服从均匀分布,参数 0,
X1, X 2, , X n 是来自总体 X 的样本,试证明2X 和
n
证
n
1 max(
因为
X
1,
E
X2,
(2X
)
, X n ) 都是 的无偏估计. 2E(X ) 2E(X) 2
由于方差是随机变量取值与其数学期望的 偏离程度, 所以无偏估计以方差小者为好.
设ˆ1 ˆ1( X1, X2 ,, Xn )与ˆ2 ˆ2( X1, X2 ,, Xn ) 都是 的无偏估计量, 若有 D(ˆ1) D(ˆ2 ), 则称ˆ1较 ˆ2有效.
例6 (续例5)
试证当n 1时, 的无偏估计量X 较 n密度
fmin ( x; )
n
e
nx
,
x 0,
0,
其他.
故知 E(Z ) , E(nZ ) ,
n
所以 nZ 也是 的无偏估计量.
由以上两例可知,一个参数可以有不同的无 偏估计量.
三、有效性
比较参数 的两个无偏估计量ˆ1 和ˆ2 , 如果 在样本容量n相同的情况下, ˆ1的观察值在真值 的附近较ˆ2 更密集, 则认为ˆ1 较 ˆ2 有效.
例1 设总体 X 的k 阶矩 k E( X k ) (k 1)存在,
又设 X1, X2 ,, Xn 是 X 的一个样本,试证明不论
总体服从什么分布,
k 阶样本矩 Ak
1 n
n i 1
X
k i
是k
阶总体矩 k 的无偏估计.
证 因为 X1, X2 ,, Xn 与 X 同分布,
故有
E
(
X
k i
)
E(
,
2
所以 2X 是 的无偏估计量.
因为 Xh max(X1, X2,, Xn )的概率密度为
nx n1
f
(
x)
n
,
0 x ,
0,
其他
所以
E(Xh)
0
x
nx
n1
n dx
n ,
n1
故有
E
n
n
1
X
h
,
故
n
n
1
max(
X
1
,
X
2
,,
X
n
)
也是
的无偏估计量.
例5 设总体 X 服从参数为 的指数分布, 概率密度
证明 由于 D( X ) 2, 故有 D( X ) 2 ,
n
又因为
D(Z )
2
n2
,
故有 D(nZ ) 2,
当n 1时, D(nZ ) D( X ),
故 的无偏估计量X 较 nZ 有效.
例7 (续例4) 在例4中已证明ˆ1 2X
和 ˆ2
n n
1 max{ X 1 ,
X2 ,,
Xn} 都是
(n
n 1)2 ( n
2)
2
,
故
D(ˆ2 )
1 2,
n(n 2)
又n 2, 所以 D(ˆ2 ) D(ˆ1), ˆ2 较 ˆ1 有效.
四、相合性(一致性)
若ˆ ˆ( X1, X 2 ,, X n )为参数的估计量, 若对于任意 ,当n 时,ˆ( X1, X 2 ,, X n ) 依概率收敛于 , 则称 ˆ 为 的相合估计量.
下面介绍几个常用标准.
二、无偏性
若 X1, X2 ,, Xn 为总体 X 的一个样本,
是包含在总体X 的分布中的待估参数, ( 是 的取值范围)
若估计量ˆ ( X1, X2 ,, Xn ) 的数学期望 E(ˆ) 存在, 且对于任意 有 E(ˆ) , 则称 ˆ 是 的无偏估计量.
无偏估计的实际意义: 无系统误差.
n 1 2 2 , 所以ˆ 2 是有偏的.
n
若以 n 乘 ˆ 2 , 所得到的估计量就是无偏的.
n1
(这种方法称为无偏化).
E n ˆ 2 n E(ˆ 2 ) 2 .
n1 n1
因为
n ˆ 2
n1
S
2
1 n
1
n i 1
(Xi
X 2 ),
即 S2是 2 的无偏估计,故通常取S2作 2的估计量.
的无偏估
计量, 现证当n 2时, ˆ2 较ˆ1 有效.
证明
由于
D(ˆ1) 4D( X )
4 D( X ) 2 ,
n
3n
D(ˆ2 )
D
n1 n
X
h
n
n
1
2
D
X
h
,
又因为
E(
Xh
)
n
n
1
,
E( Xh2 )
0
n
n
x n1dx
n
n
2
2,
D( Xh
)
E(
X
2 h
)
[E(
Xh
)]2
第三节 估计量的评选标准
一、问题的提出
从前一节可以看到, 对于同一个参数, 用不 同的估计方法求出的估计量可能不相同, 矩估计、 极大似然估计、Bayes估计等. 而且, 很明显, 原 则上任何统计量都可以作为未知参数的估计量. 问题 (1)对于同一个参数究竟采用哪一个估计量好? (2)评价估计量的标准是什么?
f
(
x;
)
1
x
e
,
0,
x 0, 其他.
其中参数 0, 又设 X1, X2,, Xn 是来自总体X 的
样本, 试证 X 和nZ n[min(X1, X2 ,, Xn )] 都是
的无偏估计.
证明 因为 E( X ) E( X ) ,
所以 X 是 的无偏估计量.
而
Z
min(
X1,
X2 ,,
,
2 均为未知, 则 2 的估计量ˆ 2
1 n
n i 1
(
Xi
X )2
是 有偏 的(即不 是无偏 估计).
证
ˆ
2
1 n
n i 1
X
2 i
X
2
A2
X
2,
因为 E( A2 ) 2 2 2 ,
又因为 E( X 2 ) D( X ) [E( X )]2 2 2 ,
n
所以 E(ˆ 2 ) E( A2 X 2 ) E( A2 ) E( X 2 )
例如 由第六章第二节知, 样本k(k 1)阶矩是
总体 X 的k 阶矩 k E( X k )的相合估计量, 进而若待估参数 g(1, 2 ,, n ), 其中g为连续 函数, 则 的矩估计量ˆ g(ˆ1, ˆ2 ,, ˆn ) g( A1, A2 , , An )是 的相合估计量.
例3(略)设 X1, X2,, Xn 是来自正态总体N ( , 2 )
的样本,试求 2的无偏估计量.
解 由定理二知
n1
2
S2
~
2(n
1),
E n 1S
0
x
n1
22
1 n
1
e
x 2
x
n11
2 dx
n1
22
1 n
2
1
0
x
e2
n1
x 2 dx
2
2
n
n 2
1
,
2
E(S)
X
k
)
k
,
i 1,2,,n.
即
E(
Ak
)
1 n
n i 1
E(
X
k i
)
k
.
故 k 阶样本矩 Ak 是 k 阶总体矩 k 的无偏估计.
特别的: 不论总体 X 服从什么分布, 只要它的数学期望存在,
X 总是总体 X 的数学期望1 E( X )的无偏
估计量.
例2 对于均值 , 方差 2 0 都存在的总体, 若