第七章 参数估计
第七章 参数估计
![第七章 参数估计](https://img.taocdn.com/s3/m/bcca890314791711cc7917e8.png)
第七章参数估计一、内容精要(一)点估计1.点估计的定义2.矩估计法3.最大似然估计法(二)参数的区间估计1.置信区间2.正态总体的期望和方差的区间估计求解具体步骤(三)估计量的评选标准1.无偏性2.有效性3.一致性(相合性)二、 常考题型分析(一) 点估计例1 X 设总体的概率分布为()2201232112X P θθθθθ--10,2X θθ⎛⎫<< ⎪⎝⎭其中是未知参数利用总体的如下样本值3,1,3,0,3,1,2,3.θ求的矩估计值和最大似然估计值例2 X 设总体的概率分布为()()2123211X P αβββ--1233,1,2, 1..x x x αβ===现在观察容量为的样本求和的最大似然估计值例3 ()221200,,,,,0n X X X N μσμσ> 设是总体为的简单随机样本其中已知,()221111,,,1n n i ii i X X S X X n n ====--∑∑未知记 ()22ˆ1;σσ求参数的最大似然估计量 ()22ˆˆ2.E D σσ计算和例4 12,,,n X X X X 设为总体的一个样本,总体的密度函数为()1,,,,0,,x e x f x others μθμθμθ-⎧⋅≥⎪=⎨⎪⎩0,.θθμ>其中求未知参数和的最大似然估计量例5 ()11,1,;1,0,1,x X F x xx βββ⎧->⎪=>⎨⎪≤⎩设总体的分布函数为其中未知参数 12,,,,n X X X X 是取自总体的简单随机样本求()1;β的矩估计量 ()2.β的最大似然估计量例6 X 设总体的概率密度为()01,,,,12,0,,x f x x others θθϕϕ<<⎧⎪=≤<⎨⎪⎩,()12,0,1,,,,,n X X X X N θϕθϕ<< 其中是未知参数是取自总体的简单随机样本记为12,,,,.n x x x θϕ 样本值中小于1的个数,求的最大似然估计例7 X 设总体的概率分布为221231X P θθθθ-- ()()0,1,i N X n iθ∈其中参数未知以表示来自总体的简单随机样本样本容量为中等于()312311,2,3.,,,=,i i i i a a a T a N T θ==∑的个数试求常数使为的无偏估计量并求的方差.例8 212111,,,,,,nn i i n X X X DX X X n σ===∑ 设个随机变量独立同分布()()2211,1ni i S X X n ==--∑则()A S σ是的无偏估计量 ()B S σ是的最大似然估计量 ()C S σ是的相合估计量 ()D S X 与相互独立例9 ()()(),,,,0,.x ex X f x x θθθθθ--⎧≥⎪=∈-∞+∞⎨<⎪⎩设总体的密度函数为为未知 ()121212111ˆˆ,,,,:1,min ,,,n n i ni X X X X X X X X n nθθ==-=-∑ 参数,为的一个样本证明,.θ是的两个无偏估计并确定哪个更有效例10 ()1230,,,,,X U X X X X θ 设总体是的一个样本验证1213134ˆˆmax ,4max 3i ii i X X θθ≤≤≤≤== ,θ为参数的无偏估计并比较哪个更加有效?(二) 参数的区间估计例11 ()2,0.99X N μ 设由来自正态总体容量为的简单随机样本,得样本均值5,0.95___________.X μ=则未知参数的置信度的置信区间为例12()2,,X N μσσ 假定到某地旅游的一个游客的消费额且=500元,今要对该地每一个旅客的平均消费额进行估计,为了能不小于95%的置信度,确信这估计的误差小于50元,问至少需要随机调查多少个游客.例13 (),8,,10X N X μμ设随机变量服从正态分布未知现有的个观测值10121011,,,,1500.10i i x x x x x ===∑ 已知()10.95;μ求的置信度为的置信区间()2.9n 要使05的置信区间长度不超过1,观察值个数最少应该取多少?()()3100,1,1n x x μ=-+若那么区间作为的置信区间时,置信度是多少?例14 0.50,1.25,0.80,2.00,ln X Y X =设是来自总体的简单随机样本已知(),1.N μ服从正态分布()()1EX b 求记为()2μ求的置信度为0.95的置信区间;()3,0.95.b 利用上述结果求的置信度为的置信区间。
概率论与数理统计第7章参数估计PPT课件
![概率论与数理统计第7章参数估计PPT课件](https://img.taocdn.com/s3/m/209c407a0722192e4536f6ec.png)
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
第七章 参数估计
![第七章 参数估计](https://img.taocdn.com/s3/m/18b8893283c4bb4cf7ecd11d.png)
第三节 总体均数估计
估计总体平均数的步骤: 估计总体平均数的步骤: X与S 1、 计算样本 2、 计算 σ X 3、 确定置信水平或显著性水平并查表 4、计算置信区间 5、解释总体平均数的置信区间
一、正态估计法 , σ2已知 、
1、前题条件: 、前题条件:
总体正态, n不论大小 总体正态, n不论大小
点估计与区间估计的比较
定义: 定义
直接以样本统计量(数轴上的一个点) 点估计 :直接以样本统计量(数轴上的一个点) 作为总体参数的估计值
区间估计:按一定概率要求, 区间估计:按一定概率要求,根据样本统计量估 计总体参数可能落入的范围的一种统计方法。 计总体参数可能落入的范围的一种统计方法。也 就是说整体参数所落的有把握的范围 整体参数所落的有把握的范围。 就是说整体参数所落的有把握的范围。
D=0.95时 时
75.7 ≤ µ ≤ 81.3
5、解释:用样本1估计,总体的平均数落在 、解释:用样本1估计, 73.6-82.4之间的可能性为95%, 之间的可能性为95% 73.6-82.4之间的可能性为95%,超出这一范 围的可能性为5% 5%。 围的可能性为5%。 用样本2估计,总体的平均数落在76.7 80.3之 76.7用样本2估计,总体的平均数落在76.7-80.3之 间的可能性为95% 落在75.7 81.3的可能性为 95%, 75.7间的可能性为95%,落在75.7-81.3的可能性为 99%。 99%
X ± 2.58σ X
置信限:就是总体参数所落区间的上下界限。 置信限:就是总体参数所落区间的上下界限。即
X − 1.96σ X ≤ µ ≤ X + 1.96σ X
置信下限 置信上限
标准误
标准误(中心极限定理 ) 标准误(中心极限定理3)
概率论 第七章 参数估计
![概率论 第七章 参数估计](https://img.taocdn.com/s3/m/4f638ec95901020206409c89.png)
L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数
…
…
参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本
第七章 参数估计
![第七章 参数估计](https://img.taocdn.com/s3/m/21e4a06152d380eb63946d07.png)
第七章 参数估计
1、正态总体、方差已知或非正态总体,大样本 当总体服从正态分布且方差已知时,或者总体不是正态分布但是大样本时,样本 均值的抽样分布均为正态分布,其数学期望为总体均值u,方差为Ϭ2/n。而样本均 值经过标准化以后的随机变量则服从标准正态分布,即 Z=(x-u)/(Ϭ/n0.5)~N(0,1) 根据上式和正态分布的性质可以得出总体均值u在1-α置信水平下的置信区间为: xα+是(-)事Z(α先/2)所(Ϭ确/n定0.5的)。而其一中个,概x率+Z值(α/2,) (Ϭ也/n称0.为5)为风置险信值上,限是,总x体-Z均(α/2值) (Ϭ不/包n0.含5)为在置置信信下区限间,的 概是率估;计1总- 体α称均为值置时信的水估平计,误Z差(α/。2) 是标准正态分布右侧面积为α/2的z值;Z(α/2) (Ϭ/n0.5) 也即是说,总体均值的置信区间由两个部分构成:点估计值和描述估计量精度的 +(-)值,这个+(-)值称为估计误差。
第七章 参数估计
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
其中,区间的最小值称为置信下限,最大值称为置信上限。
由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名 为置信区间。原因是:如果抽取了许多不同的样本,比如说抽取100个样本,根据 每一个样本构造了一个置信区间,这样,由100个样本构造的总体参数的100个置 信区间中,有95%的区间包含了总体参数的真值,而5%则没有包含,则95%这个值 称为置信水平。一般,如果将构造置信区间的步骤重复多次,置信区间中包含总 体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。
自然使用估计效果最好的那种估计量。什么样的估计量才算一个好的估计量呢? 统计学家给出了评价估计量的一些标准,主要包括以下几个:
第七章-参数估计
![第七章-参数估计](https://img.taocdn.com/s3/m/ede3de4777232f60ddcca1a4.png)
X 0
• 2.有效性
• 当总体参数的无偏估计不止一个统计量时,无偏
估计变异小者有效性高,变异大者有效性低,即 方差越小越好。
9 0.286 9 0.286 2 23.6 1.73
0.11 2 1.49
• 【例7-7】
• n=31,sn-1=5问的0.95置信区间?
• 解:先求方差的置信区间,当df=30,查χ2表,
2 0.025 47
2 0.975 16.8
2 30 52 30 5 2 47 16.8
正态分布,即Z0.05/2=1.96。
5 0.635 2 31
• 0.95的置信区间为:
5 1.96 0.635 5 1.96 0.635
3.76 6.24
• 二、方差的区间估计
• 根据χ2分布:
2
X X
2
2
2 2 n 1 sn ns 1
第七章 参数估计
思 考
• 例8-1:从某市随机抽取小学三年级学生50名,测 得平均身高为 140cm ,标准差 4 。试问该市小学 三年级学生的平均身高大约是多少?
例8-2:某教师用韦氏成人智力量表测80 名高三学生,M=105。试估计该校高三 学生智商平均数大约为多少?
什么是参数估计
当在研究中从样本获得一组数据后,如何通过 这组数据信息,对总体特征进行估计,也就是 如何从局部结果推论总体的情况,称为总体参 数估计。 • 参数估计: 样本 统计量
• 【例7-2】
• 有一个49名学生的班级,某学科历年考试成绩的
概率论与数理统计-参数估计
![概率论与数理统计-参数估计](https://img.taocdn.com/s3/m/c1bb2fc0a216147916112852.png)
第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2
令
A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,
即
B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
第7章 参数估计(小结与典型例题选讲)
![第7章 参数估计(小结与典型例题选讲)](https://img.taocdn.com/s3/m/5181dcdb26fff705cc170aa8.png)
估计量, 这个估计量称为矩估计 . 量
最大似然估计量
得到样本值 x1 , x2 ,, xn 时 , 选取使似然函数L( )
ˆ 取得最大值的 作为未知参数 的估计值, ˆ 即 L( x1 , x2 , , xn ; ) max L( x1 , x2 , , xn ; ).
( 其中 是 可能的取值范围)
P{ ( X 1 , X 2 ,, X n ) ( X 1 , X 2 ,, X n )} 1 ,
则称随机区间( , ) 是 的置信水平为1 的置信 区间, 和 分别称为置信水平为 的双侧置信 1 区间的置信下限和置信 上限, 1 为置信水平.
其中 Sw2
n1S12 n2 S2 2 , Sw Sw2 . n1 n2 2
1 2. 两个总体方差比 2 的置信区间 2 (1)总体均值 1 , 2 为已知的情况.
2
1 2 的一个置信水平为 1 的置信区间 2
2
m m 2 2 n ( X i 1 ) n ( X i 1 ) 1 1 i n1 . , i n1 F (m, n) F (m, n) m (Y j 2 ) 2 1 /2 m (Y j 2 ) 2 /2 j 1 j 1
ˆ Var[ p ] p(1 p) , 2 n ln f ( x; p) E p n
1 n ˆ 对于参数 p 的无偏估计量 p X X i , n i 1
1 n 1 n ˆ ] Var X i 2 Var[ X i ] Var[ p n i 1 n i 1
i 1
n
L( )称为样本似然函数 .
参数估计方法
![参数估计方法](https://img.taocdn.com/s3/m/3f02d749f7ec4afe04a1dfc9.png)
第七章 参数估计第一节 基本概念1、概念网络图{}⎪⎪⎪⎭⎪⎪⎪⎬⎫⎪⎪⎪⎩⎪⎪⎪⎨⎧⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧→⎭⎬⎫⎩⎨⎧单正态总体的区间估计区间估计一致性有效性无偏性估计量的评选标准极大似然估计矩估计点估计从样本推断总体2、重要公式和结论例7.1:设总体),(~b a U X ,求对a, b 的矩估计量。
例7.2:设n x x x ,,,,21 是总体的一个样本,试证(1);2110351321x x x ++=∧μ (2);12541313212x x x ++=∧μ(3).12143313213x x x -+=∧μ都是总体均值u 的无偏估计,并比较有效性。
例7.3:设n x x x ,,,,21 是取自总体),(~2σμN X 的样本,试证∑=--=ni i x x n S 122)(11 是2σ的相合估计量。
第二节 重点考核点矩估计和极大似然估计;估计量的优劣;区间估计第三节 常见题型1、矩估计和极大似然估计例7.4:设0),,0(~>θθU X ,求θ的最大似然估计量及矩估计量。
例7.5:设总体X 的密度函数为⎪⎩⎪⎨⎧≥=--.,0,1)(/)(其他μθθμx e x f x其中θ>0, θ,μ为未知参数,n X X X ,,,21 为取自X 的样本。
试求θ,μ的极大似然估计量。
2、估计量的优劣例7.6:设n 个随机变量n x x x ,,,21 独立同分布,,)(11,1,)(122121∑∑==--===n i i n i i x x n S x n x x D σ 则(A )S 是σ的无偏估计量;(B )S 是σ的最大似然估计量; (C )S 是σ的相合估计量;(D )x S 与2相互独立。
例7.7:设总体X 的密度函数为⎪⎩⎪⎨⎧<<-=,,0,0),(6)(3其他θθθx x xx fn X X X ,,,21 是取自X 的简单随机样本。
(1) 求θ的矩估计量∧θ;(2) 求∧θ的方差D (∧θ);(3) 讨论∧θ的无偏性和一致性(相合性)。
统计学第七章参数估计
![统计学第七章参数估计](https://img.taocdn.com/s3/m/f004534d3069a45177232f60ddccda38376be193.png)
单击添加文本具体内容
参数估计
假设检验
描述统计
推断统计
参数估计在统计方法中的地位
统计方法
统计推断的过程
总体
总体均值、比例、方差等
样本统计量 如:样本均值、比例、方差
样本
§7.1 参数估计的一般问题
单击此处添加文本具体内容,简明扼要地阐述你的观点
一、估计量和估计值
参数估计(Parameter Estimation) ,用样本估计量估计总体估计值。
一个总体参数的区间估计
总体参数
符号表示
样本统计量
均值
比例
方差
第一章节
总体均值的区间估计 (正态总体、2已知,或非正态总体、大样本)
总体均值的区间估计 (大样本)
假定条件 总体服从正态分布,且方差(2) 未知 如果不是正态分布,可由正态分布来近似 (n 30) 使用正态分布统计量 z 总体均值 在1- 置信水平下的置信区间为
(1)估计量:用来估计总体参数的样本统计量。如:样本算术平均数、样本中位数、样本标准差、样本方差等。 例如: 样本均值就是总体均值 的一个估计量 (2)参数用 表示,估计量用 表示 (3)估计值:估计参数时计算出来的统计量的具体值 如果样本均值 x =80,则80就是的估计值
矩估计法
最小二乘法
换句话说,做出校全体女大学生身高均数为163.0 -- 164.5cm的结论,说对的概率是95%,说错的概率是5%;做出校全体女大学生身高均数为162.7 – 164.7cm的结论,说对的概率是99%,说错的概率是1%。
3、置信区间与置信水平
(1 - ) 区间包含了 的区间未包含
a /2
A
B
的抽样分布
07心理统计学-第七章 参数估计
![07心理统计学-第七章 参数估计](https://img.taocdn.com/s3/m/8bbcbe83b9d528ea81c779fb.png)
犯错误的概率,常用α(或p)表示。则1-α为置信 度。(显著性水平越高表示的是α值越小,即犯错误的可
能性越低) α为预先设定的临界点,常用的如.05、.01、.001;p 为检验计算所得的实际(犯错误)概率。
第一节 点估计、区间估计与标准误
三、区间估计与标准误
3、区间估计的原理与标准误
转换成比率为
p
n
p, SE p
n
pq n
同理可得公式7-17。自习[例7-12、例7-13]
1、从某地区抽样调查400人,得到每月人均文化消费为 160元。已知该地区文化消费的总体标准差为40元。试 问该地区的每月人均文化消费额。(α=.05,总体呈正态
分布)
2、上题中总体方差未知,已知Sn-1=44元。 3、已知某中学一次数学考试成绩的分布为正态分布,总 体标准差为5。从总体中随机抽取16名学生,计算得平 均数为81、标准差为Sn=6。试问该次考试中全体考生成 绩平均数的95%置信区间。 4、上题中总体方差未知,样本容量改为17人。 5、假定智商服从正态分布。随机抽取10名我班学生测 得智商分别为98、102、105、105、109、111、117、 123、124、126(可计算得M=112,Sn≈9.4),试以95% 的置信区间估计我班全体的智商平均数。 返回
值表,求tα /2(df)。
5、计算置信区间CI。
σ2已知,区间为M-Zα /2 SE <μ< M+Zα /2 SE;
σ2未知,区间为M-tα /2(df)SE <μ< M+tα /2(df)SE。
6、对置信区间进行解释。
二、σ2已知,对μ的区间估计(Z分布,例7-1 & 2) 三、σ2未知,对μ的区间估计(t分布,例7-3 & 4)
统计学 第七章 参数估计
![统计学 第七章 参数估计](https://img.taocdn.com/s3/m/89c2a33b87c24028915fc34c.png)
[
]
2 χα (n) (n)的α 分位数,记为k≜ n k≜
抽样分布
(3)性质 • 若X服从χ2 (n),则均值E(X)=n ,方差 D(X) =2n 。 • χ2分布具有可加性。若 X1,X2相互独立,
X1~ χ2(n1) ,X2~χ2(n2)
则(X1+X2)~χ2(n1+n2) • 当n→∞时,χ2分布渐进于正态分布
σ
2
~ χ (n −1)
2
第三节两个总体参数的区 间估计(112页)
• • • • • • • 一、两个总体均值之差的区间估计 (一)两个总体均值之差的估计:独立样本 大样本:近似于正态分布 小样本: (1)两个总体的方差均已知,近似于正态分布 (2)两个总体的方差均未知但相等,近似于t分布 (3)两个服从正态分布的总体的方差均未知且不等, 但样本容量相等,近似于t分布 • (4)两个总体的方差均未知且不等,样本容量也不 等,近似于t分布,自由度为V
• 解:求(3)的计算步骤: • ①求样本指标:
x =1000小时
σ=50 (小时)
µ x=
σ
n
=
50 100
=(小时) 5
• ②根据给定的F(t)=95%,查概率表得t=1.96。 • ③根据∆x=t×µx=1.96×5=9.8,计算总体平均耐 用时间的上、下限: x − ∆ x=1000-9.8=990.(小时) 2 • 下限 x +∆ x=1000+9.8=1009 .(小时) 8 • 上限 • 所以,以95%的概率保证程度估计该批产品的平均耐 用时间在990.2~1009.8小时之间。
f (x;θ ) 其中 θ
或概率密度为
是未知参数。 是未知参数。
如何求极大似然估 计量呢? 计量呢?
参数估计
![参数估计](https://img.taocdn.com/s3/m/831fa9c8195f312b3169a527.png)
求:, 2的极大似然估计量。
解:X的概率密度为:
f (x; , 2 )
1
2
exp{
1
2 2
(x
)2}
似然函数为:
n
L(, 2 )
i 1
1
2
exp{
1
2 2
( xi
)2}
ln
L
n 2
ln(2
)
n 2
ln(
2
)
1
2
2
n
( xi
i 1
)2
返回主目录
第七章 参数估计
令
ln L
第七章 参数估计
但 dxi不随而变,故只需考虑:
i
n
L( ) L(x1, , xn ; ) f (xi ; ),
§1 点估计
(1.4)
i 1
的最大值,这里 L( )称为样本的似然函数。
若
L( x1 ,
,
xn
;ˆ)
max
L( x1 ,
,
xn ;
)
则称ˆ( x1, , xn )为的极大似然估计值。
即: P{- x - } 1- 0 n
返回主目录
第七章 参数估计
由正态分布表的构造, 由P{| t | } 1 ,可知:
查正态分布表() 1 / 2,找出,得:
- (x - ) n 0
推得,随机区间:
[x - 0 , x 0 ]
n
n
它以1 的概率包含。
返回主目录
S 2
1 n 1
n i1
( xi
x)2
而选取样本函数: t x
S/ n
数理统计 第七章-参数估计
![数理统计 第七章-参数估计](https://img.taocdn.com/s3/m/e633999c6bec0975f465e27e.png)
休息
结束
2. 最大似然法
是在总体类型已知条件下使用的一 种参数估计方法 。 它首先是由德国数学家高斯在1821 年提出的 ,费歇在1922年重新发现了这 一方法,并首先研究了这 种方法的一些 性质 。
休息 结束
最大似然法的基本思想:
已发生的事件具有最大概率。
休息
结束
先看一个简单例子: 在军训时,某位同学与一位教官同 时射击,而在靶纸上只留下一个弹孔。 如果要你推测,是谁打中的呢? 你会如何想呢?
max f ( xi , )
i 1
n
休息
结束
X 假设X 为连续型总体: f ( x; )
( X 1 , , X n ) 为子样
( x1 , , xn ) 为子样观察值。
已发生的事件为:
x x ,X {{X 11 1x, X 1 nx1 ,n } , xn x X n xn } x
休息
结束
ˆ
1 n ( X i X )2 n i 1
1 n ˆ X ( X i X )2 n i 1
休息
结束
矩法的优点是简单易行,并不需要 事先知道总体是什么分布 。 缺点是,当总体类型已知时,没有 充分利用分布提供的信息 . 一般场合下, 矩估计量不具有唯一性 。
( 1 )x , 0 x 1 f( x) 0, 其它
1
其中 1 是未知参数,
X1,X2,…,Xn是取自X的样本,求参数 的矩估计. 解:
1 E( X ) x( 1 )x dx
0
( 1 )
从 中解得
1
0
x
1
《概率论与数理统计》课件第七章 参数估计
![《概率论与数理统计》课件第七章 参数估计](https://img.taocdn.com/s3/m/555d2517dc36a32d7375a417866fb84ae55cc348.png)
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
第七章 参数估计
![第七章 参数估计](https://img.taocdn.com/s3/m/8f23151d33687e21af45a9c2.png)
a
2
b
X
2 (a,b)
a2
ab b2 3
1 n
n i 1
X
2 i
解方程组得aˆ X
3 n
n i1
(Xi
X )2 ,bˆ
X
3 n
n i1
(Xi
X )2
练习1
设总体X
~
e(),
X
1
,
X
2
,...,
X
是来自该
n
总体的一组样本,求的矩估计。
2 总体X的概率密度为f (x, )
1
L L
0, 0,
2
L 0,
s
1
ln L ln L
0, 0,
2
lnL 0,
s
解方程组求解出ˆ1, ˆ2 , ,ˆs .
例1.设总体X ~ N(, 2 ), 但, 2均未知,设X1, X2 ,Xn 是来自该总体的一组样本, 求, 2的极大似然估计.
2
)2
2
(3)似然方程
ln L
1
2
n
(Xi
i 1
)
0
ln L
2
n 2
1
2
1
2 4
n
(Xi
i 1
)2
0
(4)解方程组得 X ,
第七章__参数估计
![第七章__参数估计](https://img.taocdn.com/s3/m/088781e04afe04a1b071dedd.png)
三、区间估计与标准误
㈠区间估计的定义 是根据样本统计量,利用抽样分布的原理,在一定的
可靠程度上,估计出总体参数所在的范围,即以数 轴上的一段距离表示未知参数可能落入的范围。 ㈡置信区间与显著性水平 ⑴置信区间:也称置信间距,指在一定可靠程度上,总体参
数所在的区域距离或区域长度。
⑵置信界限(临界值):置信区间的上下两端点值。 ⑶显著性水平:指估计总体参数落在某一区间时,可能犯错
⑶区间估计的原理是样本分布理论。在计算区间估计值解释估 计的正确概率时,依据的是该样本统计量的分布规律及样本 分布的标准误。样本分布可提供概率解释,而标准误的大小 决定区间估计的长度。一般情况下,加大样本容量可使标准 误变小。
当总体方差已知时,样本平均数的分布为正态分布或
渐近正态分布,此时,样本平均数的平均数uX u, 平均数的离散程度即平均数分布的标准差(简称
例4
解:由题意知,其总体方差未知,但其总体分布为正态分布,
则此样本均数的分布服从t分布, 可以依t分布对总平 均身高μ进行估计。
SEX
S 4.8 0.81; df n 1 36 1 35 n 1 35
查t值表可知 : t0.05 230 2.042;t0.01 230 2.75
例2 已知某区15 岁男生立定跳远的方差 为 436.8cm ,现从该区抽取58名15岁男生, 测得该组男生立定跳远的平均数为198.4cm, 试求该区15岁男生立定跳远平均成绩的95%和 99%的置信区间。
例2
解:由题意知:由于样本容量(n=58)大于30 ,
该样本的抽样分布为渐进正态分布。
SEX
因此, 的95%的置信区间为 :
82 2.0211.12 82 2.0211.12
概率论与数理统计第七章参数估计
![概率论与数理统计第七章参数估计](https://img.taocdn.com/s3/m/38d93177e2bd960590c6778a.png)
例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .
概率论第7章
![概率论第7章](https://img.taocdn.com/s3/m/7cbe9279f7ec4afe04a1dfb5.png)
X1, ... ,Xn是来自总体X的独立同分布样本,分布
律或概率密度函数是f(x,q),其中q∈Q是参数,Q已知, 是q的取值范围.f (x,q)的形式已知,则有统计模型
f ( x1,θ) f ( xn ,θ) θ Q
例1 某种型号的产品N个,其合格率q未知,从中随机
抽取n个(n<<N),设Xi 是第i次抽到的样品,正品Xi=1, 否则 Xi =0,则 X1,X2,…,Xn 就是样本.总体分布为两点
分布B(0,1),参数空间为q=(0,1),则可得统计模型
n
n
xi
n xi
θ i1 (1 θ) i1
用矩估计法估计λ的值。
解 设X为灯管寿命,则
1 n
x n i1 xi 130.55
μ1
E
X
=
1 λ
μ1 m1
μ1
E
X
=
1 λ
X
λˆ 1 0.0077 X
例2 设总体X的均值μ和方差σ2 >0都存在,μ,σ2未知.
X1,…,Xn是来自 X 的样本,试求μ, σ2的矩估计量 .
矩估计量的观察值称为矩估计值 .
总体k阶中心矩 样本k阶中心矩
Vk
Bk
E[ X 1n
n i1
E( X )]k; ( Xi X )k .
例1. 设有一批灯管,其寿命服从参数为λ的指数分 布,今随机从中抽取11只,测得其寿命数据如下:
110, 184, 145, 122, 165, 143, 78, 129, 62, 130, 168
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设零件长度近似服从正态分布,试求方差σ 2 的置信度为 0.95 的置信区间.
n−1
∑ c ( X i+1 − X i )2 为σ 2 的无偏估计. i =1
7.设θˆ1 和θˆ2 相互独立且均为参数θ 的无偏估计,并且θˆ1 的方差是θˆ2 的方差的 2 倍,试求出常
数 a,b ,使得 aθˆ1 + bθˆ2 是θ 的无偏估计,并且在所有这样的无偏估计中方差最小.
8. 设总体 X 服从参数为 λ 的泊松分布, X1, , X n 是来自总体 X 的一个样本, X , S 2 分别
−∞
−∞ 2σ
阶矩,
∫ ∫ ∫ E(X 2 ) =
∞
x 2 f (x,σ )dx
=
∞
x2
− | x|
e σ dx
∞
=
x2
−x
eσ
dx
=2σ
2
−∞
−∞ 2σ
0σ
令
∑ 2σ 2
=
1 n
n i =1
X
2 i
解得参数σ 的矩估计量为
∑ σˆ =
1 2n
n i =1
X
2 i
2、解:(1)设 x1, x2 , , xn 是相应于 X1, X 2 , , X n 的样本,则似然函数为
∑ ⎧
⎪ ⎪⎩⎨(θ1
θ1 + θ2 = X
+ θ2 )2
+
θ
2 2
=
1 n
n i =1
X
2 i
解得参数θ1,θ 2 的矩估计量为:
θˆ1 = X − θˆ2 ,
∑ θˆ2 =
1 n
n i =1
X
2 i
− (X)2
(6)
∫ ∫ ∞
因为一阶矩 E( X ) = xf (x,σ )dx =
∞
x
−|x|
e σ dx = 0 ,它与σ 无关,所以还必须求二
θˆ = X (1) = min{X1, , X n } (4) 设 x1, x2 , , xn 是相应于 X1, X 2 , , X n 的样本,则似然函数为
∏ L(θ ) =
n
f
(
xi
,θ
)
=⎪⎨⎧θ
n 2
(
x1
x
2
xn ) θ −1, 0 ≤ xi ≤ 1, i = 1,2, , n
i =1
⎪⎩
(2)设从对数正态总体 X 取容量为 n 样本 x1, x2 , , xn ,求 E( X ) 的极大似然估计值.此处
μ ,σ 2 均为未知.
(3)已知在文学家萧伯纳的《AN Intelligent Woman’s Guide To Socialism》一书中,一个句子
的单词数近似服从对数正态分布. μ ,σ 2 均为未知.今从该书中随机的取 20 个句子.这些句子
(xi
i =1
0,
−
θ1
⎫ )⎬,
⎭
xi > θ1, i = 1,2, 其它
,n
所以当 xi > θ1,i = 1,2, n 时, L(θ1,θ2 ) > 0 ,并且
∑ ln
L
=
−n lnθ2
−
1 θ2
n
xi
i =1
+ nθ1 θ2
由 于 ∂ ln L = n ∂θ1 θ 2
> 0 , 所 以 L(θ1,θ 2 ) 是 θ1 的 单 调 递 增 函 数 ,
(5)
∫ ∫ E(X )
=
∞
xf
−∞
(x;θ1,θ 2 )dx
=
∞x θ θ1 2
exp⎨⎧− ⎩
x −θ1 θ2
⎫ ⎬dx ⎭
= θ1
+θ2
∫ ∫ E(X
2)
=
∞
x2
−∞
f
(x;θ1,θ 2 )dx
=
∞ θ1
x2 θ2
exp⎨⎧− ⎩
x −θ1 θ2
⎫ ⎬dx ⎭
=
(θ1
+ θ2 )2
+
θ
2 2
令
的单词数分别为 54 24 15 67 15 22 63 26 16 32 7 33 28 14 7 29 10 6 59 30 问这本书中,一个句子字数均值的极大似然估计值等于多少?
6.设总体 X ~ N (μ,σ 2 ) , X1, , X n 是来自总体 X 的一个样本,试确定常数 c ,使统计量
令
∑ d ln L
dθ
=
θ
n+ +1
n i =1
ln xi
=
0
解得θ 的极大似然估计值为
θˆ = −1 − n n ∑ ln xi i =1
从而θ 的极大似然估计量为
θˆ = −1 − n n
∑ ln X i
i =1
(2) 设 x1, x2 , , xn 是相应于 X1, X 2 , , X n 的样本,则似然函数为
⎧2e−2(x−θ ) , x ≥ θ ,
(3)
f
(
x,θ
)
=
⎪ ⎨
, 其中θ > 0 为未知参数;
⎪ ⎩
0
, x <θ
⎧ θ x θ −1 , 0 ≤ x ≤ 1,
(4)
f
(x,θ
)
=
⎪ ⎨
, 其中θ > 0 为未知参数;
⎪ ⎩
0
, 其他
(5)
f
(x;θ1,θ 2 )
=
⎪⎨⎧θ12
exp{−
x −θ1 }, θ2
n
ln L(θ ) = n ln 2 − 2∑ (xi − θ ) i =1
因为 d ln L = 2n > 0, 所以 L(θ ) 单调递增. dθ
因为必须满足 xi ≥ θ (i = 1,2, ) ,因此θ = x(1) = min{x1, , x(n)} 时, L(θ ) 取最大 值,所以θ 的极大似然估计值为θˆ = x(1) ,极大似然估计量为
16.设两位化验员 A, B 独立地对某种聚合物含氯量用相同的方法各做 10 次测定,其测定值的
样本方差依次为
s
2 A
=
0.5419
,
s
2 B
=
0.6065
,设
σ
2 A
,σ
2 B
分别为
A, B 所测定的测定值总体的
方差,设总体均为正态的.求方差比 σ
2 A
σ
2 B
的置信度为
0.95
的置信区间.
(二)解答
x > θ1
⎪⎩
0,
其它
(6)
f (x,σ ) =
1
− | x|
e σ,
其中 σ
> 0 为未知参数.
2σ
2. 求上题中各未知参数的极大似然估计量.
3. 设总体 X 服从参数为 m, p 的二项分布:
P{X
=
x}
=
⎜⎜⎝⎛
m x
⎟⎟⎠⎞
p
x
(1
−
p)m−x ,
x
=
0,1,2,…, m
,
0 < p < 1, p 是未知参数 X1,
11.设总体 X ~ N (μ,σ 2 ) , x1, x2 , , xn 是其样本值,如果σ 2 为已知,问 n 取多大值时,能保证 μ 的置信度为1 −α 的置信区间的长度不大于给定的 L ?
12.在测量反应时间中,一心理学家估计的标准差为 0.05 秒,为了以 95%的置信度使他对平均
反应时间的估计误差不超过 0,01 秒,应取多大的样本容量 n .
1、解 (1)
∫ ∫ E(X ) =
∞
xf (x)dx
=
1
(θ
+ 1)xθ +1
−∞
0
θ +2
令
θ +1 = X
θ +2
得未知参数θ 的矩估计量为
θˆ = 2X −1 1− X
(2) 因为 E( X ) = 1 ,所以 p 的矩估计量为 p
pˆ = 1 X
(3)
∫ ∫ E(X )
=
∞
xf
θ 的极大似然估计量为
θˆ =
n2
∑⎡ n
⎤2
⎢⎣ i=1 ln X i ⎥⎦
(5) 设 x1, x2 , , xn 是相应于 X1, X 2 , , X n 的样本,则似然函数为
∏ ∑ L(θ1,θ2 ) =
n i =1
f (xi ,θ1,θ2 ) =⎪⎩⎪⎨⎧θ12n
⎧ exp⎨−
⎩
1 θ2
n
估计量
∑ θˆ1
=
1 n
n i =1
Xi
−
1 2
,
θˆ2
=
X (n)
−
n n +1
皆为参数θ 的无偏估计,并且θˆ2 比θˆ1 有效. 10.从一台机床加工的轴承中,随机地抽取 200 件,测量其椭圆度,得样本均值 x = 0.081mm ,并 由累积资料知道椭圆度服从 N (μ,0.0252 ) ,试求 μ 的置信度为 0.95 的置信区间.
,Xn
是来自该总体的一个样本,求 p 的极大似然估计量.