第7章_参数估计
概率论与数理统计第7章参数估计PPT课件
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
第七章 参数估计
第三节 总体均数估计
估计总体平均数的步骤: 估计总体平均数的步骤: X与S 1、 计算样本 2、 计算 σ X 3、 确定置信水平或显著性水平并查表 4、计算置信区间 5、解释总体平均数的置信区间
一、正态估计法 , σ2已知 、
1、前题条件: 、前题条件:
总体正态, n不论大小 总体正态, n不论大小
点估计与区间估计的比较
定义: 定义
直接以样本统计量(数轴上的一个点) 点估计 :直接以样本统计量(数轴上的一个点) 作为总体参数的估计值
区间估计:按一定概率要求, 区间估计:按一定概率要求,根据样本统计量估 计总体参数可能落入的范围的一种统计方法。 计总体参数可能落入的范围的一种统计方法。也 就是说整体参数所落的有把握的范围 整体参数所落的有把握的范围。 就是说整体参数所落的有把握的范围。
D=0.95时 时
75.7 ≤ µ ≤ 81.3
5、解释:用样本1估计,总体的平均数落在 、解释:用样本1估计, 73.6-82.4之间的可能性为95%, 之间的可能性为95% 73.6-82.4之间的可能性为95%,超出这一范 围的可能性为5% 5%。 围的可能性为5%。 用样本2估计,总体的平均数落在76.7 80.3之 76.7用样本2估计,总体的平均数落在76.7-80.3之 间的可能性为95% 落在75.7 81.3的可能性为 95%, 75.7间的可能性为95%,落在75.7-81.3的可能性为 99%。 99%
X ± 2.58σ X
置信限:就是总体参数所落区间的上下界限。 置信限:就是总体参数所落区间的上下界限。即
X − 1.96σ X ≤ µ ≤ X + 1.96σ X
置信下限 置信上限
标准误
标准误(中心极限定理 ) 标准误(中心极限定理3)
概率论 第七章 参数估计
L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数
…
…
参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本
第7章参数估计
31 100
假定A品牌袋装大米的重量服从正态分布,现随机抽取13袋大 米,测得其重量(单位:千克)分别为 ⎛ ⎞ 24, 24.2, 24.4, 24.6, 24.7, ⎝ 24.8, 25, 25.1, 25.1, 25.2, ⎠ 25.3, 25.4, 25.6. 分别计算该品牌袋装大米的重量的均值,及重量的标准差 的95%的置信区间。
4. 整理后,得到未知参数������的置信区间
参数估计的基本原理 点估计 区间估计 一个总体参数的区间估计 总体均值的区间估计 总体比例的区间估计 总体方差的区间估计 两个总体参数的区间估计 两个总体均值之差的区间估计 两个总体比例之差的区间估计 两个总体方差之比的区间估计 样本量������的确定 估计总体均值是样本量的确定 估计总体比例时是样本量的确定
一家食品生产企业以生产袋装食品为主,每天的产量大约 为8000袋左右。按规定每袋的重量应为100g。为了对产品质量进 行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符 合要求。现从某天生产的一批食品中随机抽取25袋,测得每袋重 量如下所示: 112.5 102.6 100 116.6 136.8 101 107.5 123.5 95.4 102.8 103 95 102 97.8 101.5 102 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105 93.3
正态总体,������未知,因此应用公式①,即 ������ 2 ������ 2 方差的置信区间为[ ������(2������−(1) , ������2(������−1) ], ������ − 1) ( ������ −1) ������/2 1−������/2 √︂ √︂ ������ 2 ������ 2 标准差的置信区间为[ ������(2������−(1) , ������2(������−1) ]。 ������−1) (������−1)
概率第7章 参数估计
Gauss
Fisher
基本思想
甲.乙两人比较射击技术,分别射击目标一次,甲中而乙未中, 可以认为:甲射击技术优于乙射击技术. 事件A发生的概率为0.1或0.9,观察一次,事件A发生了, 可以认为:事件A发生的概率为0.9. 实际问题(医生看病、公安人员破案、技术人员进行质量 检验等)尽管千差万别,但他们具有一个共同的规律,即在 获得了观察资料之后,给参数选取一个数值,使得前面的观 察结果出现的可能性最大. 最大似然估计就是通过样本值 x1 , , x n 等数求得总体的 分布参数,使得 X1 ,, X n 取值为 x1 , , x n 的概率最大.
i
L( ) L( x1 , , x n ; ) f ( x i ; ),
i 1
n
的最大值,这里 ( )称为样本的似然函数 L .
ˆ 若 L( x 1 , , x n ; ) max L( x 1 , , x n ; )
ˆ 则称 ( x1 , , xn )为 的极大似然估计值 .
i
xi
在得到观测值 x1 , x 2 , , x n 的前提下,自然 应当选取使得 n
f ( x ; )dx
i i 1
i
达到最大的 值作为未知参数 的估计值.
因为当未知参数 等于这个值时,出现给 定的那个 样本观测值的可能性最 大.
但 dxi 不随 而变,故只需考虑:
3.期望和方差的点估计 在实际中,常常以样本均值作为总体均值的 点估计,以样本方差作为总体方差的点估计. 期望的点估计: (1)无偏性 1 n 选择估计量 X X i n i 1 (2)样本容量越大,估计值 越有效 方差的点估计:
第7章参数估计
x 1 0
f P 1-p
x
xf f
1 p 0 (1 p) p (1 p)
p
2 (x x)2 f (1 p)2 p (0 p)2 (1 p)
f
p (1 p)
似然函数常简记为L或 L 1,2, ,k
未知参数的函数。
38
若有 ˆi (x1, x2,..., xn ) i 1, 2, k 使得
L x1, x2,..., xn;ˆ1, ˆ 2,
, ˆ k
max L (1 ,2 , ,k )
x1, x2,..., xn; 1, 2,
, k
则 ˆi (X1, X2,..., Xn) 为参数θi的极大似然估计量。
中选出一个使样本观察值出现的概率为最大的 ˆ 作
为θ的估计量。
称 ˆ 为θ 的极大似然估计量。
37
2.似然函数的数学表达式
设X1,X2,…Xn是取自总体X的一个样本,样本的联合密度 (连续型)或联合分布律 (离散型)为 :
f (x; 1,2 , , k )
定义似然函数为:
n
L L x1,..., xn; 1, 2, , k f xi; 1, 2, , k i 1 x1, x2 ,..., xn 给定的样本观察值
§7.1.4抽样误差
1.误差:调查结果与实际值之间的差异 抽样调查中的误差
登记性误差(非抽样误差) 误差代表性误差随系机统误误差差((抽非样抽误样差误)差)
2.抽样误差—由于抽样的随机性而产生的 样本指标对总体指标的代表性误差。抽样误 差可以计算并加以控制,但不可以避免。
(07)第7章 参数估计
STATISTICS
第 7 章 参数估计
7.1 参数估计的一般问题 7.2 一个总体参数的区间估计 7.3 必要的样本容量的确定
7-1
统计学
STATISTICS
学习目标
1. 2. 3. 4.
估计量与估计值的概念 点估计与区间估计的区别 一个总体参数的区间估计方法 必要的样本容量的确定方法
7-2
统计学
STATISTICS
置信水平
1. 将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比重称为置信水平,也叫做置信度 2. 表示为 (1 -
为总体参数未在区间内的比重
相应的 为0.01,0.05,0.10
3. 常用的置信水平值有 99%, 95%, 90%
2. 则,将所有样本均值标准化为t统计量:
t x n ~ t (n 1)
3. 最终,总体均值 在1-置信水平下的置信 区间为: s
x t
2
s
7 - 24
n
统计学
STATISTICS
t 分布
t 分布是类似正态分布的一种对称分布,它通常要比 正态分布平坦和分散。一个特定的t分布依赖于称之 为自由度的参数。随着自由度的增大,分布也逐渐 趋于正态分布
2
n
或 p z
p(1 - p)
2
( 未知时)
n
统计学
STATISTICS
总体比重的区间估计
(例题分析)
解:已知 n=100,p=65% , 1- = 95%, z/2=1.96
p z p (1 p )
2
【例】某城市想 要估计下岗职工 中女性所占的比 重,随机地抽取 了 100 名 下 岗 职 工,其中65人为 女性职工。试以 95%的置信水平 估计该城市下岗 职工中女性比重 的置信区间
统计学第七章、第八章课后题答案
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
07心理统计学-第七章 参数估计
犯错误的概率,常用α(或p)表示。则1-α为置信 度。(显著性水平越高表示的是α值越小,即犯错误的可
能性越低) α为预先设定的临界点,常用的如.05、.01、.001;p 为检验计算所得的实际(犯错误)概率。
第一节 点估计、区间估计与标准误
三、区间估计与标准误
3、区间估计的原理与标准误
转换成比率为
p
n
p, SE p
n
pq n
同理可得公式7-17。自习[例7-12、例7-13]
1、从某地区抽样调查400人,得到每月人均文化消费为 160元。已知该地区文化消费的总体标准差为40元。试 问该地区的每月人均文化消费额。(α=.05,总体呈正态
分布)
2、上题中总体方差未知,已知Sn-1=44元。 3、已知某中学一次数学考试成绩的分布为正态分布,总 体标准差为5。从总体中随机抽取16名学生,计算得平 均数为81、标准差为Sn=6。试问该次考试中全体考生成 绩平均数的95%置信区间。 4、上题中总体方差未知,样本容量改为17人。 5、假定智商服从正态分布。随机抽取10名我班学生测 得智商分别为98、102、105、105、109、111、117、 123、124、126(可计算得M=112,Sn≈9.4),试以95% 的置信区间估计我班全体的智商平均数。 返回
值表,求tα /2(df)。
5、计算置信区间CI。
σ2已知,区间为M-Zα /2 SE <μ< M+Zα /2 SE;
σ2未知,区间为M-tα /2(df)SE <μ< M+tα /2(df)SE。
6、对置信区间进行解释。
二、σ2已知,对μ的区间估计(Z分布,例7-1 & 2) 三、σ2未知,对μ的区间估计(t分布,例7-3 & 4)
统计学原理:第7章 参数估计
一个总体参数的区间估计
总体参数 均值 比例 方差
7 - 26
符号表示 样本统计量
x
p
2
s2
7.2.1 总体均值的区间估计
1、正态总体、2已知,
非正态总体、大样本
2、正态总体、2未知,小样本
7 - 27
总体均值的区间估计
(1、Z分布)
1. 假定条件
总体服从正态分布,且方差(2) 已知
量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10g。试估计该批产品平均重量的 置信区间,置信水平为95%
这表明一个具体的点估计值无法给出估计的可 靠性的度量,一个点估计量的可靠性是由它的 抽样标准误差来衡量的。
7 -9
抽样分布回顾
Xi ~
, 2
..X
~
,
2
n
p Z Z Z 1
2
2
p Z 2
X
X
Z 2
1
p
Z 7 - 10
2
X
X
Z
2
X
1
抽样分布回顾
p
Z
2
X
X
7 - 12
实际情况是,样本均值已知,而总体均值未知 。
x
样本均值与总体均值的距离是对称的,
若某个样本均值落在总体均值的两个标准差范围以内, 则总体均值就会被包括在以样本均值为中心左右两个标 准差的范围之内。
7 - 13
区间估计
(interval estimate)
1. 总体参数估计的一个区间: 样本统计量 加减 估计误差
心理及教育统计学第7章参数估计
章节内容
第一节 点估计、区间估计及标准误 第二节 总体平均数的估计 第三节 标准差与方差的区间估计 第四节 相关系数的区间估计 第五节 比率及比率差异的区间估计
总体参数估计:在研究中从样本获得一组数 据后,通过这组信息,对总体特征进行估计, 即从局部结果推论总体的情况。
总体参数估计分点估计和区间估计两种。
7 8 2 . 2 6 2 2 . 6 7 7 8 2 . 2 6 2 2 . 6 7
71.9684.04
当n2=36时,df2=35,t0.05/2=2.042
7 9 2 . 0 4 2 1 . 5 2 7 9 2 . 0 4 2 1 . 5 2
75.982.1
【例7-4】
根据n2=36的样本估计总体参数μ:
0.95的置信区间 7 8 1 . 9 6 1 . 1 8 7 9 1 . 9 6 1 . 1 8
76.781.3
0.99的置信区间
7 9 2 . 5 8 1 . 1 8 7 9 2 . 5 8 1 . 1 8
75.782.04
83.686.4
总体方差σ2未知,对总体平均数的估计
总体方差未知,用样本的无偏方差(
s
2 n 1
)作为总体
方差的估计值,实现对总体平均数μ的估计。因为在总
体方差未知时,样本平均数的分布为t分布,故应查t值
表,确定t/2或t(1-)/2。
有两种情况:
(1)总体的分布为正态时,可不管n之大小。
(2)总体分布为非正态时,只有n>30,才能用概率对 其抽样分布进行解释,否则不能推论。
0.05水平和0.01水平是人们习惯上常用的两个显著性 水平。
区间估计的原理是抽样分布理论。在计算区间估计值, 解释估计的正确概率时,依据的是该样本统计量的分 布规律及抽样分布的标准误(SE)。
张厚粲 第七章 参数估计
间。
解:12名学生阅读能力的得分假定是从正态总体
中抽出的随机样本,而总体标准差σ未知,样本的容量 较小(n=12<30),在此条件下,样本平均数与总体 平均数离差统计量服从呈t分布。
于是需用t分布来估计该校三年级学生阅读能力总
体平均数95%和99%的置信区间。
由原始数据计算出样本统计量为
X 29.917
性的指标。
平均数区间估计的基本原理
通过样本的平均数估计总体的平均数,首先假定该样本 是随机取自一个正态分布的母总体(或非正态总体中的n> 30的样本),而计算出来的实际平均数是无数容量为n的
样本平均数中的一个。
根据样本平均数的分布理论,可以对总体平均数进行估 计,并以概率说明其正确的可能性。
一.总体平均数区间估计的基本步骤 ①.根据样本的数据,计算样本的平均数和标准差; ②.计算平均数抽样分布的标准误;
例:已知某样本的分散程度
标准差与方差分别计算)。
解1(标准差):
,样本
容量40,问该样本之总体的分散程度如何。(用
,样本标准差的分布接近正态分布,用Z分布。
(1) 0.95或0.05
10-1.96×1.12<σ<10+1.96×1.12
7.8 <σ<12.2 (2)0.99或0.01 10-2.58×1.12<σ<10+2.58×1.12 7.11<σ<12.89
第二节 总体平均数的估计
平均数抽样分布的几个定理
⑴.从总体中随机抽出容量为n的一切可
能样本的平均数之平均数等于总体的平均数。
E( X )
⑵.容量为n的平均数在抽样分布上的标准差 (即平均数的标准误),等于总体标准差除以n的平 方根。
数理统计 第七章-参数估计
休息
结束
2. 最大似然法
是在总体类型已知条件下使用的一 种参数估计方法 。 它首先是由德国数学家高斯在1821 年提出的 ,费歇在1922年重新发现了这 一方法,并首先研究了这 种方法的一些 性质 。
休息 结束
最大似然法的基本思想:
已发生的事件具有最大概率。
休息
结束
先看一个简单例子: 在军训时,某位同学与一位教官同 时射击,而在靶纸上只留下一个弹孔。 如果要你推测,是谁打中的呢? 你会如何想呢?
max f ( xi , )
i 1
n
休息
结束
X 假设X 为连续型总体: f ( x; )
( X 1 , , X n ) 为子样
( x1 , , xn ) 为子样观察值。
已发生的事件为:
x x ,X {{X 11 1x, X 1 nx1 ,n } , xn x X n xn } x
休息
结束
ˆ
1 n ( X i X )2 n i 1
1 n ˆ X ( X i X )2 n i 1
休息
结束
矩法的优点是简单易行,并不需要 事先知道总体是什么分布 。 缺点是,当总体类型已知时,没有 充分利用分布提供的信息 . 一般场合下, 矩估计量不具有唯一性 。
( 1 )x , 0 x 1 f( x) 0, 其它
1
其中 1 是未知参数,
X1,X2,…,Xn是取自X的样本,求参数 的矩估计. 解:
1 E( X ) x( 1 )x dx
0
( 1 )
从 中解得
1
0
x
1
概率与数理统计第7章参数估计习题与答案
第7章参数估计----点估计一、填空题1、设总体X服从二项分布B(N,p),0P1,X1,X2X n是其一个样本,那么矩估计量p?XN.2、设总体X~B(1,p),其中未知参数0p1,X1,X2,X n是X的样本,则p的矩估计为_ 1n in1X i _,样本的似然函数为_in1X i(1p)1Xp__。
i3、设X1,X2,,X n是来自总体X~N(,2)的样本,则有关于及2的似然函数2L(X,X,X n;,)_12 in112e12(X) i22__。
二、计算题1、设总体X具有分布密度f(x;)(1)x,0x1,其中1是未知参数,X1,X2,X为一个样本,试求参数的矩估计和极大似然估计.n解:因E(X ) 1x1a()α1(α1)xdx1x dxαα112a2|xααα12令E(X)X?α?α122X1α?为的矩估计1Xn因似然函数L(x1,x2,x;)(1)(x1x2x)nnnlnLnln(α1)lnX,由αii1 l nLαnα 1inlnX0得,i1n ?的极大似量估计量为(1)αnln Xii12、设总体X服从指数分布f(x)xe,x00,其他,X1,X2,X n是来自X的样本,(1)求未知参数的矩估计;(2)求的极大似然估计.56解:(1)由于1 E(X),令11 X X,故的矩估计为? 1 X(2)似然函数nL(x,x,,x )e12ni nx i 1nlnLnlnxii1 ndlnLnnx0 indi1x ii1故的极大似然估计仍为1 X 。
3、设总体 2 X~N0,, X 1,X 2,,X n 为取自X 的一组简单随机样本,求 2 的极大似然估计;[解](1)似然函数n1 Le i122 x i 2 22n 22en 2x i 2 i 12于是n2nnx2i lnLln2ln2222i1 dlnLn1d224 22n i1 2x i,令 d lnL 2d 2 0,得的极大似然估计:n 122X ini1. 4、设总体X 服从泊松分布P(),X 1,X 2,,X n 为取自X 的一组简单随机样本,(1)求 未知参数估计;(2)求大似然估计. 解:(1)令E(X )X?X ,此为估计。
概率与数理统计第7章参数估计习题及答案
第7章参数估计 ----点估计一、填空题1、设总体X 服从二项分布),(p N B ,10P ,n X X X 21,是其一个样本,那么矩估计量pX N.2、设总体)p ,1(B ~X ,其中未知参数01p, X X X n 12,,是X 的样本,则p 的矩估计为_n1i iX n1_,样本的似然函数为_iiX 1n1i X )p 1(p __。
3、设12,,,n X X X 是来自总体),(N ~X 2的样本,则有关于及2的似然函数212(,,;,)n L X X X _2i2)X (21n1i e21__。
二、计算题1、设总体X 具有分布密度(;)(1),01f x x x ,其中1是未知参数,n X X X ,,21为一个样本,试求参数的矩估计和极大似然估计.解:因10101α1α1αdxxdxx x X E a)()()(2α1α2α1α12|a x令2α1α)(XX E XX112α为的矩估计因似然函数1212(,,;)(1)()nn n L x x x x x x ni i X n L 1α1αln )ln(ln ,由ni iX n L 101ααln ln 得,的极大似量估计量为)ln (ni iX n11α2、设总体X 服从指数分布,0()0,xe xf x 其他,n X X X ,,21是来自X 的样本,(1)求未知参数的矩估计;(2)求的极大似然估计.解:(1)由于1()E X ,令11XX,故的矩估计为1X(2)似然函数112(,,,)nii x nn L x x x e111ln lnln 0nii nini ii L n x d Lnnx dx 故的极大似然估计仍为1X。
3、设总体2~0,X N ,12,,,n X X X 为取自X 的一组简单随机样本,求2的极大似然估计;[解] (1)似然函数222112i x ni Le2212222ni i x ne于是2221ln ln 2ln222ni i x n n L22241ln 122n ii d L n x d,令2ln 0d L d,得2的极大似然估计:2211nii X n.4、设总体X 服从泊松分布()P , 12,,,n X X X 为取自X 的一组简单随机样本, (1)求未知参数的矩估计;(2)求的极大似然估计.解:(1)令()E X XX ,此为的矩估计。
第七章 参数估计
a
2
b
X
2 (a,b)
a2
ab b2 3
1 n
n i 1
X
2 i
解方程组得aˆ X
3 n
n i1
(Xi
X )2 ,bˆ
X
3 n
n i1
(Xi
X )2
练习1
设总体X
~
e(),
X
1
,
X
2
,...,
X
是来自该
n
总体的一组样本,求的矩估计。
2 总体X的概率密度为f (x, )
1
L L
0, 0,
2
L 0,
s
1
ln L ln L
0, 0,
2
lnL 0,
s
解方程组求解出ˆ1, ˆ2 , ,ˆs .
例1.设总体X ~ N(, 2 ), 但, 2均未知,设X1, X2 ,Xn 是来自该总体的一组样本, 求, 2的极大似然估计.
2
)2
2
(3)似然方程
ln L
1
2
n
(Xi
i 1
)
0
ln L
2
n 2
1
2
1
2 4
n
(Xi
i 1
)2
0
(4)解方程组得 X ,
第七章__参数估计
三、区间估计与标准误
㈠区间估计的定义 是根据样本统计量,利用抽样分布的原理,在一定的
可靠程度上,估计出总体参数所在的范围,即以数 轴上的一段距离表示未知参数可能落入的范围。 ㈡置信区间与显著性水平 ⑴置信区间:也称置信间距,指在一定可靠程度上,总体参
数所在的区域距离或区域长度。
⑵置信界限(临界值):置信区间的上下两端点值。 ⑶显著性水平:指估计总体参数落在某一区间时,可能犯错
⑶区间估计的原理是样本分布理论。在计算区间估计值解释估 计的正确概率时,依据的是该样本统计量的分布规律及样本 分布的标准误。样本分布可提供概率解释,而标准误的大小 决定区间估计的长度。一般情况下,加大样本容量可使标准 误变小。
当总体方差已知时,样本平均数的分布为正态分布或
渐近正态分布,此时,样本平均数的平均数uX u, 平均数的离散程度即平均数分布的标准差(简称
例4
解:由题意知,其总体方差未知,但其总体分布为正态分布,
则此样本均数的分布服从t分布, 可以依t分布对总平 均身高μ进行估计。
SEX
S 4.8 0.81; df n 1 36 1 35 n 1 35
查t值表可知 : t0.05 230 2.042;t0.01 230 2.75
例2 已知某区15 岁男生立定跳远的方差 为 436.8cm ,现从该区抽取58名15岁男生, 测得该组男生立定跳远的平均数为198.4cm, 试求该区15岁男生立定跳远平均成绩的95%和 99%的置信区间。
例2
解:由题意知:由于样本容量(n=58)大于30 ,
该样本的抽样分布为渐进正态分布。
SEX
因此, 的95%的置信区间为 :
82 2.0211.12 82 2.0211.12
概率论与数理统计第七章参数估计
例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .
概率论第7章
X1, ... ,Xn是来自总体X的独立同分布样本,分布
律或概率密度函数是f(x,q),其中q∈Q是参数,Q已知, 是q的取值范围.f (x,q)的形式已知,则有统计模型
f ( x1,θ) f ( xn ,θ) θ Q
例1 某种型号的产品N个,其合格率q未知,从中随机
抽取n个(n<<N),设Xi 是第i次抽到的样品,正品Xi=1, 否则 Xi =0,则 X1,X2,…,Xn 就是样本.总体分布为两点
分布B(0,1),参数空间为q=(0,1),则可得统计模型
n
n
xi
n xi
θ i1 (1 θ) i1
用矩估计法估计λ的值。
解 设X为灯管寿命,则
1 n
x n i1 xi 130.55
μ1
E
X
=
1 λ
μ1 m1
μ1
E
X
=
1 λ
X
λˆ 1 0.0077 X
例2 设总体X的均值μ和方差σ2 >0都存在,μ,σ2未知.
X1,…,Xn是来自 X 的样本,试求μ, σ2的矩估计量 .
矩估计量的观察值称为矩估计值 .
总体k阶中心矩 样本k阶中心矩
Vk
Bk
E[ X 1n
n i1
E( X )]k; ( Xi X )k .
例1. 设有一批灯管,其寿命服从参数为λ的指数分 布,今随机从中抽取11只,测得其寿命数据如下:
110, 184, 145, 122, 165, 143, 78, 129, 62, 130, 168
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
= 1219.78 , 1280.62
(2) A- B置信度为99%的置信区间为
(4500 3250) 2.58 2500 3600 25 25
= 1209.7 ,1290.3
2)总体方差未知但相等 使用 t 分布统计量
t
x
t
2
sn1 n
,x
t
2
sn1 n
50 2.0639
8 ,50 2.0639 25
8 25
46.69,53.3
7.2.2 总体比例的区间估计
总体服从二项分布,样本量足够大,样
本比例的抽样分布可用正态分布近似时,对
总体比例的区间估计,使用统计量
z
p
1
n
~
N 0,1 ,
总体比例 p 的置信区间为 p Z 2
+1.65x
+ 2.58x
X
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
置信水平:
1. 置信区间中包含总体参数真值的次数所占 比例
2. 表示为 (1 -
– 为显著性水平,是总体参数未在区间内的 概率
3. 常用的显著性水平值有 99%, 95%, 90%
– 相应的 为0.01,0.05,0.10
解:已知 x=26, =6,n=100,1- = 0.95,Zα/2=1.96
x Z 2
n , x Z 2
n
26 1.96
6 ,26 1.96 100
6 100
24.824,27.176
2.正态总体、方差未知、小样本 用样本方差代替总体方差,这时用 t 统
计量进行估计。
t
x s
n
7.2.1 总体均值的区间估计
1.正态总体、方差已知,或非正态总体、大样本
总体服从正态分布,且总体方差(2)已知 如果不是正态分布,可以由正态分布来近似 (n≥30)
使用正态分布统计量
z
x n
~
N
0,1
进行估计
总体均值
在
1-
置信水平下的置信区间为
x
Z
2
n
;
如果方差未知,或总体不服从正态分布的情况下,只要满足大样
0.95,Z/2=1.96
pˆ Z 2
pˆ (1 pˆ ) n
0.7 1.96 0.7(1 0.7) 200
0.636, 0.764
7.2.3 总体方差的区间估计
对于正态总体方差的估计,可以用
2
=
n
1
2
s
2
~
2
n 1 统计量进行估计
总体方差在 1-α置信水平下的置信区
n 1 s2 n 1 s2
~
t
n
1
总体均值 在 1- 置信水平下的置信
区间
x
t
2
sn1 n
,
x
t
2
sn1 n
【例】从一个正态总体中抽取一个随机样本,n =
25 ,其均值x = 50 ,标准差 s = 8。 建立总体均值
的95%的置信区间。
解:已知X~N(,2),x=50, s=8, n=25, 1- =
0.95,t/2=2.0639。
x1 x2 z 2
s12 s22 n1 n2
86 78 z0.025
5.82 7.22
46 33
8 1.961.52
(2)小样本的估计 在两个样本都是小样本的情况下,为估
计两个总体的均值之差,需要做出以下假定
➢ 两个总体都服从正态分布 ➢ 两个随机样本独立的分别抽自两个总体
则两个样本均值之差必定服从正态分布
总 态分体布服。从试方求差分A-别为B的区A2=间25估00计和B2=3600的正
(1)置信度为95%
(2)置信度为99%
解:已知
XA~N(A,2500) XB ~N(B,3600)
xA=4500, xB=3250,
A2 =2500 B2 =3600
nA= nB =25
(1) A- B置信度为95%的置信区间为
7.3 两个总体参数的区间估计
7.3.1 两个总体均值之差的区间估计
总体1
1 1
2 2
总体2
抽取简单随机样 样本容量 n1 计算 X1
计算每一对样本 的X1-X2
抽取简单随机样 样本容量 n2 计算X2
所有可能样本 的X1-X2
1 2
抽样分布
1.两个总体均值之差的估计:独立样本
如果两个样本是从两个总体中独立抽取 的,即一个样本中的元素与另一个样本中的 元素相互独立,则称为独立样本
P1 P2
12
2 2
用于估计的 样本统计量
x pˆ
s2 x1 x2 pˆ1 pˆ2 s12 s22
7.1.2 点估计与区间估计
1.点估计 用样本统计量 $的某个取值直接作为总
体参数 的估计值。
例如: 用样本均值 x 作为总体未知均值 的估
计值就是一个点估计
点估计没有给出估计值接近总体未知参 数程度的信息
s12=16.63 s22=18.92 n1= n2=10 1212
自由度 f 为
2
16.36 18.92
f 10
10
17.9 18
16.36
10
2
1 9
18.92
10
2
1 9
1- 2置信度为95%的置信区间为
22.2 28.5 2.1009 16.36 18.92
2.区间估计
在点估计的基础上,给出总体参数估计 的一个区间范围,该区间通常由样本统计量 加减估计误差得到。对样本统计量与总体参 数的接近程度给出一个概率度量。
例如: 总体均值落在50~70之间,置信度为95%
置信区间
样本统计量 (点估计)
置信下限
置信上限
X = Zx
x_
- 2.58x
-1.65 x
本条件,可以用样本方差代替总体方差,即
x
Z
2
s n
【例】某种零件长度服从正态分布,从该批产品中 随机抽取9件,测得其平均长度为21.4 mm。已知总 体标准差0.15mm,试建立该种零件平均长度的置信 区间,给定置信水平为0.95。
解:已知X~N(,0.152),x=2.14, n=9, 1- = 0.95, Z/2=1.96
s22 n2
2
2
n1
s22
2 n2
n1 1
n2 1
两个总体均值之差1-2在1- 置信水平
下的置信区间为
x1 x2
t 2 (v)
s12 s22 n1 n2
【例】为比较两位银行职员为新顾客办理个
人结算账目的平均时间长度,分别给两位 职员随机安排了10位顾客,并记录下了为 每位顾客办理账单所需的时间(单位:分
X
2.有效性
对同一总体参数的两个无偏估计量,有 更小标准差的估计量更有效。
与其他估计量相比 ,样本均值是一个更 有效的估计量
均值的抽样分布
P(X )
B
中位数的抽样分布
A
X
3.一致性
随着样本量的增大,点估计量的值越来 越接近被估总体参数。
较小的样本容量
X
7.2 一个总体参数的区间估计
x1 x2 sp
1 2
11 n1 n2
: t n1 n2 2
s
2 p
n1 1 s12 n1 n2
n2 1 2
s22
两个总体均值之差1-2在1- 置信水平 下的置信区间为
x1 x2 t 2 n1 n2 2sp
11 n1 n2
【例】为比较两位银行职员为新顾客办理个
人结算账目的平均时间长度,分别给两位职 员随机安排了10位顾客,并记录下为每位顾 客办理账单所需的时间(单位:分钟),相 应的样本均值和方差分别为:x1=22.2, s12=16.63,x2=28.5,s22=18.92。假定每位职 员办理账单所需时间均服从正态分布,且方
本差值的标准差 sd 代替
(2)小样本 假定两个总体个观察之的配对差服从正态分布,
两个总体均值之差 1-2 在 1- 置信水平下的置信 区间为
d
t
2 n 1
sd n
7.3.2 两个总体比例之差的区间估计
1. 假定条件
▪ 两个总体是独立的 ▪ 两个总体服从二项分布 ▪ 可以用正态分布来近似
2. 两个总体比例之差P1-P2在1-置信水平下 的置信区间为
区间与置信水平
均值的抽样分布
x
/2
1 -
/2
X
x
(1 - ) % 区间包含了 % 的区间未包含
7.1.3 评价估计量的标准
1.无偏性 估计量抽样分布的数学期望等于被估计
的总体参数,E $ 。则称$为 的无偏估计量。
x, p, s2 分别是 , , 2 的无偏估计量
P( X )
无偏 有偏
A
C
水平下的置信区间为: x1 x2 z 2
s12 s22 n1 n2
某地区教育管理部门想估计两所中学的学生 高考时的英语平均分数之差,为此在两所学 校独立抽取两个随机样本,有关数据如下:
n1 46n2 33 x1 86x2 78 s1 5.8s2 7.2
建立两所学校高考英语平均分之 差95%的置信区间
钟),相应的样本均值和方差分别为: x1=22.2,s12=16.63,x2=28.5,s22=18.92 。假定每位职员办理账单所需时间均服从
正态分布,但方差不相等。试求两位职员 办理账单的服务时间之差的95%的区间估计 。