第7章 参数估计
概率论第七章 第1节
根据样本概率最大原则,m的估计值为3。
最大似然估计法原理
一般地,不仿设总体X是离散型分布X~p(x,θ),如果 X1,X2,…,Xn是来自这个总体的一个随机样本,x1,x2,…,xn 是这个随机样本的样本值,则这个样本发生的概率为:
记这个概率为θ的函数:
16
最大似然估计法原理
如果在一次抽样中样本值x1,x2,…,xn出现了,我们就认为 它之所以出现是因为它发生的概率最大导致的。因此我们 就选择能使这个概率最大的那个θ作为θ的估计值,这就 是极大似然估计法。 “样本值概率最大原则”
矩估计法理论依据
命题2:设总体X的l=1,2,…,k阶矩存在即E(Xl)=μk,则l阶样 本矩A1,A2,…,Ak的连续函数g(A1,A2,…,Ak)也依概率收敛于总 体矩的连续函数即
根据这两个命题,我们使用如下方法来进行矩估计: (1)用样本矩A1,A2,…,Ak来估计总体矩; (2)用样本矩的连续函数g(A1,A2,…,Ak)来估计总体矩的连续 函数g(μ1,μ2,…,μk)。
砍掉充分小的dxi,记这 个概率为θ的函数:
30
连续型总体中参数 θ的似然函数!
最大似然估计值 最大似然估计量
怎样求最大值点?
基于此通常先取对数,再求最大值点。
化成求 对数似 然函数 的最大 值点!
如果对数似然函数二阶可导,并且概率 密度函数是单峰函数,则驻点就是最大 值点!通过求一阶导数能得驻点:
第七章 参数估计
1、什么是参数估计? 当总体的分布类型已知,但其中仍有未知参数。比如总体 X服从参数μ,σ2的正态分布,但μ,σ2未知。但是我们 能根据来自总体X的一个简单随机样本X1,X2,…,Xn通过适 当的方法对这些未知参数进行估计,得到它的一个近似值 或近似区间。 2、参数估计有哪些形式? (1)点估计:矩估计法、极大似然估计法。 (2)区间估计:正态总体下区间估计法。
第七章 参数估计
第三节 总体均数估计
估计总体平均数的步骤: 估计总体平均数的步骤: X与S 1、 计算样本 2、 计算 σ X 3、 确定置信水平或显著性水平并查表 4、计算置信区间 5、解释总体平均数的置信区间
一、正态估计法 , σ2已知 、
1、前题条件: 、前题条件:
总体正态, n不论大小 总体正态, n不论大小
点估计与区间估计的比较
定义: 定义
直接以样本统计量(数轴上的一个点) 点估计 :直接以样本统计量(数轴上的一个点) 作为总体参数的估计值
区间估计:按一定概率要求, 区间估计:按一定概率要求,根据样本统计量估 计总体参数可能落入的范围的一种统计方法。 计总体参数可能落入的范围的一种统计方法。也 就是说整体参数所落的有把握的范围 整体参数所落的有把握的范围。 就是说整体参数所落的有把握的范围。
D=0.95时 时
75.7 ≤ µ ≤ 81.3
5、解释:用样本1估计,总体的平均数落在 、解释:用样本1估计, 73.6-82.4之间的可能性为95%, 之间的可能性为95% 73.6-82.4之间的可能性为95%,超出这一范 围的可能性为5% 5%。 围的可能性为5%。 用样本2估计,总体的平均数落在76.7 80.3之 76.7用样本2估计,总体的平均数落在76.7-80.3之 间的可能性为95% 落在75.7 81.3的可能性为 95%, 75.7间的可能性为95%,落在75.7-81.3的可能性为 99%。 99%
X ± 2.58σ X
置信限:就是总体参数所落区间的上下界限。 置信限:就是总体参数所落区间的上下界限。即
X − 1.96σ X ≤ µ ≤ X + 1.96σ X
置信下限 置信上限
标准误
标准误(中心极限定理 ) 标准误(中心极限定理3)
第7章 参数估计
重复构造出µ 20个 重复构造出µ的20个置信区间
统计学
STATISTICS
置信区间与置信水平
均值的抽样分布
α /2
σx
1–α
α /2
µx = µ
(1 - α) 区间包含了µ
x
α 的区间未包含µ
7 – 107-21 10Байду номын сангаас-
统计学
STATISTICS
影响区间宽度的因素
σ
1. 总体数据的离散程度,用 σ 来测度 总体数据的离散程度,用
比如,某班级平均分数在75~85之间,置信水平是95% 比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计) 点估计)
7 – 107-15 107-
置信下限
置信上限
统计学
STATISTICS
中心极限定理
(central limit theorem) theorem)
7 – 107-6 107-
统计学
STATISTICS
参数估计在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
7 – 107-7 107-
假设检验
统计学
STATISTICS 总体
统计推断的过程
样 本
样本统计量 如:样本均值 、比例、方差
7 – 107-8 107-
统计学
STATISTICS
7 – 107-11 107-
统计学
STATISTICS
点估计与区间估计
7 – 107-12 107-
统计学
STATISTICS
参数估计的方法
估 计 方 法
点
概率论 第七章 参数估计
L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数
…
…
参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本
概率第7章 参数估计
Gauss
Fisher
基本思想
甲.乙两人比较射击技术,分别射击目标一次,甲中而乙未中, 可以认为:甲射击技术优于乙射击技术. 事件A发生的概率为0.1或0.9,观察一次,事件A发生了, 可以认为:事件A发生的概率为0.9. 实际问题(医生看病、公安人员破案、技术人员进行质量 检验等)尽管千差万别,但他们具有一个共同的规律,即在 获得了观察资料之后,给参数选取一个数值,使得前面的观 察结果出现的可能性最大. 最大似然估计就是通过样本值 x1 , , x n 等数求得总体的 分布参数,使得 X1 ,, X n 取值为 x1 , , x n 的概率最大.
i
L( ) L( x1 , , x n ; ) f ( x i ; ),
i 1
n
的最大值,这里 ( )称为样本的似然函数 L .
ˆ 若 L( x 1 , , x n ; ) max L( x 1 , , x n ; )
ˆ 则称 ( x1 , , xn )为 的极大似然估计值 .
i
xi
在得到观测值 x1 , x 2 , , x n 的前提下,自然 应当选取使得 n
f ( x ; )dx
i i 1
i
达到最大的 值作为未知参数 的估计值.
因为当未知参数 等于这个值时,出现给 定的那个 样本观测值的可能性最 大.
但 dxi 不随 而变,故只需考虑:
3.期望和方差的点估计 在实际中,常常以样本均值作为总体均值的 点估计,以样本方差作为总体方差的点估计. 期望的点估计: (1)无偏性 1 n 选择估计量 X X i n i 1 (2)样本容量越大,估计值 越有效 方差的点估计:
第7章参数估计
x 1 0
f P 1-p
x
xf f
1 p 0 (1 p) p (1 p)
p
2 (x x)2 f (1 p)2 p (0 p)2 (1 p)
f
p (1 p)
似然函数常简记为L或 L 1,2, ,k
未知参数的函数。
38
若有 ˆi (x1, x2,..., xn ) i 1, 2, k 使得
L x1, x2,..., xn;ˆ1, ˆ 2,
, ˆ k
max L (1 ,2 , ,k )
x1, x2,..., xn; 1, 2,
, k
则 ˆi (X1, X2,..., Xn) 为参数θi的极大似然估计量。
中选出一个使样本观察值出现的概率为最大的 ˆ 作
为θ的估计量。
称 ˆ 为θ 的极大似然估计量。
37
2.似然函数的数学表达式
设X1,X2,…Xn是取自总体X的一个样本,样本的联合密度 (连续型)或联合分布律 (离散型)为 :
f (x; 1,2 , , k )
定义似然函数为:
n
L L x1,..., xn; 1, 2, , k f xi; 1, 2, , k i 1 x1, x2 ,..., xn 给定的样本观察值
§7.1.4抽样误差
1.误差:调查结果与实际值之间的差异 抽样调查中的误差
登记性误差(非抽样误差) 误差代表性误差随系机统误误差差((抽非样抽误样差误)差)
2.抽样误差—由于抽样的随机性而产生的 样本指标对总体指标的代表性误差。抽样误 差可以计算并加以控制,但不可以避免。
概率论与数理统计-参数估计
第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2
令
A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,
即
B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
(07)第7章 参数估计
STATISTICS
第 7 章 参数估计
7.1 参数估计的一般问题 7.2 一个总体参数的区间估计 7.3 必要的样本容量的确定
7-1
统计学
STATISTICS
学习目标
1. 2. 3. 4.
估计量与估计值的概念 点估计与区间估计的区别 一个总体参数的区间估计方法 必要的样本容量的确定方法
7-2
统计学
STATISTICS
置信水平
1. 将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比重称为置信水平,也叫做置信度 2. 表示为 (1 -
为总体参数未在区间内的比重
相应的 为0.01,0.05,0.10
3. 常用的置信水平值有 99%, 95%, 90%
2. 则,将所有样本均值标准化为t统计量:
t x n ~ t (n 1)
3. 最终,总体均值 在1-置信水平下的置信 区间为: s
x t
2
s
7 - 24
n
统计学
STATISTICS
t 分布
t 分布是类似正态分布的一种对称分布,它通常要比 正态分布平坦和分散。一个特定的t分布依赖于称之 为自由度的参数。随着自由度的增大,分布也逐渐 趋于正态分布
2
n
或 p z
p(1 - p)
2
( 未知时)
n
统计学
STATISTICS
总体比重的区间估计
(例题分析)
解:已知 n=100,p=65% , 1- = 95%, z/2=1.96
p z p (1 p )
2
【例】某城市想 要估计下岗职工 中女性所占的比 重,随机地抽取 了 100 名 下 岗 职 工,其中65人为 女性职工。试以 95%的置信水平 估计该城市下岗 职工中女性比重 的置信区间
07心理统计学-第七章 参数估计
犯错误的概率,常用α(或p)表示。则1-α为置信 度。(显著性水平越高表示的是α值越小,即犯错误的可
能性越低) α为预先设定的临界点,常用的如.05、.01、.001;p 为检验计算所得的实际(犯错误)概率。
第一节 点估计、区间估计与标准误
三、区间估计与标准误
3、区间估计的原理与标准误
转换成比率为
p
n
p, SE p
n
pq n
同理可得公式7-17。自习[例7-12、例7-13]
1、从某地区抽样调查400人,得到每月人均文化消费为 160元。已知该地区文化消费的总体标准差为40元。试 问该地区的每月人均文化消费额。(α=.05,总体呈正态
分布)
2、上题中总体方差未知,已知Sn-1=44元。 3、已知某中学一次数学考试成绩的分布为正态分布,总 体标准差为5。从总体中随机抽取16名学生,计算得平 均数为81、标准差为Sn=6。试问该次考试中全体考生成 绩平均数的95%置信区间。 4、上题中总体方差未知,样本容量改为17人。 5、假定智商服从正态分布。随机抽取10名我班学生测 得智商分别为98、102、105、105、109、111、117、 123、124、126(可计算得M=112,Sn≈9.4),试以95% 的置信区间估计我班全体的智商平均数。 返回
值表,求tα /2(df)。
5、计算置信区间CI。
σ2已知,区间为M-Zα /2 SE <μ< M+Zα /2 SE;
σ2未知,区间为M-tα /2(df)SE <μ< M+tα /2(df)SE。
6、对置信区间进行解释。
二、σ2已知,对μ的区间估计(Z分布,例7-1 & 2) 三、σ2未知,对μ的区间估计(t分布,例7-3 & 4)
统计学原理:第7章 参数估计
一个总体参数的区间估计
总体参数 均值 比例 方差
7 - 26
符号表示 样本统计量
x
p
2
s2
7.2.1 总体均值的区间估计
1、正态总体、2已知,
非正态总体、大样本
2、正态总体、2未知,小样本
7 - 27
总体均值的区间估计
(1、Z分布)
1. 假定条件
总体服从正态分布,且方差(2) 已知
量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10g。试估计该批产品平均重量的 置信区间,置信水平为95%
这表明一个具体的点估计值无法给出估计的可 靠性的度量,一个点估计量的可靠性是由它的 抽样标准误差来衡量的。
7 -9
抽样分布回顾
Xi ~
, 2
..X
~
,
2
n
p Z Z Z 1
2
2
p Z 2
X
X
Z 2
1
p
Z 7 - 10
2
X
X
Z
2
X
1
抽样分布回顾
p
Z
2
X
X
7 - 12
实际情况是,样本均值已知,而总体均值未知 。
x
样本均值与总体均值的距离是对称的,
若某个样本均值落在总体均值的两个标准差范围以内, 则总体均值就会被包括在以样本均值为中心左右两个标 准差的范围之内。
7 - 13
区间估计
(interval estimate)
1. 总体参数估计的一个区间: 样本统计量 加减 估计误差
心理及教育统计学第7章参数估计
章节内容
第一节 点估计、区间估计及标准误 第二节 总体平均数的估计 第三节 标准差与方差的区间估计 第四节 相关系数的区间估计 第五节 比率及比率差异的区间估计
总体参数估计:在研究中从样本获得一组数 据后,通过这组信息,对总体特征进行估计, 即从局部结果推论总体的情况。
总体参数估计分点估计和区间估计两种。
7 8 2 . 2 6 2 2 . 6 7 7 8 2 . 2 6 2 2 . 6 7
71.9684.04
当n2=36时,df2=35,t0.05/2=2.042
7 9 2 . 0 4 2 1 . 5 2 7 9 2 . 0 4 2 1 . 5 2
75.982.1
【例7-4】
根据n2=36的样本估计总体参数μ:
0.95的置信区间 7 8 1 . 9 6 1 . 1 8 7 9 1 . 9 6 1 . 1 8
76.781.3
0.99的置信区间
7 9 2 . 5 8 1 . 1 8 7 9 2 . 5 8 1 . 1 8
75.782.04
83.686.4
总体方差σ2未知,对总体平均数的估计
总体方差未知,用样本的无偏方差(
s
2 n 1
)作为总体
方差的估计值,实现对总体平均数μ的估计。因为在总
体方差未知时,样本平均数的分布为t分布,故应查t值
表,确定t/2或t(1-)/2。
有两种情况:
(1)总体的分布为正态时,可不管n之大小。
(2)总体分布为非正态时,只有n>30,才能用概率对 其抽样分布进行解释,否则不能推论。
0.05水平和0.01水平是人们习惯上常用的两个显著性 水平。
区间估计的原理是抽样分布理论。在计算区间估计值, 解释估计的正确概率时,依据的是该样本统计量的分 布规律及抽样分布的标准误(SE)。
数理统计 第七章-参数估计
休息
结束
2. 最大似然法
是在总体类型已知条件下使用的一 种参数估计方法 。 它首先是由德国数学家高斯在1821 年提出的 ,费歇在1922年重新发现了这 一方法,并首先研究了这 种方法的一些 性质 。
休息 结束
最大似然法的基本思想:
已发生的事件具有最大概率。
休息
结束
先看一个简单例子: 在军训时,某位同学与一位教官同 时射击,而在靶纸上只留下一个弹孔。 如果要你推测,是谁打中的呢? 你会如何想呢?
max f ( xi , )
i 1
n
休息
结束
X 假设X 为连续型总体: f ( x; )
( X 1 , , X n ) 为子样
( x1 , , xn ) 为子样观察值。
已发生的事件为:
x x ,X {{X 11 1x, X 1 nx1 ,n } , xn x X n xn } x
休息
结束
ˆ
1 n ( X i X )2 n i 1
1 n ˆ X ( X i X )2 n i 1
休息
结束
矩法的优点是简单易行,并不需要 事先知道总体是什么分布 。 缺点是,当总体类型已知时,没有 充分利用分布提供的信息 . 一般场合下, 矩估计量不具有唯一性 。
( 1 )x , 0 x 1 f( x) 0, 其它
1
其中 1 是未知参数,
X1,X2,…,Xn是取自X的样本,求参数 的矩估计. 解:
1 E( X ) x( 1 )x dx
0
( 1 )
从 中解得
1
0
x
1
第七章 参数估计
x
1
2
|x|
e
dx
0
不含θ ,故不能由“样本一阶矩=总体一阶矩”解得所
求
矩估计,需要2继E续(X 求2二) 阶2矩1: x2e|x|dx
河南理工大学精品课程
概率论与数理统计
1 x2exd 0
x 20x2exdx
其中未知参数θ >0,求θ 的矩估计量.
〖解〗单参数,连续型.
因为总体一阶矩
1
1E(X) xf (x)dx x dx
0
x 1
| 1 1 0
1
由
河南理工大学精品课程
1 A1
概率论与数理统计
即 解得:
X 1
X( 1)
(1X)X
X
1 X 故所求矩估计量为:
ˆ
1
X X
2
■
河南理工大学精品课程
概率论与数理统计
【例5】已知总体X的概率密度为:
f(x)21 e|x|( x )
其中未知参数θ >0,求θ 的矩估计量.
〖解〗单参数,连续型.
因为总体一阶矩
1E(X)
河南理工大学精品课程
概率论与数理统计
ddL(x1,x2, ,xn;)0
或与之等价的
ddlnL(x1,x2, ,xn;)0
来得到待估参数θ 的极大似然估计值(驻点);
③ 、必要时,参照极大似然估计值写出极大似然 估计量.
河南理工大学精品课程
概率论与数理统计
【例6】求服从二项分布B(m,p)的总体X未知参数 p的极大似然估计量。
第7章参数估计
所以重量的标准差的95%的置信区间
√︁
√︁
为[
12*0.230256 23.337
,
12*0.230256 4.403
]
=
[0.3441,
0.7922]。
即,我们约有95%的把握估计该品牌袋装大米重量的标准
差������在0.3441千克到0.7922千克之间。
参数估计的基本原理 点估计 区间估计
=0.31 ± 1.645
2
������
100
=0.31 ± 0.07608
=(23.39%, 38.61%)
即,我们约有90%的把握估计全校学生戴眼镜比 例������在23.39%到38.61%之间。
R的计算结果: 90 percent confidence interval: 0.2340092, 0.3946717
假定A品牌袋装大米的重量服从正态分布,现随机抽取13袋大 米,测得其重量(单位:千克)分别为
⎛ 24, 24.2, 24.4, 24.6, 24.7, ⎞ ⎝ 24.8, 25, 25.1, 25.1, 25.2, ⎠
25.3, 25.4, 25.6.
分别计算该品牌袋装大米的重量的均值,及重量的标准差 的95%的置信区间。
参数估计的基本原理 点估计 区间估计
一个总体参数的区间估计 总体均值的区间估计 总体比例的区间估计 总体方差的区间估计
两个总体参数的区间估计 两个总体均值之差的区间估计 两个总体比例之差的区间估计 两个总体方差之比的区间估计
样本量������的确定 估计总体均值是样本量的确定 估计总体比例时是样本量的确定
2������
∑︁ ������������
������=1
第七章 参数估计
a
2
b
X
2 (a,b)
a2
ab b2 3
1 n
n i 1
X
2 i
解方程组得aˆ X
3 n
n i1
(Xi
X )2 ,bˆ
X
3 n
n i1
(Xi
X )2
练习1
设总体X
~
e(),
X
1
,
X
2
,...,
X
是来自该
n
总体的一组样本,求的矩估计。
2 总体X的概率密度为f (x, )
1
L L
0, 0,
2
L 0,
s
1
ln L ln L
0, 0,
2
lnL 0,
s
解方程组求解出ˆ1, ˆ2 , ,ˆs .
例1.设总体X ~ N(, 2 ), 但, 2均未知,设X1, X2 ,Xn 是来自该总体的一组样本, 求, 2的极大似然估计.
2
)2
2
(3)似然方程
ln L
1
2
n
(Xi
i 1
)
0
ln L
2
n 2
1
2
1
2 4
n
(Xi
i 1
)2
0
(4)解方程组得 X ,
第7章参数估计
评价估计量的标准
1. 无偏性
∧
E(θ) =θ
2. 有效性
对同一总体参数的两个无偏估计量,标准差 越小的估计量估计效果越好,称估计量越有效。
3. 一致性
随着样本量的增大,点估计量的值越来越接 近被估总体的参数。
7.2 一个总体参数的区间估计
7.2.1 总体均值的区间估计
总体均值的置信区间=样本均值±边际误差
第7章 参数估计
统计方法
描述统计
推断统计
参数估计
假设检验
7.1 参数估计
1. 用样本统计量去估计总体参数。
2. 估计量——用来估计总体参数的统计量 估计值——一个具体样本计算出的统计 量的数值
参数估计的方法
点估计
区间估计
二战中的点估计— 德军有多少辆坦克?
二战期间,盟军非常想知道德军总共制造了 多少辆坦。德国人在制造坦克时是墨守成规的, 他们把坦克从1开始进行了连续编号。在战争过 程中,盟军缴获了一些敌军坦克,并记录了它们 的生产编号。那么怎样利用这些号码来估计坦克 总数呢?在这个问题中,总体参数是未知的坦克 总数N,而缴获坦克的编号则是样本。
常用置信水平的临界值(Zα/2值)
置信水平
90% 95% 99%
α
0.10 0.05 0.01
α/2
0.05 0.025 0.005
Zα/2
1.645 1.96 2.58
X
- 2.58x
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
用样本方差s2代替总体方差σ2
样本均值经标准化处理后服从自由度为
第七章__参数估计
三、区间估计与标准误
㈠区间估计的定义 是根据样本统计量,利用抽样分布的原理,在一定的
可靠程度上,估计出总体参数所在的范围,即以数 轴上的一段距离表示未知参数可能落入的范围。 ㈡置信区间与显著性水平 ⑴置信区间:也称置信间距,指在一定可靠程度上,总体参
数所在的区域距离或区域长度。
⑵置信界限(临界值):置信区间的上下两端点值。 ⑶显著性水平:指估计总体参数落在某一区间时,可能犯错
⑶区间估计的原理是样本分布理论。在计算区间估计值解释估 计的正确概率时,依据的是该样本统计量的分布规律及样本 分布的标准误。样本分布可提供概率解释,而标准误的大小 决定区间估计的长度。一般情况下,加大样本容量可使标准 误变小。
当总体方差已知时,样本平均数的分布为正态分布或
渐近正态分布,此时,样本平均数的平均数uX u, 平均数的离散程度即平均数分布的标准差(简称
例4
解:由题意知,其总体方差未知,但其总体分布为正态分布,
则此样本均数的分布服从t分布, 可以依t分布对总平 均身高μ进行估计。
SEX
S 4.8 0.81; df n 1 36 1 35 n 1 35
查t值表可知 : t0.05 230 2.042;t0.01 230 2.75
例2 已知某区15 岁男生立定跳远的方差 为 436.8cm ,现从该区抽取58名15岁男生, 测得该组男生立定跳远的平均数为198.4cm, 试求该区15岁男生立定跳远平均成绩的95%和 99%的置信区间。
例2
解:由题意知:由于样本容量(n=58)大于30 ,
该样本的抽样分布为渐进正态分布。
SEX
因此, 的95%的置信区间为 :
82 2.0211.12 82 2.0211.12
概率论与数理统计第七章参数估计
例1. 设总体X的数学期望和方差分别是μ,
σ2 ,求μ , σ2的矩估计量。
E(X )
E( X 2 ) D( X ) [EX ]2 2 2
(3) 写出方程 ln L 0
i1
若方程有解,
求出L(θ)的最大值点 ˆ(x1,x2,..x.n,)
于 是 ˆ ˆ ( X 1 , X 2 , . . . , X n ) 即 为 的 极 大 似 然 估 计 量
例2. 设总体X服从参数λ>0的泊松分布,求 参数λ的极大似然估计量。
例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 ,…, Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.
ˆ(x1,x2,..x.n,),使得
L (ˆ) m a x L (), (或 L (ˆ) s u p L ())
则 称 ˆ ( x 1 ,x 2 , . . . ,x n ) 为 的 极 大 似 然 估 计 值
称 ˆ ( X 1 ,X 2 ,...,X n ) 为 极 大 似 然 估 计 量
第7章 参数估计
总体所服从的分布类型已知/未知
抽样
参数 估计
估计总体中未知的参数
参数估计 参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数. 估计新生儿的体重
估计废品率
估计湖中鱼数
§7.1
点估计
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 (可以是向量) .
概率论第7章
X1, ... ,Xn是来自总体X的独立同分布样本,分布
律或概率密度函数是f(x,q),其中q∈Q是参数,Q已知, 是q的取值范围.f (x,q)的形式已知,则有统计模型
f ( x1,θ) f ( xn ,θ) θ Q
例1 某种型号的产品N个,其合格率q未知,从中随机
抽取n个(n<<N),设Xi 是第i次抽到的样品,正品Xi=1, 否则 Xi =0,则 X1,X2,…,Xn 就是样本.总体分布为两点
分布B(0,1),参数空间为q=(0,1),则可得统计模型
n
n
xi
n xi
θ i1 (1 θ) i1
用矩估计法估计λ的值。
解 设X为灯管寿命,则
1 n
x n i1 xi 130.55
μ1
E
X
=
1 λ
μ1 m1
μ1
E
X
=
1 λ
X
λˆ 1 0.0077 X
例2 设总体X的均值μ和方差σ2 >0都存在,μ,σ2未知.
X1,…,Xn是来自 X 的样本,试求μ, σ2的矩估计量 .
矩估计量的观察值称为矩估计值 .
总体k阶中心矩 样本k阶中心矩
Vk
Bk
E[ X 1n
n i1
E( X )]k; ( Xi X )k .
例1. 设有一批灯管,其寿命服从参数为λ的指数分 布,今随机从中抽取11只,测得其寿命数据如下:
110, 184, 145, 122, 165, 143, 78, 129, 62, 130, 168
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
郑州轻工业学院数学与信息科学系第七章:参数估计概率统计教研组统计推断是根据样本所提供的信息对总体的特性作出种种推断,参数估计是统计推断的重要问题之一它是在总体的分布类型已知时,利用观测数据对总体中的未知参数进行估计.本章学习总体参数的两种估计方法,点估计和区间估计.●【装配线的平衡问题】使装配线达到平衡是一项重要的经营管理活动,主要目标是确保不同操作台的操作耗用近似相同的时间.如果装配线不平衡,操作员就会出现有时无事可做,有时忙不过来的现象.结果,产品堆积在费时的操作台上,影响整个装配线的效率.建立装配线,经常要使用各种管理科学工具,常常需要估计各个操作台的平均装配时间,以对装配线进行合理的调整.●【装配线的平衡问题】下面随机记录了某装配线两个操作台各30次的装配时间(单位:分钟),如何估计操作台的平均装配时间?它们的平均装配时间有无显著差异?X 2.27 1.87 1.93 2.25 1.21 1.66 1.64 1.73 2.41 1.95 2.12 1.82 2.09 1.05 2.04 2.27 2.32 2.57 1.95 2.07 1.36 2.18 1.86 2.61 1.24 2.05 1.76 2.11 2.04 1.74Y 2.96 2.6 3.23 3.86 3.82 3.89 3.54 3.21 2.76 3.44 2.96 3.34 2.67 4.12 4.38 2.75 2.45 3.28 3.7 3.47 3.31 3.39 3.35 3.26 3.6 3.54 2.75 3.91 3.19 3.1主要内容:§7.1参数的点估计§7.2参数的区间估计第七章:总结7.1.1点估计问题的一般提法【定义7.1】设总体X 的分布函数F (x ;θ1,θ2,…,θm )形式已知,但其中含有一个或多个未知参数:θ1,θ2,⋯,θm ,又设X 1,X 2,…,X n 为总体的一个样本,x 1,x 2,…,x n 是样本观测值,构造m 个统计量:用的观测值作为未知参数θi 的近似值的方法称为点估计法.称为未知参数θi 的估计量,称为未知参数θi 的估计值.,,...,2,1),,,,(ˆ21m i X X X ni = θ),,,(ˆ21n i X X X θ),,,(ˆ21ni x x x θ),,,(ˆ21ni X X X θ),,,(ˆ21ni x x x θ●7.1.1点估计问题的一般提法进行点估计关键是构造统计量,不同的统计量得到的估计值是不同的.下面介绍两种常用的点估计方法:矩估计法和最大似然估计法7.1.2矩估计【定义】用样本k阶矩来近似总体k阶矩,这种用样本矩去估计总体相应矩的方法,即是所谓的矩估计法.●7.1.2矩估计方法:设总体X 的分布有m 个参数θ1,θ2,…,θm ,且总体的k 阶矩μk =E (X k )存在(1)计算出前m 阶总体矩(2)用样本k 阶矩近似相应的总体k 阶矩的原则,即令(3)解上述关于参数θ1,θ2,⋯,θm 的方程组便得到参数的估计量称为参数θ1,θ2,⋯,θm 的矩估计量⎪⎩⎪⎨⎧==),,,(...........),,,(212111m m m mθθθμμθθθμμ ⎪⎩⎪⎨⎧==),,,(...........),,,(212111m m mm A A θθθμθθθμ ),,,,(ˆˆ21ni i X X X θθ=●7.1.2矩估计方法:设总体X 的分布有m 个参数θ1,θ2,…,θm ,且总体的k 阶矩μk =E (X k )存在(1)计算出前m 阶总体矩(2)用样本k 阶矩近似相应的总体k 阶矩的原则,即令(3)如果样本观测值为x 1,x 2,…,x n ,称的观测值为θ1,θ2,⋯,θm 的矩估计值⎪⎩⎪⎨⎧==),,,(...........),,,(212111m m m mθθθμμθθθμμ ),,,(ˆˆ21ni i X X X θθ=),...,,(ˆ21n i x x x θ⎪⎩⎪⎨⎧==),,,(...........),,,(212111m m mm A A θθθμθθθμ7.1.2矩估计【例7-1】设总体X 的均值μ和方差σ2都存在,但μ和σ2均未知,求μ和σ2的矩估计量.解:设X 1,X 2,…,X n 为总体X 的一个样本,总体X 的一阶、二阶矩分别为用样本矩A 1和A 2分别代替总体矩μ1和μ2,得解之1ˆA =μ;1μμ==EX 22EX =μ222)(μο+=+=EX DX ;1μ=A 222μο+=A ;11X X n n i i ==∑=7.1.2矩估计【例7-1】设总体X 的均值μ和方差σ2都存在,但μ和σ2均未知,求μ和σ2的矩估计量.解:设X 1,X 2,…,X n 为总体X 的一个样本,总体X 的一阶、二阶矩分别为用样本矩A 1和A 2分别代替总体矩μ1和μ2,得解之2122ˆA A -=σ;1μμ==EX 22EX =μ222)(μο+=+=EX DX ;1μ=A 222μο+=A 221)(1B X X n ni i =-=∑=2X -∑==n i i X n 121●7.1.2矩估计【评注】对任意总体X,其均值μ和方差σ2的矩估计都分别:常用分布中参数的矩估计:(1)X ~B (n ,p )(n 已知):(2)X ~P (λ):(3)X ~U (0,b ):(4)X ~Exp (θ):(5)X ~N (μ,σ2):μˆ;11X X n n i i ==∑=2ˆσ221)(1B X X n n i i =-=∑=,ˆX =μ22ˆB =σ.ˆX =θ.ˆX =λ.2ˆX b =n X p/ˆ=●7.1.2矩估计【例7-2】设一大批产品的合格率是p ,每次从中抽出10件进行检验,共抽15次,每次抽出的10件中合格品的个数记录如下,求合格率p 的矩估计值.887979789888798解:用X i 表示第i 次抽出的10件中合格品的个数,i =1,2,…,15,则可以认为X 1,X 2,…,X 15独立同分布,是来自二项分布总体X ~B(10,p )的样本.由于为E (X )=10p 的矩估计量,所以p 的矩估计值为:%801015120==X 1015...10/ˆ1521x x x x p +++==●7.1.2矩估计【例7-3】设总体X 的概率密度为其中θ(θ>–1)为待估参数,X 1,X 2,…,X n 为总体的一个样本,求θ的矩估计量.解:由于只有一个待估参数,只需写出总体的一阶矩用A 1代替μ1,得θ的矩估计量为⎩⎨⎧<<+=其他,010,)1();(x x x f θθθ)(1X E =μ121ˆ11--=A A θdx x x θθ⎰+=10)1(121--=X X 21++=θθ●7.1.3最大似然估计【最大似然思想】【例】有个两外形相同的箱子,各装100个球:第一箱99个白球1个红球第二箱1个白球99个红球现从两箱中任取一箱,并从箱中任取一球,结果所取得的球是白球,试估计所取到的球来自哪一箱?答案是第一箱.因为第一箱更有利于白球的出现.这种思考问题的方法,称为最大似然思想●7.1.3最大似然估计【最大似然估计法】若X,X2,…,X n为总体X的一个样本1,x2,…,x n出现时,若要估计总体X中的未当样本观测值x1知参数θ,自然要选取使x,x2,…,x n出现的“概率”达到最1大的作为θ的估计值了●7.1.3最大似然估计若X 是离散型总体,其分布律为P {X =x }=P (x ;θ),x 1,x 2,…,x n 出现的概率是(7.1) 于是,θ的估计值应为L (θ)最大值点,即其中Θ为θ的取值范围.称这样得到的为θ的最大似然估计值称为θ的最大似然估计量.);,...,,()(21θθn x x x L L =∏==n i i x p 1)(θ;)ˆ;,...,,()ˆ(21θθn x x x L L =∏=∈=n i i x p 1)(max θΘθ;θˆ);,...,,(max 21θθn x x x L Θ∈=),,,(ˆˆ21nx x x θθ=),,,(ˆˆ21n X X X θθ=●7.1.3最大似然估计若X 是连续型总体,其概率密度为f (x ;θ),由于(7.2) 刻画了X 1,X 2,…,X n 在x 1,x 2,…,x n 附近小邻域内出现概率,于是θ的估计值也应为L (θ)最大值点,即其中Θ为θ的取值范围.称此为θ的最大似然估计值,称为θ的最大似然估计量.称(7.1)和(7.2)式是基于x 1,x 2,…,x n 的似然函数.∏===n i i n x f x x x L L 121)();,...,,()(θθθ;);,...,,(max )ˆ;,...,,()ˆ(2121θθθΘθn n x x x L x x x L L ∈==∏=∈=n i i x f 1)(max θΘθ;),,,(ˆˆ21nx x x θθ=),,,(ˆˆ21n X X X θθ=●7.1.3最大似然估计求最大似然估计值就是求似然函数L (θ)的最大值点 【步骤】(1)求似然函数L (θ)=L (x 1,x 2,…,x n ;θ)或对数似然函数ln L (θ)=ln L (x 1,x 2,…,x n ;θ)(2)求似然函数L (θ)=L (x 1,x 2,…,x n ;θ)的最大值点或对数似然函数ln L (θ)=ln L (x 1,x 2,…,x n ;θ)的最大值点方法:在似然函数可微的情况下,解方程(7.3)或(7.4)0);,...,,()(21==θθθθd x x x dL d dL n 0);,...,,(ln )(ln 21==θθθθd x x x L d d L d n 似然方程对数似然方程●7.1.3最大似然估计上述方法同样适用于总体分布中含有多个为知参数θ1,θ2,…,θm 的情形.此时,只需要求出似然函数或者对数似然函数的最大值点就可以了.),...,,;,...,,(),...,,(212121m n m x x x L L θθθθθθ=),...,,;,...,,(ln ),...,,(ln 212121m n m x x x L L θθθθθθ=●7.1.3最大似然估计【例7-4】总体X 服从参数为λ的泊松分布,λ(λ>0)未知,求参数λ的最大似然估计量.解:设X 1,X 2,…,X n 是来自X 的样本,x 1,x 2,…,x n 是样本观测值.由于X 的分布律为故基于x 1,x 2,…,x n 的似然函数为对数似然函数为{} ,2,1,0!);(====-x e x x p x X P xλλλ);,,,()(21λλn x x x L L =)(ln λL ∏=-=ni i x ex i1!λλ∏=-∑==ni ix n x eni i1!1λλλln 1∑+=n i i x λn -=!ln i nx ∑-●7.1.3最大似然估计【例7-4】总体X 服从参数为λ的泊松分布,λ(λ>0)未知,求参数λ的最大似然估计量.解:对数似然函数为 对数似然方程为 解之得 由于 所以λ的最大似然估计值和最大似然估计量分别为为!ln ln )(ln 11i n i ni i x x n L ∑==-∑+-=λλλ01)(ln 1=∑+-==n i i x n L d d λλλx x n n i i =∑==11λ01)(ln 1222<∑-==n i i x L d d λλλ;1ˆx x n n i=∑=λX X n i =∑=1ˆλ●7.1.3最大似然估计【例7-5】设总体X 的概率密度为其中θ(θ>–1)为待估参数,求θ的最大似然估计量.解:设X 1,X 2,…,X n 为总体X 的一个样本,x 1,x 2,…,x n 是样本观测值.似然函数为当0<x 1,x 2,…,x n <1时,⎩⎨⎧<<+=其它,010,)1();(x x x f θθθ)(θL ∏==ni i x f 1);(θ)(ln θL ⎩⎨⎧<<+=其它,01,...,,0,)...()1(2121n n n x x x x x x θθ∑=++=n i ix θn 1ln 1)(ln θ●7.1.3最大似然估计【例7-5】设总体X 的概率密度为其中θ(θ>–1)为待估参数,求θ的最大似然估计量.解:当0<x 1,x 2,…,x n <1时, 令 解得 由于⎩⎨⎧<<+=其它,010,)1();(x x x f θθθ∑=++=ni ix θn L 1ln ln )(ln θθ1)(0ln 1)(ln 1=∑++==n i i x n L d d θθθ∑--==ni ix n 1ln 1θ0)1()(ln 222<+-=θθθn L d d●7.1.3最大似然估计【例7-5】设总体X 的概率密度为其中θ(θ>–1)为待估参数,求θ的最大似然估计量.解:当0<x 1,x 2,…,x n <1时, 令 解得 所以,θ的最大似然估计值为⎩⎨⎧<<+=其它,010,)1();(x x x f θθθ∑=++=ni ix θn L 1ln ln )(ln θθ1)(0ln 1)(ln 1=∑++==n i i x n L d d θθθ∑--==ni ix n 1ln 1θ--=nn1ˆθ●7.1.3最大似然估计【例7-5】设总体X 的概率密度为其中θ(θ>–1)为待估参数,求θ的最大似然估计量.解:当0<x 1,x 2,…,x n <1时, 令 解得 所以,θ的最大似然估计量为⎩⎨⎧<<+=其它,010,)1();(x x x f θθθ∑=++=ni ix θn L 1ln ln )(ln θθ1)(0ln 1)(ln 1=∑++==n i i x n L d d θθθ∑--==ni ix n 1ln 1θ--=nn1ˆθ●7.1.3最大似然估计【例7-6】设X 1,X 2,…,X n 是N (μ,σ2)的样本,求μ与σ2的的最大似然估计量.解:设x 1,x 2,…,x n 是总体X 的样本观测值.由于X 的概率密度为 故似然函数为⎭⎬⎫⎩⎨⎧--=2222)(exp 21),;(σμσπσμx x f ∏=⎭⎬⎫⎩⎨⎧--=ni i x L 12222)(exp 21),(σμσπσμ⎪⎪⎪⎬⎫⎪⎪⎪⎨⎧--=∑=21222)(exp )()2(122σμσπn i i x n n●7.1.3最大似然估计【例7-6】设X 1,X 2,…,X n 是N (μ,σ2)的样本,求μ与σ2的的最大似然估计量.解:故似然函数为对数似然函数),(2σμL 2122)(σμ∑=--ni ix⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧--=∑=21222)(exp )()2(122σμσπn i i x n n ),(ln 2σμL )2ln(2πn -=2ln 2σn -●7.1.3最大似然估计【例7-6】设X 1,X 2,…,X n 是N (μ,σ2)的样本,求μ与σ2的的最大似然估计量.解:对数似然函数对数似然方程组2122)(σμ∑=--ni ix),(ln 2σμL )2ln(2πn -=2ln 2σn -22),(ln σσμ∂∂L ∑==-=ni ix120)(1μσμσμ∂∂),(ln 2L ∑==-+-=ni ixn 12420)(212μσσ●7.1.3最大似然估计【例7-6】设X 1,X 2,…,X n 是N (μ,σ2)的样本,求μ与σ2的的最大似然估计量.解:解对数似然方程组,即得可以验证,当时lnL(μ,σ2)达到最大值.μ和σ2的最大似然估计量分别为,1ˆ1∑==ni i x n μ∑=-=n i i x x n 122)(1ˆσ,ˆμμ=22ˆσσ=,1ˆ1∑==n i i x n μ∑=-=ni i x x n 122)(1ˆσ●7.1.3最大似然估计【例7-6】设X 1,X 2,…,X n 是N (μ,σ2)的样本,求μ与σ2的的最大似然估计量.解:μ和σ2的最大似然估计量分别为所以,对于正态分布总体来说,μ和σ2的最大似然估计与矩估计是相同的.在求参数的最大似然估计时,有时不需要建立似然方程或对数似然方程,直接观察似然函数就很容易得到其最大值点,从而得到参数的最大似然估计。