第五章 参数估计《统计学》
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无偏性
有效性
一致性 对于无限总体, 对于无限总体, 如果对任意 0 ε> 满足条件
估计量 θˆ 当 θˆ 为 θ 的无 的数学期望 θ 偏估计时, 偏估计时,ˆ方 等于总体参 ˆ ˆ =θ 差 E(θ −θ)2 越小 数,即 Eθ 该估计量称 ,无偏估计越 为无偏估计。 有效。 为无偏估计。 有效。
估计值 误差范围
置信度
随机区间
(θˆ L , θˆU )
精确度
随机区间
(θˆL , θˆU )
或
总体参数
△:一定倍数的抽样误差 σ △ 例如: 例如: x = Zα
2
2
n Z 抽样误差 σ / n 一定时, α 越大, 一定时, 越大,
包含θ 的概率 的平均长度 (即可靠程度 E (θˆU , θˆL ) 越大越好。 )越大越好。 (误差范围 )越小越好
• 2.为提高银行的服务质量,管理部门需要考 为提高银行的服务质量, 为提高银行的服务质量 查在柜台上办理每笔业务所需要的服务时 假设每笔业务所需时间服从正态分布, 间。假设每笔业务所需时间服从正态分布, 现从中抽取16笔业务组成一个简单随机样 现从中抽取 笔业务组成一个简单随机样 其平均服务时间为13分钟 分钟, 本,其平均服务时间为 分钟,样本标准 差为5.6分钟 分钟, 差为 分钟,试建立每笔业务平均服务时 间的95%的置信区间。 的置信区间。 间的 的置信区间
ˆ LimP(|θn −θ |≥ ε ) = 0
n→∞
则称 θˆ 是 θ 的一致估计。 的一致估计。
• 点估计中,关键是求估计量,估计量确定 点估计中,关键是求估计量, 将样本值代入, 后,将样本值代入,即可得到总体参数的 估计值。求估计量的方法很多, 估计值。求估计量的方法很多,其中最常 用的方法是矩法估计。 用的方法是矩法估计。 • 矩法估计包括两方面内容,一是用样本矩 矩法估计包括两方面内容 包括两方面内容, 作为总体同一矩的估计量; 作为总体同一矩的估计量; • 二是用样本矩的函数作为总体相应矩同一 函数的估计量。 函数的估计量。
概率(可靠性) △ 随之增大, 概率(可靠性)大; x 随之增大, 精确度就差。 精确度就差。
置信度的含义: 置信度的含义:
• 所构造的随机区间能盖住位置参数θ的概率为1-α,由于 所构造的随机区间能盖住位置参数θ的概率为1 这个随机区间会随样本观察值的不同而不同, 这个随机区间会随样本观察值的不同而不同,它有时盖住 了参数θ 有时没盖住θ 用这种方法作区间估计时, 了参数θ,有时没盖住θ,用这种方法作区间估计时, 100次中大约有100*( 次中大约有100* 个区间能盖住未知参数θ 100次中大约有100*(1-α)个区间能盖住未知参数θ, 个左右区间不能盖住θ 100* α 个左右区间不能盖住θ。
P (θˆ L < θ < θ U ) = 1 − α
或者, 或者,有:
ˆ P (θ L < θ < θ U ) = 1 − α
则称区间 (θˆ ,θ ) 和 侧置信区间。 侧置信区间。
L U
ˆ (θ L , θ U )
为总体指标θ 为总体指标θ的单
例
• 某商店供应居民一万户,春节前夕,为了 某商店供应居民一万户,春节前夕, 调查居民对某种商品的需要量, 调查居民对某种商品的需要量,用不重复 抽样法抽查了100户,得出每户平均需要量 抽样法抽查了 户 为10斤,样本均方差为 斤。问该种商品最 斤 样本均方差为3斤 少应准备多少,斤能以99%的把握满足需 少应准备多少,斤能以 的把握满足需 要?
样本均值分布
总体分布
大样本( 大样本( n≥30 )
小样本正态总体
(总体为正态或非正态分布) 总体为正态或非正态分布)
x ~ N ( µ,
σ2
n
σ已知:
)
x ~ N (µ,
σ2
n
)
σ未知 : x−µ
s n
~ t ( n − 1)
总体均值的区间估计: 总体均值的区间估计:
样本容量
总体分布
σ已知
x ± Zα 2 x ± Zα 2
(二)区间估计
• 它是根据样本估计量以一定可靠程度推断 总体参数所在的区间范围。 总体参数所在的区间范围。
(二)区间估计
估计未知参数所在的可能的区间。 估计未知参数所在的可能的区间。 ˆ ˆ P(θL<θ<θU ) =1−α 评价准则 一般形式
ˆ ) θ (ˆ ) (θ −△< <θ +△ θ = θˆ ±△
• 3.为了解居民用于服装消费的支出情况,随 为了解居民用于服装消费的支出情况, 为了解居民用于服装消费的支出情况 机抽取90户居民组成一个简单随机样本 户居民组成一个简单随机样本, 机抽取 户居民组成一个简单随机样本, 计算得样本均值为810元,样本标准差为 计算得样本均值为 元 样本标准差为85 元,试建立该地区每户居民平均用于服装 消费支出的95%的置信区间。 的置信区间。 消费支出的 的置信区间
2
= 3 − 2.26 ×
= 1.75
置信上限为: 置信上限为: s 2 x + tα (n − 1) n −1 = 3 + 2.26 × = 4.43 10 n 2 95%的概率保证下 的概率保证下, 这表明在 95%的概率保证下,可认为组装车间人均日次品量在 1.75 之间。 至 4.43 之间 。
课堂练习 • 1.假设参加某种寿险投保人的年龄服从正态分 假设参加某种寿险投保人的年龄服从正态分 标准差为7.77岁。从中抽取 人组成一个 布,标准差为 岁 从中抽取36人组成一个 简单随机样本,其平均年龄为39.5岁,试建立 简单随机样本,其平均年龄为 岁 的置信区间。 投保人平均年龄 的90 %的置信区间。 的置信区间 µ
• 某玩具生产企业为了了解产品生产的最后 一道工序对产品质量的影响, 一道工序对产品质量的影响,从玩具组装 车间中随机抽取了10名工人 名工人, 车间中随机抽取了 名工人,观察得某日 的次品量为: , , , , , , , , 的次品量为:1,6,3,0,2,4,1,5, 3,5,假定次品量的概率分布为正态分布, , ,假定次品量的概率分布为正态分布, 给定置信概率95%, %,求组装车间人均日次 给定置信概率 %,求组装车间人均日次 品量的置信区间。 品量的置信区间。
1 n ˆ µ = x = ∑ xi • n i =1
1 n ˆ σ 2 = s 2 = ∑ ( xi − x )2 n i =1
矩法估计不仅局限于对总体矩进行估计, 矩法估计不仅局限于对总体矩进行估计,当总体分布类型已知但含有未知参 数时,也可以用矩估计法获得该参数的点估计。 数时,也可以用矩估计法获得该参数的点估计。 1 服从均匀分布, 【 例5-3】假设所考察的随机变量 x 服从均匀分布, f ( x) = - 】 , a ≤ x ≤ b, b−a 的矩法估计量。 试求 a 和 b 的矩法估计量。 均匀分布的数学期望即一阶原点矩为 E ( x) =
ˆ a = x − 3s ˆ b = x + 3s
矩估计法的优缺点: 矩估计法的优缺点:
• 优点:矩法估计比较简便,而且进行矩法 优点:矩法估计比较简便, 估计时无需知道总体分布。 估计时无需知道总体分布。 • 矩法估计局限性:它要求总体的矩必须存 矩法估计局限性: 否则无法估计; 在,否则无法估计;它不考虑总体分布类 型,因此也就没有充分利用总体分布函数 提供的信息。 提供的信息。
(b − a) 由此可得方程组: Var ( x) = , 由此可得方程组: 12
2
a+b , 方差即二阶中心矩为 2
a + b = 2 ⋅ µ 2 b − a = 12σ
得
a = µ − 3σ 2 b = µ + 3σ 2
ˆ ˆ 的矩法估计量为: 由 µ = x , σ 2 = s 2 ,可得 a 和 b 的矩法估计量为:
σ未知
x ± Zα 2 s n
s n
σ
n
n≥30
正态或非正态
σ
n
n<30
正态分布
x ± tα 2 (n −1)
【例5-5】 - 】
• 为了解某县农户的年收入状况,从该县所 为了解某县农户的年收入状况, 有农户中随机抽取了200户进行调查,得样 户进行调查, 有农户中随机抽取了 户进行调查 本每户农民的年平均收入为3600元,标准 本每户农民的年平均收入为 元 差为192元,试在 %的概率保证下,求该 差为 元 试在95%的概率保证下, 县农户平均年收入的置信区间。 县农户平均年收入的置信区间。 • 由于 由于n=200表明该样本为大样本,所以样本 表明该样本为大样本, 表明该样本为大样本 均值的概率分布可看作正态分布,显然, 均值的概率分布可看作正态分布,显然, 此例属于大样本情形下总体均值的区间估 计。
【例5-2】 - 】 • 设一总体的均值和方差均未知,从中抽取 设一总体的均值和方差均未知, 一个容量为n的简单随机样本 的简单随机样本, 一个容量为 的简单随机样本,求和的矩法 估计量。 估计量。 • 由于一阶原点矩是均值,二阶中心矩是方 由于一阶原点矩是均值, 由矩法估计可知, 差,由矩法估计可知,样本观测值的一阶 原点矩即样本均值可作为总体均值的估计 量;样本观测值的二阶中心矩即样本方差 可作为总体方差的估计量。 可作为总体方差的估计量。即:
解: = 10000, n = 100, 大样本, x = 10, s = 3 N
1 − α = 99%, x ~ N ( µ ,
由题意可知,需要求
σ2
n
)
x的单侧置信区间
பைடு நூலகம்
Z α = Z 0.01 = 2.33 s2 n 32 100 σx = ) = 0.2985(斤) ∗ (1 − ) = × (1 − n N 100 10000 ∆ x = Z α σ x = 2.33 × 0.2985 = 0.6955 斤) (
的条件下, 置信概率 1-α=0.95 的条件下, 查标准正态分布概率表 可得上侧分位数 Z
α/2
=1.96, =1.96,由于 x =3600 元, s =192 元, 1.96
故大样本情形下总体均值的置信区间的置信下限为: 故大样本情形下总体均值的置信区间的置信下限为:
x − Zα
2
s n
= 3600 − 1.96 ×
t 在 置信 概率 1 - α = 0.95 的条件 下 , 查 t 分 布表 可得自 由度为 下,
(9)=2.26, n-1=9 的 t 分布上侧分位数 t α/2(n-1)= t 0.025(9)=2.26,故组装车间人均 日次品量置信下限为: 日次品量置信下限为:
sn −1 n 2 10
x − tα (n − 1)
由于 n=10,表明该样本为小样本,且总体方差 σ n=10,表明该样本为小样本, 分布进行估计。根据所给的样本数据可得: 用 t 分布进行估计。根据所给的样本数据可得 :
x= ∑ x 1+ 6 +L+ 5 = =3 n 10
2
未知,所以需使 未知,
sn −1 =
∑( x − x ) 2 (1 − 3) 2 + (6 − 3) 2 + L + (5 − 3) 2 = =2 n −1 9
192 200
= 3573.39(元)
置信上限为: 置信上限为:
x + Zα
2
s n
= 3600 + 1.96 ×
192 200
= 3626.61(元)
95%的概率保证下, 这表明在 95%的概率保证下,可认为该县农户的平均年 元之间。 收入在 3573.39 元至 3626.61 元之间。
【例5-6】 - 】
单侧置信区间
• 所谓 单侧置信区间, 即根据给定的置信概 所谓单侧置信区间 , 单侧置信区间 率求出一个置信限, 率求出一个置信限 , 另一个置信限为总体 参数的上届或者下届。 参数的上届或者下届 。 记待估计总体指标 为θ,其取值上界为θU ,取值下界为θL , ˆ 对于给定的置信概率1 样本估计量为 , 对于给定的置信概率 1θ 若有: α,若有:
第五章 参数估计
• 第一节 参数估计概述 • 统计推断是根据样本的信息,对总体的特 统计推断是根据样本的信息, 征作出推断,它包括参数估计与假设检验 参数估计与假设检验, 征作出推断,它包括参数估计与假设检验, 本章先介绍参数估计。 本章先介绍参数估计。
一、参数估计中的基本概念
二、参数估计
点估计 以样本指标直接估计总体参数。 ˆ 以样本指标直接估计总体参数。 θ ⇒ θ 评价准则