第七章--统计学-参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 参数估计
学习目标
▪ 1.掌握点估计与区间估计 ▪ 2.了解样本容量的确定方法
本章教学重点与难点
重点
1. 区间估计的基本思想和原理
难点
利用Excel进行分布概率计算、
区间估计和分析。
参数估计
7. 1 参数估计的一般问题 7. 2 一个总体参数的区间估计 7. 3 样本量的确定
参数估计的一般问题
z } 1
2
P{X z
2
n
X z
2
}1 n
▪ 即在给定显著性水平下,总体均值在的置信水平下的置信区间为:
(X z
2
n
,
X
z
2
) n
7.Leabharlann Baidu2 一个总体参数的区间估计
总体均值的区间估计 总体比例的区间估计 总体方差的区间估计
一个总体参数的区间估计
总体参数 均值 比例 方差
符号表示 样本统计量
1-a
0.6827 0.9500 0.9545 0.9973
第六章
抽样极限误差
99.73% 95.45% 68.27%
3 2
x
x
x
X
2 3
x
x
x
x
x ~ N ( X , 2 n)
总体均值的区间估计(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对食品
质量进行监测,企业质检部门经常要进行抽检,以分析每袋 重量是否符合要求。现从某天生产的一批食品中随机抽取了 25袋,测得每袋重量如下表所示。已知产品重量的分布服从 正态分布,且总体标准差为10g。试估计该批产品平均重量 的置信区间,置信水平为95%
• 比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计)
置信下限
置信上限
区间估计的图示
x z 2 x
x
- 2.58x
x
-1.65 x
+1.65x +2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
置信区间(confidence interval)
3. 4.
参估数计用值:表(e示st,im估at计ed量v用alueˆ)估表计示参数时计算出
来的统计量的具体值
• 如果样本均值 x =80,则80就是 的估计
值
参数估计的分类
▪ 点估计
▪ 区间估计
点估计 (point estimate)
1. 用样本的估计量直接作为总体参数的估计 值 ▪ 例如:用样本均值直接作为总体均值的 估计 ▪ 例如:用两个样本均值之差直接作为总 体均值之差的估计
量要优于另一个?
无偏性(unbiasedness)
▪ 无偏性:估计量抽样分布的数学期望等于 被估计的总体参数
P(ˆ)
无偏
有偏
A
B
ˆ
有效性(efficiency)
有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
ˆ
一致性(consistency)
▪ 一致性:随着样本容量的增大,估计量 的值越来越接近被估计的总体参数
P(ˆ) 较大的样本容量
B
较小的样本容量
A
ˆ
区间估计 (interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减估计误差而得到
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
112.5 102.6 100.0 116.6 136.8
25袋食品的重量
101.0 103.0 102.0
107.5
95.0 108.8
123.5 102.0 101.6
95.4
97.8 108.6
102.8 101.5
98.4
100.5 115.6 102.2 105.0
93.3
总体均值的区间估计(例题分析)
s ( 未知)
n
区间估计的图示
均值的抽样分布
x
/2
1–
/2
x x
(1 - ) 区间包含了 的区间未包含
第六章
常用的置信度与正态分布分位数
正态分布分位数 z 2 与相应的置信度(1-a)存在 一一对应关系,常 z 2用值及相应的概率保证程
度为:
Za/2值 1.00 1.96 2.00 3.00
▪
正态总体 X ~ N(, 2) 和 2 已知时,总体均值μ的区间估计
▪ 当 X ~ N(, 2) ,由第一节已知,子样均值 X ~ N(, 2 ),则统计量
Z X ~ N (0,1)
n
/ n
▪ 对于给定的显著性水平α ,令
P{z Z z } 1
2
2
▪ 即有 ▪ 从而有
P{z
2
X / n
2. 表示为 (1 - 为显著性水平,是总体参数未在区间内
的比例
3. 常用的置信水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
置信区间与置信水平
均值的抽样分布
x
/2
1–
/2
x x
(1 - ) % 区间包含了 % 的区间未包含
区间估计的基本原理
▪ 单个总体均值的区间估计证明
1. 由样本统计量所构造的总体参数的估计 区间称为置信区间
[ˆL ,ˆU ]
2. 统计学家在某种程度上确信这个区间会 包含真正的总体参数,所以给它取名为 置信区间
置信水平(confidence level)
1. 将构造置信区间的步骤重复很多次,置信 区间包含总体参数真值的次数所占的比例 称为置信水平
2. 没有给出估计值接近总体参数程度的信息
3. 点估计的方法有矩估计法、顺序统计量法、 最大似然法、最小二乘法等
点估计量的优良标准
问题:
x
不是第那一一,个我统m们计e为量什来么估以计这某一个个总而体
参数?
mo
估计值第的二优,良如标果准:有两个以上的统计
无量估偏可计性以结、果用有来是效估否性一计、一某致致个?性是总体否参一个数统,其计
x
p
2
s2
总体均值的区间估计
(2 已知或2未知大样本)
1. 假定条件
• 总体服从正态分布,且方差(2) 已知
• 如果不是正态分布,可由正态分布来近似
(n ≥ 30)
2. 使用正态分布统计量 z z x ~ N (0,1) n
3. 总体均值 在1- 置信水平下的置信区间为
x z 2 n
或 x z 2
估计量与估计值 点估计与区间估计 评价估计量的标准
参数估计 (Parameter estimation)
1. 参数估计:就是用样本统计量去估计总体的参数
2. 估计量 (estimator)用于估计总体参数的随机 变量
• 如样本均值,样本比例, 样本方差等
• 例如: 样本均值就是总体均值的一个估计量
学习目标
▪ 1.掌握点估计与区间估计 ▪ 2.了解样本容量的确定方法
本章教学重点与难点
重点
1. 区间估计的基本思想和原理
难点
利用Excel进行分布概率计算、
区间估计和分析。
参数估计
7. 1 参数估计的一般问题 7. 2 一个总体参数的区间估计 7. 3 样本量的确定
参数估计的一般问题
z } 1
2
P{X z
2
n
X z
2
}1 n
▪ 即在给定显著性水平下,总体均值在的置信水平下的置信区间为:
(X z
2
n
,
X
z
2
) n
7.Leabharlann Baidu2 一个总体参数的区间估计
总体均值的区间估计 总体比例的区间估计 总体方差的区间估计
一个总体参数的区间估计
总体参数 均值 比例 方差
符号表示 样本统计量
1-a
0.6827 0.9500 0.9545 0.9973
第六章
抽样极限误差
99.73% 95.45% 68.27%
3 2
x
x
x
X
2 3
x
x
x
x
x ~ N ( X , 2 n)
总体均值的区间估计(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对食品
质量进行监测,企业质检部门经常要进行抽检,以分析每袋 重量是否符合要求。现从某天生产的一批食品中随机抽取了 25袋,测得每袋重量如下表所示。已知产品重量的分布服从 正态分布,且总体标准差为10g。试估计该批产品平均重量 的置信区间,置信水平为95%
• 比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计)
置信下限
置信上限
区间估计的图示
x z 2 x
x
- 2.58x
x
-1.65 x
+1.65x +2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
置信区间(confidence interval)
3. 4.
参估数计用值:表(e示st,im估at计ed量v用alueˆ)估表计示参数时计算出
来的统计量的具体值
• 如果样本均值 x =80,则80就是 的估计
值
参数估计的分类
▪ 点估计
▪ 区间估计
点估计 (point estimate)
1. 用样本的估计量直接作为总体参数的估计 值 ▪ 例如:用样本均值直接作为总体均值的 估计 ▪ 例如:用两个样本均值之差直接作为总 体均值之差的估计
量要优于另一个?
无偏性(unbiasedness)
▪ 无偏性:估计量抽样分布的数学期望等于 被估计的总体参数
P(ˆ)
无偏
有偏
A
B
ˆ
有效性(efficiency)
有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
ˆ
一致性(consistency)
▪ 一致性:随着样本容量的增大,估计量 的值越来越接近被估计的总体参数
P(ˆ) 较大的样本容量
B
较小的样本容量
A
ˆ
区间估计 (interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减估计误差而得到
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
112.5 102.6 100.0 116.6 136.8
25袋食品的重量
101.0 103.0 102.0
107.5
95.0 108.8
123.5 102.0 101.6
95.4
97.8 108.6
102.8 101.5
98.4
100.5 115.6 102.2 105.0
93.3
总体均值的区间估计(例题分析)
s ( 未知)
n
区间估计的图示
均值的抽样分布
x
/2
1–
/2
x x
(1 - ) 区间包含了 的区间未包含
第六章
常用的置信度与正态分布分位数
正态分布分位数 z 2 与相应的置信度(1-a)存在 一一对应关系,常 z 2用值及相应的概率保证程
度为:
Za/2值 1.00 1.96 2.00 3.00
▪
正态总体 X ~ N(, 2) 和 2 已知时,总体均值μ的区间估计
▪ 当 X ~ N(, 2) ,由第一节已知,子样均值 X ~ N(, 2 ),则统计量
Z X ~ N (0,1)
n
/ n
▪ 对于给定的显著性水平α ,令
P{z Z z } 1
2
2
▪ 即有 ▪ 从而有
P{z
2
X / n
2. 表示为 (1 - 为显著性水平,是总体参数未在区间内
的比例
3. 常用的置信水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
置信区间与置信水平
均值的抽样分布
x
/2
1–
/2
x x
(1 - ) % 区间包含了 % 的区间未包含
区间估计的基本原理
▪ 单个总体均值的区间估计证明
1. 由样本统计量所构造的总体参数的估计 区间称为置信区间
[ˆL ,ˆU ]
2. 统计学家在某种程度上确信这个区间会 包含真正的总体参数,所以给它取名为 置信区间
置信水平(confidence level)
1. 将构造置信区间的步骤重复很多次,置信 区间包含总体参数真值的次数所占的比例 称为置信水平
2. 没有给出估计值接近总体参数程度的信息
3. 点估计的方法有矩估计法、顺序统计量法、 最大似然法、最小二乘法等
点估计量的优良标准
问题:
x
不是第那一一,个我统m们计e为量什来么估以计这某一个个总而体
参数?
mo
估计值第的二优,良如标果准:有两个以上的统计
无量估偏可计性以结、果用有来是效估否性一计、一某致致个?性是总体否参一个数统,其计
x
p
2
s2
总体均值的区间估计
(2 已知或2未知大样本)
1. 假定条件
• 总体服从正态分布,且方差(2) 已知
• 如果不是正态分布,可由正态分布来近似
(n ≥ 30)
2. 使用正态分布统计量 z z x ~ N (0,1) n
3. 总体均值 在1- 置信水平下的置信区间为
x z 2 n
或 x z 2
估计量与估计值 点估计与区间估计 评价估计量的标准
参数估计 (Parameter estimation)
1. 参数估计:就是用样本统计量去估计总体的参数
2. 估计量 (estimator)用于估计总体参数的随机 变量
• 如样本均值,样本比例, 样本方差等
• 例如: 样本均值就是总体均值的一个估计量