第四章 参数估计2014
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
湖北大学商学院 chen qianli
大学生每周上网花多少时间?
回答类别
3小时以下 3~6小时 6~9小时 9~12小时 12小时以上
人数(人)
32 35 33 29 71
频率(%)
16 17.5 16.5 14.5 35.5
合计
200
100
•平均上网时间为8.58小时,标准差为0.69小时。全校学生每
统计推断的语言是用长期会发生的事实来表达对任 何一个样本结果的可信程度。 Stata命令:ttest HMO == 400
湖北大学商学院 chen qianli
区间估计实例:HMO
我们通过一个过程达到这些数值,此过程能 在95%的时间里给出准确结果。 置信区间:一个参数的1-α水平的置信区间有 两部分: 从数据计算的区间,一般形式为: 边际误差 估计值 置信水平1-α,给出在重复样本中此区间包 含真实参数的概率。
1. 将构造置信区间的步骤重复很多次,置信
区间包含总体参数真值的次数所占的比例 称为置信水平 2. 表示为 (1 - – 为是总体参数未在区间内的比例
(confidence level)
3. 常用的置信水平值有 99%, 95%, 90%
– 相应的 为0.01,0.05,0.10
湖北大学商学院 chen qianli
湖北大学商学院 chen qianli
(point estimate)
2. 无法给出估计值接近总体参数程度的信息
– –
区间估计
(interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间
范围,该区间由样本统计量加减估计误差而得到 2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
/2
湖北大学商学院 chen qianli
区间估计注意事项:
数据必须是总体的一个SRS。 对于比SRS复杂的概率抽样设计方案以上公式是
不正确的。可以获得其他概率抽样的相关公式。 对于带有未知大小偏误的随意收集的数据,没有 正确的推断方法。好的公式不能挽救坏的数据。 因为样本均值是不耐抗的,异常值会对置信区间 产生很大影响。应该搜索异常值并试图修正或说 明去除的理由,然后再计算置信区间。如果异常 值不能去除,需要采用对异常值不敏感的方法。
– 如样本均值,样本比例、样本方差等 – 例如: 样本均值就是总体均值 的一个估计量
2. 参数用 表示,估计量用 ˆ 表示 3. 估计值:估计参数时计算出来的统计量的
具体值
– 如果样本均值 x =80,则80就是的估计值
湖北大学商学院 chen qianli
参数估计的方法
估 计 方 法
点
(正态总体、2已知,或非正态总体、大 样本)
湖北大学商学院 chen qianli
总体均值的区间估计
(大样本)
1. 假定条件
– – 总体服从正态分布,且方差(2) 已知 如果不是正态分布,可由正态分布来近似 (n 30)
2. 使用正态分布统计量 z
z x
3. 总体均值 在1- 置信水平下的置信区间为 s x z 2 或 x z 2 ( 未知) n n
湖北大学商学院 chen qianli
区间估计的图示
x z 2 x
- 2.58x -1.65 x
x
+1.65x +2.58x
x
-1.96 x
+1.96x
90%的样本 95% 的样本 99% 的样本
湖北大学商学院 chen qianli
置信水平
湖北大学商学院 chen qianli
区间估计注意事项:
上例中,我们说有95%的相信程度总体均值 在394.48到415.56之间,这是指区间的计 算是通过一种方法完成,此方法可以在所 有可能样本的95%给出正确结果。不能说 有95%的可能真实均值μ落在394.48到 415.56之间。一旦我们抽取一个特定样本 并从中获得一个特定区间后随机性不存在 了,真实的总体均值μ要么在394.48到 415.56之间,要么不在。概率作为长期相 对频数的解释在此情形下没有意义。
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,中国人民大学公
共管理学院的 4 名本科生对全校部分本科生做了问 卷调查。调查的对象为中国人民大学在校本科生, 调查内容包括上网时间、途径、支出、目的、关心 的校园网内容,以及学生对收费的态度,包括收费 方式、价格等 问卷调查由调查员直接到宿舍发放并当场回收。对 四个年级中每年级各发60份问卷,其中男、女生各 30份。共收回有效问卷共 200份。其中有关上网时 间方面的数据经整理如下表所示
第 4 章 参数估计
7.1 7.2 7.3 7.4 参数估计的一般问题 一个总体参数的区间估计 两个总体参数的区间估计 样本容量的确定
湖北大学商学院 chen qianli
不像其他科学,统计从来不打算使 自己完美无缺,统计意味着你永远 不需要确定无疑。
Gudmund R.Iversen
湖北大学商学院 chen qianli
湖北大学商学院 chen qianli
评价估计量的标准
湖北大学商学院 chen qianli
无偏性(unbiasedness)
• 无偏性:估计量抽样分布的数学期望等于
被估计的总体参数
ˆ) P(
无偏 有偏
A
B
湖北大学商学院 chen qianli
ˆ
有效性(efficiency)
有效性:对同一总体参数的两个无偏点估计
样本统计量
如:样本均值 、比例、方差
湖北大学商学院 chen qianli
4.1 参数估计的一般问题
估计量与估计值 点估计与区间估计 评价估计量的标准
湖北大学商学院 chen qianli
估计量与估计值
(estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量
– – 我们只能是希望这个区间是大量包含总体参数真值的 区间中的一个,但它也可能是少数几个不包含参数真 值的区间中的一个 总体参数以一定的概率落在这一区间的表述是错误的
湖北大学商学院 chen qianli
3.
置信区间
(95%的置信区间)
点估计值
重复构造出的20个置信区间
湖北大学商学院 chen qianli
ˆ
4.2 一个总体参数的区间估计
4.2.1 总体均值的区间估计 4.2.2 总体比例的区间估计 4.2.3 总体方差的区间估计
湖北大学商学院 chen qianli
一个总体参数的区间估计
总体参数 符号表示
样本统计量
x p
s
2
均值
比例
2
湖北大学商学院 chen qianli
方差
总体均值的区间估计
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称为 2.
置信区间 统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区 间,我们无法知道这个样本所产生的区间是否包 含总体参数的真值
湖北大学商学院 chen qianli
区间估计注意事项:
关于置信区间的最重要的警示是,置信区间的边际 误差只包括随机抽样误差。抽样调查中实际的困 难如代表不足和不回应,会产生其他误差。这些 误差可能大于随机抽样误差,特别是在大的样本 容量下。调查的实际实施会在很多方面影响结果 的可靠性,但这些方面没有包括在报告的边际误 差里。 使用概率方法容易指出某个推断方法完全正确的条 件,但这些条件在实际中不可能完全满足。决定 什么时候某个统计方法在实际中应该使用经常需 要在数据的探索性分析下的判断。
湖北大学商学院 chen qianli
区间估计注意事项:
如果样本容量小且总体不是正态分布,真
实的置信水平会不同于1-α。仔细检查数据 的偏斜程度和其他非正态的迹象。置信区 间只依赖样本均值的分布,即使在很小样 本容量下样本均值比单个值更接近正态分 布,当n>=15,置信区间不会受到非正态 总体很大的影响,除非有极端数值或存在 强烈的偏斜。 必须知道总体标准差σ,这对应用产生限制, 稍后会讨论σ未知的情形。当样本容量很大 时,用样本标准差s代替总体标准差是合适 的。
量,有更小标准差的估计量更有效
ˆ) P(
ˆ1 的抽样分布
B A
ˆ2 的抽样分布
ˆ
湖北大学商学院 chen qianli
一致性(consistency)
• 一致性:随着样本容量的增大,估计量
的值越来越接近被估计的总体参数
ˆ) P(
较大的样本容量
B A
较小的样本容量
湖北大学商学院 chen qianli
湖北大学商学院 chen qianli
置信区间如何变化
估计总体均值的边际误差
z / 2
n
可说明置信区间的重要性质: 高置信水平1-α会增加 z ,从而增加边际误差。
我们当然希望高置信水平和小边际误差,但改进 一个会恶化另一个。有三种方式减小边际误差: 1.使用较低的置信水平;2.减少σ 3.增加样本容量n
湖北大学商学院 chen qianli
n
~ N (0,1)
总体均值的区间估计
(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对产量质 量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了 25 袋,测得每袋重量(单位:g)如下表所示。已知产品重量的 分布服从正态分布,且总体标准差为 10g 。试估计该批产品 平均重量的置信区间,置信水平为95%
– 比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计)
置信下限
湖北大学商学院 chen qianli
置信上限
区间估计实例:HMO
湖北大学商学院 chen qianli
区间估计实例:HMO
样本均值 x 是未知总体均值 的自然的估 计量,因为它的无偏性。 x 405.02 作为总体均值的估计有多可靠?显然再进行 一次抽样,肯定不会给出405.02的值。 要了解此种估计方法的可靠性,需要知道样 本均值的分布,即抽样分布。由中心极限 定理(CLT)知,样本均值近似服从正态分 2 布 N ,
置信区间与置信水平
均值的抽样分布
/2
x
1 –
/2
x
(1 - ) 区间包含了
x
Fra Baidu bibliotek
的区间未包含
湖北大学商学院 chen qianli
影响区间宽度的因素
1. 总体数据的离散程度,用 来测度
2. 3. 置信水平 (1 - ),影响 z 的大小
样本容量, x n
估
计
区间估计
矩估计法 顺序统计量法 最大似然法 最小二乘法
湖北大学商学院 chen qianli
点估计
1. 用样本的估计量的某个取值直接作为总体参
数的估计值
例如:用样本均值直接作为总体均值的估计;用 两个样本均值之差直接作为总体均值之差的估计 虽然在重复抽样条件下,点估计的均值可望等于 总体真值,但由于样本是随机的,抽出一个具体 的样本得到的估计值很可能不同于总体真值 一个点估计量的可靠性是由它的抽样标准误差来 衡量的,这表明一个具体的点估计值无法给出估 计的可靠性的度量
湖北大学商学院 chen qianli
总体均值的置信区间 从未知均值 和已知标准差 的总体中获取
/2
容量为n的SRS, 的置信水平为1-α的置信 区间为: xz
n
其中 z / 2 为标准正态分布曲线右侧的概率为 / 2 的临界值。 z /2 称为边际误差。 n 此区间在正态总体时是准确的,在其他总体 分布但n很大时是近似正确的。
湖北大学商学院 chen qianli
周的平均上网时间是多少?每周上网时间在12小时以上的学生 比例是多少?你做出估计的理论依据是什么?
参数估计在统计方法中的地位
推 •参 统 假 断 数 设 计 统 估 检 方 计 计 验
描 述 统 计
法
湖北大学商学院 chen qianli
统计推断的过程
总体
样 本
n
湖北大学商学院 chen qianli
区间估计实例:HMO
假设总体标准差 等于样本标准差s=112.08,在 大样本(n=453)下此近似是合理的。根据样本 均值的抽样分布可得:
变换后可得:
x Pr 1.96 95% / n
112.08 112.08 Pr x 1.96 x 1.96 Pr 394.48 415.56 95% 453 453
大学生每周上网花多少时间?
回答类别
3小时以下 3~6小时 6~9小时 9~12小时 12小时以上
人数(人)
32 35 33 29 71
频率(%)
16 17.5 16.5 14.5 35.5
合计
200
100
•平均上网时间为8.58小时,标准差为0.69小时。全校学生每
统计推断的语言是用长期会发生的事实来表达对任 何一个样本结果的可信程度。 Stata命令:ttest HMO == 400
湖北大学商学院 chen qianli
区间估计实例:HMO
我们通过一个过程达到这些数值,此过程能 在95%的时间里给出准确结果。 置信区间:一个参数的1-α水平的置信区间有 两部分: 从数据计算的区间,一般形式为: 边际误差 估计值 置信水平1-α,给出在重复样本中此区间包 含真实参数的概率。
1. 将构造置信区间的步骤重复很多次,置信
区间包含总体参数真值的次数所占的比例 称为置信水平 2. 表示为 (1 - – 为是总体参数未在区间内的比例
(confidence level)
3. 常用的置信水平值有 99%, 95%, 90%
– 相应的 为0.01,0.05,0.10
湖北大学商学院 chen qianli
湖北大学商学院 chen qianli
(point estimate)
2. 无法给出估计值接近总体参数程度的信息
– –
区间估计
(interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间
范围,该区间由样本统计量加减估计误差而得到 2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
/2
湖北大学商学院 chen qianli
区间估计注意事项:
数据必须是总体的一个SRS。 对于比SRS复杂的概率抽样设计方案以上公式是
不正确的。可以获得其他概率抽样的相关公式。 对于带有未知大小偏误的随意收集的数据,没有 正确的推断方法。好的公式不能挽救坏的数据。 因为样本均值是不耐抗的,异常值会对置信区间 产生很大影响。应该搜索异常值并试图修正或说 明去除的理由,然后再计算置信区间。如果异常 值不能去除,需要采用对异常值不敏感的方法。
– 如样本均值,样本比例、样本方差等 – 例如: 样本均值就是总体均值 的一个估计量
2. 参数用 表示,估计量用 ˆ 表示 3. 估计值:估计参数时计算出来的统计量的
具体值
– 如果样本均值 x =80,则80就是的估计值
湖北大学商学院 chen qianli
参数估计的方法
估 计 方 法
点
(正态总体、2已知,或非正态总体、大 样本)
湖北大学商学院 chen qianli
总体均值的区间估计
(大样本)
1. 假定条件
– – 总体服从正态分布,且方差(2) 已知 如果不是正态分布,可由正态分布来近似 (n 30)
2. 使用正态分布统计量 z
z x
3. 总体均值 在1- 置信水平下的置信区间为 s x z 2 或 x z 2 ( 未知) n n
湖北大学商学院 chen qianli
区间估计的图示
x z 2 x
- 2.58x -1.65 x
x
+1.65x +2.58x
x
-1.96 x
+1.96x
90%的样本 95% 的样本 99% 的样本
湖北大学商学院 chen qianli
置信水平
湖北大学商学院 chen qianli
区间估计注意事项:
上例中,我们说有95%的相信程度总体均值 在394.48到415.56之间,这是指区间的计 算是通过一种方法完成,此方法可以在所 有可能样本的95%给出正确结果。不能说 有95%的可能真实均值μ落在394.48到 415.56之间。一旦我们抽取一个特定样本 并从中获得一个特定区间后随机性不存在 了,真实的总体均值μ要么在394.48到 415.56之间,要么不在。概率作为长期相 对频数的解释在此情形下没有意义。
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,中国人民大学公
共管理学院的 4 名本科生对全校部分本科生做了问 卷调查。调查的对象为中国人民大学在校本科生, 调查内容包括上网时间、途径、支出、目的、关心 的校园网内容,以及学生对收费的态度,包括收费 方式、价格等 问卷调查由调查员直接到宿舍发放并当场回收。对 四个年级中每年级各发60份问卷,其中男、女生各 30份。共收回有效问卷共 200份。其中有关上网时 间方面的数据经整理如下表所示
第 4 章 参数估计
7.1 7.2 7.3 7.4 参数估计的一般问题 一个总体参数的区间估计 两个总体参数的区间估计 样本容量的确定
湖北大学商学院 chen qianli
不像其他科学,统计从来不打算使 自己完美无缺,统计意味着你永远 不需要确定无疑。
Gudmund R.Iversen
湖北大学商学院 chen qianli
湖北大学商学院 chen qianli
评价估计量的标准
湖北大学商学院 chen qianli
无偏性(unbiasedness)
• 无偏性:估计量抽样分布的数学期望等于
被估计的总体参数
ˆ) P(
无偏 有偏
A
B
湖北大学商学院 chen qianli
ˆ
有效性(efficiency)
有效性:对同一总体参数的两个无偏点估计
样本统计量
如:样本均值 、比例、方差
湖北大学商学院 chen qianli
4.1 参数估计的一般问题
估计量与估计值 点估计与区间估计 评价估计量的标准
湖北大学商学院 chen qianli
估计量与估计值
(estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量
– – 我们只能是希望这个区间是大量包含总体参数真值的 区间中的一个,但它也可能是少数几个不包含参数真 值的区间中的一个 总体参数以一定的概率落在这一区间的表述是错误的
湖北大学商学院 chen qianli
3.
置信区间
(95%的置信区间)
点估计值
重复构造出的20个置信区间
湖北大学商学院 chen qianli
ˆ
4.2 一个总体参数的区间估计
4.2.1 总体均值的区间估计 4.2.2 总体比例的区间估计 4.2.3 总体方差的区间估计
湖北大学商学院 chen qianli
一个总体参数的区间估计
总体参数 符号表示
样本统计量
x p
s
2
均值
比例
2
湖北大学商学院 chen qianli
方差
总体均值的区间估计
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称为 2.
置信区间 统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区 间,我们无法知道这个样本所产生的区间是否包 含总体参数的真值
湖北大学商学院 chen qianli
区间估计注意事项:
关于置信区间的最重要的警示是,置信区间的边际 误差只包括随机抽样误差。抽样调查中实际的困 难如代表不足和不回应,会产生其他误差。这些 误差可能大于随机抽样误差,特别是在大的样本 容量下。调查的实际实施会在很多方面影响结果 的可靠性,但这些方面没有包括在报告的边际误 差里。 使用概率方法容易指出某个推断方法完全正确的条 件,但这些条件在实际中不可能完全满足。决定 什么时候某个统计方法在实际中应该使用经常需 要在数据的探索性分析下的判断。
湖北大学商学院 chen qianli
区间估计注意事项:
如果样本容量小且总体不是正态分布,真
实的置信水平会不同于1-α。仔细检查数据 的偏斜程度和其他非正态的迹象。置信区 间只依赖样本均值的分布,即使在很小样 本容量下样本均值比单个值更接近正态分 布,当n>=15,置信区间不会受到非正态 总体很大的影响,除非有极端数值或存在 强烈的偏斜。 必须知道总体标准差σ,这对应用产生限制, 稍后会讨论σ未知的情形。当样本容量很大 时,用样本标准差s代替总体标准差是合适 的。
量,有更小标准差的估计量更有效
ˆ) P(
ˆ1 的抽样分布
B A
ˆ2 的抽样分布
ˆ
湖北大学商学院 chen qianli
一致性(consistency)
• 一致性:随着样本容量的增大,估计量
的值越来越接近被估计的总体参数
ˆ) P(
较大的样本容量
B A
较小的样本容量
湖北大学商学院 chen qianli
湖北大学商学院 chen qianli
置信区间如何变化
估计总体均值的边际误差
z / 2
n
可说明置信区间的重要性质: 高置信水平1-α会增加 z ,从而增加边际误差。
我们当然希望高置信水平和小边际误差,但改进 一个会恶化另一个。有三种方式减小边际误差: 1.使用较低的置信水平;2.减少σ 3.增加样本容量n
湖北大学商学院 chen qianli
n
~ N (0,1)
总体均值的区间估计
(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对产量质 量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了 25 袋,测得每袋重量(单位:g)如下表所示。已知产品重量的 分布服从正态分布,且总体标准差为 10g 。试估计该批产品 平均重量的置信区间,置信水平为95%
– 比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计)
置信下限
湖北大学商学院 chen qianli
置信上限
区间估计实例:HMO
湖北大学商学院 chen qianli
区间估计实例:HMO
样本均值 x 是未知总体均值 的自然的估 计量,因为它的无偏性。 x 405.02 作为总体均值的估计有多可靠?显然再进行 一次抽样,肯定不会给出405.02的值。 要了解此种估计方法的可靠性,需要知道样 本均值的分布,即抽样分布。由中心极限 定理(CLT)知,样本均值近似服从正态分 2 布 N ,
置信区间与置信水平
均值的抽样分布
/2
x
1 –
/2
x
(1 - ) 区间包含了
x
Fra Baidu bibliotek
的区间未包含
湖北大学商学院 chen qianli
影响区间宽度的因素
1. 总体数据的离散程度,用 来测度
2. 3. 置信水平 (1 - ),影响 z 的大小
样本容量, x n
估
计
区间估计
矩估计法 顺序统计量法 最大似然法 最小二乘法
湖北大学商学院 chen qianli
点估计
1. 用样本的估计量的某个取值直接作为总体参
数的估计值
例如:用样本均值直接作为总体均值的估计;用 两个样本均值之差直接作为总体均值之差的估计 虽然在重复抽样条件下,点估计的均值可望等于 总体真值,但由于样本是随机的,抽出一个具体 的样本得到的估计值很可能不同于总体真值 一个点估计量的可靠性是由它的抽样标准误差来 衡量的,这表明一个具体的点估计值无法给出估 计的可靠性的度量
湖北大学商学院 chen qianli
总体均值的置信区间 从未知均值 和已知标准差 的总体中获取
/2
容量为n的SRS, 的置信水平为1-α的置信 区间为: xz
n
其中 z / 2 为标准正态分布曲线右侧的概率为 / 2 的临界值。 z /2 称为边际误差。 n 此区间在正态总体时是准确的,在其他总体 分布但n很大时是近似正确的。
湖北大学商学院 chen qianli
周的平均上网时间是多少?每周上网时间在12小时以上的学生 比例是多少?你做出估计的理论依据是什么?
参数估计在统计方法中的地位
推 •参 统 假 断 数 设 计 统 估 检 方 计 计 验
描 述 统 计
法
湖北大学商学院 chen qianli
统计推断的过程
总体
样 本
n
湖北大学商学院 chen qianli
区间估计实例:HMO
假设总体标准差 等于样本标准差s=112.08,在 大样本(n=453)下此近似是合理的。根据样本 均值的抽样分布可得:
变换后可得:
x Pr 1.96 95% / n
112.08 112.08 Pr x 1.96 x 1.96 Pr 394.48 415.56 95% 453 453