06-抽样分布与参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 从所有县中,分别随机抽选10、30、100、200个
县,计算其人口数的平均数。
▪ 将同一实验反复进行200次,观察平均数的分布
规律。
o 说明:为简化实验起见,在此进行的是无放回实验, 结果与有放回的情况略有差异。
统计学原理
统计学原理
样本均值的抽样分布特征
▪ N>30时,样本均值服从正态分布。 ▪ 样本均值以总体均值为期望值 ▪ 样本均值的标准差为总体标准差除以样
差作为总体标准差的替代。
s
(xi x)2
n 1
统计学原理
例题:估计总体平均数
▪ 一次调查中获得了36个样本的数据如下 ▪ 23 35 39 27 36 44 36 42 46 43 31 33 ▪ 42 53 45 54 47 24 34 28 39 36 44 40 ▪ 39 49 38 34 48 50 34 39 45 48 45 32 ▪ 试在95%的置信度水平下,估计总体平均数的置信区间。
▪ 也可称为置信度或置信系数(Confidence
Coefficient)。
统计学原理
置信度与置信区间的关系
▪ 以正态分布为例,当置信度为P时,置信
区间为[μ-tσ,μ+tσ]
▪ 其中,μ为期望值,σ为标准差。 ▪ T称为概率度,以下为对应关系
概率度(t) 概率值(p) 概率度(t) 概率值(p)
统计学原理
估计中的要点
▪ 参数估计是从统计量的抽样分布入手,
2 x
2
n
N N
n 1
2 x
2
n
N n N
2
n
(1
f
)
2 x
2
n
(1
f
)
(若n
N)
2 x
2
n
由上述的推导可见,在总体单位数特别大的情况下, 有放回与无放回抽样的效果是相同的。
统计学原理
例题:关于扑克牌的游戏
▪ 从一副扑克牌(52张)中,有放回地抽
出30张,其平均点数的分布规律如何?
▪ 如果以点数来赌胜负,什么区间的胜率
统计学原理
对计算结果的说明
▪ 严格地说,在这个例子中,不应当根据正态分布进行估
计,而应当使用T分布进行估计。
▪ 如果使用T分布,自由度为35,95%置信度的概率度(t)是
2.03,而非1.96。计算出来的置信区间比正态分布的情 况要略大一些。
▪ 置信区间略大的原因,在于使用S替代总体标准差时,本
身也包含了一定的误差。
方式也存在相关。一般讨论统计量的抽样分布 时,总是基于有放回的简单随机抽样。
o 有放回简单随机抽样:从总体中抽出一个单位后, 将其放回总体,再抽选下一个单位。
o 有放回简单随机抽样的各个样本单位之间是相互独 立的。
统计学原理
抽样分布的实验
▪ 使用1999年中国2159个县级行政区人口数资料进
行实验。
▪ 点估计是用样本统计量的某个取值直接作为总
体参数的估计值。
▪ 区间估计(Interval Estimate)是在点估计的
基础上给出总体参数估计的一个区间范围。
▪ 总体参数的估计区间,称为置信区间。
统计学原理
置信度
▪ 如果将构造置信区间的步骤重复多次,置信区
间中包含总体真值的次数所占的比例称为置信 水平(Confidence Level)。
统计学原理
计算结果
▪ 计算样本平均数:X=39.5 ▪ 计算样本标准差:s=7.7736 ▪ 令:总体标准差=样本标准差,计算抽样误差为
1.2956
▪ 95%置信度对应的T值为1.96 ▪ 得总体平均数的置信区间为:
o 上限:39.5+1.96×1.2956=42.04 o 下限:39.5-1.96×1.2956=36.96
▪ 实践中,社会调查的样本量一般都比较大,正态分布与T
分布的差异不明显,因此可以用正态分布进行近似分析。
▪ 例如,当样本量为200时,T分布的95%概率度为1.9719,
与正态分布的1.96已经没有太大区别了。
统计学原理
第三节 常见的参数估计题型
本章为选修内容,涉及到数 理统计中较多知识,需要通 过习题来加以掌握。
本量的平方根。
E(x) X
, x
n
统计学原理
样本均值分布与中心极值定理
▪ 正态总体中,样本均值的分布仍为正态分布。 ▪ 非正态总体,根据中心极值定理
统计学原理
样本均值抽样特征的推导
统计学原理
统计学原理
统计学原理
无放回条件下的简单随机抽样
统计学原理
无放回条件下抽样公式的简化
f=n/N,称为抽样比
统计学原理
第六章 抽样分布与参数估计
抽样分布、参数估计和 假设检验是推断统计的 三个中心内容
统计学原理
第一节 抽样分布
统计学原理
基本概念
▪ 统计量:由样本构造出来,不依赖于任
何总体参数的函数。
▪ 参数:描述总体分布状况的数。
统计学原理
抽样分布
▪ 抽样分布:统计量的分布形式 ▪ 统计量的分布依赖于总体的分布,同时与抽样
是95%?
统计学原理
统计学原理
第二节 参数估计
主要讨论总体平均数的 参数估计
统计学原理
参数估计的一般问题
▪ 参数估计:用样本统计量去估计总体的参
数。
▪ 估计量与估计值
o 用于估计总体参数的样本统计量的名称叫估 计量;
o 根据一个具体样本计算出来的估计量的数值 叫估计值。
统计学原理
点估计与区间估计
统计学原理
统计学原理
从前例逆推
▪ 已知某总体方差为100,其一个由36个
单位组成的样本的平均数为50,试在95 %的置信度水平下,估计总体平均数的 置信区间。
统计学原理
统计学原理
统计学原理
总体标准差的替代
▪ 对总体均值进行估计时,需要使用到总体
标准差的Leabharlann Baidu值。
▪ 当总体标准差未知时,可以使用样本标准
统计学原理
有放回条件下的简单随机抽样
▪ 依据:样本平均数的分布特征
o 1.样本量n>30时,样本平均数服从正态分布
o 2.样本平均数以总体平均数为期望值
o 3.样本平均数的方差为
2x 2
n
统计学原理
导入:估计样本平均数的范围
▪ 某总体方差为100,平均值为40,抽出一
个36个单位构成的样本,试在95%的置信 度水平下,估计样本平均数的范围。
1.28
80%
1
68.27%
1.64
90%
2
95.45%
1.96
95%
3
99.73%
2.58
99%
统计学原理
评价估计量的标准
▪ 无偏性(Unbiasedness)
o 估计量的期望值等于总体参数值。
▪ 有效性(Efficiency)
o 估计量的标准差最小。
▪ 一致性(Consistency)
o 大样本获得的估计量比小样本更接近总体参 数值。
县,计算其人口数的平均数。
▪ 将同一实验反复进行200次,观察平均数的分布
规律。
o 说明:为简化实验起见,在此进行的是无放回实验, 结果与有放回的情况略有差异。
统计学原理
统计学原理
样本均值的抽样分布特征
▪ N>30时,样本均值服从正态分布。 ▪ 样本均值以总体均值为期望值 ▪ 样本均值的标准差为总体标准差除以样
差作为总体标准差的替代。
s
(xi x)2
n 1
统计学原理
例题:估计总体平均数
▪ 一次调查中获得了36个样本的数据如下 ▪ 23 35 39 27 36 44 36 42 46 43 31 33 ▪ 42 53 45 54 47 24 34 28 39 36 44 40 ▪ 39 49 38 34 48 50 34 39 45 48 45 32 ▪ 试在95%的置信度水平下,估计总体平均数的置信区间。
▪ 也可称为置信度或置信系数(Confidence
Coefficient)。
统计学原理
置信度与置信区间的关系
▪ 以正态分布为例,当置信度为P时,置信
区间为[μ-tσ,μ+tσ]
▪ 其中,μ为期望值,σ为标准差。 ▪ T称为概率度,以下为对应关系
概率度(t) 概率值(p) 概率度(t) 概率值(p)
统计学原理
估计中的要点
▪ 参数估计是从统计量的抽样分布入手,
2 x
2
n
N N
n 1
2 x
2
n
N n N
2
n
(1
f
)
2 x
2
n
(1
f
)
(若n
N)
2 x
2
n
由上述的推导可见,在总体单位数特别大的情况下, 有放回与无放回抽样的效果是相同的。
统计学原理
例题:关于扑克牌的游戏
▪ 从一副扑克牌(52张)中,有放回地抽
出30张,其平均点数的分布规律如何?
▪ 如果以点数来赌胜负,什么区间的胜率
统计学原理
对计算结果的说明
▪ 严格地说,在这个例子中,不应当根据正态分布进行估
计,而应当使用T分布进行估计。
▪ 如果使用T分布,自由度为35,95%置信度的概率度(t)是
2.03,而非1.96。计算出来的置信区间比正态分布的情 况要略大一些。
▪ 置信区间略大的原因,在于使用S替代总体标准差时,本
身也包含了一定的误差。
方式也存在相关。一般讨论统计量的抽样分布 时,总是基于有放回的简单随机抽样。
o 有放回简单随机抽样:从总体中抽出一个单位后, 将其放回总体,再抽选下一个单位。
o 有放回简单随机抽样的各个样本单位之间是相互独 立的。
统计学原理
抽样分布的实验
▪ 使用1999年中国2159个县级行政区人口数资料进
行实验。
▪ 点估计是用样本统计量的某个取值直接作为总
体参数的估计值。
▪ 区间估计(Interval Estimate)是在点估计的
基础上给出总体参数估计的一个区间范围。
▪ 总体参数的估计区间,称为置信区间。
统计学原理
置信度
▪ 如果将构造置信区间的步骤重复多次,置信区
间中包含总体真值的次数所占的比例称为置信 水平(Confidence Level)。
统计学原理
计算结果
▪ 计算样本平均数:X=39.5 ▪ 计算样本标准差:s=7.7736 ▪ 令:总体标准差=样本标准差,计算抽样误差为
1.2956
▪ 95%置信度对应的T值为1.96 ▪ 得总体平均数的置信区间为:
o 上限:39.5+1.96×1.2956=42.04 o 下限:39.5-1.96×1.2956=36.96
▪ 实践中,社会调查的样本量一般都比较大,正态分布与T
分布的差异不明显,因此可以用正态分布进行近似分析。
▪ 例如,当样本量为200时,T分布的95%概率度为1.9719,
与正态分布的1.96已经没有太大区别了。
统计学原理
第三节 常见的参数估计题型
本章为选修内容,涉及到数 理统计中较多知识,需要通 过习题来加以掌握。
本量的平方根。
E(x) X
, x
n
统计学原理
样本均值分布与中心极值定理
▪ 正态总体中,样本均值的分布仍为正态分布。 ▪ 非正态总体,根据中心极值定理
统计学原理
样本均值抽样特征的推导
统计学原理
统计学原理
统计学原理
无放回条件下的简单随机抽样
统计学原理
无放回条件下抽样公式的简化
f=n/N,称为抽样比
统计学原理
第六章 抽样分布与参数估计
抽样分布、参数估计和 假设检验是推断统计的 三个中心内容
统计学原理
第一节 抽样分布
统计学原理
基本概念
▪ 统计量:由样本构造出来,不依赖于任
何总体参数的函数。
▪ 参数:描述总体分布状况的数。
统计学原理
抽样分布
▪ 抽样分布:统计量的分布形式 ▪ 统计量的分布依赖于总体的分布,同时与抽样
是95%?
统计学原理
统计学原理
第二节 参数估计
主要讨论总体平均数的 参数估计
统计学原理
参数估计的一般问题
▪ 参数估计:用样本统计量去估计总体的参
数。
▪ 估计量与估计值
o 用于估计总体参数的样本统计量的名称叫估 计量;
o 根据一个具体样本计算出来的估计量的数值 叫估计值。
统计学原理
点估计与区间估计
统计学原理
统计学原理
从前例逆推
▪ 已知某总体方差为100,其一个由36个
单位组成的样本的平均数为50,试在95 %的置信度水平下,估计总体平均数的 置信区间。
统计学原理
统计学原理
统计学原理
总体标准差的替代
▪ 对总体均值进行估计时,需要使用到总体
标准差的Leabharlann Baidu值。
▪ 当总体标准差未知时,可以使用样本标准
统计学原理
有放回条件下的简单随机抽样
▪ 依据:样本平均数的分布特征
o 1.样本量n>30时,样本平均数服从正态分布
o 2.样本平均数以总体平均数为期望值
o 3.样本平均数的方差为
2x 2
n
统计学原理
导入:估计样本平均数的范围
▪ 某总体方差为100,平均值为40,抽出一
个36个单位构成的样本,试在95%的置信 度水平下,估计样本平均数的范围。
1.28
80%
1
68.27%
1.64
90%
2
95.45%
1.96
95%
3
99.73%
2.58
99%
统计学原理
评价估计量的标准
▪ 无偏性(Unbiasedness)
o 估计量的期望值等于总体参数值。
▪ 有效性(Efficiency)
o 估计量的标准差最小。
▪ 一致性(Consistency)
o 大样本获得的估计量比小样本更接近总体参 数值。