统计学基础第八章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)抽样推断的特点: 1.样本资料对总体的数量特征作出具有一定可靠性。 2.按照随机性原则从全部总体中抽取样本单位。 3.抽样推断必然会产生抽样误差。
二、参数估计的一般问题 (一)参数估计(parameter estimation)就是用样本统 计量去估计总体的参数。
1. 估计量:用于估计总体参数的随机变量 • 如样本均值、样本比率、样本方差等 • 样本均值就是总体均值的一个估计量
点估计值
图8-3 重复构造出置信水平95%,的20个置信区间
三、评估估计量的标准
无偏性:估计量抽样分布的数学期望等于被估计的总体 参数。
P(ˆ)
无偏
有偏
A
B
ˆ
图8-4 有偏和无偏估计量的例子
一致性:随着样本容量的增大,估计量的值越来越接 近被估计的总体参数。
P(ˆ) 较大的样本容量 B
较小的样本容量
表8-3 25袋食品的重量
单位:g
112.5 102.6 100.0 116.6 136.8
101.0 107.5 123.5
95.4 102.8
103.0 95.0
102.0 97.8
101.5
102.0 108.8 101.6 108.6
98.4
100.5 115.6 102.2 105.0
93.3
A
ˆ
图8-5 两个不同容量样本统计量的抽样分布
有效性:对同一总体参数的两个无偏点估计量,有更小 标准差的估计量更有效。
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
ˆ
图8-6 两个无偏点估计量的抽样分布
第二节 单总体参数的区间估计
一、总体均值的区间估计
(一)大样本的估计方法 1.样本均值经过标准化以后的随机变量则服从正态分布,
第八章
参数估计
本章内容
第一节 参数估计的一般问题 第二节 单总体参数的区间估计 第三节 样本容量的确定
第一节 参数估计的一般问题
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
参数估计 假设检验
一、抽样推断 (一)抽样推断的概念:按照随机性原则,从研究对象中 抽取一部分进行观察,并根据所得到的观察数据,对研究 对象的数量特征做出具有一定可靠程度的估计和推断,以 达到认识总体的一种统计方法。
即Z
x μ σ
~
N(0,1)
n
2.总体均值所在(1-α)置信水平下的置信区间为:
σ x Zα 2 n
x Zα 2
σ n
称为置信下限, x Z α 2
Baidu Nhomakorabea
σ n
称为置信上限。
例1:一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企 业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产 的一批食品中随机抽取了25 袋,测得每袋重量如表8-3所示。已知产品重量 的分布服从正态分布,且总体标准差为10 g。试估计该批产品平均重量的置 信区间,置信水平为95%。
解:已知总体服从正态分布,且标准差为σ=10,n=25,
置信水平为 1-α=95%,查标准正态分布表得:
Z 2 =1.96 根据样本计算均值,得x =105.36 g
于是有: x Zα 2
σ 105.36 1.96 n
10 25
105.36 3.92
101.44,109.28
即该批食品平均重量95%的置信区间为101.44~109.28 g。
数的点估计。常用的方法有两种:矩估计法和极大似然估 计法。 2.区间估计
在点估计的基础上,给出总体参数估计的一个范围。 图8-1给出了区间估计的示意图:
图8-1 区间估计的图示
3. 在区间估计中,由样本统计量所构造的总体参数 的估计区间,称为置信区间,其中区间的最小值称为置信 下限,最大值称为置信上限。
2. 参数用表示,估计量用ˆ 表示 3. 估计值:估计参数时计算出来的统计量的具体值
• 如果样本均值 x =5600,则5600就是总体均值 的估计值
表8-2 样本统计量和总体参数符号对应关系
总体参数 均值 比例 方差
符号表示 μ π σ2
样本统计量
x
p S2
(二)点估计与区间估计
1.点估计 根据样本统计量直接估计出总体参数θ的值,称为参
利用Excel来计算置信区间
• 1.将样本数据输入Excel工作表中A1︰E5
• 2.计算样本均值。点击粘贴函数“fx”,选择“统计”下的“AVERAGE”函 数。在出现的“函数参数”对话框中,“Number1”一栏填入样本数据所在 区域A1︰E5,然后“确定”,在输出区域内(本例放置在F1)得结果105.3x6, 此即样本均值。
• 5.置信下限为105.36-3.78=101.58,置信上限为105.36+3.78= 109.14,即置信区间为(101.58,109.14)g。
(二)小样本的估计方法 总体方差σ2未知,而且是在小样本的情况下,则需要用
样本方差S2代替σ2,这时样本均值经过标准化以后的随机变 量则服从自由度为(n-1)的t分布,即:
t x μ ~ t(n1) S n
t 分布是类似正态分布的一种对称分布,它通常要比正 态分布平坦和分散。一个特定的分布依赖于称之为自由度的 参数。随着自由度的增大,分布也逐渐趋于正态分布,如图 8-7和图8-8所示:
图8-7 t分布与标准正态分布的比较 图8-8 不同自由度的t分布
• 总体均值 在1-置信水平下的置信区间为:
• 3.计算样本标准差,选择的函数为“统计”下的“STDEV”函数。本例 放在G1,得结果9.6545。
• 4.计算允许误差。选择“统计”下的“CONFIDENCE”函数,在出现的 “函数参数”对话框中,“Alpha”一栏填入显著性水平“0.05”, “Standard_dev”一栏填入总体标准差“G1”(大样本情况下,可用样 本标准差代替),“Size”一栏填入样本容量“25”,然后“确定”,在 输出区域内得允许误差“3.784490”(取近似值3.78)。
4.置信水平:如果将构造置信区间的步骤重复多次, 置信区间包含总体参数真值的次数所占的比率。
5.比较常用的置信水平及正态分布曲线下的右侧面积 为时的值(即临界值Zα/2)。
表8-3 常用置信水平的值
置信水平 90 95 99
α 0.1 0.05 0.01
α/2 0.05 0.025 0.005
Zα/2 1.645 1.96 2.58
相关文档
最新文档