总体参数区间估计(6)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
特 点
2、在方法上运用不确定的概率估计方法,而不 是运用确定的数学分析方法。
3、抽样估计存在抽样误差。
点估计
从总体中抽取一个随机样本,计算与总 体参数相应的样本统计量,然后把该统 计量视为总体参数的估计值,称为参数 的点估计。
优点 缺点
简单,具体明确 无法控制误差,仅适用于对推断的准 确程度与可靠程度要求不高的情况
居民 1 2 3 4 5 6 7 8 9 汽车里 程数 32 50 40 24 33 44 45 48 44 居民 10 11 12 13 14 15 16 17 18 汽车里 程数 47 31 36 39 46 45 39 38 45 居民 19 20 21 22 23 24 25 26 27 汽车里 程数 27 43 54 36 34 48 23 36 42 居民 28 29 30 31 32 33 34 35 36 汽车里 程数 34 39 34 35 42 53 28 49 39
lim P(
n
) 1
无偏性
• 无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 。
ˆ) P(
无偏 有偏
A
B
ˆ
有效性
• 有效性:与离散度相联系。对同一总体参数 的两个无偏点估计量,有更小标准差的估计 量更有效。
ˆ) P(
ˆ1 的抽样分布
B A
ˆ2 的抽样分布
职员 1 2 3 4 5 时间 52 44 55 44 45 职员 6 7 8 9 10 时间 59 50 54 62 46 职员 11 12 13 14 15 时间 54 58 60 62 63
根据上述资料建立臵信度为95%的总体均值的区间估 计。(假定培训时间总体服从正态分布)。
解:依题意,总体服从正态分布,n=15(小样本),此时 总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值 的区间估计。 x 52 44 55 63 样本平均数
ˆ
一致性
• 一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数。
ˆ) P(
较大的样本容量
B A
较小的样本容量
ˆ
抽样估计量的优良标准
数理统计证明:
x 为 X的无偏、有效、一致估计量; S n 1 为 的无偏、有效、一致估计量;
p 为 P的无偏、有效、一致估计量。
案例导入
25袋食品的重量(克) 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.4 98.4 100.5 115.6 102.2 105.0 93.3
(一)抽样误差
抽样误差:一个无偏估计与其对应的
总体参数之差的绝对值。
x x
(实际未知)
STAT
x , x
x x
(二)抽样误差的概率表述
由概率论可知,
Z x
STAT
x
服从标准正态分布,即 Z ~ N (0,1)
有以下关系式成立: P(
x
x
Z 2 ) 1
x
s
n
15
2
53.87
样本标准差 误差边际
( x x)
n 1
s 6.82 x t 2 2.145 * 3.78 n 15
651 .73 6.82 14
95%的臵信区间为
53.87 ±3.78
即(50.09,57.65)天。
三、总体比率的区间估计
样本统计量 (点估计)
置信下限
置信上限
区间估计的图示 x z 2 x
x
+ 2.58x
- 2.58x
-1.65 x
+1.65x
x
-1.96 x
+1.96x
90%的样本 95% 的样本 99% 的样本
一、总体均值的区间估计 大样本(n≥30)的情形
抽样估计量的优良标准
设 为待估计的总体参数, 为样本统 计量,则 的优良标准为:
无偏性 指样本指标的均值应等于被估计 的总体指标
若 估计量
,则称
为
的无偏
抽样估计量的优良标准
有效性
若
作为优良的估计量,除了满足无偏 性的要求外,其方差应比较小
,则称 为比 更有效的估计量
指随着样本单位数 的增大,样本 一致性 估计量将在概率意义下越来越接近 于总体真实值 若 越大 越小,则称 为 的一致估计量
n 样本标准差s
x Z 2
总体标准差(未知)
样本标准差
s
误差边际
( x x)
n 1
2
7.77
s 7.77 x Z 2 Z 2 1.645 * 2.13 n n 36
即(37.37,41.63)里。
(3)90%的臵信区间为39.5 〒2.13 注意
(1)臵信系数一般在抽样之前确定,根据样本所建立的区间能 包含总体参数的概率为 (2)臵信区间的长度(准确度)在臵信度一定的情况下,与样 本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样 本容量来达到。
二、总体均值的区间估计 小样本(n<30)的情形
STAT
在小样本的情况下,样本均值的抽样分布依 赖于总体的抽样分布。
n n
【例】1997年菲瑞卡洛通讯公司对全国范围每内的902
名女子高尔夫球手进行了调查,以了解美国女子高尔夫球
手对自己如何在场上被对待的看法。调查发现,397名女
子高尔夫球手对得到的球座开球次数感到满意。
试在95%的置信水平下估计总体比例的区间。
分析: 区间 点估计 误差边际
(大样本), 1 95%,Z 2 1.96 解: n 902
STAT
【例】Duotu公司是一家专营体育设备和附件的公司, 为了监控公司的服务质量,Duotu公司每月都要随即 的抽取一个顾客样本进行调查以了解顾客的满意分 数。根据以往的调查,满意分数的标准差稳定在20 分左右。最近一次对100名顾客的抽样显示,满意分 数的样本均值为80分Βιβλιοθήκη Baidu试建立总体满意分数的区间。
1、样本比例近似服从正态分布
n 30, np 5, n(1 p) 5
2、使用正态分布统计量 z p
z p(1 p) n ~ N (0,1)
3、总体比例在1-置信水平下的置信区间为 (1 ) p(1 - p) p z 2 或 p z 2 ( 未知时)
STAT
根据表中数据,质检科估计出该天生产的食品每袋的平均 重量在101.57~109.14克之间,其中,估计的可信程度为95%, 估计误差不超过4克。产品的合格率在95.68%~64.32%之间,其 中,估计的可信程度为95%,估计误差不超过15.68%。
案例导入
STAT
质检报告提交后,企业高层领导人提出几点意见:一是抽
t s n ~ t (n 1)
3、总体均值 在1-置信水平下的置信区 间为
x t
s
2
n
【例】谢尔工业公司拟采用一项计算机辅助程序来培训 公司的维修职员掌握及其维修的操作,以减少培训工人 所需要的时间。为了评价这种培训方法,生产经理需要 对这种程序所需要的平均时间进行估计。以下是利用新 方对15名职员进行培训的培训天数资料。
取的样本大小是否合适?能不能用一个更大的样本进行估计?
二是能否将估计的误差在缩小一点?比如,估计平均重量时估 计误差不超过3克,估计合格率时误差不超过10%。三是总体平 均重量的方差是多少?因为方差的大小说明了生产过程的稳定 性,过大或过小的方差都意味着应对生产过程进行调整。
第6章 总体参数估计
本章重点 1、单个总体均值的区间估计; 2、样本容量的确定; 3、两个总体均值之差的区间估计。
n
~ N (0,1)
(三)总体均值的区间估计
1、大样本、未知 2、使用正态分布统计量Z
Z X
3、总体均值 在1-置信水平下的置信区 间为
n
~ N (0,1)
【例】某市交通部门为了对城市的环境进行监测,定期公 布该市居民每天小汽车的里程数,抽取了36个居民作为一 个简单随机样本,得到资料如下。试构造该市居民每天小 汽车里程数的总体均值的95%的置信区间。
第二节 单个总体均值和比率的区间估计
一、总体均值的区间估计:大样本 (n≥30)的情形
总体标准差已知 总体标准差未知
二、总体均值的区间估计:小样本 (n<30)的情形 三、总体比率的区间估计
区间估计
1.
2.
在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量 – 比如,某班级平均分数在75~85之间,置信水平 是95% 置信区间
第一节 参数估计的基本问题 第二节 单个总体均值和比率的区间估计 第三节 样本容量的确定 第四节 两个总体均值和比率差异的区间估计 第五节 分层抽样、整群抽样和等距抽样的区 间估计
案例导入
STAT
一家食品生产企业以生产袋装食品为主,每天的产量约为
8000袋左右。按规定每袋的重量应不低于100克,否则即为不合
x 的抽样分布
点估计的最大好处:给出确定的值 点估计的最大问题:无法控制误差
估计值的优良标准 问题:
x
第一,我们为什么以这一个而 me 不是那一个统计量来估计某个总体 mo 参数? 第二,如果有两个以上的统计 估计值的优良标准: 量可以用来估计某个总体参数,其 无偏性、有效性、一致性 估计结果是否一致?是否一个统计 量要优于另一个?
1 为置信度,可靠程度等,反映估计结果 一般称, 的可信程度。若事先给定一个置信度,则可根据标准 正态分布找到其对应的临界值 Z 2 。进而计算抽样误 差
x x Z 2 x
(三)总体均值的区间估计
1、大样本、已知 2、使用正态分布统计量Z
Z X
3、总体均值 在1-置信水平下的置信区 间为
40.76%到47.24%的人对得到的球座开球数感到满意。
第三节 样本容量的确定
STAT
一、总体均值估计时样本容量的确定 二、总体比率估计时样本容量的确定
一、总体均值估计时样本容量的确定
STAT
【例】拥有工商管理硕士学位的毕业生每年年薪底薪的标 准差大约为2000元,假定希望估计每年年薪底薪的95%的 臵信区间。如果研究者期望的极限误差为200元,样本容 量应当有多大?
STAT
本章难点 1、小样本情形下总体参数的区间估计; 2、其他组织形式总体参数的区间估计及样本容量的确 定。
第一节 参数估计的基本问题
参数估计
也叫抽样估计,就是根据样本指 标数值对总体指标数值作出估计 或推断。
通常,把用来估计总体特征的样本指标叫估计 量或统计量,待估计的总体指标叫总体参数。
1、它在逻辑上运用归纳推理而不是演绎推理。
(1)样本比例 (2)误差边际
m 397 p 0.44 n 902
P Z 2
p(1 p ) 0.44 0.56 1.96 0.0324 n 902
(3)95%的臵信区间0.44 〒0.0324 即(0.4076,0.4724)。
结论:在臵信水平为95%时,所有女子高尔夫球手中有
格。为对产量质量进行检测,企业设有质量检查科专门负责质 量检验,并经常向企业高层领导提交质检报告。质检的内容之 一就是每袋重量是否符合要求。 由于产品的数量大,进行全面的检验是不可能的,可行的
办法是抽样,然后用样本数据估计平均每袋的重量。质检科从
某天生产的一批食品中随机抽取了25袋,下表是对每袋食品重 量的检验结果。(假定该种袋装食品重量服从正态分布。)
分析:区间估计包括两个部分——点估计和误差边际,只需分 别求出即可到的总体的区间估计。 解:已知 (1)样本的汽车里程数
n 36 (大样本), 1 90%,Z 2 1.645
(2)误差边际
x 32 50 40 36 x 39.5 n 36
总体标准差已知 x服从正态分布 小样本n 30 总体标准差未知 x服从t分布( s )
t分布的图形和标准正态分布的图形类似
标准正态分布
t分布(自由度为20)
t分布(自由度为10)
0
标准正态分布与t分布的比较
总体均值的区间估计
1、总体服从正态分布、小样本、未知 2、使用t分布统计量 x