第七章 抽样推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节 抽样误差
一,抽样误差的概念 抽样误差(sampling error)是指按照随机原 抽样误差 是指按照随机原 则抽样, 则抽样,所得的样本指标和总体指标之间的数 量差别. 量差别. 二,抽样平均误差 (一)概念 抽样平均误差(average error of sampling) 抽样平均误差 就是所有可能出现的样本指标的标准差,是由 就是所有可能出现的样本指标的标准差, 于抽样的随机性而产生的样本指标与总体指标 之间的平均离差. 之间的平均离差.
(三)影响必要样本容量的因素 1.受标准差或方差的影响 2.受允许误差的影响 3.受概率度的影响 4.受抽样方法的影响
1. 在重复抽样的情况下,要使抽样平均误差减少为原来的 在重复抽样的情况下,要使抽样平均误差减少为原来的1/3 其他条件不变),则样本单位数必须( ),则样本单位数必须 (其他条件不变),则样本单位数必须( ) 增加3倍 增加到3倍 ① 增加 倍 ② 增加到 倍 增加9倍 增加到9倍 ③ 增加 倍 ④ 增加到 倍 2. 在简单随机重复抽样条件下,当误差范围扩大二倍时(其他条 在简单随机重复抽样条件下,当误差范围扩大二倍时( 件不变),则抽样单位数只需原来的( ),则抽样单位数只需原来的 件不变),则抽样单位数只需原来的( ) ① 1/2 ② 1/3 ③1/4 ④ 1/9 3. 在简单随机重复抽样条件下,当误差范围缩小 时(其他条件 在简单随机重复抽样条件下,当误差范围缩小1/6时 不变),则抽样单位数必须增加到原来的( ),则抽样单位数必须增加到原来的 不变),则抽样单位数必须增加到原来的( ) ① 1.44倍 倍 ② 6倍 倍 ③ 12倍 倍 ④ 36倍 倍 4. 抽样单位数增加 倍,随机重复抽样平均误差缩小为原来的 抽样单位数增加2倍 当抽样单位数减少20%,重复抽样平均误差扩大为 ( )倍,当抽样单位数减少 , 原来的( 原来的( )倍.
四,抽样方法与抽样数目的关系 例如:总体有ABCD四个单位,即总体单 四个单位, 例如:总体有 四个单位 位数N=4,要从中随机抽取两个单位构成 位数 , 样本,即样本单位数n=2.用重复抽样方 样本,即样本单位数 . 法抽选样本, 法抽选样本,全部可能抽取的样本数目是 多少?用不重复抽样方法抽选样本, 多少?用不重复抽样方法抽选样本,全部 可能抽取的样本数目又是多少? 可能抽取的样本数目又是多少?
Excel在抽样推断中的应用 在抽样推断中的应用
三,对总体总量指标的推算
(一)点估计 样本指标值乘以总体单位数, 样本指标值乘以总体单位数,是总体 总量指标的点估计值.即 x N , pN 总量指标的点估计值. (二)区间估计 总体指标的区间估计值乘以总体单位 是总体总量指标的区间估计值. 数,是总体总量指标的区间估计值.即
[( x
[( p
(二)不重复抽样的必要样本容量 1. 平均数的必要样本容量
n= Nt 2 σ
2 N x 2 2 2
+t σ
2. 成数的必要样本容量
n= Nt 2 p(1 p) N2p + t 2 p(1 p)
例3,要调查某省10000名高校教师平均月工资 要调查某省10000名高校教师平均月工资 10000 水平, 水平,根据以往资料该省高校教师工资的方差 为132.25,要求把握程度为95.45%,抽样极限 132.25,要求把握程度为95.45%, 95.45% 误差为1 需要抽查多少名教师. 误差为1元,需要抽查多少名教师. 某电子元件厂日产10000只元件, 10000只元件 例4,某电子元件厂日产10000只元件,经多次 一般测试一等品率为92% 92%, 一般测试一等品率为92%,现拟采用随机抽样 方法进行抽检,如要求误差范围在2%之内, 2%之内 方法进行抽检,如要求误差范围在2%之内,可 靠程度为95.45% 95.45%, 靠程度为95.45%,试求需要抽取多少只电子元 件.
(二)特点
1.是一种非全面调查 2.根据部分推断总体 3.按随机原则抽选调查单位 4.抽样误差可以事先计算并加以控制
(三)作用
1.对于无限总体只能进行抽样调查 2 . 对于有破坏性的产品质量检查只能进行抽 样调查 理论上可以进行全面调查, 3.理论上可以进行全面调查,但实际上办不到 的总体. 的总体. 4.需要及时了解情况的现象 5.对全面调查的资料进行评价和修正 可以用于工业生产过程的质量控制, 6.可以用于工业生产过程的质量控制,实行科 学管理. 学管理.
第四节 必要样本容量的确定
一,确定必要样本容量(sample size)的意义 确定必要样本容量 的意义 二,必要样本容量的计算公式 (一)重复抽样的必要样本容量 t 2σ 2 1. 平均数的必要样本容量 n = 2
x
2. 成数的必要样本容量
n=
t 2 p(1 p) 2p
例1,在某市组织职工家庭生活抽样调查,已 在某市组织职工家庭生活抽样调查, 知职工家庭平均每人每月生活费收入的标准差 为11.5元,要求把握程度为0.9545,允许误差 11.5元 要求把握程度为0.9545, 0.9545 试问需要抽查多少户进行调查. 为1元,试问需要抽查多少户进行调查. 调查一批机械零件的合格品率, 例2,调查一批机械零件的合格品率,根据过 去的资料,合格品率曾有过99% 97%,95%三 99%, 去的资料,合格品率曾有过99%,97%,95%三 种情况,现在要求允许误差不超过1% 1%, 种情况,现在要求允许误差不超过1%,要求推 断的把握程度为95% 95%, 断的把握程度为95%,试问需要抽查多少个零 件.
x )N ,(x + x )N
p
]
)N , ( p +
p
)N ,
]
例1,某地区小麦的播种面积为20万亩,根据抽 某地区小麦的播种面积为20万亩, 20万亩 样调查结果,平均亩产为455公斤, 455公斤 样调查结果,平均亩产为455公斤,抽样平均误 差为12公斤,试在80%的概率保证下, 12公斤 80%的概率保证下 差为12公斤,试在80%的概率保证下,推算该地 区小麦总产的范围. 区小麦总产的范围. 例2,对5000件零件进行抽样调查,调查结果废 5000件零件进行抽样调查, 件零件进行抽样调查 品率为1.5% 抽样平均误差为0.5% 1.5%, 0.5%, 95%的概 品率为1.5%,抽样平均误差为0.5%,在95%的概 率保证下,推算全部零件废品量的区间范围. 率保证下,推算全部零件废品量的区间范围.
5.为了解农民安装电话的情况,在某地 为了解农民安装电话的情况,在某地5000 为了解农民安装电话的情况 户农户中,按不重复简单随机抽样法抽取400 户农户中,按不重复简单随机抽样法抽取 户进行调查,得知这400户中已安装电话的农 户进行调查,得知这 户中已安装电话的农 户为87户 试以95%的概率保证程度估计 的概率保证程度估计: 户为87户.试以95%的概率保证程度估计: (1)该地区全部农户中已安装电话的农户在 ) 多大比例之间?( ?(2) 多大比例之间?( )若要求抽样极限误差不 超过0.02,问至少应抽取多少户作为样本? 超过 ,问至少应抽取多少户作为样本?
6.某鱼塘共养鱼 万尾,从中用纯随机有放回抽 某鱼塘共养鱼10万尾 某鱼塘共养鱼 万尾, 样方式捕捞100尾,其中有鲫鱼 尾.试对整个 样方式捕捞 尾 其中有鲫鱼30尾 鱼塘中鲫鱼的数目进行点估计,并以68.27%的 鱼塘中鲫鱼的数目进行点估计,并以 的 概率保证程度作区间估计. 概率保证程度作区间估计.
(二)抽样平均误差的计算公式
1.平均数抽样误差的计算 σ 2 ⑴ 重复抽样 x =
n =
σ
n
⑵ 不重复抽样
x =
σ
2
随机抽选某大学的100 名大学生, 100名大学生 例 1 , 随机抽选某大学的 100 名大学生 , 得到 他们的平均体重为58 公斤, 58公斤 他们的平均体重为 58 公斤 , 根据过去的材料 知道大学生的总体标准差是10 公斤. 10公斤 知道大学生的总体标准差是 10 公斤 . 求抽样 误差. 误差. 某工厂生产一种新型聚光灯泡共2000 2000只 例2,某工厂生产一种新型聚光灯泡共2000只, 随机抽选400只作耐用时间实验. 400只作耐用时间实验 随机抽选400只作耐用时间实验.测试和计算 结果, 平均寿命为4800 小时, 4800小时 结果 , 平均寿命为 4800 小时 , 样本标准差为 300小时 求抽样误差. 小时. 300小时.求抽样误差.
二,抽样调查中的几个基本概念
1.全及总体 是指研究对象的全部单位组成的总体, 是指研究对象的全部单位组成的总体 , 简称总体(population). 简称总体 . 2.样本总体 是指从全及总体中随机抽选出来的单 位所组成的小总体,简称样本(sample). 位所组成的小总体,简称样本 .
3.全及指标 根据全及总体计算的统计指标. 根据全及总体计算的统计指标. 4.样本指标 根据样本总体计算的统计指标. 根据样本总体计算的统计指标. 三,抽样方法 1.重复抽样(sampling with replacement) 重复抽样( 不重复抽样( 2.不重复抽样(sampling without replacement)
第ቤተ መጻሕፍቲ ባይዱ节 抽样调查的一般问题
一,抽样调查的概念与作用 (一)概念 抽样调查(sampling survey)是按照随 抽样调查 是按照随 机原则, 机原则 , 从总体中抽选部分单位进行调 然后, 查 , 然后 , 用这一部分单位的指标数值 去推断总体的一种非全面调查方法. 去推断总体的一种非全面调查方法.
n
(1
n ) N
2.成数抽样误差的计算 ⑴ 重复抽样 ⑵ 不重复抽样
p =
p(1 p ) n
p =
p(1 p ) n 1 n N
在某学院随机抽选400名学生, 400名学生 例 1 , 在某学院随机抽选 400 名学生 , 发现戴 眼镜的学生有200 200人 50% 求抽样误差. 眼镜的学生有200人,占50%.求抽样误差. 一批罐头共60000 60000盒 随机抽查300 300盒 例 2 , 一批罐头共 60000 盒 , 随机抽查 300 盒 , 发现其中有6盒不合格. 发现其中有6盒不合格.求合格品率的抽样误 差.
(三)区间估计的方法 1.平均数的区间估计方法 x x ≤ X ≤ x + x 2.成数的区间估计方法
pp ≤ P≤ p+p
例2,对一批成品按不重复抽样方法抽选 200件 其中废品8 200件,其中废品8件,又知道样本容量为 成品总量的1 20.当概率为95 95% 成品总量的1/20.当概率为95%时,试估计 废品率的范围. 废品率的范围.
(三)影响抽样误差的因素
1.抽样单位数目的多少. 抽样单位数目的多少. 总体被研究标志变异程度的大小. 2.总体被研究标志变异程度的大小. 抽样调查的组织方式和抽样方法. 3.抽样调查的组织方式和抽样方法.
第三节 抽样估计
一,点估计 (point estimate) 就是用样本指标直接代表总体指标. 就是用样本指标直接代表总体指标. 二,区间估计 (interval estimate) (一)区间估计的概念 区间估计是根据样本指标和抽样平均误差, 区间估计是根据样本指标和抽样平均误差, 去推断总体指标的可能范围. 去推断总体指标的可能范围. (二)区间估计的理论 区间估计依据概率论与数理统计的理论. 区间估计依据概率论与数理统计的理论.
第七章 抽样推断
第一节 第二节 第三节 第四节 抽样调查的一般问题 抽样误差 抽样估计 必要样本容量的确定
本章基本要求
理解抽样调查的概念,特点, 理解抽样调查的概念,特点,作用以及几个 基本概念; 基本概念; 掌握抽样误差的含义和影响抽样误差的主要 因素; 因素; 熟练掌握抽样平均误差的计算; 熟练掌握抽样平均误差的计算; 熟练掌握点估计和区间估计方法; 熟练掌握点估计和区间估计方法; 熟练掌握必要样本容量的确定方法. 熟练掌握必要样本容量的确定方法.