第6章抽样调查
自考-市场调查与预测-第6章-抽样方法
1 定义总体 确定调查对象全体:从抽样元素、抽样 单位、抽样范围、抽样时间角度考虑 例如…
2 确定抽样框架 抽样总体中,抽样元素的表现形式。总体中 的每一个元素都在抽样框架中出现一次,且 仅出现一次。如户籍簿。 适用性、完整性。 3 确定抽样单位 容纳总体的基本单位,大于等于样本元素。 取决于抽样框架和调查方法。 电话调查——电话号码 邮寄调查——地址或姓名
B 平均值估计 C 百分比估计样本容量
根据允许误差大小估计样本量
不同抽样方法样本容量的确定 影响因素: 调查目的;总体大小;总体构成;抽样方式 计算公式:见表6-4
其它调查方法介绍
2、自愿样本
被调查者自愿参加,成为样本中的一分子,向
调查人员提供有关信息
–
例如,参与报刊上和互联网上刊登的调查问
第6章 抽样方法
普查与抽样调查 抽样程序
常用抽样方法
样本容量的确定
6.1普查与抽样调查
抽样设计的重要性 案例6-1 普查的相关概念和案例 P159 抽样调查的概念 抽样是通过抽取总体中的部分单位,收集 这些单位的信息,从而对总体进行推断的 一种手段。 抽样调查的含义 P163 抽样调查的适用范围
第一节 抽样方法
6.3 常用抽样方法
1 简单随机抽样 2 分层随机抽样 3 分群随机抽样 4 等距随机抽样 5 任意抽样 6 判断抽样 7 配额抽样 8 滚雪球抽样
1 简单随机抽样 1、抽样方法 根据研究目的选定总体,首先对总体中所 有的观察单位编号,遵循随机原则,采用不放 回抽取方法,从总体中随机抽取一定数量观察 单位组成样本。 2、具体方法 ①抽签法
第6章抽样设计
第四节 抽样误差与样本量
• 一、调查误差的概念与种类 • 调查误差是指调查的结果和客观实际情况的出入和差数。
一般有两种误差存在, 即非抽样误差和抽样误差。 • 非抽样误差是基于抽样之外的许多其它原因而产生的误差。
• 抽样误差是指一个样本的测定值与对该变量真值之间的差 异,抽样误差无特定偏向,其误差大小主要受以下三个因 素影响:
• 单位顺序的排列方式有两种: 一种是排列顺 序与调查项目无关。另一种是按与调查项 目有关标志排队。
• 三、分层抽样
• 分层抽样又叫类型抽样, 它是先将总体 所有单位按某一重要标志进行分类(层), 然后再各类(层)中采用简单随机抽样或 等距抽样方式抽取样本单位的一种抽样方 式。
• 分层抽样比简单随机抽样和机械抽样更 为精确, 能够通过对较少的抽样单位的调查, 得到比较准确的推断结果, 特别是当总体较 大、内部结果复杂时, 分层抽样常能取得令 人满意的效果。同时, 分层抽样在对总体推 断的同时, 还能获得对每层的推断。
• (二)特点
• 与全面调查相比,抽样调查具有以下三个 显著特点:
• 1、经济
• 与全面调查相比,抽样调查的样本量大大 减少,从而可以显著地节约人力、物力和 财力。
• 2、高效
• 由于抽样调查只对总体中少量单位进行调 查,故能十分迅速地得到调查讨论。
• 3.准确
• 抽样调查是调查部分总体单位,数目较少,
• 第一,被研究总体各单位标志值的变异程度。 • 第二,抽样的样本量。 • 第三,抽样调查的组织方式。
• 二、样本量 • 在开始组织抽样调查之前,确定抽多少样本单位是个很重
要的问题。 • (一)影响样本量的因素 • 抽样调查的样本量取决于以下几个因素: • 1、被调查对象标志的差异程度 • 2、允许误差数值的大小 • 3、调查结果的可靠程度 • 4、抽样的方法 • 5.抽样的组织形式
市场调查-第六章抽样技术
N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。
第六章抽样调查习题答案
第六章抽样调查习题答案一、单项选择题1、 C2、 A3、 D4、 D5、C6、 D7、 C8、 A9、 D 10、A11、 D 12、C 13、B 14、 A 15、A16、 B 17、 B 18、D 19、 A 20、A21、 A 22、 D 23、 D 24、 B 25、A二、判断题1、CD2、AE3、BCD4、ABDE5、ABD6、AB7、ABCD8、AC9、ABCD三、判断题1、×2、√3、√4、√5、√6、×7、√8、×9、√10、√11、×12、√13、√14、×15、×16、√17、√18、×四、填空题1、随机、部分、总体2、计算、控制3、重复、不重复4、大于5、点估计、区间估计6、增加到4倍、减少三分之二、减少四分之三7、大样本、小样本8、正、反五、复习思考题1、影响抽样误差的主要因素有哪些?答:影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。
差异程度愈大则抽样误差愈大,反之则愈小。
(2)样本单位数的多少。
在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。
(3)抽样方法。
抽样方法不同,抽样误差也不相同。
一般说,重复抽样比不重复抽样,误差要大些。
(4)抽样调查的组织形式。
抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。
2、什么是抽样调查?它有哪些特点?答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。
它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
(1)只抽取总体中的一部分单位进行调查。
(2)用一部分单位的指标数值去推断总体的指标数值(3)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
统计学原理-第六章 抽样调查(复旦大学第六版)
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28
2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。
2
x X f
2
f
2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x
N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F
统计学第六章 抽样法
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80
-
x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数
据
概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计
据
总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。
第六章抽样调查练习及答案
第 六章 抽样调查一、填空题1.抽选样本单位时要遵守 原则,使样本单位被抽中的机会 。
2.常用的总体指标有 、 、 。
3.在抽样估计中,样本指标又称为 量,总体指标又称为 。
4.全及总体标志变异程度越大,抽样误差就 ;全及总体标志变异程度越小,抽样误差 。
5.抽样估计的方法有 和 两种。
6.整群抽样是对被抽中群内的 进行 的抽样组织方式。
7.误差分为 和代表性误差;代表性误差分为________和偏差;偏差是____________________________,也称为________________。
8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下: ;不重复抽样条件下: 。
9.误差范围△,概率度t 和抽样平均误差μ之间的关系表达式为 。
10.抽样调查的组织形式有: 。
二、单项选择题1.所谓大样本是指样本单位数在( )及以上A 30个B 50个C 80个 D100个2.抽样指标与总体指标之间抽样误差的可能范围是( )A 抽样平均误差B 抽样极限误差C 区间估计范围D 置信区间3.抽样平均误差说明抽样指标与总体指标之间的( )A 实际误差B 平均误差C 实际误差的平方D 允许误差4.是非标志方差的计算公式( )A P(1-P)B P(1-P)2C )1(P P -D P 2(1-P)5.总体平均数和样本平均数之间的关系是( )A 总体平均数是确定值,样本平均数是随机变量B 总体平均数是随机变量,样本平均数是确定值C两者都是随机变量 D两者都是确定值6.对入库的一批产品抽检10件,其中有9件合格,可以( )概率保证合格率不低于80%。
A 95.45%B 99.7396C 68.27%D 90%7.在简单随机重复抽样情况下,若要求允许误差为原来的2/3,则样本容量( )A 扩大为原来的3倍B 扩大为原来的2/3倍C 扩大为原来的4/9倍D 扩大为原来的2.25倍8.根据抽样调查得知:甲企业一等品产品比重为30%,乙企业一等品比重为50%一等品产品比重的抽样平均误差为 ( )A 甲企业大B 两企业相同C 乙企业大D 无法判断9.是非标志的平均数是( )A -P)1P(B P(1-P)C pD (1-P)210.重复抽样的误差一定( )不重复抽样的误差。
胡德华版统计学第六章
6.2.2 机械抽样
机械抽样又称等距抽样或系统抽样, 机械抽样又称等距抽样或系统抽样,就是将总体的各单位按某一标 志的大小进行排队,用总体单位数除以样本单位数求得抽样间隔, 志的大小进行排队,用总体单位数除以样本单位数求得抽样间隔,然后 按照相同的间隔等距抽取样本的一种抽样方式。 按照相同的间隔等距抽取样本的一种抽样方式。 根据总体单位排列方法,等距抽样可分为两类: 根据总体单位排列方法,等距抽样可分为两类:一是按有关标志排 二是按无关标志排队。 队;二是按无关标志排队。 所谓有关标志就是指与调查问题直接相关的标志。 所谓有关标志就是指与调查问题直接相关的标志。 采用等距抽样法,主要应解决以下两个问题: 采用等距抽样法,主要应解决以下两个问题: 一是要计算抽样间隔, 代表抽样间隔, 代表总体单位数 代表总体单位数, 代 一是要计算抽样间隔,若K代表抽样间隔,N代表总体单位数,n代 代表抽样间隔 表抽取的样本单位数, 表抽取的样本单位数,则K=N / n 。 二是要确定起点样本,即第一个样本。 二是要确定起点样本,即第一个样本。通常的方法可采取在第一组 1-K个样本单位中随机抽取的方法,也可以在第一组 个样本单位中随机抽取的方法, 个样本单位中随机抽取的方法 也可以在第一组1-K个样本单位中采 个样本单位中采 用取中间值的方法,然后,每隔K个单位抽取一个样本 个单位抽取一个样本, 用取中间值的方法,然后,每隔 个单位抽取一个样本,直到抽够样本 为止。 为止。 等距随机抽样方法可以使样本单位均匀地分布在总体的各个部分, 等距随机抽样方法可以使样本单位均匀地分布在总体的各个部分, 因而使样本具有更高的代表性,减少了抽样误差; 因而使样本具有更高的代表性,减少了抽样误差;采用机械顺序抽取样 简单易行,便于操作。但是,在应用等距抽样方法时, 本,简单易行,便于操作。但是,在应用等距抽样方法时,要注意抽样 间隔与现象本身所具有的规律不能重叠,否则,会加大抽样误差。 间隔与现象本身所具有的规律不能重叠,否则,会加大抽样误差。 等距随机抽样方法比较适合于同质性较高的总体。 等距随机抽样方法比较适合于同质性较高的总体。
七年级上册-第六章-第二讲 普查和抽样调查
第二讲普查和抽样调查一、全面调查与抽样调查1.全面调查:(1)定义:为某一特定目的而对所有考察对象进行的全面调查叫做普查;(2)主要方法:问卷调查、访问调查、电话调查等.(3)适用范围:调查范围小、调查不具有破坏性、数据要求准确全面.2.抽样调查:(1)定义:从总体中抽取部分个体进行调查,这种调查称为抽样调查.(2)主要方法:①简单随机抽样:它的特点是每个对象被抽取的可能性都相等;当全体对象较少时,常采取简单随机抽样.②分层抽样:当全体对象是由有明显差异的几部分构成时,可将全体对象按差异情况分成几个部分,然后按各个部分所占的比例进行抽样,这样的抽样方法叫做分层抽样.(3)适用范围:调查对象涉及面广,范围大,或受条件限制,或具有破坏性等.例1 下列调查中,适合做普查的是()A.某班同学“立定跳远”的成绩B.某水库中鱼的种类C.某鞋厂生产的鞋底承受的弯折次数D.某型号节能灯的使用寿命二、全面调查与抽样调查例2 下列调查中,哪些适宜抽样调查,哪些适宜普查?(1)调查我市中学生每天做作业的时间;(2)调查某班学生对“中国梦”的知晓率;(3)调查一架“歼20”隐形战机各零部件的质量;(4)调查伦敦奥运会100 m跨栏决赛参赛运动员兴奋剂的使用情况.小结:(1)要判断一个调查是否适合采用抽样调查,先看调查的范围有多大,调查的目的如何,对调查结果的要求是否很高,同时,还要兼顾人力、物力的节省.(2)选择抽样调查的情况有:①当被调查的对象数目较多时,全面调查的工作量较大,可选择抽样调查;②当客观条件限制,无法对所有调查对象进行全面调查时,可选择抽样调查;③当调查具有破坏性时,可选择抽样调查.例3 (中考·重庆)下列调查中,最适宜采用全面调查方式(普查)的是()A.对重庆市中学生每天学习所用时间的调查B.对全国中学生心理健康现状的调查C.对某班学生进行6月5日是“世界环境日”知晓情况的调查D.对重庆市初中学生课外阅读量的调查例4 (中考·通辽)下列调查中适合抽样调查的是()A.审核书稿中的错别字B.对某社区的卫生死角进行调查C.对八名同学的身高情况进行调查D.对中学生目前的睡眠情况进行调查例5 为了了解本校学生所穿校服尺码的分布情况,四位同学进行了不同的调查:甲对七年级的三个班的全体同学进行调查;乙对八年级的三个班的全体同学进行调查;丙对九年级的三个班的全体同学进行调查;丁分别对三个年级的任意一个班的全体同学进行调查.则抽样调查较为合理的是()A.甲B.乙C.丙D.丁三、总体、个体、样本在上一节中,我们曾对全班同学的节水意识进行了调查,像这种为某一特定目的而对所有考察对象进行的全面调查叫做普查.其中,所要考察对象的全体称为总体,而组成总体的每一个考察对象称为个体.总体:所要考察对象的全体称为总体.个体:组成总体的每一个考察对象称为个体.样本:从总体中抽取的一部分个体叫做总体的一个样本.样本容量:一个样本中包含的个体的数目叫做样本容量;注意:样本容量没有单位.例6 某市有3万名学生参加2013年的中考,想要了解这3万名考生的中考成绩,从中抽取了500名考生的中考成绩进行统计分析,以下说法正确的是()A.这500名考生是总体的一个样本B.每个考生的中考成绩是个体C.3万名考生是总体D.500名考生是样本容量小结:(1)样本、个体、总体都是调查过程中的考察对象,所要考察的内容是相同的,只是数量不同;(2)样本的抽取是否得当直接关系到对总体估计的准确度,因此抽取的样本要具有代表性和广泛性.(3)样本和总体的关系:总体包括所有个体,样本只包括一部分个体;样本是总体的一部分,总体可以有多个样本;一个样本所体现的特征只是近似地反映总体的特征.(4)样本容量是一个样本中包含的个体的数目;样本容量越大,样本的特征越接近总体的特征.(5)用样本的情况去估计总体的情况的思想称为用样本估计总体.例7 (中考·聊城)电视剧《铁血将军》在我市拍摄,该剧展示了抗日英雄范筑先的光辉形象.某校为了了解学生对“民族英雄范筑先”的知晓情况,从全校2 400名学生中随机抽取了100名学生进行调查.在这次调查中,样本是()A.2 400名学生B.100名学生C.所抽取的100名学生对“民族英雄范筑先”的知晓情况D.每一名学生对“民族英雄范筑先”的知晓情况四、样本的代表性例8 判断下列调查中样本的选取是否合适,并说明理由.(1)在网上调查“你对老师讲课时‘拖堂现象’的态度”;(2)在某一个敬老院里调查我国老年人的寿命情况;(3)在校园里调查我国青年人上网的时间;(4)为了了解我校七年级同学看电视的时间,随机选取了100名同学进行调查.注意:①样本容量适当;②样本具有广泛性:当总体是由有明显差异的几个部分组成时,每个部分都应被抽取到且比例适中;③样本具有随机性,即保证每个个体被抽到的机会相等.例9 要调査下面的问题,你觉得用什么调查方式比较合理?(1)调査某种灯泡的使用寿命;(2)调査你们学校七年级学生的体重;(3)调査你们班学生早餐是否有喝牛奶的习惯.例10 为了了解你们学校的学生是否吃早饭,下列这些抽取样本的方式是否合适?(1)早上7: 00至7: 30在校门口随机选择50名同学进行调査;(2)选择全校每个班级中学号是5和15的同学进行调查;(3)选择七(1)班全体学生进行调查.例11 (中考·宁德)为了解本地区老年人一年中生病次数,下列样本抽取方式最合理的是()A.到公园调查100名晨练老人B.到医院调查100名老年病人C.到某小区调查10名老年居民D.利用户籍资料,按规则抽查10%老年人例12 (中考·淄博)下列调查中,样本具有代表性的是()A.了解全校同学对课程的喜欢情况,对某班男同学进行调查B.了解某小区居民的防火意识,对你们班同学进行调查C.了解商场的平均日营业额,选在周末进行调查D.了解观众对所看电影的评价情况,对座号是奇数号的观众进行调查第二讲普查和抽样调查1.考察全体对象的调查称为________________,又叫__________.它可以直接获得____________的情况,结果__________,但工作量__________,费时费力.2.(中考•山西)以下问题不适合全面调查的是()A.调查某班学生每周课前预习的时间B.调查某中学在职教师的身体健康状况C.调查全国中小学生课外阅读情况D.调查某校篮球队员的身高3.(中考•西宁)下列调查中,适合采用全面调查(普查)方式的是()A.了解西宁电视台“教育在线”栏目的收视率B.了解青海湖斑头雁种群数量C.了解全国快递包裹产生包装垃圾的数量D.了解某班同学“跳绳”的成绩4.(中考•辽阳)下列事件中适合采用抽样调查的是()A.对乘坐飞机的乘客进行安检B.学校招聘教师,对应聘人员进行面试C.对“天宫2号”零部件的检查D.对端午节期间市面上粽子质量情况的调查5.(中考•襄阳)下列调查中,调查方式选择合理的是()A.为了解襄阳市初中生每天锻炼所用时间,选择全面调查B.为了解襄阳市电视台《襄阳新闻》栏目的收视率,选择全面调查C.为了解神舟飞船设备零件的质量情况,选择抽样调查D.为了解一批节能灯的使用寿命,选择抽样调查6.在某一调查过程中,所要考察对象的全体称为________,而组成总体的每一个________称为个体;从总体中抽取的一部分个体叫做总体的一个________.7.(中考•营口)为了解某市参加中考的25 000名学生的身高情况,抽查了其中1 200名学生的身高进行统计分析,下面叙述正确的是()A.25 000名学生是总体B.1 200名学生的身高是总体的一个样本C.每名学生是总体的一个个体D.以上调查是普查8.样本的抽取是否得当直接影响到对总体的估计,因此抽取的样本要具有_________和___________.9.为了解某市老人的身体健康状况,需要抽取部分老人进行调查,下列抽取老人的方法最合适的是( ) A.随机抽取100位女性老人B.随机抽取100位男性老人C.随机抽取公园内100位老人D.在城市和乡镇各选10个点,每个点任选5位老人10.(中考•苏州)为了鼓励学生课外阅读,学校公布了“阅读奖励”方案,并设置了“赞成、反对、无所谓”三种意见,现从学校所有2 400名学生中随机征求了100名学生的意见,其中持“反对”和“无所谓”意见的共有30名学生,估计全校持“赞成”意见的学生人数约为()A.70 B.720 C.1 680 D.2 37011.为了建设和谐、平安、效益社会,区政府通过发调查表的方式广泛向居民征求对社会热点问题的意见,要求每位被调查者只写一个自己最关心的问题.根据调查统计得如图所示的统计图.(1)这次调查是全面调查还是抽样调查?(2)已知收回的调查表中,对社会治安提出意见的有540份,则这次共收回调查表多少份?(3)提道路交通问题的比提环境保护问题的多多少人?(4)请用一两句话谈谈你对这次调查结果的感想.12.家庭过期药品属于“国家危险废物”,处理不当将污染环境,危害健康,某市药监部门为了解市民家庭处理过期药品的方式,决定对全市家庭作一次简单随机抽样调查.(1)下列选取样本的方法最合理的一种是__________(只需填上正确答案的序号).①在市中心某个居民区以家庭为单位随机抽取;②在全市医务工作者中以家庭为单位随机抽取;③在全市常住人口中以家庭为单位随机抽取.(2)本次抽样调查发现,接受调查的家庭都有过期药品,现将有关数据呈现如图所示.①m=________,n=________;②补全条形统计图;③根据调查数据,你认为该市市民家庭处理过期药品最常见的方式是什么?④家庭过期药品的正确处理方式是送回收点,若该市有180万户家庭,请估计大约有多少万户家庭处理过期药品的方式是送回收点.。
统计学第六章抽样调查
n
N
例题2
xf
x
f
8400 200
42
s (x x)2 f 12200 7.81
f
200
2 (1 n ) 7.812 (1 200 ) 0.55
x
n
N
200
2000
例题3
❖某冷库的10万只冻鸡合格率为97%, 如果按重复抽样与不重复抽样各抽 取1000只和2000只,分别计算抽样 平均误差。
A
B
较小的样本容量
X
成数
❖ 总体成数
每个总体单位标志值设为0或1 1:具有某种属性的总体单位标志值 0:不具有某种属性的总体单位标志值 总体中具有某种特征的单位占全部总体单位
数的比例称为总体成数,记作P 成数总体方差:P(1-P)
总体成数和样本成数
❖ 样本成数
从成数总体中抽取样本容量为n的样本 样本中具有此种特征的单位占全部样本单位
从1、2 、3、4中随机抽取2个的样本数
重复抽样考虑顺序
16
1、1 2、1 3、1 4、1
1、2 2、2 3、2 4、2
1、3 2、3 3、3 4、3
1、4 2、4 3、4 4、4
从1、2 、3、4中随机抽取2个的样本数
不重复抽样考虑顺序 12
2、1 3、1 4、1
1、2
3、2 4、2
1、3 2、3
- 2.58x
-1.65 x
+1.65x + 2.58x
x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
区间估计
❖ 根据一个样本的观察值给出总体参数的估计范围 ❖ 给出总体参数落在这一区间的概率 ❖ 例如: 总体均值落在50~70之间,置信度为 95%
2013年第6章 抽样调查
2.优缺点及适用范围
优点: 与简单随机抽样比,省去了一个个抽样的时间。 能使样本均匀分散在调查总体中,不会集中于某 个层次,样本代表性增强了 缺点:进行排列时需要总体各个单位的详细资 料;总体单位差异较大或排列有规律时,调查 精确度有影响 商场抽每天销售量 适用范围:同质性较高的总体
2.经验法
经验法确定抽样数目的范围 -非随机抽样用
总体 规模 100 以下 100~ 1000 1 000~ 5000 5000~ 10000 10000~ 100000 100000 以上
抽样数 占总体 比重(%)
50以上
50~20
30~10
15~3
5~ 1
1以下
6.3 抽样调查方式
抽样调查方式
2.样本单位是从总体中抽选出来进行调查观察的 单位样本单位数n
(三)指标和标志 指标是总体的数量特征 数量指标,反映总体总规模或总水平,如人口 数,产量,耕地面积。 质量指标,反映总体内在质量,如产品合格率, 劳动生产率等。 标志反映的是总体单位的特征。 品质标志,如人的性别,籍贯等 数量标志,人的年龄,身高,职工工资等
(4)简单随机抽样法的优缺点及适用范围 优点 完全按照随机的原则进行抽样,简单直观 缺点 抽月收入 要有完整样本框 高的 如需编号,总体量大面广则难度较大; 有可能 全被抽到 总体单位差异较大时,样本代表性差; 适用范围 适用于总体单位数不多且差异较小的
(二)等距抽样
1.定义 等距抽样又称机械抽样或系统抽样,它是先将总体 各单位按某一标志排队,并给总体中所有个体编号,然后 抽取一个编号,并按照相同的间隔距离来抽取其他样本单 位。 编号 并根据总体单位数和样本单位数计算出抽样距离(即相 同的间隔),然后按相等的距离或等间隔来抽取样本单位。 L=N/n 标志采取方法可以选择与调查主题相关的或者不相关的 举例:某地区有零售店110户,采用等距抽样抽取11户 如何抽?
第六章 抽样调查
第六章 抽样调查一、单项选择题1.随机抽样的基本要求是严格遵守( )①准确性原则;②随机原则;③代表性原则;④可靠性原则。
2.抽样调查的主要目的是( )①广泛运用数学的方法; ②计算和控制抽样误差;③修正普查的资料; ④用样本指标来推算总体指标。
3.抽样总体单位亦可称( )①样本; ②单位样本数; ③样本单位; ④总体单位。
4.反映样本指标与总体指标之间抽样误差可能范围的指标是( )①样本平均误差; ②抽样极限误差; ③可靠程度; ④概率程度。
5.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( )①抽样单位数占总体单位数的比重很小时;②抽样单位数占总体单位数的比重很大时;③抽样单位数目很少时; ④抽样单位数目很多时。
6.在其他条件不变的情况下,抽样单位数目和抽样误差的关系是( ) ①抽样单位数目越大,抽样误差越大;②抽样单位数目越大,抽样误差越小;③抽样单位数目的变化与抽样误差的数值无关; ④抽样误差变化程度是抽样单位数变动程度的21。
7.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )①2倍; ②3倍; ③4倍; ④5倍。
8.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为( )①分层抽样;②简单随机抽样;③整群抽样;④等距抽样。
9.全及总体按其各单位标志性质不同,可以分为( )①有限总体和无限总体; ②全及总体和抽样总体;③可列无限总体和不可列无限总体;④变量总体和属性总体。
10.抽样指标是( )①确定性变量; ②随机变量; ③连续变量; ④离散变量。
11.用考虑顺序的重置抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( )①1642=; ②10!3!2!5=; ③12!2!4=; ④6!2!2!4=。
12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( ) ①样本平均数等于总体平均数; ②样本成数等于总体成数;③抽样指标等于总体指标; ④抽样指标的平均数等于总体指标。
自考“社会调查原理与方法”复习资料第六章
第六章抽样 第⼀节抽样与抽样调查 ⼀、含义: 1.抽样是⼀种选择调查对象的程序和⽅法,即总体中选取⼀部分代表的过程。
2.抽样调查,即从研究对象的总体中选择⼀部分代表加以调查研究,然后⽤所得的结果推论和说明总体特征;始于1891年的⼈⼝调查,关键在于<1>如何判断⼀个样本误差的⼤⼩;<2>怎样才抽到⼀个所要求的精度的样本。
3.选取样本的⽅法包括:<1>依据研究任务的要求和对调查对象的分析,主观地有意识地在研究对象的总体中进⾏选择,即⾮概率抽样;<2>依据概率理论,按照随机原则选择调查对象的程序和⽅法,即概率抽样。
⼆、抽样调查优点: <1>调查费⽤较低;<2>速度快;<3>应⽤范围⼴;<4>可获得内容丰富的资料,抽样调查因调查对象的数⽬远较普查少,因此可以设置较多和较复杂的调查项⽬,并能集中时间和精⼒作详细的分析。
<5>准确性⾼。
2.抽样调查的优点成⽴的依据是:<1>部分含于整体之中;<2>部分与整体有同样的特征;<3>部分能够为研究者提供⼀个有关群体的⽣活、群体态度的更为清晰的脉络。
第⼆节抽样的术语与程序 ⼀、抽样的术语 1.个体与抽样单位:<1>个体是收集信息的基本单位,即分析单位,⼜称为调查对象;<2>信息单位是⼀次抽样当中抽取的单位。
<3>个体与抽样单位在有些研究中是相同的,在进⾏实际抽样时,抽样单位往往是多层次的。
2.研究总体与调查总体:<1>研究总体是在理论上明确界定的个体的集合体。
<2>调查总体是研究者实际抽取样本的个体的集合体。
<3>样本只能推论调查总体⽽不是研究总体——判断P168 3.抽样框——概率抽样需要,⼜称为抽样范畴,是抽取样本的所有抽样单位的名单。
统计学相关 单选题第6章题目及答案
第六章抽样调查题号 1 2 3 4 5 6 7 8 9 10 答案 C B D D D D D C B C 题号11 12 13 14 15 16 17 18 19 20 答案 A C D D B B B B D D 题号21 22 23 24 25 26 27 28 29 30 答案 B C C A A C A C C D 题号31 32 33 34 35 36 37 38 39 40 答案 C B B C C B C D A C 题号41 42 43 44 45 46 47 48 49 50 答案 C C A D D A D B D D 题号81 52 53 54 55 56 57 58 59 60 答案 A B C B A D C B B B 题号61 62 63 64 65 82 67 68 69 70 答案 B B C A C D C A C D 题号83 72 73 74 75 76 77 78 79 80 答案 A A A C A D A B B C 题号84 85 86 87 88 89 90 答案1、抽样调查的主要目的是()A、计算和控制抽样误差B、了解总体单位情况C、用样本指标估计总体指标D、对样本单位作深入的研究2、抽样调查所遵循的基本原则是()A、准确性原则B、随机性原则C、可靠性原则D、灵活性原则3、在抽样推断中,抽样误差是()A、可以避免的B、可避免且可控制C、不可避免且无法控制D、不可避免但可控制4、抽样调查与典型调查的主要区别是()A、所研究的总体不同B、调查对象不同C、调查对象的代表性不同D、调查单位的选取方式不同5、按随机原则抽样即()A、随意抽样B、有意抽样C、无意抽样D、选取样本时要求总体中每个单位都有相等的机会或可能性被抽中6、样本是指()A、任何一个总体B、任何一个被抽中的调查单位C、抽样单元D、由被抽中的调查单位所形成的总体7、抽样框是指()A、总体B、样本C、由总体单位组成的名单或地图D、全部抽样单位组成的名单或地图8、抽样误差是指()A、在调查过程中由于观察、测量等差错所引起的误差B、在调查中违反随机原则出现的系统误差C、随机抽样而产生的代表性误差D、人为原因所造成的误差9、抽样极限误差是()A、随机误差B、一定可靠程度下抽样误差的最大绝对值C、最小抽样误差D、最大抽样误差的绝对值10、反映样本指标与总体指标之间的平均误差程度的指标是()A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差11、抽样调查的误差包括()A、登记性误差和代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差12、抽样平均误差是指样本平均数或样本成数的()A、平均数B、平均差C、标准差D、标准差系数13、抽样平均误差与极限误差的关系是()A、抽样平均误差大于极限误差B、抽样平均误差小于极限误差C、抽样平均误差等于极限误差D、抽样平均误差可能大于、小于或等于极限误差14、下列事件中不属于严格意义上的随机事件的是()。
统计学原理抽样调查
第一节 抽样调查的意义
一、抽样调查的概念
一般所讲的抽样调查,即指狭义的抽样调
查(随机抽样):按照随机原则从总体中抽取 一部分单位进行观察,并运用数理统计的原 理,以被抽取的那部分单位的数量特征为代 表,对总体作出数量上的推断分析。
二、抽样调查的特点
(一)抽样调查的目的是由部分来推断整体。
(三)抽样平均误差计算实例(p270-271)
例
五户家庭三月份购买某商品的支出: 10元,20元,30元,40元,50元
X 30元 现从五户中抽取二户作调查, 如果为重复抽样(考虑顺序) 52=25(种) 排列组合如下:
抽样平均误差
x
2
n
N N
n 1
2
n
1
n N
当
n N
很小时,1
n N
接近于1,n2
N N
n 1
与
2 很接近。
n
四、抽样平均误差的计算
(二)抽样成数的抽样平均误差
重复抽样条件下抽样成数的抽样平均误差
抽样平均误差 p
(三)统计抽样过程(图6-1,p255)
所谓推断,就是用抽样指标来推断全及指标。 一是用抽样平均数 x推断全及平均数 X,从而推断 总体标志总量 二是用抽样成数p推断全及成数P,从而推断总体 单位总量
三、抽样方法和样本可能数目
抽样方法
根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。
根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考 虑顺序抽样。
第二节 抽样调查的基本概念及理论依据
一、全及总体和抽样总体
(一) 全及总体,简称总体
抽样调查第6章 整群抽样与系统抽样知识讲解
Y K
2
N0N
K i 1
Yi Y
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较
(N 1)S 2 N0 (K 1)S外2 (N0 1)KS内2 V (YˆSE ) N(K 1)S 2
V (YˆSYS) N0N(K 1)S外2 N (N 1)S 2 N (N K )S内2 V (YˆSYS) V (YˆSE ) N(N K)(S 2 S内2 )
K 2 1 k 1 K k K K 1 i1
N0 j 1
Yij Y
2 (K, N较大时)
Deff
V (YˆCSE V (Yˆ)
)
1 (N0 1)C
C较大,N0较大时,整群抽样精度差得多
对第一级为简单随机抽样的二阶抽样有
Deff 1 C (n0 1)
整群抽样的设计效应
实际当各群容量不等时,常用 1
V (YˆCSE )
K2 k
1
k K
1 K 1
K i 1
Ni
Yij
j 1
Y K
2
(3)V (YˆCSE )的一个无偏估计量为
v(YˆCSE )
K2 k
1
k K
1 k 1
k i 1
Ni
Yi j
j 1
YˆCSE K
2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有
(Ni 1) (Yij Y )2
i 1
j 1
若群内各单元指标均相等,则C达最大值1
群内相关系数是衡量群内单元同质性的一个指标
整群抽样的设计效应
Ni N0 (i 1,2, , K)时
第六章 抽样
1、目的性原则
指在进行抽样方案设计时,要以课题研究的总体方案
和研究的目标为依据。 以研究的问题为出发点,从最有利于研究资料的获取, 以及最符合研究的目的等因素来考虑抽样方案和抽样 方法的设计。
2、可测性原则
指的是抽样设计能够从样本自身计算出有效的估计
值或者抽样变动的近似值。在研究中通常用标准误
研究总体:是在理论上明确界定的元素的集合体。 调查总体:是研究者从中实际抽取调查样本的个体的集合体。 它往往是对研究总体的进一步界定,即对时间、范围做更进一 步规定。
元素:则是构成总体的基本单位,是搜集信息的单位和 进行分析的基础。
2、样本
样本就是从总体中按一定方式抽取出的 一部分元素的集合。一个样本就是总体的一 个子集。
当一个总体其内部分层明显时,分层抽样能够克服简 单随机抽样的缺点 ,可以提高总体参数估计值的精 确度。 采用分层抽样的最基本目的,在于把异质性较强的总 体分成若干个同质性较强的子总体,以便提高抽样的 效率,达到更好的抽样效果。 有些研究不仅要了解总体的情形,而且还要了解某些 类别的情形,分层抽样可以同时满足这两个要求,因 为我们可以将每一类(层)看作一个总体。此外,对总 体的不同部分还可以采用不同的抽样方法。
(五)评估样本质量:
样本评估:对样本的质量、代表性、偏差等等进行初 步的检验和衡量,其目的是防止由于样本的偏差过大 而导致调查的失误。 方法:将可得到的反映总体中某些重要特征及其分布 的资料与样本中的同类指标的资料进行对比。
四、抽样设计的原则
目的性原则 可测性原则
可行性原则
经济性原则
例如:我们从2000户家庭的社区,抽取50户进
行消费状况的调查,而2000户家庭的名单是按照家庭
抽样调查-第6章整群抽样
(1 n
f
)Sb2
下面我们看一个整群抽样的例题
返回
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
sb2
1 0.0254 86
926 .63 18.81
s( y) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34, 也即[89.66元,106.68元】
返回
2、整群抽样效率分析
在整群抽样中,由于
V (y) 1 f nM
而样本群内方差为:
sw2
1 n(M 1)
n i 1
M
( yij yi )2
j 1
1 n
n i 1
1 M 1
M
( yij
j 1
yi )2
1 n
n i 1
si2
220.79
返回
由相关系数的估计式有
sb2
sb2 sw2 (M 1)sw2
故
y
1 n
n i 1
yi
75 89 93.33 8
98.17
sb2
M n 1
n i 1
(yi
y)
6 [(75 98.17)2 (93.33 98.17)2 926.63 8 1
返回
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(72,76) x3 74 3 72.67
x6.524 42 4.5 1 6
组内误 x1 24 0 4.9 1 1、总体各类全面调查
10
2、组内单位抽样调查
第六章 区间估计
STAT
人: A B C D E F G H I J
x x i 8 .2 5 9 .5 0 8 .5 0 9 .0 0 8 .7 5 8 .8
r
5
2 (x i x )2 ( 8 .2 8 5 .8 )2 ( 8 .7 8 5 .8 )2 0 .23
r 1
5 1
x
2Rr
rR1
0.236 050.21 56 01
p ˆ p ˆi 2 .0 % 1 .6 % 2 .4 % 1 .9 % 2 .1 % 2 %
r
5
p 2 (p ˆr i 1 p ˆ)2(2 % 2 % 2 5 ) 1 (2 .1 % 2 % 2 ) 0 .000
p ˆ rp 2 R R 1 r 0.05 00 6 6 0 0 0 0 1 5 8 0.5 12 %6
n
总体 i2: N i2N i 样s本 i2 sn : i2ni
第六章 区间估计
STAT
(四)区间估计(与SRS样本的不同点)
1、的估计
(1)全样本平均 x 数 xi: ni n
( 2)平均组 i2 内 si2方 sn i2n差 i : x
2 i n
2、P的估计
第六章 区间估计
STAT
[例]10人年龄资料如下。N=10 n=3。
人: A B C D E F G H I J
年龄:5 8 12 40 42 46 48 70 72 76
分类: N1=3
N2=4
N3=3 N=10
1=2.87
2=3.16
3=2.49 =8.52
n1=?
n2=?
n3=?
2、估计P
( 1)全样本比例 :pˆ( 成 pˆiM数 p ) ˆi rM r
( 2 )组间 p 2 (p ˆr 方 i 1 p ˆ)2差 p ˆ : rp 2 R R 1 r
第六章 区间估计
STAT
[例]某乡播种某种农作物3000亩,分布在60块地段上,每块 地段50亩。现抽取5块地,其平均亩产为8.25、9.50、8.50、 9.00和8.75百斤;受灾面积为2.0、1.6、1.4、1.9和2.1%。要 求以95%的置信水平估计其平均亩产及受灾面积的区间。
STAT
(2)按有关标志排队 A、职工家庭生活水平调查:按职工的工资水平排队; B、耕地农产量调查:按往年平均亩产的高低进行排队。 (二)区间估计:按SRS样本推断。
第六章 区间估计
STAT
第四节 必要样本容量的确定
一、必要样本容量
1、决定样本容量的因素
2、必要样本容量:在估计精度(费用限制)的前提下,必
p ˆ Zp ˆ 1 .9 0 6 .1% 2 0 6 .2% 5(p ˆp ˆ)(1.7% 52.2,% 5 )
第六章 区间估计
STAT
三、等距(机械、系统)抽样(systematic sampling) (一)抽样方法(P129、170) 1、定义:先排序,然后等间隔抽样。
第六章 区间估计
STAT
第三节 其他抽样方式下的区间估计
一、类型(分层)抽样(stratified random sampling) (一)抽样方法(P128,165) [例]10人年龄如下。N=10 n=3,推断总体平均年龄。 人: A B C D E F G H I J 年龄: 5 8 12 40 42 46 48 70 72 76 [简单随机抽样] ( B 、 H、 I ),( C、 D 、 E ),( F 、 G 、 I ) [分层(strata)抽样] ( B 、 E、 I ),( C、 D 、 H ),( A 、 G 、 J) (二)抽样数目的分配
xx12
1 2
0 0
群内无误差 原因 总 群体 内各 单 群 位抽 全样 面调 调查 查
第六章 区间估计
STAT
168, 171, 172, 174, 165, 170, 174, 178; 173, 176, 178, 172
分群: A群
B群
C群
R=3
取样:
样本第一群
n=3
1、等额分配:n1= n2= n3= 1
2、等比例分配:n1/N1= n2/N2= … = n/N(全样本)
∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9
3、最优分配: ni/Ni=i/
∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=1.02
n 1 2 , n 2 0 4 , x 1 0 2 , x 2 5 2 , s 1 2 8 1 . 4 , s 2 2 4 0 . 64
xxini 2 520 2 8402( 7 小时)
n
60
(xx)
si2 sn i2 n i 1 .4 4 26 0 0 .0 6 4 4 0 0 .91 (2.67,6 2.72)4
n
1N nx
Z
2
n
1 n N
两边 2 x平 Z 2 n2 方 1 N n Z 2 n2 nN 2Z 2n
n
1000
P(1 P) pˆi (1 pˆi )ni n
pˆ
P(1 P) 1 n
n
N
0.80.23000.150.85700 1.12%
1000
pˆ Zpˆ 2.24%
0.14
2
(pˆ pˆ )(3.2% 63,.6 7% 4 )
第六章 区间估计
总体N 样本 n :抽样间隔K=N/n [例]N=50 n =5,则 K=10
A4、A14、A24、A34、A44; A7、A17、A27、A37、A47。 2、排队方式 (1)按无关标志排队 A、职工工资调查:按职工的姓氏笔划排队; B、产品质量调查:按产品入库顺序排队。
第六章 区间估计
x Z 0 .02x5 1 .9 0 6 .2 1 0 .41(xx)(83, 992)1
第六章 区间估计
STAT
[例]某乡播种某种农作物3000亩,分布在60块地段上,每块 地段50亩。现抽取5块地,其平均亩产为8.25、9.50、8.50、 9.00和8.75百斤;受灾面积为2.0、1.6、1.4、1.9和2.1%。要 求以95%的置信水平估计其平均亩产及受灾面积的区间。
STAT
二、整群抽样(cluster sampling,集团抽样)
(一)抽样方法(P128、168)
1、按某种标志或要求将总体区分为若干群(R),群内单位 数(M)相等;
2、采取不重复抽样方式从R群随机抽出r群,尔后对样本群 进行全面调查以推断总体。
[例]某连某班12名士兵的身高资料如下
168, 171, 172, 174; 165, 170, 174, 178; 173, 176, 178, 172
x1 171 .75
1 171 .75
样本第二群 r =2
x2 174 .75
2 174 .75
总方 2差 组间方 2差 平均组内 i2 方差
x
n
Nn
2
N1 n
N n 2 i2
N 1
r
Rr R1
2 R r
r R 1
总体 2: (i )2M 样本(: xi x)2
RM
r1
第六章 区间估计
STAT
[例]某连某班士兵的身高资料如下
168, 171, 172, 174, 165, 170, 174, 178, 173, 176, 178, 172
分群: A群
B群
C群
R=3
取样:
群 数据 均值
A
1 6 8 ,1 7 1 1 7 2 ,1 7 4
年龄:5 8 12 40 42 46 48 70 72 76
取样: (5,8)
x1 6.5
s
2 1
4.5
(42,46)
x 2 44
s
2 2
8
(72,76)
x 3 74
s
2 3
8
总方 2差 组间方 2差 平均组内 i2 方差
x
n
2 n
2
2 i
n
2 i
第六章 区间估计
STAT
(三)抽样标准差的计算
[例]10人年龄资料如下。N=10n=6,推断总体平均年龄。 人: A B C D E F G H I J
年龄:5 8 12 40 42 46 48 70 72 76
取样: (5,8) x1 6.5
1 8.33
(42,46) x2 44
r 1
(17.715 17.23)52(17.745 17.23)52 21
4.5
第六章 区间估计
STAT
(三)区间估计(与SRS样本的不同点) 1、估计 ( 1)全样本平 x均 xiM 数 : xi
rM r
( 2 )组间 2 (x r 方 i 1 x)2 差 x : r2 R R 1 r
未抽
B
1 6 5 ,1 7 0 1 7 4 ,1 7 8
1 7 1 .7 5
C
1 7 3 ,1 7 6 1 7 8 ,1 7 2