第7章 抽样调查
第七章 抽样调查技术
13
一、简单随机抽样
(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;
第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
5
2015/12/22
(二)样本总体
概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。
2015/12/22
23
三、分层抽样
(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24
假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因
原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。
(抽样检验)第七章整群抽样最全版
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
统计学原理第七章 抽样调查
合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
抽样调查-第7章 系统抽样
三、总体单元的排序
系统抽样时N个总体单元的排序情况 大致有以下三种:
(1)按无关标志排队 (2)按有关标志排队
(3)介于上述两者之间
返回
四、系统抽样的优缺点
系统抽样的优点: 1.简便易行,容易确定样本单元
2.样本单元在总体中分布比较均匀
系统抽样的缺点: 1.如果单元的排列存在周期性的变化,而抽样 者对此缺乏了解或缺乏处理经验,抽取的样本 的代表性就可能很差。
3,8,13。 7 8 9 10 11 12 6 5 4 3 2
1
13
循环等距抽样
返回
3. 不等概系统抽样法
不等概系统抽样中每个单元的入样概率不相等.最常用 也是最简单的不等概系统抽样是PS 抽样.即入样概率 i 与单元大小 M 成比例的系统抽样.令
i
Mi 表示总体所有单元大小的总和,则 i n M0
Y( n1) k r
yr
Y
yk
nk
返回
令 Yrj
Y( j 1) k r (r 1,2,, k ; j 1,2,, n) 得下表:
1 2
Y12
1 2
Y11 Y21
Y22
r
Yr1
Yr 2
k
层平均
Yk1
Yk 2
j Y Y
M0 Mi
i 1
N
实施不等概系统抽样最简单的方法是代码法: 下面以例7.1来说明 【例7.1】设总体由10个行政村组成,N=10,每个行政村 的人数 M i 见下表.利用PS 系统抽样抽取n=3个行政村.
返回
用PS系统抽样抽选行政村
《统计学原理》课件第七章抽样调查
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序
研
究 原
总体分布 样本分布 抽样分布
理
一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析
第7章 抽样方法
分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
第7章抽样调查和现场调查
(1)随机抽样技术的优点 ①随机抽样是从总体中按照随机原则抽取一部分单 位进行的调查 ②随机抽样技术能够计算调查结果的可靠程度 (2)随机抽样技术的不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员 和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资 料分析。一般调查人员难以胜任。
• (4)分层随机抽样技术
• 又称为分类随机抽样技术,是把调查总体按其属性
不同分为几个层次(或类型)然后在各层(或类型) 中随机抽取样本。
• 【观念应用7-2】 • 某地共有居民20000户,按经济收入高低进行分类, 其中高收入的居民为4000户,占总体的20%,中 收入为12000户,占总体的60%,低收入为4000 户,占总体的20%。要从中抽选200户进行购买力 调查,则各类型应抽取的样本单位数为:经济收 入高的样本单位数目为:200×20%=40(户)经 济收入中的样本单位数目为:200×60%=120(户) 经济收入低的样本单位数目为:200×20%=40 (户) • 【分析提示】样本单位数的抽取是按各种经济收 入的单位数量占总体单位数量的比例进行样本的 抽选。
• (3)分群随机抽样技术 • 分群随机抽样技术,又称整群抽样技术,是把调 查总体区分为若干群体,然后用单纯随机抽样法, 从中抽取某些群体进行全面调查。 • 运用分群抽样技术抽取样本,先要把调查总体区 分为若干个群体,然后用单纯随机抽样法,从中 抽取某些群体进行全面调查。如果不是对所抽取 的群体进行全面调查,而是进一步划分为若干个 小群体,再按随机原则抽取一个或一部分小群体 来调查,称为多段分群抽样。 • 运用分群抽样技术抽取样本,抽选工作比较简易 方便,抽中的单位比较集中,但是由于样本单位 集中在某些群体,而不能均匀分布在总体中的单 位,如果群与群之间差异较大,则抽样误差就会 增大。
第七章抽样调查
总体中有N个个体
将总体所有个 以群为单以元选在中总群中体的分所成若干群 体中抽取有若个干体群组成样本
整群抽样图示
第三节 抽样误差
一、抽样误差的含义
由于随机抽样的偶然因素使样本各单位的结构不足以 代表总体各单位的结构,而引起抽样指标和全及指标 之间的绝对离差。
例如,估计粮食平均亩产500公斤,允许误差范围 为10公斤,这就意味着亩产在490-510之间都是有效的 。490-510又称估计区间。允许误差范围与估计值之比 称为误差率,(1-误差率)称为估计精度。如本例误 差率=2%,估计精度=98%。
总体中有N个个体 将总体中个体按某一标志排 序,并均分成n个部分。
在第一部分中随机地抽取一个, 然后每隔相同的距离抽取一个, 直到抽完n个为止。
等距抽样图示
四、整群抽样
将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的
抽样组织形式。又称区域抽样或分群抽样。
整群抽样对被抽中群体的所有单位都作调查,因此 抽样平均误差不再受群内方差的影响,而受群间方 差和抽样数目的影响。整群抽样采用不重复抽样方 法抽取样本。
将总体中每个单位编上号码,然后
⑶随机数码表法 使用随机数表,查出所要抽取的调
查单位。
二、类型抽样
先对总体各单位按主要标志加以分组,然后再从各
组中按随机原则抽选一定单位构成样本。或称分 类抽样、分层抽样
样本抽取方法
(1)等比例类型抽样法(类型比例抽样法)
(2)不等比例类型抽样法(类型适宜抽样法) 在类型比例抽样中,首先要对总体作分类(组)。再 从每类(组)中随机抽取样本。所以不存在组间误差, 抽样平均误差取决于各组内方差的平均水平。
经济统计学第7章抽样调查
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15
(抽样检验)第七章第一次课抽样原理与方法
(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。
调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。
例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。
由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。
同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。
为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。
调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。
例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。
同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。
(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。
例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。
(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。
调查项⽬确定的正确与否直接关系到调查的质量。
因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。
应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。
例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。
调查项⽬有⼀般项⽬和重点项⽬之分。
⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。
第7章 抽样调查及答案
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
第七章市场调查方式(抽样技术)
具体做法: A、抽签法(有重复和不重复抽样两种选择)
先给调查总体的每个单位编号,然后将号码写在卡片上搅拌均匀, 任意从中抽选,抽到一个号码,就对上一个单位,直到抽足预先 规定的项目为止。适用于总体单位较少的情况。
B、乱数表(随机数表)法 优点:完全排除了抽样中主观因素的干扰、简单易行 缺点:在调查总体单位差异小(同质总体)情况下,调查结果 具有代表性,否则会产生较大误差 适用范围:总体单位明确、总体单位数较少、总体各单位间差 异程度较小
14
1
合 计
1 30
50
20
100
第四步:具体抽样 优点:较简单易行、准确度较高;节省费用, 能较快地获得市场信息 缺点:若调查者对调查总体不了解,会产生较 大误差 适用范围:调查者对调查总体了解
(二)随机抽样
严格按随机原则从调查总体中 抽取样本单位的调查方式。
1、简单随机抽样(纯随机抽样)
含义:在总体单位中,不进行任何有目的 的选择,完全按随机原则抽取样本单位 的方式。
具体做法:
第一步:对样本总体进行分类; 第二步:确定每类样本的分配数额; 第三步:编制样本交叉配额分配表; 第四步:具体抽样 仍以上例为例,采用相互控制配额抽样 第一步、第二步(略) 第三步:编制样本交叉配额分配表
高收入 民族 汉 族 回 族 其他民族
中收入
低收入
合计
21 8
35
14 6 0
70 28 2
2、分层随机抽样(类型随机抽样、分类 随机抽样)
( 1 )含义:将总体单位按某一标准(有关标 志)分组,然后在各个类型组中,按随机原 则抽取样本单位的方式。 (2)具体做法: 第一步:选择有关标志对总体进行划分; 第二步:确定各组的样本分配数额 方法:等比例和不等比例 等比例:ni = n× (Ni / N) 不等比例: ni = n×(Ni· Si /∑Ni· S i)
第七章抽样习题
一、填空题1.总体参数估计有和两种。
2.抽样调查的组织方式一般有、、和四种。
3.样本指标是一个变量。
4.在简单随机抽样条件下,抽样误差受、和、等因素的影响。
5.在其他条件不变的情况下,抽取单位越多,抽样平均误差。
6.类型抽样的抽样平均误差受方差的影响,而整群抽样的抽样平均误差受方差的影响。
7.抽样调查是按原则抽取样本,用推断的一种非全面调查。
8. 在假设检验中,第Ⅰ类错误就是弃真错误,弃真是指_____状况;第Ⅱ类错误就是纳伪(取伪)错误,纳伪是指______状况。
9.抽样成数是指样本中具有某一标志表现的占的比重。
10.抽样方法按抽取样本的方式不同分为和。
11、正态总体均值的假设检验,H0:u =u0,H1:u≠u0,若总体方差已知,样本量为n,则其检验的统计量为_______,其公式为_________,若显著性水平为a,接受域为_________。
12、假设检验中若其他条件不变,显著性水平a的取值越小,接受H0的可能性______,原假设为真而被拒绝的概率____。
13、假设检验是利用_____资料来检验事先对总体某些数量特征所作的____是否可信的一种统计分析方法。
14、在假设检验过程中,依据显著性水平a 的大小把概率分布划分为两个区间:小于给定标准的概率区间称为_____;大于给定标准的概率区间称为_____。
15、假设一般包括两部分即___和____。
二、判断题1.抽样误差大小与总体各单位标志值的差异程度成正比。
()2.抽样误差大小与样本单位数目的平方根成反比。
()3.不重复抽样的抽样误差小于重量复抽样的抽样误差。
()4.抽样误差范围是一个绝对可靠的范围。
()5.抽样单位数越多,抽样误差越大。
6.通常所说的抽样误差一般是指抽样平均误差。
()7.抽样误差是人的主观因素造成,因此应该避免。
()8.如果不知道总体方差或标准差,就无法计算抽样平均误差。
()9.整群抽样一般采取不重复抽样。
10.纯随机抽样时,所有可能的样本平均数的平均数等于总体平均数。
第7章抽样调查
二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E
如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u
1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。
07章抽样调查基础知识
1.14%
n
150
若按不重复抽样方式:
p(1p) n 0.98(10.98) 150
p
(1 )
(1 )1.137%4
nN
150
15000
三、抽样误差的允许范围
(一)抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与
总体指标之间抽样误差的可能范围。
x x X p pP 将上式等价转换为下列不等式:
抽样误差
一、抽样误差的概念 (一)代表性误差
代表性误差是指在抽样调查中,用部分样 本推断总体时,由于样本各单位的结构情况不 足以代表总体状况而产生的误差。
代表性误差有两种:系统误差和随机误差。
1、系统误差是指破坏了抽样的随机原则而产生 的误差。例如有意识的选取好的单位或较差单 位进行调查造成的误差。
4、抽样组织方式(分层抽样误差较小,整群抽 样误差较大)。
二、抽样平均误差的计算 (一)样本平均数的抽样的平均误差
的计算 重复抽样条件下:
不重复抽样条件下:
(二)样本成数的抽样平均误差的计算 重复抽样条件下: 不重复抽样条件下:
(三)总体方差未知时的解决办法 1.用样本方差、成数代替 2.用过去的资料代替 3.用估计值代替 4.用小规模试验性调查资料代替 见书例2.
例:
某灯泡厂从一天所生产的产品10,000个 中抽取100个检查其寿命,得平均寿命为 2000小时,根据以往资料:σ =20小时, 分别按重复抽样和不重复抽样求抽样平 均误差
重复抽样平均误差为:
202 202(小时 )
x 100 100
不重复抽样平均误差为: x
400(1 100 ) 1.99(小时) 100 10000
抽样调查习题集答案
抽样调查习题集答案篇一:2015年《统计学》第七章抽样调查习题及满分答案2015年《统计学》第七章抽样调查习题及满分答案一、单选题1. 反映样本指标与总体指标之间抽样误差可能范围的指标是(B)。
A、样本平均误差B、抽样极限误差C、可靠程度D、概率度2.在其它条件不变的情况下,抽样单位数目和抽样误差的关系是( B )。
A.抽样单位数目越大,抽样误差越大B.抽样单位数目越大,抽样误差越小C.抽样单位数目的变化与抽样误差的数值无关D.抽样误差变化程度是抽样单位数变动程度的1/23.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为(D)。
A、分层抽样B、简单随机抽样C、整群抽样D、等距抽样4.在同样条件下,不重置抽样的抽样平均误差与重置抽样的抽样平均误差相比(A)。
A、前者小于后者B、前者大于后者C、两者相等D、无法判断5.如果总体成数方差未知,计算必要抽样数目时,可用总体方差的最大值,最大值为( B )。
A、0.24B、0.25C、0.50D、1 6.抽样估计的置信度是(C )A.概率度B.区间范围的大小C.概率保证程度或置信概率D.与概率度无关的量7.随机抽样的基本要求是严格遵守(B)A、准确性原则B、随机性原则C、代表性原则D、可靠性原则8.抽样调查的主要目的是(D)A.广泛运用数学方法 B.计算和控制抽样误差 C.修正普查资料D.用样本指标推算总体指标9. 抽样调查中(A )A、既有登记性误差,也有代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差10.要使抽样误差减少一半(在其它条件不变的情况下),则抽样单位数必须( D )。
A、增加2倍B、增加到2倍C、增加4倍D、增加到4倍11.抽样平均误差反映了样本指标与总体指标之间的(C )A、实际误差B、实际误差的绝对值C、平均误差程度D、可能误差范围12.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( A )A、抽样单位数占总体单位数的比重很小时B、抽样单位数占总体单位数的比重很大时C、抽样单位数目很少时D、抽样单位数目很多时13.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将( C )。
第七章 抽样调查
第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。
简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。
2、抽样调查的特点⑴随机原则。
所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。
也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。
⑵从数量上推算全体。
抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。
⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。
3、几个概念⑴总体也称为母体、一般总体等。
是指具有某种统计特征的一类事物的全部个案。
也即,研究对象的全体称为总体。
例如,某批产品、某类病人、某个生产过程等。
总体的单位数通常用符号N来表示。
⑵个体也称为个案、元素。
组成总体的每个元素称为个体。
有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。
⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。
也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。
总体是大群体,样本是小群体。
在社会研究中,资料的收集工作往往是在样本中完成的。
样本的单位数(即样本容量)常用符号n来表示。
⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。
(5)抽样单位就是一次直接的抽样所使用的基本单位。
吉珠统计学期末考试重点第7章 抽样及抽样分布
x
时, f (x) 的曲线以 x 轴为渐近线。
第七章 抽样调查
4. 标准正态分布
标准正态分布的概率密度函数为:
1 ( z) e , <z< 2
若随机变量 Z 服从标准正态分布, 则记为 Z~ (0, 1)
z2 2
1. 任何一个一般的正态分布,可通过下面的 线性变换转化为标准正态分布
总体均值的区间估计
(一) 大样本时总体均值的区间估计
第七章 抽样调查
例:某企业生产A产品的工人有1000人, 某日采用不重复抽样从中随机抽取100人调查 他们的当日产量,样本人均产量为35件,产量 的样本标准差为4.5件。请以95.45%的臵信度
估计该日人均产量的臵信区间。
解:①计算抽样平均误差
x 0
x a
第七章 抽样调查
标准差 决定密度函数曲线 f (x) 的陡缓程度.
0.5
1
2
第七章 抽样调查
3. 正态分布密度函数的特点
(1) 对称性。 (2) 非负性。
(3) f (x) 在 X x 时达到极大值 f(x ) 1 2
(4) f (x) 的曲线在 X x 处有拐点。 (5 )当
Z X
x2 2
~ N (0,1)
2. 标准正态分布的概率密度函数
1 ( x) e 2 , x
3. 标准正态分布的分布函数 t2 x x 1 -2 ( x) (t )dt e dt 2
第七章 抽样调查
标准正态分布, 具有如下性质或结论:
③计算抽样极限误差
由 1 ) 0.95 ,查t分布表得, (
t n 1 t 2.5% (9)=2.2622
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N n n x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的臵信度。
抽样的极限误差越大,抽样估计的臵信度也越大。
抽样估计又可区分为点估计和区间估计。
按估计的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。
二、难点释疑1.要区分样本可能数目与必要抽样数目。
样本可能数目是指从总体N 中抽取一个样本容量为n 的子样最多有多少种抽法,一般用M 表示。
而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多少个单位作样本,是样本容量(n )的另一种表现形式。
2.大数定律、正态分布理论、中心极限定理都是假定从N 中抽取一个样本容量为n 的子样,把所有的样本都抽到(有M 种抽法)之后进行验证的,在实际工作中不可能办到。
只能用样本的相应指标去推测总体的相应指标。
这些理论只是为了验证抽样推断的科学性。
3.在实际工作中往往是以重复抽样的方法确定必要抽样数目,以不重复抽样的方法来抽取调查单位,进行计算估计,而又用重复抽样的误差公式来计算误差,一方面是计算公式简单,另一方面,这样计算的误差比实际存在的误差大,便于提高抽样推断的可靠性。
4.在抽样调查中总体的方差是未知的,一般都用样本的方差来代替。
对于抽样成数来说,当p=0.5时,抽样成数的方差取极大值0.25。
三、练习题(一)填空题1.抽样调查是建立在()上的一种科学的调查方法。
它是从研究对象中()部分单位进行调查,以其达到对()的认识,并可对()进行计算和控制。
2.样本中所包含的总体单位数称为(),通常记为n,当n()时称为大样本。
3.在抽样调查中总体指标是(),而样本指标则是随机的。
4.对确定的总体来说,可能的样本数目与()有关,也与()有关。
5.一般地说,用抽样指标估计总体指标应该有三个要求。
这三个要求是()、()、()。
6.常用的抽样方法有()抽样和()抽样;()抽样和()抽样。
7.常用的抽样组织形式有()、()、()、()、()。
8.抽样平均误差就是抽样平均数(或抽样成数)的()。
它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。
9.抽样误差是一个(),抽样平均误差是一个()。
前者是在不考虑()条件下,抽样估计值与被估计的真实总体参数之差;后者反映抽样平均数(成数)与总体平均数(成数)的()。
10.影响抽样误差大小的因素有:()、()、抽样方法和()。
11.对于同一种抽样组织形式来讲,重复抽样的平均误差()不重复抽样的平均误差。
当()很小时,可以用重复抽样的平均误差公式来近似计算不重复抽样的平均误差。
12.在其它条件不变的情况下,极限误差增大,则概率度(),可靠程度()。
13.在缺少总体的方差时,可用()代替来计算抽样误差。
14.抽样极限误差是指抽样指标与总体指标之间抽样误差的()。
抽样极限误差通常以()为标准单位来衡量。
(二)名词解释1.随机性原则2.抽样误差3.样本4.抽样平均误差5.抽样极限误差6.区间估计7.重复抽样8.不重复抽样(三)判断题1.抽样调查就是凭主观意识,从总体中抽取部分单位进行调查。
()2.抽样法不仅是对被研究总体有关指标进行科学推算的方法,而且是搜集统计资料的方法。
()3.抽样调查中的随机误差是可以避免的。
()4.所有可能的样本平均数的平均数等于总体的平均数。
()5.抽样误差是不可避免的,但人们可以调整总体的方差的大小来控制抽样误差的大小。
()6.缩小抽样的极限误差便会降低推断的把握程度。
()7.由于抽样调查中既有登记性误差又有代表性误差,所以只有登记性误差的全面调查准确性高。
()8.重复抽样和不重复抽样是抽取样本的两种方法,各抽样组织方式都可以使用这两种方法。
()(四)单项选择题1.随机抽样的基本要求是严格遵守()A、准确性原则B、随机性原则C、代表性原则D、可靠性原则2.抽样调查的主要目的是()A、广泛运用数学方法B、计算和控制抽样误差C、修正普查资料D、用样本指标来推算总体指标3. 抽样调查中()A、既有登记性误差,也有代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差4.要使抽样误差减少一半(在其它条件不变的情况下),则抽样单位数必须()。
A、增加2倍B、增加到2倍C、增加4倍D、增加到4倍5.抽样平均误差反映了样本指标与总体指标之间的()。
A、实际误差B、实际误差的绝对值C、平均误差程度D、可能误差范围6.反映样本指标与总体指标之间抽样误差可能范围的指标是()。
A、样本平均误差B、抽样极限误差C、可靠程度D、概率度7.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是()A、抽样单位数占总体单位数的比重很小时B、抽样单位数占总体单位数的比重很大时C、抽样单位数目很少时D、抽样单位数目很多时8.在其它条件不变的情况下,抽样单位数目和抽样误差的关系是()。
A、抽样单位数目越大,抽样误差越大B、抽样单位数目越大,抽样误差越小C、抽样单位数目的变化与抽样误差的数值无关D、抽样误差变化程度是抽样单位数变动程度的1/29.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为()。
A、分层抽样B、简单随机抽样C、整群抽样D、等距抽样10.在总体内部情况复杂,而且各单位之间差异程度较大,单位数目又多的情况下,宜采用()。
A 、简单随机抽样B 、类型抽样C 、等距抽样D 、整群抽样11.用考虑顺序的重臵抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( )。
A 、1642=B 、10!3!2!5=C 、12!2!4=D 、6!2!2!4=12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( )。
A 、样本平均数等于总体平均数B 、样本成数等于总体成数C 、抽样指标等于总体指标D 、抽样指标的平均数等于总体指标13.在同样条件下,不重臵抽样的抽样平均误差与重臵抽样的抽样平均误差相比( )。
A 、前者小于后者B 、前者大于后者C 、两者相等D 、无法判断14.当可靠程度大于0.6828时,抽样极限误差( )。
A 、大于抽样平均误差B 、小于抽样平均误差C 、等于抽样平均误差D 、与抽样平均误差的大小依样本容量而定15.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将( )。
A 、保持不变B 、随之扩大C 、随之缩小D 、无法确定16.如果总体成数方差未知,计算必要抽样数目时,可用总体方差的最大值,最大值为( )。
A 、0.24B 、0.25C 、0.50D 、1(五)多项选择题1.抽样调查适用于下列哪些场合( )。
A 、不宜进行全面调查而又要了解全面情况B 、工业产品质量检查C 、调查项目多、时效性强D 、只需了解一部分单位的情况E 、适用于任何调查2.下列哪些调查中存在系统误差( )。
A 、抽查某车间产品质量时将两名徒工的产品排除在外B 、某县用等距抽样调查农户收入时决定:如果中选户户主不在家,则以该户下一户顶替,已知不在家的农户多为外出经商者C 、为了了解学生健康情况而做的普查D 、将学生按来自城乡分组后采取按比例抽样调查学生开支情况E 、简单随机抽样3.影响抽样误差大小的因素有( )。
A 、抽样单位数的多少B 、总体被研究标志的变异程度C 、抽样组织方式D 、登记误差大小E 、抽到的样本如何4.合理的或优良的抽样估计,要求用抽样指标估计总体指标时,应该满足如下标准,即( )。
A 、无偏性B 、代表性C 、一致性D 、时间性E、有效性5.抽样推断中的抽样误差()。
A、是不可避免要产生的B、可以事先计算C、可通过不同的抽样方式消除D、误差范围可事先控制E、只能事后进行计算6.抽样平均误差是()。
A、所有可能样本平均数的标准差B、所有可能样本平均数的平均差C、抽样推断中作为计算误差范围的衡量尺度D、反映抽样平均数与总体平均数的平均误差程度E、是一种系统性误差7.区间估计的基本要素有()。
A、平均误差B、概率度C、修正系数D、点估计值E、误差范围8.抽样调查的数理依据主要有()。
A、回归分析B、大数定律C、中心极限定理D、误差分布理论E、相关分析9、与典型调查相比较,抽样调查的特点有()。
A、理论基础是概率论大数法则B、按随机原则抽选调查单位C、抽样误差可以事先计算和控制D、调查单位的选取方法不同E、排除主观因素的影响10.抽样估计的特点是()。
A、在逻辑上运用演绎推理B、在逻辑上运用归纳推理C、在方法上运用不确定的概率估计法D、在方法上运用确定的数学分析法E、结论存在一定的抽样误差(六)简答题1.1.什么是随机性原则?在抽样调查中为什么要坚持随机性原则?2.2.什么是抽样估计?它有什么特点?3.3.什么是抽样误差?影响抽样误差的因素有哪些?4.4.什么叫点估计?什么叫区间估计?5.5.什么是极限误差,它与概率度,抽样平均误差有什么关系?(七)论述题重复抽样与不重复抽样有什么不同?为什么不重复抽样的误差总是小于重复抽样的误差?(八)计算题1.某商店有20名职工,现从中抽取5名职工进行调查。