第四章 整群抽样
第4章整群抽样
1 p nM 1 n ai pi n i 1 i 1
n
1 并令: A N
A
i 1
N
i
1 n a ai n i 1
定理4.2.2 在整群抽样中,若群的大小相等, 且对群进行简单随机抽样,则:
yij , i 1, 2,, n; j 1, 2,, M
总体第i个群的指标总值(简称群和):
Yi Yij , i 1, 2,, N
j 1 M
样本第i个群的指标总值(简称群和):
yi yij , i 1, 2,, n
j 1 M
总体第i个群的指标均值(简称群均值):
记:
总体第i个群中具有某特征的次级单元数: Ai , i 1, 2,, N 样本第i个群中具有某特征的次级单元数: ai , i 1, 2,, n
总体第i个群中具有某特征的次级单元所占比例: Ai Pi , i 1, 2,, N Mi
样本第i个群中具有某特征的次级单元所占比例: ai pi , i 1, 2,, n mi
书上P118例4-1
例 某厂近两年来积压了某种零件100箱,每箱20 只。最近有用户要货,急需估计100箱中有多少报 废零件,以尽快安排生产及时供应用户。现随机抽 取5箱,对箱中的零件全部检查,结果如下表。 (1)对零件的废品率作点估计,并估计其标准差; (2)对100箱中的废品数作点估计,并估计其标准 差。
m0 mi 样本中的次级单元数:
i 1 N
n
1 总体的平均群大小: M N
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
社会学第四章 主要研究方法和抽样技术
一、问卷调查法
问卷调查法(survey)是社会学研究用于收集资料 最常用的方法之一,问卷调查法的基本步骤包括:确定调 查总体、选择抽样方案、设计调查问卷、实施调查、汇总 和录入数据、分析数据,等等。 第一步是识别和确定调查总体。所谓总体,就是所要 研究的对象的全体或所有个体。明确调查总体一是为了掌 握研究对象的总体情况,而是为了确定抽样框架。 第二步是根据抽样总体的特征以及具体研究要求,选 择和确定抽样方案。 第三步,确定选取样本的方案之后,就需要着手设计 调查问卷。问卷作为一种测量工具,在设计过程中,需要 考虑其信度和效度。
深度访谈也是田野调查中获得信息和资料的重要途径 。从访谈对象看,访谈可以划分为个别访谈(individual interview)和群组访谈(focus group)。个别访谈就是访 谈对象是单个个体,而群组访谈就是将若干访谈对象集中 起来同时进行访谈。 从访谈内容组织来看,有可以分为结构访谈和无结 构访谈。结构访谈是一种标准化访谈形式,要求在访谈 程序、访谈内容、提问方式等方面尽可能标准化,减少 主观因素影响。无结构访谈没有事先设计好的程序和内 容,而是围绕访谈主体进行比较自由、深入和细致的交 谈。
四、历史比较法
为了探讨社会现象的发展历史轨迹和变迁规律,社会 学常常采用历史比较和跨文化比较的方法。历史比较法的 资料来源主要有两种:一是政府文献资料,包括政府和机 构文件档案材料、统计资料和其他保存下来的历史资料; 二是民间历史资料,包括民间流传下来的地方史志资料, 以及民间口述史资料。 在历史比较法中,较常用的分析历史资料的方法有: 类比分析法和理想型分析法。类别分析法是指在分类的基 础上对某类现象或事件在不同阶段的表现和特征进行对比 ,并由此类推出现象产生的原因和变化规律。理想型分析 法是韦伯创立。理想类型是一种分析概念或逻辑工具,是 经过高度抽象出来的、反应事务本质特征的分类概念:如 “资本主义精神”、“科层制”等。
第四章整群抽样
1 (M 1)c
上面结果意味着:按同样的样本量(以次级单元计) 整群抽样的方差约为简单随机抽样的方差的 1 (M 1)c 倍。换句话说,为了获得同样的精度,整群抽样的样本 量必须是简单随机抽样的样本量的 1 (M 1)c 倍。
20
第21页/共49页
群内相关系数
NM
2
(Yij Y )(Yik Y )
• Def.1 一般地说,如果总体中所有较小的基本单元可 以以某种形式组成数量较少但规模较大的单元;或反 过来说,每个“大”单元都由若干“小”单元组成, 称这些 “大”单元为初级(抽样)单元(primary sampling unit),“小”单元为次级(抽样)单元 (secondary sampling unit).
Deff = (所考虑抽样设计估计量的方差)/(相同样 本量下简单随机抽样估计量的方差)
18
第19页/共49页
设计效应值愈大,表明它的效率愈低。若deff>1,表明
所考虑的抽样设计的效率不如简单随机抽样;若deff<1,
表明该抽样设计的效率比简单随机抽样高。
在整群抽样中,我们在前面已经指出:如何划分群以
27
第28页/共49页
(3) 若 令为简单随机抽样的样本量 则
nsrs
即可达到整群抽样96户样本量相同的估计精度
Mn nsrs deff
812 20(户) 4.7
28
第29页/共49页
群规模不相等的整群抽样
一、等概抽样,简单估计 二、等概抽样,加权估计 三、等概抽样,比率估计 四、例子
29
8 230,205,187,176,212,253,189,240 211.50 27.48
9 274,208,195,307,264,258,210,309 253.13 44.52
[高等教育]现代社会调查 第四章 抽样
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
第4章-等概率整群抽样和多阶段抽样
4.1.1 定义
整群抽样(cluster sampling)是将总体 划分为若干群,然后以群(cluster)为抽 样单元,从总体中随机抽取一部分群,对 被选群内的所有单元进行调查的一种抽样 技术。
2024/7/17
3
例
欲估计某高校大学生拥有手机数量,大学共有40000 名学生,10000个宿舍(每个宿舍4名学生)。
V (ˆ) E1 E2 (ˆ)2 E1 V2 (ˆ ) E1E2 (ˆ)2 V1 E2 (ˆ) E1 V2 (ˆ )
4.3.3 等概率两阶段抽样的符号说明
表4-5
4.3.4 初级单元(PSU)规模相等的 两阶段抽样
定理4.5 对于初级单元规模相等的两阶段抽样 ,如果两个阶段都是简单随机抽样,且对每个 初级单元,第二阶抽样是相互独立进行的,则 对总体均值 Y 的无偏估计为:
定理 4.1:y 是 Y 的无偏估计,即
Ey Y
定理 4.2: y 的方差为:
V ( y) 1 f n
1N N 1 i1
Yi Y
2
1 f nM
Sb2
定理 4.3:V ( y) 的样本估计为:
v( y) 1 f nM
sb2
Yˆ NMy V (Yˆ) V (NMy) N 2M 2V ( y) v(Yˆ) N 2M 2v( y)
(NM 1)(M 1)S 2
用简单随机抽样方法抽取n个群,每个群内的M个
单元全部进入样本,则等群抽样均值估计量 y 的方
差可用群内相关系数近似表示
N
2
V (y)
1 V(y) 1 f
Yi Y
i 1
M2
nM 2 N 1
1 f n
(NM 1) M 2 (N 1)
统计基础单元测试第四章抽样技术含答案8K
统计基础单元测试第四章抽样技术一、单项选择题(10题20分)1.在抽样推断中,必须遵循( )抽取样本A.随意原则B.随机原则C.可比性原则D.对等原则2.能够事先加以计算和控制的误差是A.抽样误差B.登记误差C.系统误差D.测量误差3.抽样极限误差与抽样平均误差数值之间的关系是A.前者一定小于后者B.前者一定大于后者C.前者一定等于后者D.以上三种情况都有可能4.某企业连续性生产,为检验产品质量,在24小时中每隔半小时抽取一分钟产品进行检验,这是A.整群抽样B.简单随机抽样C.类型抽样D.纯随机抽样5.概率和概率度之间的对应关系是A.前者大于后者B.前者小于后者C.确定性关系D.不确定6.现随机从某批次日兴灯产品中抽取100件产品,测得平均寿命为2000小时,则样本平均A.100小时B.2000小时C.1900小时D.2100小时7.现随机从某批次日兴灯产品中抽取100件产品,其中优质品率为98%,则样本优质品的成数为A.100%B.98%C.2%D.无法计算8.抽样平均误差反映了样本指标与总体指标间的A.可能误差范围B.平均误差程度C.实际误差D.实际误差的绝对值9.在实际工作中,不重复抽样的平均抽样误差的计算,采用重复抽样的公式的情况是A.n占N比重很小时B.n占N比重很大时C.n很小时D.n很大时10.点估计A.不考虑抽样误差及可靠程度B.考虑抽样误差及可靠程度C.适用于推断的准确性要求高的情况D.无需考虑有效性和一致性二、多项选择题(8题24分)1.以下关于抽样调查说法正确的是A.必须遵循随机性原则B.能以样本数据估计总体数C.能节约调查成本D.需要大量调查经费2.总体A.可以是有限总体B.可以是无限总体C.可以抽取多个样本D.其容量用N表示3.从总体中抽取样本单位的方法有A.随机抽样B.重复抽样C.类型抽样D.不重复抽样4.影响抽样误差的主要因素有A.必须抽样数目的多少B.总体标志变异程度的大小C.不同的抽样组织形式D.抽样周期的长短5.要提高抽样推断的精确度,可采用的方法有A.增加样本单位数目B.减少样本单位数目C.缩小总体被研究标志的变异程度D.改变抽样组织方式6.以下相关公式正确的有A.xμ= B.pμC.pμxμ7.在总体1000个单位中,随机抽取100个单位进行调查,则下列说法正确的是A.样本个数是100个B.样本容量是100个C.是一个大样本D.是一个有100个单位的样本8.对总体平均数进行区间估计时必须掌握的基本数据有A.样本平均数B.样本平均数的抽样误差C.抽样间隔数D.概率度t三、填空题(10题10分)1.概率抽样的组织方式主要简单随机抽样、系统随机抽样、分层抽样和整群抽样等2.通常当样本容量小于30时,称为小3.在抽样调查中,按照随机原则从总体中抽取的那部分组成的整体叫做样本4.总体参数估计的方法有点估计和区间估计两种5.抽样极限误差反映了样本指标与总体指标之间的抽样误差的可能范围6.总体参数通常是一个定值(常量),而样本统计量则随机变量7.总体指标的区间估计必须具备样本指标、抽样平均误差和概率度三个素8.在简单重复抽样条件下,如果其他条件保持不变,仅将误差范围缩小二分之一,则样本容量必须扩大为原来的4倍;若将误差范围扩大一倍,则抽样单位数目将缩小为原来的四分之一四、简答题(10分)1.什么是抽样平均误差?影响抽样平均误差的因素有哪些?答:抽样平均误差是指所有样本指标数值与总体指标数值之差的平均数,即所有样本的抽样估计误差与被估计的未知的真实总体参数值之差的平均数。
统计学复习资料 抽样分布
5、样本容量与样本均值分布的关系
由于样本标准差与总体标准差及样本容量有关: x n 因此,样本容量增大,样本均值标准差变小,从而 使样本分布峰度变高,于是在相同区间内,概率分布线 下的面积变大,提高了样本均值落在该区间的可能性。 ▼注意: 1、所有可能的样本均值的平均数等于总体均值,而 与样本容量无关。 2、点估计往往是在总体方差已知的情况下进行的。
抽样估计方法主要用在下列两种情况: 1、对所考查的总体不可能进行全部测度; 2、从理论上说可以对所考查的总体进行全 部测度,但实践上由于人力、财力、时间等方 面的原因,无法或没有必要(不划算)进行全 部测度。 注意: ●抽样调查必须遵循随机原则。 ●抽样估计只能得到对总体特征的近似测度, 因此,抽样估计还必须同时考察所得结果的 “可能范围”与“可靠程度”。
假如抽取30名,得到样本平均数、标准差和成数是
x
n
x
1554420 30
51814 . 00
s
(x x) n 1
2
325009260
/ 29 3347 . 72
p 19 / 30 0 . 63
则,样本:抽取到的30名中层干部。 统计量:根据样本分布计算的综合指标,是样本变 量的函数。 另注意区分样本容量和样本个数: 样本容量是指一个样本所包含的单位数。 样本个数是指样本的可能数目。
.3
均值和方差
x
i 1
N
i
.2 .1 0
1 2 3 4
2.5
2
N
( xi )
2 i 1
N
1.25 N
样本均值的抽样分布
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
06 第四章 抽样
现在,我们决定从那里开始。可以闭着眼睛随便戳一个数字。也
(二)方法
A 总体元素较少时,类似于抽签方法。
B 总体元素较多时,随机数表法 小总体时 抓阄,抽签, 较大总体时 随机数字表.使用方法. 简单随机样本是概率抽样的理想类型,他从 随机样本的抽取到对总体进行推断有一套健全的规 则.但是当总体所含个体的数目太多时采用这种方法 不仅费事,工作繁杂,而且费用太高.此外当总体内分 类明显时,这种抽样无法按类别特征自动分配样本数, 若想保证样本的代表性,必须增大样本量,从而使整 个工作的工作量增大.
因此,我们在使用系统抽样方法时,一定要注意抽样
框的编制方法。
注意:
总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况
例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,
而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。
抽样间距=2000/50=40
如果两个人选择样本,一个人选择初始号码为3,另一个人选择初 始号码为38,那么肯定前者家庭平均收入远远高于后者。
随机数表中的数码
8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
选用的数码
0906
不选用的原因
后面四位数大于3000
整群抽样
三、群的大小不等时 在许多情况下,总体各群的大小 M是不完全相 i 等,或完全不相等的。若各群的大小相差不大时, 总体参数的估计量可按简单估计或比估计来确定: (一)简单估计
如果群的抽取是简单随机的,则可将每个群的 总和 Yi 看作是第 i 群的指标,于是总体总和
Y
Y
i 1
N
i
的简单估计可依照简单随机抽样的情形来做。
五、整群抽样与分层抽样的比较 综合前面的分析,比较整群抽样和分层抽样 可以发现二者在分组(层或群)的条件、调查的 方式、分组(层或群)的目的、分组(层或群) 的原则、总体方差的分解等方面都存在着较为明 显的差别。
第二节
等概率整群抽样的情形
一、群的大小相等时 (一)估计量 整群抽样是以群为单位进行抽样,如果群的 抽取是简单随机的,则当群的大小都相等时,可 以将简单随机抽样理解为是一种特殊的整群抽样, 特别当总体分群后的每个群都只包括一个次级单 元时,整群抽样和简单随机抽样一致。因此,整 群抽样的估计量可以比照简单随机抽样方式来构 造。
4.如果把每一个群看作一个单位,则整群抽 样可以被理解为是一种特殊的简单随机抽样。 5.整群抽样也是多阶段抽样的前提和基础。
6.整群抽样有特殊的用途。有些现象的研究, 如果直接调查作为基本单元的个体,很难说明问 题,必须以一定范围所包括的基本单元为群体, 进行整群抽样,才能满足调查的目的。
7.整群抽样要求分群后各群所含次级单元数 目应该确知,否则会给抽样推断带来不便。
(二)比估计
当群的大小不等时,在对群进行简单随机抽
样的情况下,Y Yi M i ,我们注意到它同比率
R Yi
i 1 N
N
N
X 形式上完全相同,只不过在这里是
《社会调查理论与方法》第四章 社会调查的抽样
党派 共和党 民主党
支持率 57% 43%
选举结果——两个星期之后,美国总统选举 的结果罗斯福以61%的得票率获得第二任任期。 相较于罗斯福的523张选举人票,兰登仅得到8张。
预测为什么失败呢?
3. 决定抽 样方案
4. 实际抽 取样本
5. 评估样 本质量
•确定样本的
数量
•选择抽样的 由于拒访或样 具体方法:总 本缺失,可根 体规模的大小; 据实际情况抽 调查对象的特 取预备样本
,在抽样的过程中,总体的每一个元素都有同等的 机会入选样本,而且每个元素的抽取都是相互独立 的。
特点:总体中的任何个体都同样有被抽取的平等机 会。
主要方法: • 总体较小时:抓阄,抽签法 • 总体较大时:摇号法,随机数字表
随机数法的具体步骤
例题:要从3000个人(或其他分析单位)的总体中用简单随 机抽样的方法选取100个人作为样本进行调查。
随机数表
简单随机抽样方法的适用性:
➢ 总体数量较小 ➢ 易获得所有样本单位的完整列表 ➢ 样本单位之间差异程度较小或难以分组 ➢ 总体在空间范围内较为集中 ➢ 采用电子技术辅助调查的方法时,如CATI
(二)系统抽样
按无关标志; 按有关标志
系统抽样( systematic sampling):又叫等距抽样
一天,爸爸叫儿子小华去买一盒火柴。临出门 前,爸爸嘱咐儿子要买能划燃的火柴。小华拿着钱 出门了,过了好一会儿,小华才回到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 小华递过一盒划过的火柴,兴奋地说:“我每 根都试过啦。”
思考:得到火柴能否划燃的信息准确吗?
这样做有什么后果?
在日常生活当中所 熟知的抽样有哪些?
等概率整群抽样和多阶段抽样解析
估计效果,如:家庭-男女性别比
群的划分-大致可分为两类
1. 根据行政或地域形成的群体(如 学校、企业或街道 -节省费用) 2. 调查人员人为确定的(如将一大 块面积划分为若干块小面积的群)
分群的原则:群内差异尽可能大,群间 差异尽可能小 与分层抽样情况相反,总体结构
对复杂结构的总体,可以把两种方式结合使用
第四章 等概率整群 抽样和多阶段抽样
1. 2. 3. 4. 整群抽样 等概率整群抽样 等概率两阶段抽样 等概论两阶段抽样设计
概念:组成总体的基本单元 抽样单元
群:由若干个有联系的基本单 元所组成的集合称为群
整群抽样:抽样时抽取群,并 对入选群的所有单元进行调查。
两阶段抽样:由于群内单元通 常具有相似性, 尤其当群的规 模较大时, 对群内单元进行再 抽样,这就是实际调查中所用 的两阶段抽样,其中的群也称 为初级抽样单元,群内再抽样 的单元称为二级抽样单元
Ey Y
M
Y
定理2
y
的方差为
1 f V ( y) n
Y
N i 1
i
Y
2
N 1
1 f 2 Sb nM
证明: 由于
2
M V ( y) V ( y)
y My ,又 Y Y 1 f
N i 1 i
2
n
2
N 1
故
1 f i 1 V ( y) 2 nM N 1 1 f 2 Sb nM
2
• 样本方差
1 2 yij y s nM 1 i 1 j 1
2 n M
• 样本群间方差 • 样本群内方差
2 w
M 2 s ( yi y ) n 1 i
社会调查研究方法——第4章抽样PPT课件
2021/3/25
授课:XXX
10
3、抽样的作用
▪ (1)现实生活中有些研究总体是不可能进行 全面调查的,只可能调查其中的一部分。
▪ (2)节约人力、物力。 ▪ (3)对其他调查方法所得到的资料的可信性
的检验,尤其是对普查资料的修正与补充, 必须进行抽样调查。
2021/3/25
授课:XXX
11
4、抽样的优越性
4
2、抽样的概念
▪ (1)总体(population) ▪ (2)样本(sample) ▪ (3)抽样(sampling) ▪ (4)抽样单位(sampling unit) ▪ (5)抽样框(sampling frame) ▪ (6)参数值(parameter) ▪ (7)统计值(statistic) ▪ (8)抽样误差 ▪ (9)置信水平与置信区间
第四章 抽样
▪ 第一节 抽样的意义与作用 ▪ 第二节 非概率抽样方法 ▪ 第三节 概率抽样的原理与程 ▪ 第四节 概率抽样方法 ▪ 第五节 户内抽样与PPS抽样 ▪ 第六节 样本规模与抽样误差
2021/3/25
授课:XXX
1
教学要求:
▪ 了解抽样的概念、意义 ▪ 掌握概率抽样和非概率抽样的的几种方法 ▪ 教学重点:概率抽样 ▪ 教学难点:概率抽样中的分层抽样
▪ (1)调查费用较低。 ▪ (2)速度快 ▪ (3)应用范围广。 ▪ (4)可获得内容丰富的资料。 ▪ (5)准确度高。
2021/3/25
授课:XXX
12
▪5、抽样的类型
抽样技术
非概率抽样
概率抽样
方便抽样 判断抽样 配额抽样 滚雪球抽样
简单随机抽样 系统抽样 分层抽样 整群抽样 多级抽样 其他抽样技术
第四章抽样技术选择题
第四章一、单项选择题1. 随机抽样的基本要求是严格遵守()。
A、准确性原则B、随机原则C、代表性原则D、可靠性原则2. 抽样调查的主要目的是()。
A、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数3. 抽样总体单位亦可称为()。
A、样本B、单位样本数C、样本单位D、总体单位4. 抽样误差产生于()。
A、登记性误差B、系统性误差C、登记性误差与系统性误差D、随机性的代表性误差5. 在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的情况是()。
A、样本单位数占总体单位数的比重很小时B、样本单位数占总体单位数的比重很大时C、抽样单位数目很少时D、抽样单位数目很多时6. 在同样条件下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差大小关系是()。
A、两者相等B、前者小于后者C、两者有时相等,有时不等D、后者小于前者7. 在抽样推断中,样本的容量()。
A、越小越好B、越大越好C、取决于统一的抽样比例D、取决于对抽样推断可靠性的要求8. 用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的()。
A、2倍B、3倍C、4倍D、5倍9. 在重复简单随机抽样下,抽样平均误差要减少1/3,则样本单位数就要扩大到()。
A、4倍B、2倍C、3倍D、9倍10. 某企业今年5月试制新产品,试生产60件,其中合格品与不合格品各占一半,则该新产品合格率的成数方差为()。
A、25%B、30%C、35%D、50%11. 点估计()。
A、不考虑抽样误差即可靠程度B、考虑抽样误差及可靠程度C、适用于推断的准确度要求高的情况D、无需考虑无偏性、有效性、一致性12. 反映样本统计量与总体参数之间抽样误差可能范围的指标是()。
A、概率B、允许误差的大小C、概率保证程度D、抽样平均误差的大小13. 在区间估计中,有三个基本要素,它们是()。
社会调查方法 社会调查方法第四章 抽样之案例分析
国内主要社会科学学术调查
5、CFPS(China Family Panel Studies,中国家庭追踪调查) /cfps/ 6、CHARLS(China Health and Retirement Longitudinal Study,中国健康与养老追踪调查) /zh-CN 7、CHFS(China Household Finance and Survey,中国家庭金 融调查) / 8、CLDS(China Labor-force Dynamics Survey,中国劳动力 动态调查) /
回顾复习
什么是分析单位?分析单位的类型有哪些? 一项社会调查中所研究的对象,并不是调查对象。 个人、群体、组织、社区 社会调查的目的有哪些? 描述性调查、解释性调查 社会调查的基本过程和主要阶段是什么?
回顾复习
定额抽样是怎么开展的? 使样本与总体在某些因素或者特征方面具有相近的比例。 什么是抽样框? 抽样框又称作抽样范围,指的是以此直接抽样时总体中所有全速的名 单。 什么是简单随机抽样? 按照等概率原则直接从含有N个元素的总体中抽取n个元素组成样本。 什么是系统抽样? 又称作是等距抽样或者间隔抽样。是把总体中的元素进行编号排序后, 再计算出某种间隔,然后按这一固定的间隔抽取元素来组成样本的方 法。 PPS抽样的实质是什么? 在第一阶段中,大的群被抽中的概率大,而小的群被抽中的概率小; 这样到了第二阶段,大的群中的元素被抽中的概率就小于小的群中的 元素。这样一大一下,平衡了由于裙的规模不同带来的概率差异。
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
整群抽样
技术部
行政部
销售部
ቤተ መጻሕፍቲ ባይዱ
制造部
THE END
谢 谢 观 看!
《社会调查与统计分析》
第四章 抽样
知识点8 整群抽样
学习导航
整群抽样
整群抽样的定义 整群抽样的优缺点 整群抽样和分层抽样的区别运用
1. 整群抽样( Cluster Sampling )的定义
又称为集体抽样或群体抽样 ,是从总体中随机抽取一些 小的群体,然后由所抽出的若干个小群体内的所有元素 构成调查的样本的方法。 整群抽样区别于其它抽样方法的最大特点在于它的抽样 单位不是单个元素,而是成群的元素 。
2. 整群抽样的优缺点
优点 „ (1)在于可以简化抽样的过程 „ (2)节省时间、人力和经费 缺点就是其样本的分布面不大、样本对总体的代表性相 对较差。
3. 整群抽样与分层抽样区别运用
不同子群相互之间差别不大、而每个子群内部的异质性 较大时,则适合于采用整群抽样的方法;
反之,当不同子群相互之间差别很大、而每个子群内部 的差异不大时,则特别适合于采用分层抽样的方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E (Yij Y )(Yik Y ) E (Yij Y )
N M i 1 j k
2
2 M
(Yij Y )(Yik Y )
NM ( M 1) 2
NC
2015/11/30
31
分母可写 成:
(Y
i 1 j k
N
M
ij
y)
2
于是
又可以写成:
N M
NM
2015/11/30 26
(一)均值估计量的定义 在群的抽取是简单随机的,且群的 大小(M)相等,则总体均值的估计为:
1 y yi n i 1 i 1 j 1 nM
n
M
yij
n
2015/11/30
27
(二)估计量 y 的性质
性质1 y 是 的无偏估计. Y
性质2
y 的方差为:
2015/11/30
12
分群的原则:
划分群时应使群内方差尽可能大,群间方差 尽可能小。(注意:这一点与分层抽样中 总体内层的划分有着极大的差别) 这意味着每个群均具有足够的代表性。如 果划分的群相互之间颇多相似之处,那么 少量群的抽取足以提供良好的精度。
2015/11/30
13
分析: 整群抽样对于群而言是非全面调查,对于被抽中群 内基本单元而言则是全面调查,是“先部分,后全体” 的抽样组织形式,与分层抽样正好相反。根据方差 分析原理,当总体划分为群后,总体方差可以分解 为群间方差和群内方差两部分。这两部分是此消 彼长的关系。由于整群抽样是对入选群中的所有 单元都进行调查,因此影响整群抽样误差的主要是 群间方差。为了提高整群抽样估计的精度,划分群 时应使群内方差尽可能大,群间方差尽可能小。
第四章 整群抽样
4.1 4.2
4.3
引言 群规模相等时的估计 总体比例的估计
2015/11/30
1
第一节 引言
一.整群抽样的定义与特点 (一)定义 整群抽样(cluster sampling)或集团 抽样,是将总体划分为若干群,然后以群为 抽样单元,从总体中随机抽取一部分群, 对中选群中的所有基本单元进行调查的一 种抽样技术。
2015/11/30 18
当各群所含次级单元数相等时,就称群的
大小相等;当各群所含次级单元数不相等 时,就称群的大小不相等。 当群的大小接近时,常采用简单随机抽样 抽取群;当群的大小相差比较大时,为提 高效率则更多地采用不等概率(按与群的 大小成比例的概率抽样)方法。
2015/11/30
19
2
2 n M
2
n
2
样本群间方差:
样本群内方差: sw
2015/11/30
1 yij yi nM 1 i 1 j 1
2
24
总体ANOVA(方差分析)表---群规模相等的整群抽样
来源
自由度
平方和
均方
群间 群内
N-1
SSB Yi Y
i 1 j 1
N
第二节 群规模相等时的估计
一.符号说明 总体有N个群,每个群包含的单元数M相等(或 相近)。 符号: 总体群数: N 样本群数: n 总体第 i 群中第 j 个单元的指标值: Yij 样本第 i 群中第 j 个单元的指标值: yij 第 i 群中的单元数: M i
2015/11/30
M1 M 2 ... M N M
NM 1 2 S MN
2015/11/30
2 (Yij Y )(Yik Y )
i 1 j k
( M 1)( NM 1) S
2
32
y
1 V ( y) V ( y) 2 M
N
的方差可以用群内相关系数近似表示:
2
1 f 1 (Yi Y ) 2 nM N 1 i 1
总体总值Y
NMY 的估计量及相应的方差为:
ˆ NMy Y 2 2 ˆ V (Y ) V ( NMy ) N M V ( y ) ˆ ) N 2 M 2 v( y ) v(Y
2015/11/30 30
三、整群抽样效率分析
整群抽样的估计精度与群内相关系数
有关。
分子可写成:
N
1 f 1 Yij Y 2 n M N 1 i 1 j 1 1 f NM 1 2 S 1 ( M 1) 2 n M ( N 1) 1 f 2 S 1 ( M 1) (当N-1=N,NM-1=NM时) 2015/11/30 nM 33
2
N(M-1) SSW
Y
N i 1 j 1
ij
Yi
2
2
SSB S N 1 SSW 2 Sw N ( M 1)
2 b
总计
2015/1பைடு நூலகம்/30
NM-1
SST Yij Y
i 1 j 1
N M
SST S NM 1
2
25
二. 估计量
整群抽样是以群为单位进行抽样,如果 群的抽取是简单随机的,则当群的大小都 相等时,可以将简单随机抽样理解为是一 种特殊的整群抽样,特别当总体分群后的 每个群都只包括一个次级单元时,整群抽 样和简单随机抽样一致。因此,整群抽样 的估计量可以比照简单随机抽样方式来构 造。
y 样本中的群均值:
i 1 n
N
yi n
总体中的个体均值:
Y Y M
22
2015/11/30
样本中的个体均值:
y y M
总体方差:
S
2
1 M0
Y 1
N M i 1 j 1
N
ij
Y
2
总体群间方差:
2 1 M Sb Yi Y Yi Y N 1 i 1 j 1 N 1 i 1 2
20
总体中单元总数:
M0 Mi
i 1
N
总体中第
i 群的群总值:
Yi Yij
j1
M
样本中第
i 群的群总值:
yi yij
j 1
M
总体中第
2015/11/30
i 群的个体均值:
Yi Yi M
21
yi 样本中第 i 群的个体均值: yi M
Y 总体中的群均值: Y i i 1 N
2015/11/30
N M
2
23
总体群内方差: 样本方差:
1 Yij Yi Sw N M 1 i 1 j 1
2 N M
2 N M
2
1 yij y s nM 1 i 1 j 1
M yi y sb n 1 i 1
2015/11/30 16
注: 整群抽样与分层抽样的的比较
二者在分组(层或群)的条件、调查的方
式、分组(层或群)的目的、分组(层或 群)的原则、总体方差的分解等方面都存 在着较为明显的差别。
2015/11/30
17
群的规模大,估计的精度差但费用省;群的 规模小,估计的精度高但费用增大。
通常我们面临的总体会有自然的初级单元, 例如各所中学它们互相之间关于学生的体质很 相似,但在一个学校里每个学生之间有一定的 差异。 倘若需要我们自行划分群,一般还要考虑 到组织管理上的方便、精度上的要求以及费用 的多少等因素。
2015/11/30
6
例如,在进行农村居民户收入情况调查时,在一 个县抽千分之五的村庄,对其所有居民户进行调 查,明显地比从全县直接抽千分之五的农户进行 调查,更便于组织,节省人力、旅途往返时间及 费用。
2015/11/30
7
3.整群抽样的随机性体现在群与群间不
重叠,也无遗漏,总体任何一个基本单元 都必须且只能归于某一群,群的抽选按概率 确定。 4.如果把每一个群看作一个单位,则整群 抽样可以被理解为是一种特殊的简单随机 抽样。理解这一点对给出整群抽样的估计 量的方差有帮助. 5.整群抽样也是多阶段抽样的前提和基 础。
N
Y E( y) Y M
1 f 1 2 2 1 f V ( y) (Yi Y ) Sb n N 1 i 1 nM
2015/11/30 28
证明: 因为 y My
N
,则
2 i
1 f V ( y) n
N
(Y Y )
i 1
N 1
2
N
M V y
M
2
其中:
Yi Y Yij Y i 1 i 1 j 1 N M M 2 Yij Y 2 Yij Y Yik Y i 1 j 1 j k 2 2 NM 1S NM 1M 1S
2. 实施调查便利,节省费用。 即使具备总体基本单元的名单,能直接抽取, 但总体基本单元在空间上的分布面很广,那么选定 调查单位后的调查工作却可能相当大。如果是实 地观测调查费用则很高,并需要较长的时间。
2015/11/30 5
对于整群抽样,由于样本单元的分布相对较集中, 在样本单元数相同的条件下,整群抽样与简单随 机抽样相比,虽然样本的代表性较差,但调查组 织实施过程更加便利,同时还可以大大地节省调 查费用。因此,实际工作中,在权衡费用和精度 之后,有时宁可适当增加一些样本单元数,也采 用整群抽样方法。
(二)特点 1. 抽样框编制得以简化。 在大规模抽样调查中,常常没有或很难编 制出包括总体所有次级单元在内的抽样框,而 整群抽样则不需要编制庞大的抽样框。 因此,在缺少基本单元名单,但群有现成的 名单或明显的空间界限时使用此方法很方便。