第四章(多阶段抽样)
多阶段抽样(PPT69页)
2.比率估计量 为了减小方差,可以考虑将初级单元的大小
Mi作为辅助变量,采用比率估计量对总体总 和进行估计。 对总体总和的比率估计量:
这个比率估计量是有偏的,但随着样本量的增加,其偏倚将趋于0。
• 其近似均方误差为:
• 因为 的差异一般不会很大,因此,当Mi相
差很大时,
要比无偏估计量 的方差
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
• 估计量p的方差为: V(p)的无偏估计为:
类似于前面总体方差的表达形式,有:
• 【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装潢 公司的比例。在15个单元中随机抽取了5个单元,在这5个 单元中分别随机抽取了4户居民并进行了调查,对这20户 调查结果如下:
样本单元 一栋A座 二栋C座 三栋C座 四栋C座
样本企业
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
置信区间:
三、对总体的比例的估计
总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。 对总体比例P的估计是:
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数 。
• 性质3: 对于二阶抽样,如果两个阶段都是简单 随机抽样,则有
社会学第四章 主要研究方法和抽样技术
一、问卷调查法
问卷调查法(survey)是社会学研究用于收集资料 最常用的方法之一,问卷调查法的基本步骤包括:确定调 查总体、选择抽样方案、设计调查问卷、实施调查、汇总 和录入数据、分析数据,等等。 第一步是识别和确定调查总体。所谓总体,就是所要 研究的对象的全体或所有个体。明确调查总体一是为了掌 握研究对象的总体情况,而是为了确定抽样框架。 第二步是根据抽样总体的特征以及具体研究要求,选 择和确定抽样方案。 第三步,确定选取样本的方案之后,就需要着手设计 调查问卷。问卷作为一种测量工具,在设计过程中,需要 考虑其信度和效度。
深度访谈也是田野调查中获得信息和资料的重要途径 。从访谈对象看,访谈可以划分为个别访谈(individual interview)和群组访谈(focus group)。个别访谈就是访 谈对象是单个个体,而群组访谈就是将若干访谈对象集中 起来同时进行访谈。 从访谈内容组织来看,有可以分为结构访谈和无结 构访谈。结构访谈是一种标准化访谈形式,要求在访谈 程序、访谈内容、提问方式等方面尽可能标准化,减少 主观因素影响。无结构访谈没有事先设计好的程序和内 容,而是围绕访谈主体进行比较自由、深入和细致的交 谈。
四、历史比较法
为了探讨社会现象的发展历史轨迹和变迁规律,社会 学常常采用历史比较和跨文化比较的方法。历史比较法的 资料来源主要有两种:一是政府文献资料,包括政府和机 构文件档案材料、统计资料和其他保存下来的历史资料; 二是民间历史资料,包括民间流传下来的地方史志资料, 以及民间口述史资料。 在历史比较法中,较常用的分析历史资料的方法有: 类比分析法和理想型分析法。类别分析法是指在分类的基 础上对某类现象或事件在不同阶段的表现和特征进行对比 ,并由此类推出现象产生的原因和变化规律。理想型分析 法是韦伯创立。理想类型是一种分析概念或逻辑工具,是 经过高度抽象出来的、反应事务本质特征的分类概念:如 “资本主义精神”、“科层制”等。
抽样技术期末复习总结资料金勇进版抽样技术考前点题整理
抽样技术期末考前点题整理【第一章绪论】一、概念类1、非概率抽样有哪些常见的类型?答:(1)判断选样(2)方便抽样(3)自愿样本(4)配额抽样2、抽样调查的作用有哪些?答:(1)节约费用(2)时效性强(3)可以承担全面调查无法胜任的项目(4)有助于提高调查数据的质量3、抽样调查与普查之间的关系是什么?答:(1)抽样调查可以作为普查的补充(2)抽样调查可以对全面统计资料进行评估和修正(3)利用抽样调查可以进行深层次的分析(4)利用抽样调查可以提前获得总体目标量的估计(5)普查可以为抽样框提供资料4、目标总体和抽样总体之间的关系是什么?答:(1)目标总体:是指所研究对象的全体,或者是研究人员希望从中获取信息的总体,它由研究对象中所有性质相同的个体所组成,组成目标总体的个体称作总体单元或单位。
(2)抽样总体:是指从中抽取样本的总体。
(3)关系:通常情况下,抽样总体应与目标总体完全一致,但实践中二者常不一致。
5、什么是抽样框?其有哪些类型?一个好的抽样框的基本标准是什么?答:(1)什么是:抽样总体的具体表现是抽样框。
通常,抽样框是一份包含所有抽样单元的名单。
给每个抽样单元编上一个号码,就可以按一定的随机化程序进行抽样。
对抽样框的基本要求是其应该具有抽样单元名称和地理位置信息,以便调查人员能够找到被选中的单元。
(2)类型[1] 名录框[2[ 区域框[3] 自然框(3)基本标准[1] 抽样框与目标总体保持一致[2] 能够提供与调查目的有关的尽可能多的准确、完整的辅助信息6、什么是抽样误差和非抽样误差?抽样误差的表现形式有哪些?答:(1)抽样误差:是指由抽取样本的随机性所造成的样本值与总体值之间的差异。
只要采用抽样调查,抽样误差就不可避免。
(2)非抽样误差:是相对于抽样误差而言的。
它的产生不是由于抽样误差的随机性,而是由于其他多种原因引起的估计值与总体参数之间的差异。
(3)抽样误差的表现形式[1] 抽样实际误差[2] 抽样标准误[3] 抽样极限误差7、抽样调查的步骤有哪些?答:(1)第一步:确定调研问题(2)第二步:设计抽样方案(3)第三步:问卷设计(4)第四步:实施调查过程(5)第五步:数据分析处理(6)第六步:撰写调研报告8、与非概率抽样相比,概率抽样有哪些优点?答:(1)样本的抽取遵循随机性原则(2)可以运用概率估计的方法对总体数量特征进行推断(3)抽样误差可以计算并加以控制9、概率抽样的特点有哪些? 答:(1)按一定的概率以随机原则抽取样本(2)每个单元被抽中的概率是已知的或者是可以计算出来的(3)当用样本量对总体目标量进行估计时,要考虑到该样本被抽样的概率【第二章 简单随机抽样】一、概念类1、简单随机抽样的抽取规则是什么? 答:(1)按随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾向性,防止出现系统误差。
[高等教育]现代社会调查 第四章 抽样
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
第4章-等概率整群抽样和多阶段抽样
4.1.1 定义
整群抽样(cluster sampling)是将总体 划分为若干群,然后以群(cluster)为抽 样单元,从总体中随机抽取一部分群,对 被选群内的所有单元进行调查的一种抽样 技术。
2024/7/17
3
例
欲估计某高校大学生拥有手机数量,大学共有40000 名学生,10000个宿舍(每个宿舍4名学生)。
V (ˆ) E1 E2 (ˆ)2 E1 V2 (ˆ ) E1E2 (ˆ)2 V1 E2 (ˆ) E1 V2 (ˆ )
4.3.3 等概率两阶段抽样的符号说明
表4-5
4.3.4 初级单元(PSU)规模相等的 两阶段抽样
定理4.5 对于初级单元规模相等的两阶段抽样 ,如果两个阶段都是简单随机抽样,且对每个 初级单元,第二阶抽样是相互独立进行的,则 对总体均值 Y 的无偏估计为:
定理 4.1:y 是 Y 的无偏估计,即
Ey Y
定理 4.2: y 的方差为:
V ( y) 1 f n
1N N 1 i1
Yi Y
2
1 f nM
Sb2
定理 4.3:V ( y) 的样本估计为:
v( y) 1 f nM
sb2
Yˆ NMy V (Yˆ) V (NMy) N 2M 2V ( y) v(Yˆ) N 2M 2v( y)
(NM 1)(M 1)S 2
用简单随机抽样方法抽取n个群,每个群内的M个
单元全部进入样本,则等群抽样均值估计量 y 的方
差可用群内相关系数近似表示
N
2
V (y)
1 V(y) 1 f
Yi Y
i 1
M2
nM 2 N 1
1 f n
(NM 1) M 2 (N 1)
第四章 抽样技术
• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四篇抽样和分布1(药学)PPT课件
24
4、整群抽样 先将总体分成若干互不重叠部分(称为群),再 从各群中随机抽取某群或几群作为样本。 例:调查某年级学生上网情况
可把每班作为一群,从中随机抽取一班或几班作 为样本。
该法适用于大规模调查,易于组织,节省人 力物力,但误差较大,适于群体差异较小的调 查对象。
8
实例 研究某地区12岁儿童生长发育情 况,总体和个体应为什么? 显然,总体为该地区的全体儿童
个体为每一个儿童。
当然,衡量儿童生长发育情况要通过诸如身高、 体重等数量指标进行,所以对总体的研究实际上 是对该地区的全体儿童的这些指标值概率分布进 行研究。
9
根据研究指标的多少,总体分为 一维总体-研究一项描述指标,常用随机变量X表示; 多维总体-研究多项描述指标,常用随机向量表示,
14
一般地,对有限总体,应采用有放回抽样,对 无限总体(或数量较多),可采用无放回抽样 (近似看作有放回),否则违背独立性。
简单随机抽样具体实施的方法: 抽签法
随机数法
15
三、统计量(Statistic )
样本是对总体的代表和反映,抽样的目的是利用样本值对 总体进行统计推断。
而对总体进行统计推断,常根据需要的不同,利用样本构 造一些包含所需要的多种信息的量,就是关于样本 X1 ,X2 ,…,Xn的一些函数,这些函数统称为统计量。
3
例如,在几何学中要证明“等腰三角形底角相等”, 只须从“等腰”这个前提出发,运用几何公理,一步一 步推出这个结论.这是演绎推理。
而一个习惯于统计思想的人,可能这样推理: 做很多大小形状不一的等腰三角形,实地测量 其底角,看差距如何,根据所得资料看看可否作 出“底角相等”的结论. 这样做就是归纳式的方法.
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 社会调查的基本类型
随机抽样又叫概率抽样,是按照概率理论来抽取 样本的,能够使得总体中的每一个单位都有被抽 出作为样本的同等机会。
1、简单随机抽样 又叫纯随机抽样,是随机抽样的最基本、最常见 的类型。如摇奖、抽签等。
操作方法是:按随机的原则,直接从含有N个单 位的总体中,抽出n个单位作为样本进行调查。 具体做法:抽签法、随机数表法。
教学幻灯片
社会调查方法
(四)
主讲:张连绪
第四章 社会调查的基本类型
本章主要内容:
普查的方法与程序 抽样调查的一般步骤 几种主要抽样方法的特点和适用情况 抽样误差的产生原因 典型调查的特点和要求 个案调查的特点和步骤
第一节 普遍调查
一、普遍调查概述
1、普遍调查的涵义 普遍调查简称普查,有时又称全面调查,是指对调 查对象的全部单位无一遗漏地逐个进行调查统计, 以求全面地、准确地了解客观情况的一种统计方法。 如人口普查、工业普查等。
第三节 典型调查
一、典型调查概述
(一) 涵义
是根据一定的目的和要求,在对调查对象有了 初步了解的基础上,从中选取若干具有代表性 的对象作为典型,对其进行深入系统的研究, 借以认识同类社会现象的本质及其发展规律的 方法。
(二)特点
1、定性调查; 2、选择少数代表调查; 3、面对面的直接调查; 4、方便、灵活,节省人力、物力。
3、确定抽样单位及样本容量(大小),编制抽样框。 4、评估样本,收集样本资料。
第二节 抽样调查
三、抽样调查的基本方法
简单随机抽样
等距随机抽样
随机抽样 分层随机抽样
整群随机抽样
抽样方法
多级随机抽样
其它随机抽样
任意抽样
非随机抽样 判断抽样
多阶抽样
第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。
多阶抽样的特征:便于组织抽样;抽样方式灵活,有利于提高抽样的估计效率;多阶段抽样对基本调查单元的抽选不是一步到位的;多阶段抽样实质上是分层抽样与整群抽样的有机结合;多阶抽样在抽样时并不需要二阶或更低阶单元的抽样框;多阶抽样还可用于“散料”的抽样,即散料抽样。
第二节 一阶单元等大小的二阶抽样第一阶段在总体N 个初级单元中,以简单随机抽样抽取n 个初级单元,第二阶段在被抽取的初级单元包含的M 个二级单元中,以简单随机抽样抽取m 个二级单元,即最终接受调查的单元。
(一)估计量及其方差对于二阶抽样,若两个阶段的抽样都是简单随机的,则其总体均值Y 的无偏估计量为0111ˆ1n mnij i i j i Y y y m y n ======∑∑∑.由于在每个一阶单元中的第二阶抽样是相互独立进行的,所以,在二阶段都用不放回方法抽样时,其总体均值估计量的方差可构造为22221111)(S mnf S n f y V -+-==NS mn S M SS n 21222221)(1-+- 可以证明其方差的无偏估计量为2221211)1(1)(ˆs mnf f s n f y V -+-= 其中,22s 为22S 的无偏估计,21s 不属于21S 的无偏估计,21S 的无偏估计为22221211ˆs mf s S --= 式中右边第一部分相当于第一阶段抽样的误差,它只与各一阶单元间差异大小有关;第二部分相当于第二阶段抽样的误差,它只与各一阶单元内(即各二阶单元间)差异有关。
(二)最佳抽样比的确定在总费用一定时,考虑下述简单的线性费用函数:nm C n C C C 210++=若一阶级单元间的旅费不占重要位置,则上述费用函数被证明是适用的。
《社会调查理论与方法》第四章 社会调查的抽样
党派 共和党 民主党
支持率 57% 43%
选举结果——两个星期之后,美国总统选举 的结果罗斯福以61%的得票率获得第二任任期。 相较于罗斯福的523张选举人票,兰登仅得到8张。
预测为什么失败呢?
3. 决定抽 样方案
4. 实际抽 取样本
5. 评估样 本质量
•确定样本的
数量
•选择抽样的 由于拒访或样 具体方法:总 本缺失,可根 体规模的大小; 据实际情况抽 调查对象的特 取预备样本
,在抽样的过程中,总体的每一个元素都有同等的 机会入选样本,而且每个元素的抽取都是相互独立 的。
特点:总体中的任何个体都同样有被抽取的平等机 会。
主要方法: • 总体较小时:抓阄,抽签法 • 总体较大时:摇号法,随机数字表
随机数法的具体步骤
例题:要从3000个人(或其他分析单位)的总体中用简单随 机抽样的方法选取100个人作为样本进行调查。
随机数表
简单随机抽样方法的适用性:
➢ 总体数量较小 ➢ 易获得所有样本单位的完整列表 ➢ 样本单位之间差异程度较小或难以分组 ➢ 总体在空间范围内较为集中 ➢ 采用电子技术辅助调查的方法时,如CATI
(二)系统抽样
按无关标志; 按有关标志
系统抽样( systematic sampling):又叫等距抽样
一天,爸爸叫儿子小华去买一盒火柴。临出门 前,爸爸嘱咐儿子要买能划燃的火柴。小华拿着钱 出门了,过了好一会儿,小华才回到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 小华递过一盒划过的火柴,兴奋地说:“我每 根都试过啦。”
思考:得到火柴能否划燃的信息准确吗?
这样做有什么后果?
在日常生活当中所 熟知的抽样有哪些?
等概率整群抽样和多阶段抽样解析
估计效果,如:家庭-男女性别比
群的划分-大致可分为两类
1. 根据行政或地域形成的群体(如 学校、企业或街道 -节省费用) 2. 调查人员人为确定的(如将一大 块面积划分为若干块小面积的群)
分群的原则:群内差异尽可能大,群间 差异尽可能小 与分层抽样情况相反,总体结构
对复杂结构的总体,可以把两种方式结合使用
第四章 等概率整群 抽样和多阶段抽样
1. 2. 3. 4. 整群抽样 等概率整群抽样 等概率两阶段抽样 等概论两阶段抽样设计
概念:组成总体的基本单元 抽样单元
群:由若干个有联系的基本单 元所组成的集合称为群
整群抽样:抽样时抽取群,并 对入选群的所有单元进行调查。
两阶段抽样:由于群内单元通 常具有相似性, 尤其当群的规 模较大时, 对群内单元进行再 抽样,这就是实际调查中所用 的两阶段抽样,其中的群也称 为初级抽样单元,群内再抽样 的单元称为二级抽样单元
Ey Y
M
Y
定理2
y
的方差为
1 f V ( y) n
Y
N i 1
i
Y
2
N 1
1 f 2 Sb nM
证明: 由于
2
M V ( y) V ( y)
y My ,又 Y Y 1 f
N i 1 i
2
n
2
N 1
故
1 f i 1 V ( y) 2 nM N 1 1 f 2 Sb nM
2
• 样本方差
1 2 yij y s nM 1 i 1 j 1
2 n M
• 样本群间方差 • 样本群内方差
2 w
M 2 s ( yi y ) n 1 i
第四章 抽样3
14
一、样本规模
推论总体人数(或百分比) 推论总体人数 (或百分比)的样本规模的 计算公式: 计算公式: t2×p(1-p) p(1 n=---------------n=---------------e2 其中, 为总体的成数或百分比; 其中,p为总体的成数或百分比;t,e含义 同上。 同上。
15
21
作业思考题
从社会学期刊中选择三篇研究报告, 从社会学期刊中选择三篇研究报告,分 析并评价这些研究中所采用的抽样方法。 析并评价这些研究中所采用的抽样方法。
22
8
1、KISH选择法 KISH选择法
③ 确定样本户的编号。 通常的做法是 :调查员 确定样本户的编号。通常的做法是: 调查的第一户的编号为1 第二户的编号为2 调查的第一户的编号为1,第二户的编号为2, 以次类推。 以次类推。 样本编号末位数所在列, ④ 样本编号末位数所在列,和家庭成员人口数 所在行对应的数为该户成员年龄由大到小排列 的编号,此编号所对应的人为抽样样本。 的编号,此编号所对应的人为抽样样本。
17
二、影响样本规模确定的因素
3、总体的异质性程度。总体的异质性程度越 总体的异质性程度。 总体的方差越大, 则抽样误差越大, 高 , 总体的方差越大 , 则抽样误差越大 , 样 本规模就越大;反之,样本规模就越小。 本规模就越大;反之,样本规模就越小。
18
二、影响样本规模确定的因素
4、研究者所拥有的经费、人力和时间。从抽 研究者所拥有的经费、人力和时间。 样的可行性、 简便性考虑, 样的可行性 、 简便性考虑 , 样本规模是越小 越好; 究竟选择多大规模的样本, 越好 ; 究竟选择多大规模的样本 , 往往需要 做出选择。 而选择的一个重要砝码, 做出选择 。 而选择的一个重要砝码 , 就是研 究者所拥有的经费、人力和时间。 究者所拥有的经费、人力和时间。
抽样技术人大课件讲稿多阶段抽样
难以控制总体误差
多阶段抽样中,各阶段的抽 样误差可能难以控制和预测 ,从而影响总体误差的大小 。
05
多阶段抽样的案例分析
案例一:全国人口普查多阶段抽样
全国人口普查多阶段抽样的实施过程
全国人口普查多阶段抽样通常按照地理位置和人口分布进行分层,首先在各个省 、自治区、直辖市内进行随机抽样,确定样本点,然后再在样本点内进行更细致 的抽样,以获取更精确的数据。
抽样技术人大课件讲稿多阶段抽 样
contents
目录
• 抽样的基本概念 • 多阶段抽样的基本原理 • 多阶段抽样的实施步骤 • 多阶段抽样的优缺点 • 多阶段抽样的案例分析
01
抽样的基本概念
抽样的定义
抽样
从总体中选取一部分个体作为代表进行观察或调查,并通过对这 部分个体的观察或调查结果来推断总体的一种方法。
抽样的分类
概率抽样
按照一定的概率从总体中抽取样 本的方法。
非概率抽样
根据主观判断或特定目的从总体 中抽取样本的方法。
简单随机抽样
每个个体被选中的概率相等,且 相互独立。
多阶段抽样
将总体分成若干阶段,逐阶段进 行抽样,直到获得最终样本。
分层抽样
将总体分成若干层,从每层中抽 取一定数量的样本。
系统抽样
计算样本量
根据研究目的和资源限制,计 算所需的样本量。
实施抽样
按照确定的抽样方法和样本量 ,从样本框中抽取样本。
第二阶段抽样
确定次级抽样单位
在第一阶段抽样的基础上,确定次级抽样单 位,即具体的调查对象。
计算次级样本量
根据研究目的和资源限制,计算所需的次级 样本量。
确定次级抽样方法
根据研究目的和次级抽样单位特征,选择合 适的次级抽样方法。
社会调查研究与方法第四章自测
社会调查研究与方法第四章自测、填空题(每小题2 分,共计18 分)题目1构成某一事物的所有元素、也就是最基本单位的集合叫,从中按照一定方式抽取出的一部分元素的集合叫。
正确答案是:总体,样本题目2 在现代社会中,抽样与、计算机技术、相结合,形成了社会调查研究的最主要类型,即抽样调查。
正确答案是:问卷方法,统计分析方法题目3抽样存在的合理性是由辩证唯物主义个别与一般的理论和建立在概率论基础上的定律与定律决定的。
正确答案是:大数,中心极限题目4 抽样误差是用去估计时所出现的误差。
正确答案是:样本统计值,总体参数值题目5 总的来说,各种抽样都可以归为与两大类。
正确答案是:概率抽样,非概率抽样题目6 常用的简单随机抽样方法有、抽签法和。
正确答案是:直接抽样法,随机数表法题目7按照确定分层样本数量的不同方式,分类抽样分为分类抽样和分类抽样两种。
正确答案是:比例,非比例题目8主观抽样是调查者根据研究的目标和自己主观的分析,来选择和确定样本它又可分为和两种。
正确答案是:印象判断抽样,经验判断抽样题目9 统计学中通常以个单位为界,把样本分为大样本和小样本。
但社会调查研本规模至少不能少于个单位。
正确答案是:30,100二、选择题(每小题2 分,共计16 分)题目10抽样存在的必要性缘于总体本身所具有的()。
选择一项:A. 普遍性B. 复杂性C. 同质性D. 异质性反馈正确答案是:异质性题目11 抽样的一般步骤有()。
选择一项或多项:A. 确定总体B. 制定抽样框的方法。
究中的样C. 决定样本容量D. 决定抽样组织形式E 扌由取样本F.评估样本The correct answers are 确定总体,制定抽样框,决定样本容量,决定抽样组织形式,抽取样本,评估样本题目12 一次直接的抽样所使用的基本单位叫()。
选择一项:A. 总体B. 样本C 扌由样单位D.评估样本正确答案是:抽样单位题目13 关于样本中某一变量的综合描述叫()选择一项:A. 统计值B. 平均值C. 评估值D. 参数值正确答案是:统计值题目14在社会调查研究中,抽样主要解决的是()。
社会调查方法 社会调查方法第四章 抽样之案例分析
国内主要社会科学学术调查
5、CFPS(China Family Panel Studies,中国家庭追踪调查) /cfps/ 6、CHARLS(China Health and Retirement Longitudinal Study,中国健康与养老追踪调查) /zh-CN 7、CHFS(China Household Finance and Survey,中国家庭金 融调查) / 8、CLDS(China Labor-force Dynamics Survey,中国劳动力 动态调查) /
回顾复习
什么是分析单位?分析单位的类型有哪些? 一项社会调查中所研究的对象,并不是调查对象。 个人、群体、组织、社区 社会调查的目的有哪些? 描述性调查、解释性调查 社会调查的基本过程和主要阶段是什么?
回顾复习
定额抽样是怎么开展的? 使样本与总体在某些因素或者特征方面具有相近的比例。 什么是抽样框? 抽样框又称作抽样范围,指的是以此直接抽样时总体中所有全速的名 单。 什么是简单随机抽样? 按照等概率原则直接从含有N个元素的总体中抽取n个元素组成样本。 什么是系统抽样? 又称作是等距抽样或者间隔抽样。是把总体中的元素进行编号排序后, 再计算出某种间隔,然后按这一固定的间隔抽取元素来组成样本的方 法。 PPS抽样的实质是什么? 在第一阶段中,大的群被抽中的概率大,而小的群被抽中的概率小; 这样到了第二阶段,大的群中的元素被抽中的概率就小于小的群中的 元素。这样一大一下,平衡了由于裙的规模不同带来的概率差异。
第四章总体和样本
11 缺点:群间差异大时,可加大抽样误差
(五)多阶段抽样(multistage sampling)
定义:又称多级抽样,是将抽样的过程分为两个或两个以 上的阶段来进行。
观察单位(observed unit):亦称个体或研究单位,指 研究总体的单位组成部分,是科学研究中的最基本单 位。
层(strata):一个总体以某种特定的标准分为互相不包 含的部分,。分层常在抽样过程中应用,可以提高样本 对总体的代表性。
3
二、样本(Sample)
概念:从总体中随机抽取部分观察单位,其实 测值的集合构成样本。
Hale Waihona Puke 17总体标准差σ:σ越大,观察值的变异程度大, 所需的样本越大
容许误差δ:既预计样本统计量和相应总体参 数的最大相应误差控制在什么范围,常取可信 区间长度之半。在其他条件确定的情况下,容 许的误差越小,样本含量大;容许的误差越大, 样本含量越小。
18
(三)样本含量的估计方法
经验法 计算法 查表法 累积法
情况 ✓ 实施灵活方便,便于组织
10 缺点:调查者须对总体情况有较多的了解
(四)整群抽样(cluster sampling)
定义:又称聚类抽样,是将总体中所有的个体按照某 种属性分成若干个群组(又称为初级抽样单位),再 从若干个群组所组成的总体中随机抽取部分群,再由 被抽取的每个群的全部观察单位组成样本。
目的:用样本信息推断总体体征。
4
样本的选取应注意什么问题?
• 要留意样本在总体中是否具有代表性 • 样本容量必须足够大 • 注意样本避免遗漏某一群体
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E ( s1 2 ) E 1E ( 2s1 2 ) E 1[n1 1i n( 1 Y iY n ) 2(1n f2 m )i n1S2 2 i]
S12
(1f2) m
S22
.
E( s2 2) E1E( 2 s2 2) E1E( 2 1 ni n1s2 2i)
E1[1n
n i1
E2(s22i
)]
由题意,N=100,M=30,n=5,m=3
f1
n N
V1[
1 n
n i 1
Yi )]
1 n
f1
S12
.
E1[V2(y)]E1[V2(1 ni n1 yi)]
E1[n12
n
V2(yi )]
i1
E1[n12
n 1f2 i1 m
S22i]
1nm f2 E1[1n
n i1
S22i]
1 f2 nm
1 N
N i1
S22i
1 f2 nm
S22
所以 V (y): 1 nf1S 1 21m f2S n 2 2
,因此:
V ar(y)1 nf1S121m n f2S2 2
.
V ar ( y ) 的无偏估计是:
v(y)1 nf1s1 2f1(1 m nf2)s2 2
注意:为什么 v(y)与Var(y)的形式不完全相同?
这是因为: s12不是S12
的无偏估计,
因为
s12
1 n n1i1
(yi
y)2,在
yi
E 1 ( E 2 ˆ ) 2 E 1 [ V 2 (ˆ ) ] ( E 1 E 2 ˆ ) 2
E 1[V 2(ˆ) ]V 1[E 2(ˆ)]
.
定理2.对于两阶段抽样,有以下三个性质。
(1)E(y) Y
(2)V(y)1 nf1S1 21m f2S n2 2 (3)v(y)1 nf1s1 2f1(1 m f2n )s2 2
.
性质三:
E2[(n1)s12]
n
E2[ (yi y)2] i1 n
E2(yi2)nE2(y2) i1 n
{E 2 [(yi)2] V 2(yi) }n {E 2 [(y)2] V 2(y)} i 1
i n 1[Y i2 1 m f2S 2 2 i] n [1 ni n 1Y i]2 1 n f2m i n 1S 2 2 i
S
2 2i
1 M 1
M
(Yij
j 1
Yi )2
总体初级单元内的方差:
S
2 2
1 N (M 1)
N i 1
M
(Yij
j 1
Yi ) 2=
1 N
N
S
2 2i
i 1
样 本 中 抽 中 的 第 i个 初 级 单 元 内 的 方 差 :
s
2 2i
1 m 1
m
( yij
j 1
yi )2
样本中所有抽中的初级单元内的方差:
11280.25
2
408.30
12115.99
3
323.40
8752.76
4
502.50
17833.75
5
234.00
3953.00
6
387.75
11302.50
7
284.20
6573.04
8
256.60
4822.36
9
314.10
6921.01
10
280.50
5827.25
.
解:(1)已知条件为: N=70, n=10, M=100, m=15, f1=1/7, f2=0.15
n 1 i1
y
2 i
2y
n i1
yi
n i1
y2]
1n [
n 1 i1
y
2 i
ny 2 ]
.
yi及
s
2 2
i
(2)要求方差,需先计算
。
i
yi
s
2 2
i
1
25.02
135.02
2
27.22
71.58
3
21.56
127.16
4
33.50
71.43
5
15.60
21.61
6
25.85
97.37
7
18.95
70.582.61
10
1510
v(y% )M2N2v(y) 1 0 0 2 7 0 2 2 .6 1 1 2 7 8 9 0 0 0 0
(3)因此,y% 的标准误差的估计为:
v(y% ) 127890000 11308.85元
因而,绝对误差限 d U v(y%) 1 .9 6 1 1 3 0 8 .8 5 2 2 1 6 5 .3 5 元 这样我们就得到上月该柜台的营业总额的置信度为95%的置信区
(2) V(y)1 nf1S121m nf2S2 2 .
分析
1 n m
1n 1m
y nmi1
yij
j1
ni1(mj1yij)
Y11,K ,Y1M
Y21,K ,Y2M
……
YN1,K,YNM
1
2
N
1 m
m
y ij
j1
的期望就是第i个小盒子的均值 Y i
,再对 1
n
n
Yi
i1
求
期望,相当于 (Y1,Y2,K,YN) 中简单随机样本均值的期望,即
间为:(157108.00-22165.35 , 157108.00+22165.35)
.
【例2】欲调查4月份100家企业的某项指标, 首先从100家企业中抽取了一个含有5家样 本企业的简单随机样本,由于填报一个月 的数据需要每月填写流水帐,为了减轻样 本企业的负担,调查人员对这5家企业分别 在调查月内随机抽取3 天作为调查日,要求 样本企业只填写这3天的流水帐。调查的结 果如表8.2所示。
s
2 2
1 n (m 1)
n i 1
m j 1
( yij
y i ) 2=
1 n
n i 1
s
2 2i
.
估计量及其性质
• 每个阶段都是简单随机抽样 • 简单随机抽样的性质 • 总体均值的估计
在初级单位大小相等的两阶段抽样中, 总体均值的无偏估计量就是二级段抽样的 样本均值,即:
(1)y 是 Y 的无偏估计;
为大盒子Y(总体)均值 。因此,y 是 Y 的无偏估计。
.
注意到:y 是两次概率抽样的平均数,因此它的方差
(平方误差)应当由两部分形成:一部分取决于第一阶抽样的样本
量n与初级单元间的方差,即为
1
n
f1
S
2 1
;另一部分取决于第二阶抽
样的总样本量mn与初级单元内的方差,即为
1 f2 mn
S
2 2
1 E1[ n
n i1
S22i ]
S
1 N
N
S
2 2i
i 1
2 2
.
所E 以 [v (y ) ]: 1 n f1E 1 2 sf1 (1 m f2 )n E 2 2s
1 n f1E [S 1 2 1 m f2S 2 2 ]f1 (1 m f2 )n S 2 2
1 nf1S1 21m f2n S2 2V(y)
1
Y21,K ,Y2M
2
……
YN1,K,YNM
N
yi11,K , yi1m
1
yi21,K, yi2m
2 .
…
yin1,K , yinm
…
n
总 体 第 i个 初 级 单 元 中 的 第 j个 次 级 单 元 的 指 标 值 : Yij
i 1, 2,L , N ; j 1, 2,L , M
样 本 第 i个 初 级 单 元 中 的 第 j个 次 级 单 元 单 元 的 观 测 值 : yij
.
记 Yn1 ni n1Yi
(YnY)则 ,
E 2 [n (1 ) s 1 2 ] i n ( 1Y i2 ) n [ Y n ] 2 1 m f2i n 1 S 2 2 i 1 n f2i m n 1 S 2 2 i
于是有 i n( 1 Y iY n ) 2(n1 n )1 ( m f2)i n1S2 2i
• 最简单的是两阶段抽样,即在整群抽样的基础上, 对抽中的群不是全面调查,而是只抽取部分单位 进行调查。
.
分层抽样、整群抽样、二阶抽样的共同点及区别
共同点:都将总体分为若干子总体(层、群)
分层抽样——对总体中每个子总体(层)都进行抽样;
区别 整群抽样——对总体中被抽中的若干个子总体(群) 进行普查;
yi
1 m
m
yij
j 1
.
总体均值Y
1 NM
N i 1
M
Yij
j 1
1 N
N
Yi
i 1
样本均值 y 1
nm
n i 1
m
yij
j 1
1 n n i1
yi
总体初级单元间的方差:
S12
1 N 1
N i 1
(Yi
Y
)2 ,
样本初级单元间的方差:
s12
1 n 1
n i 1
( yi
y)2
.
总 体 第 i个 初 级 单 元 内 的 方 差 :
差的缘故。
中带有个小盒子的方
.
关于估计量方差的证明
定理1. 对于两阶段抽样,有
E(ˆ)E1E2(ˆ)
V (ˆ) E 1 [V 2 (ˆ) ]V 1 [E 2 (ˆ)]