社会科学研究方法-定量与定性的抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

——引言: 为什么要抽样
案例
– 北京社会抽样调查结果显示:十五岁为危险年龄 – 当前最受市民关注的社会热点问题仍聚焦物价 – 第二期中国妇女社会地位抽样调查主要数据报告(5) – 当前社会十大问题抽样调查
——引言: 为什么要抽样
2004年美国总统大选前夕所预测的民意调查结果
——引言: 为什么要抽样
5.1 非概率抽样
非概率抽样(nonprobability sampling)
– 配额抽样(quota sampling) • 练习:
假设全国人口的年龄分布为:30岁以下人口占25%,30-60岁人
口占50%,60岁以上人口占25%;此外,各年龄阶段的性别比 例为:30岁以下人口中的男性占60%,女性占40%;30-60岁人
• 研究的总体和抽样框架是什么? • 分层的标准是什么? 如何进行样本选择,,每个职位各 能选出多少人? 职位 人数 行政人员 15
百分比(%) 2.88
院内医师
院际医师 登记护士 助理护士 药剂师 值班人员 出纳人员 维修人员 清洁人员 总计
25
25 100 100 75 50 75 30 25 520
损情况。请利用随机数表进行抽样。
5.3 概率抽样设计的类型
系统抽样
– 选择完整名单上每第K个要素组成样本的概率抽样方法 第一个要素是 – 举例:抽查课堂考勤,在全班同学的名单中选择每5个人抽点一次
随机产生的。
– 与简单随机抽样的方法相同,但是更为实用。
– 两个常用术语:
• 抽样间距(sampling interval):两个被选择要素间的标准距离。 抽样间距=总体大小 / 样本大小 • 抽样比率(sample ratio):被选择要素与所有总体要素数量的比率。 抽样比率=样本大小/ 总体大小
• 配额抽样
• 选择线人
5.1 非概率抽样
非概率抽样(nonprobability sampling)
– 就近法
极冒险的方法 • 案例演示:http://v.ku6.com/show/xZjoQ8v-X-eHx8-t.html • 随意选择很方便就可取得的个案,并且会很轻易地得到一组相当不代 表总体的样本。
5.2 概率抽样:逻辑与理论
总体与抽样框(sampling frame)
– 总体所有要素的名单或是准名单表 – 样本的选择来源
Leabharlann Baidu
– 一个样本的代表性直接依赖于抽样框代表总体要素的程度
• 举例:针对一个街区的调研
总体样本的初级抽样单位是街区内的所有街道
街区的名册可以成为一个抽样框
常见抽样框:街道户口登记名册、电信公司的电话簿、各机构的名册、 产品目录、销售目录等等。。。 根据样本所得的研究成果, 只能代表组成抽样框的各 个要素的集合。
口中的男性占65%,女性占35%;60岁人口中的男性、女性比
例各位50%。 问题:如果要形成一个40人的样本,那么各年龄阶层各应该抽
取男性和女性样本分别为多少?
5.1 非概率抽样
非概率抽样(nonprobability sampling)
与“受访 – 选择线人( snowball sampling) 者”区分 • 线人(informants):对你所希望研究的社会现象相当熟悉的人,而 且愿意告诉你他所知道的。
谢谢!
周旖 zhouyi37@mail.sysu.edu.cn 2012-11-15
在可行性上具有合理性
可以作为前测
可以提供有益的见解
切不可过度推论
5.1 非概率抽样
非概率抽样(nonprobability sampling)
– 目标式或判断式抽样(purposive or judgmental sampling)
• 选择观察对象的方式是以个人的判断为基础: 是否最有效或者 为最佳代表 • 研究者对研究对象总体构成的要素或研究目标有所认识。 • 适用情况: (1)选择特别能提供信息的独特个案;如:针对某本权威学术刊物的 内容,研究某学科的研究趋势的变化。 (2)选取很难接近、特殊总体中的成员;如:研究农民工信息获取权
5.3概率抽样设计的类型
简单随机抽样
系统抽样
分层抽样
多级整群抽样
5.3 概率抽样设计的类型
简单随机抽样
– 最基本的抽样技术 – 方法:每一个代表着总体的单元都用一个数字来代替,然后在随
单纯的简单随 机抽样在实践 中几乎不用!
机数字表中进行抽样选择
– 练习:
• 档案馆计划从馆藏的800盒民国档案中抽取60盒,调查档案载体的破
5.1 非概率抽样
非概率抽样(nonprobability sampling)
– 抽取样本的方式并不依据概率理论。 – 作为一种定性的抽样方法,表现为选取个案。 – 适用情况:
• (1)对从中抽取样本的大群体或总体情况知之甚少; • (2)大群体或总体数量庞大。
– 类型:
• 就近法 • 目标式或判断式抽样 • 滚雪球抽样
逻辑
在同质性极高的特
例群体里,一个个 案就足以成为整个 总体的样本。
核心:随机 述 抽样
基本观念
对总体进行有用的描
从总体中抽样出来的样 本必须包含总体的各种 差异特征
5.2 概率抽样:逻辑与理论
概率抽样(probability sampling)
– 随机抽样:
硬币 • 方法:随机数表或电脑程序(P524,P204) • 随机数表使用方法举例:某社区图书馆计划调查社区用户的信息需求, 计划从社区的95户家庭中随机抽取10户调查。 • 即使最仔细的抽样也不可能提供对总体的完全代表性,一定程度的抽 样误差总是存在的。 可通过预测相关参数的抽 样分布估测——衡量标准: 置信水平与置信区间。 避免偏见 • 任何要素都具有同等的、独立于任何其他事件被抽到的概率。Eg. 掷
抽样。
– 必须考虑的两个问题:群的数量 & 群的规模 – 案例:对广东省大学生的就业情况进行调研
• 第一步:获得广东省所有高校的名录http://www.gdhed.edu.cn/main/zwgk/ptgx.html • 第二步:根据主管部门和办学性质分层 • 第三步:对学校进行抽样 • 第四步:对被抽到学校的各个院系进行分层
第一次分层抽样
第二次分层抽样
• 第五步:对各院系进行抽样
• 第六步:对被抽到的各院系的学生进行分层 • 第七步:对学生进行抽样
第三次分层抽样
5.3 概率抽样设计的类型
多级整群抽样
– 课后练习
• 目标:从枫树镇抽取一组240人的随机样本
• 已知条件:枫树镇有55个区,每个区各有20条街区(提示:可以任选6
4.81
4.81 19.23 19.23 14.42 9.62 14.42 5.77 4.81 100
5.3 概率抽样设计的类型
多级整群抽样
– 一种比较复杂的抽样技巧,需要一种重复两个基本的步骤:列表名册和
概率比例抽样、非比例 – 使用情况:无法获得总体要素名单。 抽样和加权法可以消除 误差,但是不要求掌握。
5.3 概率抽样设计的类型
分层抽样
– 分层抽样案例:调查某大学在校本科生课外活动内容,假设该大学 有在校本科生15225人,计划抽样人数为1100人。
• 研究总体与抽样框架:总体为某大学全体在校本科生,抽样框架可来自 学校教务处的学生名册。 • 分层:课外活动情况与年纪和性别有关,所以分层为:大一男生、大一 女生、大二男生、大二女生、大三男生、大三女生、大四男生、大四女 生。 • 样本选择:
社会科学研究方法 05. 定量与定性的抽样
中山大学资讯管理学院 周旖 博士 2012-11-15
提 纲
非概率抽样
概率抽样:逻辑与理论
概率抽样的设计类型
如何确定样本的数量
——引言: 为什么要抽样
社会科学研究: 寻求关于社会 的答案 研究对象 测量 抽样
对抽样样本 的研究真的 能够代表真 实的、总体 的情况吗
– 方法1:按照各个次级群体的相对比例,简单随机或系统抽样; 切不可简单随机抽样
– 方法2:将所有学生按照次级群体排列,然后系统抽样。
• 样本修订:因为经费原因,只能发放1000份问卷——再次使用系统抽样
5.3 概率抽样设计的类型
分层抽样
– 分层抽样练习案例:调查某大型医院医职人员的工作压力,已知该 院共有医职人员520人,需抽样100人进行调研,医院人事部门可以 提供一份按照入院工作时间排列的名单。
个区,每个区任选4个街区),并假设你所抽取的第X区第Y街区有45户 人家。
• 要求:写出每次抽样的步骤、抽样依据和抽得的区与街区的编号,并假
设你所抽取的某个街区符合上述所说得“第X区第Y街区有45户人家”的 要求,请详述在这一街区内抽样的方法和步骤,并写出所抽取的编号。 • 下次课上,抽取两个小组报告做作业的情况(需要做PPT详细叙述)
基本原则:总体越小,抽样比就要越大;总体越大,抽样比 可以越小。
– – – – 对于小总体(小于1 000),一般要抽样30%左右; 对于中等总体(10 000左右),一般要抽样10%左右; 对于大总体(超过150 000),一般要抽样1%左右; 对于特大总体(超过1 000万),一般要抽样0.025%左右。
— 注意的问题:名单中要素的排列方式很关键。
5. 3 概率抽样设计的类型
分层抽样
– 在抽样之前先将总体要素分成相对同质性群体的过 程。
– 降低抽样误差的程度,增进样本的代表性。
– 分层的功能:将总体分成几个同质的次级集合。
次级集合的分层标准以及精 确描述程度根据研究的需要 而确定。
为什么有这样的效果? 降低误差的方法: (1)大样本 (2)同质群
受访者:只提供关于自身的情况; 线人:提供关于研究对象的一切信息
• Eg. 通过访问社工研究自闭症患儿
精确地、统计性 地描述大型总体
5.2 概率抽样:逻辑与理论
概率抽样(probability sampling)
– 根据概率理论来选择样本的方法的总称。通过保证总体中的每个 要素都有一个已知的(非零)、被抽中的概率,概率抽样能够计 算出有意识和无意识的抽样误差。 – 用途:从大的、已知总体中抽取有代表性的样本
利保障的情况。
(3)需要确认特殊个案类型,以便深入研究。如:深入访谈学生的消 费行为。
5.1 非概率抽样
非概率抽样(nonprobability sampling)
– 滚雪球抽样(snowball sampling)
• 一种经常用于实地研究的非概率抽样方法,每个被访问者都可能被要 求介绍其他人参与访谈: • 适用情况: (1)研究社会关系网络,如岭南大学图书馆的赠书来源。 (2)特定总体的成员难以寻找时,如研究吸毒。
2001年美国“9· 11”事件前后布什的支持率比较
——引言: 为什么要抽样 概率抽样的逻
非概率抽样 概率抽样
辑和技巧:本章的 主要内容;
结论:对研究对象进行抽样,进而只针对样本的测量,其 测量数据在某种程度上是与普遍事实相符的,可以代表总 体的情况。
严谨和精确的 主题
社会科学既是一门艺术也是一门科学,而抽样则偏 向于科学,并且更具备技术化的特点。
5.4 如何确定样本的数量
决定样本数量的因素:
– 计划进行的资料分析的类型 – 根据研究的目标,样本必须达到的精确程度 – 总体的特征
决定样本数量的方法:
属于统计学讨论范畴
– 方法1:有关总体所做的假设和针对随机抽样过程采用统计方法 – 方法2:经验法则:习惯上或通常接受的数量,基于过去抽取满足统 计方法要求的样本所积累的经验。
5.1 非概率抽样
非概率抽样(nonprobability sampling)
– 配额抽样(quota sampling)
强调样本的代表性 • 一种根据预先了解的总体特征来选择样本的方法,能够保证样本的特 缺陷1:配额的框 征分布和所要研究的总体一样; 架必须十分精确, • 抽样实施示例 ——建立全国性的配额样本 掌握最新的资料。 第一步:获得有关全国人口中,城市人口的比例、居住在东部地 区人口的比例、男性人口的比例、各年龄阶层人口的比例、不同 缺陷 2:随机抽 取会存在误差 教育水平的比例等……构成类型矩阵 第二步:根据研究目的,固定抽取的类别,按照各个类别相对于 总体的比例,决定每一个类别要抽取的样本数目; 体现出对所抽取的样本加权 的思想,使抽取的样本能够 合理地代表整个总体。 抽取方法为随 机抽取
相关文档
最新文档