第三章 抽样的原理及类型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

置信度
又称置信水平,指的是总体参数值落在样 本统计值某一区间内的概率。反映的是抽样 的可靠性程度。
置信区间 指在一定的置信度下,样本统计值与总 体参数值之间的误差范围。反映的是抽样的 精确性程度。
二、抽样的作用
向人们提供一种实现“由部分认识整 体”这一目标的途径和手段。
日常生活中的抽样
第二节 抽样的类型与抽样程序
2.抽样的精确性要求
抽样的目的往往是要从样本去推论总体。影 响样本规模确定的第二个因素,就与这种推 论的可靠性和精确性密切相关。在社会科学 研究中,我们用置信度与置信区间这两个概 念来说明样本规模与抽样的可靠性及精确性 之间的关系。
3.总体的异质性程度 一般来说,要达到同样的精确性,在同质性 程度高的总体中抽样时,所需要的样本就小 一些;而在异质性程度高的总体中抽样时, 所需要的样本规模就大一些。
三、抽样分布
根据概率的原则而成立的理性分布,显示 出从一个总体中不断抽取样本时,各种可能出 现的样本统计值的分布情况。
四、抽样的一般程序
界定总体
制定抽样 框
决定抽样 方案
实际抽取 样本
评估样本 质量
1. 界定总体
界定总体就是在具体抽样前,首先对从中抽取样本 的总体范围与界限作明确的界定。这一方面是由抽样的 目的所决定的,因为抽样虽然只是对总体中的一部分个 体实施,但其目的却是为了描述和认识总体的状况与特 征,是为了发现总体中存在的规律性,因此必须事先明 确地界定总体的范围;另一方面,界定总体也是达到良 好的抽样效果的前提条件。如果不清楚明确地界定总体 的范围与界限,那么,即使采用严格的抽样方法,也可 能抽出对总体严重缺乏代表性的样本来。 1936年美国总统大选的民意测验 《文摘》
行控制的。
2.抽样误差的决定因素: 总体的分布方差+抽样规模
3.样本规模与抽样误差关系: 第一, 对于较小的样本来说,样本规模小幅度 变化,便会带来精确性方面很明显的变化。 第二, 对于比较大的样本来说,样本规模小幅 度变化,不会对精确度造成明显影响。
4.度量误差 指除抽样误差之外,抽样调查中存在的另外 一种误差。也称作非抽样误差。是在整个调 查过程中产生的,在调查访问、回答、记录、 填写、汇总、录入等工作中所出现的各种误 差。
五、抽样设计的原则
1.目的性原则 2.可行性原则 3.高效性原则
第三节 样本规模与抽样误差
一、 样本规模及其计算
1.定义:样本规模又称样本容量,指的是样本中所 含元素的多少。确定样本规模是每一项具体的社 会调查所必须解决的问题之一。 不能少于100个元素
2.简单随机抽样中样本规模计算公式:
2. 制定抽样框
这一步骤的任务就是依据已经明确界定的 总体范围,收集总体中全部抽样单位的名单, 并通过对名单进行统一编号来建立起供抽样使 用的抽样框。 对某大学进行一项该校大学生就业观的抽 样调查
3. 决定抽样的方案
从前面有关抽样类型的介绍中,我们已经 了解到具体的抽样方法有好几种,而各种不同 的抽样方法都有自身的特点和适用范围。因此, 对于具有不同研究目的、不同范围、不同对象 和不同客观条件的社会科学研究来说,所适用 的抽样方法也不一样。这就需要我们在具体实 施抽样之前,依据研究的目的要求、依据各种 抽样方法的特点,以及其它有关因素决定具体 采用哪种抽样方法。除了抽样方法的确定性以 外,还要根据要求确定样本的规模以及主要目 标量的精确程度。
a,推论总体平均数
t n 2 e
2
2
b,推论总体成数(百分比)
t 2 (1 ) n e2
☆当P=0.5时,以上公式变为:
t2 n 4e 2
二、影响样本规模确定的因素
1.总体的规模 样本规模与总体规模有关,这不难理解。按一 般的想法,总体越大时,则样本也要越大,这 样才能保证一定的精度。但是,这种想法只在 一定程度上是正确的。当总体规模大到一定程 度时,样本规模的增加与它并不保持同等的增 长速度。
第三章 抽样的原理及类型
主要内容 一、抽样的意义与作用 二、抽样的类型与抽样程序 三、样本规模与抽样误差
第一节 抽样的意义与作用
一、抽样及其相关的概念 1. 概念: 抽样指的是从调查对象的总体中,按照一 定的方式选择或抽取一部分调查对象的过程。
2.基本术语
总体与元素:总体通常与构成它的元素共同定义: 总体是构成它的所有元素的集合,而元素则是构 成 总体的最基本单位。总体中所包含的元素 数目用字母N表示。(如对某省大学生择业倾 向的社会调查) PS:定义的总体称为目标总体,从目标总体中去 掉一部分无法接触的元素后的总体称为调查 总体。(调查总体略小于目标总体)
参数值 参数值也称为总体值,它是关于总体中 某一变量的综合描述,或者说是总体中所有 元素的某种特征的综合数量表现。在统计中 最常见的参数值是总体某一变量的平均数。 如某市待业青年的平均年龄、某工厂工 人的平均收入等。
统计值 统计值也称为样本值,它是关于样本中 某一变量的综合描述,或者说是样本中所有 元素的某种特征的综合数量表现。
在概率抽样与非概率抽样这两大类中,还可以细分出若 干不同的形式,具体情况见下图
二、 概率抽样的基本原理
概率抽样是按照随机原则选择样本,完全 不带调查者的主观意识,使总体中每一个体都 具有一个已知不为零的被选机会进入样本。如 果总体中的每一个体被抽取为样本的概率相同, 那么从这个总体抽取的样本,就具有对该总体 的代表性。
5. 评估样本质量
评估样本的基本方法是:将可得到的反映总 体中某些重要特征及其分布的资料与样本中的 同类指标的资料进行对比。若二者之间的差别 很小,则可认为样本的质量较高,代表性较大; 反之,若二者之间的差别十分明显,那么样本 的质量和代表性就一定不会很高。 男生78%,女生22%,本省64%,外省36% 男生76%,女生24%,本省67%,外省33%
一项调查的总误差中,既包含抽样误差,又 包含非抽样误差。这两者同时与样本规模有 关。样本规模扩大,抽样误差会减少,但非 抽样误差又会增大。正确的做法是在抽样误 差和非抽样误差间保持适当的平衡。
一、抽样的类型 从大的方面看,各种抽样都可以归为概 率抽样与非概率抽样两大类,这是两种有 着本质区别的抽样类型。
概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中 的人为误差,保证样本的代表性。 而非概率抽样则主要是依据研究者的主观意愿、 判断或是否方便等因素来抽取对象,它不考 虑抽样中的等概率原则,因而往往产生较大 的误差,难以保证样本的代表性。
4. 实际抽取样本
实际抽取样本的工作就是在上述几个步骤 的基础上,严格按照所选定的抽样方法,从抽 样框中抽取一个个的抽样单位,构成样本。依 据抽样方法的不同,以及依据抽样框是否可以 事先得到等因素,实际的抽样工作既可能在研 究者到达实地之前就完成,也可能需要到达实 地后才能完成。即既可能先抽好样本,再下去 直接对预先抽好的对象进行调查或研究;也可 能一边抽取样本一边就开始调查或研究。
Leabharlann Baidu本
样本就是从总体中按一定方式抽取出的一 部分元素的集合。或者说,一个样本就是 总体的一个子集。样本中所包含元素数目 用字母n表示。 如从某省总共32万名大学生的总体中, 按一定的方式抽取出1000名大学生进行调 查,这1000名大学生就构成该总体的一个 样本。
抽样
从组成某个整体的所有元素的集合中, 按一定的方式选择或抽取一部分元素的过程。 比如,从1000户家庭构成的总体中, 按一定的方式抽取一个由100户家庭构成的 样本的过程。
4.调查者所拥有的经费、人力和时间 从样本的代表性、抽样的精确性考虑,则 样本规模当然是越大越好;但抽样所得到的 样本是要用来进行调查的。样本规模越大, 同时也意味着所需要投入的人力、物力和时 间越多;意味着所可能受到的限制和障碍也 就越多。
三、样本规模与抽样误差
1.定义:抽样误差就是用样本统计值去估计总体 参数值时所出现的误差,它是由于抽样本身的 随机性所引起的误差,无论采取什么样的抽样 方式,这种误差都是不可避免的。 ps:抽样误差的的大小是可以在样本设计中事先进
抽样单位
抽样单位就是一次直接的抽样所使用的基 本单位。抽样单位与构成总体的元素有时是 相同的,有时又是不同的。 如从32万名大学生抽取1000大学生,单 个大学生既是元素,又是抽样单位;但是, 抽取40个班级(假定正好是1000名)时,抽 样单位与构成总体的元素就不一样了。
抽样框
抽样框又叫抽样范围,它指的是一次抽 样时总体中所有抽样单位的名单。 如从一所中学的所有学生中,直接抽取 200名学生作为调查的样本,那么,这所中学 全体学生的名单就是这次抽样的抽样框。
相关文档
最新文档