社会统计学第5章抽样与统计推论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样的5个步骤
3.决定样本大小 在决定样本的大小时,必须同时考虑抽样 误差和研究代价这两个因素。 准则:根据所能付出的研究代价的最大限 度抽取最大的样本 抽样比例:样本个案数目/总体个案数目 4.设计抽样方法 不同的抽样方法所犯的抽样误差会不同, 但所需求的研究代价也不相同。
5.评估样本的正误
一般是根据一些在总体与样本中都能容 易找到的资料来评估样本的正误,如果 总体的资料分布与样本的资料分布基本 上一致,我们对样本的代表性就有较大 的信心。如果总体的资料分布与样本的 资料分布差异很大,则要放弃样本或在 报告中特别指出样本的偏差。 非抽样误差:遗失或无回应的问题引发 (有些个案拒绝回答)
5.阶段抽样
在多级抽样中,每一级都可看作是一次整群抽 样,每一个抽中的群体,又可看作是由若干子 群所组成,从入样的群体中,再随机抽取若干 子群组成子群。如: 第一步:从全国的省直辖市中抽取若干省和直 辖市 第二步:从入选的省和市中抽取县级单位 第三步:从县级单位中抽出乡和镇 第四步:从乡和镇中确定调查对象
优点:简化了抽取过程 缺点:可能出现周期性偏差(抽取的个案可能 具有某种特征,与不被抽取的个案有所不同)。
3.分层抽样(类型抽样、分类 抽样)
分层抽样是先将总体按与研究内 容密切有关的主要因素分类或分 层,然后在各层中按随机原则抽 选一定单位构成样本。
分层的目的,在于减少层内差 异,增加抽样调查样本的代表性。
例如:某工厂有20名工人,他们 的工资如下
40,80,70,40,50,50,80,70,50,40 70,40,70,50,40,80,40,80,50,50
粗看起来,工资水平似乎很分散,但细 分起来,实际只有4档:40,50,70,80 分层抽样适用于层内差异小,层与层间 差异大的总体。
分层抽样根据各层抽取比例是否相等,可 分作分层定比抽样和分层异比抽样:
参数估计与假设检验 在逻辑上的区别
参数估计是先看样本的情况,再问总体的 情况。
假设检验则是先假设总体的情况,再以一 个随机样本的统计值来检验这个假设是否 正确。即要先构思总体情况,才进行抽样 和分析样本的资料。
第一节 抽样调查简介
一、抽样的历程
1.界定总体。即清楚地说明全部研 究对象的范围,包括时间、地点和 人物。总体的界定越清楚越好。 2.搜集全部名单。根据总体的界定, 收集一份全部个案的名单,这份名 单,称为抽样构架。抽样构架的完 整性与准确性要审核。
2.概率抽样
抽取调查单位的原则是随机原则 所谓随机原则就是在抽选调查对象时,规 定了一定的程序,以保证每一个单位都有 同等入选的机会,从而避免了主观因素的 影响。 特点:根据已知的几率来抽取样本个案。 优点:可以作统计推论
如图:
参数值 X, ,2相关 系数
统计量 X,s,s2 相关系
数等
N
n
随机原则
总体
样本
推断
二、抽样调查方法
简单随机抽样 所谓简单随机抽样就是按照随机原则, 直接从总体N个单位中,抽取几个单位作 为样本,保证总体中每个单位在抽选时 都有同等的机会被选中。分为:
简单重复抽样 简单不重复抽样
2.等距抽样 (机械抽样,系统抽样)
先将总体按某一因素排列,然后依固定的间隔, 每间隔若干单位抽出一个构成等距抽样。 例如:总体单位为N,样本容量为n,则样本间 隔为:k=N/n,抽样时,先在第一个间隔中随机 抽取一个单位,假定为a,然后从a单位开始,每 间隔K单位都将是入选的单位。
1、非概率抽样
立意抽样法:判定抽样法,根据研究员的主观 理解和判断,选取认为是典型的个案。是否有 代表性在于研究员的主观判断是否正确。 偶遇抽样法:选取一些偶然遇见的个案作为样 本。 定额抽样法:根据某些标准将总体分组,然后 用立意或偶遇抽样法由每组中选取个案样本。 如先按照男女年龄分组(30岁作为分界),再 分别抽样调查。
第二节 抽样分布
例:设某村有5户人家,以下是 总体家庭人口的统计表
表 1 .某 村 家 庭 人 口 统 计 表
人 口 数 户 数
4
1
5
1
6
1
7
1
8
1
图1
1/5 45 6 7 8
则有:
总 体 均 值 x x 4 5 6 7 8 6 人
N5
总 体 方 差 2 1( x ) i 2 2 N 总 体 标 准 差 = 1 .4
二、抽样调查方法
部分调查根据其抽取调查 单位的准则不同,可分非 概率抽样和概率抽样。 概率抽样(随机抽样): 可以进行统计推论
1、非概率抽样
抽取调查单位的原则是根据主观判断或 其它操作上的方便。 基本方法:立意抽样法、偶遇抽样法、 定额抽样法。 非概率抽样的优点:成本低、花时短、回 答率高。 缺点:不能做统计推论
第五章
抽样与统计推论
统计推论:就是根据局部资料(样本
资料),对总体的特征进行推断。
统计推论具有两方面的特点:
1、由于样本资料来源于总体,因此,样本 资料的特性在某种程度上能反映总体的特性。
2、由于社会资料的随机性,抽样的结果不 是唯一的,一次抽样结果不一定恰好就等于 总体的结果,而且当总体参数未知时,即便 等于,我们也不知道。
112002.5%=280 66002.5%=165
老年
2200
20002.5%=55
总数
wenku.baidu.com
20000
200002.5%=500
分层异比抽样
当总体中某一层人数过少,但又 具有较高的研究价值,这时可增 大这一层的抽样比例。但这样做 的结果,统计分析时要做适当修 正。
4.整群抽样(集体抽样)
在整群抽样中,总体被分为很多 “群”,这些群是抽样的单位。随 机抽取若干群,被选入样本的群中 的全部个案都进入样本。 整群抽样适用于群间差异小,而群 内差异大的总体,这点正好和分类 抽样相反。
分层定比抽样 样本中各层抽取的比例是相同的。
例 如 总 体 单 位 N=20000 , 样 本 容 量 n=500,则抽样比例:
P 5002.5% 20000
设总体按老、中、青三代分层,于是根据
总体中三代人的总人数,就可确定三代人 的抽样人数:
代别
三代中抽样人数的分配 总人数
抽样人数
青年 中年
11200 6600