统计学第二章数据的搜集
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、统计报表要以一定的原始记录为基础,按照统一的表格形 式、统一的指标项目、统一的报送时间和报送程序进行填报。 ✓ 按填报范围不同可分为全面报表和非全面报表 ✓ 按报送周期不同可分为日报、月报、季报、年报等。 ✓ 按填报内容和实施范围不同可分为国家、部门和地方统 计报表
编辑ppt
14
2.2.2抽样调查的常用方法
抽样方法
概率抽样
非概率抽样
简 单
系
分整
随 统 层群
机 抽 抽抽 抽 样 样 样样
方判自雪 便断愿球 抽抽抽抽 样样样样
编辑ppt
15
➢ 概率抽样
(1)简单随机抽样(simple random sampling)。从有限总体抽取样本时,如果总体 中每一个体都有同等机会被选入样本,这种抽样 称为简单随机抽样,得到的样本称为随机样本 (random sample)。
编辑ppt
16
实践中,得到随机样本并不容易。即使选择对象的确是随 机的,最理想的情况所得到的样本也只代表那些愿意回答 问题人的观点所组成的总体;没有回答问题的人的观点永 远不会被这种调查的样本所代表。
比如在肺癌研究中,人们往往看到吸烟和肺癌的关系的数 据;这些数据并不是整个人群中采集的随机样本,它们可 能只是医院中的病人记录中得到的。
编辑ppt
21
(4)系统抽样
• 系统抽样(也称等距抽样):将总体N个单位按某 种顺序排列,按规则确定一个随机起点,再每隔一 定间隔逐个抽取样本单位的抽样方法。
第 2 章 数据搜集
2.1 数据来源 2.2 调查数据 2.3 实验数据 2.4 数据误差
编辑ppt
1
学习目标
1. 了解数据的来源 2. 理解数据的调查方法 3. 掌握调查方案的结构和设计 4. 掌握调查问卷设计 5. 了解实验数据 6. 了解数据的误差
编辑ppt
2
2.1 数据来源
2.1.1 数据的间接来源 2.1.2 数据的直接来源
2.2.1统计调查的方式 2.2.2抽样调查的常用方法 2.2.3搜集数据的基本方法 2.2.4调查方案的设计
编辑ppt
10
2.2.1 统计调查方式
统计调查方式
普
抽
统
样
计
查
调 查
报 表
编辑ppt
11
➢ 普查(cenBiblioteka Baiduus)
• 普查是为某一特定目的而专门组织的一次性全面调查。
• 特点:
– 普查通常是一次性的或周期性的。例如国务院规定每10 年进行一次人口普查。
的数据收集方法
2. 具有经济性、时 效性强、适应面广、 准确性高等特点
一次失败的抽样调查!
☺ ☺
☺ ☺☺
☺☺
总体
随机样本
☺☺
编辑ppt
13
➢统计报表(statistical report forms)
1、统计报表是依照国家有关法规的规定,自上而下地统一布 置、自下而上地逐级提供基本统计数据的一种调查方式。
编辑ppt
8
2.1.2数据的直接来源(原始数据)
1. 调查数据
– 通过调查方法获得的数据 – 通常是对社会现象而言 – 通常取自有限总体
2. 实验数据
– 通过实验方法得到的数据 – 通常是对自然现象而言 – 也被广泛运用到社会科学中
如心理学、教育学、社会学、经济学、管理学等
编辑ppt
9
2.2 调查数据
编辑ppt
20
(3)整群随机抽样(cluster sampling)。先把总 体分为若干群(cluster),再以群为单位进行随机抽 样,对抽出来的群进行普查。
比如在某县进行调查,首先在所有村中选取若干村 子,然后只对这些村子的人进行调查。显然,如果各 村情况差异不大,这种抽样还是方便的。否则就会增 大误差。
– 普查一般需要规定统一的标准时点。例如,第5次人口 普查的标准时间为2000年11月1日0时。
– 普查数据的准确性、标准化程度均较高 ;
– 普查的调查项目较少,适用范围较狭窄,调查资料缺乏
深度。
总体
编辑ppt
12
➢ 抽样调查(sampling survey)
1.从总体中随机抽取一部分单位作为样本进行 调查,并根据样本调查结果来推断总体特征
4. 各种会议,如博览会、展销会、交易会及
专业性、学术性研讨会上交流的有关资料 中
国中
5. 从互联网或图书馆查阅到的相关资料
人国 口市 统场
计统
年计
鉴年
鉴
编辑ppt
5
➢二手数据的特点
1. 收集容易,采集成本低 2. 作用广泛
– 分析所要研究的问题 – 提供研究问题的背景 – 帮助研究者更好地定义问题 – 检验和回答某些疑问和假设 – 寻找研究问题的思路和途径 3. 收集二手资料在研究中应优先考虑
编辑ppt
3
2.1.1 数据的间接来源
✓二手数据的来源 ✓二手数据的特点 ✓二手数据的评估
编辑ppt
4
➢二手数据的来源
1. 统计部门和政府部门公布的有关资料,如 各类统计年鉴
2. 各类经济信息中心、信息咨询机构、专业 Internet
调查机构等提供的数据
http//WWW.
3. 各类专业期刊、报纸、书籍所提供的资料
编辑ppt
18
(2)分层(分类)随机抽样(stratified sampling)。先根 据某一特征把总体分为若干类(层,stratum),再从各类中 按简单随机抽样原则进行抽样。 比如按照教育程度把要访问的人群分成几类,再在每一类中 按其所占比例进行抽样。
样本
男生
编辑ppt
女生
19
• 层内个体之间的差异越小,而不同层之间 的差异越大时,分层抽样的效果好。
在报纸和网上也有问卷,但得到的只是上了网和有这份报 刊,而且愿意回答的人的观点。
编辑ppt
17
抽样框是有关总体全部单位的名录。
特点 – 简单、直观,在抽样框完整时,可直接从中抽取样本 – 用样本统计量对目标量进行估计比较方便
局限性 – 当N很大时,不易构造抽样框 – 抽出的单位很分散,给实施调查增加了困难 – 没有利用其他辅助信息以提高估计的效率 所以规模较大的调查中,很少直接采用简单随机抽样, 一般把这种方法与其他方法结合起来使用。
编辑ppt
6
➢二手数据的评估
1. 数据是谁收集的? – 可信度评估
2. 为什么目的而收集的? 3. 数据是怎样收集的? 4. 什么时候收集的?
编辑ppt
7
使用二手数据需要注意的问题
• 应注意数据的含义、计算口径和计算方法,避 免误用或滥用;
• 注意二手数据的时间性,不能用过时的数据; • 应充分搞清这些数据的来源和可靠程度; • 应注明数据的出处,以尊重他人的劳动成果。
编辑ppt
14
2.2.2抽样调查的常用方法
抽样方法
概率抽样
非概率抽样
简 单
系
分整
随 统 层群
机 抽 抽抽 抽 样 样 样样
方判自雪 便断愿球 抽抽抽抽 样样样样
编辑ppt
15
➢ 概率抽样
(1)简单随机抽样(simple random sampling)。从有限总体抽取样本时,如果总体 中每一个体都有同等机会被选入样本,这种抽样 称为简单随机抽样,得到的样本称为随机样本 (random sample)。
编辑ppt
16
实践中,得到随机样本并不容易。即使选择对象的确是随 机的,最理想的情况所得到的样本也只代表那些愿意回答 问题人的观点所组成的总体;没有回答问题的人的观点永 远不会被这种调查的样本所代表。
比如在肺癌研究中,人们往往看到吸烟和肺癌的关系的数 据;这些数据并不是整个人群中采集的随机样本,它们可 能只是医院中的病人记录中得到的。
编辑ppt
21
(4)系统抽样
• 系统抽样(也称等距抽样):将总体N个单位按某 种顺序排列,按规则确定一个随机起点,再每隔一 定间隔逐个抽取样本单位的抽样方法。
第 2 章 数据搜集
2.1 数据来源 2.2 调查数据 2.3 实验数据 2.4 数据误差
编辑ppt
1
学习目标
1. 了解数据的来源 2. 理解数据的调查方法 3. 掌握调查方案的结构和设计 4. 掌握调查问卷设计 5. 了解实验数据 6. 了解数据的误差
编辑ppt
2
2.1 数据来源
2.1.1 数据的间接来源 2.1.2 数据的直接来源
2.2.1统计调查的方式 2.2.2抽样调查的常用方法 2.2.3搜集数据的基本方法 2.2.4调查方案的设计
编辑ppt
10
2.2.1 统计调查方式
统计调查方式
普
抽
统
样
计
查
调 查
报 表
编辑ppt
11
➢ 普查(cenBiblioteka Baiduus)
• 普查是为某一特定目的而专门组织的一次性全面调查。
• 特点:
– 普查通常是一次性的或周期性的。例如国务院规定每10 年进行一次人口普查。
的数据收集方法
2. 具有经济性、时 效性强、适应面广、 准确性高等特点
一次失败的抽样调查!
☺ ☺
☺ ☺☺
☺☺
总体
随机样本
☺☺
编辑ppt
13
➢统计报表(statistical report forms)
1、统计报表是依照国家有关法规的规定,自上而下地统一布 置、自下而上地逐级提供基本统计数据的一种调查方式。
编辑ppt
8
2.1.2数据的直接来源(原始数据)
1. 调查数据
– 通过调查方法获得的数据 – 通常是对社会现象而言 – 通常取自有限总体
2. 实验数据
– 通过实验方法得到的数据 – 通常是对自然现象而言 – 也被广泛运用到社会科学中
如心理学、教育学、社会学、经济学、管理学等
编辑ppt
9
2.2 调查数据
编辑ppt
20
(3)整群随机抽样(cluster sampling)。先把总 体分为若干群(cluster),再以群为单位进行随机抽 样,对抽出来的群进行普查。
比如在某县进行调查,首先在所有村中选取若干村 子,然后只对这些村子的人进行调查。显然,如果各 村情况差异不大,这种抽样还是方便的。否则就会增 大误差。
– 普查一般需要规定统一的标准时点。例如,第5次人口 普查的标准时间为2000年11月1日0时。
– 普查数据的准确性、标准化程度均较高 ;
– 普查的调查项目较少,适用范围较狭窄,调查资料缺乏
深度。
总体
编辑ppt
12
➢ 抽样调查(sampling survey)
1.从总体中随机抽取一部分单位作为样本进行 调查,并根据样本调查结果来推断总体特征
4. 各种会议,如博览会、展销会、交易会及
专业性、学术性研讨会上交流的有关资料 中
国中
5. 从互联网或图书馆查阅到的相关资料
人国 口市 统场
计统
年计
鉴年
鉴
编辑ppt
5
➢二手数据的特点
1. 收集容易,采集成本低 2. 作用广泛
– 分析所要研究的问题 – 提供研究问题的背景 – 帮助研究者更好地定义问题 – 检验和回答某些疑问和假设 – 寻找研究问题的思路和途径 3. 收集二手资料在研究中应优先考虑
编辑ppt
3
2.1.1 数据的间接来源
✓二手数据的来源 ✓二手数据的特点 ✓二手数据的评估
编辑ppt
4
➢二手数据的来源
1. 统计部门和政府部门公布的有关资料,如 各类统计年鉴
2. 各类经济信息中心、信息咨询机构、专业 Internet
调查机构等提供的数据
http//WWW.
3. 各类专业期刊、报纸、书籍所提供的资料
编辑ppt
18
(2)分层(分类)随机抽样(stratified sampling)。先根 据某一特征把总体分为若干类(层,stratum),再从各类中 按简单随机抽样原则进行抽样。 比如按照教育程度把要访问的人群分成几类,再在每一类中 按其所占比例进行抽样。
样本
男生
编辑ppt
女生
19
• 层内个体之间的差异越小,而不同层之间 的差异越大时,分层抽样的效果好。
在报纸和网上也有问卷,但得到的只是上了网和有这份报 刊,而且愿意回答的人的观点。
编辑ppt
17
抽样框是有关总体全部单位的名录。
特点 – 简单、直观,在抽样框完整时,可直接从中抽取样本 – 用样本统计量对目标量进行估计比较方便
局限性 – 当N很大时,不易构造抽样框 – 抽出的单位很分散,给实施调查增加了困难 – 没有利用其他辅助信息以提高估计的效率 所以规模较大的调查中,很少直接采用简单随机抽样, 一般把这种方法与其他方法结合起来使用。
编辑ppt
6
➢二手数据的评估
1. 数据是谁收集的? – 可信度评估
2. 为什么目的而收集的? 3. 数据是怎样收集的? 4. 什么时候收集的?
编辑ppt
7
使用二手数据需要注意的问题
• 应注意数据的含义、计算口径和计算方法,避 免误用或滥用;
• 注意二手数据的时间性,不能用过时的数据; • 应充分搞清这些数据的来源和可靠程度; • 应注明数据的出处,以尊重他人的劳动成果。