获取数据的途径
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章统计
9.1 随机抽样
9.1.3 获取数据的途径
教学设计
一、教学目标
1.了解获取数据的途径;
2.掌握实际调查中数据获取途径的选择方法.
二、教学重难点
1.教学重点
获取数据的途径.
2.教学难点
实际问题中数据获取方法的选择与操作.
三、教学过程
(一)新课导入
在统计调查中,获取数据的途径多种多样,像统计报表和年鉴、社会调查、普查和抽样、互联网、试验设计等等都是常见的.下面介绍获取数据的一些基本途径.
(二)探索新知
1.通过调查获取数据
对于有限总体问题,如人口总数、城乡就业状况、农村贫困人口脱贫状况、生态环境改善状况、青少年受教育状况、高中生近视的比例、产品合格率、高中生日平均上网时间等问题,一般通过抽样调查或普查的方法获取数据.
针对不同问题的特点,为了有效收集所需数据,除了我们已经学过的简单随机抽样和分层随机抽样,还有系统抽样、整群抽样、不等概率抽样、自适应抽样、两阶段抽样等很多其他的方法.在实际应用中,关键在于是否能充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误.
2.通过试验获取数据
试验是获取样本观测数据的另一种重要途径.例如,要判断研制的新药是否有效、培育的小麦新品种是否具有更高的产量等情况,没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据.又如特种钢、轮胎的配方和产品质量等,也需要通过试验获取样本观测数据.
通过试验获取数据时,我们需要严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.在统计学中,这种安排试验的学问叫做“试验设计”.
3.通过观察获取数据
在现实生活中,很多自然现象都不能被人类所控制,如地震、降水、大气污染、宇宙射线等.自然现象会随着时间的变化而变化,不能用已经学过的有限总体来刻画,也就不能用抽样的方法获取观测数据;另一方面,由于自然现象不能被人为控制,也不能通过试验获取观测数据.研究这类现象,只能通过长久的持续观察获取数据.
对于各个不同的行业,往往需要专业测量设备获取观测数据.随着科技水平的提高,专业测量设备的自动化程度越来越高,通过观测获取和存储数据的成本越来越低,这成为大数据产生的根源.一般地,通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,这些信息十分宝贵,统计学理论和方法是挖掘这些信息的强有力的工具之一.
4.通过查询获得数据
我们感兴趣的问题,可能有众多专家研究过,他们在研究中所收集的样本观测数据可能存储于学术论文、专著、新闻稿、公报或互联网上.这些数据是宝贵的财富,我们可以收集前人的劳动成果并加以利用,从而减少收集数据的成本.我们往往把这样获得的数据叫做二手数据.国家统计局是我国最主要的统计数据收集和发布的部门,调查统计的数据涉及经济、社会、民生的方方面面.国家统计局的统计数据通过多种形式进行公布,例如定期发布新闻稿、举办新闻发布会、发布统计公报、出版各类统计资料等.统计公报有年度统计公报、经济普査公报、人口普查公报、农业普查公报等;统计资料出版物有《中国统计摘要》、以《中国统计年鉴》为代表的统计年鉴系列等.
例如,我们想了解2014年全国的交通事故情况,通过查找《中国统计年鉴》可以得到如表9.1-3所示的数据.如果我们关心机动车交通事故逐年变化的情况,那么需要通过查找每年的数据表,并把它们合并整理.
随着信息技术的发展,通过互联网获取数据越来越成为获取二手数据的主要方式.例如,可以从国家统计局的官方网站查询得到国家统计局公布的各种统计数据.在网络上,也有专门提供数据服务的公司,它们
提供政府部门允许公开的各类数据.
互联网的最大优势是,人们可以利用强大的搜索功能,在整个网络上查找所需要的数据.但从网络上查找的数据,因为数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真,为进一步的数据分析奠定基础.
(三)小结作业
小结:
获取数据的四个途径:(1)通过调查获取数据;(2)通过试验获取数据;(3)通过观察获取数据;(4)通过查询获得数据.
作业:
四、板书设计
9.1.3 获取数据的途径
获取数据的途径.