统计学第二章数据的收集
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 填空式: • 您认为我国目前的广告宣传中,存在的 主要问题是什么? • • 您对这种捷达新款车有何更具体的看法?
• 封闭式问题
• 对问题事先设计出了各种可能的答案,由 被调查者从中选择 • 问题的答案是标准化的,有利于被调查者 对问题的理解和回答,也有利于调查后的 资料整理 • 对答案的要求较高,对一些比较复杂的问 题,有时很难把答案设计周全 • 问题的答案是选择回答型,所以设计出的 答案一定要穷尽和互斥 • 回答方法有:两项选择式、多项选择式、 多项排序式、等级评定式、双向列联式
• • • • •
访问法 (1)面访 (2)电话访问 (3)邮寄访问 (4)互联网调查
2.2.2 收集二手数据
• • • • 1.内部二手数据的收集 2.外部二手数据的收集 3.收集二手数据需要注意的问题 应注意数据的含义、计算口径和计算方法, 避免误用或滥用; • 注意次级数据的时间性,不能用过时的数 据; • 应充分搞清这些数据的来源和可靠程度; • 应注明数据的出处,以尊重他人的劳动成 果。
说明信(范例)
• ××女士/小姐/先生 • 您好!我是××市场调查公司访问员,我 们正在进行一项有关公众医疗保险意识方面的调 查,目的是想了解人们对医疗保险的看法和意见, 以便更好地促进医疗保险事业的发展。您的回答 无所谓对错,只要真实地反映了您的情况和看法, 就达到了这次调查的目的。希望您能积极参与, 我们对您的回答完全是保密的。调查要耽搁您一 些时间,请您谅解。谢谢您的支持与合作!
– 多项单选式:要求被调查者对所给出的 问题答案选择其中的一项 – 多项多选式:要求被调查者对所给出的 问题答案中,选出自己认为合适的答案, 数量不受限制 – 多项限选式:要求被调查者在所给出的 问题答案中,选出自己认为合适的答案, 但数量要受一定限制
• 多项单选式实例
• 您觉得哪种类型的广告宣传效果最好? • (选一项) • 1.电视广告 • 2.广播广告 • 3.杂志广告 • 4.报纸广告 • 5.路牌广告
• 两项选择式 • 1、答案只有两项,要求被调查者选择其中 之一来回答 • 2、优点:被调查者只需在二者之中选择一 项,回答比较容易;调查后的数据处理也 很方便 • 3、缺点:得到的信息量较少;当被调查者 对两项答案均不满意时,很难作出回答 • 例如,您是否购买了笔记本电脑? • A、是 B、否
• 多项选择式 • 在设计问卷时,对一个问题给出三个或三个以上 的答案,让被调查者从中选择进行回答 • 根据要求选择的答案多少不同,有以下类型
2.1.2 数据的类型
对事物进行分类的结果 数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类
顺序数据(rank data)
对事物类别顺序的测度 数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等
数值型数据(metric data)
对事物的精确测度 结果表现为具体的数值 例如:身高为175cm、168cm、183cm
•
3.按与时间的关系分类 截面数据
在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况 比如,2009年北京和上海地区生产总值数据
时间序列数据
在不同时间上收集到的数据 描述现象随时间变化的情况 比如,2000年至2009年北京地区生产总值数据
面板百度文库据
总体中不同总体单位在不同时间上的数据表现 是时间序列数据与截面数据的结合
4. 整车价格合理
5. 驾驶容易
6. 制动性好
3)调查问卷设计中的注意事项
• 问卷中问题项的设计 • (1)提问的内容尽可能短。 • 问题中应该坚决摒弃多余的修饰词,提问 的内容尽可能的短,若问题比较复杂,应将 其分为几个问题来问。 • (2)用词要确切通俗,避免不具 体的问 题 • 问卷中的用词要确切、通俗,应容易被人 理解,应避免使用过于专业的术语;设计 的问题要适合所有被调查者;提问目的要 明确,避免模棱两可。
• 普查的基本形式有两种:一种是设立专门的普查
机构,配备一定的普查人员,对调查单位直接进行登记, 如历次全国人口普查就是采用这种形式;另一种是利用企 事业单位的原始记录和核算资料,设计一系列调查表,这 些基层报告单位根据普查的要求自行填报,如全国科技人 才普查即是如此。
• 全面统计报表 • 统计报表(Statistical Report Forms)是指依照 国家统计局或国家各行政管理部门的规定,自上 而下地统一布置,以一定的原始记录为依据,按 照统一的表式,统一的指标项目,统一的报送时 间与报送程序,自下而上地逐级定期提供基本统 计资料的一种调查方式。
2.3
• (1)准确性 • (2)完整性 • (3)及时性
数据的质量
• 2.3.1 数据的质量要求
2.3.2 数据的误差及防控
• 1.登记性误差 • 这是指调查过程中由于调查者或被调查者 人为的主观因素造成的误差。 • 是可以防止和消除的 • 2.代表性误差 • 这是由于样本的代表性不够,而造成的样 本推断总体指标时与总体指标的真实值之 间的误差,是由于部分单位推断总体时产 生的误差。 • 是不可避免的
第二章 数据的收集
学习目标 1.数据的类型。 2.一手数据和二手数据的收集。 3.统计调查方案的设计。 4.统计表的设计。 5.调查问卷及其设计 6. 调查方式和方法
2.1 数据是什么
• 2.1.1 数据的含义
• • • • 3个基本构成要素 数据名称 数值 数据的计量单位
1.按计量尺度分 分类数据(categorical data)
• 多项多选式实例
• 请问您在购买小轿车时,主要考虑哪些因素? • (选出您认为合适的答案) • 1.价格 6.维修费用 • 2.款式 7.乘坐舒适 • 3.品牌 8.行使平稳 • 4.耗油量 9.加速性能 • 5.售后服务 10.制动性能
多项排序式
1、问题答案有多个,要求被调查者在回 答时,对所选的答案按要求的顺序或 重要程度加以排列。其中,对所选的 的答案数量可以进行一定的限制,也 可以不进行限制 • 2、问题答案不仅可以反映所要调查的 内容,而且可以反映出被调查者对问 题的看法,从而增加了信息量
• 2. 按数据的来源分类 • 原始数据(一手数据) • 原始数据也称为一手数据,是反映被调查 对象原始状况的资料。如原始记录、统计 台帐、调查问卷答案、实验结果等。 • 次级数据(二手数据) • 次级数据也称为第二手资料,是已经存在 的经他人整理分析过的资料。如期刊、报 纸、广播、电视以及因特网上的资料,各 级政府机构公布的资料,企业内部记录和 报告等。
• 您在购买这种牌子的电视机时,主要是 考虑哪些因素? • 1.产品的品牌 • 2.价格合理 • 3.售后服务 • 4.外形美观 • 5.维修方便 • (按重要程度进行排序)
• 等级评定式
• 您对我校教学评估体系总体感觉如何? • A、非常满意 B、比较满意 • C、一般 D、不太满意 E、非常不满意
• 双向列联式
• 1、将两类不同问题综合到一起,通常 用表格来表现 • 2、表的横向是一类问题,纵向是另一 类问题 • 3、这种问题结构可以反映两方面因素 的综合作用,提供单一类型问题无法 提供的信息 • 4、可以节省问卷的篇幅
请在您赞同项目的空格内划“√
神龙富康 1. 耗油量低 2. 外观大方 3. 乘坐舒适 捷 达 桑塔纳
• (5)避免否定形式的提问 • 否定式的提问会影响到被调查者的思维,或容易 造成相反意愿的回答。 • (6)避免敏感性问题 • 敏感性问题是指与个人或单位的隐私或私人利益 有关而不便向外界透露的问题。 • 问卷中要尽量避免提问敏感性问题或容易引起人 们反感的问题,对敏感性问题的调查应当在提问 的方式上进行推敲,尽量采用间接询问的方式, 用语也要特别婉转,以降低问题的敏感程度。 • 你是否在考试中作过弊? • 您是否有酒后驾车行为?
• (3)一项提问只包含一项内容 • 一个问句最好只问一个要点。一个问句中 如果包含过多询问内容,会使被调查者无 从答起,给统计处理也带来困难。 • (4)避免诱导性提问 • 应避免诱导性、暗示性的提问。诱导性提 问会导致两个不良后果:
– 被调查者不加考虑就同意所诱导问题中暗示的 结论; – 由于诱导性提问大多是引用权威或大多数人的 态度,被调查者就会产生心理上的顺向反应。
2.调查表的设计 1)统计表的基本知识 (1)统计表的意义和构成 A)从形式上看 总标题、横行标题、纵栏标题、指标数值 B)从内容上看 主体栏、叙述栏 (2)统计表的种类
2)设计调查表
• • • • • • • • • • (1)统计表设计的一般原则和要求 原则:科学、实用、简明、美观 要求:标题的要求 布局的要求 边框要求 计量单位的要求 序号的要求 填写数据的要求 (2)调查表的设计 表头、表体和表脚 如表2-5
4.调查方式和方法的选择
• 1)调查方式
调查范围
全面调查
非全面调查
普查 全面统计报表 重点调查 典型调查 抽样调查
• 普查(census)
• 定义:为特定目的专门组织的非经常性全面调查 • 特点:通常是一次性的或周期性的;是全面调查,且需
确定标准时间;普查数据的准确性、标准化程度均较高 ; 通常周期性进行;涉及的面广、工作量大、费用高。 • 我国进行的普查主要有 – 人口普查,每10年进行一次,末尾数字为“0”的年份 进行 – 农业普查,每10年进行一次,每逢“6”的年份进行 – 经济普查,每5年进行一次,每逢“3”和“8”的年份进 行
• 抽样调查
• 按一定的原则从总体中抽出部分单位构成 样本的一种方式。 • 是实际中应用最广泛的一种调查方式。 1992年我国的国家调查系统将抽样调查列 为统计调查的主体。 • 与全面调查相比,它具有以下明显的特点:
– 按随机原则抽取样本。 – 推断总体 。 – 抽样误差可事先计算和控制。
• 重点调查(Key-point investigation)
– – – – – 属于经常性(连续性)调查,调查项目相对稳定。 通常是全面调查。 资料的来源是各个基层单位的原始记录。 逐级上报和汇总的。 按报表内容和实施范围不同,分为国家、部门和地方 统计报表 ;按报送周期长短不同,分为日报、旬报、 季报、半年报和年报; 按填报单位不同,分为基层统 计报表和综合统计报表。
调查内容
• 开放式问题
• 对问题的回答未提供任何具体的答案,由被调查者根据 自己的想法自由作出回答 • 属于自由回答型 • 优点:比较灵活,适合于收集更深层次的信息,特别适 合于那些尚未弄清各种可能答案或潜在答案类型较多的 问题。而且可以使被调查者充分表达自己的意见和想法, 有利于被调查者发挥自己的创造力 • 缺点:由于会出现各种各样的答案,给调查后的资料整 理带来一定困难 •
– 从调查对象的全部单位中选择少数重点单位 进行调查 – 调查结果不能用于推断总体
• 典型调查(Model survey)
– 从调查对象的全部单位中选择少数典型单位 进行调查 – 目的是描述和揭示事物的本质特征和规律 – 调查结果不能用于推断总体
2)调查方法
• 不论采用何种调查方式,在取得数据 时都需要使用一些具体的数据搜集方 法。数据的收集方法称为统计调查方 法。归纳起来可分为询问调查和观察 实验两大类。 – 询问调查是调查者与被调查者与被 调查者直接或间接触以获得数据的 一种方法。 – 观察或实验:调查者通过直接的观 察或实验获得数据的方法。
3.调查问卷的设计
• 1)问卷调查的基本知识 • (1)问卷调查是什么 • 调查者根据调查目的和要求设计的,是由 一系列问题、备选答案、说明及代码表组 成的一种调查形式 • (2)问卷调查的类型 • 按填答者的不同分类 • 可分为自填式和代填式问卷调查
• 2)调查问卷的设计
• 调查问卷的流程如下 • 步骤一:确定调查主题 • 步骤二:根据调查主题,确定调查的主要 内容 • 步骤三:根据调查问卷的结构,填写调查 问卷的内容 • 步骤四:调查问卷的试测和修改定稿
2.2 如何收集数据
• 2.2.1 收集一手数据(6W原则) • 1.统计调查方案的设计 1)确定调查目的——why
2)确定调查对象——who 3)确定调查内容 ——what 4)确定调查时间——when 5)确定调查地区——where 6)调查方式与方法 ,组织实施计划 ——how
• • • • • • • •