第二章 数据的整理与显示讲解
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
第二章 数据的初步整理
三、数据的统计分类
数据的统计分类是指按照研究对象的本质特征,根据分析研究的目的、任 务,以及统计分析时所用统计方法的可能性,将所获得的数据进行分组归 类。 一)分类时应注意的问题 以研究对象的本质特性为基础 分类标志要包括所有的数据 二)分类标志按形式划分,可分为性质类别和数量类别。 1性质类别——是按事物的不同性质进行分类。如,班级、性别、评定等 级等。 2数量类别——是按数值大小进行分类,并排成顺序。
人 数 初 中 高 中 中 专 大 专 本 科 本 科 以 上
To tal To tal 38 15 6 84 3 41 3 38 1 14 89 14 89
百 分 比
3 10 57 27. 4 2 0. 6 10 0.0
复合表
分组的标志有两个及两个以上的表.如表2.6
地区名 宁波 温州 金华
表2.6 三地区幼儿教师学历 学 历
1
2
3
4
5
6
7
8
9
10
身高 X 135 132 132 129 129 129 127 127 125 120 等级 R 1 2.5 2.5 5 5 5 7.5 7.5 9 10
多余 封口线
多余横线
第二章 数据的初步整理
第二节 统计表
二、统计表的种类
1简单表——只列出观察对象的名称、地点、时序或统计指标 名称的统计表为简单表。 2分组表——只按一个标志分组的统计表为分组表。
3标目——是对统计数据分类的项目。 按其位臵,分横标目和纵标目,可添加总标目。 按其内容,分主语和谓语。主语是对象,在横标目上,谓语 是统计指标,在纵标目上。 设计良好的统计表按“主语——谓语——数字”自左向右的 顺序阅读。
初级经济师基础统计数据的整理与显示知识点
统计数据的整理与显示本章知识点【知识点一】品质数据的整理与显示★★★【知识点二】数值型数据的整理与显示★★★【知识点三】统计表★【知识点一】品质数据的整理与显示不同类型的数据,采取的处理方式是不同的。
【总结】适用于低级数据的方法一定适用于高级数据,适用于高级数据的方法不一定适用于低级数据。
(一)分类数据的整理与显示1.频数与频数分布(1)频数(次数):是落在各类别中的数据个数。
(2)频数分布(次数分布):把各个类别及其相应的频数全部列出来。
(3)频数分布表:将频数分布用表格的形式表现出来。
分类数据整理时常用的指标【总结】比例VS比率:比例是部分比总体;比率是部分比部分。
【例如】一个班60个人,男生20个,女生40个。
男生的比例20/60,女生的比例40/60。
男生的百分比33.33%,女生的百分比66.67%。
男生女生的比率20:40。
【注意】人口的性别比就用每100名女性人口所对应的男性人口来表示,如性别比为105:100。
2.分类数据的图示(二)顺序数据的整理与显示方法1.累积频数和累积频率某国有企业工人工资状况2.顺序数据的图示——累积频数分布图【例题·多选题】(2017年)2016年年末,全国共有基层医疗卫生机构93.1万个,其中乡镇卫生院3.7万个,社区卫生服务中心(站)3.5万个,门诊部(所)21.7万个,村卫生室64.2万个。
这一组数据可以通过绘制()来显示。
A.条形图B.累积频数分布图C.圆形图D.直方图E.折线图『正确答案』AC『答案解析』本题考查分类数据的图示。
分类数据的图示方法包括条形图和圆形图,条形图纵置就是柱形图。
【例题·单选题】(2018年)调查人员在某城市抽样调查500名某品牌银行信用卡用户,对该品牌银行信用卡满意度进行研究。
根据调查结果,整理用户满意度累积频数分布表如下:则对该品牌银行信用卡服务表示“非常不满意”的用户占()。
A.56%B.12%C.8%D.4%『正确答案』D『答案解析』本题考查向下累积。
统计学第二章数据搜集整理
普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
统计学(4)
.
第一节 数据的收集
统计报表
按实施 范围分
按调查 范围分
按主管 系统分
按填报 单位分
按报送 方式分
国部地 全 非 基 专 基 综 电 书 家门方 面 全本 业 层 合 讯 面 统统统 统 面统 统 报 报 报 报 计计计 计 统计 计 表 表 表 表 报报报 报 计 报 表 表表表 表 报表 报
明确规定调查资料的起止时间; 调查资料登记时间:是指对调查单位进行调查并取得调
查资料的时间; 调查工作期限:是指从调查工作开始到调查工作结束所
经历的全部时间。 2.调查空间: 调查单位应在什么地点接受调查。
.
第一节 数据的收集
(五)制定调查的组织实施计划 调查的组织计划,是指为确保实施调查的具体工作计划。 调查的组织实施计划应包括以下内容: ➢ 建立调查工作的组织领导机构,做好人员的配备与分工; ➢ 做好调查前的准备工作。如宣传教育、人员培训、文件
重点单位:是指这些单位的标志总量在总体标志总量中占 有绝大比重的单位。
选取重点单位的原则:根据调查任务和调查对象的基本情 况确定选取的重点单位及数量;也要注意选取管理比较健全、 业务能力强、统计工作基础好的单位为重点单位。
特点:调查单位少;调查对象的标志值比较集中于某些单 位的场合。
注意:重点单位的选择是客观的。只适用于客观存在着重 点单位的情况。
注:1.资料来源于《世界概况》,由美国中央情报局(CIA出版)最权威报道; 2.中国2010年人均GDP为4283美元,居世界182个国家的95位。
.
第一节 数据的收集
1.定类尺度(类别尺度、列名尺度) 是对统计客体类别差异所作的反映,是最粗略、计量层次 最低的测量尺度。
数据的整理ppt课件
组距分组
(几个概念)
• 1. 下 限:一个组的最小值 • 2. 上 限:一个组的最大值 • 3. 组 距:上限与下限之差 • 4. 组中值:下限与上限之间的中点值
组中值= 下限值+上限值 2
等距分组表
(上下组限重叠)
表3-5 某车间50名工人日加工零件数分组表
加
☺ ☺☺ ☺☺☺
定序数据频数分布表
(实例 )
【 例 3.2】 在 一 项 城市住房问题的 研究中,研究人 员在甲乙两个城 市各抽样调查300 户,其中的一个 问题是:“您对 您家庭目前的住 房状况是否满意 ?
1.非常不满 意;2.不满意; 3.一般;4.满 意;5.非常满意 。
表3-2 甲城市家庭对住房状况评价的频数分布
其他广告 2
招生招聘广告 10
广 房地产广告
16
告 类 金融广告 9
型 服务广告
51
112
商品广告
0
40
80 人数(人)120
图3-1 某城市居民关注不同类型广告的人数分布
定类数据的图示—圆形图
(圆形图的制作)
1. 也称饼图,是用圆形及园内扇形的面积来表示数 值大小的图形
2. 主要用于表示总体中各组成部分所占的比例,对 于研究结构性问题十分有用
2. 定距和定比数据的排序
– 递增排增序排后序可:表设示一为组:数X据(1)为<XX(21)<,…X<2,X(N…) ,XN,递 – 递减排序可表示为:X(1)>X(2)>…>X(N)
第二节 品质数据的整理与显示
一. 定类数据的整理与显示 二. 定序数据的整理与显示
《统计学》教学课件 第二章 统计数据收集、整理与呈现
全面调查 非全面调查
普查、统计报表制度、抽 样调查、重点调查和典型 调查等是常见的统计调查 方式,其中普查即全面调 查,其余的为非全面调查。
1.普查 普查是根据特定研究目的而专门组织的一次性的全 面调查,以收集研究对象的全面资料。
目前,我国组织实施的普查主要包括人口普查、经济普查和 农业普查三种。
缺然点后:通过典细型致单分析位典的型选单位取以受认人识总为成功经验、找出失败 现(一3)定突的出倾选典向式性。,突出且选典典型式是调指查选结择总体教中训的或先观进察单新位生、事后物进的单情位况或。新生事 果物不作宜为典用型以单推位,算进全行面深入数细据致。的调查。
2.报告法
3.采访法
又称凭证法,指要求调查 由调查人员对被调查者进
对象以原始记录、台帐和 行采访,根据被调查者的
核算资料为依据,向有关 答复来收集数据的方法,
单位提供统计资料的方法。 包括面谈访问、电话访问、
邮寄访问 和网络访问等。
4.登记法 指当事人根据有关法制法规规定,在开展某些活动或 发生某事时,主动到有关机构进行登记,填写有关表 格,提供有关统计信息。
④滚雪球抽样。是一种针对稀疏总体进行的抽样调查,抽选样本时 先找到几个符合条件的调查单位,然后通过这些调查单位找到更多 符合条件的调查单位,以此类推,样本如同滚雪球般由小变大,直 至达到要求的样本数为止。
⑤流动总体抽样。流动总体抽样是采用“捕获—放回—再捕获”的方式 来估计总体。
4.重点调查
重点调查也是一种非全面调查,是对数据收集对象总体 中的部分重点单位进行观测的统计调查方式。
频数(人) 频数(%)
30岁以下
39.3
30-40岁
37.9
40-50岁
第2章 数据收集、整理与显示
4、定比尺度 定比尺度又称比率尺度,它是对事物之间比值的一种测 度。其功能要比定距尺度更强一些,除能区分类别、排 序、比较大小、求出大小差异、可采用加减运算以外, 还可以进行乘除运算; 在计量尺度的应用中,需要注意的是,同类事物采用不 同的尺度量化,会得到不同的尺度数据。如农民收入数 据按实际填写就是定距尺度;按高、中、低收入水平分 就是定序尺度;按有无收入计量则是定类尺度;而说某 人的收入是另一人的两倍,便是定比尺度了。
随着社会主义市场经济的建立与完善,抽样调查在我国 统计调查中的应用领域越来越广泛。
18
(四)重点调查
重点调查是指在调查对象中,只选择少数重点单位进 行的非全面调查。所谓重点单位,是着眼于现象的量的方 面而言,尽管这些单位在全部单位中只是一部分,但它们 在所研究现象的标志总量中却占有绝大的比重,在总体中 具有举足轻重的作用。 (五)典型调查 有意识地选择若干个具有代表性的典型单位进行深入、 周密、系统地调查研究。典型调查的主要目的不在于取得 总体数值,而在于了解与数字相关的生动具体情况。
3.统计分组的原则
穷尽原则,就是使总体中的每一个单位都应有组可归,或 者说各分组的空间足以容纳总体所有的单位。 互斥原则,就是在特定的分组标志下,总体中的任何一个 单位的只能归属于某一组,不能同时归属于几个组。
典型调查
具体的统计调查形式
(一)普查
普查是专门组织的一种全面调查。普查一般是调查 属于一定时点上的社会经济现象的总量,但也可以调查某 些时期现象的总量,乃至调查一些并非总量的指标。 (二)统计报表制度
统计报表制度是我国统计调查方法体系中的一种重 要的组织方式。它是根据国家的统一规定,按统一的表格 形式,统一的指标内容,统一的报送时间,自下而上逐级 提供统计资料的统计报告制度。
第二章 数据的整理与表达
数据 等级(R) 94 1 90 2 89 3 87 4 84 5 77 6 等 72 7 级 69 8 和 ∑ 36
(二)等级分布法
例2-1: 10名学生 的测验分数为:71、 78,58、70、71、70、 58、58、70、58。
有重复数时
表2-3 等级分布表
数据 78 71 71 70 70 70 58 58 58 58 等级(R) 1 2.5 2.5 5 5 5 8.5 8.5 8.5 8.5
1500Ô ª Ò Ô É Ï
800-1500Ô ª
300Ô ª Ò Ô Ï Â 300-800Ô ª
40
30
20
10
Count
0
©µ Ö Ò
160 140 120 100 80 60 40 20 0 三年以上定期 三年以下定期 活期 活期工资帐户 定活两便 各类信用卡
收入水平
1500元以上 800-1500元 300-800元 300元以下
概述 数据的搜集 数据的整理 数据的表达
概述
一、统计数据的用途
• • • • 了解事物特征 发现事物关系 认识事物规律 预测事物未来
二、一次完整的统计过程
统计 设计 准备 阶段
定量认识开始 整理分析前提
搜集数据
统计 整理 承前 启后
统计 分析
对比研究 认识本质规律
第一节 数据的搜集
• 经常性资料
二维图 三维图 象形图
1、直条图
• 含义
– 矩形长短→数量多少
类型
单式:几组性质相似资料的比较 形式 复式:几组性质不同资料的比较 方向 纵条图:以横坐标为基线 横条图:以纵坐标为基线
Õ È Ê ë Ë ® Æ ½
【统计学 精】第二章 统计数据的搜集和整理
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
• 重点调查适用的条件:
•
当统计调查的任务只要求了解调查对象的基本情况,而
调查对象中确实存在重点单位时,比较适宜进行重点调查。
• 例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、 马钢、武钢等几个大型钢铁企业调查,以便对钢铁产量有个大致的了解。
3、抽样调查
•抽样调查是一种非全面调查,是实际中应用最广 。 泛的一种调查方式
(3) 是运用概率的估计方法 。
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
性和时效性。
三、统计分组
(一)统计分组的概念和种类
• 1、定义:统计分组根据统计研究的目的和客 观现象的内在特点,按照某个标志或几个标 志把研究的总体划分为若干性质不同的部分 (或组)的一种统计方法。
统计分组
• 2.兼有“分”和“合”的双重含义: •对于现象总体,是 “分”;对于单位, 是“合”。 • 对于分组标志,是“分”,对于其他标 志,是“合”。
第二章+统计资料的收集、整理与显示
特点
目的是推断总体的数量特征;
抽样误差可以事先计算并控制;
能用较少的人力、物力和时间达到全面调查
作用
的目的; 调查资料的准确性较高、受人为干扰的可能 性较小。
抽样调查应用范围:
1.不能或难以进行全面调查的总体的数量特征。 如无限总体、范围过大的有限总体等,以及具有破坏性的 产品质量检测等; 2.发展变化比较稳定和有规律性而不必进行全面调查的现象总 体的数量特征。
事物发展的一般规律。 行的典型调查。
5、抽样调查 抽样调查是一种专门组织的非全面调查,它是按照随机原 则从调查对象中抽取一部分样本单位进行调查,再用样本指标 推断总体的数量特征的一种调查组织方式。
随 机 原 则
样本单位的抽取不受主观因素及其他 系统性因素的影响,每个总体单位都有均 等的被抽中机会
5、抽样调查 按随机原则抽取样本单位;
3、重点调查 能以较少的投入和较快的速度取得总体基
作用
本情况及变动趋势的资料;
对重点单位的选择不带有主观性
局限
只适用于客观存在着重点单位的情况
4、典型调查 典型调查也是专门组织的一种非全面调查,它是根据调 查研究的目的和任务,在对调查对象有一定了解的基础上,
有意识地选择少数典型单位 进行调查的一种调查组织方式。
统计调查的种类
按调查单位的范围大小分为 按调查时间是否连续分为 按调查的组织方式不同分为 统计报表 专门调查
非全面调查
全面调查
经常性调查 一次性调查
普查
重点调查
典型调查
抽样调查
2、统计调查的种类 (1)按组织形式分为: ①统计报表: 根据统计法规的规定,按一定的表式和要求,自上而下
统一部署,自下而上逐级提供统计资料的一种统计调查方法。
第2章-统计数据的收集整理与显示
C、1750元
2、某连续数列变量,首组为60分以下,其邻组的组中值
为75,则首组的组中值为( )。
A、30 B、35 C、40 D、45
2.5.3 累计频数和累计频率 1.累计频数(cumulative frequencies) 累计频数就是将各有序类别或组的频数逐级累加起来。 2.累计频率或百分比(cumulative percentages) 累计频率就是将各有序类别或组的频率逐级累加起来。
全国总人口为1370536875人。其中: 普查登记的大陆31个省、自治区、直辖市和 现役军人的人口共1339724852人。 香港特别行政区人口为7097600人。 澳门特别行政区人口为552300人。 台湾地区人口为23162123人。
大陆31个省、自治区、直辖市和现役军人的 人口中, 男性人口为686852572人,占51.27%; 女性人口为652872280人,占48.73%。 总人口性别比(以女性为100,男性对女性 的比例)由2000年第五次全国人口普查的 106.74下降为105.20。
§2.1 统计调查的概念和方案的设 计
统计调查:按照 研究目的及要求 ,运用 科学的统计调查方法,有计划、有组织地 向调查对象 搜集 原始资料和次级资料的过 程
广州广播听众调查问卷
目的:了解我市听众收听广州人民广播电台节目的一些 基本情况,为提高节目质量、推出优秀节目提供
科学依据。
对象和单位:广州市市民 调查项目和调查表: 调查什么 调查项目:听众收听广州人民广播电台节目的 一些基本情况 调查表:调查项目以表格的形式来表现。
2. 普查是为了某种特点的目的而进行的( A、专门组织的一次性的全面调查 B、专门组织的经常性的全面调查 C、非专门组织的一次性的全面调查
管理统计学 第2版 第二章 统计数据的收集整理与显示
(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变
种
最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式
统计学第二章
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
超市逐渐成为人们的主要购物场所之一。随着我国加入 WTO,国外的 一些大型零售商也在国内的一些城市开设了连锁超市,这无疑加剧了零 售业的竞争态势。 2003年,一家超市面对业界新的形势,除了在硬件设 施上加大投入外,更希望在服务质量上下功夫。为了解顾客对服务质量 的要求,这家超市随机抽取了 100名前来购物的顾客,让他们填写一份简 单的调查问卷 ,了解顾客的要求并让他们对该店的 服务质量进行评价 。 其中的一个问题是:“您认为本店的服务质量如何?请在下面列出的选 项上划‘√' A.好;B.较好;C.一般;D.较差;F.差。”
适用性:弄清楚数据的来源、数据的口径以及有关的背 景材料,以便确定这些数据是否符合自己分析 研究的需要,是否需要重新加工整理等
时效性:数据是否已经过时。
经过审核后的数据,确认适合于我们的实际需要, 再做进一步的加工整理。
9
二、数据的筛选 :
1、将某些不符合要求的数据或有明显错误的数据 予以剔除。
2、将符合某种特定条件的数据筛选出来,将不符合 特定条件的数据予以剔除
第二章 数据的整理与显示
一、数据的审核与筛选 二、文字型数据的整理与图示 三、数值型数据的整理与图示 四、统计表的使用
1
本章学习的目的:
1、 了解对不同种数据类型的数据处理方法 2 、选择适当的图形和表格将数据展开,以
了解数据的特征 3、 会使用Excel对数据制作频数分布表和
绘制图形 4、 会正确使用统计表
此过程可通过Excel完成。用Excel筛选是查找和处理区 域中数据子集的快捷方法
10
用Excel进行数据筛选的过程: 1 单击要进行数据筛选的任一单元格。再选择“数 据”
菜单中的“筛选”命令,再选择“自动筛选”命 令
11
2 单击数据旁的下拉列表,选择“自动筛选前10个” 例1: 筛选出销售额最多7个销售日
3
表2-1
BEC DAC ADB BAC CBC DAC BEC BAC ADB CBC
表2-1 顾客回答的原始记录 CADCBAE BCDECEE CCAEDCB DEABDDC EDBCCBC BCDECEB CADCBAE DEABDDC CCAEDCB EDBCCBC
4
表2-2 各天销售额的原始数据(万元)
日期 销售额日期 销售额日期 销售额日期 销售额日期 销售额日期 销售额日期 销售额 1-1 234 1-16 152 1-31 187 2-15 155 3-2 183 3-17 182 4-1 177 1-2 143 1-17 161 2-1 141 2-16 167 3-3 225 3-18 177 4-2 189 1-3 187 1-18 162 2-2 214 2-17 168 3-4 178 3-19 184 4-3 209 1-4 161 1-19 163 2-3 149 2-18 172 3-5 234 3-20 185 4-4 189 1-5 150 1-20 196 2-4 178 2-19 194 3-6 153 3-21 186 4-5 190 1-6 228 1-21 164 2-5 223 2-20 173 3-7 179 3-22 186 4-6 175 1-7 153 1-22 226 2-6 170 2-21 196 3-8 144 3-23 178 4-7 191 1-8 166 1-23 165 2-7 180 2-22 174 3-9 179 3-24 187 4-8 160 1-9 154 1-24 165 2-8 171 2-23 165 3-10 188 3-25 205 4-9 197 1-10 174 1-25 179 2-9 233 2-24 175 3-11 172 3-26 173 4-10 197 1-11 156 1-26 215 2-10 172 2-25 233 3-12 181 3-27 194 4-11 174 1-12 203 1-27 180 2-11 210 2-26 175 3-13 182 3-28 189 4-12 198 1-13 159 1-28 175 2-12 172 2-27 190 3-14 237 3-29 195 4-13 200 1-14 198 1-29 196 2-13 168 2-28 207 3-15 187 3-30 195 4-14 201 1-15 160 1-30 218 2-14 211 3-1 176 3-16 188 3-31 202 4-15 196 1-16 152
12
单击数据旁的下拉列表,选择“自定义” 例2:筛选出销售额超过220万元的销售日
13
三、数据的排序 :
按一定顺序将数据排列,以便于研究者通过浏览数 据发现一些明显的特征或趋势,找到解决问题的线 索。 例:销售额排序。单击销量数据列中任一单元格,按 “升序排序”按钮
7
审核数据的方法
逻辑检查:主要用于对分类的数据和顺序的数据审核,它是 从定性角度审核数据是否符合逻辑,内容是否合 理,各项目或数字之间有无相互矛盾的现象。
计算检查:主要用于对数值型数据的审核,可检查调查表中 的各项数据在计算结果和计算方法上有无错误。
8
2、间接数据的审核
对其完整性和准确性进行审核外,还应着重审核数据的 适用性和时效性。
在顾客交回问卷后,就对他们所购买的商品打九五折,以表示感谢。 下面的表2-1是问卷回收后的原始记录。
调查结束后,该超市针对顾客在调查中提出的问题,对员工进行了 培训,以提高服务质量,同时提出了新的营销策略。为比较改善服务质 量以及推出新的营销策略后是否使销售额有所提高 ,超市有对2003年前4 个月各天的销售额进行了统计,结果如表 2-2 。
5
第1节 数据的预处理
数据的预处理是数据整理的先前步骤,它是 在对数据分类或分组之前所做的必要处理, 内容包括数据的审核、筛选、排序等。
6
一、数据的审核 :
1、原始数据的审核: 完整性审核:主要是检查应调查的单位或个体是否有遗 漏,所有的调查项目或指标是否填写齐全等。 准确性审核: (1)检查数据资料是否真实地反映了客观实际情况,内 容是否符合实际; (2)检查数据是否有错误,计算是否正确等。