第二章统计数据的整理
第2章统计数据的搜集与整理精品PPT课件
▪ 优点:应用范围广、结果正确、直接
▪ 缺点:成本高、研究时间长。
统计学
2-15
统计调查的组织方式
►统计报表
▪ 依据国家统计局或国家各行政管理的规定,自上而下 地统一布置,以一定的原始记录为依据,按照统一的 表式、指标、时间和程序自下而上地逐级提供基本统 计资料的调查方式。
►专门调查
▪ 普查
▪ 抽样调查
▪ 重点调查
►重点单位是指在全体中虽然数目不多,所占比不 大,但调查标志值却占较大比重。
▪ 典型调查
►有意识地选择有典型意义或具有代表性的单位。
统计学
2-16
统计报表
►是我国定期搜集基本统计资料的一种重要形式。 ►特点
▪ 来源于基层单位的原始记录 ▪ 项目稳定,有利于资料积累和动态比较
►种类
▪ 国家、部门和地方统计报表 ▪ 全面统计报表和非全面统计报表 ▪ 定期报表和年报 ▪ 基层表表和综合报表 ▪ 电讯报表和书面报表
►统计调查方法
▪ 现场观察法、报告法、问卷法、访谈法、实验 采集法等。
►统计调查的组织方式
▪ 统计报表 ▪ 专门调查
统计学
2-12
抽样调查方案
►确定调查目的(为什么调查) ►确定调查对象和调查单位
▪ 有许多性质相同的调查单位组成的现象总体。 ▪ 调查单位:所要研究的个体。
►确定调查项目:调查中所要调查单位的特征。 ►设计调查表与问卷设计 ►选择调查方法 ►确定调查时间和调查期限 ►制定调查的组织实施计划
统计学
2-13
统计调查方法
► 现场观察法
▪ 带有明确的目的到现场,直接观察获得数据信息。 ▪ 优点:准确;缺点:成本大
► 报告法(通讯法)
统计学第2章 统计数据的搜集、整理和显示
第二节 数据整理
三、统计指标
(二)统计指标的分类
1. 数量(总量)指标
作用:反映现象的总规模、总水平或工作总量 以绝对数表示(国内生产总值、人口总数、工资总额等) 分类 总体单位数、总体标志总量 时期指标、时点指标 实物指标、价值指标和劳动量指标
第二节 数据整理
三、统计指标
搜集数据的两条途径:统计调查 + 实验 统计调查 —— 调查数据;实验 —— 实验数据 1. 确定调查目的 2. 确定调查对象和调查单位 3. 确定调查项目 4. 调查表格和问卷设计(一览表、单一表,要求简明扼要) 5. 确定调查时间(调查时间、调查期限) 6. 确定调查的组织实施计划
(三)统计调查的方案设计
上限不在内
等距分组与异距分组
等距分组
各组的标志值变动都限于相同的范围 优点:便于计算、绘制统计图 适用场合
异距分组
第一,标志值分布很不均匀的场合 第二,标志值相等的量具有不同意义的场合 第三,标志值按一定比例发展变化的场合
品质分组 单项式分组 间断组距式分组 数量分组 组限 连续组距式分组 组距式分组 等距式分组
6组:530 530 530 540 620 620 620 620 720 720 7组:720 720 630 630 630 630 620 620 620 620
8组:650 650 650 650 650 650 650 650 650 650
提问:从上述资料中,同学们能否直接看出该车间总的生产完成
类型分组
“日产量”分组
500以下 500 500以上 合计
第二章第二节 统计整理
第二节统计整理一、统计整理的概念和意义统计整理是指根据统计研究的目的和任务,对统计调查或科学实验获得的大量原始资料进行科学的分类、汇总,或对已经加工过的资料进行再加工,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料的工作过程。
通过统计调查或实验,我们取得了大量的原始资料,但这些原始资料一般是分散的、不系统的个体资料。
它们只能说明总体各单位的具体情况,而不能说明总体特征,难以反映总体的全貌情况。
用这样的资料,无法从总体上认识和研究社会经济现象的数量表现,无法揭示社会经济现象发展变化的本质和规律。
因此,必须对这些分散的、不系统的个体资料采用科学的方法进行加工、整理、汇总,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料,并以此计算各种反映总体特征的综合指标,认识社会经济现象的总体特征和全貌,认识、分析社会经济现象的本质和发展变化规律。
可见,统计整理不是单纯的数据汇总,而是运用科学的方法,对调查资料进行分类和综合,从感性认识上升到理性认识。
它是从对社会经济现象个体量的认识到社会经济现象总体量的认识的连接点,是统计调查的继续,是统计显示与分析的前提和基础,在整个统计工作中起着承前启后的作用。
统计数据整理的质量,直接影响着统计工作的成果。
二、统计整理的内容统计整理的内容,主要包括以下几个方面:(1)对原始资料进行审核与检查,如果发现被调查单位的资料不齐全或有差错,要及时查询订正。
(2)对各项指标进行综合汇总,并按调查和分析目的的要求进行各种分组,汇总出各组单位数和各项指标的总数。
(3)将汇总的结果编制成统计表与统计图,以便进一步分析和应用。
三、统计整理的方法与步骤(一)统计分组统计分组是根据研究的任务和对象的特点,按照某种分组标志将统计总体分为若干组成部分。
理解统计分组的概念要注意三点:(1)统计分组的对象是总体。
(2)统计分组应有分组标志。
(3)统计分组对总体而言是“分”,对总体单位而言是“合”。
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
第二章统计数据的采集与整理
Page 16
3、统计报表制度的种类
(1)按照调查的实施范围不同,可分为国家 统计报表、业务部门统计报表和地方统计报表
(2)按照报送周期不同,可分为定期报表和年报。
(3)按照报送的方式不同,可分为电讯报表和邮 寄报表。
Page 17
17
4、统计报表的资料来源
(1)原始记录:是指基本单位通过一定的表格 , 形式对其产生经营活动的最初直接记录。例如: 工业生产企业的收货单、发货单、出勤记录、 生产记录等,商业企业的发票、收据等。 (2)统计台账:是基本单位根据填报统计报 表的要求和实现本单位生产经营管理的需要而 设置的,将原始记录按时间顺序设置的系统积 累统计资料的表册。例如,工业生产企业的设 备台账、产品台账、工时台账等。
Page 4
4
2、静态数据和动态数据 静态数据是指被调查的总体现象在一定时间 一定空间表现的最终成果。
动态数据是指被调查的总体现象在某一时期内 连续变动的最终成果。
静态数据可以通过直接调查取得,动态数据则 只能通过连续的登记取得。
Page 5
5
二、统计数据的采集及分类
统计数据的采集又称为统计调查,就是根据调查 的任务和要求,采取科学的调查方法,有目的、
Page 20
20
(2)填表说明。它是对统计报表的统计范围、 指标等作出的规定,具体有: 填报范围:即统计报表的范围,规定每种统计 报表的报告单位和填报单位,各级统计部门与主管 部门的范围等。 指标解释:对列入表的统计指标的口径,计算 方法以及其它有关问题的具体说明。 分类目标:有关统计报表主栏中应进行填报的 有关项目的分类。 ④其他有关事项的规定:除了以上各项规定以 外的一些注意事项,如:报送日期,报送方式, 报送份数等。
第2章-统计数据的来源与整理(3学时)
70
60
50
40
30
20
10
横坐标代表广告投入, 而纵坐标代表销售收入。 看得出有何种关系吗?
0 2 4 6 8 10 12 14
额 销售
0
广告投入
定量变量间的关系
• • • • • • 能否从该数据回答下面问题: 这两个变量是否有关系? 如果有,它们的关系是否真实的(显著)? 这些关系是什么关系,能否用数学模型来描述? 这个关系是否带有普遍性? 这个关系是不是因果关系?
搜集数据的基本方法
调查的数据
实验的数据
自填式
面访式
电话式
自填式问卷调查
1. 没有调查员协助的情况下由被调查者自己完成 调查问卷
– 问卷递送方法有:调查员分发、邮寄、网络、媒体
• •
要求调查问卷结构严谨,有清楚的说明 弱点
– – – – 问卷的返回率比较低 不适合结构复杂的问卷 调查周期比较长 数据搜集过程中出现的问题难于及时采取调改措施
统计数据的来源与整理
第 2 章
§2.1 §2.2 §2.3 §2.4
数据的搜集与整理
数据案例 数据的计量与类型 统计数据的收集 统计数据的整理
数据案例
案例:证券交易数据
案例:成都市居民理财行为调查
• 提高居民的财产性收入成为经济发展 目标 • 成都居民理财情况具有代表性的 • 调研目的
–商业银行个人理财产品的市场定位 –制定提高居民财产性收入的政策
1. 对现象进行计量的结果 2. 不是指单个的数字,而是由多个数据构成 的数据集 3. 不仅仅是指数字,它可以是数字的,也可 以是文字的
统计数据的分类
• 统计数据的分类
• 按计量层次 • 按收集方法 • 按时间状况
第2章 统计数据的搜集、整理与显示
1)单项式分组与组距式分组
A)单项式分组:用一个变量值作为一组,形成单项 式变量数列。 变量值又称标志值。按数量标志分组,数量标志的 表现,就是变量的取值 单项式分组一般适用于离散型变量且变量变动范围 不大的场合。 B)组距式分组:将变量依次划分为几段区间,一段 区间表现为“从……到……”距离,把一段区间内的 所有变量值归为一组,形成组距式变量数列。区间 的距离就是组距。 连续型变量或者变动范围较大的离散型变量,适宜 采用组距式分组。
1、向上累计频数(或频率)分布:先列出各 组的上限,然后由标志值低的组向标志值高 的组依次累计。向上累计频数表明某组上限 以下的各组单位数之和是多少,向上累计频 率表明某组上限以下的各组单位数之和占总 体单位数比重的大小。 2、向下累计频数(或频率)分布:先列出各 组的下限,然后由标志值高的组向标志值低 的组依次累计。向下累计频数表明某组下限 以上的各组单位数之和是多少,向下累计频 率表明某组下限以上的各组单位数之和占总 体单位数比重的大小。
16
二、统计分组
(一)统计分组的概念与种类 根据统计研究的目的和客观现象的内在特点,按某 个标志(或几个标志)把被研究的总体划分为若干 个不同性质的组,称为统计分组。
分组的性质:兼有分和合双重含义。 穷尽原则,使总体中的每一个单位都应有组可归,或者说 各分组的空间足以容纳总体所有的单位。 互斥原则,在特定的分组标志下,总体中的任何一个单位 的只能归属于某一组,而不能同时或可能归属于几个组。
特点:可以了解较详细的情况,但无法对现象总体的数量特
征作出准确的推算,也无法测算调查误差。
适用场合 :当调查任务只要求掌握基本情况,而部分单位
管理统计学 第二章 统计数据的搜集与整理
• 计算相对数的基本公式为:
相 对 数 =比 较 数 值 ( 比 数 ) 基 础 数 值 ( 基 数 )
• 相对数的种类很多,根据其表现形式可分为两类:
一类是有名数,即凡是由两个性质不同而又有联系的绝对 数或平均数指标对比计算所得的相对数,一般都是有名数,而 且多用复合计量单位,如人口密度、人均占有土地和人均国内 生产总值等。
• 总体和个体的概念不是固定不变的, 均工资水平、学生的智商。
我们能否得到A部队的患病率较高的结论。 一家移动 公司最近宣布它将从东南亚运营机构裁减80名职员。
随着研究目的的不同,它们二者是会 也就是说,数值可以是区间内的任意点。
询问法、观察法和实验法三种。
统计总体按其包含的单位数分,可分成:有限总体和无限总体两类。
– 询问法、观察法和实验法三种。 我们关心什么变量?变量的性质是什么?
也就是说,离散变量表现为某些数值,各个可能的数值之间存在间隙。
定性
– 除了以上三种主要的调查方法外,还有计算机 连续变量:如果得到的一组可能结果是区间集合内的任意数值,那么我们称这种定量变量为连续变量。
相对数通常用百分比、千分比或万分比等来表示。
根据Gallop公司的调查结果,我们很想证实是否 有足够的证据让我们得出以下结论:80%以上的 消费者愿意通过互联网利用信用卡进行购物。
1.我们关心什么变量?变量的性质是什么?
2.测量指标是什么?
【例2-3】 在下列事项中采用什么测量指标 能够最好地描述相关信息?
A.一家移动 公司最近宣布它将从东南亚运营机构裁减80名职员。 B.天气预报说,昨天下午1点53分观察到的温度值突破了新加坡的 记录。 C.一家大公司的人力资源管理部门想要调查员工是否对在职培训感到满
第二章统计数据资料的搜集与整理
分类:
按报送范围: 全面报表——要求调查对象中的每一个 单位均要填报 非全面报表——只要求一部分调查单位 填报 按报送日期: 月报、季报、年报 月报内容简单、时效性强 年报内容比较全面
(二)报告法
基层单位根据上级的要求,以各种原始 记录与核算资料为基础,搜集各种资料, 逐级上报给有关部门
统计报表制度
(三)观察与实验
调查者通过直接的观察或实验获得数据 的一种方法
1.直接观察法
是指就调查对象的行动和意识,调查人 员边观察边记录以收集信息的方法
由于调查人员不是强行介入,受访者无 需任何反应,因而常能够在被观测者不 觉察的情况下获得信息资料
第二章 统计数据资料的搜集与整理
第一节 统计数据资料的来源
一、统计数据资料的来源渠道 直接来源
是通过直接的调查获得的原始数据, 一般称之为第一手或直接的统计数据 主要通过统计调查获得 间接来源 是别人调查的数据,并将这些数据进 行加工和汇总后公布的数据,通常称之 为第二手或间接的统计数据
二、统计数据资料的间接来源
内容:
表式 由国家统计部门根据研究的任务 与目的而专门设计制定的统计报表表格, 用于搜集统计资料。是统计报表制度的 主体
填表说明 是对统计报表的统计范围、 指标等做出的规定,具体有填报范围、 指标解释、分类目录、其他有关事项的 规定
(四)重点调查
概念:是在调查对象中选择一部分重点 单位进行的一种非全面调查。
市场调查和社会调查常用方法
2.邮寄调查
是通过邮寄或宣传媒体等方式将调查表 或调查问卷送至被调查者手中,由被调 查者填写,然后将调查表寄回或投放到 指定收集点的一种调查方法
【统计学 精】第二章 统计数据的搜集和整理
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
• 重点调查适用的条件:
•
当统计调查的任务只要求了解调查对象的基本情况,而
调查对象中确实存在重点单位时,比较适宜进行重点调查。
• 例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、 马钢、武钢等几个大型钢铁企业调查,以便对钢铁产量有个大致的了解。
3、抽样调查
•抽样调查是一种非全面调查,是实际中应用最广 。 泛的一种调查方式
(3) 是运用概率的估计方法 。
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
性和时效性。
三、统计分组
(一)统计分组的概念和种类
• 1、定义:统计分组根据统计研究的目的和客 观现象的内在特点,按照某个标志或几个标 志把研究的总体划分为若干性质不同的部分 (或组)的一种统计方法。
统计分组
• 2.兼有“分”和“合”的双重含义: •对于现象总体,是 “分”;对于单位, 是“合”。 • 对于分组标志,是“分”,对于其他标 志,是“合”。
第二章+统计资料的收集、整理与显示
特点
目的是推断总体的数量特征;
抽样误差可以事先计算并控制;
能用较少的人力、物力和时间达到全面调查
作用
的目的; 调查资料的准确性较高、受人为干扰的可能 性较小。
抽样调查应用范围:
1.不能或难以进行全面调查的总体的数量特征。 如无限总体、范围过大的有限总体等,以及具有破坏性的 产品质量检测等; 2.发展变化比较稳定和有规律性而不必进行全面调查的现象总 体的数量特征。
事物发展的一般规律。 行的典型调查。
5、抽样调查 抽样调查是一种专门组织的非全面调查,它是按照随机原 则从调查对象中抽取一部分样本单位进行调查,再用样本指标 推断总体的数量特征的一种调查组织方式。
随 机 原 则
样本单位的抽取不受主观因素及其他 系统性因素的影响,每个总体单位都有均 等的被抽中机会
5、抽样调查 按随机原则抽取样本单位;
3、重点调查 能以较少的投入和较快的速度取得总体基
作用
本情况及变动趋势的资料;
对重点单位的选择不带有主观性
局限
只适用于客观存在着重点单位的情况
4、典型调查 典型调查也是专门组织的一种非全面调查,它是根据调 查研究的目的和任务,在对调查对象有一定了解的基础上,
有意识地选择少数典型单位 进行调查的一种调查组织方式。
统计调查的种类
按调查单位的范围大小分为 按调查时间是否连续分为 按调查的组织方式不同分为 统计报表 专门调查
非全面调查
全面调查
经常性调查 一次性调查
普查
重点调查
典型调查
抽样调查
2、统计调查的种类 (1)按组织形式分为: ①统计报表: 根据统计法规的规定,按一定的表式和要求,自上而下
统一部署,自下而上逐级提供统计资料的一种统计调查方法。
第2章-统计数据的收集整理与显示
C、1750元
2、某连续数列变量,首组为60分以下,其邻组的组中值
为75,则首组的组中值为( )。
A、30 B、35 C、40 D、45
2.5.3 累计频数和累计频率 1.累计频数(cumulative frequencies) 累计频数就是将各有序类别或组的频数逐级累加起来。 2.累计频率或百分比(cumulative percentages) 累计频率就是将各有序类别或组的频率逐级累加起来。
全国总人口为1370536875人。其中: 普查登记的大陆31个省、自治区、直辖市和 现役军人的人口共1339724852人。 香港特别行政区人口为7097600人。 澳门特别行政区人口为552300人。 台湾地区人口为23162123人。
大陆31个省、自治区、直辖市和现役军人的 人口中, 男性人口为686852572人,占51.27%; 女性人口为652872280人,占48.73%。 总人口性别比(以女性为100,男性对女性 的比例)由2000年第五次全国人口普查的 106.74下降为105.20。
§2.1 统计调查的概念和方案的设 计
统计调查:按照 研究目的及要求 ,运用 科学的统计调查方法,有计划、有组织地 向调查对象 搜集 原始资料和次级资料的过 程
广州广播听众调查问卷
目的:了解我市听众收听广州人民广播电台节目的一些 基本情况,为提高节目质量、推出优秀节目提供
科学依据。
对象和单位:广州市市民 调查项目和调查表: 调查什么 调查项目:听众收听广州人民广播电台节目的 一些基本情况 调查表:调查项目以表格的形式来表现。
2. 普查是为了某种特点的目的而进行的( A、专门组织的一次性的全面调查 B、专门组织的经常性的全面调查 C、非专门组织的一次性的全面调查
第二章统计数据的搜集与整理
第⼆章统计数据的搜集与整理第⼆章统计数据的搜集与整理(⼀)教学⽬的通过本章的学习,了解统计数据搜集与整理的基本理论与⽅法,掌握各种⽅法的特性。
(⼆)基本要求要求灵活运⽤各种数据搜集的⽅式⽅法,并对所得数据进⾏加⼯整理,为以后各章学习打下基础。
(三)教学要点1、数据搜集的⽅式⽅法;2、统计调查⽅案的设计;3、统计分组;4、变量数列的编制;5、统计数据的显⽰。
(四)教学时数9课时(五)教学内容本章共分四节:第⼀节数据的计量与类型⼀、数据的计量尺度在计量学的⼀般分类⽅法中,依据对事物计量的精确程度,可将所采⽤的计量尺度由低级到⾼级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和⽐尺度。
1.定类尺度定类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样⼀种品质标志,按照它可对研究客体进⾏平⾏的分类或分组,使同类同质,异类异质。
例如,按照性别将⼈⼝分为男、⼥两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。
这⾥的“性别”和“经济性质”就是两种名类尺度。
名类尺度是最粗略、计量层次最低的计量尺度,利⽤它只可测度事物之间的类别差,⽽不能了解各类之间的其他差别。
名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可⽤不同数字或编码表⽰不同类别。
⽐如⽤1表⽰男,0表⽰⼥;⽤1表⽰国有企业,2表⽰集体企业,3表⽰私营企业,等等。
这些数字只是不同类别的代码,决不意味着它区分了⼤⼩,更不能进⾏任何数学运算。
名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2.定序尺度定序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样⼀种品质标志,利⽤它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。
例如“产品等级”就是⼀种测度产品质量好坏的顺序尺度,它可将产品分为⼀等品、⼆等品、三等品、次品等;“考试成绩”也是⼀种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某⼀事物的态度”作为⼀种顺序尺度,可将⼈们的态度分为⾮常同意、同意、保持中⽴、不同意、⾮常不同意,等等。
2 统计整理(第二章)含作业
某班级统计学成绩分布表
考试分数 60以下 60—70 70—80 80—90 90—100 合计 (各组变量值) (次数) 人数(人) 2 7 11 12 8 40 频率(%) 20.0 30.0 27.0 17.0 5.0 100.0 (频率)
二、统计表的结构 总标题 主词 横行标题 分标题 纵栏标题 宾词 标数值
(详见教材页例表2-5)
三、编制统计表的注意事项
第一:标题应十分简明地概括所要反应的内容
第二:主词各行和宾词各栏,一般应按先局部后整体
的原则排列
第三:表中必须注明数字资料的计量单位
第四:表中数字上下位置要对齐 第五:统计表一般是开口式,表的左右两端不画纵线,
五、统计分组体系 简单分组与平行分组体系 将社会经济总体只选择一个标志分组称 为简单分组。 对同一总体选择两个或两个以上的标志 分别进行简单分组,排列起来,即成为 平行分组体系。
例:研究攀枝花学院学生情况的时候,对全校的 学生进行简单分组
按学科性质来分 : 按学历层次来分:按性别来分: 管理学 医学 文学 工学 本科 专科 男 女
第二章第二节
统计整理
一、统计整理的意义和内容
意义:使原始资料系统化、条理化、科学化, 从而能够实现对客观事物认识从量的分析到质 的认识。
内容:审核、分组或分类、汇总、编表、系统 积累
统计整理的步骤 1、对原始资料进行审核 2、数据的分类汇总
3、编制统计表或绘制统计图
4、数据的保管和发布
二、统计分组的概念和意义
4、有一个学生考试成绩为70分,在统计分组中,这个变 量值应归入( )。 A、60---70分这一组 B、70---80分这一组 C、60-70或70-80两组都可以 D、作为上限的那 一组 5、某主管局将下属企业先按轻、重工业分类,再按企业规 模分组,这样的分组属于( )。 A、简单分组 B、复合分组 C、分析分组 D、 结构分组 6、有20 个工人看管机器台数资料如 下:2,5,4,4,3,4,3,4,4,2,2,4, 3,4,6,3,4,5,2,4。如按以上 资料编制分配数列,应采用( ) A.单项式分组 B.等距分组 C.不等距分组 D.以 上几种分组均可以 7、次数分配数列是( ) A.按数量标志分组形成的数列 B.按品质标志分组 形成的数列 C.按统计指标分组所形成的数列 D.按数量标志和品 质标志分组所形成的数列
2 第二章 统计资料的收集和整理
二、资料的搜集
(Collection of Data) 要求:原始数据准确、完整、及时。 资料的主要来源: 1.经常性资料:①统计报表:国家统一 制定并要求定期逐级上报的报表;②报 告卡(单);③日常医疗卫生工作记录。 2.一时性资料:①专题调查(不施加 处理因素);②实验(试验)研究(施 加处理因素) 。
三类资料间关系
例:一组2040岁成年人的血压
等 级 资 料
<8 8 12
低血压 正常血压 轻度高血压
计量资料 计数资料
15
17
中度高血压
重度高血压
以8kPa和12kPa为界分为正常 与异常两组,统计每组例数
第三节 统计工尽可能少的人力、财力及物力达到 预期的研究目的。设计是后三个步骤的 依据,是统计工作中最关键的一步。 方法:应遵循对照、齐同、随机和重复4个 基本原则。医学科研设计有调查设计和 实验设计。调查设计包括专业设计和统 计设计,统计设计包括资料搜集整理与 分析全过程的统计设想和安排;实验设 计包括动物实验、临床试验、社区干预 实验。
第二节 统计资料的类型
计量资料
(measurement data) 对每个观察单位用定量的方 法测定某项指标数量的大小所收 集的资料称为计量资料,一般有 度量衡单位。与计数资料的主要 区别在于观察单位之间只有量的 差别,没有质的不同。
计数资料
(enumeration data)
将观察单位按照某种性质或 类别进行分组,然后计数各组的 观察单位数所收集的资料称为计 数资料。与计量资料的主要区别 在于观察单位之间只有质的不同, 没有量的差别。
数值变量
(numerical variable)
数值变量又称为定量变 量,是指相同性质的观察单 位所具有的变量值是定量的, 表现为数值大小,一般有度 量衡单位,大多数数值变量 属于连续性变量。
管理统计学 第2版 第二章 统计数据的收集整理与显示
(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变
种
最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式
统计学第二章
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
统计学基础2 3
一、绝对数和相对数
(一)绝对数
绝对数(亦称总量指标)是统计资料经过汇总整理后得到的反映总体规模和水平的总和指标。
作用(1)反映一个国家的国情和国力,一个地区或一个企业的人力、物力、财力。
(2)是进行经济核算和经济活动分析的基础。
(3)是计算相对指标和平均指标的基础。
分类:按反映总体的பைடு நூலகம்容分:变量总值/单位总数
3.在确定集中趋势指标的过程中,算术平均数比中位数和众数使用了更多的数据信息。
4.对于钟形分布且数据量很大时,三种集中趋势指标有如下三种数量关系:
应用平均指标的原则
1.必须是同质的量方可平均;
2.总平均数与组平均数结合分析;
3.集中趋势与离散趋势结合分析.
三、离散趋势的测定
标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干组,对于定量数据就是依据属性数值的不同将数据划分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键
变量的选择,选择与研究的问题有关的变量。
组限的确定。应遵循穷尽和互斥原则。
定性数列编制:
组限的确定一般比较简单。
定量变量编制:
分为单项数列和组距数列两种形式。
3.确定组限
应能把现象的不同类型划分出来。
要考虑到数据是连续性变量还是离散型变量。
无法确定实际数据的取值范围,或者数据中存在极端数值,可采用开口组的形式。
4.确定组中值:(上限+下限)/2,开口组
二、统计数据的展示
当统计数据比较多时,就应该制作表格或者图形进行展示,使数据的重要特性能从表格或者图形中直观地反映出来,这样可提高分析数据和解释数据的效率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章统计数据的整理【学习目标】本章主要介绍有关统计数据整理的基础知识,包括数据整理的含义及其重要性、数据整理的内容、数据分组的意义、分组的类型和方法、经济统计中的常用分类、分配数列的含义和类型、一些分配数列中的概念、变量数列的编制方法、统计表的构成和编制、各种统计图的绘制等,这些内容对以后学习统计数据的描述有着重要的作用。
学习时要求掌握统计数据整理的最基本理论,在此基础上熟练掌握主要的整理操作方法,能够根据不同的统计原始数据编制相应的分配数列,并能根据所编制的数列编制恰当的统计表和绘制适当的统计图。
【重点难点】1.数据整理的内容2.数据分组的类型和方法3.经济统计中的常用分类4.变量数列的编制方法5.统计表的编制6.各种统计图的绘制【学习内容】第一节统计整理的意义和内容一、统计数据整理的意义统计数据整理,就是根据统计研究的任务与要求,将调查所得到的大量原始资料进行科学的加工、分类、汇总,使之条理化、系统化,得出能够反映总体综合特征的统计资料的工作过程。
大量数据收集上来以后,并不能直接用来分析,因为这些数据间的差异仍然体现为一种原始的无序的状态,只有经过整理后我们才能找出现象的规律性。
例如,通过人口普查,可以取得每个人的性别、年龄、民族、文化程度和婚姻状况等个体资料,这仅说明单个人的具体情况,然而,通过对普查人口资料的整理,就可以得到全国及各地区的人口总数、人口性别结构、民族构成、年龄结构等反映全国人口综合特征的统计资料,达到对全国人口的全面、系统的认识。
统计数据的整理工作在统计工作过程中具有十分重要的地位,它实现了从调查得到的大量个别单位的标志表现向说明总体数量特征的指标数值的过渡,是人们对社会经济现象从感性认识上升到理性认识的连接点。
同时,统计整理又是统计分析的前提,如果不对统计资料进行整理,就得不到必要的统计分组和变量数列,也得不到科学合理的统计图表,就无法计算统计分析指标,也就谈不上进一步的统计分析了。
可见,统计数据整理既是统计调查的继续和深化,同时又是统计分析的基础和前提,具有承前启后的作用。
如果这一步工作搞不好,将会使调查来的丰富、完备的资料失去价值,从而也不能达到统计工作的目的和完成统计工作的任务。
二、统计数据整理的内容统计数据整理的内容主要包括以下几个方面:(一)统计数据的预处理——调查资料的审核为了确保统计工作的质量,在统计调查资料汇总整理前,首先要做好原始资料的审核和检查工作。
因为资料一经汇总,原始资料中的差错就会被掩盖起来,会影响到整个统计工作的质量,故在整理之前必须对调查资料作严格审查。
对原始资料的审核主要包括以下三个方面:1.及时性审核资料的及时性,是检查资料是否符合调查方案规定的时间以及资料是否按规定的时间报送等。
任何单位的资料不能及时取得,都将会影响整个统计工作的进程,对于某些时效性较强的问题,如果统计数据过于滞后,就失去了研究的意义。
2.完整性审核资料的完整性,一是检查调查表是否都已收齐;二是要检查调查表中所填写的项目有无遗漏,是否齐全等。
对于不完整的资料,应采取适当的措施加以补救,避免出现大的数据偏差。
3.正确性审核资料是否正确是审核资料的重点。
审核办法主要有以下两种:一是逻辑检查法。
即检查调查资料各项目之间的关系是否合乎逻辑,有无不合理或相互矛盾的现象。
例如,人口调查中,少年儿童年龄段的居民不应有婚姻情况,人口数量不应小于家庭户数;工业调查中,工业总产值应大于工业净产值,全年产值应大于每个季度的产值,等等。
二是计算检查法。
即检查资料的统计口径和范围、计算方法和计量单位是否符合要求;统计数字有无差错;有关指标间的平衡关系是否得到保持等。
例如,审核中要注意各单项之和是否等于小计,小计之和是否等于合计,各横行纵栏的合计有无错误等。
通过审核发现错误以后,要分别不同情况及时纠正和处理。
对弄虚作假、虚报瞒报、伪造篡改统计资料的,要按《统计法》严肃处理。
统计资料的审核是一项严肃细致的工作,一定要认真对待,不可草率从事。
(二)统计数据的分组和汇总这是整个统计整理工作的核心内容,如何对调查资料进行科学分组,我们将在本章第二节中详细介绍。
按分组要求进行汇总,即通过计算机或手工将原始资料的各种标志值汇总、计量,得出总体指标。
统计汇总有逐级汇总和集中汇总两种基本组织形式。
(三)编制统计表和绘制统计图根据现象之间的内在联系和统计分析的要求,将总体有关数量关系编制在一张表上,就形成了统计表,统计表使统计资料的表现更加明白、清晰。
统计图是表现统计资料的另一种更直观、更形象的手段。
有关统计表和统计图的详细内容,我们将在本章第四节中介绍。
第二节统计分组一、统计数据分组的涵义统计分组是按照某种标志将统计总体划分为若干个组成部分的一种统计方法。
总体的组成部分称为“组”。
统计分组的基本作用,在于使数据资料条理化。
合理的分组将总体划分为组间差异较大、组内差异较小或没有差异的若干部分,这就便于进一步的分析研究。
例如,在人口统计中,我们除了掌握全部人口的总数量外,还要按照性别、年龄、民族等标志把人口总体区分为各种不同的组,汇总计算各组的各种标志值,来丰富、完善我们对人口总体的认识。
统计分组可以反映总体的分布特征,说明总体的结构,使我们对总体的认识深化,更好地揭示事物的本质和规律。
统计分组在整个统计工作中占有十分重要的地位。
它不仅是统计整理的基础,而且是统计分析的基本方法。
二、统计数据分组的类型(一)字符型分组和数值型分组1.字符型分组字符型分组是指选择反映事物属性差异的品质标志作为分组标志进行分组,并在该品质标志的变异范围内划定各组的界限,将总体划分为若干个性质不同的组成部分。
例如,人口按性别、民族、职业、文化程度等分组;企业按所有制形式、隶属关系、地区、规模等分组都是字符型分组。
2.数值型分组数值型分组是指选择反映事物数量差异的数量标志作为分组标志进行分组,在数量标志的差异范围内划定各组界限,从而将总体分为性质不同的若干个组成部分。
如企业按职工人数、计划完成百分比、资金利税率分组;学生按身高或学习成绩分组;职工按工资、年龄分组等等,都是按数量标志分组。
按数量标志分组的目的并不是单纯确定各组的数量差别,而是通过数量变化来区分各组的不同类型和性质。
(二)简单分组、复合分组和分组体系在统计整理中,为了全面认识被研究对象总体的数量特征,常常需要运用多个分组标志对总体进行分组,形成一系列相互联系、相互补充的统计分组体系。
统计分组体系有平行分组体系和复合分组体系两种重要形式。
1.简单分组与平行分组体系对总体只按一个分组标志进行分组称为简单分组。
简单分组只反映现象在某一标志特征方面的差异情况。
同一总体选择两个或两个以上标志分别进行简单分组,平行排列起来,即成为平行分组体系。
例如,对国民收入积累额的研究,可以进行以下平行分组,形成分组体系。
国民收入积累额(1)按用途分:生产性非生产性(2)按性质分:固定资产流动资产平行分组体系中,各个分组都是彼此独立的,没有相互包含关系。
它们各有侧重,相互补充,形成对总体全貌的完整认识。
2.复合分组与复合分组体系对同一个总体选择两个或两个以上的标志重叠或交叉起来进行分组,叫复合分组。
复合分组的结果即形成复合分组体系。
按多个标志分组和分组的层叠(或交叉)形成是复合分组体系的两个基本特点。
具体地说,复合分组就是先按某一主要标志将总体分为若干组,再按其他有关辅助标志,对各组进行更细的分组,从而形成一种具有许多层次的分组组合形式。
例如,对国民收入积累额的研究,可以作如下复合分组:国民收入积累额:按用途分按性质分固定资产生产性流动资产固定资产非生产性流动资产通过复合分组,可以从多角度对现象总体内部差别进行描述,反映问题全面深入。
进行复合分组时,首先应合理安排好各个分组标志的主次关系,以及由此决定的分组层次。
这样,才能做到主次分明,层次清楚。
另外,分组标志不宜太多,因为复合分组体系的总组数是各分组标志所分组的乘积,每增加一个分组标志,就会增加一个分组层次,组数也会成倍增加,从而使资料显得冗长、繁琐。
一般以两个分组标志为宜,最多不要超过三个分组标志层叠分组。
在实际工作中,平行分组体系和复合分组体系常常是结合运用的。
三、统计分组的原则和方法统计分组的关键问题是正确选择分组标志和划分各组的界限,它们不仅直接影响统计分组的科学性和统计资料整理的准确性,而且也影响统计分组结果的真实性。
(一)统计数据分组的原则科学的统计分组,应遵循以下几项原则:1.必须坚持组内统计资料的同质性和组间资料的差异性,这是统计分组的一个基本原则。
2.必须遵循穷举性和互斥性原则。
所谓穷举性,是指每一个总体单位都能归到某一组;而互斥性是指每一个总体单位只能归属于一组,不能同时归属于两个或两个以上的组。
(二)分组标志的选择正确地选择分组标志是统计分组的核心。
分组标志就是作为分组依据的标志。
分组标志一经选定,就突出了总体在此标志下的性质差异,同时也将总体在其他标志下的性质差异给掩盖了。
分组标志选择的是否恰当,关系到能否正确反映总体的数量特征及其变化规律,对同一总体采用不同的标志分组,其结果也不相同。
如果分组标志选择不恰当,不但不能显示出所研究总体的基本特征,而且可能歪曲事物的本来面目,得出错误的结论。
分组标志的选择应根据统计研究的目的和任务,结合现象所处的具体历史条件和经济条件,选择能够反映事物本质特征或主要特征的标志分组。
(三)分组界限的划分分组标志确定以后,区分各组性质差别界限是十分重要的,各组之间界限的划分正确与否,直接影响统计分析结果的真实性。
对于字符型分组,各组之间界限的划分在许多情况下是比较简单的,作为分组标志的品质标志一经确定,组的名称和组数也就确定了,不存在组与组之间界限难以划分的困难。
如人的性别、民族分组等。
但有些品质标志的涵义抽象繁杂,各组间性质差异不太明确,从这一组到另一组存在各种过渡状况,边缘不清,这种分组比较复杂。
例如,国民经济的行业分类中,由于各部门都是在社会分工发展过程中逐渐形成的,工业首先从农业中分离出来,随后又从工业中分离出来了一些其他物质生产部门和非物质生产部门,这是一个由量变到质变的渐进过程,因此,工业与农业,工业与其他物质生产部门之间也必然存在着一些过渡形态。
这些过渡状态是划归工业,还是划归其他物质生产部门,就是一个很复杂的物质分类问题。
在实际工作中,为了使这些复杂的分类在全国有个统一的分类标准,国家统计局及中央有关部门,统一制定有关各种分类目录与规定标准,如《国民经济分类目录》、《大中小型工业企业划分标准》、《工业部门分类目录》、《工业产品目录》等等,供全国各地区、各部门、各单位分类时使用。
完善统计分类目录,做到分类标准化是统计工作现代化的重要标志。