统计数据的整理与显示
统计学第2章 统计数据的搜集、整理和显示
第二节 数据整理
三、统计指标
(二)统计指标的分类
1. 数量(总量)指标
作用:反映现象的总规模、总水平或工作总量 以绝对数表示(国内生产总值、人口总数、工资总额等) 分类 总体单位数、总体标志总量 时期指标、时点指标 实物指标、价值指标和劳动量指标
第二节 数据整理
三、统计指标
搜集数据的两条途径:统计调查 + 实验 统计调查 —— 调查数据;实验 —— 实验数据 1. 确定调查目的 2. 确定调查对象和调查单位 3. 确定调查项目 4. 调查表格和问卷设计(一览表、单一表,要求简明扼要) 5. 确定调查时间(调查时间、调查期限) 6. 确定调查的组织实施计划
(三)统计调查的方案设计
上限不在内
等距分组与异距分组
等距分组
各组的标志值变动都限于相同的范围 优点:便于计算、绘制统计图 适用场合
异距分组
第一,标志值分布很不均匀的场合 第二,标志值相等的量具有不同意义的场合 第三,标志值按一定比例发展变化的场合
品质分组 单项式分组 间断组距式分组 数量分组 组限 连续组距式分组 组距式分组 等距式分组
6组:530 530 530 540 620 620 620 620 720 720 7组:720 720 630 630 630 630 620 620 620 620
8组:650 650 650 650 650 650 650 650 650 650
提问:从上述资料中,同学们能否直接看出该车间总的生产完成
类型分组
“日产量”分组
500以下 500 500以上 合计
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
统计学课件 第三张章 数据的整理与显示
1. 2.掌握3.掌握 4.用Excel5.§3.1数据的预处理3.1.1 数据审核3.1.2 数据筛选3.1.3 数据排序1.错误2.符合条件3.升序和降序4.按需要汇总(raw data)完整性准确性检查数据是否有错误,计算是否正确等数值型数据,计算检查)(second hand data)1.适用性2.时效性3.确认(data filter)1. 2.不符合明显错误剔除符合筛选出来,而不用Excel 进行数据筛选8名学生的考试成绩数据(data filter)(data rank)1.一定顺序2.有助于3.排序本身就是分析的目的4.借助于计算机(方法)1.分类数据 字母型习惯上用升序汉字型首位拼音字母笔画多少2.数值型–递增递增–递减x (2)>…>x (n)数据透视表(pivot table )1.复杂提取有用 2.重要信息汇总和作图3. 4.首行列标题拖至区域,将需要汇总的“变【向导—3步骤之3】对,即可输出数据透视表§3.2 分类和顺序数据的整理与显示3.2.1 分类数据的整理与显示3.2.2 顺序数据的整理与显示(基本问题)1.弄清数据类型2.分类数据和顺序数据分类整理3.数值型数据分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整(基本过程) BAEDC比率百分比比例频数分类(可计算的统计量)1.个数2.一类别全部数据3.4.不同类别制作频数分布表(bar Chart )1.宽度相同高度或长短2.单式复式3.分类数据频数分布4.条形图可以横置或纵置汇源果汁露露品牌(side - 1.不同时间或不同空间2.差异或变化趋势688563328247戴尔电脑品牌1.频数多少排序2.分类数据不同品牌饮料的帕累托图百事可乐露露汇源果汁品牌(pie Chart)1.圆形及圆内扇形的角度2.各组成部分所占的比例结构性问题3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占不同品牌饮料的构成旭日升冰茶22%分类数据显示图例(可计算的指标)频数逐级累加频率(百分比)的逐级累加☺☺☺☺☺☺———100.092562510276168753044.075.090.0100.0132225270300乙城市回答类别100.093.060.034.012.7300279180102387.040.066.087.3100.0211201982623007.033.026.021.312.72199786438非常不满意不满意一般满意非常满意百分比(%)户数(户)百分比(%)户数(户)向下累积向上累积百分比(%)户数(户)乙城市家庭对住房状况评价的频数分布(243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向上累积非常不满意不满意一般满意非常满意(b)向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布(annular chart)1. 2.同时绘制多个总体3. 4.环形图主要用于展示分类和顺序数据满意非常满意§3.3 数值型数据的整理与显示3.3.1 数据分组3.3.2 数值型数据的图示等距分组等距分组异距分组异距分组(要点)一个变量值离散变量值较少的情况☺☺☺☺(要点)1.一个区间2.连续变量3.变量值较多4.“不重不漏”5.等距不等距☺~ ☺☺~ ☺☺~ ☺☺~ ☺☺~ ☺(步骤)1.确定组数2.确定组距上限与下限之差,可根据全部数据的最大统计频数并整理成频数分布表(几个概念)(例题分析)【例】某电脑公司2005年前四个月各天的销售量数据(单位:台)。
中级经济师基础---第二十一章-统计数据的整理与显示
第二十一章统计数据的整理与显示第一节、品质数据的整理与显示本节学习要求:本节具体内容:一、分类数据的整理与显示(一)频数与频数分布1、频数的含义:频数也称次数,是落在各类别中的数据个数.2、频数分布(次数分布):各个类别及其相应的频数全部列出来就是频数分布或称次数分布。
3、频数分布表:频数分布用表格的形式表现出来就是频数分布表.4、分类数据进行整理时常用的指标如下:(1)比例:是指在一个总体当中,各个部分的数量占总体数量的比重,通常反映整体的构成或者整体结构.各部分比例之和等于1。
【例题1—-课后题第4题】比例是一个总体中各个部分的数量占总体数量的比重,各部分的比例之和()A。
大于1 B.小于1 C。
等于1 D.等于100(2)百分比:将比例乘以100就是百分比或百分数。
当分子的数值很小而分母的数值很大时,也可以用千分数来表示比例。
如人口的出生率、死亡率、自然增长率等(3)比率:各不同类别的数量的比值,可以是一个总体中各不同部分的数量对比。
由于比率不是总体中部分与整体之间的对比关系,因而比值可能大于1.为方便起见,比率可以不用1作为基数,而用100或其他便于理解的数作为基数。
比如:人口的性别比就用每100名女性人口所对应的男性人口来表示。
【例题2:2004年单选题】根据第5次人口全国普查的结果,我国男性占总人口的51.63%,女性占总人口的48.37%,那么人口的性别比例应该为()。
A。
100:106.74 B。
93。
67:100C。
106。
74:100 D。
100:93.67在经济和社会问题的研究中,经常使用比率.比如经济学中的积累和消费之比;国内生产总值中第一、二、三产业产值之比等。
比率也可以是同一现象在不同时间或空间上的数量之比.如:某年的国内生产总值与上年的国内生产总值进行对比,得出经济增长率;一个地区的国内生产总值同另一地区的国内生产总值进行对比,反映两个地区的经济发展水平差异。
【例题3:2007年单选题】计算我国国内生产总值中的第一、二、三产业产值之比,是采用了计算()的数据整理方法。
统计数据的整理和显示
在编制组距数列中,要按照以下程序进行:
第一,使原始数据序列化( 编制由小到大的 单项式数列) 第二,计算出组距、组数等 第三,分组归类形成变量数列
整第 理3 和章 显统 示计
数 据
a、使原始数据序列化
现有某车间50名工人日加工零件的资料如下: 117,108,110,112,137,122,131,118, 134,114,124,125,123,127,120,129, 117,126,123,128,139,122,133,119, 124,107,133,134,113,115,117,126, 127,120,139,130,122,123,123,128, 122,118,118,127,124,125,108,112, 118,121
整第 理3 和章 显统 示计
数 据
区分标示组限与真实组限:组间是连续还是间断
连续:真实组限,如60-70,70-80,80-90;间断 :标示组限,如1-2,3-5,6-8;转换为0.5-2.5, 2.5-5.5,5.5-8.5)
组限
上限(大) 下限(小)
标示上限 真实上限= 标示上限+0.5 标示下限
组距 组 全数 距 最大 组 值 最 数小值
整第 理3 和章 显统 示计
数 据
组数与组距成反比关系,组数越多,组距越小, 反之,组数越少,组距越大。
确定组数可参照美国统计学家sturges(斯特古斯) 经验公式:
组数=1+3.322lgN, N为总体单位数。 组数=1+3.322lg50=6.64≈7,当然,这只是一个 经验结果,到底分多少组还取决于现象本身。
整第 理3 和章 显统 示计
数 据
采用单项式变量分组形成如下分布数列
统计学统计数据的整理和显示
组数
组中值:各组中点位置所对应的变量值。其计算公式为:
01
或= (适用上开口组)
03
组中值= (适用所有闭口组)
02
或= (适用下开口组)
表3—2 三次产业增加值结构变化 资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。
从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。
举例说明:
1
某工厂生产车间30人工人日产量原始数据如下:
第三章 统计数据的整理和显示
本章主要内容
肆
叁
贰
壹
统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。
第一节 统计数据整理概述
3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。
第三章统计数据的整理与显示
统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
最新三章节统计数据整理与显示
第四节 统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。
二、统计汇总的形式:
• 1、逐级汇总 • 2、集中汇总 • 3、汇审汇编 • 4、综合汇总
三、统计汇总的技术
• 1、手工汇总 • 2、电子计算机汇总
第五节 分布数列
• 分布数列——也称次数分布或次数分配,指反映 总体单位在各组分布状况的一系列数字。
• 分布数列组成要素: • 1、组的名称 • 2、各组次数(也称频数)或频率
分布数列的分类
按分组标志 品质数列
变量数列
分
布
钟形分布数列 正态分布
按商品销售额分组(万元) 商店数(个)
100以下
25
100500
70
500 1000
130
1000 3000
75
3000 5000
40
5000 10000
18
10000以上
10
流通费用率(%)
11.2 10.6 9.9 8.7 7.8 7.0 6.3
三、统计分组的种类
• 按分组的作用或目的不同分为:类型分组、 结构分组和分析分组
2.变量数列例:
按月工资收入分组 1000元以下 1000-1500 1500-2000 2000-2500 2500-3000 3000元以上 合计
人数(人) 80 150 230 340 150 50
1000
所占(%) 8 15 23 34 15 5 100
统计数据的整理及其显示(ppt-107页)(共106张PPT)全篇
穷尽原则
互斥原则
注意:统计分组是对总体认识深化的手段,它是一切统计研究的基 础,应用于统计工作的全过程,是统计研究的基本方法。
⑴ 类型分组
揭露社会经济现象的类型,反映各类型的特点。
例
单位:亿元
类 型 1999年 2000年 2001年 2002年
农业 14 106.2 13 873.6 14 462.8 14 931.5
审核
对第二手数据: 完整性: 准确性: 适用性:数据的来源、口径以及
有关背景资料; 时效性:尽可能使用最新的数据。
(2)数据筛选
当数据中的错误不能予以纠正,或者有些数据不符合 调查的要求而又无法弥补时,需要对数据进行筛选。
数据筛选的内容:
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除;
例如:企业按人数分组
499及以下
500 ~ 999
1000 ~ 2999 3000及以上
工人按工资分组
600 ~ 700 700 ~ 800 800 ~ 1200
1200 ~ 1500
适用条件: 它适用于变量值变化范围较大、不同变量值个数
较多的离散型变量及连续型变量的场合。
注意:连续型变量的数值不能一一列举,故
例如:按以五分制计分的成绩对全班100名学生进行分组,宜单 变量数列;按以百分制计分的成绩对全班100名学生进行分组 ,宜组距式数列;
1. 定类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯
上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列
,也可按笔画排序,其中也有笔画多少的升 序降序之分
2. 定距和定比数据的排序
递递增增排排序序:后设可一表组示数为据:为X(1X)1<,X(X2)2<,……<X,(NX) N, 递减排序可表示为:X(1)>X(2)>…>X(N)
统计数据的整理和显示
三维立体图展示多维数据空间结构
三维立体图原理
利用计算机图形学技术,在三维空间中呈现数据,提供更丰富的 视觉信息。
多维数据空间结构展示
三维立体图可用于展示多维数据的空间结构,帮助用户理解数据之 间的复杂关系。
案例分析
如科学研究中的三维散点图、三维曲面图等,可直观展示实验数据 的分布情况和趋势。
交互式图表提升用户体验
相关性分析及应用场景
Pearson相关系数
衡量两个变量之间的线性相关程度,适用于连续变量。
Kendall秩相关系数
也是一种等级相关系数,适用于判断两个变量变化趋势 的一致性。
ABCD
Spearman秩相关系数
衡量两个变量之间的单调关系,适用于等级数据或非线 性关系。
应用场景
在金融、经济、医学等领域广泛应用,如股票价格预测 、疾病与基因关联分析等。
地理信息系统(GIS)在数据可视化中的应用
GIS技术概述
地理信息系统是一种用于 采集、存储、管理、分析 和显示地理数据的计算机 系统。
数据可视化应用
GIS可将地理数据与统计数 据相结合,通过地图、图 表等形式展示数据的空间 分布和变化趋势。
案例分析
如疫情地图,通过GIS技术 展示疫情在全球或某个地 区的传播情况和统计数据。
图表中的文字、标签、图例等应清晰可读 ,字体大小和颜色应与背景形成对比,方 便读者阅读和理解。
常用图表制作技巧
数据排序
在制作柱状图和折线图时,可对数据进行排序,以便更好地展示数据 的分布和趋势。
数据分组
对于大量数据,可进行分组处理,以减少图表的复杂度,提高可读性。
使用颜色
可使用颜色来区分不同的数据系列或类别,但应注意颜色的搭配和对 比度,避免过多的颜色和过于鲜艳的颜色。
管理统计学 第2版 第二章 统计数据的收集整理与显示
(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变
种
最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式
第三章 统计数据的整理和显示
发现数据 的规律性, 作进一步的 统计分析
二、统计整理的步骤
1.统计资料的审核
包括对资料的完整性和准确性审核。
2.统计资料的分组和汇总
分组和汇总是统计整理的中心工作
3.编制统计图表
统计图表是统计整理成果最常用的表现形式,
举例
男
政治面貌
中共党员 团员 中共党员 团员
按别
女
政治面貌
3.
按分组的作用分
类型分组 结构分组 分析分组
四、分组体系
1.概念:统计分组体系是指在统计整理中,为研究现 象总体的情况而运用多个分组标志对总体进行分组,从而 形成一系列相互联系、相互补充的分组体系。 2.分类:平行分组体系和复合分组体系。 平行分组体系就是对同一总体进行若干次简单分组。 复合分组体系就是对某一总体进行某种复合分组。 汉族12人,占60% 1.按民族分组 回族5人,占25% 平 满族3人,占15% 行 20岁5人,占25% 分 21岁5人,占25% 组 2.按年龄分组 22岁2人,占10% 体 23岁8人,占40% 系 中共党员8人,占40% 3.按政治面貌分组 团员12人,占60%
一、统计整理的意义
统计整理:根据统计研究的目的,对统计 调查所搜集到的原始资料进行分组、汇总, 使其条理化、系统化的工作过程。
对于已整理过的初级资料进行再整理,也属于
统计整理。
意义:整个统计工作和研究过程的中间
环节,起着承前启后的作用。统计整 理是统计调查的继续,又是统计分析 的基础。
适用于连续型变量 变动范围比较大的离散型变量
某班考试成绩统计表
统计学第二章
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(四)资料审核后的订正
• • • •
对可以肯定的一般错误,代为更正,并通知原报单位。 对可疑数据或无法代为更正的错误,要求原单位复查更正 如果所发现错误在其他上报单位也可能发生时,应通知其 他单位。 对严重错误,应发还重填,并查明错误原因。
第三节
统计分组
• • • • •
一、统计分组的含义 二、统计分组的作用 三、统计分组的种类 四、分组标志的选择 五、组数、组距、组限、组中值
三、统计分组的种类• 来自分组的作用或目的不同分为:类型分组、 结构分组和分析分组 • 按分组标志多少,分为:简单分组、复合分 组和并列分组。 • 按分组标志的性质分为品质分组和数量分组
四、分组标志的选择
1. 分组标志:是指将总体划分为性质不同 的组的标准或依据。 2. 分组标志选择的要求:
–要符合统计研究的目的和要求 –必须选择最主要的标志作为分组依据 –要考虑社会经济现象所处的具体历史条件
划分社会不同类型
按商品分类分组 食品类 衣着类 家庭设备用品类 文化娱乐用品类 交通通讯类 医疗保健类 居住类 杂项商品类 合计 构成(%) 40.6 4.7 7.5 11.6 10.8 4.7 14.4 5.7 100
揭示社会经济现象的内部结构
我国出口商品构成(%)
年份 1950 1960 1970 1980 1985 1990 1995 1999 农副产品 57.5 31.0 36.7 18.7 17.5 13.0 7.3 5.2 农副产品加工品 33.2 42.3 37.7 29.5 26.9 29.2 26.2 25.1 工矿产品 9.3 26.7 25.6 51.8 55.6 57.8 66.5 69.7 合计 100 100 100 100 100 100 100 100
准确的资料是 进行正确统计 分析的关键。
(一)审查资料的完整性 和及时性
• 完整性: 检查应调查的 单位或个体是否有遗漏, 所有的调查项目或指标 是否填写齐全 及时性:检查填报单位 是否按时报送了有关
•
(三).历史资料的审核
• 应审查资料的可靠性程度 ,指标含义,所属时间,计算方法 等,对不能满足现在要求,有缺漏或有疑问的资料,要进 行有科学依据的推算,弥补和订正。
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组
组
限
组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式
1、重合式:
• • • • • 指相邻两组中,前一组的上限和后一组的下限数值重合。 一般用于连续型变量。 组距=上限-下限 例如:身高1.60m~1.70m、1.70~1.80m、 1.80~1.90m……… 所谓重合只是形式上相重,实际上两组没重合,一般采用“含下 限不含上限”原则处理
2.组数、组距确定的斯特杰斯经验公式
n 1 3.3 lg N R X max X min d n 1 3.3 lg N n : 组数,N:总体单位数,d:组距,R:全距 X max :最大变量值,X min :最小变量值
N n
15-24 5
25-44 6
45-89 7
90-179 8
统计整理最后的 结果就是形成各 种统计表格和统 计图。
统计整理的程序
对搜集到的资料进行全面的审核,确保符合研究 目的要求和准确无误 选择整理的指标,并进行划类分组 将分组资料进行汇总 编制统计表和统计图
第二节
统计资料的审核
(二)审查资料的正确 性
• 数据是否真实反映 客观实际情况 • 内容是否符合实际 • 数据是否有错误 • 计算是否正确等
五、组数、组距、组限、组中值
• 组数:即将总体分为几组。 • 组数的确定分下面两种情况: (一)品质分组的组数 由两个因素决定: • 1、事物本身的属性特征 • 2、统计研究的要求
(二)数量分组的组数和组距
1.组数由两个因素决定:
• 总体的全距R • 组距(class width)
全距R = 最大标志值-最小标志值 组距 = 各组最大标志值(上限)-各组最 小标志值(下限) 在等距分组的条件下,组数等于全距除以组距
划分社会现象的依存关系
按商品销售额分组(万元) 100以下 100500 500 1000 1000 3000 3000 5000 5000 10000 10000以上
商店数(个) 25 70 130 75 40 18 10
流通费用率(%) 11.2 10.6 9.9 8.7 7.8 7.0 6.3
一、统计分组的含义
• 统计分组:指根据社会经济现象的特点和统
计研究的任务,按某个标志(或几个标志)把 总体分成若干部分的科学分类。没有统计分组 就没有科学的统计
• 统计分组的关键:
1、选择分组标志:使组间差异大,组内差异小 2、划分各组界限。
二、统计分组的作用
• 划分社会经济现象的不同类型 • 揭示社会现象的内部结构 • 分析社会现象之间的依存关系
2、不重合式
指前一组的上限与后一组的下限,两值紧密相连而不相重 复。 一般用于离散型变量。 组距=下组下限-本组下限=本组上限-前组上限 例:人口普查时,按照家庭人口数分组:1-2,3-4,5-6, 7和7以上
组 中 值
• 组中值:各组上下限的中点值,代表组内各标志值的一般水平。 • 重合式组限时: –组 距=上限-下限 –组中值=(上限+下限)÷2 =下限+组距/2=上限-组距/2 • 不重合式组限时: –组 距=下组下限-本组下限=本组上限-前组上限 –组中值=(本组下限+下一组下限) ÷2 =本组下限+组距/2=下组下限-组距/2 • 组距式分组中: –第一组开口(多少以下),组中值=上限-相邻组组距/2 –最后一组开口(多少以上),组中值=下限+相邻组组距/2
第三章
统计数据的整理与显示
第一节 统计整理的意义和程序
一、统计整理的意义 二、统计整理的程序
统计整理是承 上启下的过程, 是统计调查的 继续也是统计 分析的基础。
统计整理:根据统计研究的目的,对调查 所得原始材料进行科学分组与汇总和对以 往的材料进行再加工。
统计整理的意义:是统计调查的继续, 是统计分析的基础。