统计学第三章数据的整理
统计学 第3章 统计数据的整理
统计分组的标志
第三章 统计数据的整理
统计分组的标志:分组标志就是将总体分为各个性质不同的标准或根据。
根
据分组标志的特征不同,总体可按属性标志分组,也可按数量标志分组。
1.按属性标志分组
以属性标志作为分组标志,并在属性标志的变异范围内划分各组界限,将总体 分为若干组。属性标志划分,概念明确,容易确定分组组数,如性别。
2.按数量标志分组
以数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体 分为若干组。如工资。
第三章 统计数据的整理
(五)简单分组和复合分组
在统计分组时,根据统计研究目的不同,分组标志的选择可以是一个标志,也可以是 两个或两个以上的标志,这样就有简单分组和复合分组之分:
1.简单分组 对总体只按一个标志分组称为简单分组。
第三章 统计数据的整理
数量次数分布的编制方法
在组距次数分布中,各组组距相同的次数分布称为等距次数分 布(表3-8)。各组组距不同的次数分布称为异距次数分布。
等距次数分布一般在现象性质差异变动比较均衡的条件下使用。
优点:
• 易于掌握次数分布的特性。
• 各组次数可以直接比较。
组数= 全距/组距
组距=全距/组数
100.00
提问:这是单 项次数分布还 是组距次数分 布?
第三章 统计数据的整理
数量次数分布的编制方法
例:对某工厂某月50名工人装配零件(件)情况进行调查, 得到下列初级资料:
106 81 98 111 91 107 86 105 93 106 82 108 114 122 109 104 125 103 113 102 106 84 128 104 91 112 85 96 115 89 97 105 92 111 107 97 105 124 106 86 96 110 112 103 108 110 109 125 101 119
统计学课件 第三张章 数据的整理与显示
1. 2.掌握3.掌握 4.用Excel5.§3.1数据的预处理3.1.1 数据审核3.1.2 数据筛选3.1.3 数据排序1.错误2.符合条件3.升序和降序4.按需要汇总(raw data)完整性准确性检查数据是否有错误,计算是否正确等数值型数据,计算检查)(second hand data)1.适用性2.时效性3.确认(data filter)1. 2.不符合明显错误剔除符合筛选出来,而不用Excel 进行数据筛选8名学生的考试成绩数据(data filter)(data rank)1.一定顺序2.有助于3.排序本身就是分析的目的4.借助于计算机(方法)1.分类数据 字母型习惯上用升序汉字型首位拼音字母笔画多少2.数值型–递增递增–递减x (2)>…>x (n)数据透视表(pivot table )1.复杂提取有用 2.重要信息汇总和作图3. 4.首行列标题拖至区域,将需要汇总的“变【向导—3步骤之3】对,即可输出数据透视表§3.2 分类和顺序数据的整理与显示3.2.1 分类数据的整理与显示3.2.2 顺序数据的整理与显示(基本问题)1.弄清数据类型2.分类数据和顺序数据分类整理3.数值型数据分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整(基本过程) BAEDC比率百分比比例频数分类(可计算的统计量)1.个数2.一类别全部数据3.4.不同类别制作频数分布表(bar Chart )1.宽度相同高度或长短2.单式复式3.分类数据频数分布4.条形图可以横置或纵置汇源果汁露露品牌(side - 1.不同时间或不同空间2.差异或变化趋势688563328247戴尔电脑品牌1.频数多少排序2.分类数据不同品牌饮料的帕累托图百事可乐露露汇源果汁品牌(pie Chart)1.圆形及圆内扇形的角度2.各组成部分所占的比例结构性问题3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占不同品牌饮料的构成旭日升冰茶22%分类数据显示图例(可计算的指标)频数逐级累加频率(百分比)的逐级累加☺☺☺☺☺☺———100.092562510276168753044.075.090.0100.0132225270300乙城市回答类别100.093.060.034.012.7300279180102387.040.066.087.3100.0211201982623007.033.026.021.312.72199786438非常不满意不满意一般满意非常满意百分比(%)户数(户)百分比(%)户数(户)向下累积向上累积百分比(%)户数(户)乙城市家庭对住房状况评价的频数分布(243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向上累积非常不满意不满意一般满意非常满意(b)向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布(annular chart)1. 2.同时绘制多个总体3. 4.环形图主要用于展示分类和顺序数据满意非常满意§3.3 数值型数据的整理与显示3.3.1 数据分组3.3.2 数值型数据的图示等距分组等距分组异距分组异距分组(要点)一个变量值离散变量值较少的情况☺☺☺☺(要点)1.一个区间2.连续变量3.变量值较多4.“不重不漏”5.等距不等距☺~ ☺☺~ ☺☺~ ☺☺~ ☺☺~ ☺(步骤)1.确定组数2.确定组距上限与下限之差,可根据全部数据的最大统计频数并整理成频数分布表(几个概念)(例题分析)【例】某电脑公司2005年前四个月各天的销售量数据(单位:台)。
统计学(第三章)
四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。
统计学统计数据的整理和显示
组数
组中值:各组中点位置所对应的变量值。其计算公式为:
01
或= (适用上开口组)
03
组中值= (适用所有闭口组)
02
或= (适用下开口组)
表3—2 三次产业增加值结构变化 资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。
从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。
举例说明:
1
某工厂生产车间30人工人日产量原始数据如下:
第三章 统计数据的整理和显示
本章主要内容
肆
叁
贰
壹
统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。
第一节 统计数据整理概述
3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。
第三章统计数据的整理与显示
统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
统计数据的整理和显(1)
分组的原则:穷尽和互斥
1.按品质标志分组或按数量标志分组,或用两 种标志结合分组 2.按主要标志与辅助标志分组
(四)统计分组体系
1.简单分组与平行分组
标 按性别分组
志 男性 女性
(二)统计分组的作用
1.划分性质不同的各种类型,研究其特征和规律性
表1 我国近几年农业总产值情况 单位:亿元
类型 1995年 1996年 1997年 1998年
农业 11884.6 13539.8 13866.9 14099.3
林业
709.9
778 817.8 848.7
牧业
6044.9 7083 7620.3 7729.8
如:某校按学生人数分组,其组限为: 100人以下 101—200 201—300 301人以上
组距分组中,上述分组都是等距分组,即各组组 距相等,其特点是:
由于各组组距相等,各组次数的分布不受组距大 小的影响,它消除了组距对其分布的影响,与次数 密度的分布是一致的,一般呈正态分布。
同时也存在不等距分组即只要有一组组距不相等的 分组,也称异距分组。例如学生年龄18岁以下,1920,21-24,25岁以上等。其特点是:
60—70
—60
70以上等
61人以上等
我们把这种分组形式称为开口组。“以下”称之 为下开口,“以上”称之为上开口。
下开口的组中值=本组上限-(1/2)*相邻组 的组距
上开口的组中值=本组下限+(1/2)*相邻组 的组距
例如结合上面学生成绩的分布计算其组中值 下开口组中值=60-(1/2)×(70-60)=55 上开口组中值=70+(1/2)×(70-60)=75
统计学c第三章统计整理
合计
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
第五、绘制频数直方图和折线图
我一眼就看出 来了,大多数 人的日加工零 件数在120~ 125之间!
直方图下的面 积之和等于1
频 15
数
12
(人) 9
6 3 105 110 115 120 125 130 135 140 日加工零件数(个) 某车间工人日加工零件数的直方图
统计学
第三节 分布数列—变量数列
第四步,编制变量数列 某车间50名工人日加工零件数分组表 按零件数分组(件)
105~110 110~115 115~120 120~125 125~130 130~135 135~140
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
目前我国有的地方性别比为120:100,这是不正常的现象
2.划分现象的类型:如我国经济成份划分为国有经济
和非国有经济,工业化分为轻、重工业。
经济、管理类 基础课程
统计学
第二节 统计分组
3 揭示现象的内部结构:如我国人员结构、产业结构。 新交通法中,正确处理机动车司机和过路行人之间的关系 体现以人为本的理念.
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
(1)组距数列的几个常用概念
A. 组限:各组的界限,有上限和下限之分。
B. 组距:上限与下限之差 。 C. 组中值:上、下限之和的半数,即:
D. 次数密度:单位组距分配的次数。即:
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
E. 开口组与开口数列:第一组无下限或最后一组无 上 限的组称开口组。含开口组的数列称开口数列。 注意:a. 开口组的组距按相邻组的组距推算; b. 分组时正好等于组限的数应按“归下限原则”处 理。 缺上限的组中值= 下限+相临组组距的一半 缺下限的组中值= 上限—相临组组距的一半
统计学第三章 统计数据的整理
汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
统计学-第三章 统计数据整理
2020/1/10
(三)分组标志的选择(关键)
(1)分组标志:进行统计分组的标准或根据。 (2)遵循的原则(三个):
(a)符合统计研究的目的和要求; (b)必须选择最主要的、能反映总体本质特征的标志作为分组依据; (c)要考虑到社会经济现象所处的具体历史条件。
(四)统计分组的种类(两大类,五小类)
2020/1/10
引例 如何整理和显示数据?
为确定一批灯泡的使用寿命(单位:小时),质检人员在 该批灯泡中随机抽取100只进行测试,所得数据如下表3-1:
表3-1 100只灯泡使用寿命表 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688
2020/1/10
第三节 频数分布(重点)
(一)分布数列的意义
2.分布数列的两要素(名称和频数)
(1)组的名称:按一定标志划分出来的各个组。按 数量标志分组表现为各组的变量值(标志值),常 用x表示。 (2)各组次数(频数):落在各组中的总体单位个 数,绝对数。常用f表示。频率:各组频数f占总体 单位总数的比重,频数的相对数形式。反映总体的 构成,常用f/f表示。(频率分析)
第三章统计整理
统计整理
第一节 统计整理的意义和步骤
第二节 统计分组
第三节 分配数列 第四节 统计表和统计图
本章的教学目的、要求及内容
一般了解统计整理的概念和内容、统计分组、分配 数列及统计表等概念和内容。
重点与难点:重点掌握统计分组的方法,在分组的 基础上进行次数分配数列的编制,并学会用统计表 来表示统计资料。
预处理
分组汇总
编制表图
数据的预处理
数据的预处理,主要包括三个方面: 1. 数据的审核 2. 数据的筛选 3. 数据的排序
统计数据资料整理的内容
统计整理的步骤:
(1)拟定统计整理方案 (2)审查原始资料 (3)对各项原始资料分组、汇总,计算总体总量指标 (4)将汇总的结果,以统计表或统计图的形式表现出 来 (5)将统计资料进行系统积累
统计分组的作用 3、揭示现象的内部结构
现象的内部结构是表明现象本质特点的一个重要方面,将同 一总体不同时期的结构联系起来,还可以看到现象的发展趋 势和规律。 “九五”期间我国国内生产总值构成(%)
年
份
1996
20.4
1997 1998
19.1 18.6
1999
17.6
2000
15.9
第一产业
第二产业
分配数列表
频数
分布数列的种类
分布数列以分组标志特征不同可以 分为: 品质数列
Байду номын сангаас
变量数列
品质数列
品质数列:按品质标志分配而形成的数列叫属性 分配数列,简称品质数列。用来观察总体单位中 不同属性的单位分布情况。
例 某班学生的性别构成情况
按性别分 组 男 女 合计
绝对数人 比重(%) 数 30 75 10 40 25 100
统计学(第3章)
4、定比尺度(比率尺度 ratio scale)
是对事物之间比值的一种测度,可用
于参数与非参数统计推断。 特征:
除区分事物的类别、进行排序、比较大 小,而且还可以进行加减乘除运算。 具有绝对零点,即“0”表示“没有” 或“不存在”。 所有统计量都可以对其进行分析。与定 距尺度的唯一区别是有绝对固定的零点。
第三章 统计数据的整理 10
3、观察数据和实验数据
观察数据:通过调查或观测而得 到的数据。 实验数据:通过控制实验对象而 收集的数据。
第三章 统计数据的整理
11
4、直接数据和间接数据
直接数据:即原始数据。
间接数据:已加工整理过的数据。
第三章 统计数据的整理
12
第二节 统计整理的含义和步骤
当异距分组时,各组的次数还受 到组距不同的影响。为消除异距 分组的这种影响,须计算频率密 度(或次数密度),计算公式: 频数密度 = 频数/组距 频率密度 = 频率/组距
第三章 统计数据的整理
36
二、分布数列的编制
将原始资料按其数值大小重新排列 2. 确定全距 3. 确定组距和组数 4. 确定组限 5. 编制变量数列 示例3-5
第三章 统计数据的整理
某地人口
21
(三)按分组标志的不同性质分
品质分组(属性分组):是将总体按
品质(或属性)标志进行分组。如企 业按经济成份、企业规模,职工按性 别、文化程度分组等。 数量分组(变量分组):是将总体按 数量标志进行分组,如企业按职工人 数、劳动生产率分组,职工按工龄、 工资分组等。
第三章 统计数据的整理 31
4、开口组的组距与组中值
统计学基础(第三章)
7.0 40.0 66.0 87.3 100.0 —
300 279 180 102 38 —
100.0 93.0 60.0 34.0 12.7 —
statistics
统计学——第三章数据整理与显示 数值数据(定距数据)的分组
单项分组:每一个组中只有一个变量值,适用于离散型变量 的数据、并且数据的范围不太大情况下的分组。 组距分组:每个分组是一个数值区间。它适用于连续型变量 或变动范围较大的离散型变量的数据分组。
statistics
统计学——第三章数据整理与显示
具体步骤:
(1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。
(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。 (3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域” 一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他 选项根据需要选择。点击“确定”按钮,得结果。 (4)对输出结果进行还原并适当改造,即可得频数分布。
统计学——第三章数据整理与显示
第四节 统 计 图
statistics
统计学——第三章数据整理与显示
统计图的结构
标题 一般包括图表标题、数值轴(X,Y)标题 坐标轴和网格线 坐标轴和网格线构造了绘图区的骨架, 借助坐标轴和网格线,可以更容易读懂统计图。 图表区和绘图区 统计表的所有内容都在图表区内,包括 绘图区。统计图绘制在绘图区内。 图例 用来标明图表中的数据系列。
答:调查整理的结果为
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 户数/户 24 108 93 45 30 300 百分比/% 8 36 31 15 10 100 向上累积 24 132 225 270 300 — 8.0 44.0 75.0 90.0 100.0 — 向下累积 百分比/% 100 92 56 25 10 — 300 276 168 75 30 — 户数/户 百分比/% 户数/户
第三章 统计整理
单项式分组:
工人平均日产量资料
工人平均日产量(件) 2 3 4 5 6 合计 工人数 绝对数 比重(%) 10 8.7 15 13.0 30 26.1 40 34.8 20 17.4 115 100.0 上一页 下一页
返回本节首页
组距式分组:
某工厂工人完成生产定额情况表 工人完成生产定额分组(%) 工人数 绝对数 比重(%) 80~90 30 16.7 90~100 40 22.2 100~110 60 33.3 110~120 30 16.7 120~130 20 11.1 合计 180 100.0
某班学生籍贯分布表 地区分 绝对数人数 安徽 30 非安徽 10 合计 40
比重(%) 75 25 100
第3章 统计整理
42
单项式数列:一个变量值代表一组。
工人生产情况表 产量(件) 工人数
第3章 统计整理 11
2、统计分组目的: 总体经过分组,能够突出组与组之间的 差异,抽象掉组内各单位之间的差异, 使数据变得条理化,便于进一步分析研 究。
上一页
下一页
返回本节首页
3、统计分组的原则
⑴穷尽性
就是使总体中的每一个单位都应有组可归, 或者说各分组的空间足以容纳总体所有的单位。 例如:从业人员按文化程度分组,分为小学 毕业、中学毕业(含中专)和大学毕业三组,那 么,文盲及识字不多的以及大学以上的学历者则 无组可归。如果将分组调整为:文盲及识字不多、 小学程度、中学程度、大学及大学以上,那么就 可以包括全部从业人员的各种不同层次的文化程 度,符合了分组的穷尽性原则。
位数。
频率(f/∑f):次数的相对数,各组次数占总
次数的比重。
上一页 下一页 返回本节首页
㈡统计分布(分配数列)的分类
统计学 数据的整理及图表展示
– 饼图只能显示一个总体各部分所占的比例 – 环形图则可以同时绘制多个总体的数据系
列,每一个总体的数据系列为一个环
3. 环形图可用于进行比较研究 4. 环形图可用于展示分类数据和顺序数据
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
非常不满意 不满意 一般 满意 非常满意
组中值= 下限值+上限值 2
组距分组
第1步:排序,确定组数(K)
5≤K≤15
K 1 lg n
能够显示数据的分布特征和规律
lg 2
第2步:确定组距 组距=(最大值-最小值)÷组数
★ 组距宜取5或10的倍数
◆第一组的下限应低于最小值, ◆最后一组的上限应高于最大值。 遵循“不重不漏”的原则
上组限不在内
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135以上
4
8
合计
50
100
用Excel制作数值型数据的频数分布表
【工具】 ——【数据分析】 ——【直方图】 【输入区域】:输入原始数据区域 【接收区域】:输入各组的上限值 【输出区域】:选择一个空白单元格(想要
(上下组限重叠)
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~110
3
6
第三章统计整理
3、分 类
品质数列 变量数列
单值数列
组距数列
等距数列 异距数列
二、变量数列的编制
编制变量数 列的步骤
确 定 组 数 确 定 组 距 计 算 频 数 编 制 表 格
(一)品质数列:
将总体按品质标志分组形成的分布数列 例
某班学生的性别构成情况
按性别分组 绝对数人数 比重(%)
男 女 30 10 75 25
1、定义
2、作用
是统计调查的继续,统计分析的 前提和基础 (承上启下)
3、统计整理的步骤
1.数据的预处理
2.统计分组
3.编制分配数列
4.汇总统计资料
5.制作统计表或统计图
2008-1-4 5
第二节 统计分组
33 %
25%
42%
分组前
分组后
2008-1-4
6
一、统计分组的含义与性质
1.含义 根据统计研究任务的要求和现象总体的内在 特点,把统计总体按照某一标志划分为若干性 质不同而又有联系的几个部分的统计方法,称 为统计分组。 2.性质 分与合 、穷尽与互斥、反映本质差异、可能 掩盖差异、关键是分组标志的选择和分组界限 的确定
单位:亿元
例
类 型 1999年 2000年 2001年 2002年 农业 14106.2 13873.6 14462.8 14931.5 林业 886.3 936.5 938.8 2 815.0 1 033.5
牧业
渔业
6 997.6
7 393.1 7 963.1
8 454.6
2 971.1
2 539.0 2 712.6
张桂平 刘汉 马云 李非列 宋卫平 孙广信 杨孙西 李彦宏 张力 李思廉 李金元 陈发树
第三章 统计数据的整理和显示
发现数据 的规律性, 作进一步的 统计分析
二、统计整理的步骤
1.统计资料的审核
包括对资料的完整性和准确性审核。
2.统计资料的分组和汇总
分组和汇总是统计整理的中心工作
3.编制统计图表
统计图表是统计整理成果最常用的表现形式,
举例
男
政治面貌
中共党员 团员 中共党员 团员
按别
女
政治面貌
3.
按分组的作用分
类型分组 结构分组 分析分组
四、分组体系
1.概念:统计分组体系是指在统计整理中,为研究现 象总体的情况而运用多个分组标志对总体进行分组,从而 形成一系列相互联系、相互补充的分组体系。 2.分类:平行分组体系和复合分组体系。 平行分组体系就是对同一总体进行若干次简单分组。 复合分组体系就是对某一总体进行某种复合分组。 汉族12人,占60% 1.按民族分组 回族5人,占25% 平 满族3人,占15% 行 20岁5人,占25% 分 21岁5人,占25% 组 2.按年龄分组 22岁2人,占10% 体 23岁8人,占40% 系 中共党员8人,占40% 3.按政治面貌分组 团员12人,占60%
一、统计整理的意义
统计整理:根据统计研究的目的,对统计 调查所搜集到的原始资料进行分组、汇总, 使其条理化、系统化的工作过程。
对于已整理过的初级资料进行再整理,也属于
统计整理。
意义:整个统计工作和研究过程的中间
环节,起着承前启后的作用。统计整 理是统计调查的继续,又是统计分析 的基础。
适用于连续型变量 变动范围比较大的离散型变量
某班考试成绩统计表
统计学 第3章 数据的整理与显示
主讲:王光玲,济南大学商学院 45
2.统计分组的方法
2)数量标志分组 ——按表现总体单位数量特征的标 志进行的分组 。
例如,按职工人数分组、按人口年龄分组、按工资收 入水平分组、按销售额分组等
(1)单项式分组:每组变量值是一个值 (2)组距式分组:每组变量值是一个区间。
2020/5/14
46
小作业:课后将课本P50的例3-1和3-2的例子演示
一遍!
2020/5/14
39
3.2 统计分组与频数分布
3.2.1 统计分组 3.2.2 频数分布及统计图
主讲:王光玲,济南大学经济学院
3.2.1 统计分组
主讲:王光玲,济南大学经济学院
1、统计分组(见P52)
概念:根据统计研究的目的和客观现象的内在特点,按 照一定的标志把被研究总体划分为若干个性质不同但又 有联系的组,称为统计分组。
某单位共有1000名职工,每名职工的文化程度、月收入、 婚姻状况等个体特征都有所不同(变异)。若该单位领导 想从总体上了解职工队伍的文化程度、月收入、婚姻状况 等情况,则可先要通过登记方法获得每个职工的资料,对 这些描述每名职工个体特征的资料进行分类汇总和分析计 算,就可以了解该单位全部职工中有多少人未婚、多少人 已婚、多少人离婚、多少人丧偶,各自所占的百分比是多 少;也可以了解研究生、大学、中专(高中)等不同文化 程度职工的人数及比重;还可以了解职工月平均工资、各 类职工的工资水平、职工工资分布的均衡性等等,以上内 容均为统计整理的有效信息,这些统计信息对于制定企业 的人力资源计划是十分必要的。
2020/5/14
43
2.统计分组的方法
1)品质标志分组 ——按研究对象的某种属性特征分组。
(2)复合分组:对总体按两个或两个以上的标志进 行的重叠式分组。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学第三章数据的整理
1
统计分组的依据是()。
A、标志
B、指标
C、标志值
D、变量值
正确答案:A 我的答案:A得分:4.0分
2
在进行组距分组时,以组中值作为该组数据的代表值的假定前提条件是()。
A、各组变量值均相等
B、各组数据在本组内呈均匀分布
C、各组组距均相等
D、各组频数均相等
正确答案:B 我的答案:B得分:4.0分
3
等距分组适合于()。
A、一切变量
B、变量变动比较均匀的情况
C、呈急剧升降变动的变量
D、按一定比率变动的变量
正确答案:B 我的答案:B得分:4.0分
4
确定连续型变量的组限时,相邻的组限一般要求()。
A、不重叠
B、重叠
C、不等
D、重叠或不重叠
正确答案:D 我的答案:D得分:4.0分
5
组距数列末组的向上累计为()。
A、该组的频数
B、频数之和
C、该组的频率
D、末组的向下累计频数
正确答案:B 我的答案:B得分:4.0分
6
反映人口死亡现象按年龄分布的次数分布为()。
A、钟形分布
B、U型分布
C、J型分布
D、反J型分布
正确答案:B 我的答案:B得分:4.0分
7
组数与组距的关系是()。
A、组数越多,组距越小
B、组数越多,组距越大
C、组数与组距无关
D、组数越少,组距越小
正确答案:A 我的答案:A得分:4.0分
8
按某一标志分组的结果表现为()。
A、组内同质性,组间同质性
B、组内同质性,组间差异性
C、组内差异性,组间同质性
D、组内差异性,组间差异性
正确答案:B 我的答案:B得分:4.0分
9
连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,末组的组中值为()。
A、260
B、215
C、230
D、185
正确答案:C 我的答案:C得分:4.0分
10
某年收入变量数列,其分组依次为10万元以下,10—20万元,20—30万元,30万元以上,则有()。
A、10万元应归入第一组
B、20万元应归入第二组
C、20万元应归入第三组
D、30万元应归入第三组
正确答案:C 我的答案:C得分:4.0分
二.多选题(共5题,20.0分)
1
统计资料整理的内容一般包括()。
A、资料审核
B、统计分组
C、统计汇总
D、编制统计表
正确答案:ABCD 我的答案:ABCD得分:4.0分
2
在分配数列中,()。
A、各组的频数之和应等于100
B、各组的频率之和应等于100%
C、某组频率越大,则该组标志值所起的相对作用就越大
D、某组频数越大,则该组标志值所起的绝对作用就越大
正确答案:BC 我的答案:BC得分:4.0分
统计表从形式上看由()组成。
A、总标题
B、横行标题
C、纵栏标题
D、主词
正确答案:ABC 我的答案:ABC得分:4.0分
4
统计表从内容上看由()组成。
A、总标题
B、横行标题
C、主词
D、宾词
正确答案:ABC 我的答案:CD得分:0.0分
5
选择分组标志时应考虑的因素有()。
A、统计研究目的或分组目的
B、标志能否反映事物本质
C、是区分事物数量差别还是性质差别
D、现象所处的客观历史条件
正确答案:ABD 我的答案:ABD得分:4.0分
三.判断题(共10题,40.0分)
1
按一个标志进行分组的是简单分组,按多个标志进行分组的是复合分组。
我的答案:√得分:4.0分正确答案:√
2
向上累计是各组上限以下的累计频数或累计频率,当所关注的是标志值较小的现象的次数分配情况时,通常采用向上累计。
我的答案:√得分:4.0分正确答案:√
资料审核的内容主要包括完整性、准确性和及时性三方面。
我的答案:√得分:4.0分正确答案:√
4
在编制变量数列时,若资料有特大或特小的极端数值,则宜采用开口组表示。
我的答案:√得分:4.0分正确答案:√
5
所谓“上限不在内”原则,是指当某单位的标志值恰好等于某组上限时,就把该单位归入该组。
我的答案:×得分:4.0分正确答案:×
6
能够对总体进行分组,是由于统计总体中各单位所具有的差异性决定的。
我的答案:√得分:4.0分正确答案:√
7
开口组组距数列计算的组中值为近似值。
我的答案:√得分:4.0分正确答案:√
8
饼状图是以图形面积的大小表现各组的频数或频率的大小。
我的答案:√得分:4.0分正确答案:√
9
分组标志的种类主要包括品质标志分组、数量标志分组和空间标志分组。
我的答案:×得分:4.0分正确答案:×
10
向下累计是各组下限以上的累计频数或累计频率,当所关注的是标志值较大的现象的次数分配情况时,通常采用向下累计。
我的答案:√得分:4.0分正确答案:√。