第3章统计数据的描述与显示
第三章统计数据的整理和显示习题
第三章统计数据的整理和显示练习题一、填空题1.统计数据分组的关键在于。
2.一般说来,统计分组用于三方面:(1>;<2);<3)。
3.根据分组标志的不同,统计分组可以有分组和分组。
4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。
5.在组距式数列中,表示各组界限的变量值叫。
各组中点位置上的变量值叫。
6.组距式变量数列,根据各组的组距是否相等可以分为和。
7.已知一个变量数列最后一组的下限为900,其邻组的组中值为850,则最后一组的上限和组中值分别为和。
b5E2RGbCAP8.统计资料的表现形式主要有和。
9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。
10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。
p1EanqFDPw11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。
12.直方图是用的宽度和高度来表示频数分布的图形。
13.雷达图是一种的图示方法。
二、单项选择题1.统计分组的关键问题是( >A正确选择分组标志 B确定组距和组数C确定组距和组中值 D确定全距和组距2.为了反映我国经济中所有制成份的构成情况需要进行( >A经济成份分类B登记注册类型分类C三次产业分类 D国民经济行业分类3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( >A组数较多 B标志变异不明显C两种性质变异间存在过渡形态 D分组有粗有细4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( >A260 B 215 C 230 D 1855.下列分组中按品质标志分组的是( >A人口按年龄分组 B产品按质量优劣分组C企业按固定资产原值分组 D乡镇按工业产值分组6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( >A简单分组 B平行分组C复合分组 D分组体系7.用组中值代表各组内的一般水平的假定条件是( >A各组的次数均相等 B各组的组距均相等C各组的变量值均相等 D各组次数在本组内呈均匀分布8.对统计总体按两个及以上标志分组后形成的统计表叫( >A简单表 B简单分组表C复合分组表 D汇总表9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( >A变量分组 B属性分组C分组体系 D复合分组10.在频数分布中,频率是指( >A各组频数之比 B各组频率之比C各组频数与总频数之比 D各组频数与各组次数之比11.频数分布用来表明( >A总体单位在各组的分布状况 B各组变量值构成情况C各组标志值分布情况 D各组变量值的变动程度12.在分组时,若有某单位的变量值正好等于某组的下限时,一般应将其归在( >A上限所在组 B下限所在组C任意一组均可 D另设新组13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( >A正比例关系 B反比例关系C乘积关系 D毫无关系14.统计表的宾词是用来说明总体特征的( >A标志 B总体单位C统计指标 D统计对象15.统计表的主词是统计表所要说明的对象,一般排在统计表的( >A左方 B上端中部 C右方 D下方16.用组中值与次数求坐标点连接而成的统计图是( >A直方图 B条形图 C曲线图 D折线图17.按字母的顺序或笔画数的多少顺序排序的统计数据一般是( >A定类型数据 B定距数据C定比数据 D定序数据18.多指标的图示方法是( >A直方图 B条形图 C环行图 D雷达图19.变量数列的构成要素是< )A分组标志和指标B分组标志和次数C数量分组标志数值和频数D品质分组标志属性和频数20.下列哪一种资料,适合编制单项数列< )A连续型变量且各变量值变动比较均匀B离散型变量且变量值的种类数较少C连续型变量且各变量值变动幅度较大D离散型变量且各变量值变动幅度较大21.某组向上累计次数表示< )A大于该组上限的次数有多少B大于该组下限的次数有多少C小于该组上限的次数有多少D小于该组下限的次数有多少三、多项选择题1.统计分组的主要应用有(>A区分现象的类型 B反映现象总体的内部结构C比较现象间的一般水平 D分析现象的变化关系E研究现象之间的数量依存关系2.指出下表表示的分布数列所属的类型( >A品质数列 B变量数列C分组数列 D组距数列E等距数列3.指出下列分组哪些是属性分组( >A人口按性别分组 B企业按产值多少分组C家庭按收入水平分组 D在业人口按文化程度分组 E宾馆按星级分组4.对统计数据准确性审核的方法有( >A计算检查 B逻辑检查C时间检查 D调查检查E平衡检查5.统计数据的预处理,包括( >A数据分类 B数据筛选C数据审核 D数据订正E数据排序6.从形式上看,统计表由哪些部分构成( >A总标题 B主词 C纵栏标题D横行标题 E宾词7.按主词是否分组,统计表可分为( >A单一表 B简单表 C分组表D复合表 E综合表8.统计数据的审核主要是审核数据的( >A准确性 B及时性 C完整性D适用性 E代表性9.统计数据整理的内容一般有( >A对原始数据进行预处理 B对统计数据进行分组C对统计数据进行汇总 D对统计数据进行分析E编制统计表、绘制统计图10.国民经济中常用的统计分组有( >A经济成分分组 B登记注册类型分组C国民经济行业分类 D三次产业分类E机构部门分类11.某厂100名工人按工资额分为800以下、800-1000、1000-1200、1200-1400、1400以上等五个组。
统计学第3章统计数据整理与显示
2013-11-21
本 章 内 容
第一节 统计数据整理概述 第二节 统计分组与频数分布数列
第三节 统计数据的显示
第四节
2013-11-21
EXCEL在数据整理应用示例
第一节 统计数据整理概述
一、统计数据整理的含义与要求
二、统计数据整理的步骤
三、统计数据的预处理
2013-11-21
一、统计数据整理的含义与要求
个体企业 其它企业
70~80分 (中等) 80~90分 (良好) 90~100分(优秀)
2013-11-21
统计分组是在总体内部进行的一种定性分类,把 总体划分为一个个性质不同,范围更小的总体。
统计分组有两个方面的含义,即:
是“分” 即将总体区分为性质 不同的若干组成部分
统计 分组
是“合” 即将性质相同的总 体单位合为一组
每一组中的最大变量值称为上限,每组最小变量值
称为下限。
重叠组限 在统计时 遵循“上 限不在内” 的原则。
工人按工资分组:
600 700 800 1200 ~ 700 ~ 800 ~ 1200 ~ 1500
企业按人数分组:
1 ~ 499 500 ~ 999 1000 ~ 2999 3000 ~ 3499
(4)按数量标志分组
数量标志分组,即变量分组。 例如, 按考分分组(分) 60以下 用数量来 60 ~ 70 表示各组 70 ~ 80 性质上的 80 ~ 90 差别 90 ~ 100 注意:第一,明确分组的目的,. 即通过数量的变化来区 分各组质的差别,而不是单纯的数量差别。 第二,采用适当的分组形式, 即要以什么样的数量作 为划分标准。是单项式或是组距式?如果是组距式分
2013-11-21
统计学原理 第三章 数据整理与显示
4.数量(变量)分组
如,企业按产值分组
按数量标志进行的分组。
100万元以下 100 ~ 500 500 ~ 1000 1000万元以上
单项式分组 数量(变量)分组 组距式分组
单项式分组: 在变量分组中, 一个组只有一个变量值。
如,居民家庭按子女数分组: 0 1 2 3 单项式分组适用于变量值变化范围不大、不同变量值个数 较少的离散型变量的场合。
10
22
20
22
30
27
主要步骤:数据------数据透视表------布局
EXCELL应用:单项式分组及汇总 日产量 22 23 24 25 26 工人人数 6 8 10 1 3 比重 20.00% 26.67% 33.33% 3.33% 10.00%
27
总计
2
30
6.67%
100.00%
主要步骤:数据------数据透视表------布局
600 ~ 700 700 ~ 800 800 ~ 1200 1200 ~1500
组 限 重 叠
499以下 500 ~ 999 1000 ~ 1999 2000 ~ 2999 3000及以上
组 限 不 重 叠
组限的划 分方法
不重叠组限(只适用于离散型变量) 重叠组限(适用于连续型变量和离散型变量)
当为重叠组限时,交叉组限值遵循 “上限不在其内”的原则。
它适用于变量值变化范围较大、不同变量值个数较多 的离散型变量及连续型变量的情形。
组距式分组最为常见,进行分组涉及以下几个问题
(1)组限及划分方法
(2)组距与组数 (3)等距分组与不等距分组 (4)组中值
组距式分组的组限及划分方法
每组起点值称为上限,终点值称为下限。 工人按工资分组: 企业按人数分组:
第三章统计数据的整理与显示
统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
统计学-第3章 数据的图表展示 学习指导
第3章(数据的图表展示)学习指导(一)数据的预处理数据预处理包括审核、筛选和排序。
1.对不同渠道取得的数据在审核内容和方法上有所不同。
直接调查取得的原始数据从完整性和准确性上去审核。
二手数据除审核其完整性和准确性外,还要审核其适用性和时效性。
2.数据的筛选包括两个方面:一是剔除错误数据;二是剔除不符合特定条件的数据。
3.数据排序是按一定的顺序将数据进行排列,以便发现数据的特征和趋势。
(二)品质数据的整理与显示品质数据的整理是对数据进行分类,计算出每一类别的频数、频率或比例、比率,并用图形进行显示。
(三)数值型数据的整理与显示品质数据的整理与显示方法都适用于数据型数据的整理与显示,但数据型数据还有一些特定的方法,而且这些方法不适用于品质数据。
(四)统计表统计表是用于显示统计数据的基本工具,由表头、行标题、列标题、数字资料以及表外附注组成。
概念练习一)单项选择题1、统计整理阶段最关键的问题是( )。
A、对调查资料的审核;B、统计分组;C、统计汇总;D、编制统计表。
2、统计分组的关键在于( )。
A、分组标志的正确选择;B、按品质标志分组;C、运用多个标志进行分组,形成一个分组体系;D、分组形式的选择。
3、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( )。
A、80-89%B、80%以下90-99%80.1-90%100-109%90.1-100%110%以上100.1-110%C、90%以下D、85%以下90-100%85-95%100-110%95-105%110%以上105-115%4、在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是( )。
A、将此值归人上限所在组;B、将此值归人下限所在组;C、将此值归人上限所在组或下限所在组均D、另行分组。
5、划分离散变量的组限时,相邻两组的组限( )。
A、必须是间断的;B、必须是重叠的;C、即可以是间断的,也可以是重叠的;D、应当是相近的。
第3章 统计数据描述与显示作业答案
第3章统计数据描述与显示作业答案一、单项选择题l.按照反映现象的时间状况不同,总量指标可以分为( 3 )。
①单位总量和标志总量②数量指标和质量指标③时期指标和时点指标④实物指标和价值指标2.下列指标属于时期指标的是( 1 )。
①商品销售额②商品库存额③商品库存量④职工人数3.将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( 4 )。
①动态相对指标②结构相对指标③比例相对指标④比较相对指标4.下列指标属于总量指标的是( 4 )。
①人均粮食产量②资金利税率③产品合格率④学生人数5.结构相对指标是( 3 )。
①报告期水平与基期水平之比②实际数与计划数之比③总体部分数值与总体全部数值之比④甲单位水平与乙单位水平之比6.某地区2000年底有1000万人口,零售商店数有5万个,则商业网点密度指标为( 1 )。
①5个/干人②O.2千人/个③200个/干人④2个/千人7.下列指标中属于数量指标的是( 2 )。
①劳动生产率②产量③人口密度④资金利税率8.下列各项中属于时期指标的是( 2 )。
①企业实有人数②工资总额③产品库存量④设备拥有数量9.某种商品的年末库存额是( 4 )。
①时期指标并实物指标:②时点指标并实物指标;③时期指标并价值指标:④时点指标并价值指标。
1O.下列指标中属于时点指标的是( 4 )。
国内生产总值②流动费用率③人均利税额④商店总数11.反映同类事物在不同时间条件下对比结果的综合指标称为( 1 )。
①动态相对指标②比较相对指标③比例相对指标④强度相对指标12.反映总体中各构成部分之问数量关系程度和比例关系的综合指标称为( 4 )。
①比较相对指标②比例相对指标③强度相对指标④结构相对指标13.某商场2000年空调销售量为6500台,库存年末比年初减少100台,这两个总量指标是( 3 )。
①时期指标②时点指标③前者是时期指标,后者是时点指标④前者是时点指标,后者是时期指标14.总量指标数值大小( 1 )。
《管理统计学》焦建玲 第03章 描述性统计分析
第三章 描述性统计分析
3.1 统计数据整理与显示
频数分布
【例3-1】以下是一个班级60名学生数学期末考试成绩,请编制 组距式变量数列。 90 78 81 64 83 75 78 79 81 82 91 93 95 94 84 64 61 87 70 60 20 65 77 73 78 92 88 73 86 73 64 76 71 67 63 69 70 89 90 83 74 79 76 99 75 38 55 82 93 98 85 78 89 66 71 84 70 68 72 80
第三章 描述性统计分析
3.1 统计数据整理与显示
统计分组
统计分组是根据统计研究的任务的要求和现象总体的内 在特点,按照一定的标志,将统计总体区分为不同类型或 不同性质的若干组成部分。这些组成部分中的每一个部分 就叫做一个分组,通过分组把总体内部不同性质的单位分 开,把性质相同的单位归并在一个组内,说明总体内部各 组之间的相互关系及其特征。
下限公式: 上限公式:
Me L
fi 2 Sm1 h fm
Me U
fi 2 Sm1 h fm
第三章 描述性统计分析
3.1 统计数据整理与显示
【例3-2】某高校随机抽取300名学生的身高样本资料,
并根据研究需求对样本进行分组,数据如表3-4所示,试
计算该校学生身高的中位数。
表3-4 某高校学生身高样本数据
第三章 描述性统计分析
3.1 统计数据整理与显示
频数分布
组限的具体形式有间断组限和重合组限,开口组限和闭口组限。 例如:企业职工按年龄分组,其 组限可表示为:30岁以下,30~39 岁,40~49岁,50~59岁,60岁以 上。
间断组限是每一组的组限与邻组的组限都是间断设置的。
统计学(第3章)
4、定比尺度(比率尺度 ratio scale)
是对事物之间比值的一种测度,可用
于参数与非参数统计推断。 特征:
除区分事物的类别、进行排序、比较大 小,而且还可以进行加减乘除运算。 具有绝对零点,即“0”表示“没有” 或“不存在”。 所有统计量都可以对其进行分析。与定 距尺度的唯一区别是有绝对固定的零点。
第三章 统计数据的整理 10
3、观察数据和实验数据
观察数据:通过调查或观测而得 到的数据。 实验数据:通过控制实验对象而 收集的数据。
第三章 统计数据的整理
11
4、直接数据和间接数据
直接数据:即原始数据。
间接数据:已加工整理过的数据。
第三章 统计数据的整理
12
第二节 统计整理的含义和步骤
当异距分组时,各组的次数还受 到组距不同的影响。为消除异距 分组的这种影响,须计算频率密 度(或次数密度),计算公式: 频数密度 = 频数/组距 频率密度 = 频率/组距
第三章 统计数据的整理
36
二、分布数列的编制
将原始资料按其数值大小重新排列 2. 确定全距 3. 确定组距和组数 4. 确定组限 5. 编制变量数列 示例3-5
第三章 统计数据的整理
某地人口
21
(三)按分组标志的不同性质分
品质分组(属性分组):是将总体按
品质(或属性)标志进行分组。如企 业按经济成份、企业规模,职工按性 别、文化程度分组等。 数量分组(变量分组):是将总体按 数量标志进行分组,如企业按职工人 数、劳动生产率分组,职工按工龄、 工资分组等。
第三章 统计数据的整理 31
4、开口组的组距与组中值
统计学II第3章 统计数据的描述-1
分数分组
95~99
90~94 85~89 80~84 75~79 70~74 65~69 60~64 55~59 50~54 45~49 40~44 35~39 30~34 25~29 20~24 15~19
~
次数 向上累积次数 向下累积次数 向上累积相对次数
7
1640
7
100%
16
1633
53
1617
(2)组距数列算术平均数的计算:以组中值代替变量x,尔后按 公式计算。
年龄 人数(f) 组中值(x)
xf
14—20
2
17
34
21—27
5
24
120
28—34
3
31
93
合计
10
247
x xf 247 24.7岁 f 10
STAT
(3)是非标志的平均数(成数、比率)
是非标志及哑变量
女性总录用率:10%×(100/130)+50%×(30/130) =19.23%
2.虽然在每个单位,女性录用率都高于男性,但录用率 低的甲单位女性的应聘率(即权数:100/130)高,录用率高 的乙单位,女性应聘率(即权数:30/130)低,而男性的情 况正相反,造成加权后的总录用率女性反而比男性低。
3.该现象(悖论)的产生是由于“权重”的倾斜造成的。
STAT
三、几何平均数
1、定义:n个变量值连乘积的n次方根。
2、适用前提:总体标志总量=总体各单位标志值,宜计算比率 或速度的平均数。
3、公式:
简单几何平均数 : G n x1 x2 xn n x
加权几何平均数 : G f
50
50
统计学基础(第三章)
7.0 40.0 66.0 87.3 100.0 —
300 279 180 102 38 —
100.0 93.0 60.0 34.0 12.7 —
statistics
统计学——第三章数据整理与显示 数值数据(定距数据)的分组
单项分组:每一个组中只有一个变量值,适用于离散型变量 的数据、并且数据的范围不太大情况下的分组。 组距分组:每个分组是一个数值区间。它适用于连续型变量 或变动范围较大的离散型变量的数据分组。
statistics
统计学——第三章数据整理与显示
具体步骤:
(1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。
(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。 (3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域” 一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他 选项根据需要选择。点击“确定”按钮,得结果。 (4)对输出结果进行还原并适当改造,即可得频数分布。
统计学——第三章数据整理与显示
第四节 统 计 图
statistics
统计学——第三章数据整理与显示
统计图的结构
标题 一般包括图表标题、数值轴(X,Y)标题 坐标轴和网格线 坐标轴和网格线构造了绘图区的骨架, 借助坐标轴和网格线,可以更容易读懂统计图。 图表区和绘图区 统计表的所有内容都在图表区内,包括 绘图区。统计图绘制在绘图区内。 图例 用来标明图表中的数据系列。
答:调查整理的结果为
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 户数/户 24 108 93 45 30 300 百分比/% 8 36 31 15 10 100 向上累积 24 132 225 270 300 — 8.0 44.0 75.0 90.0 100.0 — 向下累积 百分比/% 100 92 56 25 10 — 300 276 168 75 30 — 户数/户 百分比/% 户数/户
自考00974-统计学原理-复习重点
《统计学原理》串讲笔记第一章:总论1、统计的三基本方法:大量观察法,综合分析法,归纳推断法(P1)(可扩展未简答)2、凯特乐将统计学的三个主要源泉:英国的政治学派,德国的国势学,法国的概率统计(P7)3、“统计”一词的含义(P8)(简答)4、统计信息的两大特征:数量性和总体性(P8)(多选、简答)5、统计的三大职能:信息,咨询,监督(P9)(多选)6、四大计量尺度:定类尺度,定序尺度,定距尺度,定比尺度(重点前两个)(P16)7、按度量层次低到高:定类尺度>定序尺度>定距尺度>定比尺度8、区别总体和总体单位(P18)(选择,判断)9、统计指标的的三大特性:总体性,数量性,综合性(P19)(多选)10、区分变异和变量,变量又可以分为:连续变量和离散变量(P20)(多选)第二章:统计资料的收集和整理1.统计资料的三大特性:数量性,总体性,数量性(P22)(选择,填空)2.总体性的定义(P23)(判断)3.原始资料的搜集方法(P26-27)(多选)4.统计调查的方式:(P28-31)1)普查:专门组织进行一次性的全面调查(填空、多选)2)抽样调查:最常用的方法3)统计报表4)重点调查:了解定义(选择)(多年都有考到)5)典型调查6.结论:统计方式是以普查为基础,抽样调查为主体(选择、判断)7.统计调查方案的内容:(P32-33)(简答)8.区分调查内容的时间和调查工作的时间(P33-34)(判断)9.统计调查误差的种类(P34)(简答)10.产生误差的客观原因(P35)(简答)11.怎么看待误差(P35)(历年考过,很有可能考)12.分组的关键:选择恰当的分组标志和准确划分分组的界限(判断)13.统计分组的类型以及内容(P40-41)(简答)14.组距和组数基本成反比关系:组距越大组数越小,反之相反(判断)15.判断开口组的组中值的计算(P45)(判断)16分组变量的类型(P46)(简答)17了解洛伦茨曲线的横轴和纵轴表示的内容(P50)(填空)18.次数分布的类型和特点(P52-54)(历年考过的简答、选择)第三章:统计数据的描述和显示(核心内容:平均数代表性指标)1、统计指标按照数量特征不同分为:绝对指标,相对指标,平均指标(单选)2、区分时点指标和时期指标(P57)(选择)3、强度相对指标:常用为:人口密度指标,人均GDP指标,利率,人口增长率(多选)4、重点计算三大指标:平均数,标准差,离散系数(必考)5、中位数的定义(P61)(填空)6、各变量值与均值的离差之和为0(判断)7、什么时候使用离散系数(P77)(填空)8、统计表的三大基本要素:表头,表体,表尾(多选)9、统计图的四大种类:条形图,线图,圆形图,统计地图(历年考过的简答,多选)附加必学的计算题:练习册。
管理统计学 第2版 第三章 数据特征的描述与分析
某工厂有五条相同的流水线,生产同一产品且生产速度相同,各流水线的合 格率分别为 95%、92%、90%、85%、80%,那么该工厂产品的平均合格率 是多少?如果某流水生产线有前后衔接的五道工序,各工序产品的合格率分 别为95%、92%、90%、85%、80%,那么产品的平均合格率又是多少?
x x1 x2 xn 95% 92% 90% 85% 80% 88.40%
X F2 2
X N FN
9 (105.3%)3 (104.5%)2 (102.1%)4
103.90%
投资者平均股票的平均收益率为103.90%-1=3.90%
3.1 集中趋势的测度与应用
中位数
中位数是位置平均数,若将变量值按大小顺序排 列,处于中点位置的变量值即为中位数。
中位数不受极端数值的影响,在由个别极端数值 存在的数列种,中位数的代表性比算术平均数的 代表性强。
为:
X
K
Xi
Fi
K
593 .10(元)
i 1Leabharlann Fii 1算术平均数
3.1 集中趋势的测度与应用
算术平均数的性质 (1)各变量值与其均值的离差之和等于零,即:
未分组资料: 分组资料:
N
(X i - X ) 0
i 1
N
(X i - X )Fi 0
i 1
(2)各变量值与其均值的离差平方和最小,即:
中位数的计算一般分两步,首先确定中位数位置, 然后找出中位数位置对应的变量值。
3.1 集中趋势的测度与应用
中位数
未分组资料计算中位数 (1)中位数的位次= N 1 2
式中,N为变量值的项数。
(2)若用Me表示中位数则有:
Me
第三章 统计数据的整理和显示
发现数据 的规律性, 作进一步的 统计分析
二、统计整理的步骤
1.统计资料的审核
包括对资料的完整性和准确性审核。
2.统计资料的分组和汇总
分组和汇总是统计整理的中心工作
3.编制统计图表
统计图表是统计整理成果最常用的表现形式,
举例
男
政治面貌
中共党员 团员 中共党员 团员
按别
女
政治面貌
3.
按分组的作用分
类型分组 结构分组 分析分组
四、分组体系
1.概念:统计分组体系是指在统计整理中,为研究现 象总体的情况而运用多个分组标志对总体进行分组,从而 形成一系列相互联系、相互补充的分组体系。 2.分类:平行分组体系和复合分组体系。 平行分组体系就是对同一总体进行若干次简单分组。 复合分组体系就是对某一总体进行某种复合分组。 汉族12人,占60% 1.按民族分组 回族5人,占25% 平 满族3人,占15% 行 20岁5人,占25% 分 21岁5人,占25% 组 2.按年龄分组 22岁2人,占10% 体 23岁8人,占40% 系 中共党员8人,占40% 3.按政治面貌分组 团员12人,占60%
一、统计整理的意义
统计整理:根据统计研究的目的,对统计 调查所搜集到的原始资料进行分组、汇总, 使其条理化、系统化的工作过程。
对于已整理过的初级资料进行再整理,也属于
统计整理。
意义:整个统计工作和研究过程的中间
环节,起着承前启后的作用。统计整 理是统计调查的继续,又是统计分析 的基础。
适用于连续型变量 变动范围比较大的离散型变量
某班考试成绩统计表
统计学 第3章 数据的整理与显示
主讲:王光玲,济南大学商学院 45
2.统计分组的方法
2)数量标志分组 ——按表现总体单位数量特征的标 志进行的分组 。
例如,按职工人数分组、按人口年龄分组、按工资收 入水平分组、按销售额分组等
(1)单项式分组:每组变量值是一个值 (2)组距式分组:每组变量值是一个区间。
2020/5/14
46
小作业:课后将课本P50的例3-1和3-2的例子演示
一遍!
2020/5/14
39
3.2 统计分组与频数分布
3.2.1 统计分组 3.2.2 频数分布及统计图
主讲:王光玲,济南大学经济学院
3.2.1 统计分组
主讲:王光玲,济南大学经济学院
1、统计分组(见P52)
概念:根据统计研究的目的和客观现象的内在特点,按 照一定的标志把被研究总体划分为若干个性质不同但又 有联系的组,称为统计分组。
某单位共有1000名职工,每名职工的文化程度、月收入、 婚姻状况等个体特征都有所不同(变异)。若该单位领导 想从总体上了解职工队伍的文化程度、月收入、婚姻状况 等情况,则可先要通过登记方法获得每个职工的资料,对 这些描述每名职工个体特征的资料进行分类汇总和分析计 算,就可以了解该单位全部职工中有多少人未婚、多少人 已婚、多少人离婚、多少人丧偶,各自所占的百分比是多 少;也可以了解研究生、大学、中专(高中)等不同文化 程度职工的人数及比重;还可以了解职工月平均工资、各 类职工的工资水平、职工工资分布的均衡性等等,以上内 容均为统计整理的有效信息,这些统计信息对于制定企业 的人力资源计划是十分必要的。
2020/5/14
43
2.统计分组的方法
1)品质标志分组 ——按研究对象的某种属性特征分组。
(2)复合分组:对总体按两个或两个以上的标志进 行的重叠式分组。
第三章统计数据分布特征的描述
第三章统计数据分布特征的描述统计数据分布特征的描述是统计学中的重要概念之一、它是通过对数据进行整理、组织和分析来了解数据的分布情况,帮助我们更好地理解数据的特点和趋势。
一、数据分布特征的描述方法在统计学中,数据分布特征主要通过以下两种方法进行描述:1.图形描述法:通过绘制图表来展示数据的分布情况。
常见的图形描述方法有直方图、条形图、饼图、箱线图等。
直方图是一种用于展示数据分布的图形。
它将其中一范围内的数据分成若干个等宽的区间,并统计每个区间中数据的频数或频率,然后绘制柱状图来表示。
箱线图是一种用于展示数据分布和异常值的图形。
它将数据划分为四个部分:最大值、上四分位数、中位数、下四分位数和最小值,并通过画出盒子和须来表示数据的分布情况。
2.数值描述法:通过使用统计指标和参数来描述数据的分布情况。
常见的数值描述方法有均值、中位数、众数、标准差、方差等。
均值是指将所有数据相加后再除以数据的总个数的得到的值,代表了数据的平均水平。
中位数是指将数据按大小排序后,处于中间位置的值,代表了数据的中心位置。
众数是指数据集中出现次数最多的值,代表了数据的集中趋势。
标准差是指数据在均值附近的波动程度,代表了数据的离散程度。
方差是指数据与均值之间的平均差的平方的平均值,代表了数据的离散程度。
二、数据分布特征的描述步骤要进行数据分布特征的描述,一般需要进行以下步骤:1.数据的整理和搜集:搜集所需的数据,并将其整理成适合进行分析的形式。
2.确定描述方法:根据数据的特点和目标,选择适当的图形描述法或数值描述法。
3.进行描述分析:根据所选的描述方法,对数据进行分析和计算,得出相应的描述结果。
4.解释和应用:根据描述结果,解释数据的分布特征,并根据需要进行相应的应用。
三、数据分布特征的描述应用数据分布特征的描述在实际应用中有很多用途,以下是几个常见的应用:1.判断数据是否符合其中一种分布:通过对数据的分布特征进行描述,可以判断数据是否符合正态分布或其他特定的分布形式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-
总体单位总量——说明总体的单位数数量。 总体标志总量——说明总体中某个标志值总 和的量。
-
例
工资总额 平均工资 工人人数 工人人数 每个企业平均工人数 企业数
在以上两个例子中,分子都属于标 志总量指标,而分母属于单位总量指 标。
按其反映的时间状况不同可分为:
时期指标 —— 反映现象在某一时期发展过程 的总数量。(可连续计数,与时间长短有关,
二、相对指标的种类及其计算 (一) 结构相对指标
计算公式为:
总体某部分数值 总体全部数值
结构相对数
100%
例
上海“十五”期间GDP构成(%)
2001年 第一产业 第二产业 1.73 47.58 2002年 1.63 47.42 2003年 1.49 50.09 2004年 1.30 50.85 2005年 0.87 48.95
② 由单项数列确定中位数
例
某企业按日产零件分组如下: 工人数 (人) 3
按日产零件分 组(件) 26
向上累计 3
向下累计 80
31
32 34
10
14 27
13
27 54
77
67 53
36
41 合计
18
8 80
72
80 -
26
8 -
f 中位数位置 2 即M e 34(件)
80 40 2
(1) 实物单位 a.自然单位:辆、双、头、根、个…… b.度量衡单位:吨、米、克、立方米…… c.双重单位:公里/小时、人/平方公里…… d.复合单位:吨公里、公斤米、千瓦小时……
e.标准实物单位:对有些性质相同但规格或含量
不同的产品总量的计算,要按折合标准实物量的
方法计算。
例如,能源统计以标准燃料每千克发热量 7000Kcal为标准单位。
⑵ n为偶数时,则中间位置的两个标志值的算术 平均数为中位数。
上例中,假如有六个工 人生产某产品件数,按 序排列如下: 20,23,26,29,30,32 n 1 6 1 中位数位置 3.5 2 2 这表明中位数是第三、 至第四人的平均数: 26 29 Me 27.5(件) 2
5.4亿元和3.6亿元。
则甲公司商品销售额为乙公司的1.5倍(5.4/3.6)。
(五) 强度相对指标
计算公式为:
强度相对数
某一总量指标数值 另一性质不同但有一定联系的总量指标数值
1.强度相对数的数值表示有两种方法:
① 一般用复名数表示; ② 也有少数用百分数或千分数表示。
例
流通费用额 商品流通费用率 纯销售额 用百分数表示.
例
设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。
按日产量分 组 (千克) 60 以下 60 – 70 70 – 80 80 – 90 90 – 100 100 – 110 110 以上 组中值X (千克) 55 65 75 85 95 105 115 工人数f (人 ) 10 19 50 36 27 14 8
众数M0=3.00(元)
② 根据组距数列确定众数
⑴ 由最多次数来确定众数所在组; ⑵ 利用比例插值法推算众数的近似值。
例
按日产量分组 (千克)
60以下 60 - 70 70 - 80 80 - 90
工人人数 (人)
10 19 50 36
90-100
100-110 110以上
27
14 8
表中70-80,即众数所在组。
说明平均每百元销售额负担多少流通费。 产值利润率、资金利润率一般用千分数表示。
2.有些强度相对数有正、逆两种计算方法: 例
某城市人口100万人,有零售商业机构5000个,则:
商业网密度的正指标 5000个 5(个 / 千人) 1000000人 1000000人 200(人 / 个) 5000个
部使用。
第二节 相对指标
一、相对指标的概念
是两个有联系的绝对指标之比。 例 2005年我国对外贸易进口总额增长率为 16.1%,出口总额增长率为25.7%。
例
企业 8月份劳动生 产率 (万元) 2 0.56 7月份劳动生 产率 (万元) 1.94 0.52 8月比7月发展 速度 (%) 103.09 107.69 + 600 元 + 400 元
第三章 统计数据的描述与显示
• 重点与难点:
• 重点:
绝对指标的含义及特点 相对指标的种类和特点
集中趋势的测度指标的计算方法
离散程度指标的测定
• 难点:
集中趋势测度指标的计算 离散程度指标的计算
• 学习内容:
一、绝对指标与相对指标 二、集中趋势的测定 三、离散程度的测定 四、统计数据的显示
综合指标从它的作用和方法特点的角度可概 括为三类:
是累计结果)如出生人口数、产品产量等。
时点指标 —— 反映现象在某一时刻的状况。 (间断计数,与时间间隔无关,不能累计)如 人口数、存款余额等。
三、 总量指标的计算 计算原则:
1.现象的同类性。 2.明确的统计含义。
3.计量单位必须一致。
根据总量指标所反映的社会经济现象性质 不同,计量单位分三种形式:
数。 例如:2005年我国财政收入30510亿元,财政 支出 33510亿元,财政赤字3000亿元。
作用 : (1)总量指标能反映一个国家的基本国情
和国力,反映某部门、单位等人、财、 物的基本数据;
(2)总量指标是进行决策和科学管理
的依据之一 ;
(3)总量指标是计算相对指标和平均指
标的基础。
二、 总量指标的分类
计算众数的近似值:
1 d 下限公式: M 0 X L 1 2 2 d 上限公式: M 0 X U 1 2
50 19 10 76.89(千克) (50 19 ) (50 36 )
50 36 10 76.89(千克) (50 19 ) (50 36 )
三、中位数
Me
1.概念:将总体中各单位标志值按大小顺序排列, 居于中间位置的那个标志值就是中位数。
2.中位数的计算方法
① 由未分组资料确定中位数
n1 中位数的位置 2
( n为总体单位数)
⑴ n为奇数时,则居于中间位置的那个标志值就 是中位数。
例
有五个工人生产某产品 件数,按序排列如下: 20,23,26,29,30 n 1 5 1 中位数位置 3 2 2 即,第 3位工人日产 26件产品为中位数: M e 26(件)
商业网密度的逆指标
(六) 动态相对指标
计算公式为:
动态相对数 报告期水平 基期水平 100%
基期 —— 作为对比标准的时间 报告期—— 同基期比较的时期,也称计算期
三、正确运用相对指标的原则
1.注意二个对比指标的可比性。
2.相对指标要和总量指标结合起来运用。
第三节 集中趋势的测定——平均指标
一、平均指标的意义和作用
1.概念:平均指标是指在同质总体内将各单
位某一数量标志的差异抽象化,用以反
映总体在具体条件下的一般水平。
2.特点 - 数量抽象性 - 集中趋势代表性
3.作用
(1)比较作用
a. 同类现象在不同空间的对比。 b. 同一总体在不同时间上的比较。
(2)利用平均指标可以分析现象之间的依存关系。
(2) 价值单位(货币单位)
货币单位有现行价格和不变价格之分。
价值单位使不能直接相加的产品产量过渡 到能够加总,用于综合说明具有不同使用价值
的产品生产总量或商品销售量等的总规模、总
水平。
(3) 劳动单位 例
工时 —— 工人数和劳动时数的乘积; 台时 —— 设备台数和开动时数的乘积。 由于具体条件不同,不同企业的劳动量指标不 具有可比性,因此,劳动量指标只限于企业内
练习:计算加工零件数的众数和中位数
某车间50名工人日加工零件数分组表 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 —
S m 1 fm
d
164 49 90 2 10 80.83(千克) 36
3.中位数的特点
① 中位数不受极端值及开口组的影响,具有稳健性。 ② 各单位标志值与中位数离差的绝对值之和是 个最小值。
即:
XM
e
min 或
XM
e
f min
③ 对某些不具有数学特点或不能用数字测定的 现象,可用中位数求其一般水平。
M0
M0
M0
若有两个次数相等的众数,则称复众数。
M0
M0
② 在单位数很少,或单位数虽多但无明显集中趋势时, 计算众数是没有意义的。
下三图无众数:
2.众数的计算方法
① 根据单项数列确定众数; 例
某种商品的价格情况
价格 (元)
2.00 2.40 3.00 4.00 合计
销售数量 (千克)
20 60 140 80 300
绝对指标:反映客观事物的实际总量;
相对指标:反映事物在不同时间、地点所 形成的对比关系,也反映不同事物绝对 量之间的对比关系; 平均指标:反映同类事物数量特征的一般
水平。
第一节 总量指标(绝对指标) 一、总量指标的概念和作用
概念: 总量指标是反映社会经济现象一定时间、地点、 条件下总的规模、水平的统计指标。 总量指标表现形式是绝对数,也可表现为绝对差
第三产业
50.69
50.95
48.42
47.85
50.18