第二章 数据的描述性分析 图表展示

合集下载

应用统计学--第2章数据的图表展示

应用统计学--第2章数据的图表展示
A、环形图 B、饼图 C、帕累托图 D、对 比条形图
2.3.1 数据分组 2.3.2 数值型数据的图示
单变量值分组
组距分组 等距分组 异距分组
1. 将一个变量值作为一组 2. 适合于离散变量
3. 适合于变量值较少的情况
1. 将变量值的一个区间作为一组 2. 适合于连续变量
3. 适合于变量值较多的情况
。然后选择【布局】 第5步:在【向导—布局】对话框中,依次将“分类变量“(这
里是“饮料品牌”)连续拖放两次:一次拖至左边的“行 ”区域 ,一次拖至 “数据”区域 第6步:然后单击【确定】,自动返回【向导—3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表
1. 整理EXCEL文件“例2-1.xls” 2. 将“例2-1.xls”转换成SPSS文件 3. 分析—描述统计—频率 4. 分析—描述统计—交叉表
• 态度量表
通过逐个问题的回答,量化主观态度,获取 整个态度的总分。
其量化的结果,一是态度的方向,如对某种 商业服务满意或不满意的基本倾向;二是态 度的深度,即被调查者所持某种态度的数量 程度。
• 李克特量表(Likert Scales)
1. 数据的预处理 2. 品质型数据的整理与显示 3. 数值型数据的整理与显示 4. 如何合理使用统计图表
*问卷组织者的行为和态度,不能对被调查者产生引导 作用。
• 问句常用的方式
是否式:用是、否、能、不能表示;
例:这种学习方式是否帮助您解决了学习矛盾?
是( )
否( )
选择式:包括类别型、条件型、等距型等;
例:类别型
如:您最喜欢的面对面的教学方式是:
系统讲授( ) 总结归纳( ) 讨论( )
答疑( ) 辅导( ) 其他( )

第2章 数据的图表展示 (3)

第2章   数据的图表展示 (3)

矿泉水 碳酸饮料 绿茶 其他 果汁 绿茶 其他 矿泉水
购买者性别的记录。试
为研究不同类型饮料的市场销售情况,一家市场调查公司对随 观察饮料类型和顾
顾客性别 女 男 男 女 男 男 女 女
饮料类型 碳酸饮料 绿茶 矿泉水 矿泉水 碳酸饮料 矿泉水 碳酸饮料 绿茶
男 男 女 女 男 男 男 女 男
果汁 碳酸饮料 矿泉水 其他 碳酸饮料 绿茶 碳酸饮料 其他 矿泉水
问题:
1、表中数据是什么类型的数据? 2、应该用什么方法Biblioteka 分析它? 3、可以直接用来分析吗?
市场调查公司对随机抽取的一家超市进行调查。下表是调查员随机观察 观察饮料类型和顾客性别的分布状况,并进行描述性分析,生成频数分
顾客性别及购买饮料类型
顾客性别 女 男 男 女 男 男 女 男 饮料类型 碳酸饮料 绿茶 其他 碳酸饮料 绿茶 绿茶 碳酸饮料 碳酸饮料
女 男 女 女 女 男 男 女 男
绿茶 矿泉水 绿茶 碳酸饮料 矿泉水 其他 碳酸饮料 果汁 矿泉水
下表是调查员随机观察的50名顾客购买的饮料类型及购买者性别的记录 描述性分析,生成频数分布表。
顾客性别 女 女 女 女 男 女 女 女
饮料类型 其他 碳酸饮料 其他 果汁 绿茶 果汁 碳酸饮料 果汁
男 女 女 女 女 男 女 女

第2章 描述性统计课件

第2章 描述性统计课件
方差S2是标准差S的平方值。标准差(或方差)越大,表 示观察值的分布越分散,反之,标准差(或方差)越 小,表示观察值的分布越集中。实际应用时常以均数 ±标准差的写法综合观察值的集中和离散特征。
第三节 离散程度的指标
4.变异系数(Coefficient of Variation) 简记为CV,它是标准差与均数之比,用百分数表达。
➢比较不同对象时,用不同的线条或颜色 表示,并要附图例说明。图例写在图的 下面或图的右上角。
• 几种常用的统计图 ➢直条图 (bar graph)
直条图用等宽直条的长短来表示相互独 立的各指标的数值大小。 适用于相互独立的、无连续关系的间断 性资料的比较。
种类:单式直条图和复式直条图
直条图的绘制要点
=4.959
二、几何均数(Geometric Mean)
常用对数计算,公式如下: LogG=∑logX/n
再查反对数得出G。 列成频数表时计算公式如下:
LogG=∑flogX/Σf 适用条件: 1.成倍数关系的资料。
2.明显正偏态分布的资料。
二、几何均数(Geometric Mean)
例3.3 6例钩端螺旋体病人的潜伏期分别为7, 10, 12, 14, 18, 20天, 求其平均潜伏期。
x=
=鍈x/n
适用于服从正态分布的资均数
x为每个组段的组中值, f为相应组段的频数。
原理:将落在某一组段内的观察值都视为
组中值。
本例: =(4.0×4+4.2×5+……+5.8×3)/120
=595.8/120=4.965
如用原始观察值计算有 =(5. 195+5.070+……+5.010)/120

社会统计学知识点总结

社会统计学知识点总结

第一章数据与统计学数据分析所使用的方法大体上可分为描述统计和推论统计(推断统计),描述统计主要是利用图表形式对数据进行展示,或通过计算一些简单的统计量(诸如:比例、比率、平均数、标准差等)对数据进行分析。

推断统计主要研究如何根据样本信息来推断总体的特征,内容包括参数估计和假设检验两大类。

变量:是描述观察对象某种特征的概念,其特点是从一次观察到下一次观察可能会出现不同的结果(具有一个以上取值的概念)1、下列哪一个选项不是变量?( )A. 民族B. 智商C. 衣服的尺寸D. 女性答案:C2、下列变量属于数值型变量的是( )A. 工资收入B. 产品等级C. 学生对考试改革的态度D. 企业的类型答案:A解析:3、社会统计学的数据分析方法主要包括统计描述和( )A. 统计描述B. 统计推导C. 统计推论D. 统计分析答案:C4、能计算均值和标准差的必须是哪种变量( )A. 自变量B. 因变量C. 数值型变量D. 字符串型变量答案:C5、在SPSS中最多可以设置几个独立的缺失值?( )A. 3B. 4C. 5D. 8答案:A6、描述统计可以最恰当地表述为( )A.数据作概括性的表达B.对总体所作的结论C.测量操作的应用D.原始数据到标准分的转变答案:A解析:描述统计主要是利用图表形式对数据进行展示,或通过计算一些简单的统计量(诸如:比例、比率、平均数、标准差等)对数据进行分析。

第二章数据的描述性分析:图表展示1、欲以图形显示两变量X和Y的关系,最好创建( )。

A. 直方图B. 圆形图C. 柱形图D. 散点图答案:D第三章数据的描述性分析:概括性度量1、下列统计指标中,对极端值的变化最不敏感的是( )。

A. 众值B. 中位值C. 四分位差D. 均值答案:A2、经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( )A. 50%的数据B. 68%的数据C. 95%的数据D. 99%的数据答案:B解析:根据标准得分可以判断一组数据中是否存在离群点。

第二章数据描述

第二章数据描述

值的影响。因此,它不能准确地描述数据的分散程度。
【例题 2.14】在反映各变量值离散趋势的变异指标中,只与变量极端标志值有关的指标是( )。
(4)用哪个值代表一组数据 平均数的主要缺点是更容易受少数极端数值的影响,对于严重偏态分布的数据,平均数的代表性较 差。 中位数和众数的优点是不受极端值的影响,具有统计上的稳健性,当数据为偏态分布,特别是偏斜 程度较大时,可以考虑选择中位数和众数,这时它们的代表性要比平均数好。
【例题 2.12】在各种平均指标中,不受极端值影响的平均指标有( )。[2009 年中级真题] A.算数平均数 B.调和平均数 C.中位数 D.几何平均数 E.众数 【答案】CE
3
述。
【例题 2.8】为描述身高与体重之间是否有某种关系,适合采用的图形是( )。
A.直方图
B.条形图
C.散点图
D.环形图
【答案】C
【解析】散点图来反映两个变量的关系。题中只有两个变量,即身高和体重,因此可用散点图来描
【例题 2.9】下列各项中,即适用于定性数据,又适用于定量数据的图形表示方法有( )。
【例题 2.5】某管理局对其所属的企业的生产计划完成百分比采用如下分组,其中最能反映事物本质 差异的分组是( )。[2007 年中级真题]
A.80~89%,90~99%,100~109%,110%以上 B.80%以下,80~100%,100%以上 C.80%以下,80~90%,90~100%,100%~110%,110%以上 D.85%以下,85~95%,95~105%,105%以上 【答案】C 2.确定组距 组距:指每个组变量值中的最大值与最小值之差。若将最大值称为上限,最小值称为下限,则组距 等于上限与下限之差,即 组距=上限-下限 第一组的下限应小于最小值,最后一组的上限应高于最大值。 在确定组距时,一般应当掌握以下原则: (1)要考虑各组的划分是否能区分总体内部各个组成部分的性质差别 如果不能正确反映各部分质的差异,必须重新分组。例如,按学生百分制成绩分组,必须要有 60 分 的组限,否则不能反映是否及格的本质区别。 (2)要能准确地清晰地反映总体单位的分布特征 在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而当研究的现象变动很 不均匀时,则一般采用不等距分组。

统计学第2章用图表展示数据

统计学第2章用图表展示数据
绘制环形图
环形图
(doughnut chart )
北京、天津、上海和重庆地区按收入法计算的地区生产总值
第 2 章 用图表展示数据
2.2 用图表展示定量数据
2.2.1 生成频数分布表 2.2.2 定量数据的图示
2.2 用图表展示定量数据 2.2.1 生成频数分布表
【例2-3】某电 脑公司120天的 销售额数据(单 位:万元) 。生 成一张频数分
(定性数据)
【例2-1】为研究人们 对不同类型软饮料的偏 好情况,一家调查公司 在某超市随机调查了50 名消费者。右表是顾客 性别及其所偏好的饮料 类型记录。生成频数分 布表,观察不同性别的 消费者及其所偏好的饮 料类型的分布状况,并 进行描述性分析
制作频数分布表
生成频数分布表
(列联表—Excel)
用于研究结构 问题
简单饼图
(pie Chart)
主要用于展
示两个或多 个分类变量 的构成比较, 比如,在男 女分类的基 础上又增加 了饮料类型 的分类。
复式饼图
(pie Chart)
环形图
(doughnut chart)
1. 环形图中间有一个“空洞”,样本或 总体中的每一部分数据用环中的一段 表示
用哪些图形展示奖牌?
根据上面的数据,你认为可以选择哪些图形来展示 三个国家所获得的奖牌情况?学完本章的图表展示 技术,这样的问题就会迎刃而解
统计应用
把数据画图之后,要用用脑袋
➢ 沃德(Abraham Wald)和许多统计学 家一样,在第二次世界大战时也处理
了战争与相关的问题。他发明的一些
统计方法在战时被视为军事机密。以 下是他提出的概念中较简单的一种
3. 条形图主要用于展示定性数据,而直方 图则主要用于展示定量数据

第2章描述性统计分析实例

第2章描述性统计分析实例

第2章 描述性统计分析实例 当进行数据分析时,如果研究者得到的数据量很小,那么就可以通过直接观察原始数据来获得所有的信息;如果得到的数据量很大,那么就必须借助各种描述指标来完成对数据的描述工作。

用少量的描述指标来概括大量的原始数据,对数据展开描述的统计分析方法被称为描述性统计分析。

常用的描述性统计分析有频数分析、描述性分析、探索分析、列联表分析。

下面我们将一一介绍这几种方法在实例中的应用。

2.1 实例1——频数分析SPSS的频数分析(Frequencies)是描述性统计分析中比较常用的方法之一。

通过频数分析,我们可以得到详细的频数表以及平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数和峰度系数等重要的描述统计量,还可以通过分析得到合适的统计图。

所以进行频数分析不仅可以方便地对数据按组进行归类整理,还可以对数据的分布特征形成初步的认识。

下载资源\video\chap02\...下载资源\sample\2\正文\原始数据文件\案例2.1.sav【例2.1】表2.1给出了山东省某学校50名高二学生的身高。

试分析这50名学生的身高分布特征,计算平均值、最大值、最小值、标准差等统计量,并绘制频数表、直方图。

表2.1 山东省某学校50名高二学生的身高编号身高(cm)001 175002 163003 156004 174005 167… …048 158049 164050 16315在用SPSS 进行分析之前,我们要把数据录入到SPSS 中。

本例中有两个变量,分别是编号和身高。

我们把编号定义为字符型变量,把身高定义为数值型变量,然后录入相关数据。

录入完成后,数据如图2.1所示。

图2.1 案例2.1数据先做一下数据保存,然后开始展开分析,步骤如下:进入SPSS 24.0,打开相关数据文件,选择“分析”|“描述统计”|“频率”命令,弹出如图2.2所示的对话框。

选择进行频数分析的变量。

在“频率”对话框的左侧列表框中选择“身高”选项,单击中间的按钮使之进入“变量”列表框。

统计数据描述性分析PPT课件

统计数据描述性分析PPT课件

识别异常值
描述性统计可以帮助我们 识别异常值,即远离数据 集中心的值,这些值可能 会对数据分析产生影响。
提供决策依据
通过描述性统计,我们可 以了解数据的总体情况, 为进一步的数据分析提供 决策依据。
描述性统计的常用指标
01
02
03
04
均值
均值是数据集中所有数值的和 除以数值的数量,用于表示数
据的集中趋势。
通过实地观察记录数据, 适用于难以通过问卷等
方式获取的数据。
通过实验设计获取数据, 适用于需要控制变量的
实验研究。
通过查阅文献资料获取 数据,适用于历史数据 或无法直接获取的数据。
数据整理的步骤
数据清洗
去除重复、错误或不完整的数 据,确保数据质量。
数据分类
将数据按照一定的标准进行分 类,便于后续分析。
散点图
总结词
用于展示两个变量之间的关系,体现变量之间的关联程度
详细描述
散点图通过将数据点在坐标系上标出并连接成线来展示两个 变量之间的关系,能够反映变量之间的关联程度和趋势。适 用于展示两个变量之间的相关性分析。
05 数据的数值描述
数据的集中趋势描述
平均数
表示数据的集中趋势,计算所有数值的和除以数 值的数量。
样本代表性
在选择样本时,要确保样本具有代表性,能 够反映总体情况。
结论的可信度
在分析过程中,要注意排除偶然因素和误差 的影响,确保结论的可信度。
07 案例分析
案例一:销售数据描述性分析
总结词
通过销售数据的描述性分析,了解销 售情况,发现潜在问题,为决策提供 依据。
01
02
收集销售数据
收集一定时间段内的销售数据,包括 销售额、销售量、销售渠道、客户信 息等。

数据的描述性分析42页PPT

数据的描述性分析42页PPT
数据的描述性分析
11、获得的成功越大,就越令人高兴 。野心 是使人 勤奋的 原因, 节制使 人枯萎 。 12、不问收获,只问耕耘。如同种树 ,先有 根茎, 再有枝 叶,尔 后花实 ,好好 劳动, 不要想 太多, 那样只 会使人 胆孝懒 惰,因 为不实 践,甚 至不接 触社会 ,难道 你是野 人。(名 言网) 13、不怕,不悔(虽然只有四个字,但 常看常 新。 14、我在心里默默地为每一个人祝福 。我爱 自己, 我用清 洁与节 制来珍 惜我的 身体, 我用智 慧和知 识充实 我的头 脑。 15、这世上的一切都借希望而完成。 农夫不 会播下 一粒玉 米,如 果他不 曾希望 它长成 种籽; 单身汉 不会娶 妻,如 果他不 曾希望 有小孩 ;商人 或手艺 人不会 工作, 如果他 不曾希 望因此 而有收 益。-- 马钉路 德。
66、节制使快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70、浪费时间是一桩大罪过

第二章 数据的描述性分析 图表展示

第二章 数据的描述性分析 图表展示

3.2.1 数据分组
组距式分组
• 将全部变量值依次划分为若干区间,并将这一区 间的变量值作为一组。
• 适用于:连续变量/离散变量且变量值较多
组距分组
(要点)
1. 将变量值的一个区间作为一组 2. 适合于连续变量 3. 适合于变量值较多的情况
~ ~
4. 需要遵循“不重不漏”的原则
~
5.
电脑品牌 一季度 二季度
联想 IBM 康柏 戴尔
256
468
285
397
247
328
563
688
分类数据的图示—对比条形图
(例题分析)
销售量
800
688
700
600
563
500
468
400
300 256
397 285
328 247
200
一季度 二季度
100
0
联想
IBM
康柏
戴尔 电脑品牌
电脑销售量的对比条形图
400 累
225 270 300
积 300 户 300
276
数 200
168
132
(户) 100
75
0 24
0
30
非常 不满意 一般 满意 非常
非常 不满意 一般 满意 非常
不满意 (a)向上累积
满意
不满意 (b)向下累积
满意
甲城市家庭对住房状况评价的累积频数分布
Practice
某家书店为了了解前来该书店购物的顾客的学历分布情况, 随机抽取了100名顾客。其中学历表示为:1:初中,2:高 中或中专,3:本科,4:研究生及以上。调查结果如下表:
分类数据的图示—条形图

用统计图表示数据-分析和描述数据18页PPT

用统计图表示数据-分析和描述数据18页PPT

谢谢!
51、 天 下 之 事 常成 于困约 ,而败 于奢靡 。——陆 游 52、 生 不 等 于是呼 吸,生 命是活 动。——卢 梭
53、 伟 大 的 事 业,需 要决心 ,能力 ,组织 和责任 感。 ——易 卜 生 54、 唯 书 籍 不 朽。——乔 特
55、 为 中 华 之 崛起而 读书。 ——周 恩来
用统计图表示数据-分析和描述数据
6、法律的基础有两个,而且只有两个……公平和实用。——伯克 7、有两种和平的暴力,那就是法律和礼节。——歌德
8、法律就是秩序,有好的法律才有好的秩序。——亚里士多德 9、上帝把法律和公平凑合在一起,可是人类却把它拆开。——查·科尔顿 10、一切法律都是无用的,因为好人用不着它们,而坏人又不会因为它们而变得规矩起来。——德谟耶克斯

数据的描述(图与表)

数据的描述(图与表)

4、统计表的上下两端用粗线或双线绘制,在有些需要明显 分隔的部分也应用粗线或双线,其他则用细线。在横行 和合计栏、横行与纵栏标题间要划线。表的左右两端应 是开口的,不得划线。
5、统计表中如果栏目较多,可以加以编号:一般主词的计 量单位栏用(甲)、(乙)、(丙)……等次序编号,宾词各栏用 (1)、(2)、(3)………等次序编号。若各栏中统计指标有一定 的计算关系,还可以用算式表示之。
统计表的结构,从外表形式上看,是由四部分构成
总标题
表的名称,用于概括统计表中要说明的 内容。
横行标题 各组的名称,反映总体各组成部分的。
纵栏标题 分组标志或指标的名称,说明纵行所列 各项资料的内容。
指标数值
统计表的具体内容,每一项数值由相应 的横行标题和纵栏标题限定,可以是总 体单位数,也可以是标志总量,或者平
6%
13%
9%
本科以上
大专
中专
中专以下
72%
图2-2 职位需求按学历分布图
数值型数据的表示
1、直方
统计表
统计表的概念和结构 统计表是表现统计资料的一种形式。把经
过大量调查得来的统计资料,经过汇总整 理以后,按照一定的规定和要求填列在相 应的表格内,就形成了一定的统计表。
分类数据和顺序数据的表示
(二)统计图的种类
1、条形图
条形图是以相同宽度条形的长短或高度来比较统 计指标数值大小的图形。如某企业1995 — 2001 年的销售额情况
700 600 500 400 300 200 100
0 1995
1996
1997
1998
1999
2000
2001
年销售额(万)
2、面积图
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例:对学生成绩的分组可以分为0~20分、20~40分、
40~60分、60~80分、80~100组
• 不等距分组 适用于变动很不均匀,且变动幅度大 例:学生成绩分组也可分为0~60(D)、 60~80(C) 80~90(B)、90~100(A) 关键问题:分组数目的确定/组距的确定
3.2.1 数据分组
21
7.0 300 100.0
99
33.0
120
40.0 279
93.0
78
26.0
198
66.0 180
60.0
64
21.3
262
87.3 102
34.0
38
12.7
300
100.0
38
12.7
300 100.0




顺序数据的图示—累计频数分布图
400 累 积 300 户 数 200
(户1)00
根据上述资料编制频数分布表,向上向下累计频数,频率 分布表
居民户月消费品 支出额
751~800 801~850 851~900 901~950 951~1000 1001~1050 1051~1100 1101~1150
合计
频数
1 4 12 18 8 4 1 2 50
频率%
2 8 24 36 16 8 2 4 100
(1)表中数据属于顺序数据
(2)
学历 初中 高中或中专 本科 研究生及以上 合计
频数(人) 13 31 27 29 100
(3) 绘制条形图
学历分布
31
27
29
13
初中
高中或中专
本科
研究生及以上
频率(%) 13.00 31.00 27.00 29.00 100.00
环形图
(doughnut chart)
组距式分组
第三,组距的确定 组距=(最大值-最小值)÷组数。
第四,组限的确定 组限的选择应做到第一组的下限应略低于最小变量值,最后 一组的上限应高于最大变量值。
离散型变量:相邻组的上下限可以不重叠 连续型变量:相邻两组的组限应重叠,即上一组的上限
同时也是下一组的下限。用“上限不在内”原则解决不 重问题 当变量值变动范围较大时,最小组为“……以下”,最大组 为“……以上”的开口组。
400 累
225 270 300
积 300 户 300
276
数 200
168
132
(户) 100
75
0 24
0
30
非常 不满意 一般 满意 非常
非常 不满意 一般 满意 非常
不满意 (a)向上累积
满意
不满意 (b)向下累积
满意
甲城市家庭对住房状况评价的累积频数分布
Practice
某家书店为了了解前来该书店购物的顾客的学历分布情况, 随机抽取了100名顾客。其中学历表示为:1:初中,2:高 中或中专,3:本科,4:研究生及以上。调查结果如下表:
3.2.1 数据分组
组距式分组
• 将全部变量值依次划分为若干区间,并将这一区 间的变量值作为一组。
• 适用于:连续变量/离散变量且变量值较多
组距分组
(要点)
1. 将变量值的一个区间作为一组 2. 适合于连续变量 3. 适合于变量值较多的情况
~ ~
4. 需要遵循“不重不漏”的原则
~
5.
频率 fi fi
式中, fi 表示第 i 组的频数。很显然,任何一个分布都必须满 :
(1)各组的频率都界于0和1之间。 (2)各组频率之和等于1(或100%)。
Practice
根据抽样调查,2010年某地区50户城镇居民家庭 的人均月消费额(单位:元)的资料如下。
886 1000 886 926 864 900 938 821 1027 1006 816 999 946 950 1100 800 978 852 890 981 900 818 946 854 900 921 949 954 863 850 916 999 1040 893 967 927 905 919 651 987 928 918 1120 895 1050 866 864 924 928 926
分类数据的图示—条形图
(bar Chart)
1. 用宽度相同的条形的高度或长短来表示各类别数据 的图形
2. 有单式条形图、复式条形图等形式 3. 主要用于反映分类数据的频数分布 4. 绘制时,各类别可以放在纵轴,称为条形图,也可
以放在横轴,称为柱形图(column chart)
分类数据的图示—条形图
3.2.1 数据分组
单项式分组
就是把每一个变量值作为一组。 这种方法通常只适于离散变量且变量值较少的情况
10 13 4 8 7 14 17 7 24 8 10 9 15 10 15 2 5 10 6 5 15 9 8 4 5 20
由于机器台数属于离散型变量,因此使用单项式分组方法。 1.将原始资料按变量值升序排列, 2.然后将相同变量值分为一组, 3.最后将资料分成若干组。
以下主要介绍等距分组的基本步骤。
组距式分组
第一,数据排序
第二,分组数目的确定
使每组所包含的数据个数,平均不少于4个或5个,或采用斯特吉
斯经验公式,即
k=1+3.322lgN
k为组数;N为总体中的个体数。
分组组数参考表
N 15~24 25~44 45~89 90~179 180~359
k
5
6
7
8
9
3.2.1 数据分组
4414234433 4423324122 2242323124 1232231243 2344412223 1214142334 3143332423 3441442343 2424222213 4334233142
(1)上表中的数据属于什么类型
(2)制作一张频数分布表,向上频数,向上频率表
(3)绘制一张条形图,反映顾客的学历分布
第 2 章 数据的描述性分析: 图表展示
国际经济贸易学院 经济学教研室 柳馨竹
重要知识点
3.1 品质数据的整理与显示 3.2 数值型数据的整理与显示 3.3 合理使用图表
学习目标
1. 掌握分类和顺序数据的整理与显示方法 2. 掌握数值型数据的整理与显示方法 3. 合理使用图表
3.1 品质数据的整理与展示
分类数据的整理与图示
分类数据的整理 (基本过程)
1. 列出各类别 2. 计算各类别的频数 3. 制作频数分布表 4. 用图形显示数据
分类 A B C D ELeabharlann 频数比例百分比
比率
分类数据的整理
(可计算的统计量)
1. 频数(frequency) :落在各类别中的数据个 数
2. 比例(proportion) :某一类别数据个数占全 部数据个数的比值
3.2.1 数据分组
组距式分组
第五,组中值的确定 组中值=(上限+下限 )÷2
开口组的组中值: 组中值=下限+邻组组距/2(缺上限) 组中值=上限-邻组组距/2(缺下限)
3.2.1 数据分组
1.频数
频数和频率
频数是各组所具有的单位个数,一般用 fi 表示。
2.频率
即各组频数与总体单位总和之比,它反映了各组频数的大小对总体所起 的作用的相对强度。频率的计算公式如下:
频数
16 15
12
11
9
9
8
6
4
0 可口 旭日升 百事 可乐 冰茶 可乐
汇源 果汁
露露
不同品牌饮料的频数分布
品牌
分类数据的图示—对比条形图
(side-by-side bar chart )
1. 分 类 变 量 在 不 同 时间或不同空间 上有多个取值
2. 对 比 分 类 变 量 的 取值在不同时间 或不同空间上的 差异或变化趋势
分类数据的图示—帕累托图
(pareto chart)
1. 按各类别数 据出现的频 数多少排序 后绘制的柱 形图
2. 主要用于展 示分类数据 的分布
频数
16
15
12
11
9
9
8
6
4
0 可口可乐 旭日升冰茶 百事可乐
露露
不同品牌饮料的帕累托图
汇源果汁
品牌
分类数据的图示—饼图
(pie Chart)
1. 也称圆形图,是用圆形及圆内扇形的角度来表示数 值大小的图形
非常满意 30 10 300 100.0 30 10
合计
300 100.0 —



顺序数据的频数分布表
回答类别
非常不满意 不满意 一般 满意 非常满意
合计
乙城市家庭对住房状况评价的频数分布
乙城市
户数 百分比
(户)
(%)
向上累积
户数 (户)
百分比 (%)
向下累积
户数 (户)
百分比 (%)
21
7.0
2. 主要用于表示样本或总体中各组成部分所占的比 例,用于研究结构性问题
3. 绘制圆形图时,样本或总体中各部分所占的百分比 用圆内的各个扇形角度表示,这些扇形的中心角度, 按各部分数据百分比乘以3600确定
分类数据的图示—饼图
¶ ¶ 18% »ã Ô´ û¹ Ö­ 12%
¿É ¿Ú ¿É ÀÖ 30%
° Ù ÊÂ ¿É ÀÖ 18%
Ðñ ÈÕ Éý ± ù ²è 22%
²» ͬ · Æ ÅÆ Òû ÁÏ µÄ ¹ ³É
顺序数据的整理与图示
顺序数据的整理
(可计算的统计量)
相关文档
最新文档