第2章 描述统计学:表格法和图形法

合集下载

2描述统计1:表格法和图形法

2描述统计1:表格法和图形法

Example: Hudson Auto Repair Hudson 汽车修理
相对频数和百分数频数
Relative
Cost ($) Frequency
50-59
.04
60-69
.26
70-79
.32
80-89
.14
90-99
.14
100-109
.10
Total 1.00
Percent Frequency 4 26 32 14 14 10 100
College of Management
(1)找出数据的最大值L,最小值l,计算极差R=L—l,
本例中,L=4.9,l=2.6, R=2.3。
(2)确定分组个数k,计算组距h。本例中,可选k=5,
则组距
为了计算方便,可取h=0.5。
(3)决定各组界限值,确定分点。首先可取第一组下限
值为2.5,则第一组上限值为2.5+0.5=3,依此类推,
Example 2:
从一批电阻中抽取30只,测得各只的电阻值如下 (单位:千欧姆)。对这组数据适当分组,建立 频数频率分布表,并作出频率直方图。
4.3 4.6 4.7 3.7 3.8 3.2 4.0 4.4 2.8 3.4 3.7 3.2 4.1 2.6 4.6 4.9 4.1 3.4 3.8 2.7 3.5 4.4 3.6 3.2 4.0 3.8 3.5 4.2 4.6 3.9
College of Management
Example:
Relative
Rating
Frequency
Poor
0.10
Below Average 0.15
Average
0.25

第二章统计描述第二部分

第二章统计描述第二部分

9% 18%
43%
30%
图4.某地5岁以下儿童死亡原因分布
呼吸系疾病 传染病 先天性疾病 其它
线图(line diagram )
1. 概念:以线段的上升或下降来表示事物在时间上的发 展变化或一种现象随另一种现象变迁的情况
2. 适用资料:连续性资料。
3. 应用:反映事物的连续的动态变化规律。
线图(line diagram )
25 20 15 10 5 0
红细胞计数值(10 12 /L)
3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.90~5.66.02~0
频数(人数)
散点图(scatter diagram)
1.概念:以点的密集程度和趋势来表示两种现 象的相关关系。
绘制要点:
(1)坐标轴:横轴表示时间或组段,纵轴表示频数或率。 纵轴坐标可以不从0开始,因此在看图时要注意纵轴 的起点坐标。
(2)数据点画在组段中间位置。相邻的点用直线连接, 不要用平滑的曲线连接。无数据的组段用虚线连接。 直线不能任意外延。
(3)同一张线图上不要画太多条曲线,否则不易分清。 当有两条或两条以上曲线在同一张线图上时,须用 不同颜色或不同的图形形式加以区分,并附图例加 以说明。
5.备注 不应写在表中,在数字上角用“*”号标出,文字叙
述写在表的下方。
不良统计表的修改举例
表 2-15 第三组病人各年存活及死亡情况 (原表)
年份 (1)
病例数 (2)
存活数 (3)
住院期死 亡总例数
急性期 死亡数
住院期总病 急性期病 死率(%) 死率(%)
(4)=(2)+(3) (5) (6)=(4)/(2) (7)=(5)/(2)

描述统计-图表方法

描述统计-图表方法

一、品质数据汇总与显示 ㈠品质数列 ㈡频数与频率 ㈢条形图与饼图
中国体育代表团在悉尼 奥运会上获金牌的项目
射击 射击 体操 体操 乒乓球 举重 乒乓球 羽毛球 举重 乒乓球 羽毛球 举重 举重 跳水 跳水 跳水 乒乓球 跳水 射击 体操 羽毛球 柔道 柔道 举重 田径 羽毛球 跆拳道
获金牌项目 跳水 举重 乒乓球 羽毛球 体操 射击 柔道 田径 跆拳道
第二节 数据整理与显示 一、数据审核与统计分组 二、品质数据汇总与显示 三、数量数据汇总与显示
一、数据审核与分组 ㈠数据审核 ㈡统计分组
数据审核
统计工作的基本程序 收集 数据 真实 数据 虚假 数据 假数真算 科学地计 算与分析 得出 结论 正确 结论 错误 结论
数据审核
审核种类 全员劳动生产率<工人劳动生产率 工人劳动生产率 全员劳动生产率 审核内容 审核方法
定距测量 定比测量
甲生于1940年、 年 甲生于 乙生于1985年。 乙生于 年
较高
=、≠、 =、 、> 、 < 、+ 、-
=、≠、 =、 、> 、 < 、+ 、-、 ×、÷
甲60岁、乙15岁 岁 岁
较高
高 层 次
定比测量 定距测量 定序测量 定类测量
对于不同的现象, 对于不同的现象,注意准确性
定 比 尺 度
按现象绝对差异与相对差异 进行的辨别与区分。 进行的辨别与区分。测量结 定比变量或 果形成定比变量 定比指标。 果形成定比变量或定比指标。 定比变量或指标确切的值也 定比变量或指标确切的值也 以数字表述, 以数字表述,有计量单位 , 可以加减, 可以加减, 定比变量或指标有绝对意义 定比变量或指标有绝对意义 上的零点,既可以加减, 上的零点,既可以加减,可 以乘除运算。 以乘除运算。

《统计学(第二版)》电子课件 第2章 数据的描述

《统计学(第二版)》电子课件 第2章 数据的描述

《统计学》第2章数据的描述
2-19
抽样调查
抽样调查(sampling survey):是从研究对 象的总体中随机抽取一部分个体作为样 本进行调查,并根据调查结果来推断总 体数量特征的一种非全面调查方法。
抽样调查的特点:经济性好、实效性强、 适应面广、准确性高。
2021/8/7
《统计学》第2章数据的描述
2021/8/7
《统计学》第2章数据的描述
2-30
【例2.2】
——条形图的绘制
图2.1 30名教师职称分布条形图
2021/8/7
《统计学》第2章数据的描述
2-31
【例2.3】
——饼图的绘制
(数据文件为)根据表资料, 用SPSS绘制 饼图。
解:打开数据文件example2.1.sav;
选择→“图形”→点击“旧对话框 (L)”→“饼图(E)”→在“图表中的 数据为”中选“个案组摘要(G)→点击 “定义”→ 在“分区的表征”中选中“个 案数(N)”→将“职称”选入“定义分区 (B)”→点击“确定”,可得图。
100.00
2021/8/7
《统计学》第2章数据的描述
2-36
组距分组中的几个基本概念
组限:每个组两端的数值。分为上限和 下限。
组距:一个组的上限与下限两端的距 离。
全距:所有变量值中最大值与最小值 之差 。
组中值:每个组的上限与下限的中点 值。
2021/8/7
《统计学》第2章数据的描述
2-37
数据的计量尺度 数据的类型
2021/8/7
《统计学》第2章数据的描述
2-4
数据的计量尺度
按照对现象计量程度的不同,可以将数据 计量尺度分为四种,即:定类尺度、定序 尺度、定距尺度、定比尺度。

第2讲描述统计_表格法与图形法

第2讲描述统计_表格法与图形法
2.打开文件“饮料频数分布分组”,制作购买饮 料品牌的的分组条形图和分段条形图。
3.打开文件“多选题(二分法)”和“多选题 (分类法)”,制作旅游景点偏好的频数分布表。
4.打开文件“居民出游天数原始数据”,制作出 游天数的频数分布表和直方图。
5.打开文件“餐厅列联表”,制作关于餐价和质 量等级分类的列联表。
主讲人: 宋立杰
第二讲 描述统计—表格法与图形法
作为统计学的基本方法,描述 统计是通过图表或数值方法,对数 据进行描述的方法。本讲首先系统 地介绍如何使用表格法和图形法来 描述定性数据和定量数据。然后详 细介绍如何利用表格法和图形法描 述两变量之间的关系。
1 2 3
(一)频数分布表
1.概念:用表格方法描述几个互不重叠的分组中数据的个数。
2.制作过程 例5:打开“饮料 频数分布性别分组.”, 制作关于购买饮料品 牌的饼状图。
预览框
饼 状 图 制 作 对 话 框
购买饮料品牌饼状图
购买饮料品牌饼状图进一步编辑
1
定性数据描述
2
3
(一)频数分布表
例6:对下列定量数据进行分组,制作出游天数的频数分布表。
20名居民每年出游天数
12
14

预览框







出游天数直方图
1
定性数据描述
2
3
(一)列联表
1. 概念 描述两定性变量关系的分布表,行、列变量均为分组变量。
2. 制作过程 例8:打开文件
“餐厅列联表”,制 作关于餐价与质量等 级的列联表。
列联表制作对话框
行变量 列变量
餐价与质量等级列联表
结果讨论:列联表显示,质量等级与餐价之间 存在着密切的正相关关系。

生物统计第二章资料的整理与描述

生物统计第二章资料的整理与描述
样本容量;
大样本与小样本; 随机样本(random sample);
非随机样本(non-random sample)。
总体与样本的关系
由样本推断总体虽然有很大可靠 性,也有一定错误率。俗语说“不 可不信,不可全信”,这是我们对 待统计推断的正确态度。
2、参数与统计数 用总体的全体观察值计算的、描述总 体的特征数称为参数(parameter)。
玉米的穗行数等
上一张 下一张 主 页 退 出
(二)质量性状资料
质量性状是指只能观察而不能测量的性状。
如花药、种子、果实、叶片的颜色、籽粒的
饱满度、芒的有无等。 质量性状本身不能用数值表示,要获得这 类性状的资料,须对其观察结果作数量化
处理。数量化方法可分为以下两种:

统计次数法 评分法
上一张 下一张 主
页 退

1、统计次数法
在一定的总体或样本内,根据某一质量性状的
类别统计其次数,以次数作为质量性状的数据。
【例如】红花豌豆与白花豌豆的 【例如】 玉米果穗 杂交试验,统计F2不同花色植株, 上甜粒与 在1000个F2植株中,红花266株、 非甜粒的 分离比率。 紫花494株、白花240株。 这种利用统计次数法对质量性状 数量化得来的资料又叫次数资料。
这一条件的约束,能自由变动的
离均差的个数是 n-1 。当 n-1 个离均差确定 后,第n个离均差也就随之而定,不能再任 意变动。
【例】有5个观察值3、4、6、8、9,其平均数6。
5个察值的离均差为-3,-2,0,2,3,满足:

(x x) 0
一般,在计算离均差平方和时,若约束条 件为k个,则其自由度dƒ=n-k。
如:总体平均数 ---- μ

第二章-统计图表ppt课件

第二章-统计图表ppt课件
.
示例:小教本011教育统计学单元考试学生成绩频数分布直
方图
16
14
12
50-
10
60-
8
70-
6
80-
90-
4
2
0
.
多边图
多边图表示连续性随机变量次数分布的线性图。 绘制多边形图时,横坐标是以各分组区间组中值表示的连续变量,纵坐 标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐 标标点,连接各点,就成为一条折线。 多边形图与直方图虽然都是以面积表示表示连续性数据的次数分布,但 多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。 如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。 这样就能够对于总体的理论次数分布的分析提供很多有用的信息
.
其他常用的统计图的类型
(2)圆形图 圆形图主要用于描述间断性资料,目的为显示各部分在整体中所占
的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如 百分数)为主。
.
其他常用的统计图的类型
(3)线形图 线形图更多地用于连续资料,凡欲表示两个变量之间的函数关系,
或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的 情形,用线性图表示是较好的方法。
.
示例:小教本011教育统计学单元考试学生成绩频数分
布多边图
.
累加频数分布图
它的画法同次数多边形基本相同,不同点是横坐标为每分组区间的精确上 限或下限,纵坐标是各分组的累加次数,分别标出各个交点,连接各交点 即可画成累加曲线,也叫S型曲线
示例:小教本011教育统计学单元考试学生成绩频
数分布多边图
.
累加频数分布表

叙述统计表格与图形法.

叙述统计表格与图形法.


此種關係並不適用於全部的點,因為散佈圖上
全部的點連起來,並不是一條直線。.
CH2-
48
彙總資料的程序
資料
定性資料
表格法 圖示法 表格法
定量資料
圖示法
•次數分配 •相對次數分配. •百分比次數分配 •交叉表格
•長條圖 •圓形圖
•次數分配 •相對次數分配. •百分比次數分配 •累積相對次數分配 •莖葉圖 •交叉表格
CH2-
4
範例: 飲料購買次數

次數分配
CH2-
5
相對次數分配

一個資料組的相對次數代表該類別的觀察值次
數和全資料集合之觀察次數的比率。

相對次數分配為一個資料集合的表格化彙總,
顯示出每一個資料組的百分比次數。
CH2-
6
百分比次數分配
將每一個相對次數值乘上100,則是百分比次 數。 資料集合的表格化彙總,顯示每一個資料組的 百分比次數。

40%的稽核時間是15-19天。 只有5% 的稽核需時30天以上。
CH2-
19
點圖


最簡單的資料彙總圖形之一。
橫軸是資料集合的值域。 每一個資料值均以黑點表示在水平軸上方適當 的位置上。
CH2-
20
範例:會計師事務所的年終稽核時間

點圖
CH2-
21
直方圖

另一種常見的定量資料的表示圖形是直方圖。 將感興趣的變數放在橫軸,次數、相對次數或 百分比次數則置於縱軸。

CH2-
11
範例: 飲料購買次數

圓形圖
CH2-
12
2-2 定量資料的彙總

《应用商务统计》-课程教学大纲

《应用商务统计》-课程教学大纲

《应用商务统计学》课程教学大纲一、课程基本信息课程代码:16045003课程名称:应用商务统计学英文名称:Applied Business Statistics课程类别:专业课学时: 48学分: 3适用对象: 国际商务专业考核方式:考试先修课程:《微积分》、《概率论与数理统计》二、课程简介应用商务统计学介绍在商务经济活动当中常用的统计描述和统计推断的方法。

主要内容包括如何使用图形和统计指标对数据进行整理和描述、抽样分布、点估计、区间估计、假设检验、列联表分析、方差分析、回归分析。

课程的教学中将介绍计算机统计分析软件EXCEL的使用和案例分析。

Applied Business Statistics introduces some statistical description and statistical inference methods used in business and economic activities. The main contents include how to use graphics and statistical indicators to organize and describe the data, sampling distribution, point estimation, interval estimation, hypothesis testing, contingency table analysis, variance analysis and regression analysis. The course will introduce the use of computer statistical analysis software EXCEL and the analysis of several cases. 三、课程性质与教学目的应用商务统计学是一门应用性统计学课程,系统论述了统计理论与方法在商务经济活动中的应用。

2描述统计1:表格法和图形法

2描述统计1:表格法和图形法
College of Management
Example:
Relative
Rating
Frequency
Poor
0.10
Below Average 0.15源自Average0.25
Above Average 0.45
Excellent
0.05
Total
1.00
Percent Frequency
10 15 25 45
从一批电阻中抽取30只,测得各只的电阻值如下 (单位:千欧姆)。对这组数据适当分组,建立 频数频率分布表,并作出频率直方图。
4.3 4.6 4.7 3.7 3.8 3.2 4.0 4.4 2.8 3.4 3.7 3.2 4.1 2.6 4.6 4.9 4.1 3.4 3.8 2.7 3.5 4.4 3.6 3.2 4.0 3.8 3.5 4.2 4.6 3.9
Chapter 2
Descriptive Statistics Ⅰ: Tabular and Graphical Methods
描述统计Ⅰ :表格法和图形法
College of Management
主要内容
▪ Summarizing Qualitative Data 品质数据汇总
▪ Summarizing Quantitative Data 数量数据汇总
▪ Relative Frequency Distributions and Percent Frequency Distributions 相对频数分布和百分数频数分布
▪ Bar Graph and Pie Chart 条形图和饼形图
College of Management
Frequency Distribution 频数分布

第2章Descriptive Statistics描述统计学表格和图形法-B

第2章Descriptive Statistics描述统计学表格和图形法-B

• one variable is categorical and the other is quantitative,
一个变量是分类的,另一份是数量的,
• both variables are categorical, or 都是分类变量,
• both variables are quantitative. 或都是数量变量。
Summarizing Data for Two Variables using Tables
▪ Thus far we have focused on methods that are used to summarize the data for one variable at a time.
之前我们关注怎么汇总一个变量的数据。
1
otherwise on a password-protected website or school-approved learning management system for classroom use.
Essentials of Modern Business Statistics (7e)
▪ Often a manager is interested in tabular and graphical methods that will help understand the relationship between two variables.
管理人员往往需要汇总两个变量的数据来揭示变量之间的关系。
2
otherwise on a password-protected website or school-approved learning management system for classroom use.

高级生物统计学 第2章 资料整理

高级生物统计学 第2章 资料整理
第二章:资料统计描述
资料分类 资料的整理 统计量 Excel、SPSS制表、绘图和计算 功能简介
1
第一节: 资料的分类
试验观察、测量的数据按其性质不同,可分为计(数) 量资料、计(次)数资料二大类:
计(数)量资料 计(次)数资料
2
一、资料分类
计量(数量)资料:由量、测或直接计数所获 资料,取值为实数,常用连续型随机变量表示, 多服从正态分布,可用t检验、F检验作统计分 析。 计数(次数)资料:先按其性状或类别分组, 再清点各组次数所获资料,取值为正整数或零, 常用离散型随机变量表示,多服从二项分布, 可用X2检验作统计分析。
34
Excel应用(一)
求统计函数; 抽样; 作频数分布表-----频率数----直方图-----判断分布 正态性。
35
常用统计函数
频数分布函数———Frequency 平均数--------Average 几何平均数-------Geomean 样本标准差---------Stdev 样本方差----------Var 样本标准误(差)------Std. Error
进入统计状态: stat 数据输入:数据1-----DATA -----数据2---DATA-------数据N---DATA;
结果输出:直接按统计量符号即可。
33
Excel在统计中具体应用
查表(t、F、x2和r值表等) 求统计量 计算正态分布\二项分布概率 作图 抽样 统计分析 相关与回归分析
39
应用Excel作频数分布表
一法:输入样本数据,后用Frequency统 计函数; 二法:数据分析工具------直方图(接收区输 入分组区间)----频数-----折线图

统计学原理复习重点概述

统计学原理复习重点概述

统计学原理复习重点概述本课程主要包括三部分知识。

第一部分统计基础知识第一章和第二章数据收集部分。

第二部分描述统计第二章统计数据整理部分(表格与图形法)、第三章数据分布特征的描述(静态数据描述法)和动态数据描述法,即第六章时间数列分析和第八章统计指数。

第三部分推断统计第四章抽样估计和第五章假设检验与方差分析。

第一章绪论。

本章介绍统计学及相关概念,勾勒了本课程的框架结构——描述统计学和推断统计学。

是统计的三层含义,总体、样本及指标等概念。

统计的三层含义及相互关系统计学是一门关于数据的科学,是一门关于数据的收集、整理、分析、解释和推断的科学。

(一)统计工作(统计的基本含义)即统计实践活动,是人们对客观事物的数据资料进行搜集、整理、分析的工作活动的总称。

(二)统计资料是统计工作的成果,包括各种统计报表、统计图形及文字资料等。

(三)统计学是一门收集、整理、描述、显示和分析统计数据的方法论的科学,其目的是探索事物的内在数量规律性,以达到对客观事物的科学认识。

(四)三者关系统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践。

统计工作和统计数据是工作和工作成果关系。

统计实践活动的产生与发展三个主要的统计学派1、政治算术学派代表人物:英国的威廉·配第(1623-1687)、约翰·格朗特(1620-1674)等。

威廉·配第的代表著《政治算术》对当时的英、荷、法等国的“ 国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。

他们开创了从数量方面研究社会经济现象的先例。

可以说,威廉·配第是统计学的创始人。

2、记述学派(国势学派〕代表人物:德国的康令(1606-1681)阿亨瓦尔(1719-1772;1764年首创统计学一词)他们在大学中开设“ 国势学”课程,采用记述性材料,讲述国家“ 显著事项”,籍以说明管理国家的方法。

02 描述统计学Ⅰ:表格法和图形法

02 描述统计学Ⅰ:表格法和图形法
3
Pepsi-Cola Coke Classic Coke Classic Coke Classic Pepsi-Cola Dr. Pepper Coke Classic Diet Coke Pepsi-Cola Pepsi-Cola Pepsi-Cola Pepsi-Cola Coke Classic Dr. Pepper Pepsi-Cola Sprite
N 2 K = 1 + log10 log10
• 其中 为数据的个数(总体单位数或样本数),一般对 其中N为数据的个数 总体单位数或样本数), 为数据的个数( ),一般对 结果取整数。 结果取整数。
本例中: 本例中:K=1+lg20/lg2=1+4.32=5.32≈5 ≈
11
第二步, 第二步,确定组宽
8
2 描述统计学Ⅰ:表格法和图形法 描述统计学Ⅰ
品质型数据汇总 数量型数据汇总 探索性数据分析 交叉分组列表和散点图
9
频数分布
• 例:下表中的数量数据给出了某会计师事务所完成20个 下表中的数量数据给出了某会计师事务所完成 个 客户样本的年终审计所需要的以天计的时间数。 客户样本的年终审计所需要的以天计的时间数。
12
第三步, 第三步,确定各组组限 • 分组所遵循的主要原则是“不重不漏”。因此, 分组所遵循的主要原则是 不重不漏” 因此, 主要原则 数据的最小值; 组下限 ≤ 数据的最小值; 数据的最大值; 组上限 ≥ 数据的最大值; 另外,数据在每组中的归属习惯上采用“上组限不在 另外,数据在每组中的归属习惯上采用“ 内”。 • 对离散型数据,可采用相邻两组组限间断的办法解决 离散型数据, 不重”的问题( “不重”的问题(如6-10,11-15,16-20等); , , 等 • 对连续型数据,往往采用相邻两组组限重叠,根据“上 连续型数据,往往采用相邻两组组限重叠,根据“ 限不在内原则”解决“不重”问题( 限不在内原则”解决“不重”问题(如[5,10), ) [10,15),[15,20)等)。 ) )

第二章-统计图表PPT课件

第二章-统计图表PPT课件
如长度、重量、时间、温度等。一般测量数据中的比率变量和 等距变量都是连续变量。
2021/3/15
2021
5
(一)数据的类型
连续变量和离散变量: 这是依据数据是否具有连续性进行的分类。
2. 离散变量:其数量是有限的,取值一般是整数,在量表 (数轴)上的任何两点中只能取得有限个数值。
一般计数数据和测量数据中的顺序变量大都是离散变量。
34
1、简单次数分布表的编制
1)求全距。全距是指所有观测数据中最大数与最 小数之间的差距。用大写英文字母R表示: R=Max-Min。
2)定组数。即确定一批数据要划分为多少个等距 的区组,用符号K表示。通常根据数据的多少确 定适当的组数,也可用公式K=1.87(N-1)2/5确定。
3)定组距。组距是指每一组的间距,用符号i表 示。用全距除以组数后,取整数表示组距,组 距一般取奇数或5的倍数。
统计图的结构一般包括图号、图题、图目、 图形、图注和线条几部分。
2021/3/15
2021
21
(二)如何制作统计图?
图号:即图的序号,写在图的下方,通常也用 阿拉伯数字表示,其要求与统计表的序号一致。
图题或标题:写在图号的后面,其文字应简赅, 扼要表达统计图的内容。
图目:写在图形基线上的各种不同类别,名称, 或时间、空间的统计数量,即横坐标上所用的 各种单位名称。
70
60
50
40
30
20
10
0
同意
介于二者之间
不同意
过多的非户籍人口 房屋租赁管理不规范 政府投入不够
2021/3/15
2021
29
被调查对象性别构成情况
男 42.6%
Missing 2.6%
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表2-6 実计时间数据的频数分布
审计时间/天 10-14 15-19 20-24 25-29 30-34 总计
频数 4 8 5 2 1 20
相对频数 0.20 0.40 0.25 0.10 0.05 1.00
百分数频数 20 40 25 10 5 100
2.2.4 直方图




直方图是一种常用的数量型数据的图形描绘方式。由先 前已汇总出的频数分布、相对频数分布或百分数频数分 布等资料可构建直方图。 画法: (1)所关心的变量放置在横轴上 (2)频数、相对频数或百分数频数放置在纵轴上 (3)每组的频数、相对频数或百分数频数用一个长方 形绘制,长方形的底放置在横轴上,以组距为底,以每 组相应的频数、相对频数或百分数频数为高。 (4)与条形图不同,直方图相邻组的长方形之间没有 自然的间隔。 直方图的一个最重要的应用是提供了关于分布形态的信 息。
饮料 可口可乐 加多宝凉茶 百事可乐 康师傅冰红茶 频数 19 8 13 5 相对频数 0.38 0.16 0.26 0.10 百分数频数 38 16 26 10
雪碧
总计
5
50
0.10
1.00
10
100
2.1.3 条形图和饼形图
条形图:用来描绘已汇总的品质型数据的频数分 布、相对频数分布或百分数频数分布。 画法: 横轴——对数据分组的标记 纵轴——频数、相对频数或百分数频数的刻度 固定宽度绘制的长条放置在每一组的标记上, 长条的高度为该组的频数、相对频数或百分数 频数。 对于品质型数据,应将这些长条分隔开,以强 调每一组是相互独立这一事实。
2.2.5 累积分布

累积频数分布表示的是小于或等于每一组上组限 的数据项个数,是数值型数据的另一种表格汇总 方式。
审计时间/天 10-14 小于或等于14 15-19 小于或等于19 20-24 小于或等于24 25-29 小于或等于29 30-34 小于或等于34 频数 累积频数
4
8 5 2 1
2.2 数量型数据汇总
2.2.1 频数分布 频数分布的定义不品质型数据一样,关键在 亍对亍频数分布的互丌重叠的组的确定。 步骤: (1)确定互丌重叠组的个数(分组) (2)确定每一组的组距 (3)确定组限
根据数量型变量是离散性的还是连续性的, 可以分成两种情况: (1)单项式分组:就是把每一个变量值作为 一组。这种方法通常只适于离散变量且变量 值较少的情况。 例2.1 某车间50个工人看管机床台数资料如 下: 3 6 2 4 3 2 6 4 3 2 4 2 5 2 6 2 3 5 4 3 2 3 6 5 4 2 4 3 2 2 3 5 4 5 6 2 2 6 4 3 2 6 3 4 5 4 5 2 3 5
0-9
10-14 15-19 20-24 25-29 30-34
0
4 8 5 2 1
0
4 12 17 19
20
2.3 交叉分组表和散点图
2.3.1 交叉分组表 交叉分组表是一种汇总两个变量数据的斱法 ,用以理解两个变量间的关系。 例:表Restaurant.xls给出300家饭店组成 的一个样本,搜集了这300家饭店的质量等 级和餐价数据。质量等级是一个品质变量, 等级类别有良好、很好和极好;餐价是一个 数量变量,其变化范围是10-49美元。
饮料购买次数的条形图
-通用格式
-通用格式 -通用格式 -通用格式 -通用格式
频数
-通用格式 -通用格式 -通用格式 -通用格式
-通用格式
-通用格式 可口可乐 加多宝凉茶 百事可乐 饮料 康师傅冰红茶 雪碧




饼形图:描绘品质型数据的相对频数和百 分数频数分布的图形方法。 画法: (1)一个圆形代表所有的数据 (2)圆形内包括若干扇形部分 (3)扇形与每一组的相对频数相对应
以下主要介绍等距分组的基本步骤。 第一,数据排序 第二,分组数目的确定 使每组所包含的数据个数,平均丌少亍4个或5个, 或采用斯特吉斯经验公式,即 k=1+3.322lgN k为组数;N为总体中的个体数。
表2-4 分组组数参考表
N k
15~24 5
25~44 6
45~89 7
90~179 8
180~359 9
裁决
A 维持 推翻 总计(%) 裁决 民事庭 129(86%) 21(14%) 150(100%)
法官
B 110(88%) 15(12%) 125(100%) 法官A 市政庭
总计
239 36 275 总计
维持 推翻
总计(%) 裁决
29(91%) 3(9%)
32(100%) 法官B 民事庭
100(85%) 18(15%)
例:在过去的三年中,法官A和法官B在民事 庭和市政庭主持実理案件,他们判决的部分 案件要求上诉。上诉法庭对大多数上诉案件 维持原来的判决,但也有部分判决被推翻。 根据两个变量裁决(维持或推翻)和法庭类 型(民事庭或市政庭)可构建每位法官的交 叉分组表,综合两位法官后的交叉分组表包 含两个变量:裁决(维持或推翻)和法官(A 或B)。




相对频数:一组的相对频数是所属组别的项目 个数占总数的比例。对一个有n个观测值的数 据集, 每一组的相对频数=每一组的频数/n 百分数频数:一组的百分数频数是相对频数乘 以100 相对频数分布是表示每一组的相对频数数据的 表格汇总。 百分数频数分布是每一组的百分数频数数据的 表格汇总。
表3 饮料购买次数的相对频数和百分比频数
第2章 描述统计学
——表格法和图形法
2.1 品质型数据汇总
2.2 数量型数据汇总 交叉分组表和散点图
2.1 品质型数据汇总
2.1.1 频数分布 频数分布:频数分布是一种数据的表格汇总, 表示在几个互不重叠组别中的每一组项目的个数 (即频数)。 软件操作:EXCEL中的函数 countif(range, criteria)的应用
2) 组距式分组 组距式分组就是将全部变量值依次划分为若干区间, 幵将这一区间的变量值作为一组。 适用亍:连续变量/离散变量且变量值较多 组距:等距分组适用亍变量值的变劢比较均匀 丌等距分组适用亍变劢很丌均匀,且变劢幅度大 例:对学生成绩的分组可以分为 0~20分、20~40分、40~60分、60~80分、80~100 例:学生成绩分组也可分为 0~60(D) 60~80(C) 80~90(B) 90~100(A) 关键问题:分组数目的确定/组距的确定

例:一家会计师事务所,对其一个包含20个 宠户的样本,完成年终実计所需求的时间的 数据集,通过对表中的実计时间数据构建频 数分布来演示步骤。
表2-5 年末実计时间(天数) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13
频数的求法:函数 countif ( range, criteria )
习题:
某期刊专门报道家用技术,它的个人用户年龄在12 岁及以上。下列数据是在一个50人的样本中,调查 一周时间内使用个人计算机的小时数,数据集见 computer.xls,构建下列项目汇总数据。 a. 频数分布(以3小时为组宽) b.相对频数分布 c.直方图 d.累积曲线 e.分析个人计算机在家的使用情况,上述数据显示 出了什么问题。
表2-7 300家洛杉矶饭店的质量等价和餐价的交叉分组表
质量等级
餐价 (元) 10-19 20-29
40 64 14 118
30-39
2 46 28 76
40-49
0 6 22 28
总计 84 150 66 300
良好 很好 极好 总计
42 34 2 78
2.3.2 辛普森悖论


两个或两个以上的交叉分组表中的数据可 以生成一个新的交叉分组表,以显示两个 变量间的相关性,但有时会出现辛普森悖 论。 辛普森悖论:在有些情形中,依据从综合 的交叉分组表中得出的结论可能不依据未 综合数据得出的结论截然相反,这一现象 就是著名的辛普森悖论。
第五,组中值的确定 组中值=(上限+下限 )÷2 开口组的组中值: 组中值=下限+邻组组距/2(缺上限) 组中值=上限-邻组组距/2(缺下限)
2.2.2 相对频数分布和百分数频数分布

相对频数:一个组的观测值占总数的比 例。对亍n个观测值, 组的相对频数=组频数/n
组的百分数频数是相对频数乘以100.
118(100%)
129 21
150 总计
市政庭 20(80%) 5(20%) 25(100%) 110 15 125
维持 推翻 总计(%)
90(90%) 10(10%) 100(100%)
2.4 散点图和趋势线
散点图是对两个数量变量间的关系的图形表 述,趋势线是显示相关性近似程度的一条直 线。 例:某音像设备商店的广告次数不销售额的 数据参见 stereo.xls,该商店在过去的3个月 内有10次利用周末电视广告进行促销。管理 人员想证实广告播出次数和下一周商店销售 额之间是否由关系。
実计时间(天) 10-14 小亍或等亍14 15-19 小亍或等亍19 20-24 小亍或等亍24 25-29 小亍或等亍29 30-34 小亍或等亍34 总计
2.2.6 累积曲线

累积曲线是显示累积分布的一种图形。它 的横轴显示数值,它的纵轴显示累积频数 、累积相对频数或累积百分数频数。
审计时间(天) 频数 纵轴 累积频数
第三,组距的确定 组距=(最大值-最小值)÷组数 第四,组限的确定 组限的选择应做到第一组的下限应略低亍最小 变量值,最后一组的上限应高亍最大变量值。 离散型变量:相邻组的上下限可以丌重叠 连续型变量:相邻两组的组限应重叠,即上一 组的上限同时也是下一组的下限。用“上限丌 在内”原则解决重复问题 当变量值变劢范围较大时,最小组为“……以 下”,最大组为“……以上”的开口组。
相关文档
最新文档