第二章-统计表和统计图
统计表和统计图
200
180
伤寒和结核病的死亡率
160
均逐年下降,伤寒的死
亡率低于结核病
140
死亡率(1/10万)
120
100
80
60
40
20
0 1950
1952
1954
1956
(四)绘制统计图的基本要求
1.根据资料的性质和分析的目的选择适当的图形。
资料的性质和分析目的 比较相互独立的各类别数值大小 分析事物内部各组成部分所占比重(构成比) 描述事物随时间变化趋势或描述两现象相互变化趋势 描述连续型变量的累计频率分布 描述连续性变量的频数分布 描述某现象的数量在地域上的分布 描述定量变量的平均水平和变异程度
宜选用的统计图 条图 圆图或百分条图 线图、半对数线图 累计频率分布图 直方图 统计地图 箱式图
2.每一张统计图都要有标题,简明扼要地说明图形要表达的 主要内容,必要时应注明资料收集的时间和地点。标题一般位 于图的下方。
图1 2005年某地96名妇女产前检查次数分布
3.涉及坐标系的统计图(条图、散点图、线图和直方图)要等距
个构成比的比较
4.两种或多种类似的构成比资料相互比较时,可以绘制两个 或多个长度、宽度都相等的直条,在同一起点上依次平行排列, 各直条之间留有一定空隙,一般为直条宽度的一半。
图4-3是根据某地20世纪70年代和80年代恶性肿瘤发病登记 资料绘制成的百分比条图。
80年代
70年代
0%
20%
40%
60%
绘制条图时应注意:
1.纵轴表示各个项目相应的数据要等距,而且尺度必须 从0开始,否则会改变各对比组间的比例关系。
2.宽度:各直条的宽度应相等,各直条的间隔也应一致。 条间隔应为条宽的一半或等宽。
应用统计学第2章统计表统计图
对数图可以直观反映时间序列的环比变化趋势
可以在Office图表类型中选择自定义类型中的“对数图” ,也可通过将一般折线图纵轴“坐标轴格式” 中的“刻度” 设为“对数刻度”来绘制对数图。
例:某公司总成本和劳动成本的增长
该公司总成本和劳动成本每年增加相同的数量 ,因而用绝对数据作图时两条线是平行的,不小心 可能会得出劳动成本占总成本固定比例的误解。实 际上第1年占40%,第6年占60%。使用对数图就可以 清晰反映劳动成本有更高的增长率。
“平滑线”复选框,就将折线图转换为曲线图。
⑵经济管理中几种常见的频数分布曲线
①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的一
类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度
,某种农作物的产量等等。
正态分布曲线
②偏态曲线
——按其长尾拖向哪一方又可分为右偏(正偏)和 左偏(负偏)两类。
1.频数分布表
频数分布表列出了一系列分类数据的频率、总数 或百分比,可以看出不同类别数据间的区别。
表2-1 1 000美元用途的频数分布表
用钱做什么 购买奢侈品、旅游或礼物 向慈善机构捐款 还贷 储蓄 购买必需品 其他
百分比/% 20 2 24 31 16 7
2.条形图
3.圆饼图
4.帕累托图
L = [ 10 × log 10 n ] 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
未分组数据—茎叶图(茎叶图的制作)
树茎 树叶
数据个数
10 788
3
11 022347778889
统计图表
表号 表号指表的序号,位于表的
左上方,一般以出现的先后顺序 排列。
名称
名称又称标题,是一个表格的名称,应写在表的上 方。标题用语要简练扼要,准确得体,一望即知该 表的内容。
表的序号和标题之间留一个汉字的空格。二者居中
排在顶线的上方,长度不宜超过表的宽度,若标题
字数过多,应转行排列。
标目
标目即分类的项目。标目的好坏决定统计表 的质量,要认真酌定。标目一般在表的上面 一行或左侧一列。如果分类的标志只有一个, 写在表的上行或左列都可以。如果分类的标 志有两个,且二者没有隶属关系,则左列与 上行各一个。如果两个分类标志有隶属关系, 则要放在一个方向(或上面或左侧)分两行 分述。标目确立了数据组织的逻辑,并确定 了栏目下数据栏的性质。
2、数量类别。这是以数据的取值大小为分类标志, 把数据按数值大小以分组或不分组的形式排出一个 顺序来。(等距、比率)
对原始数据排序和分类以后,数量小的就可以直接计算,数量大时再做进一 步分组,编制统计表、统计图为以后的分析打下基础。
三、统计表
1、定义:统计表是用来表达统计指标与被说明 事物之间数量关系的表格。 统计指标:在对数据进行统计分类以后,得到的 各种数量结果称为统计指标。 2、作用:简洁、清晰、准确、一目了然,明显 地反映出事物的全貌及其蕴含的特征,省去冗长 的文字叙述,便于分析、比较、计算和记忆。 3、结构
图题的文字要言简意赅,具有说明性和专指性,使
人一看就能知道该图所要显示的是何事、何物,发 生于何时、何地。如果图示资料比较复杂,这时图
题可用大标题与小标题呈现。图题的字体要与整个
图形的大小相称,一般是图中使用的最大号的文字。
第02讲 常用的统计表与图
二、次数分布表——简单次数分布表
简单次数分布表(simple frequency table)就是依据每一个 分数值在一列数据中出现的次数编制成的统计表。
根本目标
形象化的方式把事物的特性、规律显示出来。 使人能获得全面与深刻的直观形象。 便于说明问题与比较。
三、常用的统计图——统计图的种类
统计图的种类
条形图(Bar chart) 圆形图(Pie chart)
百分条图 (percentage chart)
线图( line chart,次 数多边图、累积次数分 布图)
С Êý λ Êý Ò» Ö ¡¢ λ ´Î ¶Ô Æë
²» ÄÜ ÓÐ ¿Õ
¸±×¢
رҪ ʱ
ͼ Àý
·Å ÔÚ Í¼ ÓÒ ÉÏ ½Ç »ò ±ê Ìâ µÄ ÉÏ ·½
下次上课再见!
一般统计表的常见错误举例1
表 2-15 第三组病人各年存活及死亡情况 (原表)
年份 (1)
病例数 (2)
存活数 (3)
住院期死 亡总例数
急性期 死亡数
住院期总病 死率(%)
急性期病 死率(%)
(4)=(2)+(3) (5) (6)=(4)/(2) (7)=(5)/(2)
1964 17
9
8
7
47.1
41.2
1965 13
8
5
4
38.5
30.8
1966 15
8
7
第二章第四节统计表和统计图
一、统计表
(一)几个概念 1.频数和频率 频数和频率 (1)频数:又称次数。 分布在各组的单位个数。 )频数:又称次数。 分布在各组的单位个数。 (2)频率:各组的次数与总次数的比值。 )频率:各组的次数与总次数的比值。 2.频率的性质 频率的性质 之间的一个分数, (1)任何频率都是界于 和1之间的一个分数, )任何频率都是界于0和 之间的一个分数 fi 即: 0 ≤ ≤ 1
三、次数(频数)分布的主要类型 次数(频数)
1.钟型分布 钟型分布 正态分布 偏态分布 正态分布 2.J 型分布 3.U 型分布 右偏分布 左偏分布
J 型分布
U 型分布
3-1-9
四、统计表的编制
(一)统计表的定义和结构 1.定义 定义 统计表是以纵横交叉的线条所绘制的表格, 统计表是以纵横交叉的线条所绘制的表格, 用来表现统计资料的一种形式。 用来表现统计资料的一种形式。 广义:任何用以反映统计资料的表格, 广义:任何用以反映统计资料的表格,或统 计工作过程中的一切表格。 计工作过程中的一切表格。 狭义:统计资料经过整理、 狭义:统计资料经过整理、汇总按一定的规 则排列在表格上,这种表格称为统计表。 则排列在表格上,这种表格称为统计表。
下列判断,那些是正确的( 下列判断,那些是正确的( ) A 单位总量 单位总量——企业数(19),产量(93200),工人数(1160 企业数( ),产量( ),产量 ),工人数 企业数 ),工人数( B 标志 标志——产量、工人数和劳动生产率 产量、 产量 C 标志 标志——产量、工人数、劳动生产率和企业数 产量、 产量 工人数、 D 标志总量 标志总量——产量(93200),工人数(1160) 产量( ),工人数 产量 ),工人数( ) E 标志总量 标志总量——产量(93200),企业数(19) 产量( ),企业数 产量 ),企业数( )
统计图表教学案例
方程。
表 9-1 8 名正常儿童的年龄 (岁)与尿肌酐含量 (mmol/24h)
编
号
1
23
4
5
6
7
8
年
龄
13
11 9
6
8 10 12
7
尿肌酐含量
3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65
Sep,22,2009
箱式图(box plot) 箱子上端为上四分位 数P75 ,下端为下四分位数P25,中间横 线是中位数M(P50),穿过箱子的连线, 两端分别是除异常值外的最小值和最大值。 箱式图一般使用5个统计量反映原始数据的 分布特征,适于多组数据的直观比较。
Sep,22,2009
二、常用统计图及绘制方法
条图(bar graph) 又称直条图,用等宽度 直条的长短表示比较指标的数值大小和它们 之间的对比关系。适于比较独立或离散变量 的统计指标。
按分组因素是一个还是两个分为单式和复式 两种
Sep,22,2009
例 2-1 某地 1990 年居民 3 种死因的死亡率比较情况见表 2-4。
173 30 19.07 157 62 39.89 121 62 51.23 P<0.01
90 37 40.11 78 51 63.65 70 62 81.14 P<0.01
P<0.01
P<0.01
P<0.01
Sep,22,2009
没有标题; 线条太多,有竖线和斜线; 不应有备注; %意义不明确且计算有误。
某市 1970~1985 年痢疾与百日咳死亡率(1/10 万)
痢疾死亡率(1/10 万) 百日咳死亡率(1/10 万)
第二章统计图表解析
3.4
资料来源:见《心理学报》1979年第1期103页,选部分引用
四、统计图 统计图一般采用直角坐标系,通常横坐标或横
轴表示事物的组别或自变量X,称为分类轴; 纵坐标或纵轴表示事物出现的次数或因变量Y, 称为数值轴。
圆形图——角度坐标
统计图一般由图号及图题、图目、图尺、图形、 图例、图注等构成。
缺失:指数据不全或缺项未填;例如一份资料 中未回答的问题占10%以上,或者缺少关键性 资料。
可疑:指难以辨认或怀疑其真实性的数据;例 如,有的被试填答的问卷全部选同一个选项 (如全选A或全选B);有的被试填答的结果可 以看到是一种规则的排列方式(如A B C D E D B C A B C D E……)。
失误:指存在明确差错的数据或答案。
在剔除数据的过程中,注意不能把一些不符合 自己主观假设的数据随意去掉。因此这项工作 一定要非常慎重。对于个别极端数据是否该剔 除,应遵循三个标准差法则。
(二)统计分组应注意的问题 1.分组要以被研究对象的本质特性为基础 2.分类标志要明确,要能包括所有的数据
最高组或最低组的下限最好是组距i的整数倍; 各分组区间一般在纵坐标上按顺序排列,数值大的
分组区间排在上面,数值小的分组区间排在下面;
在呈现表格时,各分组区间使用表述组限,并且为 了书写方便,通常只用整数写下限值,然后在右侧 画一横线。
登记次数:要特别注意处于分组区间分界点 上的几个值
计算次数f 编制分组次数分布表
2
K =1.87(N 1)5
N 为数据个数,K 取近似整数。
列出分组区间 分组区间:组限,一个组的起点值和终点值之间的
距离。起点值称组下限,终点值称组上限。组限有 表述组限和精确组限两种。
统计表与统计图
小学六年级小升初数学专题复习(23)——统计表与统计图一、简单的统计表知识归纳1.统计表定义:是表现数字资料整理结果的最常用的一种表格.是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.统计调查所得来的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格中,就形成“统计表”.2.统计表构成及格式:一般由表头、行标题、列标题和数字资料四个主要部分组成,必要时可以在统计表的下方加上表外附加.(1)表头应放在表的上方,它所说明的是统计表的主要内容.(2)行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称,通常也被称为“类”.(3)表外附加通常放在统计表的下方,主要包括资料来源、指标的注释、必要的说明等内容.统计表分类:统计表形式繁简不一,通常是按项目的多少,分为单式统计表与复式统计表两种.只对某一个项目数据进行统计的表格,称为单式统计表,也称之为简单统计表.统计项目在2个或2个以上的统计表格,称之为复式统计表.1.按作用不同:统计调查表、汇总表、分析表.2.按分组情况不同:简单表、简单分组表、复合分组表.(1)简单表:即不经任何分组,仅按时间或单位进行简单排列的表.(2)简单分组表:即仅按一个标志进行分组的表.(3)复合分组表:即按两个或两个以上标志进行层叠分组的表.常考题型例1:六一儿童节,学校进行歌咏比赛,7位评委给张华的打分如下:评委 1 2 3 4 5 6 7打分92 90 95 88 85 97 90去掉一个最高分,一个最低分,张华的平均分是分.分析:根据平均数的应用和求平均数的方法解答即可.解:去掉一个最高分97分,最低分85分;其他五位评委打的平均分是:(92+90+95+88+90)÷5=455÷5=91(分);答:张华的平均分是91分;故答案为:91.点评:此题属于简单的统计和求平均数问题,根据求平均数的方法,总数÷份数=平均数,列式计算即可.二、两种不同形式的单式条形统计图知识归纳1.条形图定义:用一个单位长度表示一定的数量,根据数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图叫做条形统计图.它可以表示出每个项目的具体数量.2.单式条形统计图只表示一种数据的变化情况,比较简单.常考题型例:看图回答问题.(1)哪个季度的月平均销售量多?多多少?(2)从统计图中你还能发现什么信息?分析:(1)先分别求出第一季度和第三季度的月平均销售量,再比较哪个季度的月平均销售量多,进而求出多的具体的数量即可;(2)从统计图中我还能发现以下信息:一月销售120箱,二月销售110箱,三月销售130箱,七月销售195箱,八月销售190箱,九月销售185箱;其中二月销售的箱数最少,七月销售的箱数最多;等等.解:(1)第一季度的月平均销售量:(120+110+130)÷3,=360÷3,=120(箱),第三季度的月平均销售量:(195+190+185)÷3,=570÷3,=190(箱),190>120,190-120=70(箱);答:第三季度的月平均销售量多,多70箱.(2)从统计图中我还能发现以下信息:一月销售120箱,二月销售110箱,三月销售130箱,七月销售195箱,八月销售190箱,九月销售185箱;其中二月销售的箱数最少;七月销售的箱数最多;等等.点评:此题主要考查从条形统计图中获取信息,并根据信息解决问题;也考查了求平均数的方法:平均数=总数量÷总份数.三、单式折线统计图知识归纳1.折线统计图:用一个单位长度表示一定数量,用折线的上升或下降表示数量的多少和增减变化.容易看出数量的增减变化情况.2.折现统计图制作步骤:(1)标题:根据统计表所反映的内容,在正上方写上统计图的名称;(2)画出横、纵轴:先画纵轴,后画横轴,横、纵轴都要有单位,按纸面的大小来确定用一定单位表示一定的数量;(3)描点、连线:根据数量的多少,在纵、横轴的恰当位置描出各点,然后把各点用线段顺序连接起来.常考题型例:如图,电车从A站经过B站到达C站,然后返回.去时B站停车,而返回时不停,去时的车速为每小时48千米,返回时的车速是每小时千米.分析:从统计图中可知电车从A站到达B站用了4分钟,并在B站休息了1分钟,从B站到达C站用了5分钟,所以电车从A站到达C站共行驶了4+5=9(分钟),根据“速度×时间=路程”求出从A站到C站的距离;电车在C站休息了3分钟,从第13分钟开始行驶到第19分钟返回A站,根据“速度=路程÷时间”即可得出答案.解:48×(4+5)÷(19-13),=48×9÷6,=72(千米);答:汽车从C站返回A站的速度是每小时行72千米.故答案为:72.点评:此题首先根据问题从图中找出所需要的信息,然后根据数量关系式:“速度×时间=路程”和“速度=路程÷时间”即可作出解答.四、扇形统计图知识归纳1.扇形统计图的特点:扇形统计图是用整个圆的面积表示总数,用圆内的扇形面积表示各部分数量占总数的百分比.2.读懂扇形统计图:(1)获取信息的方法:运用综合、对比等多种观察方法,可以从扇形统计图中获取信息,还可以利用这些信息提出相应的问题.(2)扇形统计图的优点:它可以清楚地表示出部分数量与总数、部分数量与部分数量之间的关系.3.利用扇形统计图解决问题,就是解决有关不同类型的百分数应用题,按照百分数应用题的解题思路和解题方法进行解答.常考题型例:如图是某小学六年级学生视力情况统计图.①视力正常的有76人,视力近视的有人;②假性近视的同学比视力正常的人少%;(百分号前保留一位小数)③视力正常的学生与视力非正常学生人数的比是.分析:由图可知:把总人数看成单位“1”,视力正常的人数占总人数的38%,近视的人数占总人数的30%,假性近视的人数占总人数的32%;①视力正常的有76人,它对应的百分数是38%,由此用除法求出总人数,再求出总人数的30%就是近似的人数;②用视力正常占的百分数减去假性近视人数占的百分数,然后用求得的差除以视力正常占的百分数即可;③先求出视力非正常学生人数占总人数的百分数,然后作比.解:①76÷38%×30%,=200×30%,=60(人);答:视力近视的有60人.②(38%-32%)÷38%,=6%÷38%,≈15.8%;答:假性近视的同学比视力正常的人少15.8%.③38%:(32%+30%),=38%:62%,=38:62,=19:31;答:视力正常的学生与视力非正常学生人数的比是19:31.故答案为:60,15.8%,19:31.点评:解决本题关键是从图中读出数据,找出单位“1”,再根据基本的数量关系求解.一.选择题(共6小题)1.如图,()可以表示下面哪种情况的统计.A.4个学生期末数学考试成绩B.四年级喜欢各项运动的男女生人数C.小明1﹣﹣8岁的身高D.蛋糕店的草莓蛋糕和芒果蛋糕最近5天的销售情况2.下图表示的是甲班和乙班男、女生人数的情况.如果每个班都是36人,那么甲班的男生比乙班多()人.A.4 B.11 C.18 D.433.5、如图是两个厂男、女职工人数的统计图,甲厂和乙厂的女职工人数相比,()。
统计表与统计图
21.74% 43.48%
34.78%
绘制圆图的要点: 绘制圆图的要点: 每3.60为1%; %; 从相当于时钟12点或者 点或者9点的位置开始顺 从相当于时钟 点或者 点的位置开始顺 时针方向绘图; 时针方向绘图; 各部分用不同的图案或者颜色表示, 各部分用不同的图案或者颜色表示,或 在图上标出各部分的百分比和名称, 在图上标出各部分的百分比和名称,或 以图例说明; 以图例说明; 同一组资料,按百分比大小顺序排列; 同一组资料,按百分比大小顺序排列; 比较不同组资料,画两个或多个等圆, 比较不同组资料,画两个或多个等圆, 在每一个圆的下面注明组别, 在每一个圆的下面注明组别,按固定顺 序排列各组成部分,用相同的图例。 序排列各组成部分,用相同的图例。
表1 某年某地消费者对有机食品的态度
性别 男 女 合计 对有机食品的态度 喜欢(%) 不喜欢(%) 喜欢(%) 不喜欢(%) 30(20.0) 120(80.0) ( ) ( ) 80(40.0) 120(60.0) ( ) ( ) 110(31.4) ( ) 240(68.6) ( ) 合计 150 200 350
• 几种常用的统计图 直条图( 直条图(bar graph) ) 直条图用等宽直条的长短来表示相互独 立的各指标的数值大小。 立的各指标的数值大小。 适用于相互独立的、 适用于相互独立的、无连续关系的间断 性资料的比较。 性资料的比较。 种类: 种类:单式直条图和复式直条图
2005年某食品企业的产量(吨)
0%
20%
40%
60%
80%
100%
2005年和 2006 2005 年和2006 年某食品企业产品产量构成 年和 2006年某食品企业产品产量构成
02分布、统计表、统计图
(二)制作组距式统计表(定距变量) 1、找出调查数据中的最大值L和最小值S。 2、求出极差:R=L-S 3、确定分组组数:K
调查总数N 50-100 分组数K 6-10
100-250
250以上
7-12
10-20
R LS K K
4、计算组距h
h
5、确定各组组界:标明组界 中位值( 0.5) 真实组界 6、统计各组频次、频率,制作出组距式统计表。 p30
成绩 (Banded)
四、累计表和累计图
子女数 频数 频率 cf↑ C%↑ cf ↓ C% ↓
0
1 2 3
14
25 8 3
0.28
0.5 0.16 0.06
cf↑向上累计频数:变量取值小于某一取值的频数之和。 cf↓向下累计频率:变量取值大于某一取值的频数之和。 c%↑向上累计频数:变量取值小于某一取值的频率之和。 c%↓向下累计频率:变量取值大于某一取值的频率之和。
子女数
频数
频率
cf↑
C%↑
cf ↓
C% ↓
0
1 2 3
14
25 8 3
0.28
0.5 0.16 0.06
14
39 47 50
0.28
0.78 0.94 1.00
50
36 11 3
1.00
0.72 0.22 0.06
cf↑向上累计频数:变量取值小于某一取值的频数之和。 cf↓向下累计频率:变量取值大于某一取值的频数之和。 c%↑向上累计频数:变量取值小于某一取值的频率之和。 c%↓向下累计频率:变量取值大于某一取值的频率之和。
多峰图形
两边不对称: 右偏态 或正偏态
左偏态 或负偏态
教育与心理统计学第二章:统计图表
分类 满足 的要 求
1、周延性 2、互斥性
表1 某心理学院研究生的情况汇总表
类别 男 女 基础心理学 发展与教育心理学 应用心理学 合计
人数 63 119
62
50
70
182
不具有 互斥性
表2 某心理学院研究生的情况汇总表(双向)
专业方向 基础心理学 发展与教育心理学 应用心理学
男 30
10
性 别 女 32
①非常不尽职 ②不尽职 ③不置可否 ④尽职 ⑤非常尽职
总计
人数
9 30 10 25
6
80
现场演示,教给学生如何来画三线表
二、分组次数分布表(grouped frequency table)
当数据量比较大的时候,应该把所有的数据线划分为若干分 组区间,然后将数据按其数值大小划归到相应的组别内,分 别统计各个组别内包括的数据个数,再用列表形式呈现出来。
二、次数多边形图(frequency polygon)
是一种表示连续性随机变量次数分布的线形图。(注: 不能用于离散型数据)
(1)累加直方图 横坐标分组区间,纵坐标是累加次数。可以看出某
上限以下的次数或者某下限以上的次数。
(2)累加曲线图 先同上,标出各交点,再连接各交点。
第三节 次数分布图
一、直方图(histogram)(如,图2-3、图2-4) 组距确定矩形宽度,每组频数确定各矩形高度,各 矩形间不留空隙,矩形面积与其频数分布大小等价。
直方图的另外一种形式:组织图
组织图
20 15 10
5 0 60 63 66 69 72 75 78 81 84 87 90 96 99
第二章 统计图表
第一节 数据的初步整理 第二节 次数分布表 第三节 次数分布图 第四节 其他类型的统计图
医学统计学课件统计表与统计图
3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.90~5.66.02~0
频数(人数)
6. 统计地图(statistical map)
用不同颜色或花纹表示统计量的值在地理分 布上的变化,适合描述研究指标的地理分布
颜色选择最好与统计量数值增减的趋势一致, 如颜色由浅到深代表统计量数值的增加
1990-1999年某市鼻咽癌标化发病比的地区分布
7. 几种常见的特殊分析图
(1) 箱式图
用于显示未分组的原始数据或分组数据的分布特征 箱式图由一组数据的5个特征值(最大值、最小值、中位数、
下四分位数和上四分位数)绘制而成,由一个箱子和两条线 段组成
绘制方法:
➢ 首先找出一组数据的5个特征值 ➢ 连接两个四分位数画出箱子,再将两个极值点与箱子相连接
百喉死亡率 20.1 16.6 14.0 11.8 10.7 6.5 3.9 2.4 1.3
160
140
120
死亡率(1/10 万)
100
结核病
80
60
40
20
白喉
0 1949 1950 1951 1952 1953 1954 1955 1956 1957
年份
某市 1949~1957 年儿童结核病和白喉死亡率(普通线图)
6
4 . 888899
3
5 . 001
4
5 . 2233
0
5.
茎叶图类似横 置的直方图
1
5. 7
茎宽: 1
每叶: 1 例
(3)误差条图(error bar chart)
通过样本信息描述总体,估计抽样误差大小 用于比较多个样本间的差异 三种不同区间:可信区间、均数±标准差、
统计表和统计图
18
可以将其分为三个表,表12-5、12-6、12-7,具体修改如下。
19
20
例12.2 某医院用麦牙根糖浆治疗急慢性 肝炎161例,疗效资料如表12-8,指出其 缺点并加以改进。
21
问题: 标题过于简单;主谓安排不合理,标目 组合重复。可进行如下修改,见表12-9。
32
/
100
90
80
死 70 亡
60
率 ( 50
40
十 万 30 ) 20
10
0
第一季度
第二季度
第三季度
第四季度
图3.1 某年某地三种慢性病四季死亡率比较
脑血管病 恶性肿瘤 心血管病
33
②构成比圆图:用圆的面积为100% (360°圆心角)代表总体,以圆的各扇 形面积(百分比×3.6°圆心角)代表总 体的各部,以自然顺序或大小顺序顺时 针排列。
34
恶性肿瘤
40.57
泌尿系病
5.58
9.80 心脏病
呼吸系病
32.48
12.57 脑血管病
图3.3 某医院住院病人的死因构成(%)
35
③线图:适用于连续性资料。用
线段的上升、下降来说明事物在时间上 的发展变化,或某种现象随另一现象变 化的情况。
横轴表示连续变量,纵轴表示率、 均数或频数。
36
100
标目排列一般有一定次序:先后、大 小、重要性、习惯等。
7
横标目
表3.1 某年某校知识分子的高血压患病率
纵标目
年龄(岁) 检查人数 病人数 患病率(%)
35~
478
33
45~
379
28
02讲统计表与图
作业标准记得牢,驾轻就熟除烦恼。2 020年1 0月24 日星期 六1时1 分39秒0 1:01:39 24 October 2020
好的事情马上就会到来,一切都是最 好的安 排。上 午1时1 分39秒 上午1时 1分01: 01:3920 .10.24
一马当先,全员举绩,梅开二度,业 绩保底 。20.10. 2420.1 0.2401: 0101:01 :3901:0 1:39Oct-20
500
0
0
5
10
15
20
25
30
35
教龄
图2.11 幼儿教师教龄与月收入的关系
38
(四)数据类型及统计图选用(小结)
数据类型与统计图
离散数据
连续数据
分组数据
原始数据
条圆 形形 图图
直折 方线 图图
累
累
积
积
次
次
数
数
分
曲
布
线
图 39 图
茎箱 叶线 图图
时序数据
线 性 图
练习
根据P27 第1题数据绘制 1. 次数多边图 2. 累积次数分布图(以上) 3. 茎叶图
41
图3 90名学生英语成绩分布茎叶图
43
44
45
46
图4 300名学生家长职业分布图
47
树立质量法制观念、提高全员质量意 识。20. 10.2420 .10.24S aturda y, October 24, 2020
人生得意须尽欢,莫使金樽空对月。0 1:01:39 01:01:3 901:01 10/24/2 020 1:01:39 AM
33
线形图
7 6 5 4 3 2 1 0
2统计图表的正确应用总结
1)
120
条图(bar graph)
106.2
97.8
© ò £ ¨1/10Í Ê £ öÂ À Í Ë
80 53.6 40 18.4 0
±Ð ¼ Ô ´ « È ¾ ² ¡ 53.6 18.4 Ô Ñ Ä ª ¹ Ü ² ¡ 38.9 106.2 ñ Ð ¶ Ô Ö ×Á ö 38.3 97.8
Ä ê
· Ý
5)半对数线图(semilogarithmic line graph)
³ µ Ä Ø 1950-1966Ä ê É Ë º ® Ó ë ½ á º Ë ² ¡ Ë À Í ö Â Ê
1000
Ë º É ¦ Ë À Í ö Â Ê á º ½ Ë ² ¡ Ë À Í ö Â Ê
¨1/10Í Ê £ ö Â © À Í Ë ò £
» Ä Ò ê ¼ ¶ Å ® ´ ó Ñ §É ú Ì å Ö Ø Ó ë · Î » î Á ¿ É ¢ µ ã Í ¼
其他图形
7)直方图(histogram) 以等宽矩形的面积表示频数的多少,用 于表示连续变量的频数分布。 绘制要点:横轴组段必须是等距的; 纵轴必须从0开始。 8)统计地图(statistical map) 用于表示某现象的数量在地域上的分 布。
第二章 统计表与统计图
一、统计表
统计表(statitical table)是将统计分析 的事物及其指标用表格列出,以代替冗长的
文字叙述,方便计算、分析、对比。正确绘
制统计表有助于提高统计分析质量。
1.统计表的结构和种类
统计表的基本结构:
表号 标题 纵标目(谓语)
横标目 (主语)
数字
统计表的种类
¡ Ý 3´ Î 0 1 ¡ ª 1
应用统计学第2章--统计表统计图
16
制作频数分布表的注意事项
4) 组中值 组中值是各组的代表值,在计算分组数据的许多统
计指标时要用到。通常取该组上限和下限的平均 值为组中值。如表2-7所示,10~19的组中值是14.5, 20~29的组中值是24.5,等等。 5) 表格线 统计表中的表格线应当是两边开口的表格。
17
使用 Excel 制作频数分布表
L = [ 10 × log 10 n ] 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
26
未分组数据—茎叶图(茎叶图的制作)
树茎 树叶
数据个数
10 788
3
11 022347778889
倒J 形
图1.9 J 形曲线
其典型的应用分别是经济学中的供给曲线和需求曲线。 供给曲线(正 J 形)表现为随着价格的增加,供给量以更
2
1.频数分布表
频数分布表列出了一系列分类数据的频率、总数 或百分比,可以看出不同类别数据间的区别。
表2-1 1 000美元用途的频数分布表
用钱做什么 购买奢侈品、旅游或礼物 向慈善机构捐款 还贷 储蓄 购买必需品 其他
百分比/% 20 2 24 31 16 7
3
2.条形图
100美元的使用
其他
购买必需品
48 71 52 53 36 41 69 58 47 60 53 29 41 72 81 37 43 58 68 42 73 62 59 44 51 53 47 66 59 52 34 49 73 29 47 16 39 58 43 29 46 52 38 46 80 58 51 67 54 57 58 63 49 40 54 61 58 66 47 50
统计表和统计图
统计表和统计图统计表和统计图是数据可视化的重要方式,在数据分析和决策过程中起到了至关重要的作用。
它们能够将复杂的数据转化为易于理解和分析的形式,帮助人们更好地观察数据的趋势和关系。
本文将介绍统计表和统计图的基本概念、种类以及它们在不同领域的应用。
统计表统计表是通过行和列的组织形式,以表格的形式展示数据的方式。
它通常包含了一系列相关的变量或指标,并通过交叉分类的方式呈现数据。
统计表通常包含了表头、行和列的标签、数据单元格以及可能的注释。
通过统计表,我们可以直观地了解数据在不同维度上的分布情况和关系。
统计表的种类较多,常见的有频数表、累计频数表、百分比表等。
频数表显示了每个变量或指标的取值的出现频率,可以帮助我们了解数据的分布情况。
累计频数表则显示了每个变量或指标的取值的累计频率,能够帮助我们更好地观察数据的累积情况。
百分比表通过对频数表或累计频数表进行计算,将频率转化为百分比,更好地展示了数据的比例关系。
统计表在各个领域都有着广泛的应用。
在市场调查中,统计表可以用于收集和整理消费者的个人信息、购买行为等数据;在人口统计学中,统计表可以用于收集和呈现人口的年龄、性别、婚姻状况等信息;在科学研究中,统计表可以用于记录实验数据、变量之间的关系等。
统计表不仅可以提供直观的数据展示,还可以作为后续数据分析的基础。
统计图统计图是以图形的形式展示数据的方式。
通过图形化的方式,统计图可以更好地呈现数据的分布情况、变化趋势和比较关系。
与统计表相比,统计图能够更直观地传达数据的意义,帮助人们更好地理解和解读数据。
统计图的种类非常多,常见的有柱状图、折线图、饼图、散点图等。
柱状图以柱状的高度来表示各个变量或指标的大小,可以用于比较不同类别的数据之间的差异。
折线图通过连续的折线来表示数据的变化趋势,可以用于显示时间序列数据的变化情况。
饼图通过扇形的大小来表示数据的比例,可以用于展示不同类别数据在总体中的占比情况。
散点图以坐标系中的点来表示变量之间的关系,可以用于分析变量之间的相关性和趋势。
第二章 统计图表
第一节
数据的初步整理
• 数据整理形式 • 统计指标:对数据进行统计分类以后,得到的各 种数量结果。 • 1、统计表:把统计指标和被说明的事物之间的 关系用表格的形式表示就成为统计表。 • 特点:简明、清晰、准确 • 2、统计图:依据数字资料,应用点、线、面、 画、体、色等描绘制成,简明而又有规律,并 且能显示数量的图形,是统计数据资料的可视 化显示方式。 • 特点:比数字更形象,简明扼要
次数f 2 3 4 8 11 17 19 14 10 7 3 1 1 ∑f=100
上限以下的累加次数 实际累加 相对累加 频数p/N 次 数 次 数 0.02 100 1 0.03 98 0.98 0.04 95 0.95 0.08 91 0.91 0.11 83 0.83 0.17 72 0.72 0.19 55 0.55 0.14 36 0.36 0.1 22 0.22 0.07 12 0.12 0.03 5 0.05 0.01 2 0.02 0.01 1 0.01 1
三、统计表(tabulation)
• 表号:表左上方 名称:即标题,表上方,与表号间隔一个汉字 ,居中。 标目:分类项目。一般在上面一行( table spanner)或左侧一列(stub column) 数字:统计指标,以个位数/小数点对准,上 下对齐。缺数字项划“-”,一般不带单位。 表注:表下面。 数据来源/附记等。
①R=98.0-62.0=36.0 ②K=11.75,组数为12,组距为3.0 ③最低组下限为60.00,6.0~,63.0~,66.0~…..96.0~,最高组96.0~99.0
精确 分组区间 96---. 93--90--87--84--81--78--75--72--69--66--63--60--组中值Xc 97 94 91 88 85 82 79 76 73 70 67 64 61
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某一组)所对应的频次是多少。有时我们
需要了解小于某一变量值或者大于某一变
量值的总共频次是多少,这时要用到累计
图和累计表。
累计图和累计表
表2-5 家庭子女数频次分布与累计频次分布
家庭子女数
频次
cf↑
cf ↓
0
1 2 3 4
9
10 11 总和
153.35~156.35
156.35~159.35 159.35~161.35
153.85
155.85 157.85 —
3
2 1 118
0.025
0.017 0.008 1.000
统计图
根据变量层次可选择不同的统计图
定类变量:圆瓣图、条形图
定序变量:条形图
定距变量:直方图、折线图
统计图—圆瓣图
其他 12%
联合家庭 5%
核心家庭 直系家庭 联合家庭 其他 核心家庭 49%
直系家庭 34% 图2-1 家庭结构分布图
统计图—圆瓣图
其他 12% 核心家庭 直系家庭 联合家庭 其他 核心家庭 49%
联合家庭 5%
直系家庭 34% 图2-1 家庭结构分布图
统计图—圆瓣图
其他 12% 联合家庭 5% 核心家庭 直系家庭 联合家庭 其他
第二章 单变量统计描述分析 第一节 分布、统计表和统计图
王 荣
分布
指的是一个概念或变量,它的各个情况出现的次数或频 次,又称频次分布。 分布形式一般为:(X1,n1)(X2,n2)(X3, n3)......(Xn,nn) 如:家庭结构的分布: (核心家庭,105)(直系家庭,72)(联合家庭,11) (其他,25) n不同名称也不同:频次分布、百分比分布,概率分布。 注意变量取值的完备性和互斥性。
工厂规模(人数) 频 次
1—5 (0.5—5.5)
6—10 11—20 21—30 30—35
统计表——定距变量
对于连续型变量,无法使每一个取值对应一个确定的频次 或百分比。解决方法是将变量值分为若干个区间和组。例 如结婚年龄。 在实际中要考虑如下问题:组数、等距分组与非等距分组、 分点精度。
图3-5 某车间工人日加工零件数的直方图
© ý £ Ë Ê ¨È ý £ µ Ê Æ
10 15 20 25 0 5
3. 20 « ¡ « ¡ « ¡ « ¡ « ¡ « ¡ 00 5. 5. 5. 90 « ¡ 30 60 6. « ¡ « ¡ « ¡ 20 50 80 10 40 70 3. 3. 4. 4. 4. 5.
ù Ô Ë Ú µ ¤ Î » º Í ³ ¡ Õ ¬ Ç ø Ó Ð Î Þ » ¼ Õ ß
例: 图2-3 众的影响
三项影响较大的SARS信息对不同文化程度民
误差条形图
100 80
× (g) å Ö Ì
60 40 20 0 A B ª Ñ Ó ø Ë ×
图2-27 四种营养素喂养小白鼠三周后所增体重(克)
标明组界 1—2 3—4 5—6 7—8 真实组界 0.5—2.5 2.5—4.5 4.5—6.5 6.5—8.5
统计表——定距变量
统计表——定距变量
统计表——定距变量
统计表——定距变量
统计表——定距变量
表 2-2 118例13岁女孩身高资料统计表
组号 1 2 3 4 5 6 7 8 真实组界值 129.35~132.35 132.35~135.35 135.35~138.35 138.35~141.35 141.35~144.35 144.35~147.35 147.35~150.35 150.35~153.35 中心值 130.85 133.85 136.85 139.85 142.85 145.85 148.85 151.85 频次统计 频次 2 2 8 20 26 25 20 9 相对频次 0.017 0.017 0.068 0.170 0.220 0.212 0.170 0.076
频 次 7
百分比 17.9
爱看
一般 不爱看 反 感 总 25.6 7.7 99.9
统计表——定距变量
定距变量:连续型变量和离散型变量。
离散型变量制表方法同定序变量。但是,当如果变量值的
变化幅度过大,一一列举,势必形成很长的分类,且每类 分类中的频次又变得很少,这时需要采用组距式统计表。
C
D
分段条形图
60 50
¿ Ñ Ç ô Ð Ô Â Ê £ ¤
ä Ë Æ û £ ¤
© ¤ £ ¨£ Ê £ Ô Â ô Ð Ñ
40 30 20 10 0 Ï À Ð Ö Ë È ± Ô ² Ö ´ À ´ Ç
图2-26 老、中、青三代的结核菌素阳性率与强阳性率(%)
统计图—条形图
绘制条图注意事项 纵轴的刻度必须从“0”开始,否则会改变各对比组间的比 例关系。
男 女
图2-2 某年级操行评定结果条形图
4.5
õ Ö ³ Ð
4
ß Ö · Ð ¾ ¿ ± Æ
ó ³ ´ ¨
3.5 3 2.5 2 1.5 1 0.5 0
À Î Ê À ³ é Ö ¯ ¶ Ô À ´ ± ¾ µ × Â Ã Ó Î µ Ä ¾ ¯ · æ À É Î ú ² ¿ ¡ ¢ ± ¾ Ê Ð µ Ä Ð Â Î Å ² ¢ ² ¼ » µ
核心家庭 49%
直系家庭 34% 图2-1 家庭结构分布图
统计图—圆瓣图
核心家庭 直系家庭 联合家庭 其他
其他 联合家庭 12% 5%
核心家庭 49%
直系家庭 34% 图2-1 家庭结构分布图
统计图—条形图
条形图:主要用于表示离散型数据资料。 可分为:简单条形图、分组条形图(复式)、分段条
统计图—折线图
折线图:把直方图顶部的中点(组中值)用直线段
连接起来就是折线图。 多用于连续性资料,凡欲表示两个变量之间的函 数关系,或描述某种现象在时间上的发展趋势, 或一种现象随另一种现象变化的情形。
统计图—直方图
(个)频数 30
14
12 10 8 6
25 20 15 10 5 105 110 115 120 125 130 135 140 日加工零件数(个) 0
Xa=60/300=0.2 Xb=90/300=0.3 Xc=10/300=0.03 Xd=140/300=0.47
统计表——定类变量
表2-4 100个人购房因素统计表
A价格 适中 第一项 (5分) 20
B上班 近 60
C交通方 便 --
D购物方 便 20
第二项 (3分)
第三项 (1分) 累积人次
离散型数据;连续性数据。
50 40 人 30 数 20 10 0
甲 乙 丙 丁
(2)表示数据多少的方式不同。
等级
长短或高低表示数据的多少和大小;用面积表示。
注意:等距分组数据仍可用矩形高度直接表示频数
(3)坐标轴上标尺分点意义不同。 分类轴;刻度值。 (4)间隔
有间隔,但无意义;无任何间隙。
形图,误差线条形图,分段条形图。
60 50
百分比 %
40 30 20 10 0 核心家庭 直系家庭 联合家庭 其他
单式条形图
60 50 40 人 30 数 20 10 0
甲 乙 丙 丁
图形
尺度线
基线
等级
图2-1 某年级操行评定结果条形图
复式条形图
35 30 25 人 数 20 15 10 5 0 甲 乙 等级 丙 丁
横轴:数据分组
纵轴:频次、频率或者频次密度、频率密 度。 等距分组数据:矩形的高度可以直接表示 频数(或频率)。非等距分组数据需要用 频次(或频率)密度表示,这时矩形的面 积表示各组的频数(或频率)。
统计图—直方图
统计图—直方图
频 14 数 人 12 ( )
10 8 6 4 2 0 ∥ 105 110 115 120 125 130 135 140 按零件数分组(个)
家庭结构 核心家庭 直系家庭
百分比(%) 49.3 33.8
联合家庭
其 他 总和百分数 (统计总数)
5.2
11.7 100.0 (2130)
统计表——定类变量
有关意愿、原因等社会调查中,可供选择的答
案类别数目,有时与变量的数目不相等。
例1:问卷中“你认为人生最大的乐趣是什么”
(1)事业上有成就(2)美满的婚姻(3)经 历丰富
统计图—直方图
ì º · Ï ° û Æ ¼ ý Ê µ Ö (10 12 /L)
组织图
20 15 10 5 0 60 63 66 69 72 75 78 81 84 87 90 96 99
统计图—直方图
非等距直方图
条形图和直 方图有什么 区别?
条形图与直方图的区别
60
(1)描述的数据不同。
统计表和统计图
变量层次:定类变量 定序变量 定距变量 定比变 量 注意:社会统计学中一般将定距、定比变量都当做定 距变量处理。
层次 运算符 =≠ < > +- ³÷ 定类 √ 定序 √ √ 定距 √ √ √ 定比 √ √ √ √
统计表——定类变量
定类变量
表2-2 家庭结构的百分比统计表
(xx地,1985,6)
统计表——定类变量
表2-3 人生最大乐趣统计表
人生乐趣 事业上有成就 婚姻美满
频 次
百分比
经历丰富
事业上有成就且婚姻美满 事业上有成就且经历丰富
婚姻美满且经历丰富
统计总数
统计表——定类变量
例2 你在购房中,主要考虑哪些因素? A 价格适中 B 上班近 C交通方便 D 购物方便 请从中选择三项:第一项: 第二项: 第三项: