2作图和统计描述讲解
2.统计描述
适用于各种分布类型的资料,特别是: 资料明显偏态 资料一端或两端无确定数值(开口资料) 资料分布情况不明
(疾病的潜伏期、发汞、尿铅等)
百分位数常用于估计医学参考值范围
中位数的应用
(1)优点: 中位数不受少数特大或特小值的影响
(2)缺点 资料呈对称分布时,均数较中位数稳定 中位数不便于统计运算
表2. 130名健康成年男子脉搏(次/分)的频数分布表
脉搏组段
(1) 56~ 59~ 62~ 65~ 68~ 71~ 74~ 77~ 80~ 83~85
合计
组中值(Xi)
(2)
57.5 60.5 63.5 66.5 69.5 72.5 75.5 78.5 81.5 84.5
频数, fi (3)
2 5 12 15 25 26 19 15 10 1 N=∑f 130
频数(frequency):某变量值或指标值出 现的次数。
频数表(frequency table) :
频数分布表的作用:对大样本 计量资料进行整理,描述其分 布特征,从而根据相应分布特 征选用相应的统计描述和推断 方法。
(应用条件:样本较大时)
例:测得130名健康成年男子脉搏资料(次/分)如下,观察 频数分布情况。
累积频数
(5)=(3)↓
2 7 19 34 59 85 104 119 129 130
医学统计学-第二章 统计描述
3.写组段:即将全距分为若干段的过程。 原则:(1)第一组段要包括Xmin,最末组段包括 Xmax ;
(2)每组段均用下限值加 “~ ”表示,最终组段同时 注明上下限。
注意:各组段 不能重叠,每 一组段均为半 开半闭区间。
4. 列表划记:根据预定的组段和组距,用划记的方法整 理原始资料。
表3.2 某市100名8岁男童身高(cm)频数表
频 数
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
(三)频数表的用途:
1.揭示频数的分布特征
频 数
分布 特征
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
集中趋势
(central tendency)
离散趋势
(tendency of dispersion)
集中趋势与离散趋势结合能全面反映频数的分布特征
注意:1.同质的事物或现象才能求平均数 2.应根据资料分布状态选用适当的均数。
平均 水平
算术均数 几何均数 中位数
单峰对称分布(正态分布) 对数正态分布
偏态分布
1. 算术平均数 arithmetic mean
对称分布
● 简称:均数(mean) ● 使用条件:数据分布比较均匀呈正态或近似正
态分布,且观察值之间差异不大的定量资料。
离散趋势:
定性资料的统计描述 (2)
主要用于对慢性病危害或防治效果得评价
在一定得人群和时间内, (某病)患病率 = 发病率×病程 (某病)粗死亡率 = 发病率×粗病死率
类似于现患率得指标还有:砂眼检出率,寄生虫感染率,带菌 率等。
以上说明同样适用于年龄组死亡率、粗出生率和粗发病率 等。
比较不同时期或不同地区得粗死亡率,如人口得年龄 及性别分布不一致,应按性别、年龄标准化后作比较。
2、 反映死因分布及死因顺位得指标
比例死亡比(proportionate mortality rate, PMR),又 称死因构成
第三节 疾病统计常用指标
2/3、5
大家应该也有点累了,稍作休息
大家有疑问的,可以询问和交流
9
例3-3 在某医院得院内感染调查中,5031个病人共被观 察了127859人日(相当于127859人观察1日),其中有 596人在医院发生感染。
观察人时数 =10日×120人+9日×240人+8日×380人+…
+3日×890人+2日×920人+1日×1200人 =127859人日
区别:前者为疾病名称标准化,后者就是统计研究需要。
1853年,国际统计学会着手编制了统一得疾病名称 和死因分类,先就是在欧洲使用。
统计学 第2章 统计数据的描述
第2章统计数据的描述
练习:
2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的
等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:
B E
C C A
D C B A E
D A C B C D
E C E E
A D
B
C C A E
D C B
B A
C
D
E A B D D C
C B C E
D B C C B C
D A C B C D
E C E B
B E
C C A
D C B A E
B A
C
D
E A B D D C
A D
B
C C A E
D C B
C B C E
D B C C B C
(1) 指出上面的数据属于什么类型;
(2)用Excel制作一张频数分布表;
(3) 绘制一张条形图,反映评价等级的分布。
2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):
152 124 129 116 100 103 92 95 127 104
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;
(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,
105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
2.3某百货公司连续40天的商品销售额如下(单位:万元):
第2章 描述性统计课件
统计图
统计图(statistical graph)是用点的位 置、线段的升降、直条的长短或者面积的大 小等形式来表达统计资料之间的数量关系。
统计图形象、直观,便于对比分析,但 对数量的表达比较粗糙,不够精确。
• 绘图的基本要求
➢根据资料的性质和分析目的,正确选择
合适的图形;
➢每图应有标题;
➢直角坐标系中绘图时,纵横轴都应有标 目,并注明单位;纵:横一般以5:7为 宜;纵轴尺度一般应从“0”开始。
➢圆图和百分条图 都适用于构成比资料。
✓圆图 (pie graph): 又称饼图 以圆面积为100%,圆内各扇形面积为各 部分所占的百分比,用来表示全体中各 部分的构成。
绘制圆图的要点:
v每3.60为1%;
v从相当于时钟12点或者9点的位置开始顺
时针方向绘图;
v各部分用不同的图案或者颜色表示,或 在图上标出各部分的百分比和名称,或 以图例说明;
三.中位数(Median)
如求数列7, 10, 12, 14, 18, 20的中位数。 n=6, 为偶数,取中间两个数的平均数,则
M= (12+14) /2=13 (天) 如求数列7, 10, 12, 14, 15 ,18, 20的中位数。 n=7, 为奇数,取中间那个数为中位数。则
M=14 (天)
3
2.73
107
高中数学必修2《统计》知识点讲义
高中数学必修2《统计》知识点讲义
一、引言
高中数学必修2中的《统计》部分是我们在日常生活中应用广泛的数学知识。通过学习统计,我们可以更好地理解世界,做出更明智的决策。本篇文章将详细讲解统计部分的重要知识点。
二、知识点概述
1、描述性统计
描述性统计是统计学的基石,它主要研究如何用图表和数值来描述数据的基本特征。这部分内容将介绍如何制作频数分布表、绘制条形图、饼图和折线图等。
2、概率论基础
概率论是统计学的核心,它研究随机事件发生的可能性。在本部分,我们将学习如何计算事件的概率,了解独立事件与互斥事件的概念。
3、分布论基础
分布论是研究随机变量及其分布的数学分支。本部分将介绍如何计算
随机变量的期望和方差,了解正态分布的特点及其在日常生活中的应用。
三、知识点详解
1、描述性统计
本文1)频数分布表:频数分布表是一种用于表示数据分布情况的表格,其中每一列表示数据的一个取值,每一行表示该取值的频数。通过频数分布表,我们可以直观地看到数据分布的集中趋势和离散程度。本文2)图表:图表是描述数据的一种有效方式。通过绘制条形图、
饼图和折线图,我们可以直观地展示数据的数量关系和变化趋势。2、概率论基础
本文1)概率:概率是指事件发生的可能性,通常用P表示。P(A)表
示事件A发生的概率,其值在0和1之间,其中0表示事件不可能发生,1表示事件一定会发生。
本文2)独立事件与互斥事件:独立事件是指两个事件不相互影响,
即一个事件的发生不影响另一个事件的概率;互斥事件是指两个事件不包括共同的事件,即两个事件不可能同时发生。
3、分布论基础
卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
29
例题:某市1982年110名7岁男童的身高
已知:x = 119.95cm, s = 4.72cm. 试问: (1) 估计该地7岁男童身高在110cm以下者
占该地7岁男童的百分比。 (2) 估计该地7岁男童身高在130cm
以上者占该地7岁男童的百分比。 (3) 估计该地7岁男童身高在107.77cm到
11111,11111,11111 中位数是50%位的数值,其为百分位数的特殊形式。
●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
20
意义:标准差与均数之比用百分数表示。
符号: CV
计算: CV=(S/X)100%
无单位
应用:单位不同的多组数据比较
均数相差悬殊的多组资料
2-数值变量与分类变量的统计描述分析
实习二
统计描述第164~180页
实习二统计描述
医学统计资料类型
¾数值变量资料:又称为计量资料。变量值是定量的,有单位的,表示为数值的大小。
¾无序分类资料:又称为计数资料。变量值是定性的,没有单位,表示为相互独立的类别。
¾有序分类资料:又称为等级资料。变量值是定性的,没有单位,各类别具有程度上的差异。
注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。
一、数值变量资料的统计描述
统计描述包括两个方面:集中趋势的描述和离散趋势的描述
一、数值变量资料的统计描述
(一)数值变量资料的频数表
频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。
一、数值变量资料的统计描述
(一)数值变量资料的频数表
频数表的用途
1.描述数值变量资料的分布特征
集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。
离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。反映了数据的离散程度或者变异程度。
一、数值变量资料的统计描述
(一)数值变量资料的频数表
频数表的用途
2.描述数值变量资料的分布类型
正态分布:集中位置居中,左右两侧频数基本对称。常见近似正态分布。
偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。
负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。
2描述统计1:表格法和图形法
Average 15%
45%
Average
25%
College of Management
Summarizing Quantitative Data 数量数据汇总
▪ Frequency Distribution 频数分布 ▪ Relative Frequency Distributions and
91 78 93 57 75 52 99 80 97 62 71 69 72 89 66 75 79 75 72 76 104 74 62 68 97 105 77 65 80 109 85 97 88 68 83 68 71 69 67 74 62 82 98 101 79 105 79 69 62 73
Example:Frequency Distribution 频数分布例
如果分为6组
组宽 = (109 - 52)/6 = 9.5 10
Cost ($)
Frequency
50-59
2
60-69
13
70-79
16
80-89
7
90-99
7
100-109
5
Total 50
College of Management
Percent Frequency Distributions 相对频数分布和百分数频数分布 ▪ Dot Plot 打点图 ▪ Histogram 直方图 ▪ Cumulative Distribution 累积分布 ▪ Ogive 穹形图
知识点2 描述统计分析
知识点2描述统计分析
描述分析像频率分析那样,属于SPSS数据分析中描述分析部分。它是将研究中所得的数据加以整理、归类,简化或绘制成图表,以此分析数据的观测个数、中心趋势以及到中心值的变异或离散程度的一个过程。通过描述分析,可以清晰、准确地分析数据的分布特点
描述性分析过程主要用于对连续变量做描述性分析,可以输出多种类型的统计量,也可以将原始数据换成标准Z分值并存入当前数据集。本节将结合实例对几个常用基本统计量的描述性分析过程进行详细介绍
1描述统计分析概述
描述统计的过程为单个表中若干变量显示单变量摘要的统计量,并以此计算标准化值。其中,描述统计主要涉及数据的集中趋势、离散程度和分布形态,最常用的指标有平均数、标准差和方差等。
1.集中趋势
集中趋势是指一组数据向某一中心值靠拢的程度,反映了该组数据中心点的位置。集中趋势统计主要是寻找数据水平的代表值或中心值,其度量包括均值、中位数、众数和中列数。
(1)均值
均值又称为算术平均数,表示一组数据或统计总体的平均特征值,是最常见的代表值或中心值,主要反映了某个变量在该组观测数据中的集中趋势和平均水平。均值是计算平均指标最常用的方法和形式,其计算公式为
式中:n为总体样本数:x为各样本值。
通过该公式,用户可以发现均值的大小比较容易受到数据中极端值的影响。
(2)众数
众数是指一组数据中出现最多的数值,也是明显集中趋势的数值。在统计分析数据中,鉴于数据分组区别于单项式和组距不同类型的分组,所以众数的方法也各不相同。
其中,由单项式分组确定众数的方法比较简单,即表示出现次数最多的数值,
02第二章-描述统计
描述统计与推论统计 用SPSS如何做描述统计
1
2.1 描述统计与推论统计
统计学中的主要术语 什么是描述统计 什么是推论统计 描述统计与推论统计之间的关系
2
2.1.1 统计学中的主要术语
总体:Population,所有个体的集合 样本:Sample,总体的一部分 参数:Parameter,总体的数字特征 统计量:Statistic,样本的概括性测度值
3
2.1.2 什么是描述统计
基本内容 (1)整理数据 (2)展示数据的集中趋势、离散趋 势、数据在数组中的地位、数据之间 的相关、数据的分布情况等
目的 (1)描述数据特征,清晰直观地反映 研究对象 (2)为推论统计做准备
4
2.1.2 什么是描述统计
集中量数:Center,反映一组观测数据集中 趋势的统计量。
22
2.2.4.1 多项选择题录入在SPSS中的实现
首先,定义题目的变量并输入数据。 (1)方法1是多重二分法,即每个
选项即定义成一个变量(例如:T1_1, T1_2,T1_3,T1_4……);用1表示选 择该项,用0表示未选该项。
多重二分法适用于所有多项选择 题。但可能显得不经济,数据输入麻 烦。
多重分类法适用于问题选项较多的情况, 尤其适合于“请在下列选项中选出最重要 (最喜欢)的几个”这样一类问题。
24
第2章Descriptive Statistics描述统计学表格和图形法-B
行或列百分比
Converting the entries in the table into row percentages or column percentages can provide additional insight about the relationship between the two variables.
Crosstabulation 交叉分组表
▪ A crosstabulation is a tabular summary of data for two variables.
交叉分组表适用于描述两个变量的数据。
▪ Crosstabulation can be used when:
交叉分组表可用于:
6
otherwise on a password-protected website or school-approved learning management system for classroom use.
Essentials of Modern Business Statistics (7e)
8
otherwise on a password-protected website or school-approved learning management system for classroom use.
第2章计量资料的统计描述 PPT课件
计量资料的统计描述
第一节频数分布
(frequency distribution)
一、频数表的编制
P11 例2.1
该资料未进行任何加工整理,称为原始资料(raw data)。
1. 频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。
本例极差:R=5.46-3.07=2.39(×1012/L)(2)决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/拟分组数,通常分8-15个组,为方便计,组距参考极差的十分之一, 再略加调整。
本例:i= R /10=2.39/10=0.239≈0.20。
(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
2.频数表的图示及分析
⏹
频数分布如右图所示;
⏹频数分布的分析: 频数分布的类型 频数分布的特征
10203040
50
F r e q u e n c y
3
3.2 3.4 3.6 3.84
4.2 4.4 4.6 4.85
5.2 5.4 5.6
RBC
3. 频数表的用途
(1)揭示资料的分布类型:属对称分布,还是不对称。
(2)观察资料的分布特征:
①集中趋势(central tendency):变量值集中位置(location)。本例在组段“4.2~”。—平均水平指标
②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕“中心”左右对称。—变异程度指标
应用统计学第2章--统计表统计图
重叠组限——相邻组的上下限重合。
适用于连续型变量。但各组上、下限中有一个不包含 再内。通常按“上限不在内”处理,即组区间是 [a, b) 的形式。
注意:Excel在制作频数分布表时采用的是“上限在 内”的规则。
不重叠组限——相邻组的上下限不重合。 适用于离散型变量。
14
例:离散型变量的分组(不重叠组限)
35
120
30
100
25 20 15 10
80 60 40
5
20
0
0
储蓄 还贷 购买奢侈品、 旅游或礼 物 购买必需 品 其他 捐款
有钱要做什么 6
§2.2 数值数据的整理
当数据量很大时,首先可以将数值数据进行排序或用 茎叶图描述以获得初步信息。 (1) 排序
从没有排序的数据中很难看出数据的整体范围。排序 是把数据从小到大(或从大到小)进行排列。 (2) 茎叶图
倒J 形
图1.9 J 形曲线
其典型的应用分别是经济学中的供给曲线和需求曲线。 供给曲线(正 J 形)表现为随着价格的增加,供给量以更
31
⑵经济管理中几种常见的频数分布曲线
①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的一
类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度,
某种农作物的产量等等。
正态分布曲线
STATA软件应用(二)作图、统计描述
分类变量与连续变量资料的综合描述
tab 分组变量 , summ(数值变量)
tab 分组变量1 分组变量2 , summ(数值 变量) 例ex4 tab group, sum(x1) tab group, sum(x2) tab group, sum(x1) nofreq tab group sex, sum(x2)
原始数据
ex3
某地100名成年男子红细胞计数(1012个/升 ) 资料如下(例2.1)
4.09 5.33 4.88 4.31 4.20 4.13 4.54 4.68 4.27 5.10 5.36 4.18 4.81 3.84 4.35 5.26 4.50 4.92 4.67 6.18 5.62 4.12 3.94 4.48 5.78 4.33 4.17 5.04 4.13 4.37 4.63 5.18 5.33 4.40 4.41 5.26 4.40 4.76 5.12 3.60 4.84 4.74 4.85 3.29 5.38 4.93 5.05 5.14 5.40 4.15 4.27 4.79 4.66 4.81 4.01 4.60 4.91 5.41 5.05 4.08 5.07 3.92 5.29 4.57 4.75 4.76 4.45 4.52 5.17 4.71 3.60 5.46 5.23 4.97 5.80 4.58 4.43 3.86 4.55 4.12 3.31 4.81 5.58 3.94 6.01 4.34 4.99 4.99 5.42 4.79
统计学第2章用图表展示数据
分组数据看分布—直方图
(SPSS绘制的直方图)
绘制直方图
分组数据看分布—直方图
(直方图与条形图的区别)
1. 条形图中的每一矩形表示一个类别,其 宽度没有意义,而直方图的宽度则表示 各组的组距
2. 由于分组数据具有连续性,直方图的各 矩形通常是连续排列,而条形图则是分 开排列
(定性数据)
【例2-1】为研究人们 对不同类型软饮料的偏 好情况,一家调查公司 在某超市随机调查了50 名消费者。右表是顾客 性别及其所偏好的饮料 类型记录。生成频数分 布表,观察不同性别的 消费者及其所偏好的饮 料类型的分布状况,并 进行描述性分析
制作频数分布表
生成频数分布表
(列联表—Excel)
中 数
位数 QU)
M
e
和பைடு நூலகம்
两
个
四
分
位
数
(
下
四
分
位
数
Q
L
和
上
四
分
位
连接两个四分位数画出箱子,再将两个极值点与箱子
相连接
未分组数据看分布—箱线图
(箱线图的构成)
未分组数据看分布—箱线图
(例题分析)
贾俊平著《统计学》第五版
分布的形状与箱线图
未分组数据看分布—多批数据箱线 图
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.36
4.81 4.35
4.18
3.84 5.26
4.33
4.17 5.04
4.84
4.85 5.38
4.74
4.93
4.60
5.41
4.76
4.45 4.52
4.58
4.43 3.86
4.34
4.99 4.99
4.72
4.49 4.24
3.29 4.91
5.14
4.15
4.50
4.67
4.92
4.13
/* 直方图,为缺省值 /* 散点图 /* 二维散点图阵 /* 条图、百分条图 /* 圆(饼)图 /* 箱式图
例 ex1.dta
某地100名成年男子红细胞计数(1012个/升 )资料如下
4.09 4.88 4.20 4.54 4.27 5.33 4.31 4.13 4.68 5.10 5.62 4.12 3.94 4.48 5.78 4.63 5.33 4.41 4.40 5.12 5.18 4.40 5.26 4.76 3.60 4.27 4.79 4.66 4.81 4.01 5.07 3.92 5.29 4.57 4.75 3.60 5.46 5.23 4.97 5.80 3.31 4.81 5.58 3.94 6.01 5.32 5.09 3.53 5.48 5.50
72 62
30
64
66
y
68
70
32
34 x
16
36
38
40
统计描述
定量资料的一般描述(均数、标准差、百分 位数、中位数)
summarize [变量名] [, detail ] centile [变量名] [, centile(# [# ...])]
/* 详细描述,缺失时为简单描述 /* 指定需要计算的百分位数
恶性肿瘤 mean of p72
饼图
ex2.dta
主要表示全体中各部分的比重
graph pie p52 p72,by(disease)
肺结核
心脏病
恶性肿瘤
p52
Graphs by disease
p72
箱式图
用于描述一组资料的中位数,四分位 数及最大值、最小值的分布位置。
例 ex3.dta
20
统计描述
几何均数:
means命令
例 ex5.dta : 5份血清的某种抗体效价分别为: 1:10,1:20,1:40,1:80,1:160 求几何均数? means x
统计描述
定性资料的一般描述:
按照分类变量给出频数和构成比 tabulate 变量名
22
分类变量资料的描述
单变量描述命令 tabulate 变量名 , [选项] tab1 变量1 变量2 变量3……,[选项]
3.2
5
10
15
20
3.5
3.8
4.1
4.4
4.7 x
5
5.3
5.6
5.9
6.2
红细胞
例 ex2.dta
某地二个年份三种疾病的死亡率(1/10万)
条图
等宽直条的长短: 相互独立的各指标取值大小
graph bar p52 p72 ,over(disease)
0
50
100
150
200
肺结核
心脏病 mean of p52
选项说明: missing nofreq nolabel
/*包含缺失值 /*不显示频数 /*不显示数值标记
23
分类变量资料的描述
两个变量交叉分类描述
tabulate 变量1 变量2 , [选项] tab2 变量1 变量2 变量3…… , [选项]
选项说明: cell /*显示各小组的构成比(小组之和为1) column /*按列显示各组之构成(各列总计为1) row /*按行显示各组之构成(各行总计为1)
detail centile(# [# ...])
例 ex1.dta
某地100名成年男子红细胞计数(1012个/升 )资料如下(例2.1) 4.09
4.88 4.20 4.54
5.33
4.31 4.13 4.68
5.62
4.12 3.94 4.48
4.63
5.33 4.41 4.40
5.18
4.40 5.26 4.76
医学统计学实习课
STATA软件的应用(2)
董学思 公共卫生学院生物统计学系 dxsbiostatistics@163.com
账号: stata_study@126.com
密码: stata123456
Stata的作图
图形类型 histogram scatter matrix bar pie box
4.75
4.76
5.80
4.58
6.01
4.34
5.50
4.72
4.81
4.35 4.50
3.84
5.26 4.92
4.17
5.04 4.13
4.85
5.38 5.05
3.29 4.91
4.45
4.52 5.17
4.43
3.86 4.55
4.99
4.99 5.42
4.49
4.24 5.70
4.67
6.18 4.37
5.40
4.15
4.08
4.71
百度文库4.12
4.79
4.89
统计描述
ex1.dta
sum x ,detail centile x centile x , centile(10,25,75)
频数图
histogram x ,bin(10) freq xlab(3.2(0.3)6.2) ylab(0(5)20) norm l("人数") b("红细胞")
graph box x ,over(group) by(sex)
女
6
男
x
3 4
5
第一组
Graphs by sex
第二组
第一组
第二组
例 ex4.dta
14
scatter y x , msymbol(plus)
70 62
30
64
66
y
68
72
32
34 x
15
36
38
40
scatter y x , connect(l) sort
4.27
4.79 4.66 4.81
5.07
3.92 5.29 4.57
3.60
5.46 5.23 4.97
3.31
4.81 5.58 3.94
5.32
5.09 3.53 5.48
4.27
5.36
5.10
4.18
5.78
4.33
5.12
4.84
3.60
4.74 4.93 5.14
4.01
4.60 5.41 5.05
5.05
5.40
5.05
4.08
5.17
4.71
4.55
4.12
5.42
4.79
5.70
4.89
6.18 4.37
直方图
histogram x ,bin(10) frequency normal xlab(3.2(0.3)6.2) ylab(0(5)20) l("人数") b("红细胞")
人数
0