《医学统计学》计量资料的统计描述
医学统计学计数资料的统计描述课件
![医学统计学计数资料的统计描述课件](https://img.taocdn.com/s3/m/d1375c0e26fff705cc170af1.png)
医学统计学计数资料的统计描述
11
n 从表5-1可以看出该医院1990和1998两 年五种疾病死亡构成比的排序不同。 1990年五种疾病死亡人数中恶性肿瘤所 占比重最大,其次为循环系统疾病,消 化系统疾病死亡占的比重最小;
n 1998年循环系统疾病占五种疾病死亡人 数的比重最大,其次为恶性肿瘤,消化 系统疾病、传染病死亡则占比重最小。
医学统计学计数资料的统计描述
12
构成比有两个特点:
(1)说明同一事物的k个构成比的总和
应等于100%,即各个分子的总和等于分母。
(2)各构成部分之间是相互影响的, 某一部分比重的变化受到两方面因素的影响。 其一是这个部分自身数值的变化,其二是受 其它部分数值变化的影响。
率 同 某 期 时 可 期 能 内 发 发 生 生 某 某 现 现 象 象 的 的 观 观 察 察 单 单 位 位 总 数 数 比 例 基 数
医学统计学计数资料的统计描述
5
式中比例基数,可以取100%、1000‰、 10万/10万…等。
比例基数的选择主要根据习惯用法和使计 算的结果能保留1~2位整数,以便阅读。例如 患病率通常用百分率、婴儿死亡率用千分率、 肿瘤死亡率以十万分率表示。
医学统计学计数资料的统计描述
32
表5-4两种疗法的治愈率比较
病型
普通型 重型 合计
病人数 300 100 400
甲疗法 治愈数
180 35 215
治愈率(%) 60.0 35.0 53.8
乙疗法
病人数 治愈数 治愈率(%)
医学统计学计量资料的统计描述
![医学统计学计量资料的统计描述](https://img.taocdn.com/s3/m/490dab9e59eef8c75fbfb3f4.png)
正确应用集中趋势指标
• 算数均数:适用于单峰对称分布资料; • 几何均数:适用于变量值呈等比级数关系和呈对
数正态分布的资料; • 中位数和百分位数:适用于任何分布的资料,但
在样本含量较少时不稳定,越靠两端越不稳定; • 中位数在抗极端值的影响方面,比均数具有较好
• 计算公式: Q= QU - QL = P75 - P 25 • 意义: Q值越大,说明变异程度越大。
• 特点:包括了居于中间位置50%的变量值,该指
标比全距稍稳定,但仍未考虑每个观察值。
某传染性疾病的潜伏期(天)
平均偏差(mean difference)
• 定义:各观察值偏离平均数的绝对平均差距 • 计算公式:
差、标准差。
极差(range)
• 表示法:R • 定义:一组资料中最大值与最小值之差。
• 计算公式: R = max-min
• 意义:反映个体变异范围的大小。R越大,变异度(离
散程度)越大, R甲=188-142=46、R乙=166-158=8
• 优点:计算简便,概念清晰,如说明传染病、食物中毒 的最长、最短潜伏期等
125.5296
若应用算术均数为:
问题:
• 为什么表达该资料的平均水平宜用几何均 数?
• 几何均数适用条件是什么? • 何种情况不宜计算几何均数? • 利用频数表计算几何均数时应注意什么?
几何均数的应用
• 几何均数适用于变量值呈等比级数关系和呈对数 正态分布的资料;有些呈轻度偏态分布的资料经 过对数变换后呈对称分布的资料。
• 算术均数 • 几何平均数 • 中位数 • 众数
算术均数(mean)
医学统计学:第二章计量资料的统计描述
![医学统计学:第二章计量资料的统计描述](https://img.taocdn.com/s3/m/6d81323280eb6294dc886c71.png)
频数分布的类型
对称分布:集中位置居中,左右两边对称
偏态分布:正偏态分布(右偏态)峰左尾右 负偏态分布(左偏态)
对称分布
正偏态分布
负偏态分布
三、频数表和频数分布图的用途
揭示变量的分布特征和分布类型; 便于进一步计算指标和统计分析处理; 便于发现某些特大或特小的可疑值。
频数分布的两个特征
集中趋势,central tendency
2.直接用Report Case Summaries 命令; 3.用Compare Means 命令,但要个增加分组
变量。
使用频数表资料时SPSS操作中应 注意的事项
频数表资料要用weight命令; 进行数据输入时要使用组中值;并且
在Frequencies命令中要选择
Values are group midpoints:根据
均数的应用
主要用于对称性或近似对称性分 布的资料;
尤其是在正态分布或近似正态分 布上的应用。
计算方法 1.直接法
X X1 X 2 ... X n
X
n
n
Σ:希腊字母(西格马,sigma),求和符号 例9.2 有8名正常人的空腹血糖值(mmol/L):
6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
将各效价的倒数代入公式,得该8份血清的平均 抗体效价为1:56.57,近似为1:57 注意:变量值不能有0
2.频数表法
G lg1
f lgX
f
式中f为频数。
用频数表法计算G
例 30名麻疹易感儿童接种麻疹疫苗一 个月后,血凝抑制抗体滴度如下表所示 ,试求其平均抗体滴度。
30名麻疹易感儿童血凝抑制抗体滴度
33.06 1705.09
医学统计学计量资料的统计描述
![医学统计学计量资料的统计描述](https://img.taocdn.com/s3/m/1fa74ab8af45b307e971976d.png)
n
n
2020/6/16
计量资料的统计描述
16
举例:
➢ 计算5个同学的平均成绩,93, 92,95,94,91
X 92 93 95 94 91 93 5
2020/6/16
计量资料的统计描述
17
2.加权法(weighting method):
根据频数表计算均数的一种方法。当变 量值个数较多时,可先将原始数据列成 频数表,然后再做计算。
抗体滴度。
2020/6/16
计量资料的统计描述
21
几何均数的计算方法:
➢ 直接法 ➢ 加权法
2020/6/16
计量资料的统计描述
22
1.直接法:
G n X1 X2 L L Xn
写成对数形式 :
G
lg
1
lg
X1
lg
X
2 n
L
L
lg X n
lg
1
lg X n
2020/6/16
计量资料的统计描述
组中值X 145 155 165 175 185
X 145115515 165 20 175111853 165 50
2020/6/16
计量资料的统计描述
19
举例:
测得10个人的血清滴度的倒数分别为2, 2,4,4,8,8,8,8,32,32,求平均 滴度
用算术均数来计算 :
X 2 2 4 4 8 8 8 8 32 32 10.8 10
2020/6/16
计量资料的统计描述
43
一、概念
正态分布的通俗概念: 如果把数值变量资料编制 频数表后绘制频数分布图(又称直方图,它用矩 形面积表示数值变量资料的频数分布,每条直条 的宽表示组距,直条的面积表示频数(或频率) 大小,直条与直条之间不留空隙。),若频数分 布呈现中间为最多,左右两侧基本对称,越靠近 中间频数越多,离中间越远,频数越少,形成一 个中间频数多,两侧频数逐渐减少且基本对称的 分布,那我们一般认为该数值变量服从或近似服 从数学上的正态分布。
医学统计学 第二章 计量资料的统计描述
![医学统计学 第二章 计量资料的统计描述](https://img.taocdn.com/s3/m/71839634ad02de80d5d84028.png)
肌红蛋白含量
人数
0~
2
5~
3
10~
7
15~
9
20~
10
25~
22
30~
23
35~
14
40~
9
45~50
2
18
人数
25 20 15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
医学统计学 第二章 计量资料的统计 描述
计量资料(定量资料、数值变量资料) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值:
X1,X2,X3,……,Xn
n为样本例数(样本大小、样本含量)
2
统计描述——描述其分布规律 1、用频数分布表(图)
要求:大样本 如 n〉30
2、用统计指标 描述 集中趋势 离散趋势
6
➢制表步骤 了解分布
1. 求极差(range) 极差也称全 距,即最大值和最小值之差,记作R。 本例
R 5 .7 1 2 .3 5 3 .3 6 ( m m o l/L )
7
2.确定组距(i) :
组段数通常取组 10-15组 本例组距
i 3 .3 6 /1 0 0 .3 3 6 0 .3 0
累计频率(%) (4)
0
402
402
35.80
1
330
732
65.18
2
232
964
85.84
3
118
1082
96.35
4
27
医学统计-计量资料的统计描述
![医学统计-计量资料的统计描述](https://img.taocdn.com/s3/m/499c8e93b4daa58da1114a79.png)
中位数
符号
X
G
M
含义 应用条件
各观察值相加除 以观察值的个数 所得之商
正态或近似正态 分布
N各观察值的 一组观察值按
乘积开n次方所 顺序排列,居
得之根
中者
偏态或对数正 极偏态或分布
态分布
不规则的资料
计算公式
加权法计算中X 不能有0和负值 中位数为百分
说明 值的含义
的数据
位数的特例
二、集中趋势的描述
程度或离开平均水平的趋势
三、离散趋势的描述
描述离散趋势的指标
全距(极差)range (R) 四分位数间距 interquartile range (Q) 方差 variance 标准差 standard deviation (SD) 变异系数 coefficient variation (CV)
医学科研中的统计学方法
计量资料的统计描述
一、 频数与频数分布 二、 集中趋势的描述 三、 离散程度的描述 四、正态分布及应用
例1: 某医师在一次体检中,测得120名成年 男子的身高(厘米)资料如下, 试对此资料进行 统计描述
159 153 159 164 161 160 169 154 170 162 158 155 149 159 153 164 160 165 164 158 155 164 161 159 164 161 158 163 170 154 157 165 165 163 185 159 164 176 161 156 155 167 165 153 167 154 163 163 172 156 161 161 164 165 161 170 167 159 173 151 163 156 167 159 167 163 169 171 157 153 161 157 167 161 158 171 170 181 157 161 167 170 167 165 156 173 165 167 172 162 156 165 171 171 169 173 161 163 160 164 172 159 159 168 161 165 166 159 149 169 162 166 170 164 157 163 164 162 153 164
医学统计学第3版,02计量资料的统计描述试题
![医学统计学第3版,02计量资料的统计描述试题](https://img.taocdn.com/s3/m/ec7d7b8052ea551810a687f4.png)
第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图 (1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。
常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。
如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。
min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。
每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数(对称分布)算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。
医学统计学第二讲计量资料的统计描述
![医学统计学第二讲计量资料的统计描述](https://img.taocdn.com/s3/m/ea93fad85ef7ba0d4a733b32.png)
一、算术平均数( The Arithmetic mean)
简称均数(Mean)或均值,定义为所有变量值之 和除以变量值个数(即,样本含量Sample Size)。 反映一组呈对称分布的变量值在数量上的平均水平。
(1)直接计算法 n
公式 :
xi
x i1
x x1 x2 ... xn
n
8
8
k
11 3 2 7 2 93 1 2 2 3
xi fi
i 1 k
fi
xf f
13
i 1
(2)加权法
加权均数的计算原理
变量值
x
频数 f
频数与变量值的
积( fx)
1
1
1
3
2
6
7
2
14
9
3
27
合计
4
fi =8 i 1
4
f i xi =48 i 1
4.95 5.07 4.80 5.30 4.65 4.77 4.50 … …
4.81 4.54 3.82 4.01 4.89 4.62 5.12 … …
5
一、频数表 (Frequency Table) 同时列出观察指标的可能取值区间及
其在各区间内出现的频数。 1.求全距:R= 5.95-3.82=2.03 2.确定组数k:通常选择在8~15之间 3.确定组距: 参考组距为R/k , R为全距 4.确定组段: 包含下限不包含上限 5.对各组段计数: 划记,汇总.
108.5
20.83
21
111.5
17.50
15
114.5
12.50
15
117.5
医学统计学:计量资料的统计描述
![医学统计学:计量资料的统计描述](https://img.taocdn.com/s3/m/b1895dab534de518964bcf84b9d528ea81c72fcd.png)
方差、标准差计算方法和意义
方差
指各数据与均数之差的平方和的平均 数,用于反映数据的术平方根,用于衡量数据偏 离均数的程度。标准差越大,数据分 布越离散。
变异系数在医学研究中应用
变异系数
指标准差与均数之比,用于比较不同单位或不同均数水平下数据的离散程度。在医学研究中,常用于评价不同指 标或不同人群间的变异程度。
分类
根据测量水平不同,可分为离散型计量资料和连续型计量资料。离散型计量资 料只能取整数值,如人口数、医院床位数等;连续型计量资料可以取实数范围 内的任何值,如身高、体重等。
计量资料特点分析
01
数值性
计量资料以数值形式表示,具有明 确的数量特征。
可比性
同类计量资料之间可以进行比较, 如不同人群的身高、体重等。
众数
一组观察值中出现次数最多的数。
应用场景
常用于描述无明显集中趋势或分布规 律资料的集中趋势,如一些分类数据 的统计描述。
04 离散程度指标解读
极差、四分位数间距计算及意义
极差
指一组数据中最大值与最小值之差, 用于反映数据的波动范围。计算简单, 但易受极端值影响。
四分位数间距
指第三四分位数与第一四分位数之差, 用于反映中间50%数据的离散程度。 较极差更稳定,不易受极端值影响。
常用统计描述方法介绍
频数分布表与直方图
通过分组和计数的方式展示数 据的分布情况,适用于连续型
变量。
集中趋势描述
包括算术均数、几何均数和中 位数等,用于描述数据的平均 水平或中心位置。
离散程度描述
包括标准差、方差和四分位数 间距等,用于描述数据的波动 范围或离散程度。
偏态与峰态描述
通过偏态系数和峰态系数等描 述数据的偏态和峰态特征,反
《医学统计概论》第2章计量资料的统计描述
![《医学统计概论》第2章计量资料的统计描述](https://img.taocdn.com/s3/m/882706e302d276a200292e73.png)
2.百分位数与四分位数间距
Percentile and quartile range
百分位数 :数据从小到大 排列;在百分尺度下,所占 百分比对应的值。记为Px。 四分位间距:
QR=P75- P25
四分位半间距(quartile deviation):QD=QR/2
QR
P0
P25
P50 P75 P100
均数、中位数、众数三者关系
正态分布时: 均数=中位数=众数 正偏态分布时:均数>中位数>众数 负偏态分布时:均数<中位数<众数
(见下图)
第三节 离散程度的描述
反映数据的离散度(dispersion )。即 个体观察值的变异程度。常用的指标有:
1. 极差(range,R) 2. 四分位数间距(quartile range,QR) 3. 方差 (variance) 4. 标准差(standard deviation,SD) 5. 变异系数(coefficient of variation,CV)
f1 f2 f3 fk
fi
适用条件:对称分布,尤其是正态或近似正态分布
的资料(正态分布后述)。
2. 几何均数(geometric mean)
符号:G表示样本几何均数;G 表示总体几何均数
适用条件:呈倍数关系的等比资料或对数正态分 布(正偏态)资料。如抗体滴度资料。
G n X1X2 Xn
lg
103 5
lg
104
lg
105
1000
故平均抗体效价为1:1000
此例的算术均数为22222,显然不能代表滴度的 平均水平。同一资料,几何均数<均数
频数表资料计算的几何均数
G
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/10/17
计量资料的统计描述
22
1.直接法:
G n X1 X2
Xn
写成对数形式 :
G
lg1
lg
X1
lg
X
2 n
lg
X
n
lg1
lg X n
2020/10/17
计量资料的统计描述
23
举例:
如上例:
G 10 2 2 4 488883232 7
2020/10/17
计量资料的统计描述
2020/10/17
计量资料的统计描述
19
举例:
测得10个人的血清滴度的倒数分别为2, 2,4,4,8,8,8,8,32,32,求平均 滴度
用算术均数来计算 :
X 2 2 4 4 8 8 8 8 32 32 10.8 10
2020/10/17
计量资料的统计描述
20
(二)几何均数(geometric mean, G)
5. 划记记数
2020/10/17
计量资料的统计描述
5
2020/10/17
计量资料的统计描述
6
2020/10/17
计量资料的统计描述
7
直方图(Histogram) 直观、形象地表示频数分布的形态和特征。
2020/10/17ຫໍສະໝຸດ 计量资料的统计描述8
频数分布的两个特征:
集中趋势
集中位置的描述,即大多数数值落 在什么位置,是现象共性的反映,是 现象规律性的数量上的表现。
n
为偶数时,M
Xn
2
X
(
n 2
1)
/
2
举例:2,4,5,6,7,8的中位数为5.5
2020/10/17
计量资料的统计描述
28
2.频数表法:
M L iM (n f )
fm 2
其中L、i、f分别为M所在组段的下
限、组距和频数, f 为M所在组段之前
各组段的累积频数。
举例:以上面数据为例
频数表(频数分布):表示各组及它们对应 的组频数的表格称为频数表或频数分布。
2020/10/17
计量资料的统计描述
4
频数表编制
1. 计算极差(全距):极差(R)=最大 值-最小值
2. 确定组数、组距:组距=R/组数, 医 学上组数一般在8-15组
3. 确定组限:组限[下限~上限) 4. 计算组中值
标与离散趋势指标)
2020/10/17
计量资料的统计描述
11
第二节 集中趋势
我们用平均数(average)来描述集中趋 势,平均数是描述一组观察值集中位置 或平均水平的统计指标
2020/10/17
计量资料的统计描述
12
平均数 ➢ 算术均数
➢ 几何均数
➢ 中位数
2020/10/17
计量资料的统计描述
13
(一)算术均数(arithmetic mean)
➢ 算术均数:简称均数,用于说明一组观 察值集中位置或平均水平,是描述计量 资料的一种最常用的方法。
➢ 总体均数用μ表示,样本均数用 X 表示。
➢ 适用资料:对称分布,尤其是正态分布
2020/10/17
计量资料的统计描述
14
算术均数的计算方法:
➢ 直接法 ➢ 加权法
2020/10/17
计量资料的统计描述
15
1.直接法
当样本中变量值个数不多时,将变量 值相加再除以变量值个数(样本含量), 即得均数。
X X1 X2 n
Xn X
n
2020/10/17
计量资料的统计描述
16
举例:
➢ 计算5个同学的平均成绩,93, 92,95,94,91
M 160 10 (50 16) 164.5 20 2
2020/10/17
计量资料的统计描述
29
表2-4 某地630名正常女性血清甘油三脂含量(mg/dl)
26
(三)中位数(median, M)
把一组数值按大小顺序排列,位于中 间位置上数的值即为中位数。
适用资料:①任何分布,尤其偏态分布 ②分布类型不祥 ③末端无具体值
2020/10/17
计量资料的统计描述
27
1.直接法:
n 为奇数时,M X ( n1) 2
举例:2,4,5,6,7的中位数为5
离散趋势
离散趋势是描述一组数据的变异程
度或偏离集中位置的程度(参差不齐
的程度)
2020/10/17
计量资料的统计描述
9
频数分布的类型:
对称分布(正态分布、t分布)与偏态分布 (集中位置偏向左的一侧叫正偏态,反之 叫负偏态)
2020/10/17
计量资料的统计描述
10
频数表的主要用途:
1. 揭示分布类型 2. 发现可疑值 3. 方便进一步统计计算(计算集中趋势指
24
2.加权法:
G
lg1
f lg
f
X
2020/10/17
计量资料的统计描述
25
举例:
IgG滴度倒数 40 80 160 320 640 1280
例数 3 22 17 9 0 1
G
lg
1
3
lg
40
22
lg
80
17
lg160 52
9
lg
320
0
lg1280
129.3
2020/10/17
计量资料的统计描述
fn
f
其中X1、X2……Xn分别为各组段的组中值, 即本组段的上限与下限之和除以2
2020/10/17
计量资料的统计描述
18
举例:
身高
频数f
140~
1
150~
15
160~
20
170~
11
180~190
3
累积频数 1 16 36 47 50
组中值X 145 155 165 175 185
X 145115515 165 20 175111853 165 50
X 92 93 95 94 91 93 5
2020/10/17
计量资料的统计描述
17
2.加权法(weighting method):
根据频数表计算均数的一种方法。当变 量值个数较多时,可先将原始数据列成 频数表,然后再做计算。
X X1 f1 X 2 f2 f1 f2
X n fn fX
医学研究中有一类比较特殊的资料,如抗 体滴度等变量值呈倍数变化的数据,宜用 几何均数描述其平均水平。
适用资料: ①对数正态分布,原始数据偏态分布,经
对数变换后成正态分布的资料。 ②等比资料,即呈倍数变化的数据。例如
抗体滴度。
2020/10/17
计量资料的统计描述
21
几何均数的计算方法:
➢ 直接法 ➢ 加权法
计量资料的统计描述
主要内容:
1. 频数表 2. 集中趋势 3. 离散趋势 4. 正态分布 5. 医学参考值范围
2020/10/17
计量资料的统计描述
2
第一节 频数分布
频数表的绘制、直方图
频数分布的特点
频数分布的类型
频数分布的用途
2020/10/17
计量资料的统计描述
3
频数:当汇总大量的原始数据时,把数据按 类型分组,其中每个组的数据个数,称为该 组的频数。