统计学2 计量资料的统计描述指标课件

合集下载

第二章 计量的资料的统计描述

第二章  计量的资料的统计描述
计算: (1)直接法
中位数
2 频数表法
中位数
中位数
中位数的优缺点
中位数的优缺点
第三节 离散趋势的描述
一、极差与四分位数间距 二、方差与标准差 三、变异系数
极差与四分位数间距
极差与四分位数间距
百分位数
百分位数
百分位数
二、方差与标准差
方差 (variance)也称均方差(mean square deviation),样本观察值的离均差 平方和的均值。表示一组数据的平均离散 情况。
标准差 (standard deviation)即方差的正
平方根;其单位与原变量X的单位相同。
标准差的主要意义和用途
(1)描述资料的离散趋势 (2)用于计算变异系数 (3)用于计算标准误 (4)结合均值与正态分布的规律估计参
考值范围
变异系数
适用条件:①观察指标单位不同,如身 高、体重
制定医学参考值范围 正态分布法
百分位数法
第五节 案例讨论
自学
小结
小结
第二章 计量资料的统计描述
学习内容
第一节 频数分布表与频数分布图 第二节 集中趋势的描述 第三节离散趋势的描述 第四节 正态分布及其应用 第五节 案例讨论(自学) 小结
几个概念
频数:当汇总大量的原始数据时,把数据按类型分组(组 段),其中每个组的数据个数,称为该组的频数。
②同单位资料,但均数相差悬殊
第四节 正态分布及其应用
一、正态分布 二、标准正态分布 三、正态分布的应用
正态分布
正态分布
标准正态分布
标准正态分布
标准正态分布
标准正态分布面积示意图

统计学--第二章计量资料的统计描述幻灯片PPT

统计学--第二章计量资料的统计描述幻灯片PPT
甲组 26 28 30 32 34
乙组 24 27 30 33 36
丙组 26 29 30 31 34
课件
36
离散程度(或变异程度)
指数据参差不齐的程度,反映资料的 离散趋势。
将反映平均水平与离散程度的指标结 合起来使用,可全面地描述数据的分 布规律。
课件
37
(一)全距(或极差 , Range )
(53.0 55.0) / 2 54(cm)
数。
课件
28
中位数的应用
中位数可用于任何分布的定量资料; 资料的分布呈明显偏态,特别是负偏态; 分布的一端或两端无确定的数值;
(如:>50, 或 <10)
资料的分布不清。 注意:在完全对称的单峰曲线分布中,同
一组资料的均数与中位数相同, Mean = Median
XX22XX2
XX2 2 XX2
课件
19
(二)几何均数 Geometric mean,
G
反映一组呈倍数关系的观察值的平 均水平
适用:数据呈正偏态分布,经对数 转换后呈正态分布。多用于观察值 之间呈倍数关系,如抗体滴度
计算方法
➢直接法
➢加权法
课件
20
1.直接法
G n X1X2...Xn
lg1lgX1 lgX1 ...lgXn
对称分布
正偏态分布
课件
负偏态分布
9
三、频数表和频数分布图的用途
揭示变量的分布特征和分布类型; 便于进一步计算指标和统计分析处
理; 便于发现某些特大或特小的可疑值

课件
10
频数分布的两个特征
集中趋势,central tendency
指变量值的中心数值或中心位置所在。

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)

卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)
11111,11111,11111 中位数是50%位的数值,其为百分位数的特殊形式。
●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
估计的方法: 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算 (双侧) 95% 正常值(医学参考值)范围公式:
(x1.96 · S,x1.96 · S )
即(x±1.96 · S ) 例:
1.96 × 3.79 )
即(156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
96 ·S,x 1. Q = Qu 一 Ql
单侧 上界: P 95
单侧 下界: P 5
31
习题:
1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不

2.用均数和标准差可全面描述:
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
19
相关概念:离均差、离均差平方和、方差(2 S2 ) 标准差的符号: S

第2章计量资料的统计描述 PPT课件

第2章计量资料的统计描述 PPT课件

计量资料的统计描述第一节频数分布(frequency distribution)一、频数表的编制P11 例2.1该资料未进行任何加工整理,称为原始资料(raw data)。

1. 频数表的编制步骤(1)求极差(range):即最大值与最小值之差,又称为全距。

本例极差:R=5.46-3.07=2.39(×1012/L)(2)决定组数、组段和组距:根据研究目的和样本含量n确定。

组距=极差/拟分组数,通常分8-15个组,为方便计,组距参考极差的十分之一, 再略加调整。

本例:i= R /10=2.39/10=0.239≈0.20。

(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。

(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。

2.频数表的图示及分析⏹频数分布如右图所示;⏹频数分布的分析: 频数分布的类型 频数分布的特征1020304050F r e q u e n c y33.2 3.4 3.6 3.844.2 4.4 4.6 4.855.2 5.4 5.6RBC3. 频数表的用途(1)揭示资料的分布类型:属对称分布,还是不对称。

(2)观察资料的分布特征:①集中趋势(central tendency):变量值集中位置(location)。

本例在组段“4.2~”。

—平均水平指标②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。

离“中心”位置越远,频数越小;且围绕“中心”左右对称。

—变异程度指标(3)发现资料有无可疑值:特大或特小值。

(4)便于进一步统计处理。

(5)陈述资料的一种形式。

第二节集中趋势的描述寻找集中的位置(central location),平均(average)反映了定量资料的集中位置,不同分布类型的资料,要用不同的平均数反映,常用的有:1. 算术均数(arithmetic mean),简称均数 (mean)2. 几何均数(geometric mean)3.中位数 (median)4. 众数(mode)5.调和均数(harmonic mean)6.截尾均数(censored mean)1.均数(mean )符号表示: 表示样本均数, 总体均数 12nx x x X x nn+++∑==1123123k k ik if X fX fX f X fX x f f f f f ++++∑==++++∑适用条件:对称分布,尤其是正态或近似正态分布的资料(正态分布后述)。

计量资料的统计描述(研究生) PPT课件

计量资料的统计描述(研究生) PPT课件

第二章计量资料的统计描述计量资料的统计描述频数表与频数分布集中趋势(算术均数、几何均数、中位数)离散趋势(极差、四分位间距、方差、标准差、变异系数)福建医科大学流行病与卫生统计一、频数表与频数分布(frequency table and frequency distribution) 福建医科大学流行病与卫生统计(一)连续型计量资料的频数表1、频数表的制作步骤2、频数分布表的作用例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下,试编制频数分布表。

2.35 4.213.32 5.354.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.5 2.7 4.61 4.75 2.913.914.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.8 3.41 4.12 3.955.08 4.53 3.92 3.58 5.35 3.843.60 3.514.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.5 3.964.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.875.713.304.73 4.175.13 3.78 4.57 3.8 3.93 3.78 3.99 4.48 4.284.065.26 5.25 3.98 5.03 3.51 3.86 3.02 3.7 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26频数表的编制步骤(1)求全距(range):即最大值与最小值之差,又称为极差。

本例全距:R=(5.71-2.35)cm=3.36cm(2)划分组段组数:组段常取10~15组为方便计,组距参考极差的十分之一, 再略加调整。

2计量资料统计描述PPT课件

2计量资料统计描述PPT课件
即[3.60,3.80);以此类推。
▪ 最后一组段 [5.40,5.60]
2020/8/1
9
一、频数分布表
列出各组段
第一组段
2020/8/1
最后一组段
10
一、频数分布表
(4)分组划记并统计频数
统计每个组段内 的频数(例数)
频数的合计数等 于样本含量
2020/8/1
11
一、频数分布表
(4)分组划记并统计频数
▪ 每个组段的起点为该组的下限L(low limit), 终点为上 限U(upper limit), 上限=下限+组距;变量值X的归组 统一定为L≤X< U ,最后组段写出上限,起始组段和最后 组段应包含最小值和最大值
▪ 各组段不能重叠,每一组段均为半开半闭区间,即包括 下限,不包含上限。
例1 第一组段下限为 3.60,上限为3.60+0.20=3.80
第一篇 基本统计方法
第二章 计量资料的统计描述
标题添加
点击此处输入相 关文本内容
标题添加
点击此处输入相 关文本内容
总体概述
点击此处输入 相关文本内容
点击此处输入 相关文本内容
2
第二章 计量资料的统计描述
❖第一节 频数分布 ❖第二节 集中趋势的描述 ❖第三节 离散趋势的描述 ❖第四节 正态分布 ❖第五节 医学参考值范围的制定
▪ 纵坐标:为频数f,必须从0开始(f为每一组段内的人数)
❖ 直条 ▪ 直条的宽度:组距 ▪ 直条的高度:每一组段的频数
❖ 累计
2020/8/1
15
二、频数分布图
2020/8/1
16
二、频数分布图
2020/8/1
17
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

N
Valid
Missing
Mean
Median
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Percentiles
5
25
50
75
95
97.5
238 0
7.1387 6.6111a 3.3217 1.209
x
72.4
例 某地不同年龄女童的身高资料如下,比较不同 年龄女童身高的变异程度。
表 某地不同年龄女童身高(cm)的变异程度
年龄组 1-2月
例数 100
均数 56.3
标准差 2.1
变异系数 (%)
3.7
5-6月 120
66.5
2.2
3.3
3-3.5岁 300
97.2
3.1
3.2
5-5.5岁 500 107.8
ON AVERAGE 间距 3. 标准差,S 4. 变异系数,CV
变异程度指标越大,表示数据离散程度越大。
1. 极差
Range,亦称全距,即全部观察值中最大值与最 小值之差。
R = X max − X min
极差没有利用全部观察值,是简单但又粗略的变 异指标。
效价 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计
例数 f 2 3 6 9 8 14 12 6 60
G=78.79
只用平均数描述资料的弊病
It has been said that a fellow with one leg frozen in ice and the other leg in boiling water is comfortable。
总体标准差:σ 样本标准差:S
σ = ∑( X − μ)2 N
S = ∑( X − X )2 n −1
3. 标准差
例 选择适当的统计指标对数据库gastro.sav中的 年龄age的离散程度进行描述。
S=15.09岁
试求以下三组数据的标准差:
A组:26,28,30,32,34 B组:24,27,30,33,36 C组:26,29,30,31,34
∑ ∑ X 2 − ( X )2
4540 − 1502
S=
n=
5 = 3.16
n −1
5 −1
∑ ∑ X 2 − ( X )2
4590 − 1502
S=
n=
5 = 4.74
n −1
5 −1
∑ X 2 − (∑ X )2
4534 − 1502
S=
n=
5 = 2.92
n −1
5 −1
Comparing Standard Deviation:
3.20~
2
1.7
2
3.50~
5
4.2
7
3.80~ 10
8.3
17
4.10~ 19
15.8
36
4.40~ 23
19.2
59
4.70~ 24
20.0
83
5.00~ 21
17.5
104
5.30~ 11
9.2
115
5.60~
4
3.3
119
5.90~6.20 1
0.8
120
合 计 120
100.0

1.7 5.8 14.2 30.0 49.2 69.2 86.7 95.8 99.2 100.0 -
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 100000
1. 算术均数
适用于单峰对称分布的资料,特别是正态 分布或近似正态分布的资料。
由于均数易受到极端值的影响,故不适用 于偏态分布资料的描述。
1. 算术均数
问题: 数 据 库 Hospital.sav 中 的 住 院 总 费 用 total_fee的平均水平是?可以采用算术均 数来描述吗?
2. 四分位数间距
四分位数间距:是上四分位数(QU= P75)与下四 分位数(QL= P25)之差。
该值越大,说明资料的变异程度越大。 计算公式为:
QR = Q3 − Q1
P25
P75
2. 四分位数间距
四分位数间距比极差稳定 常与中位数一起使用 用于描述偏态分布资料、两端无确切值资
(2) 10例乳癌患者治疗前血液尿素氮(mmol/L)的结果为: 4.2,3.1,4.6,5.1,3.0,5.6,4.4,3.5,5.0,5.2。
(3) 9例肝硬化患者治疗后存活的天数为: 128, 215, 79, 243, 284, 65, 49+, 162, 217+。
案例:某市1974年留驻该市一年以上,无明显肝、 肾 疾 病 , 无 汞 作 业 接 触 史 的 居 民 238 人 的 发 汞 值 (μmol/kg)检测结果如下表所示。
2. 中位数
中位数(median,M):是将一组观察值 由小到大排列后位次居中的观察值。
2. 中位数
n 为奇数时 n 为偶数时
M = X ⎛ n+1⎞ ⎜⎝ 2 ⎟⎠
M
=
1⎛
2
⎜ ⎝
X
(
n 2
)
+

X
(
n +1) 2
⎟ ⎠
2. 中位数
例 某研究人员测得7名中年知识分子SCL-90总分依次 为:87,90,91,92,95,96,108。试求其中位数。
X =∑X
n = 112.9 + 99.5 + " 116.5 cm = 107.39cm
11

某研究者随机抽取温州市正常成年男子120名,其红细 胞计数值(×1012/L)的频数表资料如下,求均数。
表 1 某地 120 名正常成年男子红细胞频数表
组 段 频数 频率(%) 累积频数 累积频率(%)
X
n
n
频数表法:
∑∑ X
=
f1 X 1 + f2 X 2 + " + fk X k f1 + f2 + " + fk
=
fX f
1. 算术均数
例 现有11名5岁女孩的身高(cm)为:112.9, 99.5,100.7,101.0,112.1,118.7,107.9,108.1, 99.1,104.8,116.5,试计算其平均身高。
适用于对数正态分布或数据呈倍数变化的资料, 如血清抗体滴度、细菌计数等。
3. 几何均数
直接法: G = n X 1 × X 2 × " × X n
∑ G
=
lg −1
⎛ ⎜⎜⎝
lg X ⎞ n ⎟⎟⎠
加权法:
G
=
lg
−1
⎛ ⎜⎜⎝
∑f ∑
lg f
X
⎞ ⎟⎟⎠
3. 几何均数
例 有7名慢性肝炎患者的HBsAg滴度资料为:1:16, 1:32,1:32,1:64,1:64,1:128,1:512。试求 其几何均数。
M = X ⎛ n+1⎞ = X ⎛ 7+1⎞ = X 4 = 92分
⎜⎝ 2 ⎟⎠
⎜⎝ 2 ⎟⎠
例 在上述7名中年知识分子SCL-90总分的基础上,又 测得一名中年知识分子该总分为171,试求其中位数。
M
=
1 2
⎛ ⎜ ⎝
X
(
n 2
)
+
X ( n +1) 2
⎞ ⎟ ⎠
=
1 2
⎛ ⎜ ⎝
X
(
8 2
)
3. 标准差
离均差--每一个观察值与均数之差,即
X-μ ,反映所有观察值的变异程度。 离均差平方和--SS =∑(X-μ)2
方差variance--离均差平方和的平均值, 又称均方(MS)。
σ 2 = ∑( X − μ )2 N
3. 标准差
标准差(standard deviation): – 方差的正平方根,其单位与原单位相同。最常 用 Æ(正态分布或近似正态分布资料)
3.3
3.1
小结
正态分布:
均数±标准差 X ± S
偏态分布:
中位数(四分位数间距) M (QR )
SPSS演示:Frequencies
Analyze => Descriptive Statistics => Frequencies 矩法 统计描述指标
小结
1. 掌握算术均数、几何均数、中位数的概念、 特点及其适用范围;四分位数间距、标准 差、变异系数等的概念、适用范围;
《《MeMdiecdailcsatlastitsattiicssti》cs
定量资料的统计描述指标

案例:世界最富有800人资料
Data:800rich.sav
福布斯杂志2006年发布 包括:排名、姓名、国籍、年龄、净资产、居住
地等
内容提要
集中趋势的描述指标 离散趋势的描述指标 SPSS操作演示
例 计 算 数 据 库 hospital.sav 中 的 住 院 总 费 用 total_fee的平均水平。
M=6280.39元
2. 中位数
例 对于某项风险较高的新手术术后的生存时间进行 跟踪,共调查了7人,其中,6人死亡之前分别生存了 5天、6天、10天、16天、25天、29天,还有一人术后 30天随访时仍存活。问:平均生存时间是?
相关文档
最新文档