统计学2 计量资料的统计描述指标课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
M=16天
案例
某医师测得5个人的血清抗体效价分别 为 : 1 : 10 , 1 : 100 , 1 : 1000 , 1 : 10000,1:100000,该医师用其倒数求均 数,得平均效价为1:22222。
Question?
3. 几何均数
几何均数(geometric mean):记为G
G = n X1 × X2 ×"× Xn
3.20~
2
1.7
2
3.50~
5
4.2
7
3.80~ 10
8.3
17
4.10~ 19
15.8
36
4.40~ 23
19.2
59
4.70~ 24
20.0
83
5.00~ 21
17.5
104
5.30~ 11
9.2
115
5.60~
4
3.3
119
5.90~6.20 1
0.8
120
合 计 120
100.0

1.7 5.8 14.2 30.0 49.2 69.2 86.7 95.8 99.2 100.0 -
效价 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计
例数 f 2 3 6 9 8 14 12 6 60
G=78.79
只用平均数描述资料的弊病
It has been said that a fellow with one leg frozen in ice and the other leg in boiling water is comfortable。
(2) 10例乳癌患者治疗前血液尿素氮(mmol/L)的结果为: 4.2,3.1,4.6,5.1,3.0,5.6,4.4,3.5,5.0,5.2。
(3) 9例肝硬化患者治疗后存活的天数为: 128, 215, 79, 243, 284, 65, 49+, 162, 217+。
案例:某市1974年留驻该市一年以上,无明显肝、 肾 疾 病 , 无 汞 作 业 接 触 史 的 居 民 238 人 的 发 汞 值 (μmol/kg)检测结果如下表所示。
Small standard deviation Large standard deviation
A B
4. 变异系数
Coefficient of Variation,CV:标准差与均数 之比,用百分数表示。
计算: CV = s ×100% x
用途:
无单位
– 比较度量衡单位不同资料的变异度
集中趋势的描述指标
平均数:是一类描述定量资料集中位置或平均水平的统 计指标,常因资料不同而选取不同的指标进行描述。
1. 算术均数 2. 中位数 3. 几何均数
1. 算术均数
Mean,简称均数,描述一组定量资料在数量上 的平均水平。
总体均数:μ
样本均数: X
1. 算术均数
直接法:
∑ X = X 1 + X 2 + " + X n =
M = X ⎛ n+1⎞ = X ⎛ 7+1⎞ = X 4 = 92分
⎜⎝ 2 ⎟⎠
⎜⎝ 2 ⎟⎠
例 在上述7名中年知识分子SCL-90总分的基础上,又 测得一名中年知识分子该总分为171,试求其中位数。
M
=
1 2
⎛ ⎜ ⎝
X
(
n 2
)
+
X ( n +1) 2
⎞ ⎟ ⎠
=
1 2
⎛ ⎜ ⎝
X
(
8 2
)
X
=
f1X1 + f2 X 2 + " + fk X k f1 + f2 + " fk
=
3.35
×
2
+ 3.65 2+5
×5+" +"+1
+
6.05
×1
=
4.85(
×1012 /L)
注意:
频数表资料使用组中值代替时是假定各组数据在组内是 均匀分布的,如果不符合条件,其误差可能会较大。
1. 算术均数
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 100000
1. 算术均数
适用于单峰对称分布的资料,特别是正态 分布或近似正态分布的资料。
由于均数易受到极端值的影响,故不适用 于偏态分布资料的描述。
1. 算术均数
问题: 数 据 库 Hospital.sav 中 的 住 院 总 费 用 total_fee的平均水平是?可以采用算术均 数来描述吗?
《《MeMdiecdailcsatlastitsattiicssti》cs
定量资料的统计描述指标

案例:世界最富有800人资料
Data:800rich.sav
福布斯杂志2006年发布 包括:排名、姓名、国籍、年龄、净资产、居住
地等
内容提要
集中趋势的描述指标 离散趋势的描述指标 SPSS操作演示
料及分布不明确资料的离散程度
2. 四分位数间距
例 选择适当的统计指标对数据库hospital.sav中 的住院总费用total_fee的离散程度进行描述。
QR=9115.28元
3. 标准差
例 选择适当的统计指标对数据库gastro.sav中的 年龄age的离散程度进行描述。
问题: 适合选用四分位数 间距吗?该指标有 什么缺点?
总体标准差:σ 样本标准差:S
σ = ∑( X − μ)2 N
S = ∑( X − X )2 n −1
3. 标准差
例 选择适当的统计指标对数据库gastro.sav中的 年龄age的离散程度进行描述。
S=15.09岁
试求以下三组数据的标准差:
A组:26,28,30,32,34 B组:24,27,30,33,36 C组:26,29,30,31,34
X
n
n
频数表法:
∑∑ X
=
f1 X 1 + f2 X 2 + " + fk X k f1 + f2 + " + fk
=
fX f
1. 算术均数
例 现有11名5岁女孩的身高(cm)为:112.9, 99.5,100.7,101.0,112.1,118.7,107.9,108.1, 99.1,104.8,116.5,试计算其平均身高。
2. 中位数
中位数(median,M):是将一组观察值 由小到大排列后位次居中的观察值。
2. 中位数
n 为奇数时 n 为偶数时
M = X ⎛ n+1⎞ ⎜⎝ 2 ⎟⎠
M
=
1⎛
2
⎜ ⎝
X
(
n 2
)
+

X
(
n +1) 2
⎟ ⎠
2. 中位数
例 某研究人员测得7名中年知识分子SCL-90总分依次 为:87,90,91,92,95,96,108。试求其中位数。
3.3
3.1
小结
正态分布:
均数±标准差 X ± S
偏态分布:
中位数(四分位数间距) M (QR )
SPSS演示:Frequencies
Analyze => Descriptive Statistics => Frequencies 矩法 统计描述指标
小结
1. 掌握算术均数、几何均数、中位数的概念、 特点及其适用范围;四分位数间距、标准 差、变异系数等的概念、适用范围;
∑ ∑ X 2 − ( X )2
4540 − 1502
S=
n=
5 = 3.16
n −1
5 −1
∑ ∑ X 2 − ( X )2
4590 − 1502
S=
n=
5 = 4.74
n −1
5 −1
∑ X 2 − (∑ X )2
Leabharlann Baidu
4534 − 1502
S=
n=
5 = 2.92
n −1
5 −1
Comparing Standard Deviation:
例 计 算 数 据 库 hospital.sav 中 的 住 院 总 费 用 total_fee的平均水平。
M=6280.39元
2. 中位数
例 对于某项风险较高的新手术术后的生存时间进行 跟踪,共调查了7人,其中,6人死亡之前分别生存了 5天、6天、10天、16天、25天、29天,还有一人术后 30天随访时仍存活。问:平均生存时间是?
某市1974年238人的发汞检测结果
发汞组段 1.5- 3.5- 5.5- 7.5- 9.5- 11.5- 13.5- 15.5- 17.5- 19.5-21.5
人数 20 66 60 48 18 16 6 1 0
3
1、选用何种指标描述其集中位置和离散程度较 好?并列出其值(SPSS分析结果见下表)。 2、估计发汞的正常值范围。
2. 熟悉众数; 3. 了解调和均数; 4. 重点和难点:正确选择描述集中趋势和离散
程度的指标。
案例讨论
选用合适的集中趋势指标反映各组资料的平均水平:
(1) 12例肾移植病人BKV原发感染者,BKV HAI抗体最高 滴度之倒数为:320, 640, 640, 640, 1280, 1280, 1280, 2560, 5120, 10240, 10240, 20480。
N
Valid
Missing
Mean
Median
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Percentiles
5
25
50
75
95
97.5
238 0
7.1387 6.6111a 3.3217 1.209
+
X ( 8 +1) 2
⎞ ⎟ ⎠
=
1 2
(
X
4
+
X5)
= 93.5分
2. 中位数
中位数适用于任何分布的资料
– 对于正态分布的资料,中位数等于均数; – 对于对数正态分布资料,中位数等于几何均数。
中位数不受极端值影响
– 特别适用于偏态分布资料、分布不明确或两端无确切 值的资料。
2. 中位数
ON AVERAGE !
离散趋势的描述指标
1. 极差,R 2. 四分位数间距 3. 标准差,S 4. 变异系数,CV
变异程度指标越大,表示数据离散程度越大。
1. 极差
Range,亦称全距,即全部观察值中最大值与最 小值之差。
R = X max − X min
极差没有利用全部观察值,是简单但又粗略的变 异指标。
– 比较均数相差悬殊资料的变异度
例 2008年通过十省调查得知,农村刚满周岁的女童 体重均数为8.42kg,标准差为0.98kg,身高均数为 72.4cm,标准差为3.0cm。试比较周岁女童身高和 体重的变异程度。
CV = s ×100% = 0.98 ×100% = 11.64%
x
8.42
CV = s ×100% = 3.0 ×100% = 4.14%
适用于对数正态分布或数据呈倍数变化的资料, 如血清抗体滴度、细菌计数等。
3. 几何均数
直接法: G = n X 1 × X 2 × " × X n
∑ G
=
lg −1
⎛ ⎜⎜⎝
lg X ⎞ n ⎟⎟⎠
加权法:
G
=
lg
−1
⎛ ⎜⎜⎝
∑f ∑
lg f
X
⎞ ⎟⎟⎠
3. 几何均数
例 有7名慢性肝炎患者的HBsAg滴度资料为:1:16, 1:32,1:32,1:64,1:64,1:128,1:512。试求 其几何均数。
2. 四分位数间距
四分位数间距:是上四分位数(QU= P75)与下四 分位数(QL= P25)之差。
该值越大,说明资料的变异程度越大。 计算公式为:
QR = Q3 − Q1
P25
P75
2. 四分位数间距
四分位数间距比极差稳定 常与中位数一起使用 用于描述偏态分布资料、两端无确切值资
G = 7 16× 32× 32× 64× 64×128× 512 = 64
G
=
lg−1
⎛ ⎜⎝
lg16
+
lg
32
+
lg
32
+
lg
64 7
+
lg
64
+
lg128
+
lg
512
⎞ ⎟⎠
= lg−11.8062 = 64
例 某地对60名麻疹易感儿童接种麻疹减毒活疫苗,接种 后一个月测得其血清血凝抑制抗体的效价如下表。
x
72.4
例 某地不同年龄女童的身高资料如下,比较不同 年龄女童身高的变异程度。
表 某地不同年龄女童身高(cm)的变异程度
年龄组 1-2月
例数 100
均数 56.3
标准差 2.1
变异系数 (%)
3.7
5-6月 120
66.5
2.2
3.3
3-3.5岁 300
97.2
3.1
3.2
5-5.5岁 500 107.8
3. 标准差
离均差--每一个观察值与均数之差,即
X-μ ,反映所有观察值的变异程度。 离均差平方和--SS =∑(X-μ)2
方差variance--离均差平方和的平均值, 又称均方(MS)。
σ 2 = ∑( X − μ )2 N
3. 标准差
标准差(standard deviation): – 方差的正平方根,其单位与原单位相同。最常 用 Æ(正态分布或近似正态分布资料)
X =∑X
n = 112.9 + 99.5 + " 116.5 cm = 107.39cm
11

某研究者随机抽取温州市正常成年男子120名,其红细 胞计数值(×1012/L)的频数表资料如下,求均数。
表 1 某地 120 名正常成年男子红细胞频数表
组 段 频数 频率(%) 累积频数 累积频率(%)
相关文档
最新文档