第2章 数值变量资料的统计分析_PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
25
例:设甲、乙、丙三人,采每人的耳垂血,然后作红 细胞计数,每人数5个计数盘,得结果如下(万/mm3)
盘编号 甲 乙 丙
1
560 520 510 580
560
2 540 510 505 540
3 500 500 500 520
统计分析
21
离散程度指标
• 1. 极差(range,R )
• 2. 四分位数间距

(interquantile range,IQR )
• 3. 方差(variance, S 2)
• 4. 标准差(standard deviation,S )
• 5. 变异系数
(coefficient of variation,CV)
4.76 4.88 4.64 3.97 4.08 4.58 4.31 4.05 4.16 5.04 5.15 4.50
4.62 4.73 4.47 4.58 4.70 4.81 4.55 4.28 4.78 4.51 4.63 4.36
4.48 4.59 5.09 5.20 5.32 5.05 4.41 4.52 4.64 4.75 4.49 4.22
统计分析
15
例 有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64,1:128,求平均抗体效价。
7份血清的平均抗体效价为: 1:16
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
16
3、 中位数
(一)中位数(median)
第一节 数值变量资料的统计描述
一、数值变量资料的频数分布 二、平均水平指标 三、离散程度指标
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
1
例. 某地用随机抽样方法检查了140名成年男子的红细胞数 (x1012/L),检查结果见下表。
4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18 4.92 4.27 4.77 4.88
5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 5.51 5.24 4.98
4.33 4.83 4.56 5.44 4.79 4.91 4.26 4.38 4.87 4.99 5.60 4.46
4.95 5.07 4.80 5.30 4.65 4.77 4.50 5.37 5.49 5.22 4.58 5.07
4 5 合计
460 490 495 500 480
440 480 490 460
2500 2500 2500 440
均数 500 500 500 420
甲 乙丙
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
26
1、全距(Range)
• 全距,用R表示:即一组变量值最大值与最 小值之差,亦称极差。对于上例中数据,有
n1,0X75 76 72 69, 8 X272 572 6 72 248984
S489846982/105.41 (次 /分 ) 101
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
32
例. 利用表中的数据和频数表法计算标准差。
x 血糖(mol/L)组段 频数( fi ) 组中值( Xi i)
4.81 4.54 3.82 4.01 4.89 4.62 5.12 4.85 4.59 5.08 4.82 4.93
5.05 4.40 4.14 5.01 4.37 5.24 4.60 4.71 4.82 4.94 5.05 4.79
4.52 4.64 4.37 4.87 4.60 4.72 4.83 5.33 4.68 4.80 4.15 4.65
公 式:
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
30
利用频数表计算标准差的公式为:
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
31
例 对以下数据: 75, 76, 72, 69, 66, 72, 57, 68, 71, 72, 用直接法计算标准差。
4.95 5.07 4.80 5.30 4.65 4.77 4.50 5.37 5.49 5.22 4.58 5.07
4.81 4.54 3.82 4.01 4.89 4.62 5.12 4.85 4.59 5.08 4.82 4.93
5.05 4.40 4.14 5.01 4.37 5.24 4.60 4.71 4.82 4.94 5.05 4.79
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
10
(2)加权法(利用频数表)
公式 :
X f1 X 1 f2 X 2 f3 X 3 fkX k fX
f1 f2 f3 fk
f
k:频数表的组段数
f :频数
xi :组中值,其中i=1,2,……k。
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
4.71 5.21 4.94 4.68 5.17 4.91 5.02 4.76
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
12
表 某地140名正常男子红细胞数的频数分布表
红细胞数
3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.8~6.00
统计分析
19
例 7名正常人的血压(舒张压) 测定值(mmHg)为:72, 75,76,82,77,81 ,86,求中位数。
从小到大排列:72,75,76,77,81,82 ,86 M=77
若又观察了一个人的血压,为87(mmHg) ,此时M=?
M=(77+81)/2=79(mmHg)
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
R=5.95–3.82 =2.13(x1012/L)
R越大,变异度越大;R越小,变异度越小。
简单,但仅利用了两端点值,稳定性差。
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
27
4.标准差(standard deviation)
• 样本标准差用 表示 ,其度量单位与均数 一致,所以最常用。
3.60~
3 3.70
f xi f i ix i
11.10
f
i
x
2 i
41.07
3.80~
3 3.90
11.70
45.63
4.00~
8 4.10
32.80
134.48
4.20~
23 4.30
98.90
425.27
4.40~
24 4.50
108.00
486.00
4.60~
25 4.70
117.50
552.25
4.80~
20 4.90
98.00
480.20
5.00~
12 5.10
61.20
312.12
5.20~
10 5.30
53.00
280.90
5.40~5.60
4 5.50
22.00
Biblioteka Baidu121.00
合计
132
614.20
2878.92
组中值(xi)
3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90
频数(f)
2 6 11 25 32 27 17 13 4 2 1
频率(%)
1.4 4.3 7.9 17.9 22.9 19.3 12.1 9.3 2.9 1.4 0.7
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
8
1、算术均数
算术均数:简称均数(mean) • 定义:是一组变量值之和除以变量值个数所得的
商。 • 总体均数:μ
样本均数: x
均数适用于资料呈对称分布,尤其是正态分布或 近似正态分布的资料。
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
9
计算方法
正偏态
负偏态
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的 返回
统计分析
7
• 1. 算术均数(arithmetic mean, x )
• 2. 几何均数(geometric mean ,G )
• 3. 中位数(median,M)
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
14
几何均数计算公式:(1)直接法
Gn X1X2 Xn
1 lgGn(lgX1lgX2
Glg1 lgX
n
计算几何均数的 观察值应大于零
lgXn)
lgX
n
几何均数:
变量对数值的 算术均数的反对数。
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
•定义:用符号M表示,中位数是把一组观察值,按从 小到大顺序排列,位置居中的数值(n为奇数)或位置 居中的两个数值的均值(n为偶数)。
其适用情况: 适合各种类型的资料,尤其适合于 ①当资料呈明显的偏态分布; ②资料一端或两端无确定数值(如大于或小于某数值);
③资料的分布情况不清楚。
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
13
2、 几何均数(geometric mean)
• 定义:用G表示,是将n个观察值x的乘积再开n次 方的方根(或各观察值x对数值均值的反对数)。
适用条件:
1.当一组观察值为非对称分布、其差距相差较大;
2.呈倍数关系的等比资料或对数正态分布(正偏态) 资料(如抗体滴度资料);
3.不能有0;不能同时有正、负值。
4.52 4.64 4.37 4.87 4.60 4.72 4.83 5.33 4.68 4.80 4.15 4.65
4.76 4.88 4.64 3.97 4.08 4.58 4.31 4.05 4.16 5.04 5.15 4.50
4.62 4.73 4.47 4.58 4.70 4.81 4.55 4.28 4.78 4.51 4.63 4.36
5.00 4.72 4.47 5.34 4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50
5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 5.51 5.24 4.98
4.33 4.83 4.56 5.44 4.79 4.91 4.26 4.38 4.87 4.99 5.60 4.46
4.48 4.59 5.09 5.20 5.32 5.05 4.41 4.52 4.64 4.75 4.49 4.22
4.71 5.21 4.94 4.68 5.17 4.91 5.02 4.76
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
2
频数表的编制步骤: •求极差 •决定组数、组段和组距 •列出组段: •划记计数
(1)直接计算法
公式 : XX 1X2 Xn X
n
n
例. 有9名健康成人的空腹胆固醇测定值(mol/L)为:5.61,
3.96,3.67,4.99,4.24,5.06,5.20,4.79,5.93,
求算术平均数。
x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9 =4.83(mol/L)
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
3
(1)对称分布 :
若各组段的频数以频数最多组段为中心,左右两侧大 体对称,就认为该资料是对称分布
卫生学(第7版) · 第九章 数值变量资料的统计分析7版) · 第九章 数值变量资料的
统计分析
6
(2)偏态分布 :
统计分析
11
例. 某地用随机抽样方法检查了140名成年男子的红细胞数 (x1012/L),检查结果见下表。
4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18 4.92 4.27 4.77 4.88
5.00 4.72 4.47 5.34 4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50
相关文档
最新文档