集中趋势和离散趋势的描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n +1 ) 2
1 M = X n +X n ( +1) 2 (2) 2

7名病人患某病的潜伏期分别为 2,3,4,5,6,9,16 求其中位数。 求其中位数。 本例n=7,为奇数 本例n=7,为奇数 天,
M=X
7 +1 ( ) 2
= X 4 = 5(天)
例 8名患者食物中毒的潜伏期分别为 1,2,2,3,5,8,15,24 15, 求其中位数。 求其中位数。 本例n 本例n=8, 为偶数 小时, 小时,
12 P25 = 36 + (118 × 25% − 21) = 39.2 (天) 32
12 P75 = 60 + (118 × 75% − 77) = 67.7 (天) 18
离散变量百分位数
产后出血的产妇中平均有几次人工流产史? 例 产后出血的产妇中平均有几次人工流产史?
Valid Frequency
百分数: 为整数: (1)第5百分数:n=120, ×5% = 6,为整数: ) 百分数 , 120
1 1 P5 = X ( 6 ) + X ( 7 ) = (3 + 4) = 3.5( 天 ) 2 2
住院天数: 住院天数: 2 2 2 3 3 4 4 5 ⋯ 40 1 序 (2)第99百分位数: 99百分位数: 百分位数
40 42 45 号:1 2 3 4 5 6 7 8 9 ⋯ 117 118 119 120
120 × 99% = 118.8
带有小数,故取整后 带有小数,故取整后trunc(118.8)= 118 )
P = X (trunc(118.8)+1) = X (119) = 42(天) 99
2.频数表法
例 某地118名链球菌咽喉炎患者的潜伏期频数表,分 某地118名链球菌咽喉炎患者的潜伏期频数表, 118名链球菌咽喉炎患者的潜伏期频数表 别求中位数及第25 25、 75百分位数 百分位数。 别求中位数及第25、第75百分位数。
PX = L X
iX + (nX % − Σ f L ) fX
12 118 M = P50 = 48 + ( − 53) = 51 (天) 24 2
甲 组 : 90 乙 组 : 96 丙 组 : 96
95 98 99 100 100 100 105 102 101 110 104 104
X 甲 = 100cm
X 乙 = 100cm X 丙 = 100cm
二、四分位数间距(Quartile Range) 四分位数间距( Range) 四分位数(quartile) 四分位数(quartile)就是把全部变量值分 为四部分的分位数。 为四部分的分位数。
( X − µ )2 ∑ N
σ2 =
样本方差
S2 =
( X − X )2 ∑ n −1
2.标准差 2.标准差(standard deviation, SD) 标准差 总体标准差
σ=
样本标准差

( X − µ )2 N
S=
∑(X − X )
n −1
2
样本标准差的公式还可以写成 :
(∑ X ) 2 X2 − ∑ n S= n −1
二、 几何均数(geometric mean) 几何均数( mean) 用于反映一组经对数转换后呈对称分布 的变量值在数量上的平均水平, 的变量值在数量上的平均水平,在医学研究 中常适用于免疫学的指标 中常适用于免疫学的指标。 免疫学的指标。 适用条件:适用于成等比级数的资料, 适用条件:适用于成等比级数的资料,特别 成等比级数的资料 对数正态分布资料(一种右偏态分布)。 是对数正态分布资料(一种右偏态分布)。
QR = 67.7 − 39.2 = 28.5
四分位数间距可以看成居中的一半变量值的 极差(数据两端各去除了25%的数据) 极差(数据两端各去除了25%的数据)。可表示为 25%的数据 QR=28.5(39.2~67.7)天。 天
三、方差与标准差 1.方差( 1.方差(variance)也称均方差(mean square 方差 )也称均方差( deviation),反映一组数据的平均离散水平。 ),反映一组数据的平均离散水平 ),反映一组数据的平均离散水平。 总体方差
有效观察值 (人流次数 人流次数) 人流次数 0 1 2 3 4 5 6
Total
频数
Cumulative Frequency
Cumulative Percent
(累计频数) 累计频数) 402 732 964 1082 1109 1120 1123
累计百分比 累计频率) (累计频率) 35.8 65.2 85.8 96.3 98.8 99.7 100.0
G = lg
−1
f )= ∑ f lg X ) =−1 (150.2778lglgX(2.1779) = 150.6 ( lg G = lg ( 69 ) ∑f
−1 位数 例:大鼠存活天数: 大鼠存活天数: 4,10,7,50,3,15,2,9,13,>60,>60 10, 50, 15, 13,>60, 平均存活天数? 平均存活天数? (一)中位数(median) 中位数(median) 是将n个变量值从小到大排列, 是将n个变量值从小到大排列,位置居于 中间的那个变量值。 中间的那个变量值。
适用条件: 适用条件: 1.适用于各种分布类型的资料 1.适用于各种分布类型的资料 2.特别适合大样本偏态分布资料或者 2.特别适合大样本偏态分布资料或者一端或两端 特别适合大样本偏态分布资料或者一端或两端 的资料。 无确切数值的资料 无确切数值的资料。
中位数的计算 n为奇数时
M=X
n为偶数时
(
算术均数的计算方法 (1)直接计算法
X1 + X 2 + ⋯ + X n X= = n
∑X
n
例 用直接法计算101名正常成年女子的血清总胆固醇的均数。 用直接法计算101名正常成年女子的血清总胆固醇的均数。 101名正常成年女子的血清总胆固醇的均数
2.35 4.78 3.91 4.15 3.60 4.50 3.30 4.06 4.15 4.21 3.95 4.59 4.55 3.51 3.27 4.73 5.26 4.36 3.32 3.92 4.19 4.80 4.06 4.52 4.17 5.25 4.95 5.35 3.58 2.68 3.41 3.07 3.19 5.13 3.98 3.00 4.17 3.66 4.52 4.12 3.55 4.59 3.78 5.03 3.26 4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51 2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86 4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02 3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70 4.34 4.61 3.87 3.58 3.84 3.63 3.99 4.33 4.84 4.75 3.95 5.35 4.50 3.87 4.48 3.29 4.41 2.91 3.91 3.84 3.96 5.71 4.28 3.25
利用频数表计算样本标准差的公式为: 利用频数表计算样本标准差的公式为:

S=
(∑ fX ) 2 fX 2 − ∑f
∑ f −1

计算例2 方法中101名正常成年女子的血 计算例2-1方法中101名正常成年女子的血 101
1.直接计算法 设有n个原始数据从小到大排列, 设有n个原始数据从小到大排列, 第X百分位数 的一种近似计算公式为: 的一种近似计算公式为: 当 nX % 为带有小数位时: 为带有小数位时:
PX = X [ trunc ( nX %) +1]
当 nX % 为整数时: 为整数时:
1 PX = X ( nX %) + X ( nX % +1) 2
G = 5 10 × 20 × 40 × 40 ×160 = 34.8
G = lg
−1
∑lg X ) = lg (
n
−1
lg10 + lg20 + lg40 + lg40 + lg160 ( ) = 34.8 5
(2)加权法(频数表资料) 加权法(频数表资料) 69例类风湿关节炎 RA)患者血清EBV-VCA例类风湿关节炎( 例 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG 抗体滴度的分布见表,求其平均抗体滴度。 抗体滴度的分布见表,求其平均抗体滴度。
对某医院120 120名细菌性痢疾治愈者的住院天数 例 对某医院120名细菌性痢疾治愈者的住院天数 统计,试求第5百分位数和第99百分位数。 统计,试求第5百分位数和第99百分位数。 99百分位数 住院天数: 住院天数: 2 2 2 3 3 4 4 5 ⋯ 40 1 序
40 42 45 号:1 2 3 4 5 6 7 8 9 ⋯ 117 118 119 120
QL = P25, M = P50 , QU = P75
四分位间距: 四分位间距:
QR=
P75 − P25
67. 例 已知 Q U = P 7 5 =67.7, Q L = P 2 5 =39.2, 39. 计算118名链球菌咽喉炎患者潜伏期的四分位数间距。 计算118名链球菌咽喉炎患者潜伏期的四分位数间距。 118名链球菌咽喉炎患者潜伏期的四分位数间距
2.35 + 4.78 + ⋯ + 3.91 X= = 4.03(mmol/L) 101
(2)加权法(利用频数表) 加权法(利用频数表)
f1 X 1 + f 2 X 2 + f3 X 3 + ⋯ + f k X k X= = f1 + f 2 + f3 + ⋯ + f k
∑ ∑
409.75 X = fX 101 = 4f06(mmol / L) .
一、算术均数(mean) 算术均数(mean) 简称均数,可用于反映一组呈对称分布 简称均数,可用于反映一组呈对称分布的 呈对称分布的 变量值在数量上的平均水平或者说是集中位置 的特征值。 的特征值。 适用条件:算数均数适用于对称分布 适用条件:算数均数适用于对称分布,特别 对称分布, 是正态分布资料。 正态分布资料。 资料
402 330 232 118 27 11 3 1123
第三节 离散趋势的描述
描述数据变异大小的常用统计指标: 描述数据变异大小的常用统计指标: 极差 四分位数间距 方差与标准差 变异系数
极差( 一、 极差(Range) ) 即一组变量值的最大值与最小值之差。 即一组变量值的最大值与最小值之差。 三组同龄男孩的身高值(cm) 例 三组同龄男孩的身高值(cm)
1 1 1 M = X 8 + X 8 = [ X4 + X5 ] = [3+ 5] = 4(小时) 2 ( 2) ( 2+1) 2 2
(二)百分位数(percentile) 百分位数(percentile) 百分位数是一种位置指标,用 PX 来表示。 来表示。 百分位数是一种位置指标, 一个百分位数 PX 将全部变量值分为两部分, 将全部变量值分为两部分, 在全部变量值中(不包含 PX ),有 X% 的变量 全部变量值中( ),有 值比它小,有(100-X)% 变量值比它大。 100变量值比它大。 值比它小,
2010级研究生《医学统计学》 2010级研究生《医学统计学》
第二章 计量资料的统计描述
军事预防医学系卫生统计学教研室 张玉海
第二节 集中趋势的描述
统计上使用平均数(average)这一指标体系 统计上使用平均数(average) 来描述一组变量值的集中位置 平均水平。 来描述一组变量值的集中位置或平均水平。 集中位置或 常用的平均数有: 常用的平均数有: 算术均数(mean) 算术均数(mean) 几何均数( 几何均数(geometric mean) mean) 中位数(median) 中位数(median)
几何均数的计算方法 (1)直接计算法
G = n X1 X 2 ⋯ X n
G = lg
−1
∑ (
lg X n
)
例 某地5例微丝蚴血症患者治疗七年后用间接荧 某地5 光抗体试验测得其抗体滴度倒数分别为:10,20, 光抗体试验测得其抗体滴度倒数分别为:10,20, 40,40,160,求几何均数。 40,40,160,求几何均数。
相关文档
最新文档