医学统计学 第2章精品PPT课件

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对于原始数据和频数分布表资料,分别用下列两式计算中位数。
(X n/2+X(n/2+1) )/2
M= X(n+1)/2
(n为偶数) (n为奇数)
M = LM +
iM fM
n ( 22
fL )
其中, LM :中位数所在组下限; iM :中位数所在组的组距; fM :中位数所在组的频数; fL :中位数所在组前一组的累计频数。

f
例:40名麻疹易感儿童接种麻疹疫苗后一个月,测其血凝抑 制抗体滴度,结果如表所示,求几何均数。
抗体滴度
1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512
人数 f
1 4 5 8 11 6 4 1
滴度倒数 X
4 8 16 32 64 128 256 512
lgX
0.6021 0.9031 1.2041 1.5051 1.8061 2.1072 2.4082 2.7093
G´=lg-1( f lgX )=lg-1(1 0.6021+4 0.9031+ ···+1 2.7093) n 40
=lg-1(
67.1282 40
) =48
G=1:48
(三)中位数(M)
• 适合于表达偏态资料、或分布不明的资 料的平均水平,尤其适合于表达只知数 据的个数、但部分较大或较小数据的具 体数值未准确知道的资料的平均水平。
例2-4 表2.3 107正常人的尿铅含量(g/L)的中位数计算表
含量( g/L ) (1)
0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 合计
频数f (2)
14 22 29 18 15
6 1 2 107
累计频数 f
(3)
14 36 65 83 98 104 105 107
累计频率 % (4)
累计频数 (4) 2 7 19 34 59 85 104 119 129 130
累计频率(%) (5) 1.54 5.38 14.62 26.15 45.38 65.38 80.00 91.54 99.23 100.00
二. 频数表的用途
• 可以揭示资料的分布类型和分布特征, 以便于选用相应的统计分析方法。
• 便于进一步计算指标和统计处理。 • 便于发现某些特大或特小的可疑值。
第二节 集中趋势的描述
• 三种平均数
– 算术均数 – 几何均数 – 中位数。
(一)算术均数来自百度文库x)
• 简称均数,适合于表达呈正态分布资料 的平均水平。
• 直接法:

X1+···+Xn
X
• X= n
=n
例2-2:X = 81+70+66+···+69 13
第二章 数值变量的描述性统计
• 统计图表; • 统计指标。
第一节 频数分布
一. 编制频数表的步骤
• 求极差
– R=84-57cm=27(次/分)
• 划分组段
– 确定组数:较大样本时,一般取10组左右。 – 确定组距:极差/组数=27/10=2.7≈3(次/分) – 确定各组段的上下限:上限=下限+组距
28
161
故某地正常人血铅含量95%的
13
174
单侧正常值范围的上限为 1.81
• 描述离散程度的指标:
– 极差、四分位数间距、方差、标准差及变异 系数。
一. 极差(全距,R)
• 为一组同质观察值中最大值与最小值之 差。
• 甲组 R=34-26=8 • 乙组 R=36-24=12 • 甲组数据分布较乙组集中。
优点:计算简单
缺点:
1.没有充分利用样本信息,只考虑最大值与最小 值之差异,不能反映组内其它观察值的变异度。
• 统计各组段内的数据频数,编制频数表
表2.1 130名健康成年男子脉搏(次/分)的频数分布表
脉搏组段 (1) 56~ 59~ 62~ 65~ 68~ 71~ 74~ 77~ 80~ 83~85 合计
频数 (2)
2 5 12 15 25 26 19 15 10 1 130
频率(%) (3) 1.54 3.85 9.23 11.54 19.23 20.00 14.62 11.54 7.69 0.77
2.百分位数的计算公式 对连续型变量频数表资料,按下式计算第X百分位数PX:
PX=LX+
iX(nX% fX
fL )
其中, LX :第X百分位数所在组下限; iX :第X百分位数所在组的组距; fX :第X百分位数所在组的频数; fL :第X百分位数所在组前一组的累计频数。
例 某地200例正常成人血铅含量的频数分布如表所示,请计 算出血铅含量的95%正常值范围。
=71.69(次/分)
• 加权法
• X= fX
f
例: X= 572+605+6312+···+84 1 130
=71.12(次/分)
(二)几何均数(G)
• 适用于原始数据分布不对称,但经对数 转换后呈对称分布的资料。
• G= n X1X2···Xn
• G=lg-1( lgX )
n
f lgX
G=lg-1(
2.样本含量越大,抽到较大或较小观察值的可能 性越大,则极差可能越大,因此,样本含量悬殊 时不宜用极差比较分布的离散度。
所以,一般不用极差来反映离散程度。
二. 四分位数间距(Q)
1.分位数的概念
分位数是一种位置指标,一个特定的分位数将任何一 个频数曲线下的面积分为两部分。
第1四分位数记作Q1,第2、第3四分位数,分别记作 Q2、Q3;第1百分位数,记作P1。同理,还有第2、第 3、 ···、第99百分位数,分别记作P2、P3、 ···、P99。 显然,Q1=P25、Q2=P50=M、Q3=P75
200例正常成人血铅含量的频数分布表 解:即求P95。
血铅含量
频数
累计频数
nX%=200×95%=190
(mol/L) 0~
0.24~
(1) 6 48
(2) 6 54
P95 =1.69+ 0.24 (190-188) 4
0.48~ 0.72~
43
97
36
133
=1.81 (mol/L)
0.97~ 1.21~ 1.45~
13.08 33.64 60.75 77.57 91.59 97.20 98.13 100.00
4
M=8+
(107/2 - 36) = 10.41(g/L)
29
第三节 离散程度的描述
• 例:设有三组同年龄、同性别儿童体重 (kg)数据如下:
• 甲组 26 28 30 32 34 • 乙组 24 27 30 33 36 • 丙组 26 29 30 31 34
相关文档
最新文档