卫生统计学第二章 定量资料的统计描述 ppt课件
合集下载
研究生医学统计学-定量资料的统计描述课件
集中趋势指标
平均数(average)
• 定义:描述一组性质相同的观察值的集中趋势、 中心位置或平均水平的指标
• 平均数是一组数据典型或有代表性的值。
• 常用平均数的种类有: –算术均数 –几何均数 –中位数 – 众数* – 调和均数*
一、算术均数
(arithmetic mean)
1.适用资料:算术均数简称为均数 (mean),适用于正态分布或近 似正态分布资料。
6
6.0
82.0~
83.0
0
0
84.0~86.0 85.0
合计
—
1
1.0
100 100.0
累计频率% 3.0 8.0 16.0 27.0 52.0 76.0 86.0 93.0 99.0
99.0 频数表的概念
100.0 —
人数
100名健康女大学生血清总蛋白含量的频 数分布
25 20 15 10 5 0
x甲30kg
• 乙组 24 27 30 33 36
x乙30kg
• 丙组 26 29 30 31 34 • R甲=8,R乙=12,R丙=8
x丙30kg
二、四分位数间距
(quartile interval)
1.适用资料:⑴偏态分布资料,⑵资料分布 的末端无确切数据的开口资料
2.符号:Q 3.计算:Q= Qu- QL =P75-P25, Qu上四分位
83)
36.0(小
时)
P95
48
12(164 12
95%
146)
57.8(小
时)
M P50
二、几何均数
(geometric mean)
1.意义:n个数值的乘积开n次方即为这n
定量资料统计描述和正态分布ppt课件
单侧
只有 只有 下限 上限 P5 P95
双侧 范围
P2.5-P97.5
99
P1 P99
P0.5-P99.5
四、变异系数 变异系数(coefficient of variation,简 记 为 CV), 又 称 为 离 散 系 数 (coefficient of dispersion)
计算方法: CV S 100%
X
应用:
a.比较度量衡单位不同的多组资料 的变异程度。
b. 比较均数相差悬殊的多组 资料 的 变异程度(如舒张压和收缩压 ; 儿 童身高与成人身高) 。
二、几何均数(geometric mean) 计算方法 1.直接法:适用于样本量较小的计
量资料。
或
2.加权法:适用于样本量较大的计量 资料,如频数表资料。
几何均数的应用注意事项
1)常用于等比资料或对数正态分 布资料,如血清抗体滴度、细菌计 数等。
2)观察值中若有0或负值,则不宜 直接使用几何均数。
位数
一、算术均数
算术均数简称均数(mean),描述一组 同质资料的平均水平。
总体均数:
样本均数:
计算方法 1. 直接计算法:适用于样本量较小
的计量资料。
2.频数表法:适用于样本量较大的计量 资料。
均数的应用: 均数适用于描述单峰对称分布,特
别是正态或近似正态分布资料的集中 趋势。
极端值(outlier)
中位数应用:
1.中位数可用于各种分布的资料。
2.中位数不受极端值的影响,因此, 实际工作中主要用于:
(1)偏态分布或不明确分布资 料
(2)端点无确切值的资料
(3)有特大或特小值的资料
第三节 离散趋势的描述
卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)
11111,11111,11111 中位数是50%位的数值,其为百分位数的特殊形式。
●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
估计的方法: 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算 (双侧) 95% 正常值(医学参考值)范围公式:
(x1.96 · S,x1.96 · S )
即(x±1.96 · S ) 例:
1.96 × 3.79 )
即(156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
96 ·S,x 1. Q = Qu 一 Ql
单侧 上界: P 95
单侧 下界: P 5
31
习题:
1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不
变
2.用均数和标准差可全面描述:
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
19
相关概念:离均差、离均差平方和、方差(2 S2 ) 标准差的符号: S
●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
估计的方法: 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算 (双侧) 95% 正常值(医学参考值)范围公式:
(x1.96 · S,x1.96 · S )
即(x±1.96 · S ) 例:
1.96 × 3.79 )
即(156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
96 ·S,x 1. Q = Qu 一 Ql
单侧 上界: P 95
单侧 下界: P 5
31
习题:
1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不
变
2.用均数和标准差可全面描述:
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
19
相关概念:离均差、离均差平方和、方差(2 S2 ) 标准差的符号: S
卫生统计学02统计描述 PPT课件
变异程度
R =最大值-最小值
R 甲=100-60=40
R 乙=90-70=20
R 丙=100-60=40
医学统计学
12
第三节
二、离均差平方和
变异程度
SS ( X X )
2
SS甲=(60-80)2+(70-80)2+(80-80)2+(90-80)2+(100-80)2 = 1000 SS乙=(70-80)2+(75-80)2+(80-80)2+(85-80)2+(90-80)2 = 250 SS丙=(60-80)2+(75-80)2+(80-80)2+(85-80)2+(100-80)2 = 850
中位 145X 50%=72.5
M =12+6(145×50%—63)/40=13.4
医学统计学 9
第二节
三、中位数与百分位数
平均水平
百分位数计算法: 中位数实质上是50%位数,所以在中位数计算公式中用 N×50%。如果我们把50%换成别的百分数,且把相应的L、i、 fm、fc 都作相应的变换,则可求出各百分位数。 P25 =6+6 (145×25%-18) / 45= 8.43 P75 =18+6 (145×75%-103) / 30= 19.15 P5 =0+6(145×5%-0)/ 18=2.42 P95 =24+6 (145×95%-133) / 6= 28.75
医学统计学
23
The class is over 谢谢!
医学统计学
24
医学统计学
5
第一节 频数表与直方图
40
《医学统计学》第二章定量数据的统计描述
630
累积频数
(3) 27
196 363 457 538 580 608 622 626 629 630
-
累积频率(%)
(4) 4.29 31.11 57.62 72.54 85.40 92.06 96.51 98.73 99.37 99.84 100.00
资料如表,试计算其中位数。
某地630名正常女性血清甘油三酯含量(mmol/L)
甘油三酯(mmol/L)
(1) 0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~ 3.10~
合计
频数
(2) 27 169 167 94 81 42 28 14 4 3 1
练习
例 8名食物中毒患者的潜伏期分别为1,4,3,3,2,5,8,16小时,
求中位数。
n=8,为偶数
M
1
2
(
x (
8 2
)
x (
8
1)
)
2
1 2 ( x4
x5 )
1 3 4
2
3.5(小时)
例 某传染病11名患者的潜伏期(天)分别为1,3,2,2,3,7,5,6,
4,7,9,求中位数。
n=11,为奇数 M xn1 2 x(111) x6 4(天 ) 2
偏态分布
正偏态 负偏态
正偏态:集中位置偏向数值小的一侧 负偏态:集中位置偏向数值大的一侧
医学统计学(第7版)
正 态 分 布
医学统计学(第7版)
正偏态
集中位置偏向 数值小的一侧
负偏态
集中位置偏向 数值大的一侧
(麻疹年龄分布)
(肺癌年龄分布)
累积频数
(3) 27
196 363 457 538 580 608 622 626 629 630
-
累积频率(%)
(4) 4.29 31.11 57.62 72.54 85.40 92.06 96.51 98.73 99.37 99.84 100.00
资料如表,试计算其中位数。
某地630名正常女性血清甘油三酯含量(mmol/L)
甘油三酯(mmol/L)
(1) 0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~ 3.10~
合计
频数
(2) 27 169 167 94 81 42 28 14 4 3 1
练习
例 8名食物中毒患者的潜伏期分别为1,4,3,3,2,5,8,16小时,
求中位数。
n=8,为偶数
M
1
2
(
x (
8 2
)
x (
8
1)
)
2
1 2 ( x4
x5 )
1 3 4
2
3.5(小时)
例 某传染病11名患者的潜伏期(天)分别为1,3,2,2,3,7,5,6,
4,7,9,求中位数。
n=11,为奇数 M xn1 2 x(111) x6 4(天 ) 2
偏态分布
正偏态 负偏态
正偏态:集中位置偏向数值小的一侧 负偏态:集中位置偏向数值大的一侧
医学统计学(第7版)
正 态 分 布
医学统计学(第7版)
正偏态
集中位置偏向 数值小的一侧
负偏态
集中位置偏向 数值大的一侧
(麻疹年龄分布)
(肺癌年龄分布)
医学统计课件人卫6版 第二章定量数据的统计描述ppt课件
直方图
P9图2-1,
更直观的反映频数分布的类型。
2019/4/16
西安医学院公共卫生系
频数 12 10 8 6 4 2 0 1 1 2 3 4 4
频数分布直方图 10
9 6 3 2 0
1 10
9
直方图
2019/4/16 西安医学院公共卫生系
2.频数分布的两个特征:集中趋势、离散趋势 3.频数分布的类型:对称分布 偏态分布 正偏态 负偏态 不同类型的分布,应采用相应的统计分析方法 4.频数表的用途: ·作为陈述资料的形式,反映分布特征、分布类 型; ·便于以后的计算指标及统计分析处理; ·便于发现可疑值,及时查正; ·当样本含量较大时,可用各组段的频率作为概 率的估计值。
3.90 4.10 4.30
5.90
2 6 11
1
1.4 4.3 7.9
0.7
2019/4/16
西安医学院公共卫生系
1.频数表的编制: ☆ 找最大值、最小值,求极差 ☆ 按极差大小决定组段数、组段、组距 一般设10-15个组段 常用极差的1/10取整作组距 要求:第一组段包括最小值 最后一个组段包括最大值 每个组段的起点称"下限"(low limit) 终点称"上限"(upper limit) 对于连续性资料,各组段从下限开始, 不包括本组段上限。 ※最末一个组段应同时写出其下限和上限。 ☆ 列表划记,求频数(f)
1
2019/4/16 西安医学院公共卫生系
(2)应用于: · 等比资料如抗体的平均滴度、平均发展 速度人口的几何增长(增长速度);或用于 对数正态分布资料。 **注意 · 观察值不能有零 · 观察值不能同时有正值和负值 同一组资料几何均数小于均数
卫生统计学-定量资料的统计描述精品PPT课件
集中趋势:均数、几何均数、中位数
• 统计指标
离散趋势:极差、方差、标准差、四 分位间距等
定量资料的统计描述---集中趋势
✓ 算数均数 (mean)
适用条件:对称分布,特别是正态或者近似正态分 布的资料。
✓ 几何均数 (geometric mean)
适用条件:偏态分布,但是经过对数变换之后呈正 态或近似正态分布的资料。
SPSS操作过程
SPSS中实现定量资料统计 描述的四个常用过程
Frequencies过程 Descriptives过程 Explore过程 Ratio过程
Frequencies过程:
• 涉及的统计指标比Descriptives过程全 面,并给出常用统计图。
• 还可以对分类资料以及不服从正态分 布的资料进行描述
1. 均数与中位数的比较 2. 频数表 3. 直方图,P-P图,Q-Q图 4. 正态性检验:单峰对称
正态性检验 -explore命令
操作步骤: Analyze-descriptive-explore -plots histogram
normality plots with test
2、Q-Q图
做法:
1、Frequencies 过程的对话框与选择项
• (1)Frequencies 过程的对话框
①Statistics对话框:
②charts对话框
③format对话框
• 练习: • 1、1985年某省农村120例6-7岁正常男童胸
围测量结果。
• Trunc(cc/1.5)*1.5
• 2、某市1974年为了了解该地居民发汞的基 础水平,为汞污染的环境监测积累资料, 调查了留住该市一年以上,无明显肝肾疾 病,无汞作业接触史的居民238人的发汞含 量(umol/kg),试做频数表分析。
卫生统计学第7版-方积乾主编-课件第二章-定量资料的统计描述学习资料
5
0
0
1
2
3
4
5
>5
产前检查次数
图2-1 1998年某地96名孕妇产前检查次数频率分布
2020/4/12
5
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
2020/4/12
6
频率表的编制步骤如下:
2020/4/12
18
2.频率表法:当资料中相同变量值的个数f(即频数) 较多时,可通过频率表法计算几何均数,公式为
Glg1flfgX
表2-4 52例慢性肝炎患者的 HBsAg滴度资料
2020/4/12
19
本例Σf lgX= 108.06977 , Σf=52,代入公式得 Glg 1 10 .086 97 lg 1 7 2.078 13 1 .794705 52
本例
XX31.263.9075(U/L) n8
2020/4/12
பைடு நூலகம்14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
XfX0 fX0 f n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 XfX0 222818.57(μmmo/L) f 120
累计频率找出M所在的组段,然后按下式计算。
in ML fm(2fL)
式中L为中位数所在组段的下限,i为该组段的组距,fm为 该组段的频数,ΣfL为小于L的各组段累计频数。
例2-8 50例链球菌咽颊炎患者的潜伏期(小时)如表2-5, 试计算潜伏期的中位数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本例
XX31.263.9075(U/L) n8
2020/4/26
14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
XfX0 fX0 f n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 XfX0 222818.57(μmmo/L) f 120
3
一、离散型定量变量的频率分布
例2-1 1998年某山区96名孕妇产前检查次数资料,编制频率表。
表2-1 1998年某地96名孕妇产前检查次数频率分布
2020/4/26
4
离散型定量变量的频率分布图可用直条图表达,以等 宽直条的高度表示各组频率的多少
频率(%)
30
25
20
15
10
5
0
0
1
2
3
4
5
>5
2020/4/26
2
统计描述是用统计图表、统计指标来描述资料的分布 规律及其数量特征的。
第一节 频率分布表与频率分布图
医学研究资料变量值的个数较多时,对个变量值出现的 频数或频率列表即为频数分布表或频率分布表(frequency distribution table),简称频数表或频率表。
2020/4/26
1.直接法
G nX 1X 2X 3X n
对数的形式为 G l g 1 lg X 1 lg X 2 lg X n l g 1 lg X
n
n
2020/4/26
17
例2-5 7名慢性迁延型肝炎患者的HBsAg滴度资料为: 1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。
2020/4/26
18
2.频率表法:当资料中相同变量值的个数f(即频数) 较多时,可通过频率表法计算几何均数,公式为
Glg1flfgX
表2-4 52例慢性肝炎患者的 HBsAg滴度资料
4. 列表 清点各组的频数,计算频率、累积频率数和累计频率。
2020/4/26
7
表2-2 120名正常成年男子血清铁含量(μmmo/L)频率分布
2020/4/26
8
概率密度(%)
概率密度(%)
12
10
12
8
10
6
8
4
6
4
26~10~8~ 1120~~ 121~4~14~161~6~ 1188~~20~20~22~ 2224~~ 262~4~28~26~ 28~
本例先求平均滴度的倒数
G 71 3 6 3 2 6 2 6 4 1 4 2 58 1 62 4
G l 1 g l1 g l6 3 g l2 3 g l2 6 g l4 6 g l4 1 g l 2 5 g 8 1 l 1 g 1 2 .8 0 6
7
7名慢性迁延型肝炎患者的HBsAg滴度几何均数为1:64。
2. 确定组段数与组距(class interval) 组段数一般取10组左右。组距 用i表示,组距=极差/组段数,本例拟分10组,i=22.22/10=2.22,一般取靠 近的整数作为组距,本例取i=2。
3. 确定各组段的上、下限 每个组段的起点称为组段的下限,终点称 为组段的上限。第一组段要包括最小值,其下限取小于或等于最小值的 整数,本例取6最为第一组段的下限(也可取7),最后一个组段要包括 最大值。注意各组段不能重合,每组段只写出下限,如6~,8~,最后 一个组段可包括其上限值,如本例28~30。
如用直接法计算, X =18.61(μmmo/L)
2020/4/26
15
表2-3 频数表法计算均数
2020/4/26
16
二、几何均数(geometric mean,G)
几何均数使用于原始变量不呈对称分布,但对变量经对数 转换后呈对称分布的资料,又称对数正态分布资料。常见于 正偏态分布资料,如抗体滴度,某些传染病的潜伏期,细菌 计数等。计算公式亦可用直接法和频数表法。
血清铁含量(μmol/L)
血清铁含量(μmol/L)
图2-2 120名健康成年男子血清铁含量(μmol/L)分布
2020/4/26
9
频数
30 25 20 15 10 5 0
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μmol/L)
2-2 120名健康成年男子血清铁含量(μmmo/L)分布
2020/4/26
10
三、频率分布表(图)的用途
1.揭示资料的分布类型
2020/4/26
11
正偏态(右偏态)
负偏态(左偏态)
2.观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理
2020/4/26
12
第二节 描述集中趋势的统计指标
医学定量资料中,描述集中趋势的统计指标主要有 算术均数、几何均数和中位数。 一、算术均数(arithmetic mean)
产前检查次数
图2-1 1998年某地96名孕妇产前检查次数频率分布
2020/4/26
5
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
2020/4/26
6
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
第二章 定量资料 的统计描述
2020/4/26
1
[学习要求] 了解:应用SAS程序编制频率表的方法和means、 univariate过程对定量资料的描述。 熟悉:定量资料频率表的编制方法和用途。 掌握:算术均数、几何均数、中位数的计算方法和使 用条件;四分位间距、方差、标准差、变异系数的计 算方法和使用条件。
简称均数。均数适用于对称分布或近似对称分布的资
料。习惯上以希腊字母 表示总体均数(population
mean),以表示样本均数X (sample mean)。常用计 算方法有直接法和频率表法(亦称加权法)。
2020/4/26
13
1.直接法
X X n
例2-3 测得8至正常大白鼠血清总酸性磷酸酶(TACP) 含量 (U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试 求其算术均数。
XX31.263.9075(U/L) n8
2020/4/26
14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
XfX0 fX0 f n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 XfX0 222818.57(μmmo/L) f 120
3
一、离散型定量变量的频率分布
例2-1 1998年某山区96名孕妇产前检查次数资料,编制频率表。
表2-1 1998年某地96名孕妇产前检查次数频率分布
2020/4/26
4
离散型定量变量的频率分布图可用直条图表达,以等 宽直条的高度表示各组频率的多少
频率(%)
30
25
20
15
10
5
0
0
1
2
3
4
5
>5
2020/4/26
2
统计描述是用统计图表、统计指标来描述资料的分布 规律及其数量特征的。
第一节 频率分布表与频率分布图
医学研究资料变量值的个数较多时,对个变量值出现的 频数或频率列表即为频数分布表或频率分布表(frequency distribution table),简称频数表或频率表。
2020/4/26
1.直接法
G nX 1X 2X 3X n
对数的形式为 G l g 1 lg X 1 lg X 2 lg X n l g 1 lg X
n
n
2020/4/26
17
例2-5 7名慢性迁延型肝炎患者的HBsAg滴度资料为: 1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。
2020/4/26
18
2.频率表法:当资料中相同变量值的个数f(即频数) 较多时,可通过频率表法计算几何均数,公式为
Glg1flfgX
表2-4 52例慢性肝炎患者的 HBsAg滴度资料
4. 列表 清点各组的频数,计算频率、累积频率数和累计频率。
2020/4/26
7
表2-2 120名正常成年男子血清铁含量(μmmo/L)频率分布
2020/4/26
8
概率密度(%)
概率密度(%)
12
10
12
8
10
6
8
4
6
4
26~10~8~ 1120~~ 121~4~14~161~6~ 1188~~20~20~22~ 2224~~ 262~4~28~26~ 28~
本例先求平均滴度的倒数
G 71 3 6 3 2 6 2 6 4 1 4 2 58 1 62 4
G l 1 g l1 g l6 3 g l2 3 g l2 6 g l4 6 g l4 1 g l 2 5 g 8 1 l 1 g 1 2 .8 0 6
7
7名慢性迁延型肝炎患者的HBsAg滴度几何均数为1:64。
2. 确定组段数与组距(class interval) 组段数一般取10组左右。组距 用i表示,组距=极差/组段数,本例拟分10组,i=22.22/10=2.22,一般取靠 近的整数作为组距,本例取i=2。
3. 确定各组段的上、下限 每个组段的起点称为组段的下限,终点称 为组段的上限。第一组段要包括最小值,其下限取小于或等于最小值的 整数,本例取6最为第一组段的下限(也可取7),最后一个组段要包括 最大值。注意各组段不能重合,每组段只写出下限,如6~,8~,最后 一个组段可包括其上限值,如本例28~30。
如用直接法计算, X =18.61(μmmo/L)
2020/4/26
15
表2-3 频数表法计算均数
2020/4/26
16
二、几何均数(geometric mean,G)
几何均数使用于原始变量不呈对称分布,但对变量经对数 转换后呈对称分布的资料,又称对数正态分布资料。常见于 正偏态分布资料,如抗体滴度,某些传染病的潜伏期,细菌 计数等。计算公式亦可用直接法和频数表法。
血清铁含量(μmol/L)
血清铁含量(μmol/L)
图2-2 120名健康成年男子血清铁含量(μmol/L)分布
2020/4/26
9
频数
30 25 20 15 10 5 0
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μmol/L)
2-2 120名健康成年男子血清铁含量(μmmo/L)分布
2020/4/26
10
三、频率分布表(图)的用途
1.揭示资料的分布类型
2020/4/26
11
正偏态(右偏态)
负偏态(左偏态)
2.观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理
2020/4/26
12
第二节 描述集中趋势的统计指标
医学定量资料中,描述集中趋势的统计指标主要有 算术均数、几何均数和中位数。 一、算术均数(arithmetic mean)
产前检查次数
图2-1 1998年某地96名孕妇产前检查次数频率分布
2020/4/26
5
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
2020/4/26
6
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
第二章 定量资料 的统计描述
2020/4/26
1
[学习要求] 了解:应用SAS程序编制频率表的方法和means、 univariate过程对定量资料的描述。 熟悉:定量资料频率表的编制方法和用途。 掌握:算术均数、几何均数、中位数的计算方法和使 用条件;四分位间距、方差、标准差、变异系数的计 算方法和使用条件。
简称均数。均数适用于对称分布或近似对称分布的资
料。习惯上以希腊字母 表示总体均数(population
mean),以表示样本均数X (sample mean)。常用计 算方法有直接法和频率表法(亦称加权法)。
2020/4/26
13
1.直接法
X X n
例2-3 测得8至正常大白鼠血清总酸性磷酸酶(TACP) 含量 (U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试 求其算术均数。