2018精选版卫生统计学第7版 方积乾主编 课件第二章 定量资料的统计描述-精心整理
最新统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案资料
第2章 定量资料的统计描述案例2-1(P27)答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:25507523.5(23825%20) 4.7(mol/kg)6625.5(23850%86) 6.6(mol/kg)6027.5(23875%146)8.9(mol/kg)48(%)x x L x iP L n x f f P u P u P u =+?==+?==+?==+?S离散程度指标:四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,思考与练习(P31)1.答:(1)某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布Group Frequency Percent Cumulative Percent49.0- 1 .8 .850.0- 4 3.3 4.251.0- 8 6.7 10.852.0- 6 5.0 15.853.0- 19 15.8 31.754.0- 18 15.0 46.755.0- 14 11.7 58.356.0- 26 21.7 80.057.0- 10 8.3 88.358.0- 9 7.5 95.859.0- 4 3.3 99.261.0-62.0 1 .8 100.0Total 120 100.0(2)(3) 利用频数分布表数据计算均数和标准差0149.5161.56623.01112055.19(cm)fX X f∑=∑⋯⨯++⨯==⋯++=(4)………..S 2.33(cm)=255075153.0(12025%19)53.58(cm)19155.0(12050%56)55.29(cm)14156.0(12075%70)56.77((cm)26%)x x L x i P L n f f P x P P ==+?==+?==+?=+?S2.答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)3.答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案
第2章 定量资料的统计描述案例2-1(P27)答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:25507523.5(23825%20) 4.7(mol/kg)6625.5(23850%86) 6.6(mol/kg)6027.5(23875%146)8.9(mol/kg)48(%)x xL xiP L n x f f P u P u P u离散程度指标:四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,思考与练习(P31)1.答:(1)某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布(2)Descriptive StatisticsN Range Min Max Mean Std. Deviation 胸围120 12.7 49.1 61.8 55.120 2.3188(3) 利用频数分布表数据计算均数和标准差0149.5161.56623.01112055.19(cm)fX X f∑=∑⋯⨯++⨯==⋯++=(4)………..S 2.33(cm)=255075153.0(12025%19)53.58(cm)19155.0(12050%56)55.29(cm)14156.0(12075%70)56.77((cm)26%)x x L xiP L n f f P x P P2.答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)3.答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)
五、医学正常值范围的估计
定义:又称参考值范围,是指特定健康人群的解剖、 生理、生化等各种数据的波动范围。习惯上是确定包 括95%的人的界值。
单双侧:根据指标的实际用途,有的指标有上下界值, 过高过低均属异常;某些指标过高为异常,只需确定 上限;某些指标过低为异常,只需确定下限。
估计的方法: 1、正态分布法
计五算、:医C学V(156.41 cm , 171.27 cm ) =10107名3.18岁女大学生身高均数的计算
频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。 应用:原始数据分布不对称,经对数转换后呈对称分布的资料。
29
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
32
思考题:
1976年美国8岁男孩的平均身高 为146厘米,标准差为8厘米,估计 在该研究中有%多少的男孩平均身 高在138与154之间?又有多少在
130到162之间?
33
4
100名18岁女大学生身高均数的计算
身高组段 频数 f 组中值 X
f·X
(1)
(2)
(3)
(4)
154~
2
155
310
156~
4
157
628
158~
11
159
1749
160~
13
161
2093
162~
22
163
3586
164~
19
165
3135
166~
15
167
2505
168~
9
169
1521
《定量资料统计描述》PPT课件
病例数
频数
人数
25
20
正态分布:中间高、
15
两边低、左右对称
10
5
0
0.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90
血清甘油三酯(mmol/L)
图2-1 160名正常成年女子的血清甘油三酯的频数分布图
正偏态分布:
18
16
长尾向右延伸
14
12ቤተ መጻሕፍቲ ባይዱ
10
8
6
4
2
0 12 24 36 48 60 72 84 96 108 120
均数中位数非正态分布偏态分布多峰分布即右偏态集中位置偏右均数中位数正偏态即左偏态集中位置偏左均数中位数48图21160名正常成年女子的血清甘油三酯的频数分布图10152025050070090110130150170190血清甘油三酯mmoll图2259名链球菌咽喉炎患者的潜伏期h10121416181224364860728496108120潜伏期h图23101名正常人的血清肌红蛋白含量10152025101520253035404550肌红蛋白含量ugml正态分布
精选课件ppt
24
组距的大小或宽度
❖ 组距的大小或宽度是上下组界的差,也常称 为组宽.如果一个频数分布的所有组距都有同 样的宽度,那么这个共同的宽度用f来表示.在 这种情况下,f等于2个连续下组界或2个连续 上组界的差。
❖ 在表2.1中,c=62.5-59.5=65.5-62.5=3.
精选课件ppt
卫生统 计学
预防医学教研室: 徐 谦
办公地点: 大学城基础医学院六楼
精选课件ppt
1
第二章 定量资料的统计描述
卫生统计学第7版方积乾主编课件第二章定量资料的统计描述
2020/6/24
11
正偏态(右偏态)
负偏态(左偏态)
2.观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理
2020/6/24
12
第二节 描述集中趋势的统计指标
医学定量资料中,描述集中趋势的统计指标主要有 算术均数、几何均数和中位数。 一、算术均数(arithmetic mean)
本例
X X 31.26 3.9075 (U/L) n8
2020/6/24
14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
X fX 0 fX 0
f
n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 X fX 0 2228 18.57 (μmmo/L) f 120
2020/6/24
2
统计描述是用统计图表、统计指标来描述资料的分布 规律及其数量特征的。
第一节 频率分布表与频率分布图
医学研究资料变量值的个数较多时,对个变量值出现的 频数或频率列表即为频数分布表或频率分布表(frequency distribution table),简称频数表或频率表。
2020/6/24
2020/6/24
5
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
2020/6/24
6
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
卫生统计学第7版
卫生统计学第7版卫生统计学(本科预防)(第7版) 目录第一章绪论第一节医学中统计思维的进化第二节统计学与公共卫生互相推动第三节统计学的若干概念第四节目标与方法第二章定量变量的统计描述第一节频率分布表与频率分布图第二节描述平均水平的统计指标第三节描述变异程度的统计指标第四节描述分布形态的统计指标第五节统计表和统计图第六节统计内容的报告与中英文表达第七节案例讨论第八节计算机实验第九节小结第三章定性变量的统计描述第一节定性变量的频率分布第二节常用相对数指标第三节医学人口统计常用指标第四节疾病统计常用指标第五节粗率的标准化法第六节动态数列及其指标第七节定性变量统计图第八节中英文结果报告第九节案例讨论第十节计算机实验第十一节小结第四章常用概率分布第一节二项分布第二节Poisson分布第三节正态分布第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结第五章参数估计基础第一节抽样分布与抽样误差第二节t分布第三节总体均数及总体概率的估计第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结第六章假设检验基础第一节假设检验的概念与原理第二节t检验第三节二项分布与Poisson分布资料的z检验第四节假设检验与区间估计的关系第五节假设检验的功效第六节正态性检验第七节中英文结果报告第八节案例讨论第九节计算机实验第十节小结第七章方差分析基础第一节方差分析的基本思想第二节方差分析的步骤第三节多个样本均数的两两比较第四节方差分析的前提条件和数据变换第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第八章χ2检验第一节独立样本四格表资料的χ2检验第二节多个独立样本R×c列联表资料的χ2检验第三节配对设计资料的χ2检验第四节列联表资料的确切概率法第五节χ2检验用于拟合优度检验第六节中英文结果报告第七节案例讨论第八节计算机实验第九节小结第九章基于秩次的非参数检验第一节配对设计资料的符号秩和检验第二节两组独立样本比较的秩和检验第三节多组独立样本比较的秩和检验第四节随机区组设计资料的秩和检验第五节多个样本问的多重比较第六节中英文结果报告第七节案例讨论第八节计算机实验第九节小结第十章两变量关联性分析第一节线性相关第二节秩相关第三节分类变量的关联性分析第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结第十一章简单线性回归第一节线性回归第二节线性回归的应用第三节残差分析第四节非线性回归第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第十二章多重线性回归与相关第一节多重线性回归的概念及其统计描述第二节多重线性回归的假设检验第三节复相关系数与偏相关系数第四节自变量筛选第五节多重线性回归的应用第六节中英文结果报告第七节案例讨论第八节计算机实验第九节小结第十三章医学研究的统计学设计第一节统计设计的基本要素第二节统计设计的基本原则第三节误差来源及其控制方法第四节资料统计分析第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第十四章实验研究的设计与分析第一节实验设计中的对照设置和随机分组方法第二节常用实验设计方案与统计分析第三节样本含量的估算第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结第十五章临床试验设计与分析第一节临床试验概述第二节临床试验设计的原则第三节临床试验设计的基本类型第四节统计分析计划第五节临床试验中的三种试验类型第六节样本量估算第七节中英文结果报告第八节案例讨论第九节计算机实验第十节小结第十六章观察性研究的实施与分析第一节观察性研究概述第二节横断面研究的实施与分析第二三节病例对照研究的实施与分析第四节队列研究的实施与分析第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第十七章寿命表第一节基本概念第二节简略现时寿命表的编制第三节去死因寿命表的编制第四节健康期望寿命表的编制第五节寿命表有关指标及其分析第六节其他相关指标简介第七节中英文结果报告第八节案例讨论第九节计算机实验第十节小结第十八章logistic回归分析第一节logistic回归模型第二节logistic回归的参数估计及假设检验第三节条件logistic回归模型第四节logistic回归的样本含量估算第五节logistic回归的应用及注意的问题第六节中英文结果报告第七节案例讨论第八节计算机实验第九节小结第十九章生存分析第一节生存分析基本概念第二节生存曲线的估计第三节生存曲线的比较第四节Cox回归第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第二十章meta分析第一节meta分析概述第二节meta分析的统计方法第三节meta分析的偏倚第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结附录附录一软件简介(见随书光盘)附录1—1SAS简介附录1—2EpiData简介附录二统计学指南(见随书光盘)附录2—1CONSOR Tstatement的清单和流程图附录2—2STROB Estatement的清单附录2—3PRISM Astatement的清单和流程图附录三统计用表附录四重要定理证明(见随书光盘)中英文名词对照索引。
卫生统计学第7版-方积乾主编-课件第二章-定量资料的统计描述学习资料
1.直接法
G nX 1X 2X 3X n
对数的形式为 G l g 1 lg X 1 lg X 2 lg X n l g 1 lg X
n
n
2020/4/12
17
例2-5 7名慢性迁延型肝炎患者的HBsAg滴度资料为: 1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。
本例
XX31.263.9075(U/L) n8
2020/4/12
14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
XfX0 fX0 f n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 XfX0 222818.57(μmmo/L) f 120
简称均数。均数适用于对称分布或近似对称分布的资
料。习惯上以希腊字母 表示总体均数(population
mean),以表示样本均数X (sample mean)。常用计 算方法有直接法和频率表法(亦称加权法)。
2020/4/12
13
1.直接法
X X n
例2-3 测得8至正常大白鼠血清总酸性磷酸酶(TACP) 含量 (U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试 求其算术均数。
第二章 定量资料 的统计描述
2020/4/12
1
[学习要求] 了解:应用SAS程序编制频率表的方法和means、 univariate过程对定量资料的描述。 熟悉:定量资料频率表的编制方法和用途。 掌握:算术均数、几何均数、中位数的计算方法和使 用条件;四分位间距、方差、标准差、变异系数的计 算方法和使用条件。
医学统计学课件:02_统计描述(定量定性)
为什么引入相对数?
-----绝对数的局限性 Example: 有效100人。结论:B法优于A法!
某病用A法治疗100人,有效80人;B法治疗150人,
相对数的概念
两个有联系的(数值)指标之比。它表示两 者的对比水平,常以百分数或倍数表示。
同类指标的比值,如: 人口的性比例=男性人数/女性人数、医护比等。 非同类指标的比值,如:医护人员/床位数。
是一样的,但是三组的分布不一样 ,也就是离散程度不同。因此,要 全面把握数据的分布特点,不仅需 要了解数据的集中位置,还要了解 数据的离散状况。
描述计量资料要从两个方面进行:平均水平(集中趋势) 变异程度(离散趋势)
极差(Range) 全距
优点:简便 缺点:1. 只利用了两个极端值 2.样本量大,R也会大 3.不稳定
135 150
73.6
90.0 100.0
140名成年男子红细胞数
频数表的编制步骤
(1)求全距(range,R):即最大值与最小值之差; 本例极差: R=5.95-3.82=2.13 (2) 决定组数和组距:组数通常取10-15个组,组距为全距的十
分之一, 再略加调整;
本例 i= R /10=2.13/10=0.213≈0.20 (3) 列出组段:第一组段必须包括最小值,最后一个组段必须包 含最大值; (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段 的频数。
18 16 14
25
12
病例数
10 8 6 4 2 0 12 24 36 48 60 72 84 96 108 120 潜伏期(h)
20 15
人数
10 5 0 0 5 10 15 20 25 30 35 40 45 50 肌红蛋白含量(ug/mL)
卫生统计学-定量资料的统计描述精品PPT课件
集中趋势:均数、几何均数、中位数
• 统计指标
离散趋势:极差、方差、标准差、四 分位间距等
定量资料的统计描述---集中趋势
✓ 算数均数 (mean)
适用条件:对称分布,特别是正态或者近似正态分 布的资料。
✓ 几何均数 (geometric mean)
适用条件:偏态分布,但是经过对数变换之后呈正 态或近似正态分布的资料。
SPSS操作过程
SPSS中实现定量资料统计 描述的四个常用过程
Frequencies过程 Descriptives过程 Explore过程 Ratio过程
Frequencies过程:
• 涉及的统计指标比Descriptives过程全 面,并给出常用统计图。
• 还可以对分类资料以及不服从正态分 布的资料进行描述
1. 均数与中位数的比较 2. 频数表 3. 直方图,P-P图,Q-Q图 4. 正态性检验:单峰对称
正态性检验 -explore命令
操作步骤: Analyze-descriptive-explore -plots histogram
normality plots with test
2、Q-Q图
做法:
1、Frequencies 过程的对话框与选择项
• (1)Frequencies 过程的对话框
①Statistics对话框:
②charts对话框
③format对话框
• 练习: • 1、1985年某省农村120例6-7岁正常男童胸
围测量结果。
• Trunc(cc/1.5)*1.5
• 2、某市1974年为了了解该地居民发汞的基 础水平,为汞污染的环境监测积累资料, 调查了留住该市一年以上,无明显肝肾疾 病,无汞作业接触史的居民238人的发汞含 量(umol/kg),试做频数表分析。
第二讲 卫生统计学 定量资料的统计描述
离“中心”位置越远,频数越小;且围绕“中心”左
右对称。
——变异水平
指标
5、频数表的主要用途
(1)揭示分布类型; (2)便于发现特大值和特小值; (3)计算集中趋势指标与离散趋势指标; (4)作为陈述资料的形式,可以代替繁复的原始资料,便 于进一步分析; (5)当样本含量比较大时,可用各组段的频率作为概率的 估计值。如上述频数表 (2)栏的频数除以总例数即为第(3)栏 的频率,由此可推测正常男子的血清铁含量出现在各组段 的概率分别为0.0083、0.025、0.050、…、0.0083。
100.00
2、频数分布图
在表2-2的基础上,可以绘制出图2-2,称为 直方图(频率直方图)。 横轴:血清铁含量 纵轴:频率密度,即频率/组距(直条面积等于 相应组段的频率)。
在组距相等时,直方图中矩形直条的高度与 相应组段的频率成正比。
频数分布图
频 30 率 25
密
度 20 15 10 5 0 6 8 10 12 14 16 18 20 22 24 26 28
30 频 率 25 (% )
20
15
10
5
0
0
1
2
3
4
5
>5
产前检查次数
图 2-1 某 地 96名 妇 女 产 前 检 查 次 率 分 布
(二)连续型定量变量的频数分布
例2-2 抽样调查某地120名18岁~35岁健康男性居 民血清铁含量(μmol/L)。
将数据适当分组,计数每组的频数,根据这 些数据编制成的频数分布表(表2-2)则能显示出 这组数据分布的特点。
合计
120
2228
二、几何均数(geometric mean,G)
雷静卫生统计学-第二章 定量资料的统计描述一 24页PPT文档
或
G l g 1(lX g1 lX g2 . .l.X gn)l g 1( lX g)
n
n
· 频率表法:相同观察值的个数较多时
G l 1 g (f1lX g 1f2lX g 2 . .fk .lX g k l 1 g ( flX g)
f1f2 ..f.k.
f
08.09.2019
西安医学院公共卫生系
(2)应用于: · 等比资料如抗体的平均滴度、平均发展
速度人口的几何增长(增长速度);或用于 对数正态分布资料。
**注意 · 观察值不能有零 · 观察值不能同时有正值和负值
同一组资料几何均数小于均数
08.09.2019
西安医学院公共卫生系
3.中位数 中位数(median,M)是将一组观察值从小 到大排列,位次居中的观察值。 百分位数(percentile),位置指标,Px,将 总体或样本的全部观察值分为两部分, 理论上有x%的观察值比它小,有 (100-x)%的观察值比它大。 P50分位数即是中位数
合计
频数 1 4 4 10 9 6 3 2 0 1
40
08.09.2019
西安医学院公共卫生系
频率分布表(图)的用途:
作为陈述资料的形式,反映资料的分布类型; 对称分布 偏态分布 正偏态 负偏态
描述分布的两个特征:集中趋势、离散趋势 便于发现可疑值,及时查正; 便于以后的计算指标及统计分析; 当样本含量较大时,可用频率作为概率的估计值。
08.09.2019
西安医学院公共卫生系
★频率表法:频率表资料或相同观察值较多时
X fX0 f
式中,X0与f分别为频数表资料中各组段 的组中值和相应组段的频数(或相同观察值与 其对应的频数)。
卫管卫法卫统教案教案:第二章定量资料的统计描述1-2学时.doc
复习:统计工作的步骤、小概率事件、统计描述的内容木节内容:第二章定最资料的统计描述——集屮趋势的统计描述一、频数分布频数衣:描述计量资料的频数分布。
反映观察值的分布规律。
1 •频数表的编制:•找授大值、授小值,求极差•按极差人小决定组段数、组段、组距一般设10-15个组段常用极差的1/10取整作组距要求:第一组段包括最小值最后一个组段包括授大值每个纟R段的起点称〃下限〃(low limit)终点称"上限"(upper limit)对丁•连续性资料,各组段从下限开始,不包括本组段上限。
※最末一个组段应同时写出其下限和上限。
・列表划记,求频数(f)2.频数分布的两个特征:集中趋势、离散趋势3.频数分布的类型:对称分布{偏态分布:正偏态;负偏态不同类型的分布,应采用相应的统计分析方法4.频数表的用途:•作为陈述资料的形式,反映分布特征、分布类型;•便于以后的计算指标及统计分析处理;•便于发现可疑值,及时查正;・当样本含量较大时,可用各组段的频率作为概率的估计值。
5.直方图:P11图2T,更直观的反映频数分布的类型。
二、集屮趋势的描述:平均数(average)是描述一组观察值的集中位置或平均水平的统计指标。
常作为一组数据的代表值用于分析和组间比较。
常用的有:均数、几何均数、中位数等。
1.算术平均数(arithmetic mean)简称均数:总体均数用U表示;样本均数用乂表示。
反映一组观察值在数量上的平均水平。
15’举例说明频数表的编制过程10,以课本例题为例,观察频数分布的特征及类型;介绍直方图的特点及使用(1)计算方法•直接法:—》x_x( + X2+…X“式中,希腊字母工(读作sigma)n n表示求和;X】,X2,…,•为各观察值;n为样本含量,即观察值的个数。
•加权法(weighting method):用于频数表资料或样本中相同观察值较多时,其公式为:乂」X*X2+・・*Xk式中,X H X2,…,人与f 1, f2,…,fk分别为频数表资料中各组段的组中值和相应组段的频数(或相同观察值与其对应的频数)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μ mol/L)
6~
8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μ mol/L)
图2-2 120名健康成年男子血清铁含量(μmol/L)分布
努力
30 25 20
数据如下。试编制血清铁含量的频率分布表。
努力
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
2. 确定组段数与组距(class interval)
靠近的整数作为组距,本例取i=2。
6~ 8~ 10~ 12~ 14~ 16 ~ 18 ~ 20 ~ 22 ~ 24 ~ 26 ~ 28~30
1 3 6 8 12 20 27 18 12 8 4 1
120
0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
100.00
最大值。注意各组段不能重合,每组段只写出下限,如6~,8~,最后
一个组段可包括其上限值,如本例28~30。 4. 列表 清点各组的频数,计算频率、累积频率数和累计频率。
努力
表2-2 120名正常成年男子血清铁含量(μmmo/L)频率分布 组段 (1) 频数 (2) 频率(%) (3) 累计频数 (4) 累计频率(%) (5)
检查次数 (1) 0 1 2 3 4 5 >5 频数 (2) 4 7 11 13 26 23 12 频率(%) (3) 4.2 7.3 11.5 13.5 27.1 24.0 12.5 累计频数 (4) 4 11 22 35 61 84 96 累计频率(%) (5) 4.2 11.5 22.9 36.5 63.5 87.5 100.0
第二章
定量资料
的统计描述
努力
[学习要求] 了解:应用SAS程序编制频率表的方法和means、 univariate过程对定量资料的描述。
熟悉:定量资料频率表的编制方法和用途。
掌握:算术均数、几何均数、中位数的计算方法和 使用条件;四分位间距、方差、标准差、变异系数的
计算方法和使用条件。
努力
统计描述是用统计图表、统计指标来描述资料的分布 规律及其数量特征的。
努力
如用直接法计算, X =18.61(μmmo/L)
表2-3
组段 (1) 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28 ~ 30
合计
频数表法计算均数
频数(f) (3) 1 3 6 8 12 20 27 18 12 8 4 1
120
努力
组中值(X0) (2) 7 9 11 13 15 17 19 21 23 25 27 29
mean),以表示样本均数 X (sample mean)。常用计算 方法有直接法和频率表法(亦称加权法)。
努力
1.直接法
X X n
例2-3 测得8至正常大白鼠血清总酸性磷酸酶(TACP) 含量 ( U/L )为 4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38 。试 求其算术均数。 本例
频数
15 10 5 0 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~ 血清铁含量(μ mol/L)
2-2 120名健康成年男子血清铁含量(μmmo/L)分布
努力
三、频率分布表(图)的用途
1.揭示资料的分布类型
努力
资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值
合计
96
100
努力
-
-
离散型定量变量的频率分布图可用直条图表达,以等 宽直条的高度表示各组频率的多少
30 25 20
频率(%)
15 10 5 0 0 1 2 3 产前检查次数 4 5 >5
图2-1 1998年某地96名孕妇产前检查次数频率分布
努力
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),
组段数一般取10组左右。组距
用 i表示,组距 = 极差 /组段数,本例拟分 10 组, i=22.22/10=2.22 ,一般取
3. 确定各组段的上、下限 每个组段的起点称为组段的下限,终点称
为组段的上限。第一组段要包括最小值,其下限取小于或等于最小值的 整数,本例取6最为第一组段的下限(也可取 7),最后一个组段要包括
第一节
频率分布表与频率分布图
医学研究资料变量值的个数较多时,对个变量值出现的 频数或频率列表即为频数分布表或频率分布表(frequency
distribution table),简称频数表或频率表。
努力
一、离散型定量变量的频率分布
例2-1 1998年某山区96名孕妇产前检查次数资料,编制频率表。
表2-1 1998年某地96名孕妇产前检查次数频率分布
努力
1 4 10 18 30 50 77 95 107 115 119 120
0.83 3.33 8.33 15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17 100.00
合计
-
-
12 10
概率密度(%)
8
概率密度(%)
12 10 8 6 4 2 0
6 4 2 0 6~
4.便于进一步计算统计指标和作统计处理
努力
第二节
描述集中趋势的统计指标
医学定量资料中,描述集中趋势的统计指标主要有 算术均数、几何均数和中位数。 一、算术均数(arithmetic mean) 简称均数。均数适用于对称分布或近似对称分布的
资料。习惯上以希腊字母 表示总体均数(population
X 31.26 X 3.9075 (U/L) n 8
努力
2.频率表法 当变量值的个数较多时,在编制频率表
的基础上,应用加权法计算均数的近似值。
fX 0 fX 0 X f n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4
fX 0 2228 X 18.57 (μmmo/L) f 120