第二章医学统计描述技术总结范文ppt
医学统计学课件第二章 定量资料的统计描述
第四节
正态分布
一、正态分布的概念和特征
正态分布(normal distribution ):也 称高斯分布,是医学和生物学最常见的连续性 分布。如身高、体重、红细胞数、血红蛋白等。
图2-1 120名12岁健康男孩身高的频数分布
图2-2 频数分布逐渐接近正态分布示意
㈠ 正态分布的函数和图形
第二章 定量资料的统计描述
目 录
第一节 频数分布表
第二节 集中趋势的描述 第三节 离散趋势的描述
第四节 正态分布
学习要求
1.掌握频数分布表的编制步骤和方法 2.熟悉频数分布表的用途 3.掌握集中趋势、离散趋势的概念,适用条件和计
算方法 4.掌握正态分布的概念,意义和特点;正态曲线下 面积的分布规律
159.99 33.46 / 7 S . 0.089 7 1
2
加权法-标准差计算实例:
例
对表2-4资料用加x=17168,∑fx2 =2460040, 代入公式
2460040 17168 / 120 S 5.70(cm) 120 1
算术均数 (arithmetic mean): 简称均数。
适用条件:对称分布或近似对称分布的资料。
以希腊字母μ---总体均数(population mean)
以英文字母 ---样本均数(sample mean)
计算方法
1. 直接法:用于观察值个数不多时
X X n
2.加权法(weighting method):用于变量 值个数较多时
适用条件:对于变量值呈倍数关系或呈对 数正态分布(正偏态分布),如抗体效价及抗体 滴度,某些传染病的潜伏期,细菌计数等。 计算公式:有直接法和加权法。
2024版全新《医学统计学》完整ppt课件
THANKS
感谢观看
协方差分析
在方差分析的基础上,引入协变量, 以消除其对观察变量的影响,从而 更准确地评估控制变量对观察变量 的效应。
05
医学统计图表与可视化技术
统计图表的类型及特点
条形图
用于展示分类数据,可直观比较 各类别之间的差异。
折线图
用于展示时间序列数据或连续性 数据的变化趋势。
散点图
用于展示两个变量之间的关系, 可判断是否存在相关性。
森林图
用于展示多组数据的比较结果,可直观比较各组之 间的差异和联系。绘制时需选择合适的统计方法和 图形类型,如t检验或方差分析,并将结果以森林图 的形式呈现出来。
06
医学统计学在临床研究中的应用
临床试验设计与评价
01
02
03
试验设计类型
包括随机对照试验、交叉 设计、析因设计等,确保 试验的科学性和可比性。
参数估计
讲述点估计、区间估计 的方法及评价标准。
假设检验
介绍假设检验的基本思 想、步骤及常见错误类
型。
方差分析
阐述方差分析的基本原 理、假设条件及常用方
法。
常用统计指标与参数
01
02
03
04
描述性统计指标
介绍均数、中位数、众数、标 准差等描述性统计指标的计算
方法及意义。
推断性统计参数
讲解置信区间、假设检验中的 检验统计量、P值等推断性统
箱线图
用于展示一组数据的分布情况,可观察数据的中心 趋势、离散程度和异常值。绘制时需计算数据的四 分位数、中位数和异常值,并将它们以箱线图的形 式呈现出来。
ROC曲线图
用于评估诊断试验的准确性,可判断试验的灵敏度 和特异度。绘制时需计算不同临界值下的灵敏度和 特异度,并绘制出ROC曲线,计算出曲线下面积 (AUC)以评估试验的准确性。
医学统计学-第二章 统计描述
1. 首先对资料作分布类型的判定; 2. 针对分布类型先用合适的指标描述:
均值、标准差;常记录为 X S
中位数、四分位间距; 常录为M(Ql, Qu)
一、集中趋势:用于描述一组计量资料的集中位置, 说明这种变量值大小的平均水平(average)表示。
频 数
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
(三)频数表的用途:
1.揭示频数的分布特征
频 数
分布 特征
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
集中趋势
(central tendency)
离散趋势
(tendency of dispersion)
集中趋势与离散趋势结合能全面反映频数的分布特征
2.揭示频数的分布类型
对称 分布
频数 分布
正偏
非对称 分布
负偏
集中部位在中部,两 端渐少,左右两侧的
基本对称,为对称 (正态)分布。
集中部位偏于较小 值一侧(左侧),较大 值方向渐减少,为
正偏态分布。
集中部位偏于较大 值一侧(右侧),较 小值方向渐减少,
为负偏态分布。
(2) 定量资料的描述指标
描述指标: 集中趋势:
累计频数 (4) 1 6 14 31 54 75 89 96 99 100 100
累计频率 (5) 0.01 0.06 0.14 0.31 0.54 0.75 0.89 0.96 0.99 1.00 1.00
频数分布图(frequency distribution figure) :
根据频数分布表,以变量值为横坐标,频数为纵坐 标,绘制的直方图。
《医学统计学》PPT课件
提高医学研究的科学性和准确性
02
通过医学统计学的应用,可以对医学数据进行更科学、更准确
的分析和推断,从而提高医学研究的科学性和准确性。
为医学决策提供科学依据
03
医学统计学可以为医学决策提供科学依据,如制定卫生政策、
评价医疗质量等。
医学统计学的研究对象与内容
研究对象
医学统计学的研究对象主要是人体及与 人体健康有关的各种具有不确定性的数 据。
配对设计
将实验对象按照一定条件进行配对,再 随机分配到不同处理组,比较配对组之 间的差异。
随机区组设计
将实验对象按照区组进行划分,每个区 组内再随机分配到不同处理组,比较区 组间的差异。
重复测量设计
对同一实验对象在不同时间或条件下进 行重复测量,比较不同时间或条件下的 差异。
04
医学统计学的应用
临床试验中的统计学应用
样本量不足问题
01
样本量过小,导致结果不稳 定,缺乏代表性;
02
样本量不足,无法检测到真 实的效应或关系;
03
样本量计算不准确,未能充 分考虑变异度和效应大小。
数据处理不当问题
01
数据清洗不彻底,存在异常值、缺失值或重复数据 ;
02
数据转换不合理,导致信息损失或失真;
03
数据分析方法选择不当,未能充分利用数据信息。
VS
研究内容
医学统计学的研究内容包括统计设计、数 据收集、整理、分析、推断以及统计方法 的选择和应用等。其中,统计设计是医学 统计学的基础,数据收集是医学统计学的 前提,数据整理是医学统计学的关键,数 据分析是医学统计学的核心,统计推断是 医学统计学的目的。
02
医学统计学的基本概念
图文《医学统计学》PPT课件
提出假设、构造检验统计量、确定拒绝域、计算p值、做出决策。
t检验和方差分析
t检验
用于比较两组均数是否有差别,包括单样本t检验、配对样本t检验和独立样本t检验。
方差分析
用于比较多组均数是否有差别,包括单因素方差分析和多因素方差分析。
卡方检验和秩和检验
卡方检验
用于推断两个或多个总体率或构成比之 间有无差别,多用于分类资料的统计分 析。
特点
以医学为背景,以数据为基础, 运用统计学方法揭示医学现象的 数量特征和规律。
发展历程及现状
发展历程
医学统计学经历了从描述性统计到推 断性统计,再到现代多元统计分析的 发展历程。
现状
随着计算机技术的发展和大数据时代 的到来,医学统计学在医学研究和实 践中发挥着越来越重要的作用。
研究对象与任务
研究对象
样本量
样本中所包含的个体数目 。
随机抽样与非随机抽样
随机抽样
按照随机原则从总体中抽取样本的方法,保证每个个体被抽 中的机会相等。
非随机抽样
根据研究者的主观意愿或方便性选择样本的方法,可能导致 选择偏倚。
变量与数据类型
变量
研究中观察或测量的特征或属性。
数据类型
根据变量的性质可分为定量数据和定性数据。定量数据包括连续型数据和离散型 数据,定性数据包括分类数据和顺序数据。
医学统计学的研究对象包括生物医学数据、临床医学数据、公共卫生数据等。
任务
医学统计学的任务包括描述医学数据的分布特征、比较不同组别间的差异、分 析影响医学现象的因素、预测医学现象的发展趋势等。
02
医学统计学基本概念
总体与样本
01
02
03
总体
[医学]医学统计学课件PPT
• 研究长沙市2004年7岁 男孩身高的正常值范围?
• 同质:同长沙市、同7岁、同男孩、同无 影响身高的疾病。
2020/12/5
二、统计学中的几个基本概念
• (2)、变异 (variation)
• 变异 (variation):同质研究单位中变 量值间的差异。
二、统计学中的几个基本概念
变量值(value of variable) : 变量的观察结果。 例如:研究7岁男孩身高 变量值:测得的身高值 (
120.2cm,118.6cm,121.8cm,…) 研究某人群性别构成 变量值:男、女。
2020/12/5
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 ( variation)
医学统计学 Medical Statistics
2020/12/5
医学统计学讲授内容
第一章 绪论 第二章 计量资料的统计描述 第三章 总体均数的估计与假设检验 第四章 多个样本均数比较的方差分析 第五章 计数资料的统计描述 第六章 几种离散型变量的分布及其应用
第七章 2 检验
第八章 秩转换的非参数检验 第九章 双变量回归与相关 第十章 统计表与统计图
睛
研究水污染情况 水
研究细胞变性 胞
研究肝癌的地区分布
一个人 一只眼 一毫升 一个细 一个地区
2020/12/5
二、统计学中的几个基本概念
(2)变量(variable): 研究单位的研究特
征。
例如:研究7岁 男孩身高的正常值范围
变量:
身高
(3)变量值(value of variable
《医学统计学》完整课件 PPT
统计分析包括以下两大内容:
1.统计描述(descriptive statistics) 将计算出 的统计指标与统计表、统计图相结合,全面描述 资料的数量特征及分布规律。
2.统计推断(inferential statistics)
使
用样本信息推断总体特征。通过样本统计量进行
②数量分组,即将观察单位按其数值的大小分组,如按年龄 的大小、药物剂量的大小等分组。
3.汇总: 分组后的资料要按照设计的要求进行 汇总,整理成统计表。原始资料较少时用手工汇 总,当原始资料较多时,可使用计算机汇总。
四、分析资料 • 分析资料(analysis of data) —— 是根据设计的
要求,对整理后的数据进行统计学分析,结合 专业知识,作出科学合理的解释。
第1章绪论 目录
第一节 医学统计学的定义和内容 第二节 统计工作的基本步骤 第三节 统计资料的类型 第四节 统计学中的几个基本概念 第五节 学习统计学应注意的几个问题
第一章 绪论
第一节 医学统计学的定义和内容
• 医学统计学(medical statistics) ---是以 医学理论为指导,运用数理统计学的原理和方 法研究医学资料的搜集、整理与分析,从而掌 握事物内在客观规律的一门学科。
6.健康统计 研究人群健康的指标与统计方 法,除了用上述的某些方法外,他还有其特有 的方法,如寿命表、生存分析、死因分析、人 口预测等方法
第二节 统计工作的基本步骤
医学统计工作可分为四个步骤: 统计设计、搜集资料、整理资料和分析资料。 这四个步骤密切联系,缺一不可,任何一个步 骤的缺陷和失误,都会影响统计结果的正确性。
2.医疗卫生工作记录 如病历、医学检查 记录、卫生监测记录等。
3.专题调查或实验研究 它是根据研究目 的选定的专题调查或实验研究,搜集资 料有明确的目的与针对性。它是医学科 研资料的主要来源。
医学医学统计学PPT课件
样本量估算
根据研究目的、效应大小、显著性水平 和把握度等因素,合理估算所需样本量。
随机化方法
介绍简单随机化、分层随机化、整群随 机化等随机化方法,以确保试验组和对 照组的可比性。
数据分析与解读
运用统计学方法对试验数据进行描述性 统计、推断性统计和生存分析等,正确 解读分析结果。
观察性数据分析与处理
误差和提高实验效率。
方差分析基本思想
将总变异分解为组间变异和组内变 异,通过比较组间变异与组内变异 的相对大小,推断各因素对结果的 影响是否显著。
方差分析步骤
建立假设、计算检验统计量、确定P 值、作出推断结论。
04
医学统计学在医学研究中 的应用
临床试验设计与分析
试验设计类型
包括随机对照试验、交叉设计、析因设 计等,以及各种设计类型的优缺点和适 用场景。
03
样本容量
样本中所包含的个体数目。
变量与数据类型
变量
研究中观察或测量的特征或属性, 可以是定量的或定性的。
数据类型
根据变量的性质可分为定量数据和 定性数据,其中定量数据又可分为 离散型和连续型。
统计பைடு நூலகம்与抽样分布
03
统计量
用于描述样本特征的数值,如样本均值、 样本标准差等。
抽样分布
由样本统计量所形成的分布,用于推断总 体参数。常见的抽样分布有t分布、F分布 和卡方分布等。
03
多重比较与假设检验的误用
Hochberg校正
02
01
控制FDR(False Discovery Rate) 的方法
统计模型的选择与评估
统计模型的选择
1
2
根据研究目的和数据类型选择合适的统计模型
医学统计学PPT课件
验结果,每次都有如此好的吻合. 的概率约10万分之4。 6
绪论 Introduction
讲授内容:
一、医学统计学的意义
二、统计学中的几个基本概念
三、统计资料的类型
四、医学统计工作的基本步骤
五、学习医学统计学应注意的问题
.
7
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
例如:某药治疗高血压患者30名
样本含量(n)为30
.
21
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic)
• (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。
• 一般用希腊字母表示
• (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
.
15
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
.
27
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100
•
N=5万 → X =118.6cm
• 特点:1)不可避免性
卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)
●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
估计的方法: 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算 (双侧) 95% 正常值(医学参考值)范围公式:
(x1.96 · S,x1.96 · S )
即(x±1.96 · S ) 例:
1.96 × 3.79 )
即(156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
96 ·S,x 1. Q = Qu 一 Ql
单侧 上界: P 95
单侧 下界: P 5
31
习题:
1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不
变
2.用均数和标准差可全面描述:
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
19
相关概念:离均差、离均差平方和、方差(2 S2 ) 标准差的符号: S
卫生统计学02统计描述 PPT课件
变异程度
R =最大值-最小值
R 甲=100-60=40
R 乙=90-70=20
R 丙=100-60=40
医学统计学
12
第三节
二、离均差平方和
变异程度
SS ( X X )
2
SS甲=(60-80)2+(70-80)2+(80-80)2+(90-80)2+(100-80)2 = 1000 SS乙=(70-80)2+(75-80)2+(80-80)2+(85-80)2+(90-80)2 = 250 SS丙=(60-80)2+(75-80)2+(80-80)2+(85-80)2+(100-80)2 = 850
中位 145X 50%=72.5
M =12+6(145×50%—63)/40=13.4
医学统计学 9
第二节
三、中位数与百分位数
平均水平
百分位数计算法: 中位数实质上是50%位数,所以在中位数计算公式中用 N×50%。如果我们把50%换成别的百分数,且把相应的L、i、 fm、fc 都作相应的变换,则可求出各百分位数。 P25 =6+6 (145×25%-18) / 45= 8.43 P75 =18+6 (145×75%-103) / 30= 19.15 P5 =0+6(145×5%-0)/ 18=2.42 P95 =24+6 (145×95%-133) / 6= 28.75
医学统计学
23
The class is over 谢谢!
医学统计学
24
医学统计学
5
第一节 频数表与直方图
40
《医学统计学》第二章定量数据的统计描述
累积频数
(3) 27
196 363 457 538 580 608 622 626 629 630
-
累积频率(%)
(4) 4.29 31.11 57.62 72.54 85.40 92.06 96.51 98.73 99.37 99.84 100.00
资料如表,试计算其中位数。
某地630名正常女性血清甘油三酯含量(mmol/L)
甘油三酯(mmol/L)
(1) 0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~ 3.10~
合计
频数
(2) 27 169 167 94 81 42 28 14 4 3 1
练习
例 8名食物中毒患者的潜伏期分别为1,4,3,3,2,5,8,16小时,
求中位数。
n=8,为偶数
M
1
2
(
x (
8 2
)
x (
8
1)
)
2
1 2 ( x4
x5 )
1 3 4
2
3.5(小时)
例 某传染病11名患者的潜伏期(天)分别为1,3,2,2,3,7,5,6,
4,7,9,求中位数。
n=11,为奇数 M xn1 2 x(111) x6 4(天 ) 2
偏态分布
正偏态 负偏态
正偏态:集中位置偏向数值小的一侧 负偏态:集中位置偏向数值大的一侧
医学统计学(第7版)
正 态 分 布
医学统计学(第7版)
正偏态
集中位置偏向 数值小的一侧
负偏态
集中位置偏向 数值大的一侧
(麻疹年龄分布)
(肺癌年龄分布)
医学统计学--第二章 计量资料的统计描述
4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51
2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86
4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02
3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70
1
lg X ) lg (
n
1
ቤተ መጻሕፍቲ ባይዱ
lg10 lg 20 lg 40 lg 40 lg160 ( ) 34.8 5
(2)加权法 公式:
G lg (
1
f lg X f
)
例2-5 69例类风湿关节炎(RA)患者血清EBV-VCAlgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均 抗体滴度。
三、频数表和频数分布图用途
1.描述频数分布的 类型 (1)对称分布 :若 各组段的频数以频数 最多组段为中心左右 两侧大体对称,就认 为该资料是对称分布
25
20 15
Æ µ Ê ý
10 5
0
2.45
3.05
3.65
4.25
4.85
5.45
6.10
Ñ Ç × µ ¹ ´ £ mmol/L£ ª å Ü ¨Ì ¼ ¨ ©
G 公式: X 1 X 2 X n
n
或
G lg
1
lg X ) (
n
例2-4 某地5例微丝蚴血症患者治疗七年后用间接 荧光抗体试验测得其抗体滴度倒数分别为,10, 20,40,40,160,求几何均数。
G 10 20 40 40 160 34.8
5
G lg
医学统计学课件:2统计描述
¾ 确定组段的上、下限 注意:第一组必须包括最小值,最末一 组必须包括最大值,各组间不能有交 叉,每组段从本组段下限开始,不包括 上限。
¾ 列表整理,写出频数
合计
147
100.0
-
-
等级资料的频数表:
治疗结果
(1)
治愈
有效
表4-2 某药物疗效的频数表
频数 频率/% 累积频数 累积频率/%
(2) (3)
(4)
(5)
65 43.3
65
43.3
45 30.3
110
73.6
无效
25 16.7
135
90.0
恶化
15 10.0
150
100.0
合计 150 100.0
一月,血凝抑制抗体滴度见表4-5,求其平
均滴度。
表4-5 40名儿童接种麻疹疫苗后一月血凝抑制抗体滴度频数分布表
抗体滴度 人数,f 滴度倒数,X
(1)
(2)
(3)
lg(X) (4)
f·lgX (5)=(2)(4)
1:4
1
4
0.6021 0.6021
1:8
5
8
0.9031 4.5155
…
…
…
…
…
1:256
1、这150名正常成年男子红细胞数的平均水 平是多少,变异度有多大? 2、这150名正常成年男子红细胞数与当地成 年男子红细胞数总体相比是否有差别?
统计描述
统计推断
统计指标 统计图表
医学统计学——统计描述
布为最常见的一种。
偏态分布:正偏态分布—儿童疾病年龄分布;负偏态分布— 老年疾病年龄分布。
对称分布
频数分布高峰位于 中部,左右两恻的 频数大体对称。
正偏
偏态分布
负偏
生物医学研究的统计方法 第2章
高峰偏于左侧, 长尾向右侧延伸, 则为正偏态
高峰偏于右侧,长 尾向左侧延伸,则 为负偏态。
G lg 1(lg X1 lg X 2 ... lg X n ) lg 1(
lg X )
n
n
例3.2 设有5份血清样品,滴度分别 为:1:1, 1:10, 1:100, 1:1000, 1:10000 求其平均滴度。
G= 5 110100100010000 100
或G=lg-1((lg1+lg10+lg100+lg1000+lg10000)/5) =lg-1((0+1+2+3+4)/5) =lg-12 =100
中位数、算术均数和众数的关系
正偏态分布
对称分布
众数 中位数 算术均数
众数 中位数 算术均数
负偏态分布
算术均数 中位数 众数
三、离散趋势指标
极差(Range, R) 四分位数间距(Quartile,Q) 方差(Variance) 标准差(Standard deviation)
(一)、极差(Range, R)
潜伏期(小时) 频数 f 累计频数 累计频率(%)
①
②
③
④
0—
21
21
15.24
12—
58
79
48.17
24—
第二篇医学资料统计描述PPT课件
三、频数表与频数直方图的用途:
1、揭示资料分布的特征 2、揭示资料分布的类型 3、便于进一步计算指标和统计分析 4、便于发现特大或特小的可疑值
第一节 频数分布表和频数分布图
频数分布的特征 1、集中趋势:数据向某一数值集中的倾向 2、离散趋势:从中间到两侧频数分布逐渐减少。
离 离散散 趋趋势
势
集中 趋势
第一节 频数分布表和频数分布图
例 2-1
各类别及各类别下的观察单位数构成频数表
第一节 频数分布表和频数分布图
1、定量资料的频数表的编制
按数量大小分组,然后统计各组(段)的频数(人数)
步骤
(2)确定组距和组段 (3)采用划记法,统计各组段频数
(4)列表
最大值
②求组距(i): i=极差/组数=1.7/10= 0. 17≌0.2
③确定各组段的上下限 原则:第一组段包括最小值,最后组段包括最大值。
每一组段都有上限和下限 下限:组段的起点(最小值) 上限:组段的终点(最大值) 一般只列出下限! 最后组段应同时列出其上限和下限值
注意: 每个数据只能归属一个组段!
(positive skewed)
正偏态分布: 峰偏左,尾部向右侧延伸
集中位置偏向年龄小的一侧
负偏态分布: 峰偏右,尾部向左侧延伸
集中位置偏向年龄大的一侧
负偏态分布
(negative skewed)
27
王晓敏 制作
正(右)偏态 分布
人数(f)
25
20
15
10
5
0
12~
15~
18~
21~
24~
27~
不同的资料类型,要用不
资料的类型 同的统计方法和指标
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章医学统计描述技术总结范文ppt (七)、应用标准化率注意事项1、应用直接法计算标准化率时,由于所选定的标准人口不同,算得的标准化率也不同,因此,比较几个标准化率时,应采用同一标准人口。
2、当各年龄组的率出现明显交叉时,宜直接比较各年龄组的发生率,而不宜用标准化法甲乙两厂某工种某病患病率工龄甲厂乙厂(年)工人数患者数患病率(%)工人数患者数患病率(%)<3400123.010011.0≥31001010.04007218.0合计500224.45007314.6<3≥3(工龄)2015105交叉3、两样本标准化率的比较应作假设检验。
4、采用间接法计算所得的标准化率仅能与所选标准比较,两个间接法标准化率不能互相比较。
5、标化后的标准化率不反映实际水平,只是用于比较的相对水平。
第五节动态数列及其分析指标动态数列是一系列按时间顺序排列起来的统计指标(绝对数、相对数、平均数),用以说明事物在时间上的变化和发展趋势。
动态数列分析的指标一、绝对增长量①累计增长量,以某一年为基数(第一年),以后各年与之相减即得;②逐年增长量,以下一年数量减上一年数量即得。
二、发展速度和增长速度发展速度和增长速度均为比,说明事物在一定时期的速度变化。
发展速度表示期指标的水平相当于基期水平的百分之多少或若干倍。
增长速度说明某现象增长程度的相对比增长速度=发展速度-1。
1、发展速度(1)定基发展速度以某个时间(基期a0)的指标作基数,各个时间(期ai)的指标与之相比;a1/a0,a2/a0,…,an/a02000年:6997/4721=1.482(2)环比发展速度以前一个时间的指标作基数,以相邻的后一年的指标与之相比。
(人)即根据该地1996—2000年的平均发展速度,预计到2005年该地的医护人员数量可达11408人。
身高(cm)频数(f)组中值(某)f某f某295-196.596.59312.2598-799.5696.569301.75101-10102.5104-18105.5107-25108.5110-21111.5113-15114.5116-15117.5119-7120.5122-1251123.5合计120(∑f)13218(∑f某)1460046(∑f某2)3.8509.21743.76某某医院1980年与1982年各科病床情况科别1980年1982年病床数构成比病床数构成比内科20050.030060.0外科10025.010020.0儿科10025.010020.0合计400100.0500100.0(三)、相对比(Ratio)相对比是A、B两个有关指标之比,说明A是B的多少倍或百分之几。
A与B的性质可以相同,也可以不同。
可以是绝对数也可以是相对数或平均数。
人口密度、性比例、医护比,医技比二、应用相对数的注意事项1、计算相对数的分母不宜过小分母过小则计算所得的相对数不稳定,不可靠,容易产生误解。
犯了以比代率的错误3、正确计算合计率(总率)对观察单位数不等的几个率,不能直接相加求平均率正确的方法:总的发生数除以总的观察单位数。
某医院各科的病死率科别患者数死亡数病死率(%)外科150018012.0内科500204.0传染科400246.0合计24002247.3(12.0+4.0+6.0)/3某100%=7.3%平均率=224/2400某100%=9.3%决定率(或构成比)的因素很多,除所研究的因素外,尚有许多重要的影响因素;两个或两个以上的率(构成比)相比较时,其他重要的影响因素要相同或相近(即所谓的具有可比性),否则就不能直接对率进行比较。
一般的,两个地方的出生率、死亡率、发病率,不同级别医院某病的治愈率等不能直接比较。
两医院乳腺癌手术后的5年生存率(%)腋下淋巴省医院市医院结转移病例数构成生存数生存率病例数构成生存数生存率无456.03577.7730078.321571.67有71094.045063.388321.74250.60合计755100.048564.24383100.025767.10不能直接比较两院总的生存率(应标化后再比)两院乳腺癌病人有无淋巴结转移构成比较有转移无转移省医院710/755=0.94045/755=0.060市医院83/383=0.217300/383=0.7835、率或构成比的比较要遵循随机抽样的原则,要做假设检验。
即两组或多组率比较,要作假设检验再下结论。
三、率的标准化法两医院乳腺癌手术后的5年生存率(%)腋下淋巴省医院市医院结转移病例数生存数生存率病例数生存数生存率无453577.7730021571.67有71045063.38834250.60合计75548564.2438325767.10不能直接比较两院总的生存率(应标化后再比)(一)、标准化法的意义和基本思想率的标准化:是指在比较两个或多个总率时,采用一个共同的内部构成标准,将两个或多个样本不同的内部部构成调整为相同的内部构成,以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性。
采用标准化方法计算得到的率简称标化率,又调整率。
基本思想:采用统一的标准内部构成(年龄、性别),在相同的内部构成条件下,计算预期的发生率(死亡率);目的:消除因内部构成不同对总率产生的影响,使标化率具有可比性。
(二)、标化率的计算标化率的计算,常用的有直接法和间接法。
1、直接法计算标化率当已知被标化组内部各小组的率时(即pi),采用直接法。
为标准组的人口数P’代表标准化率,Ni为标准组各个年龄人口数,N为标准组总人口数;pi为被标化组各年龄组的发生率。
∑Nipi为预期发生数;Ni/N为标准组年龄构成。
注意:不能用N某p求出预期发生数。
2、间接法计算标化率P为标准组总死亡率(发生率),Pi为标准组各年龄组死亡率(发生率),r为被标化组实际死亡数(发生数),r/ΣniPi为被标化组实际死亡数与预期死亡数之比,称为标准化死亡比,用SMR表示;若SMR>1,说明被标化组人群死亡率高于标准组;若SMR<1,说明被标化组人群死亡率低于标准组。
间接法标化率仅用于被标化人群与标准组比较,两个间接法标准化率不能直接比较(没对年龄进行调整)。
(三)标准化率的计算步骤1、选择直接法或间接法直接法:已知内部各组的率时选用;间接法:已知各年龄组的人口数和总死亡数时选用。
2、选择标准直接法:选择标准的人口数;间接法:选择标准的死亡率或患病率3、按公式计算标化率(四)、标准人口选择方法:(1)选择有代表性的、较稳定的、数量较大的人群,如全世界的、全国的、全省的、本地区的历年人口数;(2)选择相互比较的人群合并做标准;(3)选择相互比较的人群某一组做标准。
相互比较时,标准要相同。
例如,国际间的比较要采用世界通用的标准。
(五)用直接法计算标准化率当已知被标化组内部各小组的率时,可以采用直接法计算标准化率。
已知内部各分率,可用直接法乙两医院乳腺癌手术后的5年生存率(%)腋下淋巴省医院市医院结转移病例数生存数生存率病例数生存数生存率无453577.7730021571.67有71045063.38834250.60合计75548564.2438325767.10两组合并为标准两医院乳腺癌手术后的5年生存率(%)淋巴省医院市医院结转移标准人数原生存率预期生存数原生存率预期生存数无34577.77268.371.67247.3有79363.38502.650.60401.3合计1138—770.9—648.51、用标准人数计算省医院标化生存率=——————某100%预期生存总数标准病人总数=———某100%770.91138=67.74%市医院标化生存率=———某100%=56.99%1138648.52、用标准人口构成计算345/1138=0.3032793/1138=0.6968(六)间接法计算标准化率已知被标化组内部各小组的人数以及总的死亡人数或发病人数时,采用间接法计算标准化率。
例2-20用间接法计算标准化率已知两医院治疗各种病型的人数以及五年总的生存人数:485人和257人。
不知各种病型的五年生存率,则只能用间接法。
省医院SSR>1,说明其生存率高于标准组;市医院SSR<1,说明其生存率低于标准组。
反映离散程度的常用指标:1、极差2、四分位数间距3、方差4、标准差5、变异系数一、极差(全距)R1、计算公式:R=最大值-最小值2、意义:R愈大,离散度愈大,R愈小,离散度愈小。
3、优点:计算简单,意义明了4、缺点:(1)不能反映每一个观察值的变异;(2)样本例数越大,R可能越大;(3)R抽样误差大,不稳定。
二、四分位数间距(简记Q)1、计算公式:四分位数间距Q=QU-QLP25:下四分位数,简记QLP75:上四分位数,简记QU2、意义:反映中间一半观察值的极差,意义与R相似。
120名链球菌咽峡炎患者潜伏期,求M,QQ=P75-P25=64.8-38.7=26.1(小时)三、方差(总体方差简记,样本方差简记)一组观察值的离均差平方和,取其均数,即方差。
∑(某-某)=0(离均差和)∑(某-某)2≠0(离均差平方和)缺点:与例数多少有关1、计算公式(直接计算法):2、意义:方差越大,离散度越大;方差越小,离散度越小。
3、缺点:单位被平方,不便于使用四、标准差(总体标准差简记σ,样本标准差简记S)方差的开平方,即标准差。
标准差甲组:262+282+302+322+342=4540乙组:242+272+302+332+362=4590丙组:262+282+302+322+342=4534求150名男婴出生体重的标准差。
变异系数身高:cm,=4.95cm体重:kg,=4.96kgCV身高==2.98%CV体重==9.23%100名20岁健康男子的身高和体重的均数、标准差如下,比较其变异度。
例如:某年甲乙两村发病情况如下:甲村:发病人数100人。
乙村:发病人数300人。
发病情况乙村比甲村严重?甲村:人口数:1000人发病人数:100人发病率:10.0%。
乙村:人口数:5000人发病人数:300人发病率:6.0%常用的相对数:率、构成比、相对比率(Rate)又称频率指标,是指在一定时间内发生某现象的观察单位数与可能发生该现象的总观察单位数之比。
它说明某现象发生的频率或强度。
(一)、率K为比例基数,可以是百分率(%)、千分率(‰)、万分率(1/万)或十万分率(1/10万),可根据习惯或使计算出的率保持一、二位整数。
人口出生率、死亡率、自然增长率、婴儿死亡率等采用千分率;肿瘤的死亡率采用十万分率。
习惯用法:计算率时,注意分母和时间。
只有可能发生某事件的观察单位才能做分母。