常用医学统计方法 胡国清PPT幻灯片
合集下载
《医学统计》课件
医学统计应用
流行病学
通过收集、整理和分析人群中发生的疾病和健 康情况,以改善公共健康。
临床研究
设计和分析临床试验,评估新药物和治疗方法 的疗效和安全性。
生物统计学
研究生物医学研究中的统计方法和数据分析, 以支持科学研究和医学决策。
公共卫生
研究和分析疾病的发生、传播和控制,以制定 政策和干预措施。
医学统计案例分析
了解这些基本概念是进 行数据收集、整理和分 析的基础。
数据收集
选择合适的数据收集方法是确保数据质量和可靠性的关键。
2
数据整理的流程:数据清洗、变量识别、数据转换等
整理数据可确保数据的一致性和可分析性,并减少错误和偏差。
3
数据可视化:表格、图表等
通过可视化表达数据的方式,使得数据更易于理解和传达。
临床试验案 例:治疗指 南的修订
使用临床试验数据 评估现有治疗指南 的有效性,并提出 修订建议。
流行病学案 例:SARS疫 情的分析
通过分析SARS疫情 数据,揭示病毒传 播和控制策略。
生物统计学 案例:基因 组分析
通过基因组数据的 统计分析,发现与 特定疾病和遗传变 异相关的基因。
公共卫生案 例:疾病控 制与预防
使用统计方法评估 疫苗和卫生干预措 施的效果,制定防 控策略。
总结与展望
1 医学统计的重要性和发展趋势
医学统计在改善健康状况和优化医疗服务方面具有重要作用,并将继续发展。
2 如何应用医学统计优化医疗健康服务
结合医学统计方法和技术,改进临床实践和医疗决策,提高医疗质量和效果。
数据分析基础
描述性统计:中心位置、离散程度、分布形态等
描述性统计用于总结和表达数据的特征,如均值、标准差和分布形态。
常用医学统计方法基本概念与步骤 PPT课件
样本均数>总体均数
属于抽样误差 √
属于本质差异
样总样本体本 455%205%%
以近视率为例
属于抽样误差 ? 属于本质差异 ?
样本
样本
属于一个
45%
25%
总体吗?
以近视率为例
样本具备“代表性”应遵循的原则
(1)随机抽样: 总体中每一个体被抽取的机会相同
(2)样本含量适宜: 太小代表性差,太大则调查费力
某医院将糖尿病患者随机分为两组,每组30人。 分别给予不同的医护方法,以比较疗效。
(1)研究开始以前,两组对象是 否要求相同?如何反映?
某医院将糖尿病患者随机分为两组,每组30人。 分别给予不同的医护方法,以比较疗效。
(2)两组对象相同,疗法不同,治 疗以后观察两组血糖:
均数相等,怎么判断? 均数不等,怎么判断?
属于抽样误差——疗效相同 属于本质区别——疗效不同
经样本观察的结果,如何判断?
健康人群的血细胞均数低于某病患者 样本的血细胞均数。
甲地人群的某病发病率高于乙地人群 的该病发病率。
高血压患者的血压平均值治疗以后呈 现下降。
抽样误差? 本质区别?
统计推断
讨论二
⑴ 指出下列可能由变异导致的现象: ⑵ 指出下列可能由抽样误差导致的现象: ⑶ 指出下列可能存在真实不同的现象。
个体之间的差异如果属于同质,称为变异。
变异是有规律的! 以成人舒张压为例,相距均数75mmHg太远则属 于血压异常。
低血压区 血压正常范围 高血压区
60
75
90 mmHg
医学正常值范围是统计学根据事物变异规律计算所得
卫生领域中的变异现象
同同 服一为 用份健 同样康 样品人 剂(,量空但的气身药、高物食、,物肺但、活患血量者液、 的)血 疗,细 效测胞 、试数 副、 方代反法应谢或、物人药含不物量同的、,血…测浓…得度都某、可物能…质不…浓一都度样可都能可不能一不样一样
[临床医学]常用医学统计方法 胡国清
2020/11/29
3
留给统计学的问题
▪ 如何简洁地、准确地从一大批杂乱无章 的数据中提炼出代表性信息?(统计描 述)
▪ 如何合理地由样本的信息(部分信息) 推断总体的信息(总体信息)?(统计 推断)
2020/11/29
6
统计方法的主要应用
1. 通过种种手段以最合适的方法搜集数据。 2. 采用统计指标、统计表、统计图描述数据的
…
2020/11/29
红细胞数 3.98 4.54 4.74 5.13 4.43 4.81 4.98 3.79
…
编号
… 143 144 145 146 147 148 149 150
红细胞数
… 4.67 5.40 5.29 4.77 5.38 5.15 4.64 5.19
20
一、描述集中趋势的特征数(平均指标)
1. 极差:任何计量资料,是参考变异指标 2. 四分位数间距:与中位数配套用 3. 标准差 :与算术均数配套用 4. 变异系数 :描述对称分布(特别是正
态分布)资料的相对变异程度。
2020/11/29
11
示例1:率和构成比的区分
2020/11/29
12
示例2: 如某种疗法治疗5例病人5例全部治愈,则 计算治愈率为5/5×100% =100%,若4例 治愈,则治愈率为4/5×100% =80%,由 100%至80%波动幅度较大,但实际上只有 1例的变化。
XG n X1X2Xn
lgXG
1 n(lgX1
lgX2
lgXn)
lgX n
XG lg1
lgX n
2020/11/29
23
几何均数的示例
血清的抗体效价滴度的倒数分别为:10、100、 1000、10000、100000,求几何均数。
第三章 医学统计基本方法ppt课件
R=0.8
R=1.2
优点
极差(range)
1.表示变异范围,简单明了; 2.各种分布类型的资料均可用。
缺点
1. 不能全面反映资料的离散程度; 2. 不稳定,易受极端值的影响,抽样误差大。
2、四分位数间距
四分位数间距是上四分位数和下四分位 数之差,用Q表示 。下四分位数QL=P25, 上四分位数QU=P75,四分位数间距即QUQL。
4.8
2组 4.2 4.5 4.8 5.1 5.4
4.8
3组 4.4 4.7 4.8 4.9 5.2
4.8
全距表示一群变量值的最大值与最小值之差,
反映个体差异的范围,用R表示。全距大,说明
变异度大;反之,说明变异度小。
1组 4.4 4.6 4.8 5.0 5.2 3组 4.4 4.7 4.8 4.9 5.2 2组 4.2 4.5 4.8 5.1 5.4
等比资料
对数正态分布
位次居中的
偏态分布;分布不
观察值水平
明;分布末端无确定值
描述观察序列在某 可用于确定医学参考值
百分位置的水平, 范围,适用于任何分布。
例9-14 三组健康成年男性红细胞数(×1012/L) 的测得值如下,试分析其平均水平和离散趋 势。
x
1组 4.4 4.6 4.8 5.0 5.2
第三章 医学统计基本方法
第一节 医学统计基本步骤
统计学是研究数据资料搜集、整理与分 析、推断的科学,面对不确定性数据做出 科学的推断,是认识社会和自然现象数量 特征的重要工具。
一、统计学的若干基本概念
(一)同质与变异 同质:是指观察单位(研究个体)间被研究指标的影响因
素相同。 变异:由于生物个体的各种指标所受影响因素复杂,同质
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 集中趋势的描述——平均数平均数:描 述一组变量值的集中位置或平均水平的 指标体系。
1. (算术)均数:对称分布,尤其是正态分 布;
2. 几何均数:对数转换后呈对称分布,尤 其是对数正态分布;
3. 中位数 :一般偏态分布;
2021/3/7
9
▪ 离散趋势描述:描述一组变量值的离散 趋势或变异程度的指标体系。
1. 极差:任何计量资料,是参考变异指标 2. 四分位数间距:与中位数配套用 3. 标准差 :与算术均数配套用 4. 变异系数 :描述对称分布(特别是正
态分布)资料的相对变异程度。
2021/3/7
10
示例1:率和构成比的区分
2021/3/7
11
示例2: 如某种疗法治疗5例病人5例全部治愈,则 计算治愈率为5/5×100% =100%,若4例 治愈,则治愈率为4/5×100% =80%,由 100%至80%波动幅度较大,但实际上只有 1例的变化。
G l g 1 l1 g1 0l1 g20 l1 g 53 0l1 g40 l1 g5 0 100
此例的算术均数为22222 问题:描述此类型资料集中趋势时,为什么倾向选 用几何均数?
2021/3/7
23
频数表资料的几何均数
G l 1 g filfiX g i l 1 g f1 lX g 1 f2 lX g 2 fi fn lX g n
抗体滴度 ⑴
1:4 1:8 1:16 1:32 ┇ 1:512 合计
人数, f ⑵
1 5 6 2 ┇ 5 72
滴度倒数, X ⑶
4 8 16 32 ┇ 512
lgX ⑷
0.6021 0.9031 1.2041 1.5051
┇ 2.7093
f·lgX ⑸
0.6021 4.5155 7.2246 3.0102
个研究的结果下结论。
2021/3/7
6
问题2:数据被恰当地表达了吗?
1. 统计指标的使用准确吗?
▪
X S 还是
X
S X
?各自使用的条件是什么?
▪
是万用通行证吗?
▪ 率X 与S 构成比 搞清楚了吗?如此计算率合 适吗 ?
2. 统计表正确吗?
3. 统计图正确吗?
2021/3/7
7
2021/3/7
8
25
中位数计算公式
先将观察值按从小到大顺序排列,按以下公
检验,或是精确概率检验? ▪ 是配对设计,还是成组设计的四格表资料?
2021/3/7
15
误区4:统计检验决定论与统计无用论
▪ P值一定要小于0.05或者0.01才行吗? ▪ P值的决定因素您考虑了哪几个? ▪ 统计检验判断结果与专业判断结果相比,
哪个更重要?
2021/3/7
16
2. 数据特征与统计描述基本知识
一. 统计学应用中的常见误区
2021/3/7
1
问题1:统计学是数字游戏?
▪ 数字形式仅是表面现象。几个示例 ▪ 统计学(Statistics):是一门研究数据的搜集、整理、
分析的科学。更主要的是帮助人类探索未知事物 规律的工具。 ▪ 统计学存在的必要性?
2021/3/7
2
几个例子
▪ 2003年湖南省省级计划生育工作的人员总 数;
2021/3/7
20
1. 算术均数(mean)
符号:总体
样本 X
适用条件:资料呈对称分布,尤其是正态或近似正态。
计算: (1)直接法
(2)频数表法
XX 1X2 Xn X
n
n
X f1 X 1 f2 X 2 f3 X 3 fkX k fX i
f1 f2 f3 fk
fi
2. 几何均数(geometric mean)
2021/3/7
17
计量资料的常用统计指标
▪ 描述集中趋势的特征数(选代表) ▪ 描述离散趋势的特征数(代表程度)
▪ 目的:简单、明了传达信息
2021/3/7
18
问题:谁能一眼看出下述数据的分布规律?
表 某地150名正常成年男子红细胞数(1012/L)
编号 1 2 3 4 5 6 7 8
…
2021/3/7
2021/3/7
12
表10-3 不同心理分值的冠心病危险因素水平比较
2021/3/7
13
统计图的误导作用
直条图的纵轴 尺度起点必须为 零示意图
2021/3/7
14
问题3:t检验、卡方检验是万能的吗?
▪ 正态分布、方差齐性的条件满足了吗? ▪ 是t检验还是方差分析; ▪ 是t检验还是U检验? ▪ 是成组t检验还是配对t检验? ▪ 是t检验,还是校正t检验,或者是非参数检验? ▪ 对于计数资料,是通常的卡方检验,还是Yates校正
┇ 13.5465 72.2471
2021/3/7
24
3. 中位数(median)
定义:是将一批数据从小至大排列后位次居中的 数据值,反映一批观察值在位次上的平均水平。
符号:Md/M 适用条件:适合各种类型的资料。尤其适合于① 大样本偏态分布的资料; ②资料有不确定数值;③资 料分布不明等。
2021/3/7
▪ 2003年在湘雅医院出生的新生儿的平均体 重;
▪ 2003年中国艾滋病发病率; ▪ 湖南省65岁以上人群的平均血压;
2021/3/7
返回3
统计方法的主要应用
1. 通过种种手段以最合适的方法搜集数据。 2. 采用统计指标、统计表、统计图描述数据的
规律。 3. 采用合适的统计方法对数据进行分析,对整
红细胞数 3.98 4.54 4.74 5.13 4.43 4.81 4.98 3.79
…
编号
… 143 144 145 146 147 148 149 150
红细胞数
… 4.67 5.40 5.29 4.77 5.38 5.15 4.64 5.19
19
一、描述集中趋势的特征数(平均指标)
总称为平均数(average)反映了资料的集中趋势 ( central tendency )。常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median)
适用条件:呈倍数关系的等比资料或对数正 态分布(正偏态)资料;如抗体滴度资料。
XG n X1X2Xn
lgXG
1 n(lgX1
lgX2
lgXn)
lgX n
XG lg1
lgX n
2021/3/7
22
几何均数的示例
血清的抗体效价滴度的倒数分别为:10、100、 1000、10000、100000,求几