[临床医学]常用医学统计方法 胡国清
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定义:是将一批数据从小至大排列后位次居中的 数据值,反映一批观察值在位次上的平均水平。
符号:Md/M 适用条件:适合各种类型的资料。尤其适合于① 大样本偏态分布的资料; ②资料有不确定数值;③资 料分布不明等。
此例的算术均数为22222 问题:描述此类型资料集中趋势时,为什么倾向选 用几何均数?
2020/11/29
24
频数表资料的几何均数
G l g 1
filfiX g i l g 1 f1 lX g 1 f2 lX g 2 fi fn lX g n
抗体滴度 ⑴
1:4 1:8 1:16 1:32 ┇ 1:512 合计
2020/11/29
13
表10-3 不同心理分值的冠心病危险因素水平比较
2020/11/29
14
统计图的误导作用
直条图的纵轴 尺度起点必须为 零示意图
2020/11/29
15
问题3:t检验、卡方检验是万能的吗?
▪ 正态分布、方差齐性的条件满足了吗? ▪ 是t检验还是方差分析; ▪ 是t检验还是U检验? ▪ 是成组t检验还是配对t检验? ▪ 是t检验,还是校正t检验,或者是非参数检验? ▪ 对于计数资料,是通常的卡方检验,还是Yates校正
XG n X1X2Xn
lgXG
1 n(lgX1
lgX2
lgXn)
lgX n
XG lg1
lgX n
2020/11/29
23
几何均数的示例
血清的抗体效价滴度的倒数分别为:10、100、 1000、10000、100000,求几何均数。
G lg 1 l1 g10 l1 g20 l1 g 530 l1 g40 l1 g50 100
2020/11/29
3
留给统计学的问题
▪ 如何简洁地、准确地从一大批杂乱无章 的数据中提炼出代表性信息?(统计描 述)
▪ 如何合理地由样本的信息(部分信息) 推断总体的信息(总体信息)?(统计 推断)
2020/11/29
6
统计方法的主要应用
1. 通过种种手段以最合适的方法搜集数据。 2. 采用统计指标、统计表、统计图描述数据的
检验,或是精确概率检验? ▪ 是配对设计,还是成组设计的四格表资料?
2020/11/29
16
误区4:统计检验决定论与统计无用论
▪ P值一定要小于0.05或者0.01才行吗? ▪ P值的决定因素您考虑了哪几个? ▪ 统计检验判断结果与专业判断结果相比,
哪个更重要?
2020/11/29
17
2. 数据特征与统计描述基本知识
总称为平均数(average)反映了资料的集中趋势 ( central tendency )。常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median)
2020/11/29
21
1. 算术均数(mean)
1. 极差:任何计量资料,是参考变异指标 2. 四分位数间距:与中位数配套用 3. 标准差 :与算术均数配套用 4. 变异系数 :描述对称分布(特别是正
态分布)资料的相对变异程度。
2020/11/29
11
示例1:率和构成比的区分
2020/11/29
12
示例2: 如某种疗法治疗5例病人5例全部治愈,则 计算治愈率为5/5×100% =100%,若4例 治愈,则治愈率为4/5×100% =80%,由 100%至80%波动幅度较大,但实际上只有 1例的变化。
常用医学统计分析方法基本知识
胡国清 副教授
中南大学公共卫生学院流行病与卫生统计学系
2020/11/29
1
一. 统计学应用中的常见误区
2020/11/29
2
问题1:统计学是数字游戏?
▪ 数字形式仅是表面现象。几个示例 ▪ 统计学(Statistics):是一门研究数据的搜集、整理、
分析的科学。更主要的是帮助人类探索未知事物 规律的工具。 ▪ 统计学存在的必要性?
2020/11/29
8
2020/11/29
9
▪ 集中趋势的描述——平均数平均数:描 述一组变量值的集中位置或平均水平的 指标体系。
1. (算术)均数:对称分布,尤其是正态分 布;
2. 几何均数:对数转换后呈对称分布,尤 其是对数正态分布;
3. 中位数 :一般偏态分布;
2020/11/29
10
▪ 离散趋势描述:描述一组变量值的离散 趋势或变异程度的指标体系。
规律。 3. 采用合适的统计方法对数据进行分析,对整
个研究的结果下结论。
2020/11/29
7
问题2:数据被恰当地表达了吗?
1. 统计指标的使用准确吗?
▪
X S 还是
X
S X
?各自使用的条件是什么?
▪
是万用通行证吗?
▪ 率X 与S 构成比 搞清楚了吗?如此计算率合 适吗 ?
2. 统计表正确吗?
3. 统计图正确吗?
人数, f ⑵
1 5 6 2 ┇ 5 72
滴度倒数, X ⑶
4 8 16 32 ┇ 512
lgX ⑷
0.6021 0.9031 1.2041 1.5051
┇ 2.7093
f·lgX ⑸
0.6021 4.5155 7.2246 3.0102
┇ 13.5465 72.2471
2020/11/29
25
3. 中位数(median)
…
2020/11/29
红细胞数 3.98 4.54 4.74 5.13 4.43 4.81 4.98 3.79
…
编号
… 143 144 145 146 147 148 149 150
红细胞数
… 4.67 5.40 5.29 4.77 5.ຫໍສະໝຸດ Baidu8 5.15 4.64 5.19
20
一、描述集中趋势的特征数(平均指标)
2020/11/29
18
计量资料的常用统计指标
▪ 描述集中趋势的特征数(选代表) ▪ 描述离散趋势的特征数(代表程度)
▪ 目的:简单、明了传达信息
2020/11/29
19
问题:谁能一眼看出下述数据的分布规律?
表 某地150名正常成年男子红细胞数(1012/L)
编号 1 2 3 4 5 6 7 8
符号:总体
样本 X
适用条件:资料呈对称分布,尤其是正态或近似正态。
计算: (1)直接法
(2)频数表法
XX1X2 XnX
n
n
X f1 X 1 f2 X 2 f3 X 3 fkX k fX i
f1 f2 f3 fk
fi
2. 几何均数(geometric mean)
适用条件:呈倍数关系的等比资料或对数正 态分布(正偏态)资料;如抗体滴度资料。
符号:Md/M 适用条件:适合各种类型的资料。尤其适合于① 大样本偏态分布的资料; ②资料有不确定数值;③资 料分布不明等。
此例的算术均数为22222 问题:描述此类型资料集中趋势时,为什么倾向选 用几何均数?
2020/11/29
24
频数表资料的几何均数
G l g 1
filfiX g i l g 1 f1 lX g 1 f2 lX g 2 fi fn lX g n
抗体滴度 ⑴
1:4 1:8 1:16 1:32 ┇ 1:512 合计
2020/11/29
13
表10-3 不同心理分值的冠心病危险因素水平比较
2020/11/29
14
统计图的误导作用
直条图的纵轴 尺度起点必须为 零示意图
2020/11/29
15
问题3:t检验、卡方检验是万能的吗?
▪ 正态分布、方差齐性的条件满足了吗? ▪ 是t检验还是方差分析; ▪ 是t检验还是U检验? ▪ 是成组t检验还是配对t检验? ▪ 是t检验,还是校正t检验,或者是非参数检验? ▪ 对于计数资料,是通常的卡方检验,还是Yates校正
XG n X1X2Xn
lgXG
1 n(lgX1
lgX2
lgXn)
lgX n
XG lg1
lgX n
2020/11/29
23
几何均数的示例
血清的抗体效价滴度的倒数分别为:10、100、 1000、10000、100000,求几何均数。
G lg 1 l1 g10 l1 g20 l1 g 530 l1 g40 l1 g50 100
2020/11/29
3
留给统计学的问题
▪ 如何简洁地、准确地从一大批杂乱无章 的数据中提炼出代表性信息?(统计描 述)
▪ 如何合理地由样本的信息(部分信息) 推断总体的信息(总体信息)?(统计 推断)
2020/11/29
6
统计方法的主要应用
1. 通过种种手段以最合适的方法搜集数据。 2. 采用统计指标、统计表、统计图描述数据的
检验,或是精确概率检验? ▪ 是配对设计,还是成组设计的四格表资料?
2020/11/29
16
误区4:统计检验决定论与统计无用论
▪ P值一定要小于0.05或者0.01才行吗? ▪ P值的决定因素您考虑了哪几个? ▪ 统计检验判断结果与专业判断结果相比,
哪个更重要?
2020/11/29
17
2. 数据特征与统计描述基本知识
总称为平均数(average)反映了资料的集中趋势 ( central tendency )。常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median)
2020/11/29
21
1. 算术均数(mean)
1. 极差:任何计量资料,是参考变异指标 2. 四分位数间距:与中位数配套用 3. 标准差 :与算术均数配套用 4. 变异系数 :描述对称分布(特别是正
态分布)资料的相对变异程度。
2020/11/29
11
示例1:率和构成比的区分
2020/11/29
12
示例2: 如某种疗法治疗5例病人5例全部治愈,则 计算治愈率为5/5×100% =100%,若4例 治愈,则治愈率为4/5×100% =80%,由 100%至80%波动幅度较大,但实际上只有 1例的变化。
常用医学统计分析方法基本知识
胡国清 副教授
中南大学公共卫生学院流行病与卫生统计学系
2020/11/29
1
一. 统计学应用中的常见误区
2020/11/29
2
问题1:统计学是数字游戏?
▪ 数字形式仅是表面现象。几个示例 ▪ 统计学(Statistics):是一门研究数据的搜集、整理、
分析的科学。更主要的是帮助人类探索未知事物 规律的工具。 ▪ 统计学存在的必要性?
2020/11/29
8
2020/11/29
9
▪ 集中趋势的描述——平均数平均数:描 述一组变量值的集中位置或平均水平的 指标体系。
1. (算术)均数:对称分布,尤其是正态分 布;
2. 几何均数:对数转换后呈对称分布,尤 其是对数正态分布;
3. 中位数 :一般偏态分布;
2020/11/29
10
▪ 离散趋势描述:描述一组变量值的离散 趋势或变异程度的指标体系。
规律。 3. 采用合适的统计方法对数据进行分析,对整
个研究的结果下结论。
2020/11/29
7
问题2:数据被恰当地表达了吗?
1. 统计指标的使用准确吗?
▪
X S 还是
X
S X
?各自使用的条件是什么?
▪
是万用通行证吗?
▪ 率X 与S 构成比 搞清楚了吗?如此计算率合 适吗 ?
2. 统计表正确吗?
3. 统计图正确吗?
人数, f ⑵
1 5 6 2 ┇ 5 72
滴度倒数, X ⑶
4 8 16 32 ┇ 512
lgX ⑷
0.6021 0.9031 1.2041 1.5051
┇ 2.7093
f·lgX ⑸
0.6021 4.5155 7.2246 3.0102
┇ 13.5465 72.2471
2020/11/29
25
3. 中位数(median)
…
2020/11/29
红细胞数 3.98 4.54 4.74 5.13 4.43 4.81 4.98 3.79
…
编号
… 143 144 145 146 147 148 149 150
红细胞数
… 4.67 5.40 5.29 4.77 5.ຫໍສະໝຸດ Baidu8 5.15 4.64 5.19
20
一、描述集中趋势的特征数(平均指标)
2020/11/29
18
计量资料的常用统计指标
▪ 描述集中趋势的特征数(选代表) ▪ 描述离散趋势的特征数(代表程度)
▪ 目的:简单、明了传达信息
2020/11/29
19
问题:谁能一眼看出下述数据的分布规律?
表 某地150名正常成年男子红细胞数(1012/L)
编号 1 2 3 4 5 6 7 8
符号:总体
样本 X
适用条件:资料呈对称分布,尤其是正态或近似正态。
计算: (1)直接法
(2)频数表法
XX1X2 XnX
n
n
X f1 X 1 f2 X 2 f3 X 3 fkX k fX i
f1 f2 f3 fk
fi
2. 几何均数(geometric mean)
适用条件:呈倍数关系的等比资料或对数正 态分布(正偏态)资料;如抗体滴度资料。