统计学方法的分类和选择 ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同理,结果为定性资料时,很多人不管结果变量的具体情况,也不 管原因变量有多少个,甚至不管统计分析的目的是什么,一律盲目 套用χ2 检验。在采用其他统计分析方法时,也存在盲目套用的问题。 正因如此,使得我国乃至全世界生物医学杂志论文的质量令人担忧 (错误率平均约为80%),大大降低了科研工作的科学性和严谨性。
-
1
在阅读生物医学杂志论文时,不难发现如下的现象:只要结果是定 量资料,人们普遍运用“t 检验”、“单因素方差分析”或“秩和检 验”来处理。
事实上,在人们用前述方法处理的定量资料中,有相当多的定量资 料同时受到多个因素(通常包括实验因素和重要的非实验因素)的 影响,即定量资料来自某种特定的多因素实验设计类型。这种用单 因素设计定量资料的统计分析方法处理原本属于多因素实验设计的 定量资料,其结论的可信度大为降低,有时,甚至会不可避免地得 出错误的结论。
表 4-1 100 名高血压患者治疗 2 周后的临床记录
患者编号 年龄(岁) 性别 职业 治疗分组 收缩压(kPa) 舒张压(kPa) 心电图
1
37 男 工人 甲药
1Leabharlann Baidu.67
2
45 女 农民 对照
20.00
3
43 男 干部 乙药
17.33
┇
┇ ┇…
┇
┇
100
54 女 其它 乙药
16.80
11.47 12.35 10.93
-
42
统计资料类型
• 计量资料最为多见。统计上将计量资料又划分为 正态分布资料、偏态分布资料等类型。对于偏态 分布资料,统计指标不宜用平均数、标准差,而 应用中位数、几何均数、四分位间距离等。
• 统计资料类型的判断失误是医学论文中统计误用 的根源之一。常见的问题有:不能正确区分资料 类型;计数资料比、率不分;计量资料不管是否 正态分布,一律计算均数、标准差;等级资料当 做分类资料,配对资料和成组资料混淆等。
┇ 11.73
正常 正常 正常
┇ 正常
-
疗效 显效 有效 有效
┇ 有效
44
表 4-1 100 名高血压患者治疗 2 周后的临床记录
患者编号 年龄(岁) 性别 职业 治疗分组 收缩压(kPa) 舒张压(kPa) 心电图
1
37
男 工人 甲药
18.67
11.47
正常
2
45
女 农民 对照
20.00
12.35
-
2
□
-
3
-
4
配对设计
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
数值变量
正态性检验
正态
数据转换
非正态
参数检验
非参数检验
-
13
分类变量
单因素分析 多因素分析
-
14
数据的转换
-
15
-
16
-
17
-
18
-
19
-
20
-
21
-
22
-
23
-
24
-
25
-
26
-
27
-
28
-
29
-
30
-
31
-
32
-
33
-
34
-
35
-
36
-
37
-
38
-
39
• 实例及解析
-
40
如何正确区分资料类型
-
41
• 一项研究在完成了设立对照、随机分组和 样本大小估计等实验设计工作后,接下来 就是收集资料。在医学论文中一些统计描 述和统计分析方法的误用中,不能够正确 区分统计资料类型是一个重要原因。
-
43
表4-1是统计数据库所要求的数据记录格式。各种试验和调查的原始记 录,无论数据是否录入计算机,都应该按表4-1的格式整理。整理后的 数据包括4种类型的变量:①标识变量,如动物编号、姓名等;②干预 变量,即试验性研究的处理因素,或观察性研究的危险因素;③协变量, 即需要进行控制和均衡性检查的因素;④反应变量,反映干预后的生物 效应,大多数研究同时记录多个反应变量。表4-1中,患者编号是标识 变量;治疗分组是干预变量;年龄、性别、职业是协变量;收缩压、舒 张压、心电图、疗效是反应变量。
-
45
如何对数据资料进行一般性统计分析
-
46
-
47
成组
-
48
-
49
-
50
-
51
-
52
-
53
-
54
4-1
-
55
-
56
4-2
-
57
5
-
58
-
59
6
-
60
-
61
谢 谢!
-
62
正常
3
43
男 干部 乙药
17.33
10.93
正常
┇
┇
┇
…
┇
┇
┇
┇
100
54
女 其它 乙药
16.80
11.73
正常
疗效 显效 有效 有效
┇ 有效
• 通常所说的资料三种类型,即计数资料、计量资料、等级资料,是针对协 变量和反应变量而言,尤其是指反应变量的类型。计数资料是定性观察结 果,如表4-1中的性别、职业、心电图检查结果,统计指标是各个属性或 类别的计数、率、结构百分比等;计量资料是定量观察结果,通常有度量 单位,如表4-1中的年龄、收缩压、舒张压,统计指标常用例数、平均数、 标准差等;等级资料介于定性观察和定量观察之间,观察结果有等级或程 度上的差别,但不能用数量表示,如表4-1中的疗效评价。
-
1
在阅读生物医学杂志论文时,不难发现如下的现象:只要结果是定 量资料,人们普遍运用“t 检验”、“单因素方差分析”或“秩和检 验”来处理。
事实上,在人们用前述方法处理的定量资料中,有相当多的定量资 料同时受到多个因素(通常包括实验因素和重要的非实验因素)的 影响,即定量资料来自某种特定的多因素实验设计类型。这种用单 因素设计定量资料的统计分析方法处理原本属于多因素实验设计的 定量资料,其结论的可信度大为降低,有时,甚至会不可避免地得 出错误的结论。
表 4-1 100 名高血压患者治疗 2 周后的临床记录
患者编号 年龄(岁) 性别 职业 治疗分组 收缩压(kPa) 舒张压(kPa) 心电图
1
37 男 工人 甲药
1Leabharlann Baidu.67
2
45 女 农民 对照
20.00
3
43 男 干部 乙药
17.33
┇
┇ ┇…
┇
┇
100
54 女 其它 乙药
16.80
11.47 12.35 10.93
-
42
统计资料类型
• 计量资料最为多见。统计上将计量资料又划分为 正态分布资料、偏态分布资料等类型。对于偏态 分布资料,统计指标不宜用平均数、标准差,而 应用中位数、几何均数、四分位间距离等。
• 统计资料类型的判断失误是医学论文中统计误用 的根源之一。常见的问题有:不能正确区分资料 类型;计数资料比、率不分;计量资料不管是否 正态分布,一律计算均数、标准差;等级资料当 做分类资料,配对资料和成组资料混淆等。
┇ 11.73
正常 正常 正常
┇ 正常
-
疗效 显效 有效 有效
┇ 有效
44
表 4-1 100 名高血压患者治疗 2 周后的临床记录
患者编号 年龄(岁) 性别 职业 治疗分组 收缩压(kPa) 舒张压(kPa) 心电图
1
37
男 工人 甲药
18.67
11.47
正常
2
45
女 农民 对照
20.00
12.35
-
2
□
-
3
-
4
配对设计
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
数值变量
正态性检验
正态
数据转换
非正态
参数检验
非参数检验
-
13
分类变量
单因素分析 多因素分析
-
14
数据的转换
-
15
-
16
-
17
-
18
-
19
-
20
-
21
-
22
-
23
-
24
-
25
-
26
-
27
-
28
-
29
-
30
-
31
-
32
-
33
-
34
-
35
-
36
-
37
-
38
-
39
• 实例及解析
-
40
如何正确区分资料类型
-
41
• 一项研究在完成了设立对照、随机分组和 样本大小估计等实验设计工作后,接下来 就是收集资料。在医学论文中一些统计描 述和统计分析方法的误用中,不能够正确 区分统计资料类型是一个重要原因。
-
43
表4-1是统计数据库所要求的数据记录格式。各种试验和调查的原始记 录,无论数据是否录入计算机,都应该按表4-1的格式整理。整理后的 数据包括4种类型的变量:①标识变量,如动物编号、姓名等;②干预 变量,即试验性研究的处理因素,或观察性研究的危险因素;③协变量, 即需要进行控制和均衡性检查的因素;④反应变量,反映干预后的生物 效应,大多数研究同时记录多个反应变量。表4-1中,患者编号是标识 变量;治疗分组是干预变量;年龄、性别、职业是协变量;收缩压、舒 张压、心电图、疗效是反应变量。
-
45
如何对数据资料进行一般性统计分析
-
46
-
47
成组
-
48
-
49
-
50
-
51
-
52
-
53
-
54
4-1
-
55
-
56
4-2
-
57
5
-
58
-
59
6
-
60
-
61
谢 谢!
-
62
正常
3
43
男 干部 乙药
17.33
10.93
正常
┇
┇
┇
…
┇
┇
┇
┇
100
54
女 其它 乙药
16.80
11.73
正常
疗效 显效 有效 有效
┇ 有效
• 通常所说的资料三种类型,即计数资料、计量资料、等级资料,是针对协 变量和反应变量而言,尤其是指反应变量的类型。计数资料是定性观察结 果,如表4-1中的性别、职业、心电图检查结果,统计指标是各个属性或 类别的计数、率、结构百分比等;计量资料是定量观察结果,通常有度量 单位,如表4-1中的年龄、收缩压、舒张压,统计指标常用例数、平均数、 标准差等;等级资料介于定性观察和定量观察之间,观察结果有等级或程 度上的差别,但不能用数量表示,如表4-1中的疗效评价。