统计学方法的分类和选择
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
45
如何对数据资料进行一般性统计分析
46
47
成组
48
49
50
51
52
53
54
4-1
55
56
4-2
57
5
58
59
6
60
61
谢 谢!
62
2
□
来自百度文库
3
4
配对设计
5
6
7
8
9
10
11
12
数值变量
正态性检验
正态
数据转换
非正态
参数检验
非参数检验
13
单因素分析
分类变量
多因素分析
14
数据的转换
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
43
表4-1是统计数据库所要求的数据记录格式。各种试验和调查的原始记 录,无论数据是否录入计算机,都应该按表4-1的格式整理。整理后的 数据包括4种类型的变量:①标识变量,如动物编号、姓名等;②干预 变量,即试验性研究的处理因素,或观察性研究的危险因素;③协变量, 即需要进行控制和均衡性检查的因素;④反应变量,反映干预后的生物 效应,大多数研究同时记录多个反应变量。表4-1中,患者编号是标识 变量;治疗分组是干预变量;年龄、性别、职业是协变量;收缩压、舒 张压、心电图、疗效是反应变量。
42
统计资料类型
• 计量资料最为多见。统计上将计量资料又划分为 计量资料最为多见。 正态分布资料、偏态分布资料等类型。 正态分布资料、偏态分布资料等类型。对于偏态 分布资料,统计指标不宜用平均数、标准差, 分布资料,统计指标不宜用平均数、标准差,而 应用中位数、几何均数、四分位间距离等。 应用中位数、几何均数、四分位间距离等。 • 统计资料类型的判断失误是医学论文中统计误用 的根源之一。常见的问题有: 的根源之一。常见的问题有:不能正确区分资料 类型;计数资料比、率不分; 类型;计数资料比、率不分;计量资料不管是否 正态分布,一律计算均数、标准差;等级资料当 正态分布,一律计算均数、标准差; 做分类资料,配对资料和成组资料混淆等。 做分类资料,配对资料和成组资料混淆等。
38
39
• 实例及解析
40
如何正确区分资料类型
41
• 一项研究在完成了设立对照、随机分组和 一项研究在完成了设立对照、 样本大小估计等实验设计工作后, 样本大小估计等实验设计工作后,接下来 就是收集资料。在医学论文中一些统计描 就是收集资料。 述和统计分析方法的误用中, 述和统计分析方法的误用中,不能够正确 区分统计资料类型是一个重要原因。 区分统计资料类型是一个重要原因。
患者编号 年龄(岁) 性别
•
通常所说的资料三种类型,即计数资料、计量资料、等级资料, 通常所说的资料三种类型,即计数资料、计量资料、等级资料,是针对协 变量和反应变量而言,尤其是指反应变量的类型。 变量和反应变量而言,尤其是指反应变量的类型。计数资料是定性观察结 如表4-1中的性别、 职业、 心电图检查结果 , 统计指标是各个属性或 中的性别、 果 , 如表 中的性别 职业、心电图检查结果, 类别的计数、 结构百分比等;计量资料是定量观察结果, 类别的计数、率、结构百分比等;计量资料是定量观察结果,通常有度量 单位,如表4-1中的年龄 收缩压、舒张压,统计指标常用例数、平均数、 中的年龄、 单位 ,如表 中的年龄 、 收缩压 、舒张压, 统计指标常用例数、 平均数 、 标准差等;等级资料介于定性观察和定量观察之间, 标准差等;等级资料介于定性观察和定量观察之间,观察结果有等级或程 度上的差别,但不能用数量表示,如表4-1中的疗效评价 中的疗效评价。 度上的差别,但不能用数量表示,如表 中的疗效评价。
表 4-1 1 2 3 ┇ 100 37 45 43 ┇ 54 100 名高血压患者治疗 2 周后的临床记录 职业 工人 农民 干部 … 其它 治疗分组 收缩压(kPa) 舒张压(kPa) 心电图 甲药 对照 乙药 ┇ 乙药 18.67 20.00 17.33 ┇ 16.80 11.47 12.35 10.93 ┇ 11.73 正常 正常 正常 ┇ 正常 疗效 显效 有效 有效 ┇ 有效
1
在阅读生物医学杂志论文时,不难发现如下的现象: 在阅读生物医学杂志论文时,不难发现如下的现象:只要结果是定 量资料,人们普遍运用“ 检验” 单因素方差分析” 量资料,人们普遍运用“t 检验”、“单因素方差分析”或“秩和 检验”来处理。 检验”来处理。 事实上,在人们用前述方法处理的定量资料中, 事实上,在人们用前述方法处理的定量资料中,有相当多的定量资 料同时受到多个因素(通常包括实验因素和重要的非实验因素) 料同时受到多个因素(通常包括实验因素和重要的非实验因素)的 影响,即定量资料来自某种特定的多因素实验设计类型。这种用单 影响, 即定量资料来自某种特定的多因素实验设计类型。 因素设计定量资料的统计分析方法处理原本属于多因素实验设计的 定量资料,其结论的可信度大为降低,有时, 定量资料,其结论的可信度大为降低,有时,甚至会不可避免地得 出错误的结论。 出错误的结论。 同理,结果为定性资料时,很多人不管结果变量的具体情况, 同理,结果为定性资料时,很多人不管结果变量的具体情况,也不 管原因变量有多少个,甚至不管统计分析的目的是什么, 管原因变量有多少个,甚至不管统计分析的目的是什么,一律盲目 套用χ 检验。在采用其他统计分析方法时,也存在盲目套用的问题。 套用 2 检验。在采用其他统计分析方法时,也存在盲目套用的问题。 正因如此, 正因如此,使得我国乃至全世界生物医学杂志论文的质量令人担忧 (错误率平均约为80%),大大降低了科研工作的科学性和严谨性。 错误率平均约为 )
44
患者编号 年龄(岁) 性别 男 女 男 ┇ 女
表 4-1 1 2 3 ┇ 100 37 45 43 ┇ 54
100 名高血压患者治疗 2 周后的临床记录 职业 工人 农民 干部 … 其它 治疗分组 收缩压(kPa) 舒张压(kPa) 心电图 甲药 对照 乙药 ┇ 乙药 18.67 20.00 17.33 ┇ 16.80 11.47 12.35 10.93 ┇ 11.73 正常 正常 正常 ┇ 正常 疗效 显效 有效 有效 ┇ 有效 男 女 男 ┇ 女