统计分析思路

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学分析基本思路指南

医学统计学的学习一定要以理解为主。对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。

尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。更实际的分析思路是:

(1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、χ2检验、非参数检验等。二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。

(2)明确数据类型,根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可

用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。

(3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。

(4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理专业结论。

下面是本人简单总结的常用方法的选择,可供读者参考。如有引用本图者,请注明引自《医学案例统计分析与SAS应用》一书,谢谢。

转自medsci网站

日志

返回日志列表

[转] 医学统计学总结2013-12-22 20:10阅读(1)转载自星之所在

•赞(234)

•评论

•转载(3717)

•分享(1121)

•复制地址

•收藏夹按钮收藏

•更多

上一篇 | 下一篇:麻雀虽小五脏俱全...

一、两组或多组计量资料的比较

1.两组资料:

1)大样本资料或服从正态分布的小样本资料

(1)若方差齐性,则作成组t检验

(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验

2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验

2.多组资料:

1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计

选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。

2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有

析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。

二、分类资料的统计分析

1.单样本资料与总体比较

1)二分类资料:

(1)小样本时:用二项分布进行确切概率法检验;

(2)大样本时:用U检验。

2)多分类资料:用Pearson c2检验(又称拟合优度检验)。

2. 四格表资料

1)n>40并且所以理论数大于5,则用Pearson c2

2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验

3)n£40或存在理论数<1,则用Fisher’s 检验

3. 2×C表资料的统计分析

1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩

2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验

3)行变量和列变量均为无序分类变量

(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2

(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验

4. R×C表资料的统计分析

1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验

2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的

3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析

4)列变量和行变量均为无序多分类变量,

(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2

(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验

三、Poisson分布资料

1.单样本资料与总体比较:

1)观察值较小时:用确切概率法进行检验。

2)观察值较大时:用正态近似的U检验。

2.两个样本比较:用正态近似的U检验。

配对设计或随机区组设计四、两组或多组计量资料的比较

1.两组资料:

1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验

2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验

2.多组资料:

1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。

2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。

五、分类资料的统计分析

1.四格表资料

1)b+c>40,则用McNemar配对c2检验或配对边际c2检验

2)b+c£40,则用二项分布确切概率法检验

2.C×C表资料:

1)配对比较:用McNemar配对c2检验或配对边际c2检验

2)一致性问题(Agreement):用Kap检验

变量之间的关联性分析六、两个变量之间的关联性分析

1.两个变量均为连续型变量

1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析

2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析

2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析

3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析

七、回归分析

1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线称为简单回归),否则应作适当的变换,使其满足上述条件。

2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校用

3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量1)非配对的情况:用非条件Logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校用

2)配对的情况:用条件Logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校用

4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

相关文档
最新文档