常用医学统计学方法汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
选择合适的统计学方法
1连续性资料
1.1 两组独立样本比较
1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。
1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。
1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。
1.2 两组配对样本的比较
1.2.1 两组差值服从正态分布,采用配对t检验。
1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。
1.3 多组完全随机样本比较
1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。
如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe 法,SNK法等。
1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。
如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。
1.4 多组随机区组样本比较
1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。
如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe 法,SNK法等。
1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。
如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。
****需要注意的问题:
(1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。
因为统计学上有中心极限定理,假定大样本是服从正态分布的。
(2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。
正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD 检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**
(3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。
常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。
2.分类资料
2.1 四格表资料
2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。
2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的检验或Fisher’s 确切概率法检验。
2.1.3 例数小于40,或有理论数小于2,则用Fi sher’s确切概率法检验。
2.2 2×C表或R×2表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<
总格子数目的25%,则用普通的Pearson 检验。
(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。
2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。
2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.3 R×C表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<
总格子数目的25%,则用普通的Pearson 检验。
(2)例数小于40,或理论数小于5的格子数目>
总格子数目的25%,则用Fisher’s确切概率法检验。
(3)如果要作相关性分析,可采用Pearson 相关系数。
2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。
2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。
如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
(2)如果要做两变量之间的相关性,可采用Spearson 相关分析。
2.4 配对分类资料的统计分析
2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对检验。
(2)b+c<40,则用校正的配对检验。
2.4.1 C×C资料,(1)配对比较:用McNemar配对检验。
(2)一致性检验,用Kappa检验。
在SPSS软件相关分析中,pearson(皮尔逊), kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同
两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.
Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。
对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。
Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
Kendall's tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。
对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;
计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据; 计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。
计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用spearman或kendall相关
Pearson 相关复选项积差相关计算连续变量或是等间距测度的变量间的相关分析
Kendall 复选项等级相关计算分类变量间的秩相关,适用于合并等级资料
Spearman 复选项等级相关计算斯皮尔曼相关,适用于连续等级资料
注:
1若非等间距测度的连续变量因为分布不明-可用等级相关/也可用Pearson 相关,对于完全等级离散变量必用等级相关
2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用Spearman
或Kendall相关。
3 若不恰当用了Kendall 等级相关分析则可能得出相关系数偏小的结论。
则若不恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。
对一般情况默认数据服从正态分布的,故用Pearson分析方法。
在SPSS里进入Correlate-》Bivariate,在变量下面Correlation Coefficients复选框组里有3个选项:
Pearson
Kendall's tau-b
Spearman:Spearman
spearman(斯伯曼/斯皮尔曼)相关系数
斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。
它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”
斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究
Kendall's相关系数
肯德尔(Kendall)W系数又称和谐系数,是表示多列等级变量相关程度的一种方法。
适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物。
等级评定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1 ,最大的为N,若并列等级时,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。
肯德尔(Kendall)U系数又称一致性系数,是表示多列等级变量相关程度的一种方法。
该方法同样适用于让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物所得的数据资料,只不过评定时采用对偶评定的方法,即每一次评定都要将N个事物两两比较,评定结果如下表所示,表格中空白位(阴影部分可以不管)填入的数据为:若i比j好记1,若i比j 差记0,两者相同则记0.5。
一共将得到K张这样的表格,将这K张表格重叠起来,对应位置的数据累加起来作为最后进行计算的数据,这些数据记为γij。
正态分布的相关检验
对来自正态总体的两个样本进行均值比较常使用T检验的方法。
T检验要求两个被比较的样本来自正态总体。
两个样本方差相等与不等时用的计算T值的公式不同。
进行方差齐次性检验使用F检验。
对应的零假设是:两组样本方差相等。
P值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显着性差异。
U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。
在这种情况下总体方差通常是已知的。
虽然T检验法与U检验法所解决的问题大体相同,但在小样本(样本数n)=30作为大样本)且均方差未知的情况下就不能用U检验法了。
均值检验时不同的数据使用不同的统计量
使用MEANS过程求若干组的描述统计量,目的在于比较。
因此必须分组求均值。
这是与Descriptives过程不同之处。
检验单个变量的均值是否与给定的常数之间存在差异,用One-Sample T Test 单样本T检验过程。
检验两个不相关的样本是否来自来具有相同均值的总体,用Independent-Samples T test 独立样本t检验过程。
如果分组样本不独立,用Paired Sample T test 配对t检验。
如果分组不止两个,应使用One-Way ANOVO一元方差分析(用于检验几个独立的组,是否来自均值相等的总体)过程进行单变量方差分析。
如果试图比较的变量明显不服从正态分布,则应该考虑使用一种非参数检验过程Nonparametric test.
如果用户相比较的变量是分类变量,应该使用Crosstabs功能。
当样本值不能为负值时用右侧单边检验
医学科研中常用医学统计学方法
统计学是一门透过同质事物的变异性、揭示内在事物规律性和实质性的科学,确切地讲,是一门关于客观数据分析的科学,研究数据的收集、整理和分析,包括理论和应用两个方面。
医学应用统计学,侧重于实际应用,是在传承和借鉴传统医学统计学“理论·原理·公式·应用”模式基础上,创造性地以“目的·数据库一变量类型一变量间关系”模式为指导的统计学。
它遵循简单实用的原则,力避复杂的数学原理和公式推导,以解决实际问题为导向,以建立统计数据库、分清变量类型为基础,以分析变量与变量间关系为核心阐述统计学分析方法,对于广大医学科研工作者,具有内容简单、思维明确、操作可行、方法实用的特点。
因此,学好用好医学应用统计学需要掌握如下一些基本方法。
一、明确研究目的和研究设计
研究目的是研究设计的目标和方向,科学研究的基本要素及其基本原则是科研设计的基础和指南。
完整的科研设计包括专业设计和统计设计两部分:专业设计是指课题的实际意义和研究价值,入选对象的诊断标准、纳入标准及排除标准等,决定研究课题的先进性和实用性;统计设计包括选择研究类型与设计方案,确定研究总体、样本量、观察指标、随机化分组或抽样方法,以及数据的质量控制和统计分析方法等,影响课题的可信度和科学价值。
因此,正确的统计学分析一定要建立在明确的研究目的和研究设计的基础之上,那些事先没有研究目的和研究设计,事后找来一堆数据进行统计分析都是不可取的。
在医学论文的撰、编、审、读过程中经常遇到的问题是研究的题目与课题设计、论文内容不符,包括文章的方法解决不了论文的目的、文章的结果说明不了论文的题目、文章的讨论偏离了论文的主题;还有是目的不明确、设计不合理。
如题目过小,论文不够字数,而一些无关紧要的变量指标或结果被分析被讨论;又如题目过大,论文的全部内容不足以说明研究的目的,使论文的论点难以立足。
所以,合理明确的论文题目或目的以及研究设计方案是撰、编、审、读者应当关注的首要问题。
此外,样本含量是否满足,抽样是否随机,偏倚是否控制等,也是不可忽视的问题。
二、建好分析用的数据库
数据库即存放数据的“仓库”,是指将不同研究对象不同观测指标的观察结果逐一有序记录的二维表格形式。
二维表中除第一行属于观察指标外,其余每一行代表一个观察对象的所有观察指标值(即数据);每一列代表某项观察指标所有观察对象的观察值。
严格的数据库数据可以直接应用相关软件进行统计分析。
由于不同软件对文字存在可识别性问题,一般在统计分析时要求数据库的数据值全部用阿拉伯数字表示,必要时可在适当位置附加批注。
对于论文作者来讲,统计分析需要借助于统计分析软件计算,而统计分析软件都要有完整、符合要求的数据或数据库,所以建好分析数据库是统计分析的需要。
此外,建好分析数据库还可以理清分析思路。
在试验或调查研究中获取的数据有时多而零散,如果不能进行科学的整理汇总,就会显得杂乱无章,理不清头绪,抓不住要点,甚至无所适从,最后可能束之高阁、弃之不用,造成数据的极大浪费。
相反,建好数据库,可以使观察对象的研究指标一目了然,使研究思路清晰明确。
因此,建好数据库是正确统计分析的前提和基础,甚至决定了论文分析结果的成败。
对于编、审、读者来讲,一般由于篇幅的限制,往往得不到数据库数据,而只有作者在数据库数据基础上经统计描述计算后给出的诸如各指标均数?x、标准差s 或中位数M、百分位数Px 的“二手”数据,或将研究对象的某一指标按其数值大小或特征属性分组,清点各组观察单位出现的个数或频数的频数表数据等。
无论是否能够得到数据库数据,作者在统计分析过程中一定依据数据库数据进行计算,得出结果。
如果对“二手”数据或频数表数据的结果等存在疑惑,编辑、审稿专家或读者有权要求作者提供数据库数据以检查其完整性、准确性和真实性,确保研究数据的质量。
假若在投稿须知中对数据库数据作出必要的要求,无疑对于保证刊物的发表质量有着积极的意义。
三、分清楚指标(或变量)的性质和类型
指标,即观察指标,是由研究目的确定的观察对象的内在属性特征或其相关的影响因素。
例如,需要研究本体感觉训练对脑卒中偏瘫患者运动功能(本体感觉、平衡功能)的影响,那么本体感觉、平衡功能反映了脑卒中偏瘫患者运动功能的特征,分别称为研究的本体感觉指标、平衡功能指标,影响本体感觉和平衡功能的有关因素,比如年龄、性别、病种、病程等,称为研究的年龄指标、性别指标、病种指标和病程指标。
变量即观察变量,也称变化的量,实际上就是观察指标,一般特指用于数学、统计或软件计算的分析指标。
例如,脑卒中偏瘫患者运动功能的本体感觉、平衡功能指标,在统计计算时,分别称为本体感觉变量和平衡功能变量。
按变量是否影响其它变量或是否受到其它变量的影响有影响变量和结果变量之分。
影响变量,也称自变量,是指自身变化并影响结果变量变化的量;结果变量,又称因变量,是指随影响变量变化而变化的量,看作是影响变量变化的结果。
如果分析康复训练对冠心病患者有氧运动功能的影响,那么康复训练可看作是影响变量,有氧运动功能则为结果变量;如果分析不同性别之间冠心病患者有氧运动功能是否存在统计学差异,那么性别是影响变量,有氧运动功能是结果变量。
分清楚变量的性质,即什么是结果变量、什么是影响变量,是选择统计分析方法的第一步。
一般而言,那些相对固有的、不易改变的特征(如性别、籍贯等)或易于被人控制的处理因素(如实验分组、疫苗接种与否等)作为影响变量或影响因素;而那些容易变化、较难确定的观察效应或结局(如疗效、患病与否等)作为结果变量,看成是最后观察的结果。
但影响变量和结果变量的划分是相对的,视研究目的和具体情况而定,有时甚至不加区分。
从数据库、数据分析的角度来看,变量是指那些能反映数据库数据的内在数量关系,可用于统计计算包括软件计算的指标。
一般而言,不同的研究目的决定了不同的数据库,实际上决定了组成数据库的不同变量。
变量的类型分为数值变量和分类变量。
数值变量,又称定量变量,是指能用定量方法测定的、具有数值大小、高低或多少的指标,变量值一般有度量衡单位,可以带小数点,如身高、体重、血压等;分类变量,又称定性变量,是指能用定性的方法确定的、观察单位某项属性或特征分类的指标。
根据分类变量的分类项数和各项数间有无等级程度差异分为二项分类变量、多项无序分类变量、多项有序分类变量,如表1。
表1? 分类变量的不同类别与举例
从应用统计学选择统计分析方法的角度考虑,变量可考虑分为数值变量、多项有序分类变量、多项无序分类变量、二项分类变量四种。
此外,不同类别变量可遵循下列顺序转化:数值变量一多项有序分类变量一多项无序分类变量一- 项分类变量,称为降级转化,但这种转化过程会不断丧失蕴藏的数据信息,导致统计分析过程中假阴性结果的不断增加。
至于逆向转化即升级转化,尽管理论上认同,但实际应用中不建议采用。
很多研究表明,掌握好统计分析的应用条件,正确选择统计分析方法是学习并应用统计学的一个突出难点。
对于医学论文作者而言,分清楚数据库中变量的性质(影响变量与结果变量)、类型(数值变量、多项有序分类变量、多项无序分类变量、二项分类变量)以及它们之间的降级转化关系(数值变量一多项有序分类变量一多项无序分类变量一二项分类变量)是学好用好应用统
计分析的基础,可以有效避免张冠李戴、缺乏原则地选错统计分析方法;对于文章的编审和读者来说,这是判断作者正确选择统计学分析方法与否的一个简单有效的途径。
四、正确选用统计学方法
应用统计学(严格而言是指统计学的假设检验)可以简单地看作是一门关于结果变量与影响变量之间关系分析的科学。
由于结果变量(因变量)、影响变量(自变量)各有4 种类型,所以相互组合有16 种情形,相对应的有16 种首选的统计分析方法(表2 中第一个或用☆表示的方法),如,二项分类变量与二项分类变量关系的分析选用两个率比较的X2 检验(四格表X2 检验),二项分类变量与多项无序分类变量关系的分析选用多个率比较的X2 检验,多项无序分类变量与二项分类变量关系的分析选用两个构成比比较的X2 检验,多项无序分类变量与多项无序分类变量关系的分析选用多个构成比比较的x2 检验.
数值变量与二项分类变量关系的分析选用t- 检验,数值变量与多项无序分类变量关系的分析选用完全随机设计的,F- 检验,数值变量与数值变量关系的分析选用Pearson 直线相关回归分析,等等。
如果首选统计方法的条件不适合,一般通过降级转化选择“低”一级或“低”二级、三级的统计方法或其它统计方法。
如,t 一检验是数值变量与二项分类变量关系分析时首选的统计方法,如果该方法的条件不适合,此时将- 检验中数值变量“降级”当作多项有序分类变量看待,故可次选Wilcoxon 秩和检验,如果再“降级”,依次低选两构成比比较的x2 检验,甚至四格表X2 检验。
又如,如果Pearson 直线相关回归分析的条件不符合,可根据情况将其中的一个或两个数值变量“降一级”,选择Spearman 等级相关,如果再“降级”,相应可以选择秩和检验、Logistic 回归或者t 一检验、X2 检验,等等。
其它仿此,详见表2。
它涵盖了基本统计分析的绝大部分,是应用统计分析的核心内容。
当然,应用统计分析除了单一变量分析、两变量间关系的分析以外,其它诸如一个自变量和多个因变量、多个自变量和多个因变量之间关系的分析当属多变量关系分析的内容。
由于分类变量与数值变量各不相同,不同个数不同变量的组合方式多种多样,所以相应的统计方法也有很多种,主要有:1 个数值变量与多个数值变量之间的关系,如多元相关回归分析;1 个分类变量与多个数值变量之间的关系,如多因素方差分析、重复设计方差分析;l 个数值变量与混合多个变量之间的关系,如协方差分析、COx 模型;l 个分类变量与混合多变量之间的关系,如Logistic 回归分析;多个数值变量与多个数值变量之间的关系,如典则相关等。
表2 两变量关系分析的统计方法
因此,医学论文的作者,在分清楚数据库中分析变量的性质、类型和降级转化关系时,可以应用表2 迅速确定首选的统计方法以及备选或次选的统计方法,应用相关软件或计算工具快速实现统计分析。
医学论文的编审和读者也可应用该表2,准确判断作者是否正确选择
了统计学分析方法,甚至分析错误选择统计方法的原因与后果。
如,欲评价某种药物的降舒张压效果,试验组用该降压药、对照组不用药,假如测量的舒张压值符合t 检验的条件(正态分布、方差齐等),很明显该数据首选 f 检验的统计方法。
如果降级转化可以选择Wilcoxon 秩和检验,如果降压效果转化为有效和无效两种情况,
甚至可以选择四格表X2 检验。
但需要注意的是,如此降级选择统计方法,可能出现假阴性或漏诊错误,即把差异有统计学意义的结果(有降压效果)当作差异无统计学意义的结果(无降压效果)看待,从而低估药物的作用,在论文讨论中至少要加以必要的说明,否则统计方法不能视为正确有效,可作为退修或退稿处理。
五、熟悉常用的统计分析软件
统计分析软件是统计分析的必备工具,常用的统计分析软件有:统计分析系统SAS、社会学统计程序包SPSS、微软公司电子表格系统Microsoft Office Excel 等。
SAS(statistics analysis system) 是统计分析系统的英文缩称,最早由北卡罗来纳大学的两
位生物统计学研究生编制,1976 年由SAS 软件研究所正式推出。
SAS 完全针对专业用
户进行设计,以编程为主。
其最大特点是分析模块调用,功能强大,深浅皆宜,简短编程即可同时对多个数据文件进行分析。
但对一般用户而言,人机界面不太友好,最初编写使用程序时可能会存在各种难度。
SPSS(statistical package for the social science) 是社会学统计程序包的英文缩称,20 世
纪60 年代末由美国斯坦福大学的 3 位研究生研制,1975 年由芝加哥sPss 总部推出。
sPss 系统的最大特点是菜单操作,方法齐全,绘制图形、表格较为方便,输出结果比较
直观。
但其统计分析功能略显逊色,特别是难以同时分析处理多个数据文件。
Microsoft Office Excel 是美国微软公司开发的电子表格系统,是目前应用最为广泛的办公
室表格处理软件之一。
Excel 作为Office 软件的一员被众多用户所熟知,具有数据处理、函数运算、数据库、图表制作等功能,进行统计分析时具有易得,快速、直观、简单、运算可视等优点,是建立数据库,并进行常用统计分析的好工具。