SAS统计分析教程方法总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对定量结果进行差异性分析
1.单因素设计一元定量资料差异性分析
1.1.单因素设计一元定量资料t检验与符号秩和检验
T检验前提条件:定量资料满足独立性和正态分布,若不满足则进行单因素设计一元定量资料符号秩和检验。
1.2.配对设计一元定量资料t检验与符号秩和检验
配对设计:整个资料涉及一个试验因素的两个水平,并且在这两个水平作用下获得的相同指标是成对出现的,每一对中的两个数据来自于同一个个体或条件相近的两个个体。
1.3.成组设计一元定量资料t检验
成组设计定义:
设试验因素A有A1,A2个水平,将全部n(n最好是偶数)个受试对象随机地均分成2组,分别接受A1,A2,2种处理。再设每种处理下观测的定量指标数为k,当k=1时,属于一元分析的问题;当k≥2时,属于多元分析的问题。
在成组设计中,因2组受试对象之间未按重要的非处理因素进行两两配对,无法消除个体差异对观测结果的影响,因此,其试验效率低于配对设计。
T检验分析前提条件:
独立性、正态性和方差齐性。
1.4.成组设计一元定量资料Wilcoxon秩和检验
不符合参数检验的前提条件,故选用非参数检验法,即秩和检验。1.5.单因素k(k>=3)水平设计定量资料一元方差分析
方差分析是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。
方差分析的假定条件为:
(1)各处理条件下的样本是随机的。
(2)各处理条件下的样本是相互独立的,否则可能出现无法解析的输出结果。
(3)各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。(4)各处理条件下的样本方差相同,即具有齐效性。
1.6.单因素k(k>=3)水平设计定量资料一元协方差分析
协方差分析(Analysis of Covariance)是将回归分析与方差分析结合起来使用的一种分析方法。在这种分析中,先将定量的影响因素(即难以控制的因素)看作自变量,或称为协变量(Covariate),建立因变量随自变量变化的回归方程,这样就可以利用回归方程把因变量的变化中受不易控制的定量因素的影响扣除掉,从而,能够较合理地比较定性的影响因素处在不同水平下,经过回归分析手段修正以后的因变量的样本均数之间的差别是否有统计学意义,这就是协方差分析解决问题的基本计算原理。
在试验中,试验因素有时会受到某个重要的定量的非试验因素的影响,
为了消除这种定量非试验因素对定量观测结果的影响和干扰。
前提条件:
一、要求各组定量资料(主要指观测结果)来自方差相等的正态总体;
二、各组的总体回归斜率要相等且不等于零。
1.7.单因素k(k>=3)水平设计一元定量资料Kruskal-Wallis秩和检验
定量资料不满足参数检验的前提条件时,则可选择秩和检验
2.单因素设计一元生存资料差异性分析
生存分析(Survival Analysis)是将重点事件的出现与否和达到终点所经历的时间结合起来的一种统计分析方法,其主要特点就是考虑了每个观察对象达到终点所经理的时间长短。终点事件不限于死亡,可以是疾病的发生、一种处理(治疗)的反映、疾病的复发等。生存分析可用于生存曲线估计、生存曲线比较、影响因素分析和生存预测。
生存分析有一套完整的方法:统计描述(包括求生存时间的分位数、中位生存期、平均数、生存函数的估计、判断生存时间分布的图示法)、非参数检验(检验分组变量各水平所对应的生存曲线是否一致)、COX模型(半参数)回归分析、参数模型回归分析。
研究者比较k条生存曲线之间是否有显著差别时,SAS软件提供了3种常用的方法:对数秩检验(log-rank Test)、威尔考克森(Wilcoxon Test)和似然比检验(Likelihood Ratio Test)。
当生存时间的分布为Weibull分布或属于比例风险比模型时,Log-Rank 检验效率较高;当生存时间的分布为对数正态分布时,Wilcoxon检验效率
较高;因似然比检验是建立在指数分布模型上的,故当资料偏离此模型时,其结果不如前两种检验方法稳健。
非参数法估计生存率有乘积极限法(Product-Limit Method,PL)和寿险法(Life Table Method),其中乘积极限法又称为Kaplan-Meier法(简称KM法)。前者适用于小样本或大样本未分组资料,后者适用于观察倒数较多的分组资料。
3.多因素设计一元定量资料差异性分析
3.1.随机区组设计一元定量资料方差分析与Friedman秩和检验
随机区组设计(Randomized block design),亦称完全随机区组设计(random complete block dsign)。这种设计的特点是根据“局部控制”的原则,将试验地按肥力程度划分为等于重复次数的区组,一区组安排一重复,区组内各处理都独立的随机排列。
参数检验前提条件:
独立性、正态性和方差齐性
若不满足参数检验的前提条件,采用秩和检验。
3.2.双因素无重复实验设计一元定量资料方差分析
有两个试验因素,全部试验条件由两因素各水平全面组合而成,在每个条件下获得定量资料的均值数据。
3.3.平衡不完全随机区组设计一元定量资料方差分析
所谓平衡不完全随机区组试验(Balanced Incomplete Block Design,简称
BIB试验)就是试验方案因受地块限制,不能把试验处理全部安置在试验区组内的情况下,所进行的试验设计。其缺点是:区组数必须严格按规定数目设立,缺一不可,否则各处理之间的比较将失去均衡性。
BIB试验设计需满足如下条件:
N=b∗k=γ∗ν
λ=γ(k−1)
ν−1
其中N为试验小区总数;λ为任两处处理在同一区组中出现的次数;γ是每个处理的重复数;b是不完全随机区组数;k是每区组内的小区数。3.4.拉丁方设计一元定量资料方差分析
拉丁方设计(Latin square design)使研究人员得以在统计上控制两个不相互作用的外部变量并且操纵自变量。每个外部变量或分区变量被划分为一个相等数目的区组或级别,自变量也同样被分为相同数目的级别。
拉丁方以表格的形式被概念化,其中行和列代表两个外部变量中的区组,然后将自变量的级别分配到表中各单元中。简单的说就是某一变量在其所处的任意行或任意列中,只出现一次。
假设我现在要做一个实验,被试一共要进行5个小测试,并且需要重测多次,因此对这5个测试的排序就需要列入变量控制之内,不可能多次都一样的顺序,因此为了平衡这种顺序效应,采取拉丁方设计,先命名5个小测试分别为1,2,3,4,5。那么对其的排序就是这样的:第一组测试顺序:1,2,5,3,4
第二组测试顺序:2,3,1,4,5