spss之统计挖掘第6章 方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.“两两比较”
6.“保存”
▪ 单击“保存”按钮,弹出图6-18所示的“单变 量:保存”对话框
7.“选项”
▪ 单击“选项”按钮,弹出图6-19所示的“单变 量:选项”对话框。
析因设计方差分析
▪ 例6.3 A、B两种药物联合应用对红细胞增加数 的影响,数据见表6-8。数据库见6-3.sav。
▪ 1.操作步骤
▪ (4)单击“选项”按钮,将“因子与因子交互 ”列表中的“组别”移入右侧“显示均值”框 ,同时勾选“比较主效应”复选框;“输出” 列表中选择“描述统计”和“方差齐性检验” ,单击“继续”按钮,返回主对话框,单击“ 确定”按钮运行。
▪ 2.主要结果解读
▪ 图6-33所示给出两组的例数、均值和标准差; 图6-34所示为两组治疗后血压的Levene方差齐 性检验,本例F=0.049,P=0.826>0.05,因此 方差齐性,符合方差分析条件要求;图6-35所 示为协方差分析结果,可见组别因素F=0.820, P=0.373,组别因素(即两种药物)对降压效果 没有差别;而治疗前血压因素的F=6.463, P=0.017,说明治疗前血压确实对治疗后血压有 影响。
▪ (1)单击“分析”|“一般线性模型”|“单变 量”命令。
▪ (2)将“治疗后血压”放入“因变量”框;将 分组变量“组别”放入“固定因子”框;将“ 治疗前血压”放入“协变量”框。
▪ (3)单击“模型”按钮,在弹出框中将“因子 与协变量”列表中的“组别”和“治疗前血压 ”放入右侧“模型”列表。“构建项”中类型 选择“主效应”。其他默认,单击继续返回。
▪ 实例详解
▪ 例6.1:比较三个不同电池生产企业生产电池的 寿命,见例6-1.sav。此例企业为因素,不同厂 家为水平,本例为单因素3水平设计。
▪ 1.操作步骤
▪ (1)选择“分析”|“比较均值”|“单因素ANOVA” 命令,如图6-6所示;
▪ (2)将因变量“寿命”放入“因变量列表”框;将因 素“企业”放入“因子”框;
▪ (5)图6-11所示为均值图,对不同电池生产企 业电池寿命的均值进行作图,可形象展示各组 间均值的差异,图中可见企业2与企业1、3均值 相差较大,结果与LSD法相同。
随机区组设计方差分析
▪ 例6.2 某研究机构研究了3种动物饲料对4种品系 小鼠体重增加的影响,数据见表6-5,数据库文 件见6-2.sav。
▪ 3.“两两比较”按钮
▪ 单击“两两比较”按钮,弹出图6-3所示的“ 两两比较”对话框。
▪ 4.“选项按钮”
▪ (1)统计量栏包含如下5项:
▪ 描述性:选中该项,则结果中输出每个因变量的个案数、均 值、标准差、均值的标准误、最小值、最大值和均值的95% 可信区间。
▪ 固定和随机效果:表示显示固定效应模型的标准差、标准误 和95%置信区间以及显示随机效应模型的标准误、95%置信 区间、方差成分间的估计值。
▪ (5)“WLS权重”:为权重变量框,在该框中给出 加权二乘分析的权重变量。权重变量必须是数值型 变量,如果权重是零、负数或者缺失,则该变量将 不计入模型。另外如果一个变量已经放入上面某个 对话框,就不能在作为权重变量。
2.“模型”
▪ “模型”对话框中含有两种设定类型,其一为 “全因子”模型,其二为“设定”模型。
▪ 模块解读
▪ 1.调用单变量程序
▪ 单击“分析”|“一般线性模型”|“单变量”命 令,弹出图6-12所示的“单变量”对话框。
▪ (1)“因变量”:为本次所要研究的结果变量。下 面几个变量框均为影响结果变量的原因变量,按照变 量性质分为几种。
▪ (2)“固定因子”:指的是该因素在样本中所有可 能的水平都出现了,一般为该变量自身属性为分类变 量,如血型、不同治疗方案、不同宣传方法等。
▪ (1)“因子”列表:其 中显示主对话框中选择 的因素。每个因素后面 括号内显示其对比的方 法。
▪ (2)“更改对比”框: 选中“因子”列表中某 因素,单击“对比”下 拉列表,选择对比方法 ,单击更改,即可完成 设置。
▪ 4.“绘制”
▪ 单击“绘制”按钮,弹出图6-16所示的对话框。此对话框可以绘 制一个或多个因素变量作用后的因变量的均值分布图。“因子” 列表中显示出此次参与分析的因素列表,“水平轴”是指横坐标 轴,放入该框的变量作为均值图的横坐标,“单图”为均值线分 割依据,放入该框变量的每一水平将会产生独立一条均值线。“ 多图”框,放入变量含义为,以此变量水平分类,做出多个统计 图。“单图”框中变量为同一统计图中分成的多条线。
IBM-SPSS
第6章 方差分析
▪ 方差分析的应用条件如下:
▪ (1)独立,各组数据相互独立,互不相关;( 2)正态:即各组数据符合正态分布;(3)方 差齐性:即各组方差相等。
▪ 统计学上的因素是指研究者所关心的实验条件 ,而水平是指因素的具体表现形式。如温度( 30、60、90)℃、药物种类(A、B、C)药, 产地(山东、安徽、江苏)。此处的温度、药 物种类和产地就是因素,而每个因素里具体的 不同形式就称为水平。
▪ 1.操作步骤
▪ (1)单击“分析”|“一般线性模型”|“单变 量”命令,弹出单变量对话框,将凝血酶原时 间(tt)移入“因变量”列表,将阶段(stage )和药物类型(drug)放入“固定因子”框, 将(subject)放入“随机因子”框。
▪ (2)单击“模型”按钮,弹出模型对话框,选 中“设定”,将stage、drug和subject移入右侧 模型框中,并将“构建项”框中“类型”改为 主效应模型,单击“继续”返回,单击“确定 ”运行。
嵌套设计方差分析
▪ 嵌套设计被称为巢式设计(nested design)有些教科书上称 这类资料为组内又分亚组的分类资料。根据因素数的不同, 套设计可分为二因素(二级)、三因素(三级)等设计。 将 全部k个因素按主次排列,依次称为1级,2级 … k级因素, 再将总离差平和及自由度进行分解,其基本思想与一般方差 分析相同。所不同的是分解法有明显的区别,它侧重于主要 因素,并且,第i级因素的显著与否,是分别用第i级与第i+1 级因素的均方为分子和分母来构造F统计量,并以F测验为其 理论根据的。
▪ (3)图6-9所示为单因素方差分析的结果,并 且进行了趋势检验,结果显示不同企业间方差 分析统计量F=38.771,P值=0.000<0.01,因此 认为不同企业间生产电池的寿命不同。
▪ (4)图6-10所示为两两比较的结果,分别为 LSD法和Tamhane法,显著性小于0.05表示有 差异。本例应该看LSD的结果,因为前面 Levene方差齐性检验显示方差齐。
单因素设计方差分析
▪ 例6.1 比较三个不同电池 生产企业生产电池的寿 命,见例6-1.sav。此例 企业为因素,不同厂家 为水平,本例为单因素3 水平设计。
▪ 2.“对比”按钮
▪ 单击“对比”按钮,弹 出图6-2所示的“对比 ”对话框,此对话框是 用于对组间平方和进行 分解并确定均值的多项 式比较。
▪ (1)单击“分析”|“一般线性模型”|“单变 量”命令。
▪ (2)将红细胞增加数“X”变量放入“因变量 ”框,将药物“A”、“B”放入“固定因子” 框。
▪ (3)单击“模型”按钮,选择系统默认的“全 因子模型”,单击“继续”返回主对话框。
▪ (4)单击“选项”按钮,选择输出栏的“描述 统计”复选框,单击“继续”返回主对话框, 单击“确定”运行。本例为2因素,每因素2个 水平,因此不必进行“两两比较”。
▪ 2.主要结果解读
▪ 主要结果如图6-28所示,本例不同药物drug间 比较,F=0.580,P=0.456,不能拒绝H0,两种 药物间凝血酶原时间差异无显著性意义;不同 阶段stage间比较,F=1.470,P=0.241,不能拒 绝H0,两阶段间凝血酶原时间差异无显著性意 义;不同个体subject间比较,F=3.108, P=0.010,拒绝H0,接收H1,可以认为不同个体 间凝血酶原时间差异有显著性意义。
▪ (3)单击“对比”按钮,弹出图6-2所示的对话框,选 中“多项式”复选框,并在“度”下拉菜单中选择“线 性”选型,单击“继续”按钮,返回主对话框。
▪ (4)单击“两两比较”按钮,弹出图6-3所示的对话框 ,本例选择LSD法和Tamhane’s T2法进行讲解。
▪ (5)单击“选项”按钮,弹出图6-4所示的对 话框,选择“描述性”、“方差同质性检验” 和“均值图”。
▪ (1)“全因子”模型:此项为系统默认,一旦 选择此项,系统将分析所有因素变量、协变量 主效应以及因素与因素间的交互作用,但不包 括协变量的交互作用,如图6-13所示。
▪ (2)“设定”模型:即自定义模型,如图6-14 所示。选择该项后,“因子与协变量”、“模 型”与“构建项”被激活。
▪ 3.“对比”
▪ (3)“缺失值”栏:选择处理缺失值的方式, “按分析顺序排除个案”表示在分析时,检验 变量中含有缺失值的将不被计算;“按列表排 除个案”表示任何一个变量中含有缺失值的个 案都不被计算。
▪ 5.“Bootstrap”按钮
▪ (1)“Bootstrap”(自助法)按钮主要功能为让 计算机对研究样本进行反复抽样,根据多次抽样的 结果对总体均数的置信区间进行估计。单击“自助 法”按钮,弹出图6-5所示的对话框,如选中“执行 Bootstrap”复选框,图6-5所示中其他复选框被激 活。建议样本数不低于1000,“设置Mersenne Twister种子”数,是为了让分析结果能够复制,即 再运行时,设置同样的种子数,会得到相同的结果 。
▪ (6)单击“继续”返回主菜单,单击“确定” 按钮运行,输出结果。
▪ 2.结果解读
▪ (1)图6-7所示为描述性统计量的结果,分别 列出了3个不同电池企业的样本量、均数、标准 差、标准误、均数的95%置信区间以及最大和 最小值。
▪ (2)图6-8所示为Levene方差齐性检验的结果 ,本例Levene统计量为0.390。显著性P值为 0.680>0.05,故3组数据方差齐性。
交叉设计方差分析
▪ 例6.4 为比较血液透析过程中,低分子肝素钙 (A)与速避凝(B)对凝血酶原时间(TT)的影 响,选择20例接受血液透析的病人为研究对象 ,采取二阶段交叉设计,试验数据如表6-11, 试对数据进行分析,数据库请见6-4.sav。
拉丁方设计方差分析
▪ 例6-5 为了比较5种防护服对脉搏数的影响,选 用5个受试者,在5个不同的日期进行试验。用 拉丁方设计,在行、列与字母上分别安排3个因 素(日期、受试者、防护服),得如表6-13结 果。
▪ 方差同质性检验:选中此项,计算Levene方差齐性检验。
▪ Brown-Forsythe:表示计算分组均值相等的Brown-Forsythe 统计量。当方差齐性未知时,此检验比F统计量更具优势。
▪ Welch选项:与Brown-Forsythe类似,当不能把握方差齐性 时,比F检验稳健。
▪ (2)“均值图”选项:输出各组的均值图,可 以辅助判断各组间的趋势。
协方差分析
▪ 例6.6 为研究A、B两种降压药对高血压病人收 缩压的降压效果,研究者将受试对象随机分为 两组,分别接受A、B降压药治疗2个月后,测量 患者收缩压,资料见表6-16。数据库见6-6.sav 。本例治疗前的血压专业上应该对治疗后的血 压存在影响,因此采用协方差分析较为合适。
▪ 1.操作步骤
▪ (3)“随机因子”:指该因素所有可能的取值在样 本中没有都出现,或不可能都出现,一般该变量自身 属性为连续性的定量变量。如研究不同温度(30℃、 40℃和50℃)对某药物提取产物的影响。
▪ (4)“协变量”:对因变量可能有影响,需要在分 析时对其作用加以控制的连续性变量。如研究不同 教学方法对学生英语成绩的影响,那么开始参加受 试的学生的英语成绩有可能会影响教学效果,因此 ,应该在分析时将学生初始成绩作为协变量加以控 制。
▪ 2.结果解读
▪ 图6-25所示显示四种组合的例数、均值与标准 偏差。图6-26所示显示析因设计方差分析的结 果,结果可见,总的校正模型F=98.750, P=0.000,有统计学意义。因素A、因素B以及 A×B两因素间交互作用均有统计学意义。结合 专业可以解释为A药和B药均能升高红细胞,同 时A×B药同时服用的红细胞升高效果更好。