SPSS统计分析—差异分析(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在方差分析中,代表变异大小,并用来进行变异分解的 指标是离均差平方和。总的变异平方和记为SST,被分解为两 项:第一项是各组的离均差平方和之和,代表组内变异(即 随机变量引起的变异),称为组内平方和SSW(Within Groups);第二项是按样本含量大小加权的各组均数与总均 数的差值平方之和,代表组间变异(由控制变量引起的变 异),称为组间平方和或者处理平方和SSB(Between Groups)。
事后比较方法的选择
LSD法实际上是t检验的变形,只是在变异和自由度的计算上利用了整个样本 信息,而不仅仅是所比较两组的信息。因此它敏感度是最高,在比较时仍然 存在放大α水准(一类错误)问题,但换言之就是总的二类错误非常的小, 要是LSD都没有检验出差别,那恐怕真的没有差别。
◆注意:方差分析的适用条件 1、样本来自的总体服从正态分布。 2、样本方差必须是齐次的。 3、各样本之间相互独立。
方差分析的类型
单因素方差分析
单因素方差分析是指只单独考虑一个因素A对指标X的影响。 此时其他因素都不变或者控制在一定的范围之内。考虑因素A 有k个水平,在每次水平下做ni次试验。
差。数据如表所示。
数学成绩表
性别
数学
Male
99Leabharlann Baidu
79
59
89
79
89
99
Female
88
54
56
23
t检验就是检验统计量为t的假设检验。
用于检验两个变量之间的差异。
假设检验的一般步骤: 根据实际问题提出原假设H0与备择假设 H1。 选择统计量t作为检验统计量,并在H0成立的条件下确定t的
分布。 选择显著性水平 ,并根据统计量t的分布查表确定临界值及
另一类是研究中人为施加的可控因素对结果的影响,称 为控制变量。
方差分析可以用来判断样本数据之间的差 异到底是由以上哪种因素造成的。
随机变量
随机误差
不可控
控制变量
系统误差
有固定的大小和方向(正或负), 重复测定时重复出现,可以校正 或消除。
方差分析的目的主要有以下: 1、通过数据分析找出对该事物有显著影响的因素; 2、研究各因素之间的交互作用是否对该事物造成影响。
方差分析基本概念
方差分析是R.A.Fister发明的,用于两个及两个以上样 本均数差别的显著性检验。方差分析方法在不同领域的各个 分析研究中都得到了广泛的应用。从方差入手的研究方法有 助于找到事物的内在规律性。
由于各种因素的影响,研究所得的数据呈现波动状而有 所不同。造成波动的原因可分成两类:
一类是不可控的随机因素的影响,这是人为很难控制的 一类影响因素,称为随机变量;
于研究者较为有利。但是,采用单尾检验必须提出支持证据,除非理论文献支持单
侧的概念,或是变量间的关系具有明确的线索显示必需使用单侧检验,否则需采用
双侧检验来检验平均数的特性。
(邱 P169)
独立两样本t检验
定义:所谓独立样本是指两个样本之间彼此独立没有任 何关联,两个独立样本各自接受相同的测量,研究者的主要 目的是了解两个样本之间是否有显著差异存在。这个检验的 前提如下:
2.根据第一步的结果,决定T统计量和 自由度计算公式
(1)两总体方差未知且相同情况下,T统 计量计算公式为
(2)两总体方差未知且不同情况下,T统 计量计算公式为
T统计仍然服从T分布,但自由度采用修正 的自由度,公式为
从两种情况下的T统计量计算公式可以看 出,如果待检验的两样本均值差异较小,t值 较小,则说明两个样本的均值不存在显著差异; 相反,t值越大,说明两样本的均值存在显著 差异。
SPSS中实现过程
分析——比较均值——单样本T检验
SPSS中实现过程
研究问题 分析某班级学生的高考数学成绩和全国的
平均成绩70之间是否存在显著性差异。数据如 表所示。
数学成绩表
性别
数学
Male
99
79
59
89
79
89
99
Female
88
54
56
23
单尾检验与双尾检验
在平均数的检验中,研究者的兴趣往往在于比较不同平均数的差距,而提出两 个平均数大于、小于与不等于几种不同形式的研究假设,形成有特定方向的检验或 无方向性的检验两种不同模式。当研究者只关心单一一个方向的比较关系时(例如男 生的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验 (one-tailed test),范例如下:
SPSS中实现过程
分析——比较均值——独立样本T检验
SPSS中实现过程
研究问题 分析A、B两所高校大一学生的高考数学成
绩之间是否存在显著性差异。
两所学校学生的高考数学成绩表
学校 清华 北大
数学 99 88 79 59 54 89 79 56 89 99 23 89 70 50 67 78 89 56
P>.05(接受 虚无假设)
1.判断两个总体的方差是否相同
SPSS采用Levene F方法检验两总体方差 是否相同。
如果“F值”检验不显著(Sig.的值大于.05),表示两个组别群体变异 数相等,此时看“方差齐性相等”所列之t值,看其是否显著。 如果“F值”检验显著(Sig.的值小于.05),表示两个组别群体变异数 不相等,此时看“方差齐性不相等”所列之t值,看其是否显著。
总变异 = 随机变异 + 处理因素导致的变 异
总变异 = 组内变异 + 组间变异
这样,我们可采用一定的方法来比较组内变异和组间变 异的大小,如果后者远远大于前者,则说明处理因素的影响 确实存在,如果两者相差无几,则说明影响不存在,这就是 方差分析的基本思想。
计算公式
SST=SSW+SSB
其中,k为水平数;ni为第i个水平 下的样本容量。可见,组间样本离 差平方和是各水平组均值和总体均 值离差的平方和,反映了控制变量 的影响。
值0的比较
单样本t检验
统计学上的定义和计算公式
定义:SPSS单样本T检验是检验某个变量 的总体均值和某指定值之间是否存在显著差异。 统计的前提是样本总体服从正态分布。也就是 说单样本本身无法比较,进行的是其均数与已 知总体均数间的比较。
单样本T检验的零假设为H0总 体均值和指定检验值之间不存在 显著差异。采用T检验方法,按照 下面公式计算T统计量:
H0的拒绝域。 根据样本值计算统计量的值,并将其与临界值作比较。 下结论:若统计量的值落入拒绝域内,就拒绝H0;否则,不
拒绝H0。
显著性水平: 0.05——显著 0.001——非常显著 0.0001——极其显著
t检验的类型
单样本t检验——样本均值与总体均值的比较 独立两样本t检验——独立两样本均值比较 配对样本t检验——配对设计的差数均值与总体均
水平,则拒绝H0,认为两总体均值之间存在 显著差异。
相反,相伴概率大于显著性水平,则不拒绝 H0,可以认为两总体均值之间不存在显著差异。
SPSS中实现过程
分析——比较均值——配对样本T检验
方差分析
多个独立样本的差异显著性检验,通常可以使用方 差分析方法。
• 油菜品种差异性分析
P164
不同教学方式是否给学生成绩造成了显著影响; 不同地区的考生成绩是否有显著的差异等。
差异分析
1、均值描述—Means过程 2、t检验 3、方差分析
均值描述——Means过程
定义:Means过程是SPSS计算各种基本描述 统计量的过程。Means过程其实就是按照用户指 定条件,对样本进行分组计算均数和标准差,如 按性别计算各组的均数和标准差。
Means过程的计算公式为:
研究问题 比较不同性别同学的数学成绩平均值和方
两配对样本T检验的前提要求如下: • 两个样本应是配对的。在应用领域中,主要的配对资料包 括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首 先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改 变。 • 样本来自的两个总体应服从正态分布。
• 原理 1、配对样本t检验是配对设计的样本差数的均值同总体均值0比较的t
分别是男生与女生数学成绩的平均数
当研究者并无特定方向的设定(例如男生的智商与女生的智商有所不同),假设检验在 两个极端的情况皆有可能发生,而必须设定两个拒绝区,此时即需使用双尾检验 (two-tailed test)。如:
单尾检验由于仅需考虑单方向的差异性,因此在同样的显著水平下,可以较双侧
检验容易得到显著结果,统计检验力(power)大于双侧检验,因此采用单侧检验对
在菜单中选择“One-Way ANOVA”命令
“One-Way ANOVA”对话框
“One-Way ANOVA:Contrasts”对话框
“One-Way ANOVA:Options”对话框
“One-Way ANOVA:Post Hoc Multiple Comparisons”
对话框
结果和讨论
◆注意 单样本t检验和独立两样本t检验样本内部数据的顺序是可以任意调换。而配 对样本t检验的样本必须是一一对应的。样本内数据的顺序不能随意交换顺序。
SPSS将自动计算T值,由于该统计量服从
n−1个自由度的T分布,SPSS将根据T分布表给 出t值对应的相伴概率值。
如果相伴概率值小于或等于用户设想的显著性
SPSS中实现过程
分析——比较均值——单因素ANOVA
SPSS中实现过程
研究问题
三组学生的数学成绩
人名 hxh yaju yu shizg hah s watet jess wish
2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9
(1)首先是单因素方差分析的前提检验 结果,也就是Homogeneity of variance test——方差齐次性检验
(2)输出的结果文件中第2个表格如下所示。
(3)输出的结果文件中第3个表格如下所示。
(4)输出的结果文件中第4个表格如下所示。
(5)输出结果的最后部分是各组观察变 量均值的折线图,如图5-6所示。
在具体的计算中需要通过两步来完成: 第一,利用F检验判断两总体的方差是否 相同; 第二,根据第一步的结果,决定T统计量 和自由度计算公式,进而对T检验的结论作出 判断。
P<=.05 异质 T值显著否? P>.05
F值
P>.05(接受虚无假设)
是否显著? 同质
P<=.05 结果显著 结果不显著
T值显著否?
数学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00
组别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1
实现步骤
组内离差平方和是每个数据与本水 平组平均值离差的平方和,反映了 数据抽样误差的大小程度。
F统计量是平均组间平方 和与平均组内平方和的 比(组间变异与误差变 异的比值)。
从F值计算公式可以看出,如果控制变量 的不同水平对观察变量有显著影响,那么观察 变量的组间离差平方和必然大,F值也就比较 大;相反,如果控制变量的不同水平没有对观 察变量造成显著影响,那么,组内离差平方和 影响就会比较大,F值就比较小。
图4-6 “Independent-Samples T Test”对话框
图4-7 “Define Groups”对话框
结果和讨论
两配对样本T检验
统计学上的定义和计算公式
定义:两配对样本T检验是根据样本数据对样本来自的两配对 总体的均值是否有显著性差异进行推断。一般用于同一研究对象 (或两配对对象)分别给予两种不同处理的效果比较,以及同一研 究对象(或两配对对象)处理前后的效果比较。前者推断两种效果 有无差别,后者推断某种处理是否有效。
注意: • 两样本必须是独立的,即从一总体中抽取一批样本对
从另一总体中抽取一批样本没有任何影响,两组样本个案数 目可以不同,个案顺序可以随意调整。
• 样本来自的总体要服从正态分布且变量为连续测量数 据。
• 在进行独立两样本t检验之前,要通过F检验来看两样 本的方差是否相等。从而选取恰当的统计方法。
两独立样本T检验的零假设H0为两总体均 值之间不存在显著差异。
检验。
2、配对样本t检验是针对配对数据的t检验。其检验方法是首先求出 每对样本的差值,然后比较样本差值的均值和总体均值0之间的关 系。
如果两组数据没有差别,那么其样本差值的均值应该在0附近波动。 否则为两组数据是有差别的。这种方法的本质就是在对配对样本的 差值同总体均值0做单样本t检验。
两配对样本T检验的零假设H0为两总体均 值之间不存在显著差异。
相关文档
最新文档