SPSS统计分析—差异分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
显著性水平: 0.05——显著 0.001——非常显著 0.0001——极其显著
t检验的类型
• 单样本t检验——样本均值与总体均值的比较 • 独立两样本t检验——独立两样本均值比较 • 配对样本t检验——配对设计的差数均值与总体均值0的比较
单样本t检验
统计学上的定义和计算公式
定义:SPSS单样本T检验是检验某个变量的总体均值和某 指定值之间是否存在显著差异。统计的前提是样本总体服从 正态分布。也就是说单样本本身无法比较,进行的是其均数 与已知总体均数间的比较。
较样本差值的均值和总体均值0之间的关系。 如果两组数据没有差别,那么其样本差值的均值应该在0附近波动。否则为两组数据是有 差别的。这种方法的本质就是在对配对样本的差值同总体均值0做单样本t检验。
两配对样本T检验的零假设H0为两总体均值之间不存在显 著差异。
◆注意 单样本t检验和独立两样本t检验样本内部数据的顺序是可以任意 调换。而配对样本t检验的样本必须是一一对应的。样本内数据的顺 序不能随意交换顺序。
数学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 56.00 89.00 99.00 70.00 89.00 55.00 50.00 67.00 67.00 56.00 56.00
组别 0 0 0 0 0 0 2 2 2 2 2 2 1 1 1 1 1 1
实现步骤
SPSS中实现过程
分析——比较均值——单因素ANOVA
SPSS中实现过程
研究问题
三组学生的数学成绩
人名 hxh yaju yu shizg hah s watet jess wish
2_new1 2_new2 2_new3 2_new4 2_new5 2_new6 2_new7 2_new8 2_new9
Means过程的计算公式为:
研究问题 比较不同性别同学的数学成绩平均值和方差。数据如表
所示。
数学成绩表
性别 Male Female
数学
99
79
59
89
79
89
99
88
54
56
23
t检验就是检验统计量为t的假设检验。 用于检验两个变量之间的差异。
假设检验的一般步骤: • 根据实际问题提出原假设H0与备择假设 H1。 • 选择统计量t作为检验统计量,并在H0成立的条件下确定t的分布。 • 选择显著性水平 ,并根据统计量t的分布查表确定临界值及H0的拒绝域。 • 根据样本值计算统计量的值,并将其与临界值作比较。 • 下结论:若统计量的值落入拒绝域内,就拒绝H0;否则,不拒绝H0。
总变异 = 随机变异 + 处理因素导致的变异
总变异 = 组内变异 + 组间变异
这样,我们可采用一定的方法来比较组内变异和组间变异的大小,如果后者 远远大于前者,则说明处理因素的影响确实存在,如果两者相差无几,则说明影 响不存在,这就是方差分析的基本思想。
计算公式
SST=SSW+SSB
其中,k为水平数;ni为第i个水平下的样本容 量。可见,组间样本离差平方和是各水平组均 值和总体均值离差的平方和,反映了控制变量 的影响。
SPSS中实现过程
分析——比较均值——独立样本T检验
SPSS中实现过程
研究问题 分析A、B两所高校大一学生的高考数学成绩之间是否存
在显著性差异。
两所学校学生的高考数学成绩表
学校 清华 北大
数学 99 88 79 59 54 89 79 56 89 99 23 89 70 50 67 78 89 56
随机误差
控制变量
系统误差
不可控
有固定的大小和方向(正或负),重复测定 时重复出现,可以校正或消除。
方差分析的目的主要有以下: 1、通过数据分析找出对该事物有显著影响的因素; 2、研究各因素之间的交互作用是否对该事物造成影响。
◆注意:方差分析的适用条件 • 1、样本来自的总体服从正态分布。 • 2、样本方差必须是齐次的。 • 3、各样本之间相互独立。
由于各种因素的影响,研究所得的数据呈现波动状而有所不同。造成波动的 原因可分成两类:
一类是不可控的随机因素的影响,这是人为很难控制的一类影响因素,称为 随机变量;
另一类是研究中人为施加的可控因素对结果的影响,称为控制变量。
方差分析可以用来判断样本数据之间的差异到底是由以 上哪种因素造成的。
随机变量
数学
99
79
59
89
79
89
99
88
54
56
23
单尾检验与双尾检验
在平均数的检验中,研究者的兴趣往往在于比较不同平均数的差距,而提出两个平均数大于、小于与不等于几 种不同形式的研究假设,形成有特定方向的检验或无方向性的检验两种不同模式。当研究者只关心单一一个方 向的比较关系时(例如男生的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验(one-tailed test),范例如下:
单样本T检验的零假设为H0总体均值和指 定检验值之间不存在显著差异。采用T检验方
法,按照下面公式计算T统计量:
SPSS中实现过程
分析——比较均值——单样本T检验
SPSS中实现过程
研究问题 分析某班级学生的高考数学成绩和全国的平均成绩70之
间是否存在显著性差异。数据如表所示。
数学成绩表
性别 Male Female
(邱 P169)
独立两样本t检验
定义:所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样 本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异 存在。这个检验的前提如下:
注意: 两样本必须是独立的,即从一总体中抽取一批样本对从另一总体中抽取一
批样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。 样本来自的总体要服从正态分布且变量为连续测量数据。 在进行独立两样本t检验之前,要通过F检验来看两样本的方差是否相等。
两配对样本T检验的前提要求如下: 两个样本应是配对的。在应用领域中,主要的配对资料包括:具有年龄、性别、 体重、病况等非处理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的 观察值顺序不能随意改变。 样本来自的两个总体应服从正态分布。
• 原理 1、配对样本t检验是配对设计的样本差数的均值同总体均值0比较的t检验。 2、配对样本t检验是针对配对数据的t检验。其检验方法是首先求出每对样本的差值,然后比
分别是男生与女生数学成绩的平均数
当研究者并无特定方向的设定(例如男生的智商与女生的智商有所不同),假设检验在两个极端的情况皆有可能发生, 而必须设定两个拒绝区,此时即需使用双尾检验(two-tailed test)。如:
单尾检验由于仅需考虑单方向的差异性,因此在同样的显著水平下,可以较双侧检验容易得到显著结果,统计 检验力(power)大于双侧检验,因此采用单侧检验对于研究者较为有利。但是,采用单尾检验必须提出支持证据, 除非理论文献支持单侧的概念,或是变量间的关系具有明确的线索显示必需使用单侧检验,否则需采用双侧检 验来检验平均数的特性。
组内离差平方和是每个数据与本水平组平均值 离差的平方和,反映了数据抽样误差的大小程 度。
F统计量是平均组间平方和与平均 组内平方和的比(组间变异与误 差变异的比值)。
从F值计算公式可以看出,如果控制变量的不同水平对观 察变量有显著影响,那么观察变量的组间离差平方和必然大, F值也就比较大;相反,如果控制变量的不同水平没有对观察 变量造成显著影响,那么,组内离差平方和影响就会比较大, F值就比较小。
SPSS将自动计算T值,由于该统计量服从给出t值对应的相伴概率值。
如果相伴概率值小于或等于用户设想的显著性水平,则拒绝 H0,认为两总体均值之间存在显著差异。 相反,相伴概率大于显著性水平,则不拒绝H0,可以认为两 总体均值之间不存在显著差异。
SPSS中实现过程
• 方差分析的类型
单因素方差分析
单因素方差分析是指只单独考虑一个因素A对指标X的影响。此时其他因素都不变 或者控制在一定的范围之内。考虑因素A有k个水平,在每次水平下做ni次试验。
在方差分析中,代表变异大小,并用来进行变异分解的指标是离均差平方和。 总的变异平方和记为SST,被分解为两项:第一项是各组的离均差平方和之和,代 表组内变异(即随机变量引起的变异),称为组内平方和SSW(Within Groups); 第二项是按样本含量大小加权的各组均数与总均数的差值平方之和,代表组间变 异(由控制变量引起的变异),称为组间平方和或者处理平方和SSB(Between Groups)。
事后比较方法的选择
• LSD法实际上是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组 的信息。因此它敏感度是最高,在比较时仍然存在放大α水准(一类错误)问题,但换言之就是总的二类 错误非常的小,要是LSD都没有检验出差别,那恐怕真的没有差别。
单尾检验与双尾检验邱p169在平均数的检验中研究者的兴趣往往在于比较不同平均数的差距而提出两个平均数大于小于与不等于几种不同形式的研究假设形成有特定方向的检验或无方向性的检验两种不同模式
差异分析
1、均值描述—Means过程 2、t检验 3、方差分析
均值描述——Means过程
定义:Means过程是SPSS计算各种基本描述统计量的过程。 Means过程其实就是按照用户指定条件,对样本进行分组计算均 数和标准差,如按性别计算各组的均数和标准差。
是否显著?
P>.05(接受虚无假设)
同质
P<=.05 结果显著 结果不显著
T值显著否?
P>.05(接受 虚无假设)
1.判断两个总体的方差是否相同
SPSS采用Levene F方法检验两总体方差是否相同。
如果“F值”检验不显著(Sig.的值大于.05),表示两个组别群体变异数相等,此时看“方差齐 性相等”所列之t值,看其是否显著。 如果“F值”检验显著(Sig.的值小于.05),表示两个组别群体变异数不相等,此时看“方差齐 性不相等”所列之t值,看其是否显著。
在菜单中选择“One-Way ANOVA”命令
“One-Way ANOVA”对话框
“One-Way ANOVA:Contrasts”对话框
“One-Way ANOVA:Options”对话框
“One-Way ANOVA:Post Hoc Multiple Comparisons”对话框
结果和讨论
(1)首先是单因素方差分析的前提检验结果,也就是 Homogeneity of variance test——方差齐次性检验
(2)输出的结果文件中第2个表格如下所示。
(3)输出的结果文件中第3个表格如下所示。
(4)输出的结果文件中第4个表格如下所示。
(5)输出结果的最后部分是各组观察变量均值的折线图, 如图5-6所示。
2.根据第一步的结果,决定T统计量和自由度计算公 式
(1)两总体方差未知且相同情况下,T统计量计算公式 为
(2)两总体方差未知且不同情况下,T统计量计算公式 为
T统计仍然服从T分布,但自由度采用修正的自由度,公 式为
从两种情况下的T统计量计算公式可以看出,如果待检验 的两样本均值差异较小,t值较小,则说明两个样本的均值不 存在显著差异;相反,t值越大,说明两样本的均值存在显著 差异。
从而选取恰当的统计方法。
两独立样本T检验的零假设H0为两总体均值之间不存在显 著差异。
在具体的计算中需要通过两步来完成: 第一,利用F检验判断两总体的方差是否相同; 第二,根据第一步的结果,决定T统计量和自由度计算公 式,进而对T检验的结论作出判断。
P<=.05 异质 T值显著否? P>.05
F值
图4-6 “Independent-Samples T Test”对话框
图4-7 “Define Groups”对话框
结果和讨论
两配对样本T检验
统计学上的定义和计算公式
定义:两配对样本T检验是根据样本数据对样本来自的两配对总体的均值是否有显著 性差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效 果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果 有无差别,后者推断某种处理是否有效。
分析——比较均值——配对样本T检验
方差分析
多个独立样本的差异显著性检验,通常可以使用方差分析方法。
• 油菜品种差异性分析 P164
不同教学方式是否给学生成绩造成了显著影响; 不同地区的考生成绩是否有显著的差异等。
方差分析基本概念
方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性 检验。方差分析方法在不同领域的各个分析研究中都得到了广泛的应用。从方差 入手的研究方法有助于找到事物的内在规律性。
相关文档
最新文档