SPSS和SAS统计实验指导书
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实用标准文档
SPSS和SAS统计实验指导书
(学生用)
王慧、欧晓华、王立平等编
经济与贸易系市场营销教研室
2006年4月
目录
实验一:统计描述 (3)
1.均值(Mean)和均值标准误差(S.E.mean) (3)
2.中位数(Median) (5)
3.众数(Mode) (6)
4.全距(Range) (7)
5.方差(Variance)和标准差(Standard Deviation) (8)
6.四分位数(Quartiles)和十分位数(Deciles) (10)
7.频数(Frequency) (12)
8.峰度(Kurtosis) (14)
9.偏度(Skewness) (16)
实验二:均值比较和T检验 (17)
1.均值比较 (17)
2.单一样本T检验 (20)
3.两独立样本T检验 (21)
4.两配对样本T检验 (23)
实验三:相关分析 (26)
1.实验理论概述 (26)
2.二元定距变量的相关分析 (26)
3.二元定序变量的相关分析 (33)
4.偏相关分析 (36)
5.距离相关分析 (41)
实验四:回归分析 (51)
1.一元线性回归 (51)
2.多元线性回归分析 (57)
实验一:统计描述
实验内容:
均值、中位数、众数、全距、方差与标准差、四分位数、十分位数、频数、峰度、偏度
实习目的:
掌握SPSS基本的统计描述方法,可以对要分析的数据的总体特征有比较准确的把握,从而为以后实验项目选择其他更为深入的统计分析方法打下基础。
实验一要研究的问题:
输入SPSS保存。
1.均值(Mean)和均值标准误差(S.E.mean)
问题:求该班级在一次数学测验中的平均成绩和其标准差
★实验步骤:
『步骤1』单击“Analyze”菜单“Descriptive statistics”项中的“Frequencies”命令,如图1-1所示。
图1-1 选择Frequencies菜单
『步骤2』弹出Frequencies对话框,如图1-2所示,在对话框左侧的便利列表中选择“数学”,单击按钮使之添加到Variable(s)框中。
图1-2 Frequencies对话框
『步骤3』单击Frequencies对话框下方的Statistics 按钮,弹出如图1-3 所示对话框。
选择要统计的项目,在Central Tendency中选择Mean,在Dispersion中S.E.mean,选好后单击Continue按钮返回Frequencies对话框,单击OK按钮,SPSS开始计算
图1-3 Frequencies:Statistics对话框
实验结果:
由以上结果可以看出该班数学的平均成绩为72.9444分,均值的标准误差为4.75097。
该结果可以在“File”菜单中选择Save as 命令,将该结果保存为Mean1文件。
2.中位数(Median)
问题:求该班级数学成绩的中位数
★实验步骤:
『步骤1』单击“Analyze”菜单“Descriptive statistics”项中的“Frequencies”命令,如图1-4所示。
图1-4 选择Frequencies菜单
『步骤2』弹出Frequencies对话框,如图1-5所示,在对话框左侧的变量列表中选择“数学”,单击按钮使之添加到Variable(s)框中。
图1-5 Frequencies对话框
『步骤3』单击Frequencies对话框下方的Statistics 按钮,弹出如图1-6所示对话框。
选择要统计的项目,在Central Tendency中选择Median,选好后单击Continue按钮返回Frequencies对话框,单击OK按钮,SPSS即开始计算
图1-6 Frequencies:Statistics对话框
实验结果:
由上图可以看出该班数学成绩的中位数是78.5分。
在结果输出窗口处选择“File”菜单中的Save as 命令,将该结果保存为Median1文件。
3.众数(Mode)
问题:求该班数学成绩的众数
★实验步骤:
『步骤1』步骤一和步骤二同以上求均值和中位数的步骤一和步骤二
『步骤2』单击Frequencies对话框下方的Statistics 按钮,弹出如图1-7所示对话框。
选择要统计的项目,在Central Tendency中选择Mode,选好后单击Continue按钮返回Frequencies对话框,单击OK按钮,SPSS即开始计算
图1-7 Frequencies:Statistics对话框
实验结果:
由以上结果可以看出该班级数学成绩中成绩为89分的人最多。
将该结果保存为“Mode1”
4.全距(Range)
问题:求该班学生数学成绩的全距
★实验步骤:
『步骤1』步骤一和步骤二同以上求均值和中位数的步骤一和步骤二
『步骤2』单击Frequencies对话框下方的Statistics 按钮,弹出如图1-8所示对话框。
选择要统计的项目,在Dispersion中选择Range,选好后单击Continue按钮返回Frequencies对话框,单击OK按钮,SPSS即开始计算
图1-8 Frequencies:Statistics对话框
实验结果:
由以上结果可以看出该班学生成绩的全距为76分(即99—23=76)。
将该结果保存为range1。
5.方差(Variance)和标准差(Standard Deviation)
问题:求该班学生数学成绩的方差和标准差
★实验步骤:
『步骤1』单击“Analyze”菜单“Descriptive statistics”项中的“Descriptives”命令,如图1-9所示
图1-9选择Frequencies菜单
『步骤2』弹出Descriptives对话框,如图1-10所示,在对话框左侧的变量列表中选择“数
学”,单击按钮使之添加到Variable(s)框中。
图1-10 Descriptives 对话框
『步骤3』单击Descriptives对话框下方的Options 按钮,弹出如图1-11所示对话框。
选择要统计的项目,在此对话框中选择Mean、Std.deviation、和Variance三项统计量,选好后单击Continue按钮返回Descriptives对话框,单击OK按钮,SPSS即开始计
算
图1-11 Descriptives:Options对话框
实验结果:
由以上结果可以看出,该班级学生数学成绩的方差为406.291,标准差为20.15666,平均成绩为72.9444。
将该结果文件保存为variance1。
6.四分位数(Quartiles)和十分位数(Deciles)
问题1:求该班级学生成绩的四分位数
★实验步骤:
『步骤1』单击“Analyze”菜单“Descriptive statistics”项中的“Frequencies”命令,如图1-1所示
『步骤2』弹出Frequencies对话框,如图1-2所示,现要求处该班学生数学成绩的四分位数,故在对话框左侧的便利列表中选择“数学”,单击按钮使之添加到Variable
(s)框中。
『步骤3』单击Frequencies对话框下方的Statistics 按钮,弹出如图1-12所示对话框。
选择要统计的项目,在Percentile Value中选择Quartiles,选好后单击Continue按钮返回Frequencies对话框,单击OK按钮,SPSS即开始计算
图1-12 Frequencies:Statistics对话框
实验结果1:
由以上结果可以看出,该班学生数学成绩的第一分位数Q1=56,第二分位数Q2=78.5,第三分位数Q3=89。
四分位差Q=(89-56)/2=16.5。
将该结果保存为quartiles1文件。
问题2:求该班学生成绩的D6
实验步骤:
『步骤1』单击“Analyze”菜单“Descriptive statistics”项中的“Frequencies”命令,如图1-1所示
『步骤2』弹出Frequencies对话框,如图1-2所示,现要求处该班学生数学成绩的十分位数,故在对话框左侧的便利列表中选择“数学”,单击按钮使之添加到Variable
(s)框中。
『步骤3』单击Frequencies对话框下方的Statistics 按钮,弹出如图1-13所示对话框。
在Percentile Value中选择Percentile(s)右方的小框中依次10,20,……100,每输完一个数据后单击下方的Add按钮,使这个数据依次添加到右下方的空白框内。
之后单击Continue按钮返回Frequencies对话框,单击OK按钮,SPSS即开始计算
图1-13 Frequencies:Statistics对话框
实验结果2:
由以上结果可以看出,该班学生数学成绩的D6=82,其余十分位数D1=47.3,D2=55.6,……D9=99。
将该结果保存为Deciles1文件。
7.频数(Frequency)
问题:求出该班学生数学成绩的频数分布
★实验步骤:
『步骤1』在“Analyze”菜单中“Descriptive Statistics”中选择Frequencies命令,弹出Frequencies对话框,如图1-14所示
图1-14 Frequencies对话框
『步骤2』在对话框左侧的变量列表中选择“数学成绩”,单击按钮使之添加到
Variable(s)框中。
『步骤3』选择对话框下方的Display frequency tables 复选框,表示显示频数分布表。
单击OK按钮,SPSS自动完成计算。
实验结果:
由以上结果可以看出各个分数的得分人数,如得89分的人最多为4个,得56分、79分和99分的人各有2个,其余的分数都为1人。
8.峰度(Kurtosis)
求该班学生数学成绩的峰度
★实验步骤:
『步骤1』在“Data”菜单中选择Weight Cases命令,如图1-15所示
图1-15 选择菜单
『步骤2』在弹出如图1-16所示的Weight Cases 对话框中,左边的变量表中选择“人数”
变量,使其添加到Frequency Variable 框中。
使人数成为权重变量。
单击OK按钮,返回到SPSS数据编辑窗口。
图1-16 Weight Cases 对话框
『步骤3』在“Analyze”菜单中“Descriptive Statistics”中选择Frequencies命令,弹出Frequencies对话框,如图1-17所示
图1-17 Frequencies 对话框
在对话框左侧的变量列表中选择“数学成绩”,单击按钮使之添加到Variable(s)
框中。
『步骤4』单击Frequencies对话框下方的Statistics 按钮,弹出如图1-18所示对话框。
选择要统计的项目,在Distribution中选择Kurtosis,选好后单击Continue按钮返回Frequencies对话框,单击OK按钮,SPSS即开始计算
图1-18 Frequencies:Statistics 对话框
实验结果:
由上图可以看出个案N为18,峰度为0.488,峰度大于0,表示该班级数学成绩分布比正态分布高峰更加陡峭。
9.偏度(Skewness)
问题:求该班数学成绩分布的偏度
『步骤1』步骤一、二和步骤三同求峰度的步骤
『步骤2』单击Frequencies对话框下方的Statistics 按钮,弹出如图1-19所示对话框。
选择要统计的项目,在Distribution中选择Skewness,选好后单击Continue按钮返回Frequencies对话框,单击OK按钮,SPSS即开始计算
图1-19 Frequencies:Statistics 对话框
实验结果:
由以上结果可以看出个案数N为18个,偏度为—0.810,偏度小于0,表示该班级数学成绩分布中,负偏差数值较大,为负偏或左偏,即和正态分布相比较,分数偏低的人较多,有一条长尾巴拖在左边。
实验二:均值比较和T检验
实验目的:掌握均值比较、单一样本T检验、两独立样本T检验和两配对样本T 检验的方法
实验内容:均值比较、单一样本T检验、两独立样本T检验和两配对样本T检验
1.均值比较
研究问题:
比较不同性别学生数学成绩的平均值和方差
★实验步骤:
『步骤1』在“Analyze”菜单“Compare Means”项中选择Means命令,如图2-1所示
图2-1 选择菜单
『步骤2』弹出Means对话框,如图2-2 所示。
因要分性别求数学成绩的均值和标准差,所以在对话框左侧的变量列表中选择“数学”,单击按钮使之进入Dependent List 框中。
选择“性别”,单击使之添加到Independent List框中。
Independent List 框可以有多个变量,表示分做的多个层次,可以通过单击“Next”按钮来实现。
图2-2 Means 对话框
『步骤3』单击右下角的Options按钮,弹出如图2-3所示的对话框,可以选择要统计的项目。
图2-3 Means:Options对话框
在Cell Statistics 项中,Mean为均值、Standard Deviation为标准差、Variance为方差、Number of Cases 为观察单位数。
在Statistics for First Layer项中,如果选中Anova table and eta 项,则将为第一层次的分组计算方差分析(也就是单因素方差分析,通过方差分析的结果,可以看出第一层次的分组是否在观察值上有均值显著差异)。
如果选中Test of linearity 项,则进行第一层次的线性检验。
选好后,单击Continue按钮返回Means对话框,单击Ok按钮,SPSS即开始计算。
以上结果显示:总共对11个个案进行了统计,其中男生的数学成绩平均值为84.71分,标准差为13.97;女生的数学成绩平均值为55.25分,标准差为26.55;总体平均值为74分,标准差为23.44。
由此可以看出女生的数学成绩总体上来说差于男生,未达到总体的平均分。
2.单一样本T检验
问题:分析该班学生的数学成绩和全国的平均成绩70分之间是否存在显著性差异。
★实验步骤:
『步骤1』在“Analyze”菜单“Compare Means”项中选择one-sample T test命令,如图2-4所示
图2-4 选择菜单
『步骤2』选择菜单后,出现One-Sample T Test对话框,如图2-5所示
图2-5 One-Sample T Test对话框
将全国数学高考的平均值70填入Test Value框,将要检验的变量“数学”从左侧框中添加到Test Variable框中。
『步骤3』单击Options按钮,出现图2-6所示的对话框
图2-6 One-Sample T Test:Options对话框
『步骤4』单击Continue按钮,返回到One-sample T Test对话框,单击OK按钮,SPSS 即完成所需要的计算
实验结果:
由以上结果可以看出:11个学生的数学成绩平均值为74分,标准差为23.44,均值误差为7.07。
本例中的检验均值为70分,样本均值和检验均值的差为4,计算出的T值为0.566,相伴概率为0.584。
95%的置信区间为[-11.75,19.75],表示95%的样本差值在该区间内。
假设显著性水平a为0.05,由于相伴概率大于a,因此接受原假设,即认为该11名同学的均值和全国的数学均值相比,没有显著性差异。
3.两独立样本T检验
研究问题:分析清华、北大大一学生的高考数学成绩之间是否存在显著性差异
★实验步骤:
『步骤1』首先到清华、北大校园中随机调查9位大一同学的高考数学成绩,进行记录。
虽然分析的是两个独立样本,但在数据组织时,SPSS要求两个独立样本数据放在一个SPSS变量中,再加上另外一个变量source01,对来自不同学校的学生进行区分。
『步骤2』在“Analyze”菜单“Compare Means”中选择Independent-Samples T Test命令,如图2-7所示
图2-7 选择菜单
『步骤3』在弹出如图2-8所示的Independent-Samples T Test对话框中,从对话框左侧的变量列表中选择“数学”变量,并添加,到Test Variable(s)框中。
选择“source01”
变量,添加到Grouping Variable框中。
图2-8 Independent-Samples T Test对话框
『步骤4』单击Define Groups按钮,弹出Define Groups对话框,如图2-9所示。
在该对
话框中指定标识变量的区分方法。
选择Use specified values选项,表示根据标识变量的取值进行区分。
在Group1中输入0,在Group2中输入1。
图2-9 Define Groups 对话框
『步骤5』单击Continue按钮,返回Independent-Sample T Test对话框,单击OK按钮,SPSS即开始计算。
实验结果:
由以上结果可以看出:两个学校9个学生的数学平均分分别为76.89和69分,标准差分别为16.56和23.54,均值误差分别为5.52和7.85 。
统计量F的相伴概率为0.461,大于显著性水平0.05,接受方差相等的假设,即认为两个学校学生的数学成绩无显著差异。
方差相等时T检验结果,统计量T的相伴概率为0.423,大于显著性水平0.05,接受T检验的零假设,也就是说,两个学校18个学生高考数学成绩平均值不存在显著差异。
4.两配对样本T检验
★实验步骤:
『步骤1』在“Analyze”菜单“Compare Means”中选择Pared-Samples T Test命令,如图2-10所示
图2-10 选择菜单
『步骤2』在弹出如入4-11所示的Pared-Samples T Test对话框中,从对话框左侧的变量列表中选择“数学1”,这时“数学1”变量出现在图4-11种的Current Selections框的Variable1中。
然后从对话框左侧的变量列表中选择“数学2”,“数学2”出现在Current Selections框的Variable2中,这时表示将这两个变量配对,然后使之添加到Pared Variable(s)框中。
图2-11 Pared-Samples T Test对话框
『步骤3』单击OK,SPSS即开始自动计算。
实验结果:
由以上结果可以看出:参加培训前后,该班学生数学成绩分别为72.94和84.77分,培训前后数学成绩序列的均值相差-11.83。
计算出的T统计量为-2.15,相伴概率为0.046,比显著性水平0.05小,因此拒绝原假设,即认为培训前后该班学生的数学成绩有显著的差异,培训后,该班学生数学成绩明显提高。
实验三:相关分析
实验目的:掌握二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析、距离相关分析的理论内容,SPSS 中的操作方法。
实验内容:二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析、距离相关分析
1.实验理论概述
任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。
变量之间的关系归纳去来可以分为两种类型,即函数关系和统计关系。
衡量事物之间,或称变量之间的线形相关程度的强弱并用适当的统计指标表示出来,这个过程就是相关分析。
比较直接和常用的一种方法是绘制散点图,但是为了能更加准确地描述变量之间的线性相关程度,可以通过计算相关系数来进行相关分析。
如果相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ,如果是根据样本数据计算来的,则称为样本相关系数,记为r .在统计学中,一般用样本相关系数r 来推断总体相关系数.
◎相关系数的取值范围在–1和+1之间,即–1≤r ≤+1。
其中: ◎若0<r ≤1,表明变量之间存在正相关关系。
◎若–1≤r <0,表明变量之间存在负相关关系。
◎当︱1︱=1时,其中一个变量的取值完全取决于另一个变量,二者即为函数关系;若r =+1,表明变量之间完全正相关;若r =–1,表明变量之间完全负相关。
◎当r =0时,说明变量之间不存在线形相关关系。
在说明变量之间线形相关程度时,根据经验可将相关程度分为以下几种情况: ◎当︱r ︱≥0.8时,视为高度相关。
◎0.5 ≤︱r ︱<0.8时,视为中度相关。
◎0.3 ≤︱r ︱<0.5时,视为低度相关。
◎︱r ︱<0.3时,说明变量之间的相关程度极弱,可视为不相关。
2.二元定距变量的相关分析
⑴ 统计学上的定义和计算公式
二元定距变量的相关分析是指通过计算定距变量间两两相关的相关系数,对两个或两个以上定距变量之间两两相关的程度进行分析。
在二元相关分析过程中比较常用的几个相关系数是Pearson 简单相关系数、Sperman 和Kendall ’s tua-b 等级相关系数。
本材料仅介绍Pearson 简单相关系数。
Pearson 简单相关系数用来衡量定距变量间的线形关系。
如衡量国民收入和居民储蓄存款、身高和体重等变量间的线形相关关系。
Pearson 简单相关系数的计算公式为:
()()
n
i
i
x x y y r --=
∑
对Pearson简单相关系数的统计检验是计算t统计量:
t=
⑵SPSS中实现过程
★研究问题:
某班级学生数学和化学期末考试成绩如表3-1所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。
表3-1 学生的数学和化学成绩
★实现步骤
『步骤1』在“Analyze”菜单“Correlate”中选择Bivariate命令,如图3-1所示。
『步骤2』在弹出的如图3-2所示Bivariate Correlate对话框中,从对话框左侧的变量列
表中分别选择“数学”和“化学”变量,单击按钮使这两个变量进入Variables框。
在Correlation Coefficients框中选择相关系数,本例选用Pearson项。
在Test of significance框中选择相关系数的双侧(Two-tailed)检验,检验两个变量之间
的相关取向,也就是从结果中来得到是正相关还是负相关。
图3-2 Bivariate Correlate对话框
选中Flag significations correlations选项,则相关分析结果中将不显示统计检验的相伴概率,而以星号(*)显示。
一个星号表示当用户指定的显著性水平为0.05时,统计检验的相伴概率值小于等于0.05,即总体无显著性相关的可能性小于等于0.05;两个星号表示当用户指定的显著性水平为0.01时,统计检验的相伴概率值小于等于0.01,即总体无显著线形相关的可能性小于等于0.01。
显然,在这两个星号比一个星号的检验更加精确。
『步骤3』单击Options按钮,出现Bivariate Correlate:Options对话框,如图3-3所示。
图3-3 Options对话框
Statistics框中的Means and standard deviations表示在输出相关系数的同时计算输出各变量的平均值和标准差;选中Cross-product deviations and covariances项表示输出叉积离差和协方差。
叉积离差即为Pearson简单相关系数公式的分子部分,协方差为:叉积离差/(–1),也反映变量间的相关程度。
Missing Values框中为对缺失值进行处理,Exclude cases pairwise项表示如果正参与计算的两个变量中有缺失值,则暂时提出那些在这两个变量上去缺失值的个案;Exclude cases listwise项为剔除所有具有缺失值的个案后再计算。
本例中选择Means and standard deviations和Exclude cases pairwise项,单击Continue按钮,返回Bivariate Correlate对话框,单击OK按钮,则可得到SPSS相关分析的结果。
结果和讨论:
SPSS的运行结果如下:
Correlations
从以上结果可以得出第一个表格所有人(n=18)的数学成绩(83.5556)、数学成绩的标准差(12.14240)、化学平均成绩(96.6111)和化学成绩的标准差(10.777109)。
第二个表格则是所要求的相关系数,它以一个矩阵的形式表示。
从中可以看出,数学成绩和化学成绩的相关系数为0.742。
在这个数据的旁边有两个星号,表示用户指定的显著性水平为0.01时,统计检验的相伴概率小于等于0.01,即数学和化学显著相关,且为正相关。
⑶ 绘制相关散点图
如果对变量之间的相关程度不需要那么精确,则可以通过绘制变量的散点图来直接判断。
仍以上例作为说明。
★实现步骤
『步骤1』在“Graphs ”菜单中选择Scatter 命令,如图3-4所示。
图3-4 选择Scatter 命令
『步骤2』本例只需绘制出数学成绩和化学成绩两者的散布情况,因此选择“Simple”图,如图3-5所示。
图3-5 Scatterplot对话框
『步骤3』单击Define按钮,打开Simple Scatterplot对话框,如图3-6所示。
在此对话
框中,把左侧的“数学”、“化学”这个两个变量分别通过单击按钮使之添加到右侧的
X Axis和Y Axis框中,表示散点图将分别把数学成绩和化学成绩绘制在X轴和Y轴上。
其他悬想不变,然后单击OK,开始绘图。
图3-6 Simple Scatterplot对话框
结果和讨论
绘出的散点图如图3-7所示,从中明显看出这两个变量线形正相关,数学成绩好的学生其化学成绩也较好。
图3-7 散点图
▲练习题:
某工厂生产多种产品,分别对其进行两标准评分,评分结果如下表,现在要研究这两个标准之间是否具有相关性。
3.二元定序变量的相关分析
⑴ 统计学上的定义和计算公式
定序变量又称为有序变量、顺序变量,它的取值的大小能够表示观测对象的某种顺序关系(等级、方位、或大小等),也是基于“质”因素的变量。
例如,“最高学历”变量的取值是:1—小学及以下、2—初中、3—高中、中专、技校、4—大学专科、5—大学本科、6—研究生以上。
由小到大的取值能够代表学历由低到高。
Spearman 和Kendall ’s tua-b 等级相关系数用以衡量定序变量间的线形相关关系,它们利用的是非参数检验的方法。
计算公式如下:
Spearman 等级相关系数:
22
61(1)
i D R n n =-
-∑
其中
221
1
()n
n
I
i
i i i D U
V ===-∑∑ (i U 、i V 分别为两变量排序后的秩),可见,Spearman
是利用秩得到的。
对Spearman 等级相关系数的统计检验,一般如果个案数n ≤30,将直接利用Spearman 等级相关系统计量表,SPSS 将自动根据该表给出对应的相伴概率值。
但是当个案数n>30,则计算Z 统计量:
Z =Z 统计量近似服从正态分布,SPSS 将依据正态分布表给出对应的相伴概率。
Kendall ’s tua-b 等级相关系数:
41(1)
V
T n n =-
-
V 是利用变量的秩数据计算而得的非一致对数目。
对Kendall ’s tua-b 等级相关系数的统计检验,一般如果个案数n ≤30,将直接利用Kendall ’s tua-b 等级相关系统计量表,SPSS 将自动根据该表给出对应的相伴概率值。
但是当个案数n>30,则计算Z 统计量:
Z =
Z 统计量近似服从正态分布,SPSS 将依据正态分布表给出对应的相伴概率。
⑵ SPSS 中实现过程
★ 研究问题
某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量“作文1”和“作文2”,如表3-2所示。
问两次评分的等级相关有多大,是否达到显著水平?
表3-2 学生作文两次的得分情况
★实现步骤
『步骤1』在“Analyze”菜单“Correlate”中选择Bivariate命令,如3-8所示。
图3-8 选择Bivariate Correlate菜单
『步骤2』在弹出如图3-9所示的Bivariate Correlate对话框中,从对话框左侧的变量列表中分别选择“作文1”和“作文2”变量,单击按钮使这两个变量添加到
Variables框。
在Correlation Coefficients框中选择Spearman和Kendall’s tua-b等级相关系数;在Test of significance框中选择相关系数的双侧(Two-tailed)检验,选中Flag significations correlations选项,则相关分析结果中将不显示统计检验的相伴概率,而以星号(*)显示。
如图3-9。
图3-9 Bivariate Correlate对话框
『步骤3』单击OK按钮,SPSS开始计算Spearman和Kendall’s tua-b等级相关系数。
⑶结果和讨论
SPSS的运行结果如下:
Nonparametric Correlations
从结果中可以看出,语文老师两次评分的Spearman和Kendall’s tua-b等级相关系数分别为0.745和0.874。
在这个数据的旁边有两个星号,表示用户指定的显著性水平为0.01时,统计检验的相伴概率小于等于0.01,即两次评分显著相关,且为正相关。
▲练习题:
某专家先后对一个工程的多个项目加以评分,两次评分分别记为变量“分值1”和“分值2”,如下表所示。
问两次评分的等级相关有多大,是否达到显著水平?
4.偏相关分析
二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。
例如,在研究某农场春季早稻产量与平均降雨量、平均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。
同时平均降雨量对平均温度也会产生影响。
在这种情况下,单纯计算简单相关关系数不能准确反映事物之间的相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。
偏相关分析正是用来解决这个问题的。
⑴ 统计学上的定义和计算公式
定义:偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。
偏相关分析的工具是计算偏相关系数12,3r 计算公式:
假定有3个变量:1x 、2x 、3x ,求剔除变量3x 的影响后,变量1x 和2x 之间的偏相关系数12,3r :
12,3r =
其中,12r 表示变量1x 与变量2x 的简单相关系数; 13r 表示变量1x 与变量3x 的简单相关系数; 23r 表示变量2x 与变量3x 的简单相关系数。
显著性检验公式:
r t =
其中,n 为个案数,n-3为自由度。
⑵ SPSS 中实现过程
★ 研究问题
某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如表3-3所示。
现求降雨量对产量的偏相关。
★实现步骤
『步骤1』在“Analyze”菜单“Correlate”中选择Partial命令,如图3-10所示。
图3-10 选择Bivariate Partial 菜单
『步骤2』在弹出的如图2所示Bivariate Partial对话框中,从对话框左侧的变量列表中
分别选择“产量”和“降雨量”变量,单击按钮使这两个变量进入Variables框中,
在选择“温度”变量,单击按钮使这个变量添加到Controlling For框中,表示现在所求的是剔除“温度”变量影响后“产量”和“降雨量”变量之间偏相关系数。
图3-11 Partial Correlations对话框
在Test of significance框中选择相关系数的双侧(Two-tailed)检验。
本例选中Flag significations correlations选项,则相关分析结果中将不显示统计检验的相伴概率,而以星号(*)显示,星号的意义与计算简单相关系数中的相同。
『步骤3』单击Options按钮,出现Partial Correlations对话框,如图3-12所示。
图3-12 Partial Correlations对话框
在Statistics框中选择Zero-order correlations项,在输出偏相关系数的同时还输出变量间的简单相关系数。
在Missing Values框中选择Exclude cases listwise项,剔除所有具有缺失值的个案后再计算。
『步骤4』单击Continue按钮,返回Partial Correlations对话框,单击OK按钮,即可得到SPSS相关分析的结果。
⑶结果和讨论
SPSS的运行结果如下。