spss练习题及简 答解读
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS练习题
1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件。
先排序data---sort cases再合并data---merge files
2、有一份关于居民储蓄调查的数据存储在EXCEL中,请将该数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。
转换Data---transpose,输题目
3、利用第2题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000-2000之间的调查数据,第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
选取数据data---select cases
4、利用第2题数据,将其按常住地(升序)、收入水平(升序)存款金额(降序)进行多重排序。
排序data---sort cases一个一个选,加
5、根据第1题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算transform---count按个输,把所有课程选取,define设区间,再排序
6、根据第1题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和女生各科成绩的平均分。
描述性统计,先转换Data---transpose学号放下面,全部课程(poli到his)放上面,ok,analyze---descriptive statistics---descriptives,全选,options。
先拆分data---split file 按性别拆分,analyze---descriptive statistics---descriptives全选所有课程options---mean
7、利用第2题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
数据分组Transform---recode---下面一个,输名字,change,old,range,new value---add 挨个输,从小加到大,等距
8、在第2题的数据中,如果认为调查“今年的收入比去年增加”且“预计未来一两年收入仍会会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。
(计算transform---count或)选取data---select cases
9、利用第2题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
Analyze--- descriptive statistics---frequencies
10、利用第2题数据,从数据的集中趋势、离散程度和分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准分布曲线进行对比,进一步,对不同常住地住房存款金额的基本特征进行对比分析。
An DS d Analyze---Descriptive Statistics---Descriptives,选择存款金额到Variable(s)中。
按Option,然后选择Mean,std.deviation,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,Variable
list.然后按continue,ok
11、将第1题的数据看作来自总体的样本,试分析男生和女生的课程平均分是否存在显著差异;试分析哪些课程的平均差异不显著。
Transform compute课程平均分=mean() analyze->compare means->independent-samples T;选择若干变量作为检验变量到test variables框(课程平均分);选择代表不同总体的变量(sex)作为分组变量到grouping variable框;.定义分组变量的分组情况Define Groups...:(填1,2)。
1.两总体方差是否相等F检验:F的统计量的观察值为0.257,对应的P值为0.614,;如果显著性水平为0.05,由于概率P值大于0.05,两种方式的方差无显著差异.看eaual variances assumend。
2.两总体均值的检验:.T统计量的观测值为-0.573,对应的双尾概率为0.569,T的P值>显著水平0.05,故不能推翻原假设,所以女生男生的课程平均分无显著差异。
配对差异:analyze->compare means->paired-samples T…paired variables框中每科与不同科目配对很麻烦略
12、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为
75,现从雇员中随机随出11人参加考试,得分如下:80、81、72、60、78、65、56、79、
77、87、76,请问该经理的宣称是否可信?
步骤:采用单样本T检验(原假设H0:u=u0,总体均值与检验值之间不存在显著差异.);菜单选项:Analyze->compare means->one-samples T test;指定检验值:在test后的框中输入检验值(填75),最后ok!分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t 统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
13、利用促销方式数据,试分析这三种推销方式是否存在显著差异,绘制各组均值的对比图,
并利用LSD方法进行多重比较检验。
单因素方差分析对比图为options中的descriptives
LSD为post…中的P值大于a接受所以无关
14、已知240例心肌梗塞患者治疗后24小时内的死亡情况如表1所示,问两组病死亡率相
差是否显著?(example1.sav)(显著性水平为5%)
表1:急性心肌梗塞患者治疗后24小时生死情况
·提出假设:
H0:是否接受治疗的急性心肌梗塞患者的病死率相差不显著
H1:是否接受治疗的急性心肌梗塞患者的病死率相差显著
·操作步骤:
1、打开数据文件:file-open-data-example1.sav
2、对count变量进行weight cases处理:data-weight cases
选中weight cases by;在Frequencies variable中加入变量count。
3、对数据进行交叉汇总,如得出的下列频次交叉表,如图表3-1:
用descriptive-cross tab过程,column填status, row填group。
在cell选项中,选中percentages,以计算频数百分比。
·统计表格及分析:
表3-1 是否接受治疗与生存状况的相关性检验成果表(Chi-Square Tests)
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 6.040(b) 1 .014
Linear-by-Linear Association 6.015 1 .014
有效个案数240
表3-1是相关性卡方检验成果表。
表中依次列出了Pearson卡方系数、线性相关的值(Value)、自由度(df)和双尾检验的显著水平(Asymp. Sig. (2-sided))。
表3-2显示了根据是否使用单参注射液对急性心肌梗塞患者进行分组后,患者的生存和死亡状况频数和所占总数的百分比。
表3-2 急性心肌梗塞患者是否治疗与生死情况的列联表
状况(status) 总数
生存死亡
分组(group)) 用单参注射液Count 185 10 195
% within 分组(group) 94.9% 5.1% 100.0% 未用单参注射液Count 38 7 45
% within ·分组(group) 84.4% 15.6% 100.0%
总数Count 223 17 240
% within ·分组(group) 92.9% 7.1% 100.0% ·结论:
根据表3-1可以看出,双侧检验的显著性概论为0.014,小于显著性水平0.05;因此否定原假设,接受备择假设,即两组患者的完全缓解率之间差别显著。
15、已知数据如表2所示,比较单用甘磷酰芥(单纯化疗组)与复合使用光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者的完全缓解率之间有无差别?(example2.sav)(显著性水平为5%)
表2:两化疗组的缓解率比较
同上小于拒绝显著
16、已知数据如表3所示,问我国南北方鼻咽癌患者(按籍贯分)的病理组织学分类的构成比有无差别?(example3.sav)(显著性水平为5%)同上小于拒绝显著
表3:我国南北方鼻咽癌患者病理组织学分类构成
17、已知97名被调查儿童体检数据文件为child.sav,请分别计算男性、女性与两性合计的儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。
1、打开数据文件:file-open-data-child.sav
2、均值比较与检验:Analyze-Compare means-means
3、在independent Var. 中选性别,dependent Var. 中选体重和身高
4、在option子框中选择median/mean/Std. Deviation
1、男性儿童的平均身高为109.962厘米;平均体重为18.202千克;中位身高为109.10厘米;中位体重为17.50千克;身高的标准差为6.084厘米;体重的标准差为2.786千克。
2、女性儿童的平均身高为109.896厘米;平均体重为18.389千克;中位身高为109.450厘米;中位体重为17.750千克;身高的标准差为5.770厘米;体重的标准差为3.235千克。
3、两性儿童的平均身高为109.930厘米;平均体重为18.292千克;中位身高为109.250
厘米;中位体重为17.605千克;身高的标准差为5.905厘米;体重的标准差为2.995千克。
18、已知97名被调查儿童体检数据文件为child.sav,请问儿童的身高与体重是否分别受到性别与年龄的影响?(显著性水平为5%)
·提出假设:
1、H0:身高与体重受到年龄的影响不显著
H1:身高与体重受到年龄的影响显著
2、H0:身高与体重受到性别的影响不显著
H1:身高与体重受到性别的影响显著
·操作步骤:
1、打开数据文件:file-open-data-child.sav
2、均值比较与检验:analysis-compare means-means
3、在independent Var. 中选性别和年龄,dependent Var. 中选体重和身高
4、在option子框中选择median/mean/ Std. Deviation
在statistic for first layer 区域内勾上ANOVA table and eta复选框
·统计表格及分析:
表7-1 体重、身高与年龄的方差分析表
Sum of Squares df Mean
Square F Sig.
体重(x4,kg) * 年龄(age) Between Groups 286.215 2 143.107 23.518 .000 Within Groups 565.918 93 6.085
Total 852.133 95
身高(x5,cm) * 年龄(age) Between Groups 1757.707 2 878.853 52.567 .000 Within Groups 1554.855 93 16.719
Total 3312.562 95
在表7-1中,分别列出了平方和(Sum of Squares)、自由度(df)、均方差(Mean Square)、
F 值以及F 值的显著性水平(Sig.)。
F 对应的概率值P(sig)<α(α=0.05);故拒绝原假设 ,接受备择假设,即身高与体重受到年龄的影响显著。
表7-2 体重、身高与性别的方差分析表
df Mean
Square F Sig. 体重(x4,kg) * 性别(x2) Between Groups 1 .839 .093 .762 Within Groups 94 9.056
Total
95 身高(x5,cm) * 性别(x2) Between Groups
1 .105 .003 .956 Within Groups 94 35.239
Total
95
在表7-2中,F 对应的概率值P(sig)>α(α=0.05);故接受原假设,即身高与体重受到性别的影响不显著。
19、文件example.sav 中列出了某学校四个年级同学接受专业训练前后的铁饼成绩,问接受专业训练后同学们的铁饼成绩有无显著提高?(显著性水平为5%)
统计表格及分析:
表8-1 配对样本的相关性分析表
H 0: 铁饼(训练前)和 铁饼(训练后)的数据之间不存在线性关系 H 1: 铁饼(训练前)和 铁饼(训练后)的数据之间存在线性关系
表8-1列出了配对样本的个数(N )、相关系数(Correlation )、显著性概率(Sig.)。
显著性概率趋近于0,远小于0.05,所以认为铁饼(训练前)和 铁饼(训练后)的数据之间存在线性关系。
表8-2 配对样本T 检验的成果表
表8-2中为铁饼(训练前)和铁饼(训练后)的数据的T检验结果。
表中前4项分别为配对样本数据差异的均值(Mean)、标准离差(Std. Deviation)、均值的标准差(Std. Error Mean)以及95%置信区间。
后3项为t值(t)、自由度(df)和双尾显著性概率(Sig. (2-tailed))。
表中双尾显著性概率为0.012,远小于0.05,故拒绝原假设,接受备择假设,认为配对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩提高显著。
·结论:
铁饼(训练前)和铁饼(训练后)的数据之间存在线性关系。
且配对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩有显著提高。
20、文件example.sav中列出了某学校四个年级同学的外语与中文成绩,问男女生总成绩(英文+中文)之间有无显著差异?(显著性水平为5%)做法:先计算出总成绩,计算方法:Transform菜单栏下的Compute Variable选项
总成绩计算出来之后,选择Analyze选项下Compare Means选项下“两独立样本T检验”选项卡
将总成绩放入Test Variable一栏中,性别放入Grouping Variable一栏中并为其定义。
点Ok即可得出结果。
结果分析:方差齐次性,采用F检验,0.235,大于0.05,所以认为男女生总成绩两样本的的方差是没有显著性差异的;
校正t检验的显著性水平Sig(2-tailed)为0.951,大于0.05,所以男女生总成绩之间没有显著性差异。
21、根据以往的资料,学生中文的平均成绩为80分。
文件example.sav中列出了某学校四个年级学生的中文成绩,问学生中文成绩有无显著的下降?(显著性水平为5%)
·提出假设:
H0 :μ=50(μ-50=0);即学生中文成绩无显著的下降。
H1:μ≠50(μ-50≠0);即学生中文成绩有显著的下降。
·操作步骤:
1、打开数据文件:file-open-data-example.sav
2、单一样本的均值检验:analysis-compare means-One Sample T Test
3、在test value 中输入80,在test Variable中选“中文”。
4、在options中输入显著性水平5%
·统计表格及分析:
表9-1 数据统计量表
表9-1为单样本数据的统计量表,列出了变量“中文”对应的数据个数(N)、均值(mean)、标准离差(Std. Deviation)、均值的标准差(Std. Error Mean)。
表9-2 单样本均值检验成果表
表9-2为单样本均值检验的成果表。
表中分别为t值(t)、自由度(df)和双尾显著性概率(Sig. (2-tailed))均值差(Mean Difference)以及均值差的95%置信区间。
表中的显著性概率为0.528,远大于0.05;因此,可以认为该样本数据的均值与总体均值之间没有显著差异。
故接受原假设,即学生中文成绩无显著的下降。
·结论:
样本数据的均值与总体均值之间没有显著差异,即学生中文成绩无显著的下降。
22、文件example.sav中列出了某学校四个年级同学的英文成绩,问学生英文成绩是否受到年级因素的影响?(显著性水平为5%)
H0 :μ1 =μ2 =μ3;即学生英文成绩不受年纪影响。
H1:μ1、μ2、μ3不完全相等;即学生英文成绩受年纪影响。
·操作步骤:
1、打开数据文件:file-open-data-example.sav
2、单因方差分析检验:Analysis→Compare Means→One-Way ANOV A
3、在“dependent list”列表中输入变量名“英语”;在“factor”文本框中输入变量名“年
纪”。
4、在options中输入显著性水平5%
·统计表格及分析:
表10-1 数据方差分析表
Within Groups 2475.000 20 123.750
Total 2580.000 23
表10-1中分别列出了方差来源、平方和(Sum of Squares)、自由度(df)、均方差(Mean Square)、F值以及F值的显著性水平(Sig.)。
由于表中的显著性水平为0.837,远大于0.05;故接受原假设,即认为学生英文成绩不受年级影响。
23、已知10名20岁男青年身高与臂长的数据,请计算其相关系数,身高与臂长间存在显著的相关关系吗?(显著性水平为5%)(example4.sav)
表4青年身高与臂长的数据
·提出假设:
H0 :身高与臂长间不存在显著的相关关系。
H1: 身高与臂长间存在显著的相关关系。
·操作步骤:
1、打开数据文件:file-open-data-example4.sav
2、相关性检验:Correlation-Bivariate
3、选择Pearson(积距相关);在option子框中选择means/Sd.
·统计表格及分析:
表11-1 描述统计量表
表11-1为描述统计量表。
表中列出的统计量包括变量的均值(Mean)、标准离差(Std. Deviation)和数据个数(N)。
表11-2 相关分析成果表
身高(cm)Pearson Correlation 1 .823(**)
Sig. (1-tailed) .002
N 10 10 臂长(cm)Pearson Correlation .823(**) 1
Sig. (1-tailed) .002
N 10 10
** Correlation is significant at the 0.01 level (1-tailed)
表11-2为相关分析成果表,表中列出了2个变量之间的Pearson相关系数、单侧显著性检验概率(Sig. (1-tailed))和数据组数(N)。
脚注内容显示相关分析结果在0.01的水平上显著。
另外,从表中可以看出,显著性概率为0.002,远小于0.05,故拒绝原假设,接受备择假设;可以认为身高和臂长的数据有较强的相关性。
·结论:
根据相关性分析结果,可知身高与臂长间存在显著的相关关系,其相关系数为0.823,属于强相关。
24、已知学生铁饼与标枪的数据,请计算其相关系数?(example.sav)
·提出假设:
H0 :学生铁饼与标枪成绩之间不存在显著关系。
H1: 学生铁饼与标枪成绩之间存在显著关系。
·操作步骤:
1、打开数据文件:file-open-data-example.sav
2、相关性检验:Correlation-Bivariate
3、选择Pearson(积距相关);在option子框中选择means/Sd.
·统计表格及分析:
表12-1 描述统计量表
铁饼(训练前)8.154 1.6479 24
表11-1为描述统计量表。
表中列出的统计量包括变量的均值(Mean)、标准离差(Std. Deviation)和数据个数(N)。
表12-2 相关分析成果表
标枪(m)铁饼(训练前)标枪(m)Pearson Correlation 1 .644(**)
Sig. (1-tailed) .000
N 24 24 铁饼(训练前)Pearson Correlation .644(**) 1
Sig. (1-tailed) .000
N 24 24 ** Correlation is significant at the 0.01 level (1-tailed).
表12-2为相关分析成果表,表中列出了2个变量之间的Pearson相关系数、单侧显著性检验概率(Sig. (1-tailed))和数据组数(N)。
脚注内容显示相关分析结果在0.01的水平上显著。
另外,从表中可以看出,显著性概率趋近于0,故拒绝原假设,接受备择假设,即学生铁饼与标枪成绩之间存在显著关系。
·结论:
学生的铁饼与标枪的数据有较强的相关性,其相关系数为0.644。
25、已调查97名儿童的生长发育数据,其中有左眼视力(x9)、右眼视力(x10),并已建立数据文件child.sav。
试问左眼视力(x9)与右眼视力(x10)间有无相关关系?(显著性水平为5%)
·提出假设:
H0 :μ1-μ2=0,即左眼视力与右眼视力间不存在显著的相关关系。
H1: μ1-μ2≠0,即左眼视力与右眼视力间存在显著的相关关系。
·操作步骤:
1、打开数据文件:file-open-data-child.sav
2、相关性检验:Correlation-Bivariate
3、选择Pearson(积距相关);在option子框中选择means/Sd.
4、在options中输入显著性水平5%
·统计表格及分析:
表13-1 描述统计量表
表13-1为描述统计量表。
表中列出的统计量包括变量的均值(Mean)、标准离差(Std. Deviation)和数据个数(N)。
表13-2 相关分析成果表
左眼视力(x9) 右眼视力(x10)
左眼视力(x9) Pearson Correlation 1 .779(**)
Sig. (1-tailed) .000
N 96 96
右眼视力(x10)Pearson Correlation .779(**) 1
Sig. (1-tailed) .000
N 96 96 ** Correlation is significant at the 0.01 level (1-tailed).
表13-2为相关分析成果表,表中列出了2个变量之间的Pearson相关系数、单侧显著性检验概率(Sig. (1-tailed))和数据组数(N)。
脚注内容显示相关分析结果在0.01的水平上显著。
另外,从表中可以看出,显著性概率趋近于0,远小于0.05,故拒绝原假设,接受备择假设;可以认为儿童左眼视力与右眼视力有较强的相关性。
·结论:
儿童左眼视力与右眼视力有较强的相关性,其相关系数为0.779。
26、某地29名13岁男童身高(x1,cm),体重(x2,kg)及肺活量(y,L)的实测数据文件是:example5.sav。
试计算其简单相关系数,当体重(x2)被控制(即固定)时,计算身高(x1)与肺活量(y)的偏相关系数r31.2,并作假设检验
·提出假设:
H0 :身高与肺活量的偏相关系数与零无显著差异。
H1:身高与肺活量的偏相关系数与零有显著差异。
·操作步骤:
1、打开数据文件:file-open-data-example5.sav
2、偏相关计算:Analyze-Correlate-Partial
3、把参与分析的变量”身高”、”肺活量”选择到Variables;将控制变量”体重”选择到Controlling for。
在option中的statistics中选择Zero-order Correlations,表示输出零阶偏相关系数。
·统计表格及分析:
表14-1 偏相关因素的偏相关分析成果表
Control Variables 身高(cm) 肺活量(L) 体重(kg) -none-(a) 身高(cm) Correlation 1.000 .588 .742
Significance
. .001 .000
(2-tailed)
df 0 27 27
肺活量(L) Correlation .588 1.000 .736
Significance
.001 . .000
(2-tailed)
df 27 0 27
体重(kg) Correlation .742 .736 1.000
Significance
.000 .000 .
(2-tailed)
df 27 27 0 体重(kg) 身高(cm) Correlation 1.000 .093
Significance
. .639
(2-tailed)
df 0 26
肺活量(L) Correlation .093 1.000
Significance
.639 .
(2-tailed)
df 26 0
a Cells contain zero-order (Pearson) correlations.
由上表可以知道一系列简单相关系数和当体重被控制时,身高与肺活量的偏相关系数。
检验统计量的概率P值为0.639,大于给定的显著性水平0.05;故接受原假设,认为身高与肺活量的偏相关系数与零无显著差异。
·结论:
1、男童身高与体重的简单相关系数为0.742;肺活量与身高的简单相关系数为0.588;体重与肺活量的简单相关系数为0.736。
2、身高与肺活量的偏相关系数为0.093,P=0.639。
身高与肺活量的偏相关系数与零无显著差异,即身高与肺活量无显著的的偏相关。
27、世界各国的统计数据表明:妇女生育率与人均国民生产总值之间呈现出对数关系。
请依据example6.sav中所提供的数据写出其回归方程与多元相关系数,在显著水平为5%时显著吗?[Analyze]→[Regression]→[Linear]
28、文件example7.sav中列出了我国分地区家庭年人均食品支出、人均收入与粮食单价的数据。
请建立人均食品支出与人均收入间的一元线性回归方程,,同时建立人均食品支出与人均收入和粮食单价间的二元线性回归方程。
·操作步骤:
1、打开数据文件:file-open-data-example7.sav
2、线性回归:Analyze-Regression-Linear
3、一元线性回归方程:在dependent中输入变量“人均食品支出”;在independent中输入变量“人均收入”。
<Analyze>-<Correlate>-<Bivariate
4、二元线性回归方程:在dependent中输入变量“人均食品支出”;在independent中输入变量“人均收入”和“粮食单价”。
·统计表格及分析:
表15-1 相关系数矩阵
人均食品支出人均收入Pearson Correlation 人均食品支出 1.000 .923
人均收入.923 1.000 Sig. (1-tailed) 人均食品支出. .000
人均收入.000 .
N 人均食品支出30 30
人均收入30 30 ·提出假设:
H0 :人均食品支出和变量人均收入之间无显著关系。
H 1: 人均食品支出和变量人均收入之间有显著关系。
表15-1为相关系数矩阵。
表中第二行为相关系数矩阵;第三行为不相关的显著性水平。
变量人均食品支出和变量人均收入的相关系数为0.923,说明两者关系紧密。
单尾显著性检验的概率值趋近于0,所以拒绝两变量没有相关性的假设,接受备择假设,即人均食品
支出和人均收入之间有显著关系。
表15-2 数据方差分析表
表15-2为方差分析表。
利用该表作回归系数的显著性检验。
表中列出了回归项(
Regression )、残差项(Residual )的平方和(Sum of Squares )、自由度(df )、均方(Mean Square )F 值和显著性概率(Sig .)。
由于表中的显著性概率趋近于0,小于0.05;所以拒绝原假设,即认为回归系数不为零,回归方程是有意义的。
表15-3 一元线性回归方程系数表
表15-3中列出了变量人均收入和常数项的非标准化系数(Unstandardized Coefficients ),标准化系数(Standardized Coefficients )、t 值、显著性水平(Sig.)和自变量待定系数取值与常数项的95%置信区间。
自变量还列出了各种相关性指标和线性统计量。
表中变量人均收入的显著性水平概率(sig.)趋近于0,所以变量的待定系数取值(B )是可靠的。
所以人均食品支出与人均收入间的一元线性回归方程:Y=-53.086+0.422X
·同上方法,可进行二元线性回归方程计算。
表15-4 二元线性回归方程系数表
Unstandardized
Coefficients
Standardized Coefficients
t
Sig.
95% Confidence Interval for B Correlations Collinearity Statistics Model B Std.
Error
Lower Bound Upper Bound Zero-order Partial
Part
Tolera nce
VIF
1 (Cons tant) -53.086 67.963 -.781 .441 -192.303
86.131 人均收入
.422
.033
.923
12.694
.000
.354
.490
.923
.923
.923
1.000
1.000
B Std.
Error Beta
Lower
Bound
Upper
Bound
Zero-
order Partial Part
Tolera
nce VIF
1 (Con
stant) -85.196
63.90
3
-1.333 .194 -216.314 45.922
人均
收入
.360 .040 .787 9.084 .000 .279 .442 .923 .868 .608 .596 1.678
粮食价格
187.621
76.27
5
.213 2.460 .021 31.117 344.124 .714 .428 .165 .596 1.678 表中变量“人均收入”和“粮食价格”的显著性水平概率(sig.)都小于0.05,故认为
其待定系数取值是可靠的。
所以,人均食品支出与人均收入和粮食单价间的二元线性回归方
程二元方程:Y=-85.196+0.36X1+187.621X2
·结论:
1、人均食品支出与人均收入间的一元线性回归方程:Y=-53.086+0.422X
2、人均食品支出与人均收入和粮食单价间的二元线性回归方程二元方程:
Y=-85.196+0.36X1+187.621X2
29、钩虫病复查阳性率y和治疗次数x有如下关系:
表5:阳性率(y)和治疗次数(x)
请用曲线估计法作多种曲线拟合,并请指出那种拟合效果最好?为什么?(curve1.sav)
[Analyze]→[Regression]→[CurveEstimation]
30、已知数据文件:hemoglo.sav。
试分别建立Ca、Mg、Fe、Mn与Cu对hemog1的直线回
归方程,并列出直线回归方程及其P值。
注意方程如何写?
·操作步骤:
1、打开数据文件:file-open-data-hemoglo.sav
2、线性回归分析:Analyze-Regression-Linear
3、在independent中依次输入变量ca、Mg、Fe、Mn与Cu;
在dependent中输入变量hemog1。
·统计表格及分析:
表16-1 线性回归方程系数表1
表16-2 线性回归方程系数表2
表16-3 线性回归方程系数表3
表16-4 线性回归方程系数表4
表16-5 线性回归方程系数表5
以上分别为Ca、Mg、Fe、Mn与Cu对hemog1的直线回归方程系数表。
列出了变量人
均收入和常数项的非标准化系数(Unstandardized Coefficients),标准化系数(Standardized Coefficients)、t值、显著性水平(Sig.)和自变量待定系数取值与常数项的95%置信区间。
自变量还列出了各种相关性指标和线性统计量。
根据以上数据可以求出Ca、Mg、Fe、Mn与Cu对hemog1的直线回归方程。
·结论:
31、对数据文件:hemoglo.sav。
进一步调用逐步回归法(Stepwise)、强迫剔除法(Remove)、向后逐步回归法(Backward)与向前逐步回归法(Forward)建立Ca、Mg、Fe、Mn与Cu 对hemog1的多元线性回归方程。
·题目分析:
题目中要求用不同的回归方法,建立不同变量之间的多元线性回归方程,显然需要进行回归分析。
特别要注意不同的回归发法的各自的剔除变量的要求。
·操作步骤:
1、打开数据文件:file-open-data-hemoglo.sav
2、线性回归分析:Analyze-Regression-Linear
用enter强行进入做事前分析。
1 系数表
表17-
1 (Constant) 1.380 1.549 .890 .382
钙(Ca) -.069 .028 -.304 -2.500 .020
镁(Mg) .028 .053 .079 .534 .599
铁(Fe) .028 .004 .821 6.730 .000
锰(Mn) -16.577 16.414 -.106 -1.010 .323
铜(Cu) 1.715 1.143 .205 1.501
.147
由表17-1 可知,除了Ca和Fe外的变量的回归系数显著性t检验的概率p值都大于显著性水平0.05。
因此接受原假设,即这些变量与血红蛋白无显著的线性关系,不应引入方程,可剔除这些变量,仅保留Ca和Fe变量。
3、逐步回归法(Stepwise):逐步回归法是对向前逐步回归法的改进,它既有引入变量,也有剔除变量。
·统计表格及分析:
表17-2 变量输入输出表
由17-117-2。
表17-3
系数分析表(逐步回归法)
由上表可得出Fe对hemog1的线性方程为Y=-0.657+0.029X
4、强迫剔除法(Remove):剔除所有变量。
5、向后逐步回归法(Backward):
·统计表格及分析:
表17-4 变量输入输出表
Model Variables Entered Variables Removed Method
1 铁(Fe), 铜(Cu), 锰
(Mn), 钙(Ca), 镁
(Mg)
. Enter
2
. 镁(Mg) Backward
(Criterion:
F-to-remove <=
2.710).
3
. 锰(Mn) Backward
(Criterion:
F-to-remove <=
2.710).
由表17-4,只能剔除镁、锰;故将铁和钙引入方程。
表17-5 系数表(向后回归法)
Model Unstandardized
Coefficients
Standardized
Coefficients
t Sig.
B Std. Error Beta
1 (Constant) 1.07
2 1.551 .691 .496
钙(Ca) -.040 .022 -.177 -1.815 .081
铁(Fe) .031 .003 .917 9.382 .000 由上表可得出Ca与Fe对于hemog1的方程Y=1.072-0.040X1+0.031X2
6、向前逐步回归法(Forward):
因为Fe与hemog1的线性相关系数最高,所以在向前逐步回归法中选择变量Fe进入方程。
在independent中依次输入变量Fe;在dependent中输入变量hemog1。
·系数表与逐步回归法一致。
故,Fe对hemog1的线性方程为Y=-0.657+0.029X
·结论:
1、stepwise:纳入变量:Fe Y=-0.657+0.029X
2、Remove:统统剔除。
3、Backward:纳入变量:Fe, Ca。
Y=1.072-0.040X1+0.031X2
4、Forward:纳入变量:Fe。
Y=-0.657+0.029X
32、掷一颗骰子600次,结果如下表所示。
问这颗骰子是否均匀?(显著性水平为5%)(example8.sav)
·题目分析:
分析这颗骰子是否均匀,即掷子每个点数出现几率是否相同。
·提出假设:
H0:掷子每个点数出现几率无显著性差别。
H1:掷子每个点数出现几率有显著性差别。
·操作步骤:
1、打开数据文件:file-open-data-hemoglo.sav
2、先对“频率”加权处理:data-weight cases
选中weight cases by;在Frequencies variable中加入变量频率
3、卡方检验:Analyze-Nonparametric Tests-Chi-square Test
4、在test Var. list 中填“点数”,选择All categories equal单选框
·统计表格及分析:
表18-1 点数频数分析表
Observed N Expected N Residual
1 80 100.0 -20.0
2 99 100.0 -1.0
3 119 100.0 19.0
4 91 100.0 -9.0
5 128 100.0 28.0
6 83 100.0 -17.0
Total 600
表18-1中,为各点数的实际出现频数(Observed N)、期望频数(Expected N)以及残差(Residual)。
表18-2 卡方检验成果表。