spass软件与统计分析实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Spass16.0与统计数据分析
实验报告
实验课程:专业统计软件运用
上课时间: 2012 学年上学期 16 周( 2012 年 06 月 04 日—07日)
姓名:花满楼
学号: 2010201101
班级: 0301008班
学院:经济管理学院
上课地点:经管实验室五楼
指导教师:刘进
第六章实验
一实验1及目的
1. 某农场为了比较4种不同品种的小麦产量的差异,选择土壤条件基本相同的土地,分成16块,将每一个品种在4块试验田上试种,测得小表亩产量(kg)的数据如表6.17所示(数据文件为data6-4.sav),试问不同品种的小麦的平均产量在显著性水平0.05和0.01下有无显著性差异。
(数据来源:《SPSS实用统计分析》郝黎仁,中国水利水电出版社)
表6.17 小麦产量的实测数据
二
解决问题1的原理:单因素方差分析
实验步骤:1.打开数据文件data6-4.sav
2.选择analyze—compare means—one-way ANOVA
3.dependent list 框里为产量,factor为品种
4.在options中选择homogeneity of variance test和exclude cases analysis
by analysis
5.在post hoc按钮里选择LSD方法,改变相关系数为0.05和0.01
6.得出结果
三结果分析
2.数据分析:在0.05和0.01显著性水平下,H0假设都是:方差相等,从上表中可以看出Sig.=0.046,小于0.05大于0.01,所以在0.05的显著性水平下不接受H0假设,即有显著性差异,但是在0.01的显著性水平下接受H0假设,即无显著性差异。
一实验2及目的
2. 某公司希望检测四种类型的轮胎A,B,C,D的寿命(由行驶的里程数决定),见表
6.18(单位:千英里)(数据文件为data6-5.sav),其中每种轮胎应用在随机选择的6辆汽车上。
在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异?(数据来源:《统计学(第三版)》,M.R.斯皮格尔,科学出版社)
表6.18 四种轮胎的寿命数据
二实验内容
解决问题2的原理:单因素方差分析
实验步骤:1.打开数据文件data6-5.sav
2.选择analyze—compare means—one-way ANOVA
3.方差相等的齐性检查。
将“历程”、“轮胎”分别移入Dependent List以及
Factor。
点击Options按钮,选中Homogeneity of variance test(方差齐
性检验),而后运行
4.多重分析比较。
在One-way NOVA中单击Post Hoc…按钮,选择LSD方法,显
著性水平取0.05,单击 Options按钮,选中Descripive和Means plot,对
数据进行整体描绘
5.得出结果。
三结果分析
1.数据截图
2:数据分析:在0.05显著性水平下,H0假设是:方差相等,从上表中可以看出Sig.=0.050,等于于0.05,所以在0.05的显著性水平下接受H0假设,说明没有显著性差异。
一实验3及目的
3. 某超市将同一种商品做3种不同的包装(A)并摆放在3个不同的货架区(B)进行销售试验,随机抽取3天的销售量作为样本,具体资料见表6.20。
要求检验:在显著性水平0.05下商品包装、摆放位置及其搭配对销售情况是否有显著性影响。
(数据来源:《应用统计学》耿修林,科学出版社;数据文件:data6-7.sav)
表6.20 销售样本资料
二实验内容
解决问题3的原理:多因素方差分析原理
实验步骤:1.分析,需要研究不同包装的产品A和不同货架区对销售量的影响。
这是一个多因素方差分析问题。
2.数据组织,按表6.20的变量名组织成4列数据。
3.变量设置,按Analyze→General LinearModel→Univeariate的步骤打开Univariate对话框。
并将“销售量”变量移入Dependent Variable框中作为
观测变量,将“包装(A)”、“货架区(B)”移入Fixed Factor(s)中作
为控制变量。
4.设置方差齐性检验,单击Options按钮,由于方差分析要求不同组别数据方差
相等,故应进行方差齐性检验,选中“Homogeneity tests
5.得出结果。
三结果分析
2.数据分析:从上图可以看出,所有的LSD方法的结果中,三组相伴概率Sig.均大于显著性性水平0.05,所以不能拒绝原假设,结果没有显著性影响。
一实验4及目的
4. 研究杨树一年生长量与施用氮肥和钾肥的关系。
为了研究这种关系,一共进行了18个样地的栽培实验,测定杨树苗的一年生长量、初始高度、全部实验条件(包括氮肥量和钾肥量)及实验结果(杨树苗的生长量)数据如表6.21,请在显著水平0.05下检验氮肥量、钾肥量及树苗初始高度中哪些对杨树的生长有显著性影响。
(数据来源:《生物数学模型的统计学基础》李勇,科学出版社;数据文件:data6-8.sav)
表6.21 杨树栽培试验数据
二实验内容
解决问题4的原理:多因素方差分析原理
实验步骤:1.打开数据源文件data6-8.sav
2.变量设置,按Analyze→General LinearModel→Univeariate的步骤打开
Univariate对话框。
并将“生长量”变量移入Dependent Variable框中作为
观测变量,将“氮肥量”、“钾肥量”、“树苗初高”移入Fixed Factor(s)
中作为控制变量。
3.设置方差齐性检验,单击Options按钮,由于方差分析要求不同组别数据方差
相等,故应进行方差齐性检验,选中“Homogeneity tests
4.得出结果
三结果分析
1.数据截图
2.数据分析:从表格中可以看出,“氮肥量”、“钾肥量”、“树苗初高”的相伴概率Sig.均大于0.05,所以他们对杨树的生长无显著性影响。
第八章实验
一实验3及目的
3.K.K.Smith在烟草杂交繁殖的花上收集到如表8.16所示的数据,要求对以上3组数据两两之间进行相关分析,以0.05的显著性水平检验相关系数的显著性。
(数据来源:《统计软件SPSS系列应用实践篇》苏金明,电子工业出版社;数据文件:data8-5.sav)
6)以及距离分析(7)
实验步骤:1.打开相应数据文件
2.运行Analyze—Correlate—bivariate,填好Variables框,选择Pearson相
关系数;在test of significance 中选择单尾或者双尾检验,单击options
按钮,在打开对话框中选择Means and standard deviations和cross-product
deviation and covariances选项
3.运行,得出结果。
三结果分析
第3题实验结果图表
数据分析:从上面三个图可以看出,Sig.值为0.00和0.002均小于0.05,所以,显著性很明显。
一试验4及目的
4. 试确定1962-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性,数据如表8.17所示。
(数据来源:《数据统计与管理》1990年第5期,中国商场统计研究会主办;数据文件:data8-6.sav)
二实验步骤及内容
偏相关分析的步骤:1.打开相应数据文件
2. 选择Analyze→Correlate→Partial,指定分析变量和数据变量
3.运行,得出结果
数据分析:从上图可以看出,Sig.值为0.00小于0.05,所以,线性相关具有显著性。
一试验5及目的
5. 某高校抽样得到10名短跑运动员,测出100米的名次和跳高的名次如表8.18,问这两个名次是否在0.05的显著性水平下具有相关性。
(数据来源:《应用统计学:数据统计方法、数据获取与SPSS应用》马庆国,科学出版社;数据文件:data8-7.sav)
表8.18 10名运动员的100米及跳高名次
二
距离分析的步骤:
1.打开相应数据文件
2.运行按Analyze→Correlate→distance,在computer distances中选择between variables单选框,定义进行变量间的距离分析,在measure中选择dissmilarities,求解其不相似测度;单击measures按钮在interval下拉列表中选择euclidean distances表示计算变量间的欧式距离
数据分析:从上图可以看出,两个Sig.值均为0.013均小于0.05,所以,两个名次的线性相关都具有显著性。
第6题实验结果图表
数据分析:从上图中可以看出销量与价格的相关系数为-0.772,Sig.为0.005小于0.05,所以二者存在显著的相关性。
同理,销量和广告费用之间也存在显著的相关性。
第7题实验结果图表
数据分析:从上表中可以看出1和2和3的差距都比较大,2和3的差距要小些。
第九章实验题目
一实验目的
3. 合金钢的强度y与钢材中碳的含量x有密切的关系,为了冶炼出符合要求强度的钢,常常通过控制钢水中的碳含量来达到目的,因此需要了解y与x之间的关系,数据如表9.27所示,现对x和y进行一元线性回归分析。
(数据文件为:data9-5.sav)
表9.27 碳含量与钢强度数据
二实验步骤及内容
实验原理:本章实验原理主要为一元线性回归分析(3题)、多元线性回归分析(4题)、曲
线估计(5题)
一元线性回归分析的实验步骤:1.打开相应数据文件,定义相应变量X、Y
2.按Analyze→Regression→Linear的顺序打开对话框,将变量“Y”作为因变量选入
Dependent列表框,将变量“X”作为自选变量选入Independent列表框。
3.单击Plots按钮打开对话框,选用DEPENDENT和*ZPRED作图。
并且选择Histogram复选框给出正态曲线和Normal probability plot复选框标出标准化残差的正态概率图。
4.单击Save按钮,打开Linear Regression:Save对话框,在Predicted Values选项组中选择Standardized选项,在Residuals选项组中选择Standard-ized选项,在Distans选项中选择Cook’s和Leverage values两个选项。
5.运行,得出结果。
三结果分析
第3题实验数据
数据分析:从表格和图形中可以看出,残差满足正态分布,且一元线性拟合优度较高。
一实验4及目的
4. 某公司太阳镜销售情况如表8.17,销售量与平均价格、广告费用和日照时间之间的关系作多元线性回归分析。
(数据文件:data8-8.sav)
二实验步骤及内容
多元线性回归分析的步骤:1. 打开相应数据文件,定义相应变量X、Y
2.按Analyze→Regression→Linear的顺序打开对话框,将变量“Y”作为因变量选入Dependent列表框,将所有的变量“X”作为自选变量选入Independent列表框。
3.在Statistics对话框中选择estimated、model fit、discriptives、durbin-watson
4.单击Plots按钮打开对话框,选用DEPENDENT和ZRESID作图。
并且选择Histogram复选框给出正态曲线和Normal probability plot复选框标出标准化残差的正态概率图。
5.单击Save按钮,打开Linear Regression:Save对话框,在Predicted Values选项组中选择Standardized选项,在Residuals选项组中选择Standard-ized选项,在Distans选项中选择Cook’s和Leverage values两个选项。
6.在options对话框里默认设置。
各项选项确认后运行。
7.运行,得出结果。
第4题实验数据:
数据分析:根据图形和数据可以了解到回归分析的拟合优度。
一试验5及目的
5 研究青春发育阶段的年龄与远视率的变化关系,测得数据如表9.28所示,请对x与y的关系进行曲线估计。
(数据来源:《统计学(第二版)》袁卫,高等教育出版社;数据文件:data9-6.sav)
表9.28 青春发育阶段年龄与远视率的变化关系
二
曲线估计实验步骤:
1. 打开相应数据文件,定义相应变量X、Y
2.按graph—legacy dialogs—scatter/dot顺序打开scatter/dot图形类型选择对话框,并选择simple scatter,点击define并作图运行
3. 按Analyze→Regression→curve estimation,将models下的模型全选上,看哪种模拟更好,得出拟合优度
4.运行,得出结果。
第5题实验结果图表
数据分析:根据表格中的数据和拟合的曲线,我们可以知道变量之间的相关关系。
实验心得与体会
作为一名经济管理学院的学生,对于我们来说这次的专业统计软件的学习实在是太重要了,他对于我的学习以及将来的工作都有很大的帮助。
其一:我将自己所学的理论知识应用于实践,众所周知,理论和实际是必不可分的,只有将理论与实践相结合才能发挥真正的效力。
在本次实验中,我的理论知识得到了充分的巩固,实践能力也得到了显著的提高。
其次,这次实验开阔了我的视野,使我对统计的认识更近了一步。
同时,也让我对于统计软件在现实生活中的作用认识更加深刻。
随着经济社会的快速发展,统计在现代化管理和日常生活中的地位越来越重要。
这就是说,专业的统计软件的应用重要性也水涨船高。
英国统计学家哈斯利特说:“统计方法的应用时如此的普遍,在我们的工作、学习和生活中,统计的影响是那么的巨大,以至于说统计的重要性无论怎么样强调也不过分。
”因此,认真学习和掌握专业的统计软件的理论知识和实践应用就变得理所当然了。
总而言之,统计已经深入的融入在我们的日常生活中。
所以,学好统计软件的理论知识以及统计软件的实际应用变得至关重要。