SPSS实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS应用——
实验报告
班级:统计0801班
学号:**********
*名:**
指导老师:胡**
2010.9.8
一、实验目的:
1、熟悉SPSS操作系统,掌握数据管理界面的简单的操作;
2、熟悉SPSS结果窗口的常用操作方法,掌握输出结果在文字处理软件中的使用方法。
掌握常用统计图(线图、条图、饼图、散点、直方图等)的绘制方法;
3、熟悉描述性统计图的绘制方法;
4、熟悉描述性统计图的一般编辑方法。
掌握相关分析的操作,对显著性水平的基本简单判断。
二、实验要求:
1、数据的录入,保存,读取,转化,增加,删除;数据集的合并,拆分,排序。
2、了解描述性统计的作用,并掌握其SPSS的实现(频数,均值,标准差,中位数,众数,极差)。
3、应用SPSS生成表格和图形,并对表格和图形进行简单的编辑和分析。
4、应用SPSS做一些探索性分析(如方差分析,相关分析)。
三、实验内容:
1、使用SPSS进行数据的录入,并保存:
职工基本情况数据:
12 1 59 989 2 2 9
13 1 59 938 3 4 8
14 1 41 889 2 1 8
15 1 55 887 3 4 8
16 1 45 887 3 4 8
操作步骤如下:
打开SPSS软件,然后在数据编辑窗口(Data View)中录入数据,此时变量名默认为var00001,var00002,…,var00007,然后在Variable View窗口中将变量名称更改即可。
具体结果如下图所示:
输入后的数据为:
将上述的数据进行保存:
单击保存即可。
2、读取上述保存文件:
选择菜单File--Open—Data;选择数据文件的类型,并输入文件名进行读取,出现如下窗口:
选定职工基本情况.sav文件单击打开即可读取数据。
3、对上述数据新增一个变量工龄,其操作步骤为将当前数据单元确定在某变量上,选择菜单Data—Insert Variable,SPSS自动在当前数据单元所在列的前一列插入一个空列,该列的变量名默认为var00016,数据类型为标准数值型,变量值均是系统缺失值,然后将数据填入修改。
结果如下图所示:
Var00016为新增加的变量;
4、对上述进行数据转化:
操作步骤为Data—Transpose,显示窗口如下:然后单击Ok可以得到结果:
5、在上述数据中删除一个变量,过程如下:在欲删除的变量名上单击右键,从弹出菜单中选择cut选项,该列即被删除。
如删除年龄后的数据为:
6、将如下数据与上述数据进行纵向合并:
职工号性别职称失业保险
17 2 1 11
18 1 1 9
19 2 2 12
20 1 2 8
21 1 3 10
具体操作步骤为:在数据编辑窗口中打开一个需要合并的SPSS数据文件,选择菜单Data—Merge File—Add Cases弹出Add Cases:Read File对话框,然后确定盘符、路径、文件名后点击OK,即完成合并。
过程操作图如下:
结果如下:
将如下数据与初始数据进行横向合并:职工号奖金
1 1000
3 2000
13 1200
14 1400
16 1700
具体操作步骤同纵向合并,过程操作图如下:
得到结果为:
7、数据的拆分
操作步骤为,选择菜单Data—Spilt File显示如下窗口:
所得到的结果如下:
8、1中录入的数据进行排序,操作步骤为:选择菜单Data—Sort Cases,如下所示:
单击OK对基本工资进行升序排列得到结果如下:
9用SPSS对职工基本情况的原始数据进行作图,操作步骤为:Graphs—Legacy Dialogs选择相应的柱形图,饼图或者折线图。
以饼图为例,单击Pie显示如下窗口:
单击Define,结果如下:
以学历为例,得出饼图:
若要画柱图,则点击Bar显示如下对话框:
单击Define然后选定主要量,单击OK即可得到柱形图:
10、用SPSS求解上述数据中职工的频数,均值,标准差,中位数,众数,极差,操作步骤为:点击菜单Analyze—Descriptive statistic—Frequencies即可打开下面窗口:
以基本工资为例,点击Statistics,进入如下窗口:
最后单击OK便可得到所求结果:
从此表中可以看出职工基本工资的均值是905.4375,中位数是887,众数是824,标准差是79.33135,极差是220,各个基本工资的频数如下所示:
11、研究50只灯泡的耐用时数(小时)如下表:
886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850 用SPSS画出频数表和图
操作步骤如下:点击菜单Analyze—Descriptive Statistic—Frequencies,然后单击Statistics..按钮,出现如下对话框:
可点击相应的项目,要求系统球出相应的结果。
选好后点击Continue返回Frequencies对话框,然后点击Charts..,出现如下窗口:
可以选择直条图(Bar chart),适用于非连续的变量;另一种是直方图(Histograms),适用于连续型变量。
本例要求选择Histograms选项,并按要求绘制正态曲线(With normal curve)点击Continue返回,最后单击OK得出结果如下:
从这个表中可以知道一些基本的统计指标,例如:众数,中位数,总和,标准差,方差,极差等等。
上表为对变量灯泡时数所做的频数分布表,其中Frequency为频数、Percent为各组频数占总例数的百分比、Valid Percent为各组频数占总例数的有效百分比、Cum Percent为各组频数占总例数的累积百分比。
最后输出直方图和带有正态曲线的直方图:
从上述两个柱形图中可以看出灯泡时数基本呈正态分布。
12、单因素方差分析:
某企业广告形式和地区对销售额的影响,见下表:
广告形式 1 2 4 3 1 2 4 3 1 2 4 3 地区 1 1 1 1 2 2 2 2 3 3 3 3
销售额75 69 63 52 57 51 67 61 76 100 85 61
广告形式 1 2 4 3 1 2 4 3 1 2 4 3 地区 4 4 4 4 5 5 5 5 6 6 6 6
销售额77 90 80 76 75 77 87 57 72 60 62 52
广告形式 1 2 4 3 1 2 4 3 1 2 4 3 地区7 7 7 7 8 8 8 8 9 9 9 9
销售额52 76 33 70 33 81 79 75 69 63 73 40
广告形式 1 2 4 3 1 2 4 3 1 2 4 3 地区10 10 10 10 11 11 11 11 12 12 12 12
销售额60 94 100 64 61 54 61 40 70 68 67 66
其中广告形式中(1表示报纸,2表示广播,3表示宣传品,4表示体验)
具体操作步骤如下:
选择菜单Analyze--Compare means--one--Way ANOVA,出现下面所示窗口:
然后选择观测变量到Dependent List框;选择控制变量到Factor框,最后单击OK即可得到分析结果。
本例最后结果如下:
广告形式对销售额的单因素方差分析结果
上述结果显示了组间、组内和合计的自由度(df)、离均差平方和(Sum of Squares)、均方差(Means Square)、F值(F)和P值(Sig)。
从上述的结果中可以看出F=2.084,P=0.116.说明广告形式对销售额的影响程度比较大。
地区对销售额的单因素方差分析结果
根据上面的方法同理即可进行结果分析。
13、相关分析:
为研究高等院校人文社会科技研究中立项课题数会受哪些因素的影响收集到31各省市自治区部分高校有关社科研究方面的数据,研究立项课题数与投入的具有高级职称的人年数之间是否有较强的线性关系。
具体数据见下面表格:
首先利用SPSS绘制散点图,其操作步骤为:选择菜单Graphs—Scatter出现下列窗口:
单击Define:
Y轴为投入高级职称的人年数,X轴为课题总数点击OK得出散点图:
然后做相关分析,步骤为:Analyze—Correlate—Bivariate出现如下窗口:选择需要的因素,单击Options,得出:
点击Continue返回,单击OK即可得出结果:
由上表可看出上网时间和零花钱的相关性非常大,因为二者的简单相关系数为0.944,而Sig的值约等于0。
14、利用SPSS进行回归分析和残差分析:
依据题13中搜集的数据进行线性回归分析,此题中被解释变量为立项课题数,解释变量为投入人年数,投入高级职称的人年数,投入科研事业费,专著数,论文数,获奖数。
具体操作步骤如下:
选择菜单Analyze—Regression—Linear,得到下面窗口:
选择变量进入相应的对话框,点击OK得出如下结果:
上述表格表示所选变量入选
表中的各列数据项的含义依次为:被解释变量和解释变量的复相关系数,判定系
数2
R ,调整的判定系数2
R ,回归方程的估计标准差。
可以看出:被解释变量的总离差平方和为7
2.110⨯,回归平方和及均方分别为
71.910⨯和6546995.095,剩余平方和及均方分别为1435825和53178.693,
F 检验统计量的观测值为123.113,对应的概率p 值近似为0.由该表可知可进行回归方程的显著性检验。
从此表中可以看出t 值均大于显著性水平,因此目前该模型是不可用的,应该重新考虑。
采用向后筛选策略让SPSS 软件自动完成解释变量的选择,观测每一步检验的变化情况,并进行残差分析和强影响点探测。
分析结果如下:
从上面三个表格中可以看出只有投入人年数的回归系数显著性检验的概率P小于显著性水平,因此将它保留在模型中是合理的。
最终的回归方程是:立项课题数=-94.524+0.492投入人年数,说明投入人年数增加一个单位会使立项课题数平均增加0.429个单位。
上述图形是其残差分析图,数据点围绕基准线还存在一定的规律性,可以认为残差满足了线性模型的前提要求。
四、试验心得:
本次SPSS课程实践让我对这门软件有了较深刻的认识,SPSS是一款菜单式的软件,操作简便,易于理解。
实践过程中我掌握如何利用SPSS进行数据简单处理,制图以及进行各种数据分析,包括相关性分析,回归分析以及残差分析等等,让我认识到SPSS对解决简单的实际问题有很大的帮助。
实践过程中由于缺少数据,大部分表格都是从教材中搜集的,在对结果分析中我做的还不是很完善,希望老师能够予以指导,我会在以后的学习中继续加深自己对这门软件的掌握和理解,做到学以致用。
2010.9.11【下载本文档,可以自由复制内容或自由编辑修改内容,更多精彩文章,期待你的好评和关注,我将一如既往为您服务】。