SPSS实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
安徽建筑大学
数据统计分析
实验报告
专业统计学
班级二班
学生姓名陈永帅
学号 *********** 实验日期
实验一描述性统计分析
一、实验目的与要求
统计分析的目的在于研究总体特征。但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。
本本实验旨在于:引到学生利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。
二、实验原理
描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。
集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。
离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数等。其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。
分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。三、实验内容与步骤
下面给出的一个例题是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相关的描述统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一些描述统计量,如均值、频数、方差等描述统计量的计算。
频率
附注
创建的输出16-12月-2013 15时55分55秒注释
输入数据C:\Users\YSC\Desktop\data12-01.sav 活动的数据集数据集1
过滤器
权重
拆分文件
工作数据文件中的N 行12 缺失值处理对缺失的定义用户定义的丢失值作为丢失对待。
使用的案例统计量的计算将基于所有包含有效数据
的案例。
语法FREQUENCIES V ARIABLES=pop
school
/ORDER=ANALYSIS.
资源处理器时间00 00:00:00.110 已用时间00 00:00:00.194
[数据集1] C:\Users\YSC\Desktop\data12-01.sav
统计量
总人口中等校平均校龄
N 有效12 12
缺失0 0
频率表
总人口
频率百分比有效百分比累积百分比有效1000 1 8.3 8.3 8.3 1200 1 8.3 8.3 16.7
3400 1 8.3 8.3 25.0
3800 1 8.3 8.3 33.3
4000 1 8.3 8.3 41.7
5700 1 8.3 8.3 50.0
8200 1 8.3 8.3 58.3
9100 1 8.3 8.3 66.7
9400 1 8.3 8.3 75.0
9600 2 16.7 16.7 91.7
9900 1 8.3 8.3 100.0
合计12 100.0 100.0
中等校平均校龄
频率百分比有效百分比累积百分比有效8.3 1 8.3 8.3 8.3
8.8 1 8.3 8.3 16.7
9.6 1 8.3 8.3 25.0
10.9 1 8.3 8.3 33.3
11.4 2 16.7 16.7 50.0
11.5 1 8.3 8.3 58.3
12.5 1 8.3 8.3 66.7
12.8 2 16.7 16.7 83.3
13.6 1 8.3 8.3 91.7
13.7 1 8.3 8.3 100.0
合计12 100.0 100.0
描述统计量
N 极小值极大值均值标准差
总人口12 1000 9900 6241.67 3439.994 中等校平均校龄12 8.3 13.7 11.442 1.7865 有效的N (列表状态)12
茎叶图
中等校平均校龄Stem-and-Leaf Plot for pop= 9600
Frequency Stem & Leaf
1.00 0 . 9
1.00 1 . 3
Stem width: 10.0
Each leaf: 1 case(s)
实验2:均值比较、方差分析
一、实验目标与要求
1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理
2.掌握方差分析的过程。
3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。
二、实验原理
在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。为此引入方差分析的方法。
方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。
方差分析有3个基本的概念:观测变量、因素和水平。观测变量是进行方差分析所研究的对象;因素是影响观测变量变化的客观或人为条件;因素的不同类别或不通取值则称为因素的不同水平。在上面的例子中,农作物的产量和商品的销量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常是某一个或多个离散型的分类变量。
根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;根据因素个数,可分为单因素方差分析和多因素方差分析。在SPSS中,有One -way ANOVA(单变量-单因素方差分析)、GLM Univariate(单变量多因素方差分析);GLM Multivariate (多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。本节仅练习最为常用的单因素单变量方差分析。
三、实验内容与步骤