《统计学》实验三:数据整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验3数据整理
一、实验目的
掌握SPSS18.0中的数据整理操作;
二、实验原理
软件设计原理。
三、实验内容
数据管理与转换
四、实验方法与步骤
1.已正确安装SPSS18.0软件;
2.进入SPSS18.0的数据编辑窗口;
数据经过预处理后,可进一步做分类或分组整理。在对数据进行整理与显示时,首先要弄清是什么类型的数据,不同类型的数据适用的处理方法不同。一般情况下,对品质数据主要是分类整理,对数值型数据主要是分组整理。本部分以及下一部分(数值型数据的整理与显示)主要介绍这两大类数据的频数分布的制作,而对于一般图形的制作,如:条形图、饼行图、直方图、圆环图等基本内容,由于篇幅所限不在这里讲述。
操作一、分类数据的整理与显示
数据:分类数据整理.sav
表3-1是一家市场调查公司为研究不同品牌饮料的市场占有率,调查员某天对50名顾客购买饮料品牌记录的原始数据。具体做法是:如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌记录一次。
表3-1顾客购买饮料品牌的记录
(一)输出频数分布表 菜单:分析->描述统计->频率
(二)输出条形图 菜单:图形->旧对话框->条形图->简单箱图(个案组摘要) (三)输出饼图 菜单:图形->旧对话框->条形图->个案组摘要
操作二、顺序数据的整理与显示
数据:顺序数据甲.sav 顺序数据的整理.exl
提示:注意数据的加权操作
在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?
1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。
(一)计算顺序数据甲的频数分布 菜单:分析->描述统计->频率 (二)生成甲城市的累计图 菜单:分析->质量控制->排列图->简单 (三)利用excel 生成甲乙两城市的环形图
操作三、数值型数据的整理与显示 数据:数值行数据整理1.sav
采用等距分组的形式制作频数分布表和分布图。
在使用spss 前,首先需要明确分几组,组距以及每组的上下组限。一般情况下,可以按Sturges 公式来确定组数K :
)lg(3.31)
2lg()
lg(1n n K +≈+
=
其中,n为数据的个数,对结果用四舍五入的办法取整即为组数。
组距是一个组的上限和下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值—最小值)÷组数。(组距最好是5或10的倍数)
某电脑公司2010年前四个月各天的销售量数据(单位:台)。试对数据进行分组。
(一)利用经验公式确定出组数和组距。
(二)利用转换->重编码为不同变量生成新变量“分组”将个数据归类到已分好的组中。(三)利用菜单:分析->描述统计->频率生成分组变量的频数分布表。
(四)对销售量数据做直方图菜单:图形->旧对话框->直方图
(五)对销售量数据做茎叶图和箱线图菜单:分析->描述统计->探索->绘制按钮
操作四、时间序列数据
数据:时间序列图.sav
菜单:图形->旧对话框->线图->简单(个案值)
操作五、多变量数据
(一)数据:多批箱线图.sav
菜单:图形->旧对话框->箱图->简单(个案组摘要)
(二)数据:雷达图.exl
当研究的变量只有2个时,可以在平面直角坐标中进行绘图;当有3个变量时,可以在三维坐标里绘图,但让人看起来很不方便,特别是当变量多于3个时,利用一般的点图方法就很难做到了。为此,人们研究了许多多变量的图示方法,其中有雷达图、脸谱图、星座图、连接向量图等。这里只介绍较为常见的雷达图。
雷达图的具体的做法是:先做一个圆,然后将圆P等分(要绘制P个变量的雷达图),得到P个变量,再将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示,再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图。
雷达图在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形围成的面积成正比。另外,利用雷达图可以研究样本之间的相似程度,两个样本形成的多边形图越相似其相似程度越高。
下面以2000年我国城乡居民家庭人均各项生活消费支出比重数据为例,绘制雷达图。如表1-13所示。
表1-13 2000年城乡居民家庭人均生活消费支出比重(%)
第一步;选中数据所在的区域,本例为A1:C9。单击工具栏上的“图表向导”按钮,或者从“插入”菜单中选择“图表”选项。
第二步:在弹出的对话框(图表向导—4步骤之1—图表类型)中,选择雷达图。如图1-29所示。
图1-29 图表类型
第三步:点击下一步,在弹出的对话框(图表向导—4步骤之2—数据来源)中,按默认设置(因为在第一步中,我们已经选中数据区域)点击下一步,在弹出的对话框(图表向导—4步骤之3—图表选项)中进行相应设置。图表选项设置是我们制图过程中的关键步骤,可以在其中加图表标题,设置网格线、图例和数据标志。如图1-30所示(读者可自行体会)。
图1-30图表选项
第四步:点击下一步,在弹出的对话框(图表向导—4步骤之4—图表位置)中,点击完成即可。结果如图1-31所示。
图1-31雷达图输出
这里需要说明的是图1-31的输出结果是经过进一步修改得到的。在点击完成按钮后我们看到的图形很粗糙、模糊,甚至很难看,这时需要我们对图形(图表区和绘图区)进行拖拉,将其显示清楚,然后进行美观设置。通常情况下,初次输出的图表字体、数字字号比较大并且坐标轴的刻度稀疏,需要对坐标轴格式、分类标志格式进行修改,其方法很简单只需在修改处点击鼠标右键即可。另外,如果我们在作图过程中有些步骤的设置不合适,在图形输出后还可以返回进行修改。具体做法也很简单在图表区域点击鼠标右键,在弹出的菜单中选择图表类型、数据来源或图表选项即可(读者可自己体会)。
上面介绍了雷达图的具体做法,其实在Excel中作图的步骤大体都相同,所以其他图形的制作,如品质数据图示需经常用到的条形图、饼形图等,这里不在重复,读者可自行体会。最后需要强调的是:图形的绘制以简洁、清晰地显示数据、合理地表达统计思想为目的,不要在图形的修饰上花费太多的时间和精力。