实验1 数据挖掘工具的使用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验1 数据挖掘工具SPSS的使用实验目的
了解统计与数据挖掘工具SPSS的运行环境、窗体结构等,掌握SPSS的安装与运行、数据的输入与保存、数据表的编辑与修改。

实验内容
1、SPSS的安装与运行
2、查看SPSS窗体的主菜单有哪些主要功能
3、数据的输入与保存
4、数据表的编辑与修改
实验条件
1.操作系统:Windows XP SP2
2.SPSS13。

1
实验要求
1、练习实验内容1。

2、练习实验内容2。

3、试录入以下数据文件,并按要求进行变量定义。

1)变量名同表格名,以“()”内的内容作为变量标签。

对性别(Sex)设值标签“男=0;女=1”。

2)正确设定变量类型。

其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。

3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。

4)在实验报告单上记录数据库中各个变量的属性,即将variable view下的表格内容记录到实验报告单上。

5)将数据保存为student.sav的数据表文件,以备在后续的实验中使用。

4、搜集数据,建立一个数据文件记录你所在宿舍学生下列情况,学号、姓名、姓别、年龄、籍贯、民族、家庭电话号码、出生年月、学期平均成绩、评定成绩等级(优、良、中、差)、兴趣爱好等,给出合理的变量名、变量类型、标签及值标签、测度水平,并在SPSS中设置变量类型和录入数据,将文件保存为roommember.sav,以备在后续的实验中使用。

将操作步骤、变量视图下的变量设置情况、数据视图下的数据记录到实验报告中。

实验思考与练习
1、如何把外部的数据文件(如EXCEL,SQL SERVER数据库表等)导入SPSS中。

2、在定义变量时,数值[Value]变量值标签如何使用,试举例说明。

3、在定义变量时,标签[Label]变量标签有什么作用?
4、数据和转换菜单中各子菜单有怎样的功能,试通过练习自行总结。

实验步骤及指导
1、SPSS的运行
1)单击Windows 的[开始]按钮(如图1-1所示),在[程序]菜单项[SPSS for Windows]中找到[SPSS 13.0 for Windows]并单击。

图1-1 SPSS启动
2)在弹出窗口中选择所需下一步完成功能对应的单选按钮(如图1-2所示),然后点击确定按钮进行相应的界面,或者单击关闭按钮或标题栏上的关闭按钮直接进行SPSS系统主窗口。

3)在弹出窗口中选择“输入数据”,然后点击“确定”按钮,进入系统数据输入窗口(系统主窗口)
4)退出SPSS
选择主窗口文件(File)菜单中的退出(Exit)或单击标题栏上的关闭按钮退出SPSS。

2、SPSS的主窗口
SPSS13.0主菜单包括十个菜单(如图1-3所示):
1)文件(File):用于新建SPSS 各种类型文件,打开一个已存在的文件,从文本文件或其它数据源读入数据。

2)编辑(Edit):用于撤消操作、剪切、复制、粘贴、查找、改变SPSS 默认设置等。

3)视图(View):运用“视图”菜单显示或隐藏状态行、工具栏、网络线、值标签和改变字体。

4)数据(Data):运用“”菜单对SPSS 数据文件进行全局变化,例如定义变量,合并文件,转置变量和记录,或产生分析的观测值子集等。

5)转换(Transform):“转换”菜单在数据文件中对所选择的变量进行变换,并在已有变量值的基础上计算新的变量。

6)分析(Analyze):“分析”菜单在以前版本中为“统计(Statistics)”,可进行各种统计分析,包括各种统计过程(Procedure),如回归分析、相关分析、因子分析等等。

7)图表(Graphs):“图表”菜单产生条形图、饼图、直方图、散点图和其它全颜色、高分辨率的图形,以及动态的交互式图形。

有些统计过程也产生图形,所有的图形都可以编辑。

8)工具(Utilities):“工具”菜单可以显示数据文件和变量的信息,定义子集,运行脚本程序,自定义SPSS 菜单等。

9)窗口(Window):“窗口”菜单用于选择不同窗口和最小化所有窗口。

10)帮助(Help):“帮助”菜单包含SPSS 帮助主题、SPSS 教程、SPSS 公司主页、统计教练等菜单项。

图1-2 SPSS 启动弹出窗口
图1-3 SPSS 主窗口
3、SPSS的数据管理(数据输入,编辑,保存)
启动SPSS 后,出现的界面是数据编辑器窗口(如图1-3所示),它的底部有两个标签:[Data View(数据视图)]和[Variable View(变量视图)],它们提供了一种类似于电子表格的方法,用以产生和编辑SPSS 数据文件。

[Data View]用于查看、录入和修改数据,[Variable View]定义和修改变量的定义。

如果使用过电子表格,如Microsoft Excel 等,那么数据编辑窗口的许多功能应该已经熟悉。

但是,还有一些明显区别:
1)列是变量,即每一列代表一个变量(Variable)或一个被观测量的特征。

例如问卷上的每一项就是一个变量。

2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS 中称为事件(Case)。

例如,问卷上的每一个人就是一个观测。

3)单元包含值,即每个单包括一个观测中的单个变量值。

单元(Cell)是观测和变量的交叉。

与电子表格不同,单元只包括数据值而不能含公式。

4)数据文件是一张长方形的二维表。

数据文件的范围是由观测和变量的数目决定的。

可以在任一单元中输入数据。

如果在定义好的数据文件边界以外键入数据,SPSS 将数据长方形延长到包括那个单元和文件边界之间的任何行和列。

如果要分析的数据还没有录入,可用数据编辑器来键入数据并保存为一个SPSS 数据文件(其默认扩展名为.sav)。

SPSS数据管理第一步,定义变量:
输入数据前首先要定义变量。

定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式,步骤如下:单击数据编辑窗口中的[Variable View] 标签或双击列的题头(Var),显示(如图1-4所示)变量定义视图,在出现的变量视图中定义变量。

每一行存放一个变量的定义信息,包括[名称(Name)]、[类型(Type)]、[宽度(Width)]、[小数位数(Decimal)]、[标签(Label)]、[数值(Value)]、[缺失(Missing)]、[列(Columns)]、[对齐(Align)]、[测量(Measure)]等②。

图1-4 定义变量
1)名称(Name):定义变量名
变量名必须以字母或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符
号。

变量名总长度不能超过8 个字符(即4 个汉字)。

2)类型(Type):定义变量类型
SPSS 的主要变量类型有:Numeric(标准数值型)、Comma(带逗点的数值型)、Dot(逗点作小数点的数值型)、Scientific Notation(科学记数法)、Date(日期型)、Dollar(带美元符号的数值型)、Custom Currency(自定义型)、String(字符型)。

单击[Type]相应单元中的按钮,显示如图1-5所示的对话框,选择合适的变量类型并单击[OK]。

图1-5 定义变量类型对话框
3)宽度[Width]:变量长度
设置数值值变量的长度,当变量为日期型时无效。

4)小数位数[Decimal]:变量小数点位数
设置数值值变量的小数点位数,当变量为日期型时无效。

5)标签[Label]:变量标签
变量标签是对变量名的进一步描述,变量只能由不超过8 个字符组成,8 个字符经常不
足以表示变量的含义。

而变量标签可长达120 个字符,变量标签对大小写敏感,显示时与输入值完全一样,需要时可用变量标签对变量名的含义加以解释。

6)数值[Value]:变量值标签
值标签是对变量的每一个可能取值的进一步描述,当变量是定类或定序变量时,这是非
常有用的。

单击数值[Value]相应单元,在如图1-6所示的对话框中进行设置。

图1-6 修改变量标签和值标签
7)缺失[Missing]:缺失值的定义方式
SPSS 有两类缺失值:系统缺失值和用户缺失值。

在数据长方形中任何空的数字单元都被认为系统缺失值,用点号(·)表示。

SPSS 可以指定那些由于特殊原因造成的信息缺失值,然后将它们标为用户缺失值,统计过程识别这种标识,带有缺失值的观测被特别处理。

默认
值为没有缺失值[None]。

单击缺失[Missing]相应单元中的按钮,可改变缺失值定义方式,如图1-7所示。

图1-7 改变缺失值的定义方式
8)列[Column]:变量的显示宽度
输入变量的显示宽度,默认为8。

9)对齐[Align]:变量显示的对齐方式
选择变量值显示时的对齐方式:[Left(左对齐)]、[Right(右对齐)]、[Center(居中对齐)]。

10)测量[Scale]:变量的测量尺度
正如前面所说的,变量按测量精度可以分为定类变量、定序变量、定距变量和定比变量,定距变量和定比变量经常不加以区别。

如果变量为定距变量或定比变量,则在测量[Scale]
相应单元的下拉列表中选择尺度[Scale];如果变量为定序变量,则选择序数[Ordinal];如果变量为定类变量,则选择名称[Nominal]。

如果有许多个变量的类型相同,可以先定义一个变量,然后把该变量的定义信息复制给新变量。

具体操作为:先定义一个变量,在该变量的行号上单击右钮,弹出如图1-8所示的快捷菜单,选择拷贝[Copy];然后用鼠标右钮选择多行,弹出如图1-9所示的快捷菜单,选择粘贴[Paste];再把自动产生的新变量名称(如Var0001、Var0002、Var0003、⋯⋯)改为所要的变量名称。

图1-8 拷贝
图1-9 粘贴
定义了所有变量后,单击[Data View]即可在数据视图中输入数据。

SPSS数据管理第二步,数据的输入与编辑:
定义了变量后就可以输入数据了,数据窗口如图1-10所示。

图1-10 数据文件编辑窗口
在数据输入和编辑过程中,可用方向键或鼠标移动到要修改的单元,键入新值。

如果数据文件较大且知道要修改的数据单元的行号,可通过选择数据[Data]=>观测量定位[Go to Case]打开如所图1-11示的对话框,在对话框中观测量编号[Case Number]的右框输入行号来查找特定观测(行)。

如果要查找某变量中的特定值或值标签,选择该变量,再选择编辑[Edit]=>查找[Find]或者按Ctrl+F 打开如图1-12所示的对话框,在查找什么[Search for]右框中输入要查找的数值或标签。

图1-11 直接定位对话框
图1-12 数据查找对话框
在数据输入和编辑过程中,单击记录前面标有记录号的矩形,选中该行记录,然后单击右键,在弹出的快捷菜单选择删除子菜单删除选定记录。

在编辑过程中有时需要对观测(case)记录进行排序。

在数据文件中,可根据一个或多个排序变量的值重排观测的顺序。

选择数据[Data]=>观测量排序[SortCases],打开观测量排
序[Sort Cases]对话框,如图1-13所示。

图1-13 观测量排序对话框
SPSS数据管理第二步,数据文件保存:
编辑好数据文件之后,选择文件[File]=>保存[Save]或按Ctrl+S 快捷键即可将文件保存。

如果要把数据文件保存为一个新文件或将数据以不同格式保存,可选择文件[File]=>另存为[Save As],选择文件类型保存文件。

主要的保存类型有:SPSS(*.sav),SPSS 13.0 默认格式;SPSS 7.0 格式;SPSS/PC+(*.sys),SPSS/PC+格式;Excel(*.xls)等等。

相关文档
最新文档