数学建模数据录入.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二步 制定每个数据的属性 一、变量的储存类型
• SPSS中,变量有三种的基本类型:数值型、字符型 和日期型。
数值型:数值型的数据是0-9的阿拉伯数字和其他符号,
如美元符号、逗号或圆点组成的。
标准型(Numeric) • 标准型是SPSS默认的数据类型,默认最大 宽度为8位,包括正负符号位、小数点和小 数位在内,小数位默认为2位。如果数据的 实际宽度大于8,SPSS将自动按照科学计数 法显示。 • (*注:数据的显示不影响数据的存储和计 算)
科学记数法型(Scientific Notation) • 科学记数法型是一种常见的数值型数据的表达方 式。 • 例:1.2E±02。E表示以十为底,±02表示正( 负)的2次方。 • 科学记数法默认最大宽度为8,其中包括了正负 符号位、字母E和符号位后的两位幂次数字。 • (*注:当类型设定为科学记数法型时可以按照 标准型方式输入,SPSS会自行转换)
逗号型(comma) • 此类型数据从整数部分的各位开始每三位以一 个逗号分隔,默认的最大宽度为8,小数位为2 ,逗号所占的位数包括在总显示宽度之内。 • 例:1,234.56 • (*注:在输入时不用输入逗号,SPSS自动在 对应位添加逗号。)
圆点型(Dot)
• 此类型数据从整数部分的各位开始每三位 以一个原点分隔,逗号作为整数和小数部 分的分隔符。默认的最大宽度为8,小数位 为 2。 • (*注:在输入时不用输入原点,SPSS自 动在对应位添加原点。)
第一步 制定变量名(name)
• 变量名是变量访问和分析的唯一标志。 • 变量名的字符个数不多于8个。 • 首字符应以英文字母开头,后面可以跟除了! 、?、*之外的字母或数字。下划线、原点不能 为变量名的最后一个字符。 • 变量名不区分大小写字母。允许汉字作为变量 名,汉字总数不能超过4个,不能使用特定含义 名如:ALL、BY、AND、NOT、OR等 • SPSS有默认的变量名,以字母“VAR”开头, 后面补足5为数字,如:VAR00001、 VAR00002等。
标尺栏 当前数据栏 标题栏 菜单栏 工具栏 数据输入区 数据编辑区
输入观测
数据值或 存放数据, 表的左端 列边框显 示观测个 体的序号, 最上端行 边框显示 变量名。
窗口标签 状态栏 显示区滚动条
• 问题:由于一般的文本文件仅有数据部分,无数 据结构的描述(见图2.3),所以SPSS数据文件 不能像一般文本文件那样被大多数编辑软件打开 。只能在SPSS中打开。
Variable View表用来定义和修改变量的名称、 类型及其他属性,如图所示。
如果输入变量名后回车,将给出变量的默认属性。如果不定 义变量的属性,直接输入数据,系统将默认变量 Var00001,Var00002等。
在Variable View表中,每一行描述一个变量,依次是: Name:变量名。 Type:变量类型。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在Date View 中所显示的列宽(默认列宽为8)。 Align:数据对齐格式(默认为右对齐)。 Measure:数据的测度方式。系统给出名义尺度、定序尺度和等 间距尺度三种(默认为等间距尺度)。
•
数据文件的组织
主要包括:原始数据的组织方式 频数数据的组织方式
SPSS数据文件收集
• • SPSS数据文件的保存形式为“xxx . sav”格式。 SPSS数据文件的结构
1、数据结构 类型、取值说明、数据的缺失情况(图2.1) 2、数据内容: 待分析数据(图2.2)
数wenku.baidu.com结构
• 数据内容
数据视图 可以直接
为了在统计分析过程中能有效的利用其它软件产生的数
据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件, 还可以直接打开和保存下述类型的文件: SPSS DOS版本产生的数据文件*.sys; Excel 报表程序产生的数据文件*.xls; DBASE 数据库格式文件*.dbf; SAS统计软件产生的数据文件。
美元符号型(Dollar)
• 此类型主要用来表示货币数据,在数据前 附加美元符号$。 • 例:$123,456.78
用户自定义型(Custom Currency) • 如果用户认为上述五种类型均不能满足需要,可 以再定义不超过四种的表示方式。 • 这四种方式的名字为:CCA、CCB、CCC、CCD 。 • SPSS系统预先将它们定义成逗号数值型,用户可 以进行重新定义。 • 重新定义的菜单顺序为: Edit→Options→Currency。
自定义类型
字符型 • 字符型数据的默认显示宽度为8个字符位,系统不 区分变量名中的大小写字母,并且不能进行数学 运算。 • 注意:在输入数据时不应输入引号,否则双引号 将会作为字符型数据的一部分。
日期型 • 用来表示日期或时间。日期型数据的显示 格式有很多,SPSS以菜单方式列出日期型 数据的显示格式以供用户选择。 • 事实上,SPSS存储中的日期型变量是该实 践与1582年10月14日零点相差的秒数。
关于日期型格式的几点说明:
“m”在年与日(字母y与d)之间表示月份;在时 与秒(字母h与s)之间表示“分”钟。
“mmm”表示要求书写英文月份单词的前三个字 母组成的缩写。 “ddd”三个字母d表示要求用从元月一日算起的 日数表示日期。 指定了日期变量的格式,不一定在输入时就使用 指定的格式。可以输入用“/”或“—”作分隔符的 具体日期,回车后,系统将自动将输入的格式转 化为指定的格式,显示在单元各种。
第二讲 数据录入与获取
本讲主要解决两个问题:
第一个问题,根据问题类型的不同,将会从开放题、单
选题和多选题的录入方式为例进行介绍。 第二个问题,重点介绍如何用SPSS直接读取Excel类型 和文本格式的数据,以及如何用ODBC接口读取数据库 文件。
数据录入的前期准备
• 数据文件的收集
主要包括:数据结构的收集 数据内容的收集