SAS系统和数据分析输入输出格式

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SAS系统和数据分析输入输出格式
电子商务系列
第五课输入输出格式
一、SAS数据集中变量的类型
SAS共有两种类型的变量:
●字符型变量━━以ASCII码存放,最大长
度不超过200字符
●数据型变量━━以浮点数存放,长度为8
个字节
SAS数据集的矩阵式结构要求每个观测的每个变量值都必须存在,因此如果某个数据值缺失,系统会自动补上一个缺失值。

对于数字型变量,这个值显示为一个点“.”,而对于字符型变量,这个值显示为空格。

二、输入和输出格式
SAS数据集的数据值的内部存放格式并不一定与该数据值的输入和输出格式一致,这取决于SAS的两个重要功能:输入格式(Informats)和输出格式(Formats)。

输入格式指示SAS系统如何读入数据,而输出格式指示SAS系统如何输出数据。

它们的一般形式如下:
●输入格式:<$>informat<w>.<d>
电子商务系列
●输出格式:<$>format<w>.<d>
其中,$符号指示这是个字符输入输出格式,没有$符号表示是数值输入输出格式;Informat是一个输入格式的名字,format是一个输出格式的名字;w是宽度值,对许多输入输出格式这个值是输入输出数据的列数;d在数值输入输出格式中是小数部分的长度;点“.”是所有输入输出格式中必须包含的分隔符,作为名字的一部分。

如果在格式中省略w和d值,SAS系统使用缺省的值。

在SAS系统6.12版本中有五类输入格式,字符输入格式共有14种,数值输入格式共有35种;四类输出格式,字符输出格式共有13种,数值输出格式共有41种。

三、日期时间值在SAS系统中的存储
当变量的值表示日期、时间和日期时间时,在这种特殊的情况下,用户还需了解日期时间值在SAS系统中是怎样被存储的。

SAS系统存储日期值为:
●1960年1月1日和这个日期之间的天数
例如,1962年3月8日被存储为797(即
电子商务系列
366+365+31+28+7),1958年10月1日被存储为-457(即-365-31-30-31)。

SAS系统存储时间值为:-457
从午夜开始到此刻的秒数
例如,8:18存储为29880(8×60×60+18×60)。

一个日期时间值存储为1960年1月1日午夜到这个日期时间之间的秒数。

例如,1962年3月8日8:18存储为6915960(797×24×360+29880)。

SAS系统6.12版本提供了17种日期、时间和日期时间的输入格式,31种输出格式。

四、几种常用的输入输出格式
如表5.1所示。

表 5.1 常用的输
入输出格式
五、数据格式变换举例
设有一个SAS数据集survey,其中有一个数字变量INCOME和一个日期变量BDATE,针对不同的采样数据格式,我们对变量采用对应的输入格式,得到在SAS系统中实际存储的数据值,然后根据报表的输出要求,选定一种输出格式,将实际存储的数据值按所选输出格式显示结果。

如表5.2所示。

表5.2 INCOME 和BDATE变量的输入输出格式
输入数据→变量和输入格式→实际存储数据值→变量和输出格式→显示结果
12345.1234 Income 12345.12 Income 12345.12
电子商务系列8.2 8.2
12,345.1234 Income
comma8.2 12345.12 Income
comma8.2
12,345.12
$12,345.1234 Income
dollar8.2 12345.12 Income
dollar8.2
$12,345.12
08MA R62 Bdate
date7.
797 Bdate
mmddyy
6.
030862
03/08/
62 Bdate
mmddyy
8.
797 Bdate
date9.
08MA
R1962
第六课建立SAS系统的数据集(ASSIST)
得到SAS数据集的五种途径
●用SAS/ASSIST 通用菜单系统创建数据集●用SAS/FSP系统的FSEDIT过程创建数据

●用SAS数据步(DATA STEP)将外部文件
转换为数据集
●用SAS/ACCESS系统访问其他数据库
●用FILE/IMPORT或EXPORT输入输出数
据库
其中,如何使用SAS数据步读入外部原始数
电子商务系列
据文件,并将它们转换为SAS数据集是我们要重点掌握的。

一、用ASSIST通用菜单援助系统创建数据集
下面我们通过创建一个SURVEY数据集,并用报表形式显示的例子,来说明SAS/ASSIST软件的具体的操作步骤。

1.启动SAS/ASSIST软件
最简单的方法是单击工具拦上的SAS/ASSIST按钮,或选择菜单命令:
Globals/SAS/ASSIST
或在左上角的命令框直接键入Assist并按Enter键,都可启动SAS/ASSIST软件,主菜单如图6.1所示。

共有11个子系统:
TUTORIAL
DATA MGMT (DATA Management)
REPORT WRITING
GRAPHICS
DATA ANALYSIS
PLANNING TOOLS
EIS
电子商务系列REMOTE CONNECT
RESULTS
SETUP
INDEX
图6.1 SAS/ASSIST软件的主菜单
2.选择主菜单中的DATA MGMT(数据管理)项
选择主菜单上的DATA MGMT(数据管理)子菜单,如图6.2所示。

电子商务系列
图6.2 数据管理的主菜单
3.选择CREATE/IMPORT(创建数据集或输入数据)的方法
选择CREATE/IMPORT菜单后,提供几种创建数据集的方法供用户选择,如图6.3所示。

假设我们:
(1)选择用交互式方法录入数据:
Enter data interactively….
电子商务系列
(2)选择第二种以表格的形式输入记录的方式
如图6.4所示,又提供了两种输入观测的方法
图6.3 创建和输入菜单
图6.4 选择以表格的形式输入记录的方式
电子商务系列
供用户选择:Enter data one record at a time(一次输入一条记录的方式)和Enter data in tabular form(以表格的形式输入)。

假设我们选择第二种以表格的形式输入记录的方式。

4.指定新创建数据集的名字和说明是永久的或临时的
在选定数据输入方式后,系统出现一个如图6.5所示的窗口:Select a New SAS Data Set to Create。

让用户指定要创建的新数据集名字并说明该数据集是临时的(Temporary)或永久的(Permanent)。

若是永久的,还必须在已有库标记中指定一个。

例如,我们在Data Set中:
●输入数据集的名字:SURVEY
●单击单词Temporary
系统自动出现提示In temporary library:WORK,已指定临时库标记为WORK;最后单击OK,这时系统生成一个名为SURVEY的空数据集。

电子商务系列
图6.5 创建临时数据集SURVEY
5.命名和描述新建数据集中的变量
在输入SAS数据集名字SURVEY和选定Temporary并OK确定后,系统显示如图6.6所示一个标题为:ASSIST:NEW WORK.SURVEY(E)的菜单。

在屏幕中共列出五项数据集的描述项:Name,Type,Length,Label,Format。

可以让用户输入数据集的变量名、变量类型、长度、标签和格式。

其中只有Name(变量名)是必需的,其他几项若用户没有特殊要求可使用SAS系统提
电子商务系列
供的缺省值。

例如,我们为数据集Work.Survey,在Name、Type和Format三项上输入了如图6.6所示的相应描述值。

因为变量NAME和SEX是字符型变量,所以在Type项上需要说明“$”。


图6.6 描述临时数据集SURVEY的变量
量描述完毕后选择菜单命令File/End。

6.用步骤3确定的方法输入观测的值
接着系统显示FSVIEW窗口,如图6.7所示。

用户可以用交互的方式输入数据集的观测值,因为在步骤三中确定的是以表格的形式输入观测,
电子商务系列 所以出现的是全屏幕输入界面。

输入数据时,要注意使键盘上的Insert 键处于非插入状态。

每输入完一条观测后,还可以返回上面已输入的观测进行立即修改,只要单击所需要修改的观测,左右移动光标到某位置进行修改。

FSVIEW 窗口菜单栏上的一个Delete 工具按钮,可用来删除当前选中的观测。

当所有观测都输入完毕后,选择菜单命令File/End 来存
储这个SAS 数据集。

选择REPORT WRITING (编写报表) 通过连续选择菜单界面的Goback 项,返回到Primary Menu 主菜单后,选择
REPORT
图6.7 在FSVIEW 全屏幕编辑窗口输入各条观测
电子商务系列WRITING(编写报表)。

7.选择LISTING(列表显示)
在Report Writing Menu菜单中选择第一个LISTING子菜单。

如图6.8所示,在SAS/ASSIST:List a Data Set对话界面让用户做以下几方面的选择:
●给出生成报表的那个SAS数据集的名字。

单击Active data set按钮,在Directory目
录对话框的列表栏中,通过单击选择数据集
SURVEY,被选中的数据集前带有一个“*”
号。

●用户可以通过单击选项Subset data按钮,
选择子集。

●用户可以通过单击选项Variables to appear
in report按钮,选择出现在报表中的变量,
如NAME、SEX、AGE和INCOME,选
择的方法是单击一下变量名。

●用户可以通过单击选项Additional options
按钮,规定一些另外的选择项,如求部分观
测的和、对变量加标签等。

在这里我们通过
电子商务系列Specify Labels选项指定变量INCOME加上标签STIPEND,通过Summary Variables 选项指定的数字变量INCOME进行汇总求和。

用户可以通过在屏幕上方菜单栏中选择Customize实现对报表加上标题(Titles)或脚注(Footnotes)。

如加上How to use SAS/ASSIST标题和Designed by DZX 副标题。

电子商务系列
8.选择RUN菜单命令显示用户要求的报表
●单击主菜单上Locals命令
●从下拉菜单中选择RUN子菜单命令
即可在OUTPUT窗口中显示经过我们层层设计的报表,如图6.9所示。

如果输出的报表还没有满足用户的要求,可以不断地返回修改和输出显示,直到满意为止。

电子商务系列
图6.9 使用SAS/ASSIST工具在OUTPUT窗口形成的报表
9.退出SAS/ASSIST系统
通过连续选择菜单界面的Goback项,返回到Primary Menu主菜单后,选择EXIT项退出SAS/ASSIST软件系统。

或将MOUSE指向SAS/ASSIST窗口的左上角图标上,双击左键立即退出SAS/ASSIST系统。

相关文档
最新文档