SAS系统简介_SAS数据库与数据集

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

data步后面可以同时定义多个数据集
year 2003 product computer sale 2000
2003
2004 2004
mp3
computer mp3
1400
1400 1300
2005
2005
computer
mp3
1600
2200
把每一年的资料构成一个数据集 data year03 year04 year05; input year production$ sale; if year=2003 then output year03; else if year=2004 then output year04; else if year=2005 then output year05; cards; 2003 computer 2000 2003 mp3 1400 2004 computer 1 400 2004 mp3 1300 2005 computer 1600 2005 mp3 2200 ;
SAS包含的模块及各模块功能简单介绍 • BASE SAS(基础模块) • SAS系统的核心.可单独使用,也可和其
他模块结合使用. • 功能:可用于数据管理,基础统计计算, 报表生成和图形显示。
• SAS/STAT(统计分析模块) • 功能:可作全面性的高级统计分析和应用 • 包括方差分析,回归分析,属性数据分析, 多元分析,生存分析,聚类分析,判别分析, 及非参数分析等。
注意:输入数据时要用TAB键和上、下、左、 右键,不能用鼠标来选择单元格。
• 利用SAS/ACCESS软件访问其他的数据文 件 利用FILE——IMPORT,来导入数据
注意:
• 缺失的数据用‘.’来表示; • 字符型数据的长度不能超过8个字符; • 变量名与数据值要对应。
input语句
• 描述输入的数据,对每个变量给出名字、 类型及格式; • 数据类型有字符型和数值型,用$加以区别 ; • 数据输入格式有:
SAS数据集的创建
data sasuser.da1; input name$ x1 x2 x3; y=x1+x2=x3; cards; M 3 1.3 0.5 M 2 2.4 0.9 F 5 3.2 0.8 M 8 4.1 1.1 F 7 3.3 0.6 ; run;
利用DATA步从 原始数据创建 SAS数据集
输出结果
(Results)
SAS的窗口功能应用
• Editor 窗口 : 可以使用一个或者多个 Editor 窗口来进行输入、编辑和提交 SAS 程序。 Editor 窗口提供了大量的编辑功能.
• LOG窗口: • 用于监视SAS 会话及程序的执行过程,提示 程序运行过程中的各种信息.
OUTPUT窗口: • 用于显示和浏览所提交的 SAS 程序的输出结果。 在默认情况下,Output 窗口是藏在 Editor 和 Log 窗口后面的,一旦你产生了输出,Output 窗 口将自动显示到前端。
(2)在Editor窗口用Libname语句创建 可用Libname语句指定永久库的库标记,格式: Libname 库标记‘文件夹位置’; 如:指定“E:\CJL\sasdata”为库标记a,可 提交下列语句: libnanme a ‘E:\ CJL\sasdata’; 库标记是临时的,可随意指定,每次启动SAS系 统后都要重新指定 。
SAS数据库
libname stat ‘d:\study’; data stat.student; input name$ age; cards; Mike 23 Alice 21 ; run;
SAS数据集
SAS数据集的基本概念
SAS数据集的构成
描述部分 数据部分
SAS数据集的类型
永久性数据集 临时性数据集
统计分析功能是由 SAS/BASE(基础),SAS/STAT(统计), SAS/GRAPH(图形)等模块实现的。
此外,还有SAS/ETS(预测)、SAS/IML(矩阵运算)和SAS/QC (质量控制)等约20个模块。 这些模块可单独使用、也可互相配合起来使用。
每个SAS模块都由多个可执行的文件组成,它 们被称为SAS过程(SAS PROCEDURE), 用户在调用SAS过程解决具体问题之前,必须用 SAS语言编写一段SAS程序(SAS PROGRAM)。 应用SAS的关键就是要编写出符合各种情况的SAS 程序。
• 编辑程序导入数据:
data test; input name$ age weight height; wei1=weight+height; Cards; Tom 10 40 165 Mike 11 42 160 Jack 10 46 162 Lucy 10 39 155 Kate 11 37 155 ; Run;
在数据挖掘技术、商业智能领域和统计分析领域中几 乎处于垄断地位
被誉为国际上的标准软件,也是国际上最流行的标准 企业管理软件。. SAS用户遍及医药、金融、商务、电讯、环境、交通、 能源、科研、企业管理、统计等众多行业。
• SAS是一种集成软件,由几十个模块组成,用户可以根据实际 应用调用不同模块或模块组合进行工作. 该软件系统最早的功能限于统计分析 至今,统计分析功能也仍是它的重要组成部分和核心功能 .
软件特点:
灵活方便,功能齐全。 SAS语言是程序设计语言,类似于C语言,有大 量的标准函数和编程语言用于数据处理。 应用面广,例如:统计学、心理学、经济学、生 物学、商业、金融、社会调查等。
SAS系统的启动与关闭
• SAS系统的启动
• SAS系统的退出 • SAS系统的各个窗口
程序编辑窗口 (PROGRAM EDIT) 程序运行日志窗口(LOG) 程序输出窗口 (OUTPUT) 图形编辑窗口 (GRAPHICS) 资源管理器 (Explorer)
(1)利用资源管理器窗口
• 在 资源管理器窗口中,双击逻辑库图标; • 空白处点击右键 → 新建; • 在新建逻辑库窗口中,输入库名称cjl,选择 启 动时启用,以便每次启动 SAS 系统的时候数据库 能被自动创建好. • 选择对应于这个数据库的目录 • 点击确定即可创建好库标记. cjl出现在当前数据 库列表中。
SAS数据集的创建
• 用VIEWTABLE(表编辑器)创建数据集
单击数据库名称——在数据库中单击鼠标右键— —在菜单中选择新建——选择表,即进入 VIEWTABLE窗口; • 为了输入表内变量的名称和属性,在变量名称A 上单击鼠标右键——选择COLUMN ATTRIBUTES ——选择GENERAL——输入相应内容——单击 APPLY——在表格中输入数据
SAS数据集(表)存储在被称为SAS数据库的文 件夹中, 根据存储方式的不同,分为永久库和临时库。 每一个数据集都有一个两级名,第一级是库标 记,第二级是数据集名,中间用“.”隔开; 库标记.数据集名 如work.example sasuser.cjl
临时库: 临时库只有1个,名为WORK. • 它在每次启动SAS系统后自动生成,关 闭SAS临时库中的数据集被自动删除 。 • 在程序中引用该库中的数据集可以省略 库标记,即它被认为是缺省的数据库。
• SAS/ETS(经济计量学和时间序列分析模块 ) • 功能:用于时间序列分析和预测,建立经 济系统模型,财务分析和撰写报告。 • 是研究复杂系统和进行预测的有力工具。 • SAS/GRAPH(绘图模块) • 功能:绘制二维或三维高分辨彩色图形。 • 可绘制柱形图,饼形图,星形图,散点图, 等高线图和地图。
DATA步的一般形式
data 语句; input 语句; (用于data步的其他语句); cards语句; datalines(数据行) ; run;
data 语句
• data 步的开始,可以定义要产生的sas数据 集的名称。可以定义数据集为永久数据集 或临时数据集。分别为: data sasuser.da1; data work.da1;(data da1;)
注:NAME:最长不超过32个字符 LABEL:变量的标签,最长不超过256个字符 LENGTH:规定变量的数据的长度,默认为8 FORwk.baidu.comAT:修改数据的存储格式 INFORMAT:修改数据的输入格式 TYPE:选择变量是数值型(NUMERIC)还是 字符型(CHARACTER)
用SAS/INSIGHT软件创建SAS数据集(略)
统计软件包
SAS系统与统计分析
第一章 SAS系统简介 SAS----Statistics Analysis System (统计分
析系统) 最早由北卡罗来纳大学的两位生物统计学研究生 编制 并于1976年成立了SAS软件研究所,正式推出了SAS 软件
SAS是集数据访问、数据管理、数据分析和报告为一体 的大型应用软件系统。
SAS实例
• • • • • • • • • data c1; input name$ sex$ age; cards; zhao m 44 zhoupin f 29 cheng f 32 ; proc print; Run;
第二章 SAS数据库与SAS数据集
SAS数据库
(1)SAS 数据库分类
Results 窗口 : Results 窗口能帮助操作和管理 所提交的 SAS 程序的输出结果。 默认情况下,Results 窗口藏在 Explorer 窗口的后面并且是空的,直到你提交了产生输出 的 SAS 程序,它才会显示到前端 Explorer 窗口: 可以查看和管理你的 SAS 文件,并为非 SAS 文件创建快捷方式、使用窗口来创建新的数据库和 SAS文件、打开任何 SAS 文件以及完成大部分的文 件管理工作。
按产品分类分别构成一个数据集 data com mp3; input year production$ sale; if production='computer' then output com; else output mp3; cards; 2003 computer 2000 2003 mp3 1400 2004 computer 1 400 2004 mp3 1300 2005 computer 1600 2005 mp3 2200 ;
永久库:
(1)永久库可有多个,且库中的数据集被保存 起来,以便下次启动系统时使用。 (2)SASUSER , Sashelp是SAS自带的永久库, 每次启动时都会自动指定此库标记。
(2)创建一个新库标记 • 利用资源管理器(Libraries)窗口命名; • 使用Libname语句命名。
如:建立一个永久库名为cjl的数据库
• SAS/ASSIST(面向任务的菜单驱动界面模块)
• 功能:为SAS系统提供面向任务的菜单驱动界面, 可免去用户学习SAS语言的负担。 • 同时SAS/ASSIST生成的SAS程序即可辅助有经 验的用户快速编写SAS程序,又可帮助新用户学 习SAS语言。 • SAS/QC(质量管理模块) • 功能:可进行生产过程分析,试验设计,包括 二阶因子分析,正交分析和矩阵试验。
• • • • 列表方式或自由格式 列方式 格式化方式 命名方式
列表方式或自由格式: input name $ age;
data ab; input a $ b ; cards; ww33 3 yyyy 322 ; run;
列方式:(指明变量的值所属的列号) input name $ 1-8 age 11-12; data ab; 输出结果 input a $ 1-4 b 7-9; cards; Obs a ww33223 yyyy2332234 1 ww33 ; 2 yyyy run; (输入数据时不用空格分开 )
• SAS/OR(运筹学模块) • 功能:用于运筹学和工程管理的专用软件, 提供全面的运筹学方法,是一种强有力的决策 支持工具。 • SAS/IML (交互式矩阵程序设计语言模块) • 功能:是用户研究新算法或解决SAS系统中 没有现成方法的工具。
• 此外,SAS系统中还包括的模块有SAS/FSP , SAS/ACESS,SAS/EIS,SAS/INSIGHT, SAS/LAB, SAS/SHAPE, SAS/CONNECT, • SAS/CAKC,SAS/GIS, SAS/NVISION, SAS/SPECTRAVIEW, SAS/TOOLKIT等等。
相关文档
最新文档