SAS使用入门

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SAS过程步常用命令:
命令 功能 格式
title
var Class
指定标题
指定分析变量 指定分类变量
title ‘标题内容’;
var 变量名列表; Class 变量名列表;
Model
Means Plot Print Sort By Output Freq Where Label
指定模型形式
产生简单统计量 绘制散点图 列出数据集内容 按变量值进行排序 指定变量分组 指定输出结果存放的数据集 指定一个重复数变量 选择数据集的子集 为变量指定临时标签
SAS数据步相当于一个单独运行的程序。数据步也称为data步,
语法结构为:
data 数据集名;
Input 变量名1[$] 变量名2[$] …变量名n[$]; 其他数据步语句; cards; 数据行
;
其他数据步语句; run; 说明: (1)变量名和变量名,数据和数据之间至少要空一个空 格。(2)变量名不能与SAS命令相同。
(4)每个SAS语句都必须以西文状态下的分号;作为结束符。
(5) 每行数据的行尾不能有;,但是数据行结束后的;必须独占一行。 (6)行保持标识符@和@@,其中@表示cards语句中的数据一行为 一条记录,用多条input语句输入,@@表示cards语句中的数据为
多条记录,用一条input语句读入。
智能编辑功能。
F5
F6
F7
Log(运行记录窗口):用于显示和记录SAS程序的运行情况,说明
程序运行成功或存在的错误,用红色字符显示错误信息,绿色 显示警告信息。 Output(输出记录窗口):可分页显示SAS程序运行所产生的文本
型输出结果(图形通过Graphics窗口显示),文本结果报错为.lst文
SAS的广泛应用

电信(运用SAS软件产品进行网络运营分析和管理) 金融(SAS帮我们发现有竞争力的商机) 保险 制造(SAS软件帮助日本富士通集团了解客户的需求,上海宝钢利用SAS
软件改善产品质量和运输过程)

证券 公共事业(香港选择SAS来做2001年的人口普查)
SAS软件发展历程
件,图形文件可以保存为各种图形格式的文件。
Explorer窗口:显示SAS库及其SAS数据集
Results窗口:用于显示程序运行成功时程序输出结果的目录, 可以方便的查看运行结果。
SAS基本概念
SAS数据集:可以看作由若干行和若干列组成的表格,数据集
的每一行称为一个观测,每一列称作一个变量。
SAS数据库:多个SAS文件放在一起,称为一个SAS数据库
6.3 SAS程序语言结构
SAS对数据的处理分为两大步骤:数据步和过程步。数据步
用来读入SAS建立SAS数据集,每一个数据步都是以data语句
开始,以run语句结束。过程步用来调用SAS的模块,处理和分 析数据集中的数据,每一过程步都以proc语句开始,以run语 句结束。 6.3.1 SAS数据步结构 1、SAS语言的自编程计算功能主要在数据步实现,一个
do …while(循环继续条件);
循环体…; end;
3) do … until循环 语法格式为: do until(循环退出条件); 循环体语句…;
end;
6.2.4 输出语句
SAS数据步的输出一般是数据集,用赋值语句计算的结果会自动 写入数据集中。用于输出的语句为put,格式为:
Put 变量名1(字符串1),变量名2(字符串2),…,变量名n(字符串n) 例:data;x=0.5;y=sin(x);put ”sin(” x ”)=” y;run;
Put x= y=;(指定带有变量名输出的结果) Put x 10-20 .6 y 30-40 .6;指定具体列的位置和小数位数; Put x 20.8 y 20.8;指定输出的宽度和精度; Put i @;使结果显示在同一行
注:Put后面不可以是数值常量或表达式,并且各项之间要用空
格分开。
6.2.5 分支语句
2、SAS数据步的运行机制
数据步开始 继续运行 遇到input,set,merge,update或 Modify语句时读入下一个观测值

读取非空?

用程序语句对数据进行处理
生成输出数据集
用output语句或数据步结束隐含的 输出把观测写入输出数据集 数据步终止
说明: SAS数据步如果有数据输入,比如用input, set, merge, update, modify等语句读入数据,则数据步中隐含了一个循环, 即数据步程序执行到最后一个语句后,会返回到数据步内的第 一个可执行语句开始继续执行,知道数据语句标志才停止执行
1、单分支单操作结构:if 条件 then 语句; 2、单分支多操作结构:if 条件 then do 语句1;…语句n; end;
3、双分支结构: if 条件 then 语句; else 语句;
4、多分支结构: Select(选择表达式); When(值列表) 语句; When(值列表) 语句;

Otherwise 语句; End;
Select; When(条件) 语句; When(条件) 语句; … otherwise 语句; End;
6.2.6 数组
SAS数组中每个元素都有自己的变量。 (1)数值型数组 格式说明为:
Array 数组名(维数说明) 数组元素名列表(初始值表);
例:array test(3) Math Chinese English (0,0,0); Array sales(95:97) yr95-yr97;利用下标界说明维数 Array test(*) Math Chinese English (0,0,0);元素个数决定维数 Array table(2,2) x11 x12 x21 x22; 二维数组 (2)字符型数组 Array 数组名(维数说明) $元素长度说明 数组元素名列表(初始
libname mylib “E:\sas example” 临时数据集和永久数据集使用时的区别:临时数据集可以用 单水平名,也可以用work.水平名,而永久数据集必须用库名.数
据集名表示。
生成永久数据集的方法: libname mylib “E:\sas example”; data mylib.数据集名; …
变量名=表达式
2、循环语句 三种循环语句,do, do while, do until 1)do循环
语法格式为:
do 计数变量=起始值 to 结束值 by 步长; 循环体; end; 计数变量=计数变量+步长,如果循环步长为1,则可以省略 by 步长。 例:
2) do … while循环 语法格式为:
第6章 SAS使用入门
SAS概述

SAS含义:Statistical Analysis System
SAS是在美国使用的最为广泛的三大著名统计分析软
件SAS SPSS和SYSTAT)之一

SAS是集大型数据管理、统计分析、报表图形、信息 系统开发等多种强大功能于一体的大型软件系统,在 农业、生物、医学、经济管理、社会学、工程等多个 行业有着广泛的应用。
(7)程序的注释方式为/* 注释内容*/,可以出现在任何允许加入空 格的位置 (8)SAS程序编辑完成后,通过按F8或者工具栏的小人图标运行, 也可以通过鼠标选程序的某一部分运行。
(9)保存某个窗口前先进行激活操作
2、SAS的变量基本类型 (1)数值型,如20,-7.5,3E-10; (2)字符型,变量名后必须使用$说明符; 其他的数据类型中,日期、时间等变量存为数值型,可以使任

初学者可以较快掌握其基本操作
熟练者可用于完成各种复杂的数据处理(科研
工作者和统计学家)
统计分析

常用生物统计分析 多变数分析 试验设计


次数资料的测验
非参数测验
常用生物统计分析

描述性统计


统计推断
方差分析 线性相关和回归分析
协方差分析
非线性回归分析
多变数分析


合条件,主要有& And,| Or,^ Not三种运算符
例如 (salary>=1000) and (salary<2000) (age<=3) or (sex=‘女’) Not (salary>=1000) and (salary<2000)
4、其他运算符
连接两个字符串操作||,取两个运算值中比较大的一个<>,取 两个运算符中较小的一个>< 6.2.3 赋值语句和循环语句 1、赋值语句
(Library)。有三个预定义的数据库,WORK,SASUSER,SASHELP, 其中WORK用于存放临时文件,叫做临时库,SASUSER库保存 与用户个人设置有关的文件,是永久的,SASHELP库保存与 SAS帮助系统、例子有关的文件,是永久的。
SAS通过libname函数将库名和子目录联系起来,如:

1966年开始研制
1976年商品化 1985年SAS PC微机版本 1987年DOS下的SAS6.03版(6.04版) 推出WINDOWS下运行,SAS6.11版,SAS6.12版, SAS8.0版,SAS8.2版,SAS9.0版,SAS9.1版
SAS软件适用人员
具有不同水平与经验的用户
百度文库Model 因变量=自变量表/选项;
Proc means[选择项]; Proc plot; Proc print data=数据集名; Proc sort[选择项] By 变量名(首先排序) Output out=输出数据集名 关键字= 变量名 关键字=变量名 Freq 重复次数 Where 条件表达式 and 条件表达式 Label 变量名=‘标签’…
意的整数,定点实数、浮点实数等,一般使用8个字节。字符型
变量默认的长度为8个字符,当然也可以通过length语句指定其 长度。Length 字符型变量名 $ 长度;
一个SAS程序示例:
6.2.2 运算符
SAS运算符包括算术运算符、关系运算符以及逻辑运算符 1、算术运算符
包括+-*/和**(乘方),x^3可写为x**3
值表)
6.2.7 常用函数
函数 Abs(x) Max(x1,x2,…,xn) Min(x1,x2,…,xn) Sqrt(x) Exp(x) Log(x) 功能 求x的绝对值 观测值最大者 观测值最小者 X的平方根 指数函数exp X的自然对数 函数 Log10(x) Int(x) Sin(x) Arsin(x) Sum(x1,x2,…,xn) 功能 以10为底的对数 取整 正弦函数 X的反正弦函数 求和函数
6.2 SAS程序设计基本常识
6.2.1 基本语法和运行方式
1、SAS程序的基本语法规定如下:
(1)SAS程序中除了赋值、表达式、注释和空语句之外,所有 其他语句都要以SAS命令作为起始单词,且不区分大小写。 (2)程序中使用的所有计算对象(变量、数据集、逻辑库)都必 须按SAS标识符定义规定命名。 (3)标示符命名规则为:1)以字母或下划线开头;2)由字母、 数字、下划线构成;3)应用中不区分大小写英文字母。
数据步,并把读入的各个观测写入到data语句中指定的数据集。
6.3.2 SAS过程步结构
SAS过程步的语法结构为:
proc 过程名 data=输入数据集 选项;
过程语句 选项; 过程语句 选项; …… run; 说明: (1)若data选项缺省,则系统默认为最近生成的数据集; (2)过程步语句一般以某个关键字开头,对应语句需要的选择 项要写在斜线’/’后面
多元方差分析
主成份分析 因子分析
聚类分析
典范相关分析
6.1命令及窗口环境
6.1.1 SAS系统的启动与退出 6.1.2 SAS系统窗口介绍 启动SAS之后,出现下页的运行界面,称为SAS应用工作空间
(SAS application workspace),简称为SAS AWS。
SAS具有三个最重要的子窗口:程序编辑窗口(Editor),运行 记录窗口(Log)和输出窗口(Output) 程序编辑窗口(Editor):用于编辑SAS源程序文件,支持全窗口编 辑,即点即输功能,支持复制、剪切、粘贴等常规操作,具有
2、关系运算符 用于处理常量、变量、表达式值之间的大小、相等或包 含关系,是双目运算符,格式为:运算对象1 运算符 运算对象2 关系运算符有:
符号表示:= ^= > <
>= <=
LE IN
字符表示 EQ NE GT LT GE
IN是SAS一个特殊的比较运算符,用来检查某个变量的取值是否
在一个给定列表中,如: City IN(‘beijing’, ’tianjing’, ’shanghai’, ’chongqing’) 3、逻辑运算符 用来描述多个真假条件之间的关系,构成比较复杂的组
相关文档
最新文档