一些常用的SAS命令
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常用SAS命令
1. SAS的子窗口主要有浏览器窗口(EXPLORER)、结果窗口(RESULTS)、程序编辑器窗口(program editor)、日志窗口(log)、输出窗口(output);
2.切换至日志窗口的命令是log、热键是F6;切换至输出窗口的命令是output、热键是F7;
3.提交SAS程序的命令是submit;
4. SAS系统是大型集成软件系统,具备完备的数据访问、管理、分析和呈现及应用开发功能;
5. SAS数据集是一类由SAS系统建立、维护和管理的数据文件;
6.为了实现存储和管理面向对象的开发任务,SAS建立目录册(catalog)类型的文件,在这一类文件中可以存储整个应用系统,包括它的界面,源程序和各种对象间的连接;
7. SAS逻辑库是一个逻辑概念,一个逻辑库就是存放在同一文件夹或
几个文件夹中的一组SAS文件;
8.在SAS软件系统的信息组织中,总共只有两个层次:SAS逻辑库是高一级的层次,低一级的层次就是SAS文件本身;
9.在SAS系统中,为便于访问一个SAS文件,要为该SAS文件所在的位置指定一个SAS逻辑库,即赋予一个逻辑库名,在指定逻辑库名后,就可使用两级命名的方式引用SAS文件:逻辑库名.文件名;
10.在每个SAS进程一开始,系统就自动地指定了一些逻辑库供用户使用,它们是WORK、SASHELP和SASUSER;
11.在每个SAS进程开始时系统缺省地创建名为work的SAS逻辑库,它是一个临时逻辑库,在引用WORK库中的SAS文件时,可省略逻辑库名;
12.永久逻辑库是指它的内容在当前SAS进程结束时仍被保留的SAS 逻辑库,在SAS系统中除了库名为WORK以外的逻辑库都是永久库;
13. Sashelp包含所安装SAS系统各个产品有关的SAS文件,运行安装的SAS系统所需要的SAS文件缺省地存储在这个逻辑库中;
14. Sasuser包含为满足用户需要而特制的SAS文件,用户的一些设置也放在Sasuser逻辑库中;Sasuser也是存放为您个人使用而创建的文件的合适场合;
15.库引擎是规定系统用什么格式向逻辑库读写文件的内部指令;
16.由于Sashelp、Sasuser和Work是系统自动设定的,这些逻辑库名是不能删除的;
17.一个SAS数据集是一个包含两个组成部分的文件:一个描述部分和一个数据部分。某些SAS数据集也另外包含一个索引文件;
18. SAS数据集的变量属性信息包括变量的:名称(name)、类型(type)、长度(length)、输出格式(format)、输入格式(informat)和变量标签(label);
19.SAS编程前必须明确以下三个方面:什么是输入的或供操作的数据、要对输入的数据进行什么加工、期望的输出结果是什么;
20.每个SAS程序是由许多完成单个动作的程序步和一些设定环境的语句构成的;
21.数据步(data step):读入源数据文件和SAS数据集,修改、编辑或创建SAS数据集或文本文件;
22.过程步(proc step):面向SAS数据集,完成某个特定的计算、分析和呈现的功能;
23.每个语句是由一个关键词开始,并以分号结束,通常就用开始的关键词命名这个语句;
24. DATA语句和PROC语句分别标志数据步和过程步的开始,RUN 语句或另一个程序步的开始标志程序步的结束;
25.指定逻辑库名的语句的一般形式为:libname 逻辑库名‘库的实际地址’;
26在程序编辑器窗口提交语句:libname 逻辑库名list;可以在log 窗口显示该逻辑库的连接;
27.多个物理位置指定同一个逻辑库名的一般形式为:libname 逻辑库名(物理位置1 物理位置2…);
28. 指定逻辑文件名语句的一般形式为:filename 逻辑文件名‘文
件位置’;
29. 查看SAS逻辑库的属性和内容的一般写法为:proc datasets lib=逻辑库名;
run;
30. 查看SAS数据集的属性的一般写法为:proc contents data=数据集名;
run;
31. 输出数据集的数据部分的一般写法为:proc print data=数据集名;
run;
32. 转换文本数据文件的数据步的一般形式为:data 数据集名;
infile 文件名;
input 变量输入设定;
run;
33. input语句的一般形式为:input 指针控制变量名输入格式…;
34. 指针控制@n表示从第n列开始读入,+n表示将列控制指针增加n列后读入;
35. 程序数据列PDV包含两个自动生成的(临时)变量:_N_、_ERROR_,它们可以在程序中使用,但不作为观测的一部分写入数据集;
36. retain语句的一般形式为:retain 变量名<初值> 变量名<初值> …;
37. 在数据步执行的每次循环中,retain语句指定的变量不再从新初始化,保留它以前存储的结果;
38. 求和语句的一般形式是:变量名+表达式;在求和语句中加号前后的项有不同的作用,一个是累加的变量,另一个是相加的表达式,两者位置是不能互换的;
39. 函数LAG和DIF调用的一般形式为:LAG(变量名);DIF(变量名);函数LAG的返回值是上一条记录中该变量的值,函数DIF的返回值是当前记录中变量值减去上一条记录中该变量的值;
40. 实现将加工结果存为文本格式的数据步程序的一般形式为:
Data
_Null_;
数据读入语句组;
数据加工语句组;
file 文件名<选项>;
put 变量写入设定;
run;
41. 过程import的作用是实现将PC格式数据文件、以固定字符为字段分隔符的文本文件转换为SAS数据集;