第5章 SAS过程步应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多个分析变量之间用空格分隔。
❖ 省略该语句时默认对数据集的所有变量进行统计分析. ❖ 语法格式: var 变量名 1 变量名2 变量名3…变量名N; ❖ 功能:指定要分析的变量。
❖ 【注意】此处的变量名为过程步指定的数据集中所具 有的变量名。
过程步基本语句
❖ 1. by语句
❖ By语句指定一个或几个分组变量,根据by语句中指明 的分组变量对数据集中的观测记录进行分组,然后对 每一组观测记录通过所调用过程进行组内分析,多个 变量之间用空格分隔.
Baidu Nhomakorabea
条件选项语句
输出文件加入标题信息
输出文件加入脚注信息
通过此语句设置,改变SAS系统的默认设置
注意
❖ 过程步中的过程语句与数据步中的语句不同, 数据步中的语句不能用到过程中,过程步中的 过程语句以某一个关键字开始,如by、var、 class、weight、freq、model等。
过程步基本语句
❖ 1. var语句 ❖ 过程步中通过var语句指定分析变量,告诉SAS ❖ 系统过程步对所要分析数据集的哪些变量进行分析,
❖ 【注意】weight语句中指定的变量只能是数值型变 量,当变量值对应值为零或缺失时此观测记录不作为
❖ 分析数据,该观测记录被剔除出分析过程。
过程步基本语句
❖ 7. id语句 ❖ 过程步用id可以替代SAS默认的obs标识,id省略时 ❖ 用SAS默认obs来标识观测记录。 ❖ 语法格式: id 标识变量名;
频度,即出现的次数,是对变量的一个累加过程。
❖ 【注意】freq语句中指定的变量只能是数值型变量。
过程步基本语句
❖ 6. weight语句
❖ 通过weight 语句对某个变量进行统计分析,可以看 出此变量在总体中的相对重要程度。
❖ 语法格式: weight 变量名;
❖ 功能:分析变量在所观测记录中占总观测记录的比 重,即百分比。
❖ 语法格式: by 变量名 1 变量名2 变量名3…变量名N;
❖ 功能:by语句对数据集按指定变量先进行分组,然后 对分好的组进行组内分析。
❖ 【注意】使用by语句的过程步中,对所分析的数据集 要先通过sort过程对数据集排序,方可在用by语句的
❖ 过程对排序后的数据集分组。
过程步基本语句
❖ 3. class语句
❖ 语法格式: model 因变量=自变量表/选项;
❖ 功能:过程步中为所用到的分析过程指定分析模型, 并给出模型用到的因变量和自变量的个数和变量名。
❖ 【注意】因变量=自变量表/选项语句就相当于医院直 线方程y=kx+b ,y变量因自变量x变化而变化。
过程步基本语句
❖ 5. freq语句 ❖ SAS用freq语句分析数据集中某个变量出现的次数。 ❖ 语法格式: freq 变量名; ❖ 功能:对freq中指定的变量求出数据集中观测出现的
Data=
指定过程步处理的数据集
选项
控制过程的选项。每个过程都有自己的选项,同时还有 通用选项
过程语句
过程内部分析数据集用到的语句
参数选项
过程语句具有的选项,如分析变量选项
run
告诉过程步到此处结束,也可以省略此语句,在下一个
过程步或数据步的开始处结束
❖ 表5-2 过程步通用基本语句
过程语句 var by class model freq weight id output where title footnote options
❖ SAS系统中所谓的过程步是指调用SAS内部已经编 译好的过程对数据集进行动态分析的过程。
过程步内部处理机制和作用
❖ 过程步以“proc”关键字为开始标志,通过 ❖ “proc”语句调用过程名和数据集,输出分析
报告或图形或对数据集变换处理的动态执行 过程。
❖ 过程步的主要作用是分析数据或对数据集做 变换处理,输出分析报告或图形等分析信息, 然后用户根据输出信息写出分析报告,做总 结性评价。
❖ 语法格式: class 变量名 1 变量名2 …变量名N;
❖ 功能:过程步中用class语句可以指定分类变量,然 后过程步再对分好类的组进行组内分析。
过程步基本语句
❖ 4. model语句
❖ model语句指定模型的样式。通过model语句可以寻 找变量与变量之间的关系,在销售领域或风险控制领 域经常用到此语句寻找变量之间呈现的关系,来帮助 决策控制销售和风险。
功
能
指定分析变量,多个变量以空格分隔
指定一个或多个分组变量对数据集分组,数据集要先排序
指定一个或多个分类变量,不需要实现对数据集排序
建模中指定模型的因变量和自变量,以及相关模型选项
指定用于分析变量的频数变量
指定权数变量,以获得该变量占百分比的权重
指定观测标识,输出会去掉obs选项标识
将过程分析结果输出到新数据集
❖ 功能:区分不同观测记录的变量,相当于指定一个 区别标识,每个观测有唯一标识。
❖ 【注意】weight语句中指定的变量只能是数值型变 量,当变量值对应值为零或缺失时此观测记录不作为
❖ 分析数据,该观测记录被剔除出分析过程。
过程步基本语句
❖ 8. output语句
❖ class语句指定一个或几个分类变量,对分析的数据 集不需要按分类变量先通过sort过程排序后再分析. 这是Class语句与by 语句的不同之处。在方差分析 过程中,class语句中指定的变量是因变量,在
❖ 均值过程(means)中,class语句和by语句功能相同。
❖ 调用不同的过程,class语句中分析变量表示的意义 也不同。
第4章 SAS过程步应用
过程步概述
❖ SAS过程步(proc step)是SAS系统的另一个核心步, 用来对生成的数据集进行分析和处理,是SAS内部 已经编译好的过程。用户可根据业务需求,直接调 用SAS内部过程并对所调用过程选项设置进行分析 处理、作图和报表,然后根据调用过程输出的信息 写出分析报告做总结性评价。
过程步语法格式
❖ Proc 过程名 <data=数据集名> <选项>;
❖
过程语句 <参数选项>;
❖ run;
❖ 【注意】对于调用SQL过程,结束标志是
❖ Quit.
表5-1 过程步语法说明
过程步操作语句 功
能
proc
过程步开始过程关键字,告诉SAS系统此处为过程步
过程名
SAS系统内部编译好的过程,直接写过程名
❖ 省略该语句时默认对数据集的所有变量进行统计分析. ❖ 语法格式: var 变量名 1 变量名2 变量名3…变量名N; ❖ 功能:指定要分析的变量。
❖ 【注意】此处的变量名为过程步指定的数据集中所具 有的变量名。
过程步基本语句
❖ 1. by语句
❖ By语句指定一个或几个分组变量,根据by语句中指明 的分组变量对数据集中的观测记录进行分组,然后对 每一组观测记录通过所调用过程进行组内分析,多个 变量之间用空格分隔.
Baidu Nhomakorabea
条件选项语句
输出文件加入标题信息
输出文件加入脚注信息
通过此语句设置,改变SAS系统的默认设置
注意
❖ 过程步中的过程语句与数据步中的语句不同, 数据步中的语句不能用到过程中,过程步中的 过程语句以某一个关键字开始,如by、var、 class、weight、freq、model等。
过程步基本语句
❖ 1. var语句 ❖ 过程步中通过var语句指定分析变量,告诉SAS ❖ 系统过程步对所要分析数据集的哪些变量进行分析,
❖ 【注意】weight语句中指定的变量只能是数值型变 量,当变量值对应值为零或缺失时此观测记录不作为
❖ 分析数据,该观测记录被剔除出分析过程。
过程步基本语句
❖ 7. id语句 ❖ 过程步用id可以替代SAS默认的obs标识,id省略时 ❖ 用SAS默认obs来标识观测记录。 ❖ 语法格式: id 标识变量名;
频度,即出现的次数,是对变量的一个累加过程。
❖ 【注意】freq语句中指定的变量只能是数值型变量。
过程步基本语句
❖ 6. weight语句
❖ 通过weight 语句对某个变量进行统计分析,可以看 出此变量在总体中的相对重要程度。
❖ 语法格式: weight 变量名;
❖ 功能:分析变量在所观测记录中占总观测记录的比 重,即百分比。
❖ 语法格式: by 变量名 1 变量名2 变量名3…变量名N;
❖ 功能:by语句对数据集按指定变量先进行分组,然后 对分好的组进行组内分析。
❖ 【注意】使用by语句的过程步中,对所分析的数据集 要先通过sort过程对数据集排序,方可在用by语句的
❖ 过程对排序后的数据集分组。
过程步基本语句
❖ 3. class语句
❖ 语法格式: model 因变量=自变量表/选项;
❖ 功能:过程步中为所用到的分析过程指定分析模型, 并给出模型用到的因变量和自变量的个数和变量名。
❖ 【注意】因变量=自变量表/选项语句就相当于医院直 线方程y=kx+b ,y变量因自变量x变化而变化。
过程步基本语句
❖ 5. freq语句 ❖ SAS用freq语句分析数据集中某个变量出现的次数。 ❖ 语法格式: freq 变量名; ❖ 功能:对freq中指定的变量求出数据集中观测出现的
Data=
指定过程步处理的数据集
选项
控制过程的选项。每个过程都有自己的选项,同时还有 通用选项
过程语句
过程内部分析数据集用到的语句
参数选项
过程语句具有的选项,如分析变量选项
run
告诉过程步到此处结束,也可以省略此语句,在下一个
过程步或数据步的开始处结束
❖ 表5-2 过程步通用基本语句
过程语句 var by class model freq weight id output where title footnote options
❖ SAS系统中所谓的过程步是指调用SAS内部已经编 译好的过程对数据集进行动态分析的过程。
过程步内部处理机制和作用
❖ 过程步以“proc”关键字为开始标志,通过 ❖ “proc”语句调用过程名和数据集,输出分析
报告或图形或对数据集变换处理的动态执行 过程。
❖ 过程步的主要作用是分析数据或对数据集做 变换处理,输出分析报告或图形等分析信息, 然后用户根据输出信息写出分析报告,做总 结性评价。
❖ 语法格式: class 变量名 1 变量名2 …变量名N;
❖ 功能:过程步中用class语句可以指定分类变量,然 后过程步再对分好类的组进行组内分析。
过程步基本语句
❖ 4. model语句
❖ model语句指定模型的样式。通过model语句可以寻 找变量与变量之间的关系,在销售领域或风险控制领 域经常用到此语句寻找变量之间呈现的关系,来帮助 决策控制销售和风险。
功
能
指定分析变量,多个变量以空格分隔
指定一个或多个分组变量对数据集分组,数据集要先排序
指定一个或多个分类变量,不需要实现对数据集排序
建模中指定模型的因变量和自变量,以及相关模型选项
指定用于分析变量的频数变量
指定权数变量,以获得该变量占百分比的权重
指定观测标识,输出会去掉obs选项标识
将过程分析结果输出到新数据集
❖ 功能:区分不同观测记录的变量,相当于指定一个 区别标识,每个观测有唯一标识。
❖ 【注意】weight语句中指定的变量只能是数值型变 量,当变量值对应值为零或缺失时此观测记录不作为
❖ 分析数据,该观测记录被剔除出分析过程。
过程步基本语句
❖ 8. output语句
❖ class语句指定一个或几个分类变量,对分析的数据 集不需要按分类变量先通过sort过程排序后再分析. 这是Class语句与by 语句的不同之处。在方差分析 过程中,class语句中指定的变量是因变量,在
❖ 均值过程(means)中,class语句和by语句功能相同。
❖ 调用不同的过程,class语句中分析变量表示的意义 也不同。
第4章 SAS过程步应用
过程步概述
❖ SAS过程步(proc step)是SAS系统的另一个核心步, 用来对生成的数据集进行分析和处理,是SAS内部 已经编译好的过程。用户可根据业务需求,直接调 用SAS内部过程并对所调用过程选项设置进行分析 处理、作图和报表,然后根据调用过程输出的信息 写出分析报告做总结性评价。
过程步语法格式
❖ Proc 过程名 <data=数据集名> <选项>;
❖
过程语句 <参数选项>;
❖ run;
❖ 【注意】对于调用SQL过程,结束标志是
❖ Quit.
表5-1 过程步语法说明
过程步操作语句 功
能
proc
过程步开始过程关键字,告诉SAS系统此处为过程步
过程名
SAS系统内部编译好的过程,直接写过程名