过程及常用统计分析-资料.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.BY语句 语句格式: BY <descending> 变量 …
功能:在过程步中用来指定一个或几个分组变量,根据
这些分组变量值可以把观测记录分组,然后对每一组观测 分别进行指定的分析。BY语句总是与SORT过程一起使用, 以便定义数据排列次序。
例如:假设我们已经把class1数据集按性别排序,则下面 PRINT 过程可以把男、女生分别列出: proc print data=class1 ; by sex; run;
3.3 简单描述统计分析
3.3.1简单描述统计量的基本概念 总体(Population):一个统计问题所研究对
象的全体。 样体(Sample):从总体中抽取一定数量的
个体进行研究,这部分个体称做样本。 随机抽样(Random Sample):从总体中随机
抽取样本,使每个个体都有同等的机会进 入样本的抽样方法称为随机抽样。
PROC PRINT <DATA = 数据集><label>;
proc print data=class1; var name chinese sex; run;
3.2.3 全程语句
1. TITLE 标题语句 SAS系统有一默认的输出标题,使输出的每页有一
行标题,内容为“The SAS System”。 我们可以指定自己的标题来取代SAS缺省的标题。
4.OUTPUT语句 语法格式为:
OUTPUT OUT=输出数据集名 关键字=变量名 关键字=变量名 …;
功能:将过程指定结果输出到一个新的SAS数据集,以便作 为下步处理的输入。不同过程中把输出结果存入数据集的 方法各有不同,OUTPUT语句是使用频繁的语句之一。 OUT=给出了存放结果数据集的名字,关键字用于定义输 出变量名,用“关键字=变量名”的方式指定了系统自动 输出变量与存储变量之间的对应关系。等号后面的变量名 指定了输出数据集中的存储变量名称。(程序示例)
GLM
拟合一般线性模型
REG
拟合多重线性回归模型
CORR
进行指定变量的相关分析
1.VAR语句 语法格式为: VAR 变量名1 变量名2 … 变量名n; 变量名列表可以使用省略的形式,如x1-x3 等。 功能:用于指定分析变量。 应用实例: var math chinese; 2.MODEL语句 语法格式为: MODEL 因变量 = 自变量列表 / 选项; 功能:统计建模过程中用来指定模型的形式。 应用实例:model y=x1 x2 x3 ;
3 SAS过程步 及简单统计分析
3.1 SAS过程步简介
SAS过程步的一般形式为: PROC 过程名 [ DATA=输入数据集] [选项];
过程语句1 [/ 选项 ]; 过程语句2 [/ 选项 ]; …… RUN;
Data选项
– 用于指明所需处理的数据集名,在这里它是一个可选 项参数。
常用过程步的名称及功能
8.CLASS语句 语法格式 CLASS 变量表;
功能:定义分类变量。
9.WHERE语句 语法格式为: where 逻辑表达式;
功能:用来选择输入数据集的子集进行分析。 示例:
Where math>=90 chinese>=60;
10.LABEL语句 语法格式 Label 变量=‘新标签 ’ …;
程序步名
功能
SORT
将指定的数据集按指定变量排序
PRINT
将数据集中的数据列表输出
GCHART
绘出高分辨率的统计图
UNIVARIATE 对指定的数值变量进行详细的统计描述
MEANS
对指定的数值变量进行简单的统计描述
FREQ
对指定的分类变量进行统计描述和检验
TTEST
进行两样本 t 测验
ANOVA
进行多变量方差分析
FOOTNOTE '注脚内容字符串';例如: FOOTNOTE '第三章例子'; 则其后的输出 每页底端会有脚注“第三章例子”显示, 直到用另一个FOOTNOTE语句指定新的脚 注,或用空FOOTNOTE语句取消脚注为止。 使用方法同TITLE语句。
3.2.3 全程语句
3. 输出格式选项OPTIONS语句
功能:为变量指定一个标签。(示例)
11 FORMAT语句 语法格式: Format 变量名 格式描述符 …;
示例:
Format inday MMDDYY8. math 5.1;
3.2 PRINT过程
3.2.1 PRINT过程简介 在SAS Windows版以前,PRINT过程是最常用的
SAS过程之一。PRINT过程步列出数据集的内容, 以检查变量对应输入的数据值是否正确。现在我 们可能通过Viewtable表打开生成的数据集查看数 据。为了输出显示一个指定的数据集,在PROC PRINT语句中使用DATA=指定数据集,语法结构 如下:
OPTIONS语句可以规定系统运行的一些通用选择 项,比如输出是否每页有页号,是否有日期,输 出的行宽,输出每一页的高度(行数),等等。 其使用例如:
options nonumber nodate linesize=78 pagesize=60;
其中NONUMBER表示输出不显示页号(改用 NUMBER则规定显示页号),NODATE表示不 在每页显示运行日期和时间(改用DATE则显 示),LINESIZE=78规定输出每行最宽不超过78 个字符,PAGESIZE=60 规定输出每页为60行, 不足时用空行补齐。
5.FREQ语句 语法格式为: FREQ 变量;
功能:规定一个数值变量,表示数据集中观测出现的频数。
6.WEIGHT语句 语法格式 WEIGHT 变量;
功能:规定一个权重变量,反映该变量在总体中的相对重要 性
7.ID语句 语法格式为: ID 来自百度文库量表;
功能:用来规定一个变量,以便在输出或由该过程产生的 SAS数据集中,不再使用Obs,而用这些变量来识别观测。
指定标题TITLE语句格式为: TITLE '标题内容'; 例如,在前一例的程序前面加上一行 title '2019级1班成绩表'; 则输出结果的标题以“2019级1班成绩表”替代了
“The Sas System”。
3.2.3 全程语句
2. FOOTNOTE 脚注语句
全程语句FOOTNOTE用于为输出添加脚注, 语句格式为:
相关文档
最新文档