SAS培训班讲义经典版
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
^
>< < >
36
运算次序二
对于相同优先级的算符,左边的运算先 做。但有两个例外: 1.对最高优先级,右边的运算先做 2.当两个比较算符围着一个量时,这个 表达式看成是有一个and 出现一样被计 算。 如:12<age< 20, 等价于:12<age & age<20
37
SAS函数一(部分)
3
数据类型
a. 横截面数据集(cross-sectional data set):即给定时点对个人、家庭、企业、 国家或一系列其他单位采集的样本所构 成的数据集(应该忽略细小的时间差别) 名词术语 1、数据集:数据的集合,由样本(行) 和变量(列)组成
4
数据类型
b.时间序列数据集(time series data set): 是由一个或几个变量在不同时间的观测 值所构成的。 c.混合横截面数据集(pooled cross section data set): 有些数据既有横截面数据的特点又有时 间序列的特点,但每一时点的样本不同。
17
SAS/EIS 面向对象编程的开发工具,用于开发 企业信息系统 SAS/ACCESS 数据访问 SAS/TOOLKIT 扩充工具,把用其他软件编写 的程序转化成SAS的组成部分 SAS/Warehouse Administrator 数据仓库管理 SAS/Enterprise Miner 数据挖掘 SAS/Text Miner 文本挖掘 SAS/SHARE 数据库的并发式控制专门软件 SAS/CONNECT 使各平台SAS系统进行分布式 处理,从而有效利用各平台机器资源
18
SAS/GIS 地理信息系统与空间数据的显 示分析 SAS/SPECTRAVIEW 数据可视化分析工 具,用几何成像的方式来分析多维数据 SAS/Intrnet 提供构建基于SAS的企业内 部网络支持 SAS/FSP 快速数据处理的交互式菜单系 统 SAS/CALC 功能完善的多维电子表格软件 SAS/ENGLISH 提供利用自然英语获取信 息的能力
SAS的发展历程一
1966年由美国北卡罗来纳州(North Carolina)州立大学开始研制 1976年成立美国SAS软件研究所,并开 始对SAS系统进行维护、开发、销售和培 训等工作 1985年推出了SAS/PC(6.02)版本
12
SAS发展历程二
1989年推出SAS/PC(6.04)版本 1997年下半年推出适用于多种操作系统 的6.12版本 2000年2月又正式推出SAS系统8版本 2002年推出全新的SAS9版本
课程名称: SAS培训班讲义 讲师: 赵坚毅 网址:http://www.pinggu.org
1
第一部分 课程介绍
培训内容:使学员掌握SAS的界面使用和 基本编程使用,为学习和应用SAS的其他 专业功能奠定坚实的基础。 使用SAS进行数据分析和处理
2
推荐教材
1. SAS系统的帮助以及在线文档,都是学习 SAS的很好的工具。 http://support.sas.com/documentation/online doc/sas9doc.html 2. 《SAS系统Base SAS 软件使用手册》 高惠 璇等编译, 中国统计出版社1997 3.《SAS 系统SAS/STAT软件使用手册》高惠璇 等编译, 中国统计出版社1997 4. 《实用统计方法与SAS系统》 高惠璇 北京 大学出版社 2001
19
SAS/SECURE 网络传输加密 SAS/OLAP SERVER 多维数据存储及汇总结果 呈现 SAS/GENETICS: SAS公司的第一个科学研究 应用软件,应用于遗传学,有5个分析过程 SAS/High-Performance Forecasting:提供快速 高效的预测结果 SAS/C, SAS/C++ 针对IBM大型机的开发工具 SAS/LAB 向导式的数据分析软件,特别针对 day-to-day类型数据
8
数据处理的应用
天文学(skicat系统处理天文数据发现类 星体) 生物学(人类基因组计划处理人体数据 研究基因) 市场营销(货篮分析) 公司财务的处理(记流水帐) 经济论文写作中的实证部分
9
数据处理的应用
“今天,我们不得不生存在全球化和信息革 命影响下的世界,我们只有两个选择:适应它, 或者被它抛弃。” ——英特尔公司主席 安德鲁· 格鲁夫 1995年尼葛洛庞帝的《数字化生存》一书指明 了即将到来的数字时代,而在未来一长段时间, 数字化生存仍将是人类的主要生存方式,在经 济学领域也不外如是。
5
数据类型
Biblioteka Baidud.综列数据集(panel data set): 由横截面数据集中每个样本的一个时间 序列组成。(定点长期调查) 其他专门数据类型: 1、离散数据(discrete data):通常在考 察个人、家庭或企业的决策行为时,通 过问卷调查获得,由此发展出“离散选 择模型”。定量数据与定性数据
6
数据集类型
2、持续数据(survival data):用于考察 变量从开始到结束或调查终止前所经过 的时间长度,如失业持续时间、罢工持 续时间,股市牛熊市持续时间
7
使用SAS进行数据处理的 应用实例
商场应用: 在美国大型超市 WalMart (沃尔玛)发 生的实例:在星期四, 年轻夫妇为准备周末 通常同时购买尿布和 啤酒,因此把尿布和 啤酒放在一起会提高 效率。
SAS/Insight模块
1、界面介绍 2、Fill values 功能 3、Extract 功能 4、Edit/windows/tool菜单使数据探索色 彩缤纷(注意选项设置) 5、打开分布、拟合、多元等的窗口之后 主菜单Tables、Graphs、Curves菜单才 被开放。
Fly,insurance数据集示例
13
SAS在中国的发展
SAS公司于1989年在北京成立了办事处 1997年,SAS软件研究所正式宣布成立 大中国区 1999年3月在国内设立独资公司——赛仕 软件(上海)有限公司。
14
SAS的成绩
全球十大独立软件开发商之一 世界六大洲近50个国家或地区设有分公 司及分支机构 应用遍及120多个国家和地区(包括中国) 的31000多个机构中 全球100家最大公司中的90多家都在应用 SAS系统。
10
第二部分 SAS系统入门 SAS系统概况
大型集成、跨平台软件系统 完备的数据访问(Access)、管理 (manage)、分析(analyze)和呈现 (present)及应用开发(develop)的功能 在数据处理、统计分析和IT应用领域, SAS系统已经成为国际上的标准软件系统。
11
27
SAS的变量及格式
变量属性(名称、类型、长度、输入格式、 输出格式、标签) 类型:数字型、字符串型 输入格式:数据被SAS读取的格式 输出格式:数据呈现给人们的格式
28
SAS程序第二例
SAS/orange.sas 输入数据-形成数据集-排序-打印显示
29
SAS文件及命名
1、SAS数据集文件(后缀为sas7bdat) 2、SAS程序文件(后缀为sas) 3、SAS日志文件(后缀为log) 4、SAS输出文件(后缀为list)
30
SAS文件及命名
临时数据集和永久数据集 SAS文件的2级命名方式:目录.文件名 work目录和其他目录 使用Libname语句创建永久数据集,
libname 自建目录名 ‘目录地址’;
libname例
31
建立SAS数据集的5种方法
1、data步自己输入数据建立。Orange 例 2、data步利用set 语句建立。Set例 3、从外部调入。Infile例 4、利用“导入数据”功能建立。Id.xls 例、data.txt例 5、利用EFI(external file interface)功能 导入。Column.dat例、tests.dat例、 comma.dat例
34
字符的比较(operator_char例)
1、按机器使用的字符排列次序(ASCⅡ或 Unicode)从左到右被比较。 2、两个不等长的字符串被比较时,系统 在较短的字符串后自动添上空格 3、在比较符后加冒号,则只比较首字母
35
运算次序一
在括弧里的表达式先计算 第一级:** (+ -)前缀 第二级:* / 第三级:+ - 第四级:|| 第五级:其余比较算符 第六级:& 第七级:|
32
Analyst分析家模块
1、界面介绍 2、浏览与编辑模式 3、生成示例数据与抽样 4、程序清单 5、假设检验
33
SAS运算符(operator例)
算术运算符: + - * / ** 比较算符: =(EQ) ^=(NE) >(GT) <(LT) >=(GE) <=(LE) in 逻辑算符: &(AND) |(!)(OR) ^(~)(Not) 其它:><(最小值) < >(最大值) ||(!)(连接)
SAS程序的书写格式
4、一个语句也可以写成几行,只要语句 中的单词不被断开就可以。在一个语句 中各个单词之间至少要有一个空格。 5、SAS程序中一般不区分大小写(字符 串中要区分大小写) 6、用 /*注释的内容*/ 来对程序进行 注释
26
SAS程序的结构
SAS数据集 样本(观测、记录)、变量(字段、 域)、表(数据集)、 数据库 许多SAS语句都是以关键词开始并用它识 别语句的类型(如data、input、proc) 绝大部分的SAS语句都可分为两步: DATA步和PROC步
38
SAS函数二(部分)
SAS系统存贮日期值为1960年1月1日到 指定日期之间的天数 SAS存贮时间值为从午夜开始到指定时间 的秒数 日期时间值存贮为1960年1月1日午夜到 指定日期时间之间的秒数 日期时间函数:weekday ( )、day()、 month()、qtr()、year()
15
SAS模块介绍
Base SAS: 1、数据管理功能 2、基础统计计算功能 3、报表生成和图形显示功能
16
SAS/STAT 统计分析 SAS/INSIGHT 数据探索 SAS/ASSIST 面向任务的易学易用模块 SAS/ETS 时间序列处理 SAS/OR 运筹学和工程管理 SAS/QC 质量控制 SAS/IML 矩阵运算 SAS/GRAPH 绘图 SAS/AF 面向对象编程(OOP)的应用开发 工具,拓展SAS的功能
数学函数: abs()、max ()、min ()、mod (x, y)、sign (x)、 sqrt (x)、 sum ()、 mean ()、exp (x) 、log (x)、log10 (x)、log2(x) 、sin (x)、arsin (x) 截取函数: ceil (x)、floor (x)、int (x)、round (x,n) 字符函数: index (S, S1)、substr (S , p, n)、scan(S2,n)、 upcase(S)、compress(S,S1)
23
Insight模块
其他功能: 1、分布(输出大多数常用的统计量) 2、拟合(回归分析) 3、多元(方差分析)
24
SAS程序的书写格式
1、SAS程序由语句组成,语句用分号结 束。 2、 SAS语句可以从某一行的任意位置开 始; 3、几个SAS语句可以写在同一行上,但 每句要使用分号
25
39
SAS函数三(部分)
概率统计函数: probnorm (x) n (of X1-Xn)、nmiss (of X1-Xn), var (of x1-xn)、std (of x1-xn) 随机数函数: rannor (seed)、ranuni (seed) Functions例
20
SAS工作空间
程序窗口(PROGRAM EDITOR) 运行记录窗口(LOG) 输出窗口(OUTPUT)
21
SAS程序第一例
SAS/HelloWorld.sas
注:以后程序文件省略后缀,直接简记 为文件名称,如此例简记为HelloWorld, 需要说明文件类型时才标明后缀。
22