统计分析软件教程(第2版)-1(概述)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014-7-4
第一章
31
优先级列表:
第一级: **(乘方) +(正号)-(负号) ^(非) ><(MIN) <>(MAX) 第二级:*(乘) /(除) 第三级:+(加) -(减) 第四级:‖(连接) 第五级:比较操作符 第六级:&(与) 第七级:∣(或)
2014-7-4
第一章
32
(五) SAS函数
教学目的与要求
1 掌握SAS软件的基本操作
2 掌握SAS软件的简单编程 3 掌握基本统计分析过程
4 熟练掌握SAS分析结果
2014-7-4
第一章
4
教学内容
一
系 统 概 述
二
数 据 管 理
三
描 述 统 计 分 析
四
统 计 图 表 制 作
五
相 关 回 归 分 析
六
假 设 检 验
七
方 差 分 析
八 多 元 统 计 分 析
第一章 2014-7-4 10
特点
1 使用灵活方便、功能齐全
SAS是为所有需要进行数据处理、数据分析的非 计算机专业人员提供的一种完整可靠的专业数据分 析软件。 例如:回归分析使用的SAS程序: proc reg data=A; model y=x1-x10/selection=stepwise; plot y * x1=„$‟/*绘制回归线*/; run;
例如:“The SAS SYSTEM”
SAS系统用空格表示字符型的缺失值。
2014-7-4
第一章
20
3、日期、时间、日期时间常量 SAS系统中表示时间的字符串。
①将一个日期表示为一个常量:将日期加上单引 号,后面加上D或(d), 如 ’01JAN96‟d 。 ②将一个时间表示为一个常数:将时间加上单引 号,后面加上T或(t)。 如’20:35:30‟t ③ 将一个日期时间表示为一个常数:将日期时 间加上单引号,后面加上DT。如2010年3月23日17 点45分可以表示为: ‟23MAR2010:17:45‟DT
是缺失值,其运算结果也是缺失值
2014-7-4 第一章 29
(2)比较操作符:=(EQ)等于 ;^=(NE) 不等于;
>(GT)大于; >=(GE) 大于等于;<(LT)小于 ; <=(LE) 不大于 如果算式中如果有一个运算对象是缺失值,它比 任何数都小。 (3)逻辑操作符:&(AND)与 ∣(OR)或 ^(NOT)非 (4)其他操作符:><(MIN) <>(MAX) ‖(连接)
第一章 13
三 SAS系统的基本结构
SAS系统由四部分构成:
(1) SAS基础(Base SAS)
完成SAS系统的数据管理功能,Base SAS是
SAS系统的基础应用平台,既可以单独使用,也
可以与其它模块组成一个用户个性化的 SAS系统,
其它模块必须与之结合起来使用。
2014-7-4
第一章
14
(2) SAS应用分析模块
2014-7-4 第一章 22
例1 -1:
DATA MYDATA; INPUT TIME@@; INFORMAT TIME MMDDYY6.; FORMAT TIME DATE9.; CARDS; 010108 021408 030108 050806 091401 061090 ; PROC PRINT; RUN; Obs 1 2 3 4 5 6 TIME 01JAN2007 14FEB2007 01MAR2007 08MAY2006 14SEP2001 10JUN1990
2014-7-4 第一章 25
6、输入(Informat)与输出(Format)格式
一般形式如下: <$>informat-name<w.><d> <$>format-name<w.><d>
其中:
$ 代表变量是字符型的 informat-name 输入格式名 format-name 输出格式名 w 输入或输出的宽度 必须的分隔符 d 小数部分的长度
1 2 3
1 2 3
2 4 6
3 6 9
3 4 5
3 4 5
3 4 5
本数据集有六个变量,三个观测,观测 的数量决定样本的大小。 一个观测
2014-7-4 第一章 28
(四) 表达பைடு நூலகம்与操作符
① SAS 表达式: 指用各种操作符把SAS常量、变
量、SAS函数连接起来的算式,是SAS的一组指 令,提交运行后产生运算结果。 例:Y=a+b*x ; z=SIN(X)+COS(Y); ② SAS操作符 (1)算术操作符:+ - * / **(乘方) 如果算术运算符连接的表达式中有一个运算对象
2014-7-4 第一章 15
(3) SAS开发及呈现工具
主要由SAS/AF、SAS/EIS与SAS/GRAPH模块
提供便捷的面向对象的开发工具,该工具支持客户/
服务器的应用开发。
2014-7-4
第一章
16
(4)数据仓库设计
属于这一部分的主要模块有: SAS/ACCESS SAS/SHARE SAS/CONNECT
2014-7-4 第一章 11
2 编程能力强且简洁易学的非过程语言
SAS语言类似C语言,且综合了各种高级语言的 功能和灵活的格式,SAS语言的特点是用户不需要告 诉SAS “怎样作”,而只需告诉SAS “作什么”。
3 数据处理与分析结合在一起
SAS程序的结构由两个基本步骤任意组合而成 其中:DATA 步用于数据的加工; PROC 步用于分析数据和编写报告
2014-7-4
第一章
18
1、数值型常量:
指出现在SAS系统中的数字,其书写方式有3种。 ①日常书写方式; ②科学计数法; ③特殊标记;
特殊的数值常量,用 “ ● ”表示缺失值。
2014-7-4
第一章
19
2、字符型常量
SAS的字符型常量是由 1—32k个字符组成的字 符串。一般情况下用单引号括起。 如果在一个表示字符型常量的字符串中含有单引 号或特殊字符时要用双引号括起来。
第一章
2014-7-4
21
SAS系统通过输入格式和输出格式将日期值与 其他较易阅读的日期形式联系起来。 例如2007年2月14日可表示为: 格式① MMDDYYw. 021407 (MMDDYY6.) 02/14/07(MMDDYY8.) 格式② DDMMYYw. 140207 (DDMMYY6.) 14/02/07 (DDMMYY8.) 格式③DATEw. 14FEB07 (DATE7. DDMMMYY) 14FEB2007 (DATE9. DDMMMYYYY)
管理统计软件应用 <SAS篇>
•
郑州航院经贸学院 • 贺书平 zdhsp@163.com
• • • • • •
一、课程名称:管理统计软件应用 二、学时学分:40学时+20上机,学分2.5 三、先修课程:统计学 四、使用教材:自编 五、教学参考书 1.《SAS for Windows 实用基础教程》洪楠 、侯军,北京:清华大学出版社,2003年。 • 2.《统计分析系统SAS》何宁、吴黎兵,武汉 :武汉大学出版社,2005年8月第一版。 • 3.《SAS 统计分析》沈其君,北京:高等教育 出版社,2005年8月第一版。 • 4. 《统计分析方法——SAS实例精选》曲庆云 等,北京:清华大学出版社,2004年第一版。
• If you have a SAS certification, You will never lose your job.” • 美国SAS专业认证和SPSS数据分析师认 证都拥有较高国际声誉。 • 关于sas的论坛 • http://www.mysas.net/forum/ • http://www.pinggu.org • http://www.cos.name/index.php • http://www.sas.com/
2014-7-4 第一章 9
二 SAS系统的特点
SAS系统提供了四十多个模块,各个模块之间 既相互独立又相互交融补充,SAS系统的功能覆盖 了信息处理和信息系统开发的各个环节,用户根据 自身需要从其模块结构中灵活选择、适当组合相应 的功能模块用于:数据输入、数据检索、数据管理、 数据分析、图形显示、图形分析、报表生成、统计 计算、工程计算、质量控制、市场研究、调查分析、 建立预测模型、管理信息系统、行政信息系统等方 面工作。
2014-7-4 第一章 12
4 适用性强、应用面广
SAS系统能提供多种界面以满足从生产第一线到 管理部门各方面人员对数据信息的需求,可以访问 各种数据资源,包括各种数据库文件。
5 扩展性能强
SAS系统的模块式结构,可以让用户灵活的按自 己的需要去选择相应的功能模块,还可以利用SAS 系统的功能扩充工具扩充系统功能或利用编程语言 编写特殊的应用程序。
SAS/WA
这些开发工具使得用户可以在 SAS系统众多
产品的基础上快速开发出功能强大的应用系统 。
2014-7-4 第一章 17
四 SAS基本概念
(一)SAS常量:
指一个数值、一个括在引号中的字符串或是表 示某一固定值的特殊标记。
SAS系统有5种类型的常量。包括:
数值型常量 字符型常量 日期、时间、日期时间常量
SAS函数是一个子函数,每个SAS函数都有一
●
2014-7-4
第一章
26
SAS系统提供的几种常用输入输出格式:
w.d 标准的数字型格式
$w.
commaw.d datew. bestw.
标准的字符型格式
数字中加入逗号(如123,456.78) 日期格式 SAS选择最佳表示法
2014-7-4
第一章
27
变 (三)观测: 量 观 同一对象的一组变量值构成一个观测。 名 测 例:某数据集中的数据 编 号 OBS X1 X2 X3 Y1 Y2 Y3
2014-7-4
第一章
5
第一章 系 统 概 述
内容与要求
熟悉SAS系统的操作环境
掌握SAS系统的功能特点
掌握SAS系统的相关概念
2014-7-4
第一章
7
目 录
一 SAS 系 统 产 生 与 发 展 二 SAS 系 统 的 基 本 特 点 三 SAS 系 统 的 基 本 结 构 四 SAS 系 统 的 基 本 概 念 五 SAS 系 统 基 本 程 序 语 句
2014-7-4
第一章
8
一 SAS系统产生与发展
SAS系统:统计分析系统(Statistical Analysis System)
1966年由美国North Carolina州立大学研发, 1976成立美国SAS软件研究所,正式推出SAS系 统,较常用的版本为 SAS8.2,最新版本SAS 9X 系列。是目前数据处理和统计分析领域的国际标 准软件,广泛应用于政府、科研、教育、生产和 商业等领域。具有完备的数据访问、管理、分析、 呈现及应用开发等功能。已经成功应用于120多个 国家和地区的3万多个机构中。
2014-7-4 第一章 24
3、变量的长度 : 指变量的每个值所占的字节数, 系统默认的变量长度为: 数值型变量 - 8个字节 字符型变量 - 由第一次赋值的长度决定 4、特殊标记: 数据录入时在字符型变量后面加‘$‟符号。
5、变量标记: 是由 1 — 40 个字符组成的字符串, 该字符串是对变量的描述,在输出结果时代替 变 量名, 系统提供LABEL语句指定变量标记,默认 值是空格。
例1:如果 A = 3 B = 5
则 A><B = 3 A<>B = 5
2014-7-4 第一章 30
例2:如果 A =„ 1‟ B =„AND‟ C =„2 ‟ D = A ‖B ‖C;则 D =„ 1AND2 ‟ 注意:连接运算符不清理开头或结尾的空格
(5)运算次序
准则1:括号里的先算 准则2:同优先级的左边的先算 准则3:较高优先级的先算
2014-7-4
第一章
23
(二)SAS变量:
1、变量命名: SAS变量由1—8个字符成,以 英文字母开头,后面7个字符可以是英文字母、 数字和下划线但不能有空格和特殊字符。 例:NAME 字符型变量; AGE DA_123
2、变量类型: SAS变量有3种类型: 数值型变量;
日期、时间、日期时间型变量
这部分是SAS系统的灵魂,也是SAS与其它软件的本 质区别。属于这一部分的主要模块有: SAS/ETS:用于经济预测和时间序列分析。 SAS/IML:用于进行矩阵运算,解决系统没有现成 方法的工具。 SAS/INSIGHT:可视化的数据探索工具,是进行数 据挖掘的有力工具。 SAS/OR:用于运筹学和线性规划。 SAS/QC:提供了根据产品观测数据进行产品质量管理 的各种分析工具。 SAS/STAT:各种主要统计分析方法。