张亨整理 四个常用统计软件SAS,STATA,SPSS,R语言分析比较及其他统计软件概述题库
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
四个常用统计软件SAS,STATA,SPSS,R语言分析比较及其他统计软件概述
一、SAS,STATA,SPSS,R语言简介
(一)SAS简介
SAS(全称Statistical Analysis System,简称SAS,翻译成汉语是统计分析系统)是全球最大的软件公司之一,是由美国NORTH CAROLINA州立大学1966年开发的统计分析软件。1976年SAS软件研究所(SAS INSTITUTE INC)成立,开始进行SAS系统的维护、开发、销售和培训工作。期间经历了许多版本,并经过多年来的完善和发展,SAS系统在国际上已被誉为统计分析的标准软件,在各个领域得到广泛应用。
其网址是:/
(二)STSTA简介
STATA统计软件由美国计算机资源中心(Computer Resource Center)1985年研制。STATA 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。
新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。STATA提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。
除此之外,STATA软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也可以透过STATA Journal 获得许许多多的相关讯息以及书籍介绍等。另外一个获取庞大资源的管道就是STATAlist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。
其网址是:/
(三)SPSS简介
SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(Statistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS 的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。
1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。
SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull 和Dale H. Bent于1968年研究开发成功,同时成立了SPSS公司,并于1975年成立法人组织、在芝加哥组建了SPSS总部。
2009年7月28日,IBM公司宣布将用12亿美元现金收购统计分析软件提供商SPSS公司。如今SPSS已出至版本22.0,而且更名为IBM SPSS。迄今,SPSS 公司已有40余年的成长历史。
其网址是:/
(四)R语言简介
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由A T&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发了一个R系统。由“R开发核心团队”负责开发。R是基于S 语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。
其网址是:
二、使用范围
扩展性SAS语言具有
强大的对数据
处理的能力,
但其不具有对
新算法的集成
功能,因此算
法比较固定,
需随着SAS软
件的版本更新
才能更新算法
STATA的编程
功能也很强
大,每期的
STATA journal
都有最新的模
型程序更新
不具备扩展
性,无法编写
新算法,只能
使用软件提供
的固定功能
R的可扩展功
能很强,可以
任意实现自己
的算法,甚至
都可以编游戏
了,不过这方
面并不是R的
长处,R的主要
应用在统计编
程
多维数据
的图形描
述SAS的图形功能很强
STATA 的作图模块,主要
提供如下八种基本图形的
制作: 直方图
(histogram) ,条形图
(bar), 百分条图
(oneway) ,百分圆图
(pie) ,散点图
(twoway) ,散点图矩阵
(matrix) ,星形图
(star) ,分位数图。这些
图形的巧妙应用,可以满
足绝大多数用户的统计作
图要求。在有些非绘图命
令中,也提供了专门绘制
某种图形的功能,如在生
存分析中,提供了绘制生
存曲线图,回归分析中提
供了残差图等。
利用SPSS可以生成数
十种基本图和交互图。
交互图可有不同风格的
二维、三维图。交互图
包括条形交互图、点形
交互图、线形交互图、
带形交互图、饼形交互
图、箱形交互图、误差
条形交互图、直方交互
图和散点交互图等。图
形生成以后,可以进行
编辑。
R的强项是绘图功能,制
图具有印刷的素质,也可
加入数学符号。
分析方法SAS是确切地说是一套
大型集成应用软件系
统,具有完备的数据存
取、数据管理、数据分
析和数据展现功能。SAS
系统中提供的主要分析
功能包括统计分析、经
济计量分析、时间序列
分析、决策分析、财务
分析和全面质量管理工
具等等,功能相当强大。
STATA 的统计功能很强,
除了传统的统计分析方法
外,还收集了近20 年发
展起来的新方法,如Cox
比例风险回归,指数与
Weibull 回归,多类结果与
有序结果的logistic 回
归,Poisson 回归,负二
项回归及广义负二项回
归,随机效应模型等。具
体说,STATA 具有如下
统计分析能力:数值变量
资料的一般分析,分类资
料的一般分析,等级资料
的一般分析,相关与回归
分析,其他方法如质量控
制,整群抽样的设计效率,
诊断试验评价,kappa
等。
提供很多常用统计方
法,但是分析功能仍然
有所欠缺
R是一套完整的数据处
理、计算和制图软件系
统。其功能包括:数据存
储和处理系统;数组运算
工具(其向量、矩阵运算
方面功能尤其强大);完
整连贯的统计分析工具;
优秀的统计制图功能;简
便而强大的编程语言:可
操纵数据的输入和输出,
可实现分支、循环,用户
可自定义功能。
编程灵活
性对于数据预处理、操作
方面具有很强大的灵活
性,但是对于统计分析
功能灵活性不强,只能
通过设置不同参数来改
变输出结果。
STATA 是一个统计分析软
件,但它也具有很强的程
序语言功能
几乎是固定的用法,不
具备灵活性
强大的编程语言。R的功
能能够通过由用户撰写
的套件增强。增加的功能
有特殊的统计技术、绘图
功能,以及编程界面和数
据输出/输入功能。