R语言入门及绘图实例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 R 的函数 3.2 R 的对象 3.3 数据操作
3.1 R 的函数
R 是一种解释性语言,输入后可直接给出结果。 功能靠函数实现。 函数形式 : 函数 ( 输入数据,参数 = ) 如果没有指定,则参数的以默认值为准。 例如 : 平均值 mean( x, trim = 0 , na.rm = F ALS E, ...) 线性模型 lm( y~x, data = test)
2.5 程序包的帮助文件
vegan 程序包内部都有哪些函数?分别 有什么功能? 查询程序包内容最常用的方法: 1 菜单 帮助 >Html 帮助 2 查看 pdf 帮助文档
练习一
安装 R 并导入程序包
概要
1. R 语言的介绍 2. R 语言的程序包 3. 数据管理 4. R 语言绘图
3. 数据管理
3.1 R 的函数
每一个函数执行特定的功能,后面紧跟括号,例如: 平均值 mean() 求和 绘图 排序 sum() plot() sort()
除了基本的运算之外, R 的函数又分为”高级”和”低级”函数,高 级函数可调用低级函数 , 这里的”高级”函数习惯上称为泛型函数。 如 plot() 就是泛型函数,可以根据数据的类型,调用底层的函数,应 用相应的方法绘制相应的图形。这就是面向对象编程的思想。
菜单栏 快 捷按钮
光标 : 等待输 入
控 制台
R 登陆界面 (Windows 版 ) 路径: 开始 > 所有程序 >R 3.0.0
RGui 的 File 菜单
RGui 的 Edit 菜单
RGui 的 Packages 菜单
RGui 的 Help 菜单
ቤተ መጻሕፍቲ ባይዱ
概要
1. R 语言的介绍 2. R 语言的程序包 3. 数据管理 4. R 语言绘图
1.3 R 与其他统计软件比较
• SAS: 速度快,有大量统计分析模块,可扩展性稍差,昂贵。 • SPSS: 复杂的用户图形界面,简单易学,但编程十分困难。 • Splus: 运行 S 语言,具有复杂的界面,与 R 完全兼容,昂贵。 ……
1.4 R 语言的缺点
• 用户需要对命令熟悉 与代码打交道,需要记住常用命令。 • 占用内存 所有的数据处理在内存中进行,不适于处理超大规模 的数据。 • 运行速度稍慢 即时编译,约相当于 C 语言的 1/20 。 • 相比点击鼠标进行操作, R 仍能够大大提高效率。
1.5 R 语言的下载和安装
• R 软件首页 http://www.r-project.org/
1.5 R 语言的下载和安装
The Comprehensive R Archive Network 简称 CRAN ,由世界几十个镜像网站组成网络,提供下载安装程序和相 应软件包。各镜像更新频率一般为 1-2 天
推荐镜像: 中国的镜像 : 数学所 http://ftp.ctex.org/mirrors/CRAN/ 即时更新的 CRAN 源 http://cran.r-project.org/
1.5 R 语言的下载和安装
• Windows 下载和安装 R
–
CRAN: R Binaries > windows > base
3.2.2 对象的类 (class)
数 组 (arra y ) 数组是 k 维的数据表( k in 1:n , n 为正整数) 。 向量 (n = 1) 矩阵 (n = 2) 高维数组 (n >= 3) 数据 框 (dataframe) 是由一个或几个向量和(或)因子构成,它们必须是等长的,但 可以是不同的数据类型。 列表 (list) 列表可以包含任何类型的对象。 可以包含向量、矩阵、高维数组,也可以包含列表
3.2.2 对象的类 (class)
向 量 ( v ector) 一系列元素的组合。 如 c(1 , 2 , 3) ; c( " a "," a "," b "," b "," c " ) 因子 (factor) 因子是一个分类变量 c( " a "," a "," b "," b "," c " ) 矩阵 (matri x ) 二维的数据表,是数组的一个特例 x < - 1:12 ; dim( x ) < - c(3 , 4) [,1] [,2] [,3] [,4] [1,] [2,] [3,] 1 2 3 4 5 6 7 8 9 10 11 12
2.4 程序包的使用
程序包的中函数,都要先导入,再使用,因此导入程序 包是第一步。 在控制台中输入如下命令: librar y ( v e g an) librar y (ape) 程序包内的函数的用法与 R 内置的基本函数用法一样。 librar y ( v e g an) This is v e g an 2.0- 7
3.1.2 R 函数调用及其选项
箱线图修饰前后 ( 左:默认值,右:修改属性后 ) 函数的调用方法 , 函数名 () 如 plot() , lm() , 并将对象放入括号中。
3.1.2 R 函数调用及其选项
箱线图绘制函数的调用 bo x plot(da y~ t y pe , data = bac , col =" red ", x lab ="V ir us ", y lab =" da y s " ) da y~ t y pe ,以 t y pe 为横轴, da y 为纵轴绘制箱线图。 data = bac col = “red” y lab = “da y s” 数据来源 bac 箱线图为红色 纵轴名称为 da y s
3.2.1 元素的类型
对象是由各元素组成的。每个元素,都有自己的数据类 型 数值型 Numeric 逻辑型 Lo g ical 因子型 F actor 复数型 C omple x 如 100 , 0 , -4.33 5 如 TRU E, F ALS E 表示不同类别 如: 2 + 3i
字符型 C haracter 如 “ C hina”
3.1.1 R 有哪些函数 ?
查询 的方法: Help>Ht ml help>packages log() log10() exp() sin() cos() tan() asin() acos()
binom.test() fisher.test() chisq.test() glm(y ~ x1+x2+x3, binomi al) friedman.test() mean() sd() var() ….
2.1 常用 R 程序包 (III)
picante raster seqinr sp spatstat splancs stats SDMTools vegan 群落系统发育多样性分析 栅格数据分析与处理 DNA 序列分析 空间数据处理 空间点格局分析,模型拟合与检验 空间与时空点格局分析 R 统计学包 物种分布模型工具 植物与植物群落的排序,生物多样性计算
2.2 程序包的分类介绍
三种平台上的 程序包
vegan 包页面
2.3 程序包的安装
在 CRAN 提供了每个包的源代码和编译好的程序包 以 vegan 包为例, CRAN 提供了: Package source: vegan_2.0-7.tar.gz MacOS X binary: vegan_2.0-7.tgz Windows binary: vegan_2.0-7.zip Reference manual: vegan.pdf Window 下程序包为 zip 文件,安装时不要解压缩。 Mac 下程序包为 tgz 文件,安装时不要解压缩。
2.3 程序包的安装
1 用函数 install.packa g es() , 如果已经连接到互联网,在括号中输入要安装的程序包名称, 选择镜像后,程序将自动下载并安装程序包。 例如: 要安装 v e g an 包 , 在控制台中输入 install.packa g es( "v e g an " ) 2 安装本地 z ip 包 路径: Packa g es > install packa g es from local files 选择本地磁盘上存储 z ip 包的文件夹。
2.1 常用 R 程序包 (I)
ade4 adephylo ape apTreeshape boot cluster ecodist FD geiger 利用欧几里得方法进行生态学数据分析 系统进化数据挖掘与比较方法 系统发育与进化分析 进化树分析 Bootstrap 检验 聚类分析 生态学数据相异性分析 功能多样性分析 物种形成速率与进化分析
2 R 语言的程序包
程序包是什么? R 程序包是多个函数的集合,具有详细的说明和示例。 Window 下的 R 程序包是经过编译的 zip 包。 每个程序包包含 R 函数、数据、帮助文件、描述文件等。 为什么要 安装 程序包? R 程序包是 R 功能扩展,特定的分析功能,需要用相应的程序包实现。 例如:系统发育分析,常用到 ape 程序包,群落生态学 vegan 包等。
R 语言入门及绘图实例
罗奇斌
概要
1. R 语言的介绍 2. R 语言的程序包 3. 数据管理 4. R 语言绘图
1. 1 什么是 R 语言?
• R 语言是主要用于统计分析、绘图的语言和操作环境。
1.1 R 语言的历史
R 是统计领域广泛使用的诞生于 1980 年左右的 S 语言 的一个分支。可以认为 R 是 S 语言的一种实现。 而 S 语言是由 AT&T 贝尔实验室开发的一种用来进行数 据探索、统计分析和作图的解释型语言。最初 S 语言的实现 版本主要是 S-PLUS 。 后来 Auckland 大学的 Robert Gentleman 和 Ross Ihak a 及其他志愿人员开发了一个 R 系统。 S-PLUS 的使用手册,只要稍加修改就可作为 R 的使用 手册。所以有人说: R ,是 S-PLUS 的一个“克隆”。 但是请不要忘了: R 是免费的 (R is free) 。
1.2 为什么选择 R 语言?
• 丰富的资源 涵盖了多种行业数据分析中几乎所有的方法。 • 良好的扩展性 十分方便得编写函数和程序包,跨平台,可以胜任复杂的数据分 析、绘制精美的图形。 • 完备的帮助系统 每个函数都有统一格式的帮助,运行实例。 • GNU 软件 免费、软件本身及程序包的源代码公开。
下载完成后,双击 R-3.0.1-win.exe 开始安装。 一直点击下一步,各选项默认,语言建议选英文。
1.5 R 语言的下载和安装
• Mac 下载和安装 R
–
CRAN: R Binaries > macosx
下载完成后,双击 R-3.0.1.pkg 开始安装。 一直点击下一步,各选项默认,语言建议选英文。
2.1 常用 R 程序包 (II)
Graphics lattice maptools mefa mgcv mvpart nlme ouch pgirmess phangorn 绘图 栅格图 空间对象的读取和处理 生态学和生物地理学多元数据处理 广义加性模型相关 多变量分解 线性及非线性混合效应模型 系统发育比较 生态学数据分析 系统发育分析
3.2.3 运算符
数学运算 运算后给出数值结果 +, - , * , /, ^ ( 幂 ) 比较运算 运算后给出判别结果 (TRU E F ALS E ) >, < , < =, >=, ==, ! = 逻辑运算 与、或、非 ! , & , && , | , ||
3.2.4 数据表的行与列
x lab = “ V irus” 横轴名称为 V irus
3.2 R 的对象
R 处理的所有数据、变量、函数和结果都以对象的形式保存。 1. 区 分大 小 写 , 注意 C hina 和 china 的不同。 2. 不能用数字作为变量,对象也不能用数字开头,但是数字可以放在中 间或结尾,如 2result 与 result2 ,后者是合法的。 3. 建议不要用过短的名称。可以用” .” 作为间隔,例如 ano v a.result 1。 4. 不要使用保留名: NA , NaN , pi , L E TT E RS , letters , month.abb , month.name
3.1 R 的函数
R 是一种解释性语言,输入后可直接给出结果。 功能靠函数实现。 函数形式 : 函数 ( 输入数据,参数 = ) 如果没有指定,则参数的以默认值为准。 例如 : 平均值 mean( x, trim = 0 , na.rm = F ALS E, ...) 线性模型 lm( y~x, data = test)
2.5 程序包的帮助文件
vegan 程序包内部都有哪些函数?分别 有什么功能? 查询程序包内容最常用的方法: 1 菜单 帮助 >Html 帮助 2 查看 pdf 帮助文档
练习一
安装 R 并导入程序包
概要
1. R 语言的介绍 2. R 语言的程序包 3. 数据管理 4. R 语言绘图
3. 数据管理
3.1 R 的函数
每一个函数执行特定的功能,后面紧跟括号,例如: 平均值 mean() 求和 绘图 排序 sum() plot() sort()
除了基本的运算之外, R 的函数又分为”高级”和”低级”函数,高 级函数可调用低级函数 , 这里的”高级”函数习惯上称为泛型函数。 如 plot() 就是泛型函数,可以根据数据的类型,调用底层的函数,应 用相应的方法绘制相应的图形。这就是面向对象编程的思想。
菜单栏 快 捷按钮
光标 : 等待输 入
控 制台
R 登陆界面 (Windows 版 ) 路径: 开始 > 所有程序 >R 3.0.0
RGui 的 File 菜单
RGui 的 Edit 菜单
RGui 的 Packages 菜单
RGui 的 Help 菜单
ቤተ መጻሕፍቲ ባይዱ
概要
1. R 语言的介绍 2. R 语言的程序包 3. 数据管理 4. R 语言绘图
1.3 R 与其他统计软件比较
• SAS: 速度快,有大量统计分析模块,可扩展性稍差,昂贵。 • SPSS: 复杂的用户图形界面,简单易学,但编程十分困难。 • Splus: 运行 S 语言,具有复杂的界面,与 R 完全兼容,昂贵。 ……
1.4 R 语言的缺点
• 用户需要对命令熟悉 与代码打交道,需要记住常用命令。 • 占用内存 所有的数据处理在内存中进行,不适于处理超大规模 的数据。 • 运行速度稍慢 即时编译,约相当于 C 语言的 1/20 。 • 相比点击鼠标进行操作, R 仍能够大大提高效率。
1.5 R 语言的下载和安装
• R 软件首页 http://www.r-project.org/
1.5 R 语言的下载和安装
The Comprehensive R Archive Network 简称 CRAN ,由世界几十个镜像网站组成网络,提供下载安装程序和相 应软件包。各镜像更新频率一般为 1-2 天
推荐镜像: 中国的镜像 : 数学所 http://ftp.ctex.org/mirrors/CRAN/ 即时更新的 CRAN 源 http://cran.r-project.org/
1.5 R 语言的下载和安装
• Windows 下载和安装 R
–
CRAN: R Binaries > windows > base
3.2.2 对象的类 (class)
数 组 (arra y ) 数组是 k 维的数据表( k in 1:n , n 为正整数) 。 向量 (n = 1) 矩阵 (n = 2) 高维数组 (n >= 3) 数据 框 (dataframe) 是由一个或几个向量和(或)因子构成,它们必须是等长的,但 可以是不同的数据类型。 列表 (list) 列表可以包含任何类型的对象。 可以包含向量、矩阵、高维数组,也可以包含列表
3.2.2 对象的类 (class)
向 量 ( v ector) 一系列元素的组合。 如 c(1 , 2 , 3) ; c( " a "," a "," b "," b "," c " ) 因子 (factor) 因子是一个分类变量 c( " a "," a "," b "," b "," c " ) 矩阵 (matri x ) 二维的数据表,是数组的一个特例 x < - 1:12 ; dim( x ) < - c(3 , 4) [,1] [,2] [,3] [,4] [1,] [2,] [3,] 1 2 3 4 5 6 7 8 9 10 11 12
2.4 程序包的使用
程序包的中函数,都要先导入,再使用,因此导入程序 包是第一步。 在控制台中输入如下命令: librar y ( v e g an) librar y (ape) 程序包内的函数的用法与 R 内置的基本函数用法一样。 librar y ( v e g an) This is v e g an 2.0- 7
3.1.2 R 函数调用及其选项
箱线图修饰前后 ( 左:默认值,右:修改属性后 ) 函数的调用方法 , 函数名 () 如 plot() , lm() , 并将对象放入括号中。
3.1.2 R 函数调用及其选项
箱线图绘制函数的调用 bo x plot(da y~ t y pe , data = bac , col =" red ", x lab ="V ir us ", y lab =" da y s " ) da y~ t y pe ,以 t y pe 为横轴, da y 为纵轴绘制箱线图。 data = bac col = “red” y lab = “da y s” 数据来源 bac 箱线图为红色 纵轴名称为 da y s
3.2.1 元素的类型
对象是由各元素组成的。每个元素,都有自己的数据类 型 数值型 Numeric 逻辑型 Lo g ical 因子型 F actor 复数型 C omple x 如 100 , 0 , -4.33 5 如 TRU E, F ALS E 表示不同类别 如: 2 + 3i
字符型 C haracter 如 “ C hina”
3.1.1 R 有哪些函数 ?
查询 的方法: Help>Ht ml help>packages log() log10() exp() sin() cos() tan() asin() acos()
binom.test() fisher.test() chisq.test() glm(y ~ x1+x2+x3, binomi al) friedman.test() mean() sd() var() ….
2.1 常用 R 程序包 (III)
picante raster seqinr sp spatstat splancs stats SDMTools vegan 群落系统发育多样性分析 栅格数据分析与处理 DNA 序列分析 空间数据处理 空间点格局分析,模型拟合与检验 空间与时空点格局分析 R 统计学包 物种分布模型工具 植物与植物群落的排序,生物多样性计算
2.2 程序包的分类介绍
三种平台上的 程序包
vegan 包页面
2.3 程序包的安装
在 CRAN 提供了每个包的源代码和编译好的程序包 以 vegan 包为例, CRAN 提供了: Package source: vegan_2.0-7.tar.gz MacOS X binary: vegan_2.0-7.tgz Windows binary: vegan_2.0-7.zip Reference manual: vegan.pdf Window 下程序包为 zip 文件,安装时不要解压缩。 Mac 下程序包为 tgz 文件,安装时不要解压缩。
2.3 程序包的安装
1 用函数 install.packa g es() , 如果已经连接到互联网,在括号中输入要安装的程序包名称, 选择镜像后,程序将自动下载并安装程序包。 例如: 要安装 v e g an 包 , 在控制台中输入 install.packa g es( "v e g an " ) 2 安装本地 z ip 包 路径: Packa g es > install packa g es from local files 选择本地磁盘上存储 z ip 包的文件夹。
2.1 常用 R 程序包 (I)
ade4 adephylo ape apTreeshape boot cluster ecodist FD geiger 利用欧几里得方法进行生态学数据分析 系统进化数据挖掘与比较方法 系统发育与进化分析 进化树分析 Bootstrap 检验 聚类分析 生态学数据相异性分析 功能多样性分析 物种形成速率与进化分析
2 R 语言的程序包
程序包是什么? R 程序包是多个函数的集合,具有详细的说明和示例。 Window 下的 R 程序包是经过编译的 zip 包。 每个程序包包含 R 函数、数据、帮助文件、描述文件等。 为什么要 安装 程序包? R 程序包是 R 功能扩展,特定的分析功能,需要用相应的程序包实现。 例如:系统发育分析,常用到 ape 程序包,群落生态学 vegan 包等。
R 语言入门及绘图实例
罗奇斌
概要
1. R 语言的介绍 2. R 语言的程序包 3. 数据管理 4. R 语言绘图
1. 1 什么是 R 语言?
• R 语言是主要用于统计分析、绘图的语言和操作环境。
1.1 R 语言的历史
R 是统计领域广泛使用的诞生于 1980 年左右的 S 语言 的一个分支。可以认为 R 是 S 语言的一种实现。 而 S 语言是由 AT&T 贝尔实验室开发的一种用来进行数 据探索、统计分析和作图的解释型语言。最初 S 语言的实现 版本主要是 S-PLUS 。 后来 Auckland 大学的 Robert Gentleman 和 Ross Ihak a 及其他志愿人员开发了一个 R 系统。 S-PLUS 的使用手册,只要稍加修改就可作为 R 的使用 手册。所以有人说: R ,是 S-PLUS 的一个“克隆”。 但是请不要忘了: R 是免费的 (R is free) 。
1.2 为什么选择 R 语言?
• 丰富的资源 涵盖了多种行业数据分析中几乎所有的方法。 • 良好的扩展性 十分方便得编写函数和程序包,跨平台,可以胜任复杂的数据分 析、绘制精美的图形。 • 完备的帮助系统 每个函数都有统一格式的帮助,运行实例。 • GNU 软件 免费、软件本身及程序包的源代码公开。
下载完成后,双击 R-3.0.1-win.exe 开始安装。 一直点击下一步,各选项默认,语言建议选英文。
1.5 R 语言的下载和安装
• Mac 下载和安装 R
–
CRAN: R Binaries > macosx
下载完成后,双击 R-3.0.1.pkg 开始安装。 一直点击下一步,各选项默认,语言建议选英文。
2.1 常用 R 程序包 (II)
Graphics lattice maptools mefa mgcv mvpart nlme ouch pgirmess phangorn 绘图 栅格图 空间对象的读取和处理 生态学和生物地理学多元数据处理 广义加性模型相关 多变量分解 线性及非线性混合效应模型 系统发育比较 生态学数据分析 系统发育分析
3.2.3 运算符
数学运算 运算后给出数值结果 +, - , * , /, ^ ( 幂 ) 比较运算 运算后给出判别结果 (TRU E F ALS E ) >, < , < =, >=, ==, ! = 逻辑运算 与、或、非 ! , & , && , | , ||
3.2.4 数据表的行与列
x lab = “ V irus” 横轴名称为 V irus
3.2 R 的对象
R 处理的所有数据、变量、函数和结果都以对象的形式保存。 1. 区 分大 小 写 , 注意 C hina 和 china 的不同。 2. 不能用数字作为变量,对象也不能用数字开头,但是数字可以放在中 间或结尾,如 2result 与 result2 ,后者是合法的。 3. 建议不要用过短的名称。可以用” .” 作为间隔,例如 ano v a.result 1。 4. 不要使用保留名: NA , NaN , pi , L E TT E RS , letters , month.abb , month.name