使用R进行数据分析和绘图
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自学和进一步了解R Self study and further understanding of R
• 《R语言初学者指南》
• 《R数据可视化手册》
自学和进一步了解R
• 百度各种R实践操作 • 购买相关书籍 • 去CRAN网站下载package的参考手册 • 以ggplot2 package 为例
下载和安装 Download and installation
• 官网链接 • R: https://www.r-project.org • R Studio: https://www.rstudio.com • Rstudio是一个友好的R操作平台。
了解RStudio操作界面Understanding RStudio operation interface
实践环节 Practice
• 数据分析(data analysis) • 计算均值和标准误 • 字母法标记差异显著性 • 计算相关系数,检验显著性并生成列表 • 主成分分析
实践环节 Practice
• 绘图(plot) • 二因子条形图 • 单因子条形图 • 箱线图 • 折线图 • 热图+聚类图 • 复合图
一般将外部文件转换成.txt文件或者.csv文件写入:
AB <- read.table(file = "~/Desktop/R/data1.txt", header = TRUE)
对象 函数名称 object function name
文件路径 file path
是否有表头 header?
参数 parameters
计算均值和标准误 Mean and standard error calculation
library(stringr)#加载package mean_se <- vector()#创建向量,用于存储数据 #自定义函数:计算标准误 func.se <- function(data){
n.t <- length(data)#data中有几个元素 n.na <- length(which(is.na(data)))#data中有几个缺失元素 n <- n.t - n.na#非缺失元素 sd <- sd(data,na.rm = TRUE)#计算标准差,忽略缺失值 se <- sd/sqrt(n)#标准误计算 return(se)#返回最终值 } #利用循环计算均值和标准误并使用±符号拼接 for (i in 1:nrow(AB)) { data.i <- as.numeric(AB[i,2:4])#将第2-4列的第i行转化为数值型 mean.i <- round(mean(data.i,na.rm = TRUE),3)#取均值,3位小数 se.i <- round(func.se(data.i),3)#计算标准误保留3位小数 mean_se[i] <- str_c(mean.i,se.i,sep = “±”) #将标准误用±拼接并赋值给mean_se }
常用基本操作符 = or <- 赋值 == 等于 != 不等于 <= 小于等于 >= 大于等于 + - * / 加减乘除 |或 &且 NA 缺失值
常见数据类型 num 数值型 int 整数型 str 字符型 factor 因子型 logi 逻辑型 vector 向量 matrix 矩阵 data.frame 数据框 list 列表 array 数组
查看数据 View data
AB 查看数据AB的全部内容 head(AB) 查看数据AB的前几行 tail(AB) 查看数据AB的后几行 str(AB) 查看数据AB的属性 ncol(AB) 查看数据AB有几行 nrow(AB) 查看数据AB有几列 AB$r1 查看数据AB的r1列($符号后面跟的是列名) AB[,1] 查看数据集AB的第一列 AB[,-1] 查看数据集除了第一列之外的列 colnames(AB) 查看数据AB的所有列名
常用高级操作 as.factor( ) 将数据类型转化为因子型 if(条件) {执行运算} if条件句 if(条件1){ } else if(不满足条件1满足条件2){ } for (i in 1:n) { } 循环语句 function (参数) {执行运算} 自定义函数
读取和导出数据 Load and export data
代码编辑区
变量显示区
RStudio
代码运行与结果展示区
操 Baidu Nhomakorabea 界 面
文件管理、绘图、package,帮助查询等
R中常见的概念 Common concepts in R
• 赋值和对象 • 数据类型 • 函数和参数 • 注释 • 脚本(script) • package
R常用基本函数 Common basic functions of R
用R语言进行数据分析和绘图 Data analysis and plot using R
Liu Ce
Content
1
基本R语言操作 Basic R language operation
2
R数据分析实例 Data analysis using R for practice
3
R绘图实例 Plot using R for practice
常用基本操作函数
mean( );sd( ) 均值;标准差 [ ] [ , ] 取子集 head( ); tail( ) 取数据集的前几行和最后几行 str( ) 查看数据类型 cbind( ); rbind( ) 按列合并;按行合并 length( ) 查看向量中元素的个数 install.packages( ) 下载相关的packages library( ) 加载对应的packages which( ) 找出满足条件的元素所在位置 table( ) 统计每种元素个数 write.csv( )导出数据内容
点进去下载
如何自学R package? • 使用? Function_name来快速获得函数参数讲解:
在帮助一栏中可以获得函数用法,函数参数,使用细节 以及实例演示等信息(与r package参考手册中的内容 基本相同)。
THANK YOU
AB2 <- read.csv(file = "~/Desktop/R/data1.csv",header = TRUE) write.csv <- (AB, file = “filename”, quote = FALSE)#导出文件
注意事项: 1. 数据文件中不能有空格; 2. 行与行或列与列之间的数据数量必须相等; 3. 区分大小写; 4. 文件路径最好写绝对路径; 5. 对象名内不能有空格,如有需要分隔用”_”代替。 6. 不同次运算最好赋值不同的变量名,避免之前的结果被覆盖。