R语言常用函数

合集下载

r语言 相关系数

r语言 相关系数

r语言相关系数R语言是一门功能强大的编程语言,可以用于进行统计分析和数学计算。

它使用的编程语言适用于各种实际问题的解决,特别是机器学习和大数据分析。

其中一个重要的统计概念是“相关系数”,它用于描述两个变量之间的关联程度。

R语言有一系列函数可以用来计算相关系数,本文将介绍R语言中的六个常用函数,分别是:cor()、cor.test()、cov()、cov.test()、MulCorTest()和Varsim()。

首先介绍cor()函数,它用于计算两个变量之间的Pearson相关系数或Spearman相关系数。

它的语法如下:cor(x,y,method =pearson”),其中x和y是你要计算的变量,method表示计算类型,可以是“pearson”或“Spearman”,如果没有指定method,则默认使用Pearson。

通过计算相关系数,可以看出两个变量之间是正相关还是负相关,如果系数值越接近1,则说明两个变量之间越强烈的正相关,反之系数值越接近-1则说明两个变量之间的负相关越强烈。

接下来介绍cor.test()函数,与cor()相比,cor.test()函数不仅可以计算相关系数,还可以计算相关系数的置信区间与显著性水平,进而评估两个变量之间的相关关系是否显著。

它的语法如下:cor.test(x,y),其中x和y是要计算相关性的变量,只能计算Pearson 系数和Spearman系数,不能计算其他类型的系数。

接下来介绍cov()函数,它可以用来计算两个变量之间的协方差,它用来度量连续变量之间的线性关系。

它的语法如下:cov(x,y),其中x和y是你要计算的变量。

结果将返回一个数值,通过比较它与0的大小,可以知道两个变量之间是正相关还是负相关,如果比0大,则说明两个变量之间存在正相关关系,反之则说明有负相关关系。

接下来介绍cov.test()函数,它用法与cor.test()的类似,它不仅可以计算协方差,还可以计算协方差的置信区间与显著性水平,从而评估变量之间的协方差是否显著。

R语言常用函数整理

R语言常用函数整理

求时间序列描述统计量(包括均值、标准差、偏度、峰度等) FinTS 检验时间序列均值是否为零(实际上可作单、双样本检验) stats ARMA 相关函数 转换为时间序列格式 将多个时间序列联合起来 将时间相同的列合并,区别不同时间的行 stats stats stats
R 语言常用函数整理 window ts.plot diff.ts as.Date acf pacf Box.test ar arima ARIMA arma predict tsdiag adf.test urdfTest kpss.test pp.test Arima.sim FitAR Auto.arima 提取符合某个时间段的数据 作时序图 时序差分 把非时间向量转为时间向量 求自相关函数和作偏自相关函数图 求偏自相关函数和作偏自相关函数图 作序列自相关 B-P 和 L-B 检验
R 语言常用函数整理
方匡南
R 语言常用函数整理
提示:碰到不懂的函数可以输入“?函数名” ,前提条件是需要先安装包,使用命令 “ istall.packages(“ 包名” ) 或菜单安装。再载入包,除了几个基本包外,其他的包需要用 “library(包名)”载入。
常用计量函数
函数 lm summary() glm maxLik predict coef cor resid fitted scale lm.ridge plsr pcr bptest bartlett.test dwtest AIC var.test vif apropos(“test”) confint() optimize optim constrOptim nls maxLik logLik expand.grid nls2 selfstart 用途 线性回归及放宽条件 做线性回归 返回回顾系数 t、F 检验等 广义线性回归(probit logit passion 回归以及 WLS 估计等) 极大似然估计(线性和非线性) 求回归预测(对绝对部分模型都适用) 求回归结果系数 求变量间 person 相关系数和 spearman 秩相关系数 返回回归残差 返回拟合值 对数据进行标准化 岭回归 偏最小二乘法 主成分回归 Breusch-Pagan 异方差检验 做变量间方差齐性检验 做 DW 检验 返回模型的 AIC 值 非参数方差齐性检验 求方差膨胀因子 返回统计常用检验 计算回归模型参数的置信区间 非线性优化和非线性回归 做一元非线性优化 做多元非线性优化 约束下的非线性优化 非线性(加权)最小二乘估计 非线性极大似然估计 求回归模型对数似然值 求格点 类似于 nls,但增加了 brute-force 算法 生成自动初始值函数 stats stats stats stats maxLik stats stats nls2 stats stats stats stats maxLik stats stats stats stats stats stats MASS pls pls lmtest stats lmtest stats stats car stats stats 所在包

r语言list函数

r语言list函数

r语言list函数
R语言是一种功能强大的编程语言,它拥有大量的函数和软件包,为数据处理、分析和可视化提供更多的灵活性和可靠性。

List函数是R语言中常用的函数之一,主要用于创建数据列表。

本文将介绍R 语言List函数的定义、语法以及具体用法。

一、R语言List函数
List函数是R语言中通用的函数,它主要用于创建数据列表。

List函数支持以下参数:a,b,c,d,e,f,g,h。

list(a,b):以a和b作为参数,创建一个包含两个元素的列表。

list(c(a,b)):将向量c(a,b)作为参数,创建一个包含该向量中所有元素的列表。

list(d,e,f,g,h):以d、e、f、g、h作为参数,创建一个包含这五个元素的列表。

二、实例说明
下面我们就以实例来说明R语言List函数的用法。

1.设定变量
a<-c(1,2,3)
b<-c(4,5)
2.使用List函数
list(a,b)
3.输出结果
[[1]]
[1] 1 2 3
[[2]]
[1] 4 5
分析:上面的代码中,我们利用list函数及其参数a、b,创建一个包含两个元素的列表,它们分别为向量a和向量b。

三、总结
R语言List函数可以为程序提供更多的灵活性和可靠性,在数据的处理、分析和可视化中,它可以起到非常重要的作用。

List函数可以通过list(a,b),或者list(c(a,b))等参数来创建数据列表,它们可以帮助我们更加准确、快速地处理数据。

R语言常用函数汇总

R语言常用函数汇总

R语言常用函数汇总R语言是一种强大的统计计算语言,拥有丰富的函数和包。

下面是常用的R语言函数的汇总(按照字母顺序排列)。

1. abs(x): 返回x的绝对值。

2. append(x, values): 向向量x中追加值values。

3. apply(X, MARGIN, FUN): 在矩阵X的指定维度上应用函数FUN。

4. args(function): 返回指定函数的参数列表。

5. as.character(x): 将对象x转化为字符型。

6. as.data.frame(x): 将对象x转化为数据框。

7. as.factor(x): 将对象x转化为因子型。

8. as.matrix(x): 将对象x转化为矩阵。

9. as.numeric(x): 将对象x转化为数值型。

10. barplot(height): 绘制条形图。

11.c(x,...):将x与其他对象合并为一个向量。

12. colnames(x): 返回矩阵或数据框x的列名。

13. cor(x, y): 计算x和y的相关系数。

14. cut(x, breaks): 将向量x划分为几个离散区间。

15. plot(x, y): 绘制散点图。

16. density(x): 生成x的密度图。

17. diff(x): 计算向量x的差值。

18. dim(x): 返回矩阵或数据框x的维度。

19. mean(x): 计算向量x的平均值。

20. median(x): 计算向量x的中位数。

21. min(x): 返回向量x的最小值。

22. max(x): 返回向量x的最大值。

23. names(x): 返回对象x的变量名。

24. paste(x, ...): 将x和其他对象合并为一个字符型。

25. print(x): 打印对象x。

26. range(x): 返回向量x的范围。

27. read.csv(file): 从CSV文件中读取数据。

28. rownames(x): 返回矩阵或数据框x的行名。

R语言常用函数

R语言常用函数

R语言常用函数基本一、数据管理vector:向量numeric:数值型向量logical:逻辑型向量character;字符型向量list:列表data.frame:数据框c:连接为向量或列表length:求长度subset:求子集seq,from:to,sequence:等差序列rep:重复NA:缺失值NULL:空对象sort,order,unique,rev:排序unlist:展平列表attr,attributes:对象属性mode,typeof:对象存储模式与类型names:对象的名字属性二、字符串处理character:字符型向量nchar:字符数substr:取子串format,formatC:把对象用格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch:字符串匹配grep,sub,gsub:模式匹配与替换三、复数complex,Re,Im,Mod,Arg,Conj:复数函数四、因子factor:因子codes:因子的编码levels:因子的各水平的名字nlevels:因子的水平个数cut:把数值型对象分区间转换为因子table:交叉频数表split:按因子分组aggregate:计算各数据子集的概括统计量tapply:对“不规则”数组应用函数数学一、计算+, -, *, /, ^, %%, %/%:四则运算ceiling,floor,round,signif,trunc,zapsmall:舍入max,min,pmax,pmin:最大最小值range:最大值和最小值sum,prod:向量元素和,积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序approx 和approx fun:插值diff:差分sign:符号函数二、数学函数abs,sqrt:绝对值,平方根log, exp, log10, log2:对数与指数函数sin,cos,tan,asin,acos,atan,atan2:三角函数sinh,cosh,tanh,asinh,acosh,atanh:双曲函数beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:与贝塔函数、伽玛函数、组合数有关的特殊函数fft,mvfft,convolve:富利叶变换及卷积polyroot:多项式求根poly:正交多项式spline,splinefun:样条差值besselI,besselK,besselJ,besselY,gammaCody:Bessel函数deriv:简单表达式的符号微分或算法微分三、数组array:建立数组matrix:生成矩阵data.matrix:把数据框转换为数值型矩阵lower.tri:矩阵的下三角部分mat.or.vec:生成矩阵或向量t:矩阵转置cbind:把列合并为矩阵rbind:把行合并为矩阵diag:矩阵对角元素向量或生成对角矩阵aperm:数组转置nrow, ncol:计算数组的行数和列数dim:对象的维向量dimnames:对象的维名row/colnames:行名或列名%*%:矩阵乘法crossprod:矩阵交叉乘积(内积)outer:数组外积kronecker:数组的Kronecker积apply:对数组的某些维应用函数tapply:对“不规则”数组应用函数sweep:计算数组的概括统计量aggregate:计算数据子集的概括统计量scale:矩阵标准化matplot:对矩阵各列绘图cor:相关阵或协差阵Contrast:对照矩阵row:矩阵的行下标集col:求列下标集四、线性代数solve:解线性方程组或求逆eigen:矩阵的特征值分解svd:矩阵的奇异值分解backsolve:解上三角或下三角方程组chol:Choleski分解qr:矩阵的QR分解chol2inv:由Choleski 分解求逆五、逻辑运算,=,==,!=:比较运算符!,&,&&,|,||,xor():逻辑运算符logical:生成逻辑向量all,any:逻辑向量都为真或存在真ifelse():二者择一match,%in%:查找unique:找出互不相同的元素which:找到真值下标集合duplicated:找到重复元素六、优化及求根optimize,uniroot,polyroot:一维优化与求根程序设计一、控制结构if,else,ifelse,switch:分支for,while,repeat,break,next:循环apply,lapply,sapply,tapply,sweep:替代循环的函数。

R语言时间序列有关各种函数总结

R语言时间序列有关各种函数总结

R语言时间序列有关各种函数总结R语言是一种强大的统计分析和数据可视化工具,提供了许多时间序列分析的函数和方法。

下面是一些重要的时间序列分析函数的总结:1. ts(函数:用于创建时间序列对象。

可以指定时间序列的起始时间、结束时间、时间间隔等。

例如,创建从1990年1月到1999年12月的月度时间序列对象可以使用以下代码:```Rts_data <- ts(data, start=c(1990, 1), end=c(1999, 12), frequency=12)``````R```3. stl(函数:基于季节性-趋势-随机性分解的局部回归方法,用于进行季节调整。

该函数可以根据时间序列的特性自动选择适当的分解模型。

以下是使用stl(函数进行季节调整的示例:```Rseasonally_adjusted <- stl(ts_data, s.window="periodic")```4. forecast(函数:用于时间序列的预测。

可以根据历史数据拟合不同的模型,例如ARIMA模型、指数平滑模型等,并生成未来一段时间的预测结果。

以下是使用forecast(函数生成未来12个月的预测结果的示例:```Rforecast_result <- forecast(ts_data, h=12)```5. autocorrelation(函数:用于计算时间序列的自相关系数。

自相关系数可以帮助我们了解时间序列的固定模式和周期性。

以下是计算时间序列的自相关系数的示例:```Racf_result <- autocorrelation(ts_data)```6. arima(函数:用于建立自回归移动平均模型(ARIMA)来拟合时间序列。

ARIMA模型是一种常用的时间序列预测模型,可以预测时间序列的未来值。

以下是使用arima(函数拟合ARIMA模型的示例:```Rarima_model <- arima(ts_data, order=c(p, d, q))```7. ets(函数:用于指数平滑时间序列模型的拟合和预测。

R语言中的各种分布函数总结

R语言中的各种分布函数总结

R语言中的各种分布函数总结R语言中有许多常用的概率分布函数。

每个概率分布函数对应着一种特定的随机变量,如正态分布、二项分布、泊松分布等。

本文将总结R语言中常用的概率分布函数。

1. 正态分布:正态分布是自然界中非常常见的一种分布。

在R语言中,正态分布相关的函数有`dnorm(`(概率密度函数)、`pnorm(`(累积分布函数)、`qnorm(`(分位数函数)和`rnorm(`(随机样本生成函数)。

2. 二项分布:二项分布是一个离散型的概率分布,描述了在给定样本数n和成功概率p的条件下,成功事件发生k次的概率。

R语言中,二项分布相关函数有`dbinom(`(概率质量函数)、`pbinom(`(累积分布函数)、`qbinom(`(分位数函数)和`rbinom(`(随机样本生成函数)。

3. 泊松分布:泊松分布适用于描述在给定时间和空间内事件发生的次数的随机过程。

R语言中,泊松分布相关函数有`dpois(`(概率质量函数)、`ppois(`(累积分布函数)、`qpois(`(分位数函数)和`rpois(`(随机样本生成函数)。

4. 均匀分布:均匀分布是指在给定的区间上,随机变量的概率密度函数是一个常数。

R语言中,均匀分布相关函数有`dunif(`(概率密度函数)、`punif(`(累积分布函数)、`qunif(`(分位数函数)和`runif(`(随机样本生成函数)。

5. 指数分布:指数分布是连续型分布,用于描述独立随机事件发生间隔时间的概率。

R语言中,指数分布相关函数有`dexp(`(概率密度函数)、`pexp(`(累积分布函数)、`qexp(`(分位数函数)和`rexp(`(随机样本生成函数)。

6. 卡方分布:卡方分布是指若干相互独立的标准正态分布的随机变量的平方和服从卡方分布。

R语言中,卡方分布相关函数有`dchisq(`(概率密度函数)、`pchisq(`(累积分布函数)、`qchisq(`(分位数函数)和`rchisq(`(随机样本生成函数)。

R语言基本统计分析方法(包及函数)

R语言基本统计分析方法(包及函数)

R语言基本统计分析方法(包及函数)R语言是一种非常强大的统计分析工具,它提供了丰富的包和函数来进行各种统计分析。

下面是一些常用的R语言基本统计分析方法、包和函数:1.描述性统计分析:描述性统计分析是对数据集中的变量进行总结和概括的过程。

R语言中一些常用的描述性统计方法包括:求和(sum),均值(mean),中位数(median),最小值(min),最大值(max),方差(var),标准差(sd),频数(table)等。

这些函数都是基本的内置函数,无需额外加载包。

2.t检验:t检验是用于比较两个样本均值是否有显著差异的统计方法。

R语言中可以使用t.test(函数进行t检验。

该函数接受两个向量作为输入,分别表示两个样本的数据,然后返回t值、自由度、p值和置信区间等结果。

3.方差分析:方差分析(ANOVA)是用于比较多个样本均值是否有显著差异的方法。

在R语言中,可以使用aov(函数进行方差分析。

该函数接受一个公式作为输入,公式表示因变量与自变量的关系,然后返回方差分析的统计结果。

4.相关分析:相关分析用于研究两个变量之间的相关性。

在R语言中,可以使用cor.test(函数进行相关分析。

该函数接受两个向量作为输入,然后返回相关系数、p值和置信区间等结果。

5.线性回归分析:线性回归分析用于建立一个线性模型来描述因变量和自变量之间的关系。

R语言中可以使用lm(函数进行线性回归分析。

该函数接受一个公式作为输入,公式表示因变量与自变量的关系,然后返回回归模型的统计结果。

6.非线性回归分析:非线性回归分析用于建立一个非线性模型来描述因变量和自变量之间的关系。

R语言中可以使用nls(函数进行非线性回归分析。

该函数接受一个公式和初始参数作为输入,然后返回拟合的非线性模型。

7.生存分析:生存分析用于研究时间数据和生存率之间的关系。

在R语言中,可以使用survival包进行生存分析。

survival包提供了一系列生存分析的函数,如生存曲线绘制、Kaplan-Meier法、Cox回归模型等。

R语言常用函数

R语言常用函数

基本一、数据管理vector:向量numeric:数值型向量logical:逻辑型向量character;字符型向量list:列表data.frame:数据框c:连接为向量或列表length:求长度subset:求子集seq,from:to,sequence:等差序列rep:重复NA:缺失值NULL:空对象sort,order,unique,rev:排序unlist:展平列表attr,attributes:对象属性mode,typeof:对象存储模式与类型names:对象的名字属性二、字符串处理character:字符型向量nchar:字符数substr:取子串format,formatC:把对象用格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch:字符串匹配grep,sub,gsub:模式匹配与替换三、复数complex,Re,Im,Mod,Arg,Conj:复数函数四、因子factor:因子codes:因子的编码levels:因子的各水平的名字nlevels:因子的水平个数cut:把数值型对象分区间转换为因子table:交叉频数表split:按因子分组aggregate:计算各数据子集的概括统计量tapply:对“不规则”数组应用函数数学一、计算+, -, *, /, ^, %%, %/%:四则运算ceiling,floor,round,signif,trunc,zapsmall:舍入max,min,pmax,pmin:最大最小值range:最大值和最小值sum,prod:向量元素和,积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序approx和approx fun:插值diff:差分sign:符号函数二、数学函数abs,sqrt:绝对值,平方根log, exp, log10, log2:对数与指数函数sin,cos,tan,asin,acos,atan,atan2:三角函数sinh,cosh,tanh,asinh,acosh,atanh:双曲函数beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:与贝塔函数、伽玛函数、组合数有关的特殊函数fft,mvfft,convolve:富利叶变换及卷积polyroot:多项式求根poly:正交多项式spline,splinefun:样条差值besselI,besselK,besselJ,besselY,gammaCody:Bessel函数deriv:简单表达式的符号微分或算法微分三、数组array:建立数组matrix:生成矩阵data.matrix:把数据框转换为数值型矩阵lower.tri:矩阵的下三角部分mat.or.vec:生成矩阵或向量t:矩阵转置cbind:把列合并为矩阵rbind:把行合并为矩阵diag:矩阵对角元素向量或生成对角矩阵aperm:数组转置nrow, ncol:计算数组的行数和列数dim:对象的维向量dimnames:对象的维名row/colnames:行名或列名%*%:矩阵乘法crossprod:矩阵交叉乘积(内积)outer:数组外积kronecker:数组的Kronecker积apply:对数组的某些维应用函数tapply:对“不规则”数组应用函数sweep:计算数组的概括统计量aggregate:计算数据子集的概括统计量scale:矩阵标准化matplot:对矩阵各列绘图cor:相关阵或协差阵Contrast:对照矩阵row:矩阵的行下标集col:求列下标集四、线性代数solve:解线性方程组或求逆eigen:矩阵的特征值分解svd:矩阵的奇异值分解backsolve:解上三角或下三角方程组chol:Choleski分解qr:矩阵的QR分解chol2inv:由Choleski分解求逆五、逻辑运算<,>,<=,>=,==,!=:比较运算符!,&,&&,|,||,xor():逻辑运算符logical:生成逻辑向量all,any:逻辑向量都为真或存在真ifelse():二者择一match,%in%:查找unique:找出互不相同的元素which:找到真值下标集合duplicated:找到重复元素六、优化及求根optimize,uniroot,polyroot:一维优化与求根程序设计一、控制结构if,else,ifelse,switch:分支for,while,repeat,break,next:循环apply,lapply,sapply,tapply,sweep:替代循环的函数。

R软件画图常用函数及参数

R软件画图常用函数及参数

R软件画图常用函数及参数R语言是一种强大的统计和绘图语言,它提供了丰富的函数和参数来进行数据可视化。

下面是一些常用的R软件画图函数及其参数的介绍:1. plot(函数:plot(函数是R中最基本的绘图函数之一,可以绘制散点图、折线图、柱状图等各种类型的图形。

参数:-x:要绘制的数据的x轴值-y:要绘制的数据的y轴值- type:图形类型,例如"p"代表散点图,"l"代表折线图- main:图形的主标题- col:点或线的颜色- pch:点的形状- lwd:线的宽度- xlim:x轴的范围- ylim:y轴的范围2. hist(函数:hist(函数用于绘制直方图,可以展示数据的分布情况。

参数:-x:要绘制直方图的数据- breaks:直方图的分割数,或者是分割点的向量- main:图形的主标题- col:直方图的颜色- xlim:x轴的范围- ylim:y轴的范围3. boxplot(函数:boxplot(函数用于绘制箱线图,可以显示数据的分布、中位数、四分位数等统计信息。

参数:-x:要绘制箱线图的数据- main:图形的主标题- col:箱线图的颜色- xlim:x轴的范围- ylim:y轴的范围4. barplot(函数:barplot(函数用于绘制柱状图,可以展示不同组别之间的比较。

参数:-x:柱状图的高度或数据- main:图形的主标题- col:柱状图的颜色- xlim:x轴的范围- ylim:y轴的范围5. plotly(函数:plotly(函数用于创建交互式的图形,可以通过鼠标和键盘进行缩放、旋转和放大等操作。

参数:-x:要绘制的数据的x轴值-y:要绘制的数据的y轴值- type:图形类型,例如"scatter"代表散点图,"line"代表折线图- mode:交互模式,例如"lines"代表线条,"markers"代表点- marker:点的样式参数,如颜色、大小等- hoverinfo:鼠标悬停时显示的信息。

R语言常用函数R语言其他

R语言常用函数R语言其他

R语⾔常⽤函数R语⾔其他操作数据库(RODBC) odbcConnect(dsn, uid="", pwd="") 建⽴⼀个到ODBC数据库的连接 sqlFetch(channel, sqltable) 读取ODBC数据库中的某个表到⼀个数据框中 sqlQuery(channel, query) 向ODBC提交⼀个查询并返回结果 sqlSave(channel, dataframe, tablename=table, append=FALSE, rowname=TRUE) 将数据框写⼊或更新到ODBC数据库的某个表中 sqlUpdate(channel, dataframe, tablename=table, append=FALSE, rowname=TRUE, index="") sqlDrop(channel, table) 删除某个表(物理删除) sqlClear(channel, table) 删除某个表的数据 close(channel) 关闭连接length(object)语句variable[condition] <- expression将仅在condition的值为TRUE时执⾏赋值。

eg: leadership$agecat[leadership$age > 75] <- "Elder"重命名 rename(dataframe, c(oldname="newname", oldname="newname", ...)) (reshape包)排序 order(object) rank(object) 返回排序后的序号使⽤sql语句操作数据框(sqldf) : sqldf(sql) : 只能使⽤select语句NA(not available) : 不可⽤NaN(not a number) : ⾮数值判断是否为NA : is.na(object)去掉NA值 : na.omit(object)apply()函数 : 可将⼀个任意函数“应⽤”到矩阵、数组、数据框的任何维度上 apply(x, MARGIN, FUN, ...)其中,x为数据对象,MARGIN是维度的下标,FUN是由你指定的函数,⽽... 则包括了任何想传递给FUN的参数。

r语言数据整理常用函数

r语言数据整理常用函数

r语言数据整理常用函数R语言是一种流行的数据分析和统计建模工具,它提供了许多强大的函数来帮助用户整理和处理数据。

在这篇文章中,我们将介绍一些常用的R语言数据整理函数,这些函数可以帮助您在数据分析和建模过程中更高效地处理数据。

1. subset函数。

subset函数可以根据指定的条件对数据框进行子集选择。

例如,您可以使用subset函数从数据框中选择满足特定条件的行或列。

这个函数非常有用,因为它可以帮助您快速筛选出符合特定要求的数据,从而简化数据处理的过程。

2. merge函数。

merge函数可以用来合并两个或多个数据框,根据一个或多个共同的列进行合并。

这个函数在处理多个数据源的情况下非常实用,可以帮助您将不同数据源的信息整合在一起,以便进行进一步的分析和建模。

3. aggregate函数。

aggregate函数可以对数据进行分组统计,计算每个分组的统计量。

这个函数非常适合在数据分析中进行汇总统计,比如计算每个分组的平均值、总和、中位数等。

使用aggregate函数可以帮助您更好地理解数据的分布和特征。

4. reshape函数。

reshape函数可以帮助您对数据进行重塑,将宽格式的数据转换为长格式,或者将长格式的数据转换为宽格式。

这个函数在数据整理和可视化过程中非常有用,可以帮助您更好地理解和展示数据的结构和特征。

5. dplyr包中的函数。

dplyr包是R语言中一个非常受欢迎的数据整理包,它提供了一系列功能强大的数据整理函数,比如filter、mutate、select、arrange和summarize等。

这些函数可以帮助您快速进行数据筛选、变量创建、变量选择、排序和汇总等操作,极大地提高了数据整理的效率和便利性。

总之,R语言提供了许多强大的数据整理函数和包,可以帮助用户更高效地处理和分析数据。

通过熟练掌握这些函数,您可以更好地理解和利用数据,为后续的数据分析和建模工作奠定良好的基础。

希望本文介绍的这些常用的数据整理函数对您有所帮助。

r语言比较大小函数

r语言比较大小函数

r语言比较大小函数
r语言中比较大小的函数有哪些?在r语言中,常常需要比较不同变量的大小,判断数据的大小关系,从而进行相应的处理。

下面是r语言中常用的比较大小函数:
1. '>':大于号,用于判断左边变量是否大于右边变量。

2. '<':小于号,用于判断左边变量是否小于右边变量。

3. '>=':大于等于号,用于判断左边变量是否大于或等于右边变量。

4. '<=':小于等于号,用于判断左边变量是否小于或等于右边变量。

5. '==':等于号,用于判断左边变量是否等于右边变量。

6. '!=':不等于号,用于判断左边变量是否不等于右边变量。

以上是r语言中常用的比较大小函数,可以根据需要选择使用。

这些函数在r语言中的使用方式与其他编程语言类似,可以在逻辑判断、条件语句等方面发挥重要作用。

- 1 -。

r语言中随机生成数字的函数

r语言中随机生成数字的函数

r语言中随机生成数字的函数R语言中随机生成数字的函数是指用R语言进行数据分析和统计时,可以使用内置的随机数函数来生成随机数。

这些函数可以用于模拟实验、抽样和数据可视化等。

以下是关于R语言中随机生成数字的函数的相关信息。

1. runif()runif函数是用于在指定的范围内生成均匀分布的随机数。

它的语法如下:runif(n, min = 0, max = 1)其中n表示生成的随机数的个数,min和max表示生成的随机数的范围。

例如,下面的代码将生成10个从0到1之间的随机数:runif(10)2. rnorm()rnorm函数是用于生成正态分布的随机数。

它的语法如下:rnorm(n, mean = 0, sd = 1)其中n表示生成的随机数的个数,mean表示生成的随机数的均值,sd表示生成的随机数的标准差。

例如,下面的代码将生成10个均值为5、标准差为2的正态分布随机数:rnorm(10, mean = 5, sd = 2)3. rpois()rpois函数是用于生成泊松分布的随机数。

它的语法如下:rpois(n, lambda)其中n表示生成的随机数的个数,lambda表示泊松分布的参数。

例如,下面的代码将生成10个参数为2的泊松分布随机数:rpois(10, lambda = 2)4. rbinom()rbinom函数是用于生成二项分布的随机数。

它的语法如下:rbinom(n, size, prob)其中n表示生成的随机数的个数,size表示二项分布的试验次数,prob表示二项分布的成功概率。

例如,下面的代码将生成10个试验次数为10、成功概率为0.5的二项分布随机数:rbinom(10, size = 10, prob = 0.5)以上介绍的是R语言中随机生成数字的四个常用函数。

需要注意的是,这些函数生成的随机数是伪随机数,而不是真正的随机数。

因此,在进行随机模拟、抽样等方面需要谨慎使用。

r语言 函数

r语言 函数

r语言函数
R语言函数是一种强大的计算机编程语言,可以用于创建、组织和管理复杂的数学和统计信息。

R语言函数功能十分强大,通过使用函数,可以对指定的输入作出反应、执行一些复杂的计算以及由此生成报告。

尽管R语言中的函数提供了很多功能,但是更重要的是,它们能够有效地促进数据处理,如数据清洗、报表制作、绘图等操作。

R语言中的函数可以分为常用函数和用户自定义函数两大类。

常用函数包括求平均数、求和、对矩阵求逆等功能;用户自定义函数则是由用户自己定义的,可以完成特定功能。

R语言函数的定义包括函数名、参数列表和函数体三部分。

函数名是函数的标识,它根据需要可以由用户自定义;参数列表包含了函数接受的参数,可以是变量或其他数据类型;最后,函数体则是函数要完成的功能,可以包含多个函数调用、输出语句等。

R语言函数的定义完成后,即可正式使用。

在调用函数时,可以让函数接受参数,以便将这些参数作为输入,并返回最终的输出结果。

R语言函数的工作原理非常容易理解,它们不仅能够有效地提高数据处理的效率,还能够为用户提供便捷的服务。

此外,R语言函数可以改善程序的可维护性和可重用性,从而让用户在处理复杂数据时可以重复使用相同的函数,从而节省许多开发时间。

总之,R语言函数是一种重要的计算机编程语言,可以有效地帮助用户实现复杂的数据处理,以及提高程序的可维护性和可重用性。

- 1 -。

R语言常用函数:交集inters...

R语言常用函数:交集inters...

R语言常用函数:交集inters...R语言基础系列:•你知道R中的赋值符号箭头(<-)和等号(=)的区别吗?•1数据类型(向量、数组、矩阵、列表和数据框)•2读写数据所需的主要函数、与外部环境交互•3数据筛选——提取对象的子集•4向量、矩阵的数学运算•5控制结构•6函数及作用域•7认识循环函数lapply和sapply•8分解数据框split和查看对象str•9模拟——随机数、抽样、线性模型在R语言进行数据分析时,经常需要找不同组间的相同和不同,那你应该掌握如下几个函数,让你事半功倍。

交集intersect两个向量的交集,集合可以是数字、字符串等# 两个数值向量取交集intersect(x=1:4, y = 2:6)# [1] 2 3 4# 两个字符向量取交集intersect(x=letters[1:4], y = letters[2:6])# [1] "b" "c" "d"# 混合向量intersect(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))[1] "a" "4"并集union求两个向量的并集,集合可以是任何数值类型# 两个数值向量取并集union(x=1:4, y = 2:6)# [1] 1 2 3 4 5 6# 两个字符向量取并集union(x=letters[1:4], y = letters[2:6])# [1] "a" "b" "c" "d" "e" "f"# 混合向量union(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))[1] "a" "b" "c" "4" "2" "3"找不同setdiff求向量x与向量y中不同的元素(只取x中不同的元素) setdiff(x, y)x = 1:4y = 2:6# 找x中不同于y的元素setdiff(x, y)# [1] 1# 找y中不同于x的元素setdiff(y, x)# [1] 5 6判断相同setequalx = 1:4y = 2:6# 判断x与y是否相同,结果为假setequal(x, y)# [1] FALSE# 找y与x是否相同,结果为假setequal(y, x)# [1] FALSE# 只有完全相同的才返回TRUE y = 1:4setequal(x, y)# [1] TRUE。

R语言:常用函数(更新版)

R语言:常用函数(更新版)

数据结构一、数据管理vector:向量numeric:数值型向量logical:逻辑型向量character;字符型向量list:列表data.frame:数据框c:连接为向量或列表length:求长度subset:求子集seq,from:to,sequence:等差序列rep:重复NA:缺失值NULL:空对象sort,order,unique,rev:排序unlist:展平列表attr,attributes:对象属性mode,typeof:对象存储模式与类型names:对象的名字属性二、字符串处理character:字符型向量nchar:字符数substr:取子串format,format C:把对象用格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch:字符串匹配grep,sub,gsub:模式匹配与替换三、复数complex,Re,Im,Mod,Arg,Conj:复数函数四、因子factor:因子codes:因子的编码levels:因子的各水平的名字nlevels:因子的水平个数cut:把数值型对象分区间转换为因子table:交叉频数表split:按因子分组aggregate:计算各数据子集的概括统计量tapply:对“不规则”数组应用函数数学相关计算一、计算+, -, *, /, ^, %%, %/%:四则运算ceiling,floor,round,signif,trunc,zapsmall:舍入max,min,pmax,pmin:最大最小值range:最大值和最小值sum,prod:向量元素和积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序approx和approx fun:插值diff:差分sign:符号函数二、数学函数abs,sqrt:绝对值,平方根log, exp, log10, log2:对数与指数函数sin,cos,tan,asin,acos,atan,atan2:三角函数sinh,cosh,tanh,asinh,acosh,atanh:双曲函数beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:与贝塔函数、伽玛函数、组合数有关的特殊函数fft,mvfft,convolve:富利叶变换及卷积polyroot:多项式求根poly:正交多项式spline,splinefun:样条差值besselI,besselK,besselJ,besselY,gammaCody:Bessel函数deriv:简单表达式的符号微分或算法微分三、数组array:建立数组matrix:生成矩阵data.matrix:把数据框转换为数值型矩阵lower.tri:矩阵的下三角部分mat.or.vec:生成矩阵或向量t:矩阵转置cbind:把列合并为矩阵rbind:把行合并为矩阵diag:矩阵对角元素向量或生成对角矩阵aperm:数组转置nrow, ncol:计算数组的行数和列数dim:对象的维向量dimnames:对象的维名row/colnames:行名或列名%*%:矩阵乘法crossprod:矩阵交叉乘积(内积)outer:数组外积kronecker:数组的Kronecker积apply:对数组的某些维应用函数tapply:对“不规则”数组应用函数sweep:计算数组的概括统计量aggregate:计算数据子集的概括统计量scale:矩阵标准化matplot:对矩阵各列绘图cor:相关阵或协差阵Contrast:对照矩阵row:矩阵的行下标集col:求列下标集四、线性代数solve:解线性方程组或求逆eigen:矩阵的特征值分解svd:矩阵的奇异值分解backsolve:解上三角或下三角方程组chol:Choleski分解qr:矩阵的QR分解chol2inv:由Choleski分解求逆五、逻辑运算<,>,<=,>=,==,!=:比较运算符!,&,&&,|,||,xor():逻辑运算符logical:生成逻辑向量all,any:逻辑向量都为真或存在真ifelse():二者择一match,%in%:查找unique:找出互不相同的元素which:找到真值下标集合duplicated:找到重复元素六、优化及求根optimize,uniroot,polyroot:一维优化与求根程序设计一、控制结构if,else,ifelse,switch:分支for,while,repeat,break,next:循环apply,lapply,sapply,tapply,sweep:替代循环的函数。

摘抄-R语言常用数学函数

摘抄-R语言常用数学函数

摘抄-R语⾔常⽤数学函数R语⾔常⽤数学函数(2013-01-04 22:09:00)转载▼标签:杂谈分类:R语⾔语⾔的数学运算和⼀些简单的函数整理如下:向量可以进⾏那些常规的算术运算,不同长度的向量可以相加,这种情况下最短的向量将被循环使⽤。

> x <- 1:4> a <- 10> x * a[1] 10 20 30 40> x + a[1] 11 12 13 14> sum(x) #对x中的元素求和[1] 10> prod(x) #对x中的元素求连乘积[1] 24> prod(2:8) #8的阶乘[1] 40320> prod(2:4) #4的阶乘[1] 24> max(x) #x中元素的最⼤值[1] 4> min(x) #x中元素的最⼩值[1] 1> which.max(x) #返回x中最⼤元素的下标[1] 4> which.min(x) #返回x中最⼩元素的下标[1] 1> x <- 4:1 #对向量x重新赋值> x[1] 4 3 2 1> which.min(x)[1] 4> which.max(x)[1] 1> range(x) #与c(min(x), max(x))作⽤相同[1] 1 4> mean(x) #x中元素的均值[1] 2.5> median(x) #x中元素的中位数[1] 2.5> var(x) #x中元素的的⽅差(⽤n-1做分母)[1] 1.666667> x[1] 4 3 2 1> rev(x) #对x中的元素取逆序[1] 1 2 3 4> sort(x) #将x中的元素按升序排列;[1] 1 2 3 4> x[1] 4 3 2 1> cumsum(x) #求累积和,返回⼀个向量,它的第i个元素是从x[1]到x[i]的和[1] 4 7 9 10> cumsum(rev(x))[1] 1 3 6 10> y <- 11:14> pmin(x,y) #返回⼀个向量,它的第i个元素是x[i], y[i], . . .中最⼩值[1] 4 3 2 1> x <- rev(x) #重新赋值> pmin(x,y)[1] 1 2 3 4> pmax(x,y) #返回⼀个向量,它的每个元素是向量x和y在相应位置的元素的最⼤者[1] 11 12 13 14> cumprod(x) #求累积(从左向右)乘积[1] 1 2 6 24> cummin(x) #求累积最⼩值(从左向右)[1] 1 1 1 1> cummax(x) #求累积最⼤值(从左向右)[1] 1 2 3 4> match(x, y) #返回⼀个和x的长度相同的向量,表⽰x中与y中元素相同的元素在y中的位置(没有则返回NA)[1] NA NA NA NA> y[c(2,4)] <- c(2,4)> y[1] 11 2 13 4> match(x, y)[1] NA 2 NA 4na.omit(x)函数忽略有缺失值(NA)的观察数据(如果x是矩阵或数据框则忽略相应的⾏)> na.omit(match(x,y))[1] 2 4attr(,"na.action")[1] 1 3attr(,"class")[1] "omit"> na.fail(match(x,y)) #na.fail(x) 如果x包含⾄少⼀个NA则返回⼀个错误消息错误于na.fail.default(match(x,y)) : 对象⾥有遺漏值which()函数返回⼀个包含x符合条件(当⽐较运算结果为真(TRUE)的下标的向量,在这个结果向量中数值i说明x[i] == a(这个函数的参数必须是逻辑型变量)> which( x == 2)[1] 2> which( x <= 2)[1] 1 2求组合数> choose(4,2)[1] 6> choose(3,1)[1] 3> choose(-3,1)[1] -3> choose(-4,2)[1] 10> y <- c(1:4, rep(4,1))> y[1] 1 2 3 4 4> unique(y) #如果y是⼀个向量或者数据框,则返回⼀个类似的对象但是去掉所有重复的元素(对于重复的元素只取⼀个)[1] 1 2 3 4> table(y) #返回⼀个表格,给出y中重复元素的个数列表(尤其对于整数型或者因⼦型变量)y1 2 3 41 1 1 2> subset(x, x>2) #返回x中的⼀个满⾜特定条件...的⼦集[1] 3 4> sample(x, 2) #从x中⽆放回抽取size个样本,选项replace= TRUE表⽰有放回的抽样[1] 1 2> sample(x, 2, replace = TRUE) #有放回的抽样[1] 2 3R中⽤来处理数据的函数太多了⽽不能全部列在这⾥。

r语言处理excel常见函数

r语言处理excel常见函数

在R语言中,处理Excel文件的主要库是`readxl`和`openxlsx`。

以下是一些常用的函数:1. **readxl::read_excel()**: 这是最常用的函数,用于从Excel 文件中读取数据。

```Rlibrary(readxl)data <- read_excel("path/to/your/file.xlsx")```2. **openxlsx::read.xlsx()**: 这个函数与`read_excel()`类似,但有一些额外的功能,如选择工作表和范围。

```Rlibrary(openxlsx)data <- read.xlsx("path/to/your/file.xlsx", sheet = 1) # 读取第一个工作表```3. **writexl::write_excel()**: 这个函数用于将数据写入Excel 文件。

```Rlibrary(writexl)write_excel(data, "path/to/your/new_file.xlsx")```4. **openxlsx::write.xlsx()**: 这个函数也用于将数据写入Excel文件,但有一些额外的功能,如选择工作表和范围。

```Rlibrary(openxlsx)write.xlsx(data, "path/to/your/new_file.xlsx", sheetName = "Sheet1") # 写入到名为"Sheet1"的工作表```5. **openxlsx::addDataFrame()**: 这个函数用于向现有的Excel 工作表中添加数据框。

```Rlibrary(openxlsx)addDataFrame(data, "path/to/your/existing_file.xlsx",sheetName = "Sheet2") # 添加到名为"Sheet2"的工作表```6. **openxlsx::addGrob()**: 这个函数用于向现有的Excel工作表中添加复杂的图形对象。

R语言常用函数

R语言常用函数

R语言:常用函数数据结构一、数据管理vector:向量numeric:数值型向量logical:逻辑型向量character;字符型向量list:列表data.frame:数据框c:连接为向量或列表length:求长度subset:求子集seq,from:to,sequence:等差序列rep:重复NA:缺失值NULL:空对象sort,order,unique,rev:排序unlist:展平列表attr,attributes:对象属性mode,typeof:对象存储模式与类型names:对象的名字属性二、字符串处理character:字符型向量nchar:字符数substr:取子串format,format C:把对象用格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch:字符串匹配grep,sub,gsub:模式匹配与替换三、复数complex,Re,Im,Mod,Arg,Conj:复数函数四、因子factor:因子codes:因子的编码levels:因子的各水平的名字nlevels:因子的水平个数cut:把数值型对象分区间转换为因子table:交叉频数表split:按因子分组aggregate:计算各数据子集的概括统计量tapply:对“不规则”数组应用函数数学相关计算一、计算+, -, *, /, ^, %%, %/%:四则运算ceiling,floor,round,signif,trunc,zapsmall:舍入max,min,pmax,pmin:最大最小值range:最大值和最小值sum,prod:向量元素和积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序approx和approx fun:插值diff:差分sign:符号函数二、数学函数abs,sqrt:绝对值,平方根log, exp, log10, log2:对数与指数函数sin,cos,tan,asin,acos,atan,atan2:三角函数sinh,cosh,tanh,asinh,acosh,atanh:双曲函数beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:与贝塔函数、伽玛函数、组合数有关的特殊函数fft,mvfft,convolve:富利叶变换及卷积polyroot:多项式求根poly:正交多项式spline,splinefun:样条差值besselI,besselK,besselJ,besselY,gammaCody:Bessel函数deriv:简单表达式的符号微分或算法微分三、数组array:建立数组matrix:生成矩阵data.matrix:把数据框转换为数值型矩阵lower.tri:矩阵的下三角部分mat.or.vec:生成矩阵或向量t:矩阵转置cbind:把列合并为矩阵rbind:把行合并为矩阵diag:矩阵对角元素向量或生成对角矩阵aperm:数组转置nrow, ncol:计算数组的行数和列数dim:对象的维向量dimnames:对象的维名row/colnames:行名或列名%*%:矩阵乘法crossprod:矩阵交叉乘积(内积)outer:数组外积kronecker:数组的Kronecker积apply:对数组的某些维应用函数tapply:对“不规则”数组应用函数sweep:计算数组的概括统计量aggregate:计算数据子集的概括统计量scale:矩阵标准化matplot:对矩阵各列绘图cor:相关阵或协差阵Contrast:对照矩阵row:矩阵的行下标集col:求列下标集四、线性代数solve:解线性方程组或求逆eigen:矩阵的特征值分解svd:矩阵的奇异值分解backsolve:解上三角或下三角方程组chol:Choleski分解qr:矩阵的QR分解chol2inv:由Choleski分解求逆五、逻辑运算<,>,<=,>=,==,!=:比较运算符!,&,&&,|,||,xor():逻辑运算符logical:生成逻辑向量all,any:逻辑向量都为真或存在真ifelse():二者择一match,%in%:查找unique:找出互不相同的元素which:找到真值下标集合duplicated:找到重复元素六、优化及求根optimize,uniroot,polyroot:一维优化与求根程序设计一、控制结构if,else,ifelse,switch:分支for,while,repeat,break,next:循环apply,lapply,sapply,tapply,sweep:替代循环的函数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

R语言常用函数
数学函数:
1、round() #四舍五入
例:x <- c(3.1416, 15.377, 269.7)
round(x, 0) #保留整数位
round(x, 2) #保留两位小数
round(x, -1) #保留到十位
2、signif() #取有效数字(跟学过的有效数字不是一个意思) 例:略
3、trunc() #取整
floor() #向下取整
ceiling() #向上取整
例:xx <- c(3.60, 12.47, -3.60, -12.47)
trunc(xx)
floor(xx)
ceiling(xx)
4、logb(a, b) #以b为底的对数,省略b表示自然对数
log() #自然对数
log10() #以10为底的常用对数
例:logb(8, 2)
log(8); logb(8)
log10(100); logb(100, 10)
5、sqrt() #平方根
exp() #指数
6、sin() #正弦
cos() #余弦
tan() #正切
asin() #反正弦
acos() #反余弦
atan() #反正切
sinh() #双曲正弦
tanh() #双曲正切
7、nchar() #字符长度
例:xx <- 'China is a great country'
nchar(xx)
8、substring() #取子字符串
例:substring(xx, 1, 5)
9、paste() #连接字符
语法是:paste(..., sep = " ", collapse = NULL)
例1:x <- 'I'; y <- 'am'; z <- 'a'; d <- 'student' paste(x, y, z, d)
例2:paste(c('x', 'y'), 1:4, sep = '')
例3:paste('x', 1:4, sep = '', collapse = '+') 10、计算
+, -, *, /, ^, %%, %/%:四则运算ceiling,floor,round,signif,trunc,zapsmall:舍入max,min,pmax,pmin:最大最小值 range:最大值和最小值sum,prod:向量元素和,积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序 approx和approx fun:插值diff:差分sign:符号函数
11、自己写函数程序流程
一、控制结构
if,else,ifelse,switch:分支for,while,repeat,break,next:循环apply,lapply,sapply,tapply,sweep:替代循环的函数。

二、函数
function:函数定义 source:调用文件 call:函数调用.C,.Fortran:调用C或者Fortran子程序的动态链接库。

Recall:递归调用browser,debug,trace,traceback:程序调试options:指定系统参数 missing:判断虚参是否有对应实参nargs:参数个数 stop:终止函数执行on.exit:指定退出时执行 eval,expression:表达式计算system.time:表达式计算计时 invisible:使变量不显示menu:选择菜单(字符列表菜单)
其它与函数有关的还有:delay,delete.response,deparse,do.call,dput,environment ,,formals,,interactive,is.finite,is.function,nguage,is.recursive ,match.arg,match.call,match.fun,model.extract,name,parse,substitute,sys.parent ,warning,machine。

三、输入输出
cat,print:显示对象
sink:输出转向到指定文件
dump,save,dput,write:输出对象
scan,read.table,load,dget:读入
四、工作环境
ls,objects:显示对象列表
rm, remove:删除对象
q,quit:退出系统
.First,.Last:初始运行函数与退出运行函数
options:系统选项
?,help,help.start,apropos:帮助功能
data:列出数据集
12、统计计算函数
一、统计分布
每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数。

比如,正态分布的这四个函数为dnorm,pnorm,qnorm,rnorm。

各分布后缀,前面加前缀d、p、q或r就构成函数名:
norm:正态
t:t分布
f:F分布
chisq:卡方(包括非中心)
unif:均匀
exp:指数
weibull:威布尔
gamma:伽玛
beta:贝塔
lnorm:对数正态
logis:逻辑分布
cauchy:柯西
binom:二项分布
geom:几何分布
hyper:超几何
nbinom:负二项
pois:泊松
signrank:符号秩
wilcox:秩和
tukey:学生化极差
二、简单统计量
sum, mean, var, sd, min, max, range, median, IQR(四分位间距)等为统计量
sort,order,rank与排序有关
其它还有ave,fivenum,mad,quantile,stem等。

三、统计检验
R中已实现的有chisq.test,prop.test,t.test。

四、多元分析
cor,cov.wt,var:协方差阵及相关阵计算
biplot,biplot.princomp:多元数据biplot图
cancor:典则相关
princomp:主成分分析
hclust:谱系聚类:
kmeans:k-均值聚类
cmdscale:经典多维标度
其它有dist,mahalanobis,cov.rob。

五、时间序列
ts:时间序列对象 diff:计算差分 time:时间序列的采样时间window:时间窗
六、统计模型
lm,glm,aov:线性模型、广义线性模型、方差分析
13、其他
(1)rm(list = ls())
#清空控制台所有向量
(2)setwd("D:/ziliao/zhuanye/R bear/R code")
#设置工作目录
(3)library(Biostrings)
#调用程序包
(4)aa <- AAString("LANDEECQW")
#将一个字符向量转化成氨基酸序列aa
(5)typeof(aa)
#查看aa类型
[1] "S4"
#aa为S4方法类型
(6)write(aa,"chuana.txt")
#尝试将aa输出到文件chuana.txt中
(7)aa=as.character(aa)
#将aa转化为字符向量
(8)write(aa,"chuana.txt")
#再次输出
奇葩函数
看别人的代码会遇到一些奇葩的函数,一般的教程上很少提到,但却有很好的用处,这类函数基本上分布在base以及utils包中,下面将它们略为归纳一下,以备后用。

1 文件执行:
在用R生成一个PDF文档后,如果想去打开它,你可能会在文件夹里找到再点开。

再或者我们想调用系统中的其它程序来做点事情,可能要打开cmd敲点命令。

实际上这都可以在R内部完成。

举例来说用pandoc转换na.md成docx再打开它。

system('pandoc d:\\rspace\\na.md -o d:\\rspace\\na.docx') shell.exec('d:\\rspace\\na.docx')
2 网络浏览:
browseURL:浏览某个指定的网页
download.file:下载网络文件到本地
3 文件操作
dir.create:新建一个文件夹
list.dirs:显示目录下的文件夹
list.files:显示目录下的文档
file.create:文档创建
file.exists:判断文档是否存在
file.remove:文档删除
file.rename:重命名
file.append:文档添加
file.copy:文档复制
file.symlink(from, to)
file.show:显示文档内容
:显示文档信息
file.edit:编辑文档
zip:压缩文件
unzip:解压缩文件
4 运算进度条
在一个大循环运算时,如果可以看到目前的进度是比较方便的,txtProgressBar和setTxtProgressBar函数可以帮助做到这一点,下面是内置的一个小例子。

相关文档
最新文档