R语言编程整理

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

logistic模型的回归语句

lo=glm(y~x1+x2+x4,family=binomial("logit"),data=data)

glm 拟合广义线性模型,因为括号内添加了family=binomial("logit"),所以可以做logistic 回归

lm 用作线性回归的

相关系数矩阵编程

cor(data,use="complete.obs",method="pearson")

其中data表示数据源Use指定缺失数据的处理方式,当use=“all.obs”时,有缺失值就会报错

当use=“complete.obs”时,空值的地方会被casewise deletion(If use is "complete.obs" then missing values are handled by casewise deletion (and if there are no complete cases, that gives an error). )但计算出来的相关系数矩阵是完整的没有缺失值的,那么那些空值的地方的值是用什么方法填补的呢

method="pearson”表示相关系数的计算方法此处使用Pearson相关系数

分组变量的独立样本t检验

t.test(y~x,data) y是一个数值型变量,x是一个二分变量默认方差不相等可添加var.equal=TRUE以假定方差相等alternative = c("two.sided", "less", "greater") 具体的假设要看所选择的是

双边假设还是单边假设(又分小于和大于)

Pin 以英寸表示的图形尺寸(宽和高)

Mai 以数值向量表示的边界大小,顺序为“下、左、上、右”,单位为英寸

Mar 以数值向量表示的边界大小,顺序为“下、左、上、右”,单位为英分默认值为c(5,4,4,2)+0.1

Lwd 指定线条宽度

Cex 表示相对于默认大小缩放倍数的数值(指定文本大小的参数)

Pch 指定绘制点时使用的符号

多重共线性的方差膨胀因子检验

library(car)

vif(lo)

sqrt(vif(lo))>2#problem

岭回归

(1)plot(lm.ridge(GDP~Consume+Investment+IO+Population+Jobless+Goods,

data=dat,lambda=seq(0,0.3,0.001))) # 和线性回归类似,这个plot可以画出岭迹图,lambda=seq(0,0.3,0.001)设置范围和间隔,可以观察岭迹图,人工选择,但是这样主观性较强。

(2)select(lm.ridge(GDP~Consume+Investment+IO+Population+Jobless+Goods,

data=dat,lambda=seq(0,0.3,0.001))) #利用select 函数找出最优岭参数lambda,会有三个值,任选一个即可。

lm.ridge(GDP~Consume+Investment+IO+Population+Jobless+Goods,

data=dat,lambda=0.09) #通过(1)或(2)把选取的lmbda 参数写到岭回归函数中去,在这里lambda=0.09。

相关文档
最新文档