R语言编程整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
logistic模型的回归语句
lo=glm(y~x1+x2+x4,family=binomial("logit"),data=data)
glm 拟合广义线性模型,因为括号内添加了family=binomial("logit"),所以可以做logistic 回归
lm 用作线性回归的
相关系数矩阵编程
cor(data,use="complete.obs",method="pearson")
其中data表示数据源Use指定缺失数据的处理方式,当use=“all.obs”时,有缺失值就会报错
当use=“complete.obs”时,空值的地方会被casewise deletion(If use is "complete.obs" then missing values are handled by casewise deletion (and if there are no complete cases, that gives an error). )但计算出来的相关系数矩阵是完整的没有缺失值的,那么那些空值的地方的值是用什么方法填补的呢
method="pearson”表示相关系数的计算方法此处使用Pearson相关系数
分组变量的独立样本t检验
t.test(y~x,data) y是一个数值型变量,x是一个二分变量默认方差不相等可添加var.equal=TRUE以假定方差相等alternative = c("two.sided", "less", "greater") 具体的假设要看所选择的是
双边假设还是单边假设(又分小于和大于)
Pin 以英寸表示的图形尺寸(宽和高)
Mai 以数值向量表示的边界大小,顺序为“下、左、上、右”,单位为英寸
Mar 以数值向量表示的边界大小,顺序为“下、左、上、右”,单位为英分默认值为c(5,4,4,2)+0.1
Lwd 指定线条宽度
Cex 表示相对于默认大小缩放倍数的数值(指定文本大小的参数)
Pch 指定绘制点时使用的符号
多重共线性的方差膨胀因子检验
library(car)
vif(lo)
sqrt(vif(lo))>2#problem
岭回归
(1)plot(lm.ridge(GDP~Consume+Investment+IO+Population+Jobless+Goods,
data=dat,lambda=seq(0,0.3,0.001))) # 和线性回归类似,这个plot可以画出岭迹图,lambda=seq(0,0.3,0.001)设置范围和间隔,可以观察岭迹图,人工选择,但是这样主观性较强。
(2)select(lm.ridge(GDP~Consume+Investment+IO+Population+Jobless+Goods,
data=dat,lambda=seq(0,0.3,0.001))) #利用select 函数找出最优岭参数lambda,会有三个值,任选一个即可。
lm.ridge(GDP~Consume+Investment+IO+Population+Jobless+Goods,
data=dat,lambda=0.09) #通过(1)或(2)把选取的lmbda 参数写到岭回归函数中去,在这里lambda=0.09。