R语言课程论文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、问题描述
1、设定问题
根据9个不同类型矿床的统计资料分析,发现矿床的评价值与矿床储量以及矿石品位之
间的关系。

N矿床评价值(亿元)矿床储量(万t)X1矿石品位(%)X2
10.06510 1.15
20.23570 1.04
30.77546 1.31
4 1.40557 1.26
5 1.5855
6 1.31
6 2.07592 1.67
7 2.39642 1.75
8 3.13743 1.83
9 3.52739 2.33
二、处理数据以及回归分析
1.绘制散点图
value<-data.frame(
X1=c(510,570,546,557,556,592,642,743,739),
X2=c(1.15,1.04,1.31,1.26,1.31,1.67,1.75,1.83,2.33),
Y=c(0.06,0.23,0.77,1.40,1.58,2.07,2.39,3.13,3.52))
plot(value)
2. 得到线性拟合模型
lm.sol<-lm(Y ~ X1+X2, data=value) summary(lm.sol)运行结果:
由上表可知,回归方程的常数项0∧
β=-4.254788 工商税收X1的系数1∧
β=0.005245 农业税收X2的系数
2∧
β=1.819148
三、模型检验
1. 显著性检验
从上面的运行结果可以看出,检验因变量(矿床评价值)与所有自变量(矿床储量、
矿石品位)之间的线性关系是显著的。

由以上的运行结果在下,在2到6的自由度中,F 比为29.89,p 值为0.0007589,因此我们认为回归方程是显著的。

Call:
lm(formula = Y ~ X1 + X2, data = value) Residuals:
Min 1Q Median 3Q Max -0.45221 -0.33992 0.09396 0.18174 0.53546 Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) -4.254788 1.376223 -3.092 0.0213 * X1 0.005245 0.003785 1.386 0.2151 X2 1.819148 0.777232 2.341 0.0578 . ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.4233 on 6 degrees of freedom Multiple R-squared: 0.9088, Adjusted R-squared: 0.8784 F-statistic: 29.89 on 2 and 6 DF, p-value: 0.0007589
2.学生化残差分析
rstudent(lm.sol)
从图中我们可以看出残差的分布没有明显的趋势,从我们选取的有限个点的分布来看大致可以认为它满足线性的假定,条件同方差的假定和独立性的假定。

3.多重共线性
vif(lm.sol)
运行结果:
X1 X2
4.552947 4.552947
由结果可以看出,方差膨胀因子VIF并不是很大,由此可以说明自变量(矿床储量、
矿石品位)之间不满足多重共线性。

四、结论
此次试验中,我们使用二元线性回归的模型来刻画样本,并且通过残差分析大致验证了模型的线性的假定,条件同方差的假定、独立性的假定和正态性假定。

通过F检验确定了模型线性的显著性,通过方差膨胀因子的方法说明了自变量之间不满足多重共线性。

相关文档
最新文档