用R软件做线性回归分析问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用R软件做线性回归
分析问题
本页仅作为文档封面,使用时可以删除
This document is for reference only-rar21year.March
实验 一元线性回归分析
一、 问题
考察温度对产量的影响,测得下列10组数据:
二、要求
(1)试画出这10对观测值的散点图。
(2)求Y 和X 的相关系数,并判断X 、Y 是否存在线性相关性。 (3)用最小二乘法求出Y 对x 的线性回归方程。 (4)求出回归的标准误差δ∧
与回归拟合系数2
R . (5)对回归方程做显著性检验。 (6)画出回归残差图并做相应分析。
(7)若温度为62C
,则产量为多少,并给出置信水平为95%的预测区间。
三、目的和意义
学会使用R 软件来做回归分析问题。
四、实验步骤
1. 绘制x 与y 的散点图,初步确定回归方程,输入下列程序: > X<-matrix(c(20,,25,,30,,35,,40,,45,,50,,55,,60,,65,,ncol=2,byrow=T,dimnames=list(1:10,c("x","y")))
> forbes< plot(forbes$x,forbes$y)
图表 1
从窗口中可以观察到,x与y大致成线性关系,假设其为;
2.做回归分析,输入下列程序:
> <-lm(y~x,data=forbes)
> summary
得到
Call:
lm(formula = y ~ x, data = forbes)
Residuals:
Min 1Q Median 3Q Max
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) ***
x ***
---
Signif. codes: 0 ‘***’ ‘**’ ‘*’ ‘.’ ‘ ’ 1
Residual standard error: on 8 degrees of freedom
Multiple R-squared: , Adjusted R-squared:
F-statistic: on 1 and 8 DF, p-value:
有以上计算结果得:
对应两个系数的P-值均小于是非常显著的,
关于方程的检验,残差的标准差,相关系数的平方,关于F 分布的P-值为,也是非常显著的。
该模型能够通过t检验和f检验,因此回归方程为
我们将得到直线方程放在散点图上,得到图表2:
图表 2
下面分析残差,输入
> abline
> <-residuals;plot
得到残差图图表3
图表 3
由上图知大部分点的绝对值都在以内,第7个点有点反常,可能存在一点问题,现在做一些简单的处理:
text(7,[7],labels=7,adj=
> i<-1:10;forbes7< lm7<-lm(y~x,data=forbes7)
> summary(lm7)
得到
Call:
lm(formula = y ~ x, data = forbes7)
Residuals:
Min 1Q Median 3Q Max
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) ***
x ***
---
Signif. codes: 0 ‘***’ ‘**’ ‘*’ ‘.’ ‘ ’ 1
Residual standard error: on 7 degrees of freedom
Multiple R-squared: , Adjusted R-squared:
F-statistic: on 1 and 7 DF, p-value:
可以对比发现,回归系数没有发生什么变化,系数有所提高,但是p值增大很多,说明样本点7不能去掉。所以回归方程还是
3.预测
若温度为62C ,给出置信水平为95%的预测区间,输入以下代码
> new<(x=62)
> <-predict,new,interval="prediction",level=
>
得到
fit lwr upr
1
由计算结果可以得到预测值与相应的预测区间
y(62)=, [ ]。