用R软件做线性回归分析问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用R软件做线性回归

分析问题

本页仅作为文档封面,使用时可以删除

This document is for reference only-rar21year.March

实验 一元线性回归分析

一、 问题

考察温度对产量的影响,测得下列10组数据:

二、要求

(1)试画出这10对观测值的散点图。

(2)求Y 和X 的相关系数,并判断X 、Y 是否存在线性相关性。 (3)用最小二乘法求出Y 对x 的线性回归方程。 (4)求出回归的标准误差δ∧

与回归拟合系数2

R . (5)对回归方程做显著性检验。 (6)画出回归残差图并做相应分析。

(7)若温度为62C

,则产量为多少,并给出置信水平为95%的预测区间。

三、目的和意义

学会使用R 软件来做回归分析问题。

四、实验步骤

1. 绘制x 与y 的散点图,初步确定回归方程,输入下列程序: > X<-matrix(c(20,,25,,30,,35,,40,,45,,50,,55,,60,,65,,ncol=2,byrow=T,dimnames=list(1:10,c("x","y")))

> forbes< plot(forbes$x,forbes$y)

图表 1

从窗口中可以观察到,x与y大致成线性关系,假设其为;

2.做回归分析,输入下列程序:

> <-lm(y~x,data=forbes)

> summary

得到

Call:

lm(formula = y ~ x, data = forbes)

Residuals:

Min 1Q Median 3Q Max

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) ***

x ***

---

Signif. codes: 0 ‘***’ ‘**’ ‘*’ ‘.’ ‘ ’ 1

Residual standard error: on 8 degrees of freedom

Multiple R-squared: , Adjusted R-squared:

F-statistic: on 1 and 8 DF, p-value:

有以上计算结果得:

对应两个系数的P-值均小于是非常显著的,

关于方程的检验,残差的标准差,相关系数的平方,关于F 分布的P-值为,也是非常显著的。

该模型能够通过t检验和f检验,因此回归方程为

我们将得到直线方程放在散点图上,得到图表2:

图表 2

下面分析残差,输入

> abline

> <-residuals;plot

得到残差图图表3

图表 3

由上图知大部分点的绝对值都在以内,第7个点有点反常,可能存在一点问题,现在做一些简单的处理:

text(7,[7],labels=7,adj=

> i<-1:10;forbes7< lm7<-lm(y~x,data=forbes7)

> summary(lm7)

得到

Call:

lm(formula = y ~ x, data = forbes7)

Residuals:

Min 1Q Median 3Q Max

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) ***

x ***

---

Signif. codes: 0 ‘***’ ‘**’ ‘*’ ‘.’ ‘ ’ 1

Residual standard error: on 7 degrees of freedom

Multiple R-squared: , Adjusted R-squared:

F-statistic: on 1 and 7 DF, p-value:

可以对比发现,回归系数没有发生什么变化,系数有所提高,但是p值增大很多,说明样本点7不能去掉。所以回归方程还是

3.预测

若温度为62C ,给出置信水平为95%的预测区间,输入以下代码

> new<(x=62)

> <-predict,new,interval="prediction",level=

>

得到

fit lwr upr

1

由计算结果可以得到预测值与相应的预测区间

y(62)=, [ ]。

相关文档
最新文档