R软件一元线性回归分析(非常详细)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

R软件一元线性回归分析合金钢强度与碳含量的数据

序号碳含量

/%

合金钢强度

/107pa

1

2

3

4

5

6

7

8

9

10

11

12

这里取碳含量为x是普通变量,取合金钢强度为y是随机变量

使用R软件对以上数据绘出散点图

程序如下:

>

x=matrix(c,42,,43,,45,,45,,45,,,,49,,53,,50,,55,,55,,60),nrow=12,ncol=2,byrow=T ,dimnames=list(1:12,c("C","E")))

>outputcost=很显然这些点基本上(但并不精确地)落在一条直线上。

下面在之前数据录入的基础上做回归分析(程序接前文,下同)

> = lm(E~C,data = outputcost)

>summary

得到以下结果:

Call:

lm(formula = E ~ C, data = outputcost)

Residuals:

Min 1Q Median 3Q Max

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) ***

C ***

---

Signif. codes: 0 ‘***’ ‘**’ ‘*’ ‘.’ ‘ ’ 1

Residual standard error: on 10 degrees of freedom

Multiple R-squared: , Adjusted R-squared:

F-statistic: on 1 and 10 DF, p-value:

由计算结果分析:

常数项0∧β=,变量(即碳含量)的系数1∧β=

得到回归方程:∧y =+

由于回归模型建立使用的是最小二乘法 ,而最小二乘法只是一种单纯的数学方法 ,存在着一定的缺陷 ,即不论变量间有无相关关系或有无显著线性相关关系 ,用最小二乘法都可以找到一条直线去拟合变量间关系。所以回归模型建立之后 ,还要对其进行显著性检验 :

在上面的结果中sd(0∧β)=,sd(1∧

β)=。而对应于两个系数的P 值

和,故是非常显著的。

关于方程的检验,残差的标准差∧σ=。相关系数的平方R 2 = 。关于F 分布的P 值为,也是非常显著的。

我们将得到的直线方程画在散点图上,程序如下:

> abline

得到散点图及相应的回归直线:

下面分析残差:

在R软件中,可用函数residuals()计算回归方程的残差。程序如下:

> =residuals;

plot

得到残差图

从残差图可以看出,第8个点有些反常,这样我们用程序将第8个点的残差标出,程序如下:

>text(8,[8],labels=8,adj=

这个点可能有问题,下面做简单处理,去掉该样本点,编程如下:>i=1:12;

outputcost2=结果输出如下:

Call:

lm(formula = E ~ C, data = outputcost2)

Residuals:

Min 1Q Median 3Q Max

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) ***

C ***

---

Signif. codes: 0 ‘***’ ‘**’ ‘*’ ‘.’ ‘ ’ 1

Residual standard error: on 9 degrees of freedom

Multiple R-squared: , Adjusted R-squared:

F-statistic: on 1 and 9 DF, p-value:

由结果分析,去掉第8个点之后,回归方程系数变化不大,R2 相关系数有所提高,并且p-值变小了,这说明样本点8可以去掉。所得新模型较为理想。

总结程序如下:

>

x2=matrix(c,42,,43,,45,,45,,45,,,,49 ,,50,,55,,55,,60),nrow=11,ncol=2,byrow=T,d imnames=list(1:11,c("C","E")))

>outputcost= = lm(E~C,data = outputcost)

>summary

Call:

lm(formula = E ~ C, data = outputcost)

Residuals:

Min 1Q Median 3Q Max

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) ***

C ***

---

Signif. codes: 0 ‘***’ ‘**’ ‘*’ ‘.’ ‘ ’ 1

Residual standard error: on 9 degrees of freedom

Multiple R-squared: , Adjusted R-squared:

F-statistic: on 1 and 9 DF, p-value:

>abline

得到最后的散点图和回归直线

得到回归方程:

y=+

相关文档
最新文档