多元回归R案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Max
-0.14092 -0.05819 -0.03905 0.02181 0.20788
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.595e+00 1.120e+00 5.889 0.000105 ***
X1
Residual standard error: 0.1225 on 11 degrees of freedom
Multiple R-squared: 0.9163, Adjusted R-squared: 0.9011
F-statistic: 60.24 on 2 and 11 DF, p-value: 1.186e-06
^
自变量X1的回归系数在0.05的显著水平下是显著的,且 y 6.595 5.106e04 X1 2.155e01X2
该回归方程是显著的。
方差分析
> anova(A)
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
-5.106e-04 9.623e-05 -5.306 0.000250 ***
X2
2.155e-01 3.946e-01 0.546 0.595816
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
残差标准差、决定系数及回归方程的显著性检验结果:
X1
5415 5700 5674 5968 6165 5929 7505 5920 7646 6556 6475 5907 5697 6618
X2
1.58 1.38 1.57 1.55 1.52 1.60 1.14 1.50 1.18 1.27 1.50 1.50 1.54 1.20
R程序
library(foreign)
两个散点图:
从该散点图可以看出,自变量X1的分布趋势大致 在一条直线上,且与因变量负相关,自变量X2与 因变量呈正相关。
绘制残差图、标准化残差图和残差QQ图 resid=residuals(B) stdresid=rstandard(B) C=predict(B) par(mfrow=c(2,2)) plot(C,resid) plot(C,stdresid) plot(B,2)
X1
1 1.80340 1.80340 120.1791 2.93e-07 ***
X2
1 0.00448 0.00448 0.2984 0.5958
Residuals 11 0.16507 0.01501
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘’1
w=read.csv("02211.csv" )
#建立以Y为因变量,X1、X2为自变量做线性回归
A=lm(Y~X1+X2,data=w)
summary(A)
输出结果:Call:
lm(formula = Y ~ X1 + X2, data = w)
Residuals:
Min
1Q Median
3Q
标准化数据回归分析及散点图 w=as.matrix(w) stdx=scale(w[,2:4],centຫໍສະໝຸດ Baidur=TRUE,scale=TRU
E) stdx=as.data.frame(stdx) B=lm(Y~X1+X2,data=stdx) summary(B) attach(stdx) par(mfrow=c(2,2)) plot(Y~X1) abline(lm(Y~X1)) plot(Y~X2) abline(lm(Y~X2))
棉纤维的线密度是指纤维的粗细程度,是棉纤维的重要品质指标之一, 它与棉纤维的成熟程度、强力大小密切相关,且还是决定纺纱特数与 成纱品质的主要因素之一,纤维较细,则成纱强力高,纱线条好。
棉纤维的成熟度是指纤维细胞壁的加厚程度,即棉纤维生长成熟的程 度正常成熟的棉纤维,截面粗、强度高、转曲多、弹性好、有丝光、 纤维间抱合力大、成纱强力也高。
通过残差QQ图 大概可以看出, 90%以上的样 本的标准残差都 在-1到1之间 且图上的点近似 的在一条直线附 近,所以可认为 样本数据来自正 态分布的总体。
所以知道该拟 合的回归模型 具有合理性与 可靠性。
若已知一组标准化后数据X1=-0.48,X2=0.42,用 拟合的线性模型预测Y的值及置信水平为95%的置 信区间。
棉纤维的强度是纤维具有纺纱性能和使用价值的必要条件之一,纤维 强度高,则成纱强度也高。
案例分析
某地区所产原棉的纤维强力Y与纤维的公制支数X1(指单位质量(g) 的纤维所具有的长度(m))、纤维成熟度X2有关,数据如下:
序号
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Y
4.03 4.01 4.00 4.09 3.73 4.09 2.95 3.90 2.89 3.48 3.60 3.77 3.94 3.66
在实际问题 中,不同变量的 测量单位往往是 不一样的。这就 是所谓的量纲, 而不同的量纲会 引起各变量取值 的分散程度和均 值的差异较大。 所以不能由偏回 归系数的大小直 接说明自变量对 因变量线性影响 的大小。
回归方程为 Y 2.965e16 8.791e01X1 9.051e02 X 2 且方程是显著的。
棉花的纤维强力
13级统计学
棉纤维的简介
棉纤维是我国纺织工业的主要原料,主要成份是纤维素,其元素组成 为碳44.44%、氢6.17%、氧49.39%。棉纤维的聚合度在6000~11000间, 其组成与长度、线密度、成熟度有关。棉纤维长度是指纤维伸直时两 端间的距离,是棉纤维的重要物理性质之一。棉纤维的长度主要由棉 花品种、生长条件、初加工等因素决定。棉纤维长度与成纱质量和纺 纱工艺关系密切。棉纤维长度长,整齐度好,短绒少,则成纱强力高, 条干均匀,纱线表面光洁,毛羽少。
相关文档
最新文档