R语言实验报告—回归分析在女性身高与体重的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
R语言实验报告
回归分析中
身高预测体重的模型
学院:
班级:
学号:
姓名:
导师:
成绩:
目录
一、实验背景 (1)
二、实验目的 (1)
三、实验环境 (1)
四、实验内容 (1)
1.给出实验女性的身高体重信息; (2)
2.运用简单线性回归分析; (2)
3.运用多项式回归分析 (2)
五、实验过程 (2)
(一)简单线性回归 (2)
1.展示拟合模型的详细结果 (2)
2.女性体重的数据 (2)
3.列出拟合模型的预测值 (3)
4.列出拟合模型的残差值 (3)
5.得出身高预测体重的散点图以及回归线 (3)
(二)多项式回归 (5)
1.展示拟合模型的详细结果 (5)
2.身高预测体重的二次回归图 (5)
六、实验分析 (7)
七、总结 (7)
一、实验背景
从许多方面来看,回归分析都是统计学的核心。她其实是一个广义的概念,通指那些用一个或多变量(也称自变量或解释变量)来预测响应变量(也称因变量、效标变量或结果变量)的方法。通常,回归分析可以用来挑选与响应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量。
二、实验目的
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具;
本次试验要求掌握了解R语言的各项功能和函数,能够通过完成试验内容对R语言有一定的了解,会运用软件对数据进行分析;
通过本实验加深对课本知识的理解以及熟练地运用R语言软件来解决一些复杂的问题。
三、实验环境
Windows系统,R或者R Studio
四、实验内容
本实验提供了15个年龄在30—39岁间的女性的身高和体重信息,运用回归分析的方法通过身高来预测体重,获得一个等式可以帮助我们分辨哪些过重或过轻的个体。
1.给出实验女性的身高体重信息;
2.运用简单线性回归分析;
3.运用多项式回归分析
五、实验过程
(一)简单线性回归
1.展示拟合模型的详细结果
2.女性体重的数据
3.列出拟合模型的预测值
4.列出拟合模型的残差值
5.得出身高预测体重的散点图以及回归线
5860626466687072
120130140150160
Women Age 30-39
Height (in inches)
W e i g h t (i n p o u n d s )
(二)多项式回归
1.展示拟合模型的详细结果
2.身高预测体重的二次回归图
58
60626466687072
120
130140150160
Women Age 30-39
Height (in inches)
W e i g h t (i n l b s
)
58
60626466687072
Height (inches)
六、实验分析
(一)简单线性回归
通过输出结果,可以得到预测等式:
Weight=-87.52+3.45*Height
因为身高不可能为0,所以没必要给截距项一个物理解释,它仅仅是一个常量调整项。在Pt (>|t|)栏,可以看到回归系数(3.45)显著不为0(P<0.001),表明身高每增高1英寸,体重预期增加3.45磅。R 平方项(0.991)表明模型可以解释体重99.1%的方差,它也是实际和预测值之间的相关系数的平方2
2
=R
r (
)
。参差标准误则可认为是模型用身高预测体重的平均误差。
我们已经输出了真实值、预测值和残差值,由身高预测体重的散点图,可以看出最大的残差值在身高矮和身高高的地方出现。
(二)多项式回归
新的预测等式为:
Weight=261.88-7.35*Height Height+0.083*
2
Height
在p<0.001的水平下,回归系数都非常显著。模型的方差解释率已经增加到了99.9%。二次项的显著性(t=13.89,p<0.001)表明包含二次项提高了模型的拟合度,说明多项式回归可以提高回归的预测精度。
七、总结
通过试验对R 语言有了进一步的了解。这次试验通过随机生成学生成绩,并且对学生成绩进行最大值、最小值、平均值等的求解,以及生成各类图形。在此过程中,锻炼了自己的学习能力、动手操作能力。希望以后有机会可以更加系统的掌握、了解R 语言,并达到熟练的应用。