数学建摸实验-有氧锻炼
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实 验 报 告
课程名称 数学建模 年级 12级 日期 5.19 姓 名 叶美芳 学号 *******1235 班级 数学*班 实验名称 回归分析 一.实验目的及要求: 1. 掌握回归分析的基本理论
2. 会运用回归分析相关理论进行编程和解决实际问题 二.实验内容: 1.背景:
由于有氧锻炼中,人体的耗氧能力是衡量人身体健康状况的重要指标,而耗氧能力(人体单位重量单位时间内最大的耗氧量)在日常生活中难以直接测量,故本文建立相关数学模型,采用机理分析和回归分析以及数据拟合相结合的办法,以期望使普通大众能够方便快键地对自身身体状况有更为直接的了解,也能更加合理科学地锻炼。
2.题目:
习题7:在有氧锻炼中人的耗氧能力y (mL/(min ·kg))是衡量身体状况的重要指标,它可能与以下因素有关:年龄1x ,体重2x (kg),1500m 跑的时间3x (min),静止时心跳速度4x (次/min ),跑步后心速5x (次/min ),对24名40至57岁的志愿者进行了测试,结果如下表1.1(节选),试建立耗氧能力y 与诸因素的之间的回归模型。 表1.1 序号 1 2 3 4 … 21 22 23 24 Y 44.6 45.3 54.3 59.6 … 39.4 46.1 45.4 54.7 X1 44 40 44 42 … 57 54 52 50 X2 89.5 75.1 85.8 68.2 … 73.4 79.4 76.3 70.9 X3 6.82 6.04 5.19 4.9 … 7.58 6.7 5.78 5.35 X4 62 62 45 40 … 58 62 48 48 X5
178
185
156
166
…
174
156
164
146
(1) 若中1x ~5x 只许选择1个变量,最好的模型是什么? (2) 若中1x ~5x 只许选择2个变量,最好的模型是什么? (3) 若不限制变量的个数,最好的模型是什么?
(4) 对最终模型观察残查,有无异常点,若有,剔除后如何?
3.做法 :
本题不同小问需要建立不同模型,由于专业知识所限,并且提供的数据较少,难以做出精确符合现实情况的模型,因此这里用最简单的线性回归法进行拟和模型基本形式如下:
ξ
βΣβββ+++++=≤≤k j jk m
k j m m x x x x y ,1110... 事实上,中的项(高次项和交互项)对于本题目来讲意义不大,因为所给定的5个自变量和因变量之间关系比较模糊,几个变量彼此之间的联系也很难说清,因此用自变量的一次线性拟和就足以适应本题的要求。但作为练习,还是将每种回归方法都使用到了,可以用于参考。具体采用的各个模型将在下面单独说明,这里不再重复。
4.程序
由于本题需要建立多组模型,并且要在不断的调试中发现最合理的,很多命令都要在这个过程中不断使用,这里仅仅给出使用的最基本的命令。
数据
clear
A=[…]; %数据矩阵,略 n=24;
y=A(2,:); %提取各个数据
x1=A(3,:);x2=A(4,:);x3=A(5,:);x4=A(6,:);x5=A(7,:); 绘制散点图(大致判断影响情况) for i=1:5
subplot(2,3,i),plot(A(i+2,:),y,'+'),grid pause end pause
单参数回归(第一问)
X=[ones(n,1),x4']; %这里检验的是自变量x4,实际操作时要分别检验x1~x5 [b,bint,r,rint,s]=regress(y',X); %回归分析程序(а=0.05)
b,bint,s, %输出回归系数估计值、置信区间、以及统计量 rcoplot(r,rint) %残差图
Polytool(x3',y',2) %检验一元多项式回归的结果,输出交互式画面
双参数回归(第二问):用逐步回归法找出最合理的两个变量 X5=[x1',x2',x3',x4',x5'];
stepwise(X5,y'); %利用输出的交互式画面,可以选出最佳的两个变量 XX=[x3',x1']; %当得到了最佳的两个变量后(这里假设是x3\x1) rstool(XX,y','linear') %检验二元情况下的交互项和高次项
全部参数回归(第三问):
X5=[x1',x2',x3',x4',x5']; %仍然用逐步回归法找出最合理的组合方式 stepwise(X5,y')
第五问要求对残差进行分析,并且剔除异常点,可以在该问得到最终模型后,采用
regress得到的残差值和置信区间并根据其绘制残差图,然后再进行剔除操作重新检验。5.运行结果及分析
散点图
(1)(2)(3)
(4)(5)
从左上到右下的顺序为x1~x5.可以由点的分布大致看出,除了x3自变量呈现比较明显的负相关趋势以外,对于其他的各个自变量都难以直接观测出其对于因变量的影响。根据这种结果,可以假设自变量x3(1500m跑后心速)最直接的与锻炼耗氧能力相关,下面通过对各个自变量的单参数回归进行检验。
单参数回归
β0 β1 β1置信区间R^2 F P s^2
被
检
对
象
X1 64.3812 -0.3599 -0.8309,0.1111 0.1025 2.5115 0.1273 31.2484 X2 52.7432 -0.0644 -0.4334,0.3046 0.0059 0.1310 0.7309 34.6097 X3 83.4438 -5.6682 -7.1252,-4.2112 0.7474 65.0959 0 8.7943 X4 67.1094 -0.3599 -0.6262,-0.0936 0.2631 7.8560 0.0104 25.6547 X5 94.0024 -0.2739 -0.5095,-0.0384 0.2091 5.8169 0.0247 27.5352 由单参数回归的结果可以证明
X3(1500m跑后心速)可以最好的反映出y(锻炼耗氧能力)的情况。由β1置信区间可以看出,x1、x2包含0在内,即y可能与该参数无关,所以不选择,并且两者的p值已经明显的大于=0.05,则不考虑x1、x2。比较x3~x5后发现,x3的2R-决定系数明显的大于x5的,决定系数反映的是在因量的总变化中自变量引起的那部分的比例,2R大说明x3自变量对因变量起的决定作用最大。并且x3的p和s^2值也都比较小,所以最终确定x3可以最好的反映出y的情况。
用Polytool检验含x3高次(2次)项的情况,参量Export如下表:
β0 β1 β2