数学实验第10次作业-回归分析

合集下载

数学实验案例浅谈如何利用计算机实现数据回归分析

数学实验案例浅谈如何利用计算机实现数据回归分析

科技资讯科技资讯S I N &T NOLOGY I NFO RM TI ON 2008NO .28SC I EN CE &TECH NO LOG Y I N FOR M A TI O N 科技教育我们的经济、生活等方方面面存在大量的数据,我们经常需要对大量的数据做相应的分析,以期从中获得有用的信息,解决或者预测生产、生活等存在的问题;而回归分析正是其中一种方法。

回归分析主要针对成对成组数据的拟合,涉及到线性描述,趋势预测和残差分析等等。

很多专业软件,如数学中常见的M A TL AB 等等都可以用来分析。

但其实使用E xcel 就完全够用了;本实验主要用E xcel 自带的数据库做数据回归分析。

1实验的知识预备:回归分析的理论知识,E xcel 操作知识(注:本实验需要使用E xcel 扩展功能,如果E xcel 尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘支持下加载“分析数据库”。

加载成功后,可以在“工具”下拉菜单中看到“数据分析”选项。

)2实验主要内容2.1问题提出:“研究我国GDP 与石油消耗量之间的关系”最近国际油价高攀,给我们的国民经济发展带来负面的影响。

探讨石油与经济增长的关系,具有一定的现实意义。

请根据我国过去十年G DP 和石油消费量I 的相关数据,对数据进行回归分析,通过回归分析来粗略的探讨一下问题。

①G DP 与石油消耗量I 的关系,主要指线性函数关系、对数函数关系或幂函数关系;建立标准曲线。

②对该函数关系做一个分析检验,对此曲线进行评价,给出残差等分析数据。

③利用该函数关系对将来做出一个结论或者预测。

2.2操作过程学生分组合作实验。

材料收集:从i nt er net 收集中国近十几年的GDP 数值,以及相应年份的石油消耗量,整理成表格。

图 2.3讨论问题2.3.1GD P 与石油消耗量I 的关系GDP 与石油消耗量一定存在相应的关系,但是这个关系是否是我们常见的线性关系?对数关系?还是幂函数关系?这是一个线性拟合问题,手工计算可采用最小二乘法求出拟合直线的待定参数,同时可以得出相关系数R 值的大小,在Exc e l 中,可以对数据做趋势图,进行初步拟合,看看是否符合其中某一种。

数学课后训练:回归分析的基本思想及其初步应用

数学课后训练:回归分析的基本思想及其初步应用

课后训练一、选择题1.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是()A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合2.下列四个命题中正确的是( )①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.A.①③B.②④C.①④D.②③3.已知x,y取值如下表:若x,y y=0.95x+a,则a=( )A.0.325 B.2。

6C.2。

2 D.04.某学校开展研究性学习活动,某同学获得一组实验数据如下表:对于表中数据,( )A .y =2x -2B .12xy ⎛⎫= ⎪⎝⎭C .y =log 2xD .y =12(x 2-1)5.若某地财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0。

5.如果今年该地区财政收入10亿元,年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿6.某产品的广告费用x 与销售额y 的统计数据如下表:y bx a =+b 费用为6万元时销售额为( )A .63.6万元B .65。

5万元C .67.7万元D .72.0万元 二、填空题7.在研究身高和体重的关系时,求得R 2≈______,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.8.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:小李这5的方法,预测小李该月6号打6小时篮球的投篮命中率为__________.三、解答题9.恩格尔系数=食物支出金支出金额总额×100%.在我国,据恩格尔系数判定生活发展阶段的标准为:贫困:>60%,温饱:50%~60%,小康:40%~50%,富裕:<40%.据国家统计局统计显示,随着中国经济的不断发展,城镇居民家庭恩格尔系数不断下降,居民消费已从温饱型向享受型、发展型转变.如下表:(2)预报2013年的恩格尔系数;(3)求R2;(4)作出残差图.10.关于x与y有以下数据:已知x与y 6.5b ,(1)求y与x的线性回归方程;(2)现有第二个线性模型:y=7x+17,且R2=0。

课时作业10:3.2 回归分析

课时作业10:3.2 回归分析

§3.2 回归分析1.某商品销售量y (件)与销售价格x (元/件)呈负相关,则其回归直线方程可能是( ) A.y ^=-10x +200 B.y ^ =10x +200 C.y ^ =-10x -200 D.y ^ =10x -200 考点 题点 答案 A解析 由于销售量y 与销售价格x 成负相关,故排除B ,D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意,故选A.2.下表是x 和y 之间的一组数据,则y 关于x 的回归直线必过( )A.点(2,3) B .点(1.5,4) C .点(2.5,4) D .点(2.5,5) 考点 回归直线方程 题点 样本点中心的应用 答案 C解析 回归直线必过样本点中心(x ,y ),即(2.5,4).3.对变量y 和x 进行相关性检验,已知n 为数据的对数,r 是相关系数,且已知①n =3,r =0.995 0;②n =7,r =0.953 3;③n =15,r =0.301 2;④n =17,r =0.499 1.则变量y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④ D .③和④ 考点 线性相关系数 题点 线性相关系数的应用 答案 C解析 ①当n =3时,r 0.05=0.997,所以|r |<r 0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的;②当n =7时,r 0.05=0.754,所以|r |>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系;③当n =15时,r 0.05=0.514,所以|r |<r 0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的;④当n =17时,r 0.05=0.482,所以|r |>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系,所以②和④满足题意,故选C. 4.某产品在某零售摊位的零售价x (单位:元)与每天的销售量y (单位:个)的统计资料如下表所示:x 16 17 18 19 y50344131由上表可得回归直线方程y ^=b ^x +a ^中的b ^=-5,据此模型预测当零售价为14.5元时,每天的销售量为( )A .51个B .50个C .54个D .48个 考点 线性回归分析 题点 回归直线方程的应用 答案 C解析 由题意知x =17.5,y =39,代入回归直线方程得 a ^=126.5,126.5-14.5×5=54,故选C. 5.已知x ,y 之间的一组数据如下表:x 0 1 2 3 y1357(1)分别计算:x ,y ,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 24; (2)已知变量x 与y 线性相关,求出回归直线方程. 考点 回归直线方程 题点 求回归直线方程解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+x 23+x 24=02+12+22+32=14.(2)b ^=34-4×1.5×414-4×1.52=2,a ^=y -b ^x =4-2×1.5=1, 故回归直线方程为y ^=2x +1.1.对具有线性相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报.2.通过求相关系数并和临界值r 0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.一、选择题1.根据如下样本数据x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归直线方程为y ^=b ^x +a ^,则( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0 D.a ^<0,b ^<0考点 线性回归分析 题点 回归直线方程的应用 答案 B解析 作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0, 当x =0时,y ^=a ^>0.故a ^>0,b ^<0.2.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:x (月份) 1 2 3 4 5 y (万盒)55668若x ,y 线性相关,回归直线方程为y ^=0.7x +a ^,估计该制药厂6月份生产甲胶囊产量为( )A .8.0万盒B .8.1万盒C .8.9万盒D .8.6万盒 考点 回归直线方程 题点 样本点中心的应用 答案 B解析 回归直线一定过样本点中心.由已知数据可得x =3,y =6,代入回归方程,可得a ^=y -0.7x =3.9,即回归直线方程为y ^=0.7x +3.9.把x =6代入,可近似得y ^=8.1,故选B. 3.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 与x 的回归直线方程是( ) A.y ^=2.62x +11.47 B.y ^=2.62x -11.47 C.y ^=11.47x +2.62 D.y ^=-2.62x +11.47考点 回归直线方程 题点 求回归直线方程 答案 A解析 由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x y∑i =18x 2i -8x2=1 849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的回归直线方程是y ^=2.62x +11.47,故选A.4.给定x 与y 的一组样本数据,求得相关系数r =-0.690,则( ) A .y 与x 的线性相关性很强 B .y 与x 的相关性很强 C .y 与x 正相关 D .y 与x 负相关 考点 线性相关系数 题点 线性相关系数的应用 答案 D解析 因为r <0,所以y 与x 负相关,又|r |∈[0.75,1]才表示y 与x 具有很强的线性相关性,所以选D.5.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关试验,并用回归分析方法分别求得相关系数r 如表:则这四位同学的试验结果能体现出A ,B 两变量有更强的线性相关性的是( ) A .甲 B .乙 C .丙 D .丁 考点 线性相关系数题点 线性相关系数的概念及计算 答案 D解析 由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强,故选D.6.每一吨铸铁成本y c (元)与铸件废品率x %建立的回归方程为y c =56+8x ,那么下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元 考点 回归直线方程 题点 回归直线方程的应用 答案 C 二、填空题7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________. 考点 线性相关系数题点 线性相关系数的概念及计算 答案 1解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上时,相关系数为1. 8.已知一个回归直线方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y =________. 考点 回归直线方程 题点 样本点中心的应用解析 ∵x =1+5+7+13+195=9,且y ^=1.5x +45,∴y =1.5×9+45=58.5.9.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为y ^=0.79x -73.56,数据列表是:则其中的数据a =________. 考点 回归直线方程 题点 样本点中心的性质 答案 163解析 由表中数据计算y =15×(49+53+56+58+64)=56,根据回归直线经过样本点中心(x ,y ),可得56=0.79x -73.56, 解得x =164.由x =15×(155+161+a +167+174)=164,解得a =163.10.2018年3月1日,某地物价部门对该地的5家商场的某商品一天的销售量及其价格进行调查,5家商场该商品的售价x 元和销售量y 件之间的一组数据如表所示,由散点图可知,销售量y 与价格x 之间有较好的线性相关关系,其回归直线方程是y ^=-3.2x +a ^,则a ^=________.考点 线性回归分析 题点 回归直线的应用 答案 40解析 由题意,得x =9+9.5+10+10.5+115=10,y =11+10+8+6+55=8,∵回归直线方程是y ^=-3.2x +a ^,∴8=-3.2×10+a ^,∴a ^=40.11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)求y 关于x 的回归直线方程y ^=b ^x +a ^; (2)试预测加工10个零件需要多少时间? 考点 回归直线方程 题点 求回归直线方程解 (1)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =14x i y i -4x y∑i =14x 2i -4x2=0.7,所以a ^=y -b ^x =1.05. 所以y ^=0.7x +1.05.(2)将x =10代入回归直线方程, 得y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.12.已知某种商品的价格x (元)与需求量y (件)之间的关系有如下一组数据:判断y 与x 是否具有线性相关关系?若有,求出其回归直线方程. 考点 回归直线方程 题点 求回归直线方程解 作出散点图如图,可看出y 与x 具有线性相关关系.x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4,∑5i =1x 2i =142+162+182+202+222=1 660,∑5i =1y 2i =122+102+72+52+32=327, ∑5i =1x i y i =14×12+16×10+18×7+20×5+22×3=620,所以b ^=∑5i =1x i y i -5x y∑5i =1x 2i -5x2=620-5×18×7.41 660-5×182=-1.15,a ^=7.4+1.15×18=28.1,所以所求的回归直线方程是y ^=-1.15x +28.1. 四、探究与拓展13.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关系数最大.考点 线性相关系数 题点 线性相关系数的应用 答案 D (3,10)解析 经计算,去掉D (3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强.14.为了分析某高三学生学习状态,对其下一阶段的学习提供指导性建议,现对他前7次考试的数学成绩x 、物理成绩y 进行分析,下面是该生7次考试的成绩.(单位:分)数学成绩x 88 83 117 92 108 100 112 物理成绩y949110896104101106(1)他的数学成绩与物理成绩哪个更稳定?请给出你的理由;(2)已知该学生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少分,并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议. 考点 线性回归分析 题点 回归直线的应用解 (1)x =100+-12-17+17-8+8+127=100,y =100+-6-9+8-4+4+1+67=100,s 2数学=142,s 2物理=2507,因为s 2数学>s 2物理,所以他的物理成绩更稳定. (2)由于x 与y 之间具有线性相关关系, 经计算得b ^=0.5,a ^=100-0.5×100=50. 所以回归直线方程为y ^=0.5x +50. 当y =115时,x =130. 估计他的数学成绩是130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.。

回归分析-数学实验-清华大学

回归分析-数学实验-清华大学

回归分析2012011849 分2 李上【实验目的】1.了解回归分析的基本原理,掌握MATLAB实现的方法;2.练习用回归分析解决实际问题。

【实验内容】1.题目5问题描述社会学家认为犯罪与收入低、失业及人口规模有关,对20个城市的犯罪率y(每10万人中犯罪的人数)与年收入低于5000美元家庭的百分比x1、失业率x2和人口总数x3(千人)进行了调查(表格略)(1)若x1~x3中至多只许选择2个变量,最好的模型是什么?(2)包含3个自变量的模型比上面的模型好吗?确定最终模型。

(3)对最终模型观察残差,有无异常点,若有,剔除后如何。

问题分析先做y和x i的散点图,来大致判断自变量和因变量的关系。

而后选择x i中的某些与y进行线性回归并与包含三个自变量的模型进行比较,并剔除某些数据点,得出更好的拟合结果。

代码和结果第一问y=[11.2 14.5 12.7 28.9 13.4 26.9 20.9 14.9 40.7 15.7 35.7 25.8 5.3 36.2 8.7 21.7 24.8 18.1 9.6 25.7]x1=[16.5 18.1 16.5 24.9 20.5 23.1 20.2 17.9 26.3 19.1 21.3 22.4 16.5 24.7 17.2 20.2 19.2 18.6 14.3 16.9] x2=[6.2 6 5.9 8.3 6.4 7.4 6.4 6.7 9.3 5.8 7.6 8.6 5.3 8.6 4.9 8.4 7.3 6.5 6.4 6.7]x3=[587 7895 643 854 643 762 1964 716 635 2793 1531921 692 741 713 595 1248 625 49 3353]plot(y,x1,'r+');pauseplot(y,x2,'r+');pauseplot(y,x3,'r+');图像如下:y-x1图像y-x2图像y-x3图像因此,y和x1、x2的关系大致为线性关系,所以,选择x1和x2和y做二元线性回归。

北师大应用多元统计分析作业——回归分析

北师大应用多元统计分析作业——回归分析

应用多元统计分析作业(七)——回归分析4-2:利用回归分析方法分析某种消费品的销售量于相关指标之间的关系。

解:●执行SAS程序代码:data dxiti42;input number x1 x2 x3 x4 Y;cards;1 82.9 92.0 17.1 94.0 8.42 88.0 93.0 21.3 96.0 9.63 99.9 96.0 25.1 97.0 10.44 105.3 94.0 29.0 97.0 11.45 117.7 100.0 34.0 100.0 12.26 131.0 101.0 40.0 101.0 14.27 148.2 105.0 44.0 104.0 15.88 161.8 112.0 49.0 109.0 17.99 174.2 112.0 51.0 111.0 19.610 184.7 112.0 53.0 111.0 20.8;proc reg data=dxiti42;model Y = x1 x2 x3 x4;run;quit;●结果分析:输出结果首先给出了回归模型的方差分析表:Model 4 169.5535 42.38838 1021.41 <.0001Error 5 0.2075 0.0415Corrected Total 9 169.761以及回归模型的一些统计量的值:0.20.9988Dependent Mean14 Adj R‐Sq 0.9978Coeff Var 1.45从以上两表中可以看出,此回归模型的拟合效果较好,R2值达到了0.9978;同时回归模型的F值也很大,为1021.41;并且F的p值很小(<0.0001),小于显著性水平α=0.05。

综上,可以判定此回归模型在α = 0.05 的水平上是显著的。

进一步给出了回归模型参数估计的一些信息:Intercept 1 ‐17.6677 5.9436 ‐2.97 0.0311 x1 1 0.09006 0.02095 4.3 0.0077x2 1 ‐0.23132 0.07132 ‐3.24 0.0229x3 1 0.01806 0.03907 0.46 0.6633x4 1 0.42075 0.11847 3.55 0.0164从上表中的最后一栏可以看出,截距项、x1、x2、x4的回归系数的t统计量的尾概率均小于显著水平α=0.05,而x3的回归系数的t统计量的尾概率大于显著水平α=0.05。

spass回归分析实验报告

spass回归分析实验报告

上,看哪种模型拟合效果更好从拟合优度(Rsq 即R2)来看,QUA,CUB,POW 效果较好(因为其Rsq 值较大),于是就选QUA,CUB,POW来进行。

重新进行上面的过程,只选以上三种模型。

3、实验结果:Model Summary and Parameter EstimatesDependent Variable:远视率EquationModel Summary Parameter EstimatesRSquare F df1 df2 Sig。

Constant b1 b2 b3Linear。

674 22。

7101 11 .001 74.006—4。

768Logarith mic .793 42.251 1 11 。

000 156。

773-57.574Inverse。

883 83.244 1 11 。

000 -40。

567 615.321Quadrati c .94382。

1142 10 .000 192.085-26.567。

908Cubic.959 69。

5383 9 .000 290.851—54。

7173.398 —。

069Compound。

794 42.445 1 11 .000 308。

120 .731Power.861 68.413 1 11 .000 49462.724—3。

638S .877 78.119 1 11 .000 -1。

502 37.175Growth.794 42。

4451 11 。

000 5。

730 —。

314Exponen tial .79442。

4451 11 。

000 308.120 -.314Logistic 。

794 42.445 1 11 。

000 .003 1。

369The independent variable is 年龄.分析:可以用Cubic拟合曲线图的拟合效果最好.第四题:棉花单株在不同时期的成铃数(y)与初花后天数(x)存在非线性的关系,假设这一非线性关系可用Gompertz模型表示:y=b1*exp(-b2*exp(—b3*x))。

数学建模——线性回归分析实用教案

数学建模——线性回归分析实用教案

数学建模——线性回归分析实用教案一、教学内容本节课选自《数学建模与数学实验》教材第十章“回归分析”中的第一节“线性回归分析”。

具体内容包括线性回归模型的建立、参数估计、模型的检验及运用,重点探讨变量间线性关系的量化表达和预测分析。

二、教学目标1. 理解线性回归模型的基本概念,掌握线性回归方程的建立和求解方法。

2. 学会运用最小二乘法进行线性回归参数的估计,并能解释其实际意义。

3. 能够对线性回归模型进行显著性检验,评估模型的可靠性。

三、教学难点与重点难点:线性回归方程的求解方法,最小二乘法的原理及运用,模型的显著性检验。

重点:线性回归模型的建立,参数估计,模型的运用。

四、教具与学具准备1. 教具:多媒体教学设备,投影仪,黑板。

2. 学具:计算器,教材,《数学建模与数学实验》。

五、教学过程1. 实践情景引入(5分钟)展示一组数据,如某商品的需求量与价格之间的关系,引导学生思考如何量化这种关系。

2. 理论讲解(15分钟)介绍线性回归模型的基本概念,引导学生了解线性关系的量化表达。

讲解线性回归方程的建立,参数估计方法,强调最小二乘法的作用。

3. 例题讲解(15分钟)选取一个实际例子,演示如何建立线性回归模型,求解参数,并进行模型检验。

4. 随堂练习(10分钟)学生分组讨论,根据给出的数据,建立线性回归模型,求解参数,进行模型检验。

六、板书设计1. 黑板左侧:线性回归模型的基本概念,参数估计方法。

2. 黑板右侧:例题解答过程,模型检验步骤。

七、作业设计1. 作业题目:给出一组数据,要求学生建立线性回归模型,求解参数,进行模型检验。

讨论线性回归分析在实际问题中的应用。

2. 答案:线性回归模型参数的求解过程及结果。

模型检验的统计量及结论。

八、课后反思及拓展延伸1. 反思:本节课学生掌握线性回归分析的基本方法,但部分学生对最小二乘法的理解仍需加强。

2. 拓展延伸:探讨非线性回归模型的建立和应用。

引导学生了解其他数学建模方法,如时间序列分析、主成分分析等。

应用回归分析实验报告

应用回归分析实验报告

重庆交通大学学生实验报告实验课程名称应用回归分析开课实验室数学实验室学院理学院年级专业班学生姓名学号开课时间2013 至2014 学年第2 学期评分细则评分报告表述的清晰程度和完整性(20分)程序设计的正确性(40分)实验结果的分析(30分)实验方法的创新性(10分)总成绩教师签名邹昌文2.15 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。

经过10周时间,收集了每周加班工作时间的数据和签发新保单数目,x 为每周签发的新保单数目,y 为每周加班工作时间(小时)。

表2.7 y 3.5 1 4 2 1 3 4.5 1.5 3 5 x825215107055048092013503256701215(1)画散点图;(2)x 与y 之间是否大致呈线性关系? (3)用最小二乘估计求出回归方程;(4)求回归标准误差ˆσ; (5)给出0ˆβ、1ˆβ的置信度为95%的区间估计; (6)计算x 与y 的决定系数;(7)对回归方程做方差分析;(8)做回归系数1ˆβ显著性检验; (9)做相关系数的显著性检验;(10)对回归方程做残差图并作相应的分析;(11)该公司预计下一周签发新保单01000x =张,需要的加班时间是多少? (12)给出0y 的置信水平为95%的精确预测区间和近视预测区间。

(13)给出0()E y 置信水平为95%的区间估计。

(1)将数据输入到SPSS 中,画出散点图如下:(2)由下表可知x与y的相关系数高达0.949,大于0.8,所以x与y之间线性相关性显著。

相关性y xPearson 相关性y 1.000 .949x .949 1.000Sig. (单侧)y . .000x .000 .N y 10 10x 10 10(3)用SPSS 进行最小二乘估计得到了如下系数表:系数a模型非标准化系数 标准系数tSig. B 的 95.0% 置信区间相关性共线性统计量B标准 误差 试用版下限 上限 零阶偏部分 容差VIF1(常量) .118.355.333 .748 -.701 .937x.004 .000 .949 8.509 .000 .003 .005 .949 .949 .949 1.000 1.000a. 因变量: y由上表可知0β、1β的参数估计值0ˆβ、1ˆβ分别为0.118和0.004,所以y 对x 的线性回归方程为0.1180.004x y ∧=+(4)由SPSS 得到如下模型汇总表:模型汇总模型RR 方调整 R 方标准 估计的误差1.949a.900.888.4800a. 预测变量: (常量), x 。

回归分析实验报告

回归分析实验报告

实验报告实验名称:数据整理与分析相关分析实验报告实验课程:统计学数据的整理与分析一、实验目的:学会运用 Excel 中次数分布表、透视表、统计图以及描述性统计功能来分析一组有调查意义的数据;从而通过分析得出有意义的结论以及推测预计。

二、实验原理:次数分布表的制作过程,第一步找出最大、最小值,确定全距R;第二步利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距;第三步分组,根据分组标志和分组上限确定在组内数据的频数以及频率。

数据透视表,选中当前数据库表中人一个单元格,单击菜单中的“数据”—“数据透视表与数据透视图”。

直方图是在平面坐标上一横轴根据各组组距的宽度标明各组组距,一纵轴根据次数的高度表示各组次数绘制成的统计图。

折线图是在直方图的基础上,用折线连接各个直方形顶边中点并在直方图形两侧各延伸一组,使者限于横线相连。

三、实验环境:实验地点:实训楼计算机实验中心五楼实验室 3试验时间:第五周周二实验软件: Microsoft Excel 2003四、实验内容1、(1)在数据源中选取所需数据,对数据进行分析。

利用Excel 对数据进行描述性统计分析。

实验内容包括:数据分组、直方图、描述性分析、透视表、实验结果分析。

(2)数据资料:数据来源“9-33各地区农村居民家庭平均每人主要食品消费量(2008 年 )”如下图所示。

2、实验步骤第一步:在数据库中把所要研究的数据对象复制黏贴到新建的Excel 工作表sheet1 中。

我要研究的是“各地区农村居民家庭平均每人主要食品消费量 (2008 年 ) ”挑选了其中的蔬菜。

第二步:对 sheet2 中的数据进行分组。

(1)找出这31个数据中的最大、最小值,得到全距R(2)其次利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距 i ;(3)然后分组,根据分组标志和分组上限确定在组内数据的频数以及频率(4)最后得到全国各地区蔬菜消费量的次数分布表。

实验十 回归分析实验

实验十 回归分析实验

实验十回归分析实验变量之间的关系可以分为两类,一类是确定性的,另一类是非确定性的。

确定型的关系是指:某一个或某几个现象的变动必然会引起另一个现象确定的变动,他们之间的关系可以使用数学函数式确切地表达出来,即()=。

当知道x的数值时,就可y f x以计算出确切的y值来。

如圆的周长与半径的关系:周长2rπ=。

非确定关系则不然,例如,在发育阶段,随年龄的增长,人的身高会增加。

但不能根据年龄找到确定的身高,即不能得出11岁儿童身高一定就是1米40公分。

年龄与身高的关系不能用一般的函数关系来表达。

研究变量之间既存在又不确定的相互关系及其密切程度的分析称为相关分析。

如果把其中的一些因素作为自变量,而另一些随自变量的变化而变化的变量作为因变量,研究他们之间的非确定因果关系,这种分析就称为回归分析。

实验目的:学习利用SPSS进行回归分析。

实验内容:一、一元线性回归分析二、多元线性回归分析三、曲线估计四、Logistic 回归分析五、probit回归分析六、非线性回归分析实验工具:SPSS中回归分析菜单。

一一元线性回归分析知识准备:相关和回归描述的是两变量间联系的不同侧面,一元线性回归分析就是寻找因变量数值随自变量变化而变化的直线趋势,并在散点图上找到这样一条直线,相应的方程也就被称为直线回归方程。

通过回归方程解释两变量之间的关系会显的更为精确,例如可以计算出大白鼠每进食一个单位代乳粉体重平均增加的单位数量,这是相关分析无法做到的。

除了描述两变量的关系以外,通过回归方程还可以进行预测和控制,预测就是在回归方程中控制了变量x的取值范围就可以相应的得到变量y的上下限,而控制则正好相反,也就是通过限制结果变量y的取值范围来得到x的上下限。

这两点在实际的应用中显得尤为重要。

1、一元线性回归分析的原理和要求如果将两个事物的取值分别定义为变量x和y,则可以用回归方程ˆy a b x=+来描述两者的关系,这里需要注意的有两点:①变量x称为自变量,而y为因变量,一般来讲应该有理由认为是由于x的变化而导致y发生变化。

实验数据分析方法_回归分析

实验数据分析方法_回归分析

0.10
0.9877 0.9000 0.8054 0.7293 0.6694 0.6215 0.5822 0.5494 0.5214 0.4973 0.4762 0.4575 0.4409 0.4259 0.4124 0.4000 0.3887 0.3783 0.3687 0.3598 0.3233 0.2960 0.2746 0.2573 0.2428 0.2306 0.2108 0.1954 0.1829 0.1726 0.1638
上式右边第二项是回归值ŷ与平均值 y 之差的平方和,我们
称它为回归平方和,并记为U: U (y ˆ k y ) 2 ( b 0 b x k b 0 b x ) 2
k
b2 (xkx)2.
— 可以看出,回归平方和U是由于x的变化而引起的。因
此U反映了在y的总的变化中由于x和y的线性关系而引起
解之可得:
b
xkyk
xk yk N
(xk x)(yk y)
xk2N 1( xk)2
(xk x)2
b0N 1( ykb xk)ybx,
实验数据分析方法_Chap.6
8
其中 1 N
1N
xNk1xk,
y Nk1
yk.
在给定参数估计值b, b0后,可得到相应的回归方程 (或回归函数)为: yˆ b0 bx.
0.05
0.9969 0.9500 0.8783 0.8114 0.7545 0.7067 0.6664 0.6319 0.6021 0.5760 0.5529 0.5324 0.5139 0.4973 0.4821 0.4683 0.4555 0.4438 0.4329 0.4227 0.3809 0.3494 0.3246 0.3044 0.2875 0.2732 0.2500 0.2319 0.2172 0.2050 0.1946

第10讲 回归分析

第10讲 回归分析

Q Q ( 0 , 1 ) y i 0 1 xi
i 1 2 i i 1
n
n
2
最小二乘法就是选择
0
ˆ 0 和 1 的估计
0 , 1
ˆ 1 使得 ,
ˆ ˆ Q ( 0 , 1 ) min Q ( 0 , 1 )
2013-6-10 12
3、预测与控制 (1)预测
ˆ ˆ ˆ 用 y0 的回归值 y0 0 1 x0 作为 y0 的预测值.
y0 的置信水平为1 的预测区间为 ˆ ˆ y0 ( x0 ), y0 ( x0 )
1 x0 x ˆ 其中 ( x0 ) e t (n 2) 1 1 n Lxx 2
2013-6-10 16
通常选择的六类曲线如下:
1 b (1)双曲线 a y x
(2)幂函数曲线 y=ax b , 其中 x>0,a>0
(3)指数曲线 y=ae bx 其中参数 a>0.
e (4)倒指数曲线 y=a b / x 其中 a>0,
(5)对数曲线 y=a+blogx,x>0
(6)S 型曲线 y
2、多项式回归
设变量 x、Y 的回归模型为
Y 0 1 x 2 x 2 ... p x p
其中 p 是已知的, i (i 1, 2, , p ) 是未知参数, 服从正态分布
N ( 0, 2 ) .
Y 0 1 x 2 x 2 ... k x k
线性模型 (Y , X , I n ) 考虑的主要问题是:
返回
(1)用试验值(样本值)对未知参数

第10章 回归分析

第10章 回归分析

7
解: 依题意,实验次数n=5,y~x为一元线性关系y=a+bx。根据最小二乘 法原理,有:
i 1 2 3 4 5
xi 2 4 5 8 9 28
yi 2.01 2.98 3.50 5.02 5.07 18.58
x i2 4 16 25 64 81 190
yi2 4.04 8.88 12.25 25.20 25.70 76.07
xiyi 4.02 11.92 17.50 40.16 45.63 119.23
解得a=1.155,b=0.4573。 因此关系式为:y=1.155+0.4573x。
如果用简化算法,则有:
故关系式为:y=1.155+0.4573x,即两种计算方法结果是一致的。 可见,根据实验数据建立回归方程,可采用最小二乘法,基本步骤为: ① 根据实验数据画出散点图; ② 确定经验公式的函数类型; ③ 通过最小二乘法得到正规方程组; ④ 求解正规方程组,得到回归方程的表达式。 其实①②两点正是第9章建立数学模型的过程,所以建立数学模型是回 归分析的前提。
13
[例10-2] 试用相关系数检验法对例10-l中得到的经验公式进行显著性检验 (α=0.05)。 解:
当α=0.05,n=5时,查得相关系数临界值 r0.05,3=0.8783。所以r>r, f, 所得的经验公式有意义。
14
应当指出的是,相关系数r有一个明显的缺点:即它接近于1的程度与实 验数据组数n有关。当n较小时,|r|容易接近于1;当n较大时,|r| 容易偏小。特别是当n=2时,因两点确定一条直线,|r|总等于1。所 以,只有当实验次数n较多时,才能得出真正有实际意义的回归方程。
2
回归分析的主要内容: 确定回归方程,检验回归方程的可信性 10.2 一元线性回归分析 10.2.1 一元线性回归方程的建立 一元线性回归分析又称直线拟合,是处理两个变量x和y之间关系的方法。 所谓一元是指只有一个自变量x,因变量y在某种程度上是随x变化的。 设有一组实验数据,实验值为 (xi, yi) (i=1,2,…,n)。若x,y符合线性关 系,或已知经验公式为直线形式,就可拟合为直线方程,即:

回归分析案例

回归分析案例

身高 0.75 0.85 0.95 1.08 1.12 1.16 1.35 1.51 1.55 1.6 1.63 1.67 1.71 1.78 1.85 体重 101215172022354148505154596675Matlab 实现:h=[0.75 0.85 0.95 1.08 1.12 1.16 1.35 1.51 1.55 1.6 1.63 1.67 1.71 1.78 1.85]; m=[10 12 15 17 20 22 35 41 48 50 51 54 59 66 75]; plot(x,y,'*')可令:adh m =,求系数可用p=polyfit(x,y,n), 其中h x m y ln ,ln ==,n=1,结果:p=[2.3,2.823]由此得d=16.8,a=2.3,即有经验公式:3..28.16h m =。

也直接利用Matlab 统计工具箱中的命令regress 求解,使用格式:[b,bint,r,rint,stats]=regress(y,x,alpha) alpha 为置信水平,r 为残差向量βˆx y -,stats 为回归模型的检验统计量,有3个值,第一个是回归方程的决定系数2R ,第二个是F 统计量值,第三个是与F 统计量对应的概率值p 。

上例可如下操作:y=log(m)';x=[ones(length(y),1),log(h)'];[b,bint,r,rint,stat]=regress(y,x)b =2.82282.3000 stat =1 1024 0.0000残差分析:rcoplot(r,rint)----------------------------------------------------------------------------------------------------------------------------------例2:施肥效果分析(1992建模赛题)磷肥施用量 0244973 98 147 196 245 294 342 土豆产量 33.46 32.47 36.06 37.96 41.04 40.09 41.26 42.17 40.36 42.73 磷肥施用量 0244973 98 147 196 245 294 342 土豆产量33.46 34.76 36.0637.9641.0440.0941.2642.1740.3642.73氮肥施用量 0244973 98 147 196 245 294 342 土豆产量33.46 34.76 36.0637.9641.0440.0941.2642.1740.3642.73对于磷肥-----土豆:可选择函数xbea y -+=1 或威布尔函数 0,≥-=-x Be A y cx对于氮肥-----土豆:可选择函数0,2210≥++=x x b x b b y2)模型的参数估计:可如下操作:x=[0 34 67 101 135 202 259 336 404 471]';y=[15.18 21.36 25.72 32.29 34.03 39.45 43.15 43.46 40.83 30.75]';X=[ones(length(y),1),x,x.^2];[b,bint,r,rint,stat]=regress(y,X)b =14.74160.1971-0.0003stat =0.9863 251.7971 0.0000 即20003.01971.07416.14x x y -+=拟合曲线图:3) 显著性检验: (仅以氮肥-----土豆模型为例说明)A):回归方程的显著性检验:检验的概率p=0,说明方程是高度显著的.B):回归系数的的显著性检验:对1β: 0:110=βH 检验统计量 =T 对2β: 0:220=βH检验统计量 =T -1004341.84343142都有 8945.1)7(05.0=>t T ,所以,均应拒绝原假设,认为系数)2,1(=i i β显著地不为0.4)残差诊断:标准化残差图如下12345678910标准化残差基本上均匀分布于-2至2之间,可以认为模型拟合是合理的.------------------------------------------------------------------------------------------------------------------------------ 案例:牙膏的销售量某牙膏制造企业要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。

数学实验第10次作业_回归分析

数学实验第10次作业_回归分析

回归分析一实验目的1 了解回归分析的基本原理,掌握MATLAB实现的方法;2 练习用回归分析解决实际问题。

二实验内容1电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),建立回归模型并进行检验,诊断异常点的存在并进行处理。

每周收入9690959295959494报纸广告费用 5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0初步解决:首先对于题目作初步分析,题目中电视广告费用和报纸广告费用都会对与每周收入产生影响,但是两者对于每周收入的影响都是独立的。

首先画出散点图如下:观察散点图之后,假设自变量与因变量满足多元线性关系。

设电视广告费用为x1,报纸广告费用为x2,每周收入为y,那么每周收入与电视广告费用以及报纸广告费用的关系模型表示如下:y=β0+β1x1+β2x2;下面在MATLAB中输入以下命令:输出结果如下所示:结果列表如下:回归系数回归系数估计值回归系数置信区间β1 1.2985[0.4007,2.1962]β2 2.3372[1.4860,3.1883]R2=0.9089,F=24.9408,p=0.0025<0.05,s2=0.4897于是由它得到的预测模型为y=83.2116+1.2985x1+2.3372x2。

做出残差和置信区间的图像如下:由图像可以看出,只有第一组数据的置信区间不包括零,改组数据可能有误,去掉之后再进行计算。

在命令栏中输入以下命令:输出结果如下所示:将结果列表如下:回归系数回归系数估计值回归系数置信区间β1 1.2877[0.7964,1.7790]β2 2.9766[2.3281,3.6250]R2=0.9768,F=84.3842,p=0.0005<0.05,s2=0.1257由它得到的回归模型为y=81.4881+1.2877x1+2.9766x2。

对于实验结果的分析:回归模型:y=81.4881+1.2877x1+2.9766x2。

数学实验回归分析

数学实验回归分析
剔除之后结果如下:
回归系数
回归系数估计值
回归系数置信区间
β0
-35.5229
[-45.1435 -25.9023]
β1
1.6040
[0.7661 2.4418]
β2
3.3581
[1.1590 5.5572]
R2=0.9111F=76.9102P<0.0001S2=9.3423
同未剔除异常点前相比,β估计值改变不大,但是置信区间变短,R2和F值提高,S2值变小。而且残差中没有异常点出现。因此可认为,剔除之后模型变得更精确。最终模型可以是:y=-35.5229+1.6040x1+3.3581x2
2.练习用回归分析解决实际问题。
二.问题描述
汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)18个月的调查资料如表,其中 是普通型汽车售量(千辆), 是豪华型汽车售量(千辆), 是汽油价格(元/gal), 是贷款利率(%)
(1)对普通型和豪华型汽车分别建立如下模型:
给出 的估计值和置信区间,决定系数 值及剩余方差等。
x3=[587 643 635 692 1248 643 1964 713 749 7895 762 2793 741 625 854 716 921 595 ];
n=18;
m=2;
X=[ones(n,1),x1',x2'];
[b,bint,r,rint,s]=regress(y',X);
b,bint,s
plot(x1,y,'+');pause;
plot(x2,y,'+');pause;
plot(x3,y,'+');pause;
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归分析
一实验目的
1 了解回归分析的基本原理,掌握MATLAB实现的方法;
2 练习用回归分析解决实际问题。

二实验内容
1电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),
建立回归模型并进行检验,诊断异常点的存在并进行处理。

每周收入9690959295959494
报纸广告费用 5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0初步解决:
首先对于题目作初步分析,题目中电视广告费用和报纸广告费用都会对与每周收入产生影响,但是两者对于每周收入的影响都是独立的。

首先画出散点图如下:
观察散点图之后,假设自变量与因变量满足多元线性关系。

设电视广告费用为x1,报纸
广告费用为x2,每周收入为y,那么每周收入与电视广告费用以及报纸广告费用的关系模型表示如下:
y=β0+β1x1+β2x2;
下面在MATLAB中输入以下命令:
输出结果如下所示:
结果列表如下:
回归系数回归系数估计值回归系数置信区间
β1 1.2985[0.4007,2.1962]
β2 2.3372[1.4860,3.1883]
R2=0.9089,F=24.9408,p=0.0025<0.05,s2=0.4897
于是由它得到的预测模型为y=83.2116+1.2985x1+2.3372x2。

做出残差和置信区间的图像如下:
由图像可以看出,只有第一组数据的置信区间不包括零,改组数据可能有误,去掉之后再进行计算。

在命令栏中输入以下命令:
输出结果如下所示:
将结果列表如下:
回归系数回归系数估计值回归系数置信区间
β1 1.2877[0.7964,1.7790]
β2 2.9766[2.3281,3.6250]
R2=0.9768,F=84.3842,p=0.0005<0.05,s2=0.1257由它得到的回归模型为y=81.4881+1.2877x1+2.9766x2。

对于实验结果的分析:
回归模型:y=81.4881+1.2877x1+2.9766x2。

对比剔除异常点后的分析结果可知,第一次分析的过程中,第一组数据的置信区间不包括零点,所以该点为异常点,需要剔除再进行一次计算。

剔除之后,发现所有点的置信区间都包括了零点。

剔除数据之后计算结果与剔除之前的比较
β0β0intβ1β1intβ2β2int
剔除后81.4881[78.7878,84.1883] 1.2877[0.7964,1.7790] 2.9766[2.3281,3.6250]
纵向比较可以看出,剔除了异常数据之后,置信区间明显的有了缩小,所以说,剔除异常数据可以有利于更加精确地建立模型。

2汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)18个月的调查资料见下表,其中y1是普通型汽车售量(千辆),y2是豪华型汽车售辆(千辆),x1是汽油价格(元/gal),x2是贷款利率(%)。

序号y1y2x1x2
215.4 5.4 1.94 6.2
311.77.6 1.95 6.3
410.3 2.5 1.828.2
511.4 2.4 1.859.8
67.5 1.7 1.7810.3
713.0 4.3 1.7610.5
812.8 3.7 1.768.7
914.6 3.9 1.757.4
1018.97.0 1.74 6.9
1119.3 6.8 1.70 5.2
1230.110.1 1.70 4.9
1328.29.4 1.68 4.3
1425.67.9 1.60 3.7
1537.514.1 1.61 3.6
1636.114.5 1.64 3.1
1739.814.9 1.67 1.8
1844.315.6 1.68 2.3
(1)对普通型和豪华型汽车分别建立如下模型:
y1=β0(1)+β1(1)x1+β2(1)x2;y2=β0(2)+β1(2)x1+β2(2)x2.
给出β的估计值和置信区间,决定系数R2,F值及剩余方差等;
(2)用x3=0,1表示汽车类型,建立统一模型:y=β0+β1x1+β2x2+β3x3,给出β估计
值和置信区间,决定系数R2,F值及剩余方差等。

以x3=0,1代入统一模型,将结果与
(1)的两个模型比较,解释二者的区别;
(3)对统一模型就每种类型汽车分别作x1和x2与残差的散点图,有什么现象,说明模型有何
缺陷?
(4)对统一模型增加二次项和交互项,考察结果有什么改进。

初步解决:
(1)首先研究y1,在命令栏中输入以下命令:
输出结果如下:
结果列表如下:
回归系数回归系数估计值回归系数置信区间
β1−27.6588[−54.5542,−0.7634]
β2−3.2283[−4.2747,−2.1819] R2=0.8593,F=45.7992,p<0.05,s2=20.7910
由它得到的回归模型为:y=90.1814−27.6588x1−3.2283x2。

β1、β2的置信区间不包含零点,且p<α,且计算可得,F(1,n−2),1−α=4.4940<F,所以该模型有效。

下面研究y2,在命令栏中输入以下内容:
输出结果如下:
结果列表如下:
回归系数回归系数估计值回归系数置信区间
β1−4.6285[−16.0184,6.7615]
β2−1.4360[−1.8792,−0.9929] R2=0.8402,F=39.4474,p<0.05,s2=3.7288
由它得到的回归模型为:y=24.5471−4.6285x1−1.4360x2。

β1的置信区间包含了零点,所以该模型无效。

(2)对于统一模型,用x3来表示车的类型,x3=0表示普通型,x3=1表示豪华型。

在命令栏中输入以下内容:
输出结果如下所示:
结果列表如下:
回归系数回归系数估计值回归系数置信区间
β1−16.1436[−35.1193,2.8320]
β2−2.3322[−3.0705,−1.5939]
β3−14.4222[−17.6546,−11.1898] R2=0.8366,F=54.6111,p<0.05,s2=22.6642
由它得到的统一回归模型为:y=64.5753−16.1436x1−2.3322x2−14.4222x3。

β1的置信区间包含了零点,所以该模型无效。

下面对这个统一模型进行研究:
首先将x3=0代入统一模型,得到回归模型为y1’=64.5753−16.1436x1−2.3322x2,然后将x3=1代入统一模型,得到回归模型为y2’=50.1531−16.1436x1−2.3322x2。

与第一问的结果相比相差较大,说明该模型并不合适。

(3)对于第二问中求出的的统一模型,分别画出x1、x2与残差的散点图。

首先是x1与残差的散点图:
然后是x2与残差的散点图:
对于两幅图,纵轴均为残差,横轴分别为x1和x2。

两种类型的汽车残差分布不同,这说明x3(即汽车类型)与x1、x2有交互作用,模型中应添加交互项。

(4)在MATLAB中尝试使用逐步回归来建立包括二次项和交互项的模型。

在命令栏中输入以下命令:
然后经过不断的调试,找到使s最小的情况,如下图所示:
于是,由它得到的模型为
y=52.6799−71.5312x3−4.004x1x2+1.7005 x2x3+26.7164 x1x3+0.2888x22另外:
R2=0.9396 , F= 93.3844,p< 0.0000, s=2.9886。

相关文档
最新文档