20115394王福临数学实验作业(回归分析)
20115394王福临数学实验作业(线性规划)
20115394王福临数学实验作业(线性规划)重庆大学学生实验报告实验课程名称数学实验开课实验室DS1421学院计算机学院年级大二专业计科三班学生姓名陈道县学号20115314开课时间至学年第学期数理学院制开课学院、实验室:数理学院DS1401 实验时间:2013 年 4 月23 日每种饲料每磅的成本2,运输问题从Toronto 和Detroit两市分别有两批货物途径Chicago 和Buffalo 最终到达New York 、Phila.和St.louis 市.之间的路线表述如下图:Toronto1Detroit 2Chicago3Buffalo 4New York 5Phila.6St. louis7Source TransshipmentPoint Destination其中Toronto和Detroit 分别有600和500的货物需要运出,New York、Phila. 和St.louis的货物需求分别是450、350和300.每一段上的运输单价如下面两表:问:如何进行运输安排使整个的运输费用最少?试建立问题的数学模型并求出最优解。
3、投资策略某部门现有资金10万元,五年内有以下投资项目供选择:项目A:从第一年到第四年每年初投资,次年末收现有五种饲料,公司希望找出满足动物营养需要使成本达到最低的混合饲料配置。
每一种饲料每磅所含的营养成分每种饲料每磅的成本Min0.02x1+0.07x2+0.04x3+0.03x4+0.05x5St:-0.3x1-2x2-x3-0.6x4-1.8x5<=-70-0.1x1-0.05x2-0.02x3-0.2x4-0.05x5<=-3-0.05x1-0.1x2-0.02x3-0.X1>=02x4-0.08x5<=-9.1X1>=0 ;x2>=0;x3>=0;x4>=0;x5>=0程序如下:c=[0.02;0.07;0.04;0.03;0.05];问:如何进行运输安排使整个的运输费用最少?试建立问题的数学模型并求出最优解。
回归分析实验报告
回归分析实验报告实验报告:回归分析摘要:回归分析是一种用于探究变量之间关系的数学模型。
本实验以地气温和电力消耗量数据为例,运用回归分析方法,建立了气温和电力消耗量之间的线性回归模型,并对模型进行了评估和预测。
实验结果表明,气温对电力消耗量具有显著的影响,模型能够很好地解释二者之间的关系。
1.引言回归分析是一种用于探究变量之间关系的统计方法,它通常用于预测或解释一个变量因另一个或多个变量而变化的程度。
回归分析陶冶于20世纪初,经过不断的发展和完善,成为了数量宏大且复杂的数据分析的重要工具。
本实验旨在通过回归分析方法,探究气温与电力消耗量之间的关系,并基于建立的线性回归模型进行预测。
2.实验设计与数据收集本实验选择地的气温和电力消耗量作为研究对象,数据选取了一段时间内每天的气温和对应的电力消耗量。
数据的收集方法包括了实地观测和数据记录,并在数据整理过程中进行了数据的筛选与清洗。
3.数据分析与模型建立为了探究气温与电力消耗量之间的关系,需要建立一个合适的数学模型。
根据回归分析的基本原理,我们初步假设气温与电力消耗量之间的关系是线性的。
因此,我们选用了简单线性回归模型进行分析,并通过最小二乘法对模型进行了估计。
运用统计软件对数据进行处理,并进行了以下分析:1)描述性统计分析:计算了气温和电力消耗量的平均值、标准差和相关系数等。
2)直线拟合与评估:运用最小二乘法拟合出了气温对电力消耗量的线性回归模型,并进行了模型的评估,包括了相关系数、残差分析等。
3)预测分析:基于建立的模型,进行了其中一未来日期的电力消耗量的预测,并给出了预测结果的置信区间。
4.结果与讨论根据实验数据的分析结果,我们得到了以下结论:1)在地的气温与电力消耗量之间存在着显著的线性关系,相关系数为0.75,表明二者之间的关系较为紧密。
2)构建的线性回归模型:电力消耗量=2.5+0.3*气温,模型参数的显著性检验结果为t=3.2,p<0.05,表明回归系数是显著的。
20115394王福临数学实验作业(解方程)
重庆大学学生实验报告实验课程名称数学实验开课实验室学院计算机学院年级大二专业计科六班学生姓名王福临学号20115394开课时间至学年第学期总成绩教师签名数理学院制开课学院、实验室:DS1401 实验时间:2013 年3月24 日课程名称数学实验实验项目名称飞机如何定价——方程求解实验项目类型验证演示综合设计其他指导教师陈道县成绩实验目的[1] 复习求解方程及方程组的基本原理和方法;[2] 掌握迭代算法;[3] 熟悉MATLAB软件编程环境;掌握MATLAB编程语句(特别是循环、条件、控制等语句);[4] 通过范例展现求解实际问题的初步建模过程;通过该实验的学习,复习和归纳方程求解或方程组求解的各种数值解法(简单迭代法、二分法、牛顿法、割线法等),初步了解数学建模过程。
这对于学生深入理解数学概念,掌握数学的思维方法,熟悉处理大量的工程计算问题的方法具有十分重要的意义。
基础实验一、实验内容1.方程求解和方程组的各种数值解法练习2.直接使用MATLAB命令对方程和方程组进行求解练习3.针对实际问题,试建立数学模型,并求解。
二、实验步骤1.开启软件平台——MATLAB,开启MATLAB编辑窗口;2.根据各种数值解法步骤编写M文件3.保存文件并运行;4.观察运行结果(数值或图形);5.根据观察到的结果写出实验报告,并浅谈学习心得体会。
三、实验要求与任务1.用图形放大法求解方程x sin(x) = 1. 并观察该方程有多少个根。
2.将方程x 5+5x3- 2x+ 1 = 0 改写成各种等价的形式进行迭代,观察迭代是否收敛,并给出解释。
3.用MA TLAB命令求下列方程的根1)e-3xsin(4x+2)+4 e-0.5xcos(2x) =0.52)22/2/2222sin()0 cos()0 xy xx yx e e xyx x y y e--+⎧+=⎪⎨++=⎪⎩应用实验1. 炮弹发射角的问题炮弹发射视为斜抛运动,已知初始速度为200 m/s,问要击中水平距离360m、垂直距离160m 的目标,当忽略空气阻力时,发射角应多大?此时炮弹的运行轨迹如何?试进行动态模拟。
回归分析知识及习题.doc
A.(0,0 )点C・(0,D.(xJ) 归分析的基本知识点及习题1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
2.线性回归方程y = hx^a中系数计算公式:-无)(月-顼)一亦顼/;= ---------- = -------- , a = y-bx9其中元,"表示样本均值.支3-元)2 力;-济/=! /=!3.回归直线必过样本点中心(% ,顼)A卷一、选择题:1 .炼钢时钢水的含碳量与冶炼时间有()A.确定性关系B.相关关系C.函数关系D.无任何关系2.对相关性的描述正确的是()A.相关性是一种因果关系B.相关性是一种函数关系C.相关性是变量与变量之间带有随机性的关系D.以上都不正确3.£时等于()/=!+X2y2+••・ D.X1- +工2>2 +••・+ "”4.设有-一个回归方程为y =2--2.5% ,则变量x增加一个单位时()A. y平均增加2.5个单位B. y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位A.3| +x2+••• + ◎'B.()\ +)Z +•.. + )'〃)5. y^jx之间的线性回归方程y =bx +a必定过()A.y = 11.47+ 2.62] C.y = 11.47x + 2.62 y = —11.47 +2.62工D. y = 11.47 -2.62x则系数的值为()£(玉—元)3,.-力/=!T)()f C. ----------------/=!已知x、y之间的一组数据:ZST)()',7)B. -----------------------n/=!£(气-玲26.某化工厂为预测某产品的问收率y,需要研究它和原料有效成分含量x之间8 8的相关关系,现取了8对观测值,计算得£兀=52, £乂=228,/=1 /=18 8£对二478,£易力=1849,则y与x的回归方程是()/=! /=!7•线性回归方程y = bx + a有一组独立的观测数据(为必),(方况),…,"〃,)%),贝,J y -W x的线性回归方程y = bx-\-a必过点()A.(2, 2)B.( 1.5,0)C. (1,2)D.(1.5,4)二、填空题:9.线性回归方程y = hx +a中,/?的意义是.10.有下列关系:⑴人的年龄与他(她)拥有的财富之间的关系;⑵曲线上的点写该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系.其中有相关关系的是.11.若施化肥量尤与水稻产量y的回归直线方程为y = 5x + 250 ,当施化肥量为SO kg时,预计的水稻产量为E(.v; - .y)2 i=l12.己知线性回归方程y = 1.5、+ 45(券{1,5,7,13,19}),则亍=.13.对于线性回归方程y = 4.75x + 257,当x = 28时,y的估计值是.三、解答题:14.为了研究三月下旬的平均气温(x°C)与四月二十号前棉花害虫化蛹高峰日(),)的关系,某地区观察了1996年至2001年的情况,得到下面的数据:(1)据气象预测,该地区在2002年三刀下旬平均气温为27°C,试估计2002年四月化蛹高峰日为哪天?(2)对变量心y进行相关性判断.•、选择题:1 .变量y与工之间的回归方程()A.表示y与工之间的函数关系B.表示y与尤之间的不确定性关系C.反映y与x之间真实关系的形式D.反映y-^x之间的真实关系达到最大限度的吻合3.由一组样本数据(羽,)\), (了2, ),2),…,(%)%)得到的回归直线方程y = bx + a , 那么下面说法不正确的是()A.直线y = bx + a必经过点(克力B.直线y=bx +a至少经过点(叫,)、),(^,/,…,(知)'〃)中的一个点Z也月—亦》C.直线y^bx + a的斜率为----------〃 2 -2Xj 一心D.直线)>= bx + a和各点(%], y)), (x2, ),•••, (x n, )的偏差[y y - (bx f +。
回归分析答案
试验设计作业1、下表为小麦栽培试验的产量结果(kg),随机区组设计,小区计产面积为12m2,试作分析。
在表示最后结果时需化为每亩产量(kg)。
假定该试验为一完全随机设计,试分析后将其试验误差与随机区组时的误差作一比较,看看划分区组的效果如何?处理区组ⅠⅡⅢⅣA 6.2 6.6 6.9 6.1B 5.8 6.7 6.0 6.3C 7.2 6.6 6.8 7.0D 5.6 5.8 5.4 6.0E 6.9 7.2 7.0 7.4F 7.5 7.8 7.3 7.6 完全随机设计的程序如下:data li_1;do i=1 to 6;do j=1 to 4;input x@@;output;end;end;cards;6.2 6.6 6.9 6.15.86.7 6 6.37.2 6.6 6.8 75.6 5.8 5.4 66.97.2 7 7.47.5 7.8 7.3 7.6;proc anova;class i;model x=i;means i;run;SAS输出结果如下: Sum ofSource DF Squares Mean Square F Value Pr > F Model 5 8.97208333 1.79441667 20.87 <.0001 Error 18 1.54750000 0.08597222Corrected Total 23 10.51958333R-Square Coeff Var Root MSE x Mean0.852893 4.406415 0.293210 6.654167Source DF Anova SS Mean Square F Value Pr > F i 5 8.97208333 1.79441667 20.87 <.0001随机区组设计的程序如下:data li_3;do i=1 to 6;do j=1 to 4;input x@@;output;end;end;cards;6.2 6.6 6.9 6.15.86.7 6 6.37.2 6.6 6.8 75.6 5.8 5.4 66.97.2 7 7.47.5 7.8 7.3 7.6;proc anova;class i j;model x=i j;run;结果如下:Sum ofSource DF Squares Mean Square F Value Pr > F Model 8 9.24333333 1.15541667 13.58 <.0001 Error 15 1.27625000 0.08508333Corrected Total 23 10.51958333R-Square Coeff Var Root MSE x Mean0.878679 4.383576 0.291690 6.654167Source DF Anova SS Mean Square F Value Pr > Fi 5 8.97208333 1.79441667 21.09 <.0001j 3 0.27125000 0.09041667 1.06 0.3943结果分析:随机区组设计的误差要小一些。
回归分析实验报告
实验报告实验名称:数据整理与分析相关分析实验报告实验课程:统计学数据的整理与分析一、实验目的:学会运用 Excel 中次数分布表、透视表、统计图以及描述性统计功能来分析一组有调查意义的数据;从而通过分析得出有意义的结论以及推测预计。
二、实验原理:次数分布表的制作过程,第一步找出最大、最小值,确定全距R;第二步利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距;第三步分组,根据分组标志和分组上限确定在组内数据的频数以及频率。
数据透视表,选中当前数据库表中人一个单元格,单击菜单中的“数据”—“数据透视表与数据透视图”。
直方图是在平面坐标上一横轴根据各组组距的宽度标明各组组距,一纵轴根据次数的高度表示各组次数绘制成的统计图。
折线图是在直方图的基础上,用折线连接各个直方形顶边中点并在直方图形两侧各延伸一组,使者限于横线相连。
三、实验环境:实验地点:实训楼计算机实验中心五楼实验室 3试验时间:第五周周二实验软件: Microsoft Excel 2003四、实验内容1、(1)在数据源中选取所需数据,对数据进行分析。
利用Excel 对数据进行描述性统计分析。
实验内容包括:数据分组、直方图、描述性分析、透视表、实验结果分析。
(2)数据资料:数据来源“9-33各地区农村居民家庭平均每人主要食品消费量(2008 年 )”如下图所示。
2、实验步骤第一步:在数据库中把所要研究的数据对象复制黏贴到新建的Excel 工作表sheet1 中。
我要研究的是“各地区农村居民家庭平均每人主要食品消费量 (2008 年 ) ”挑选了其中的蔬菜。
第二步:对 sheet2 中的数据进行分组。
(1)找出这31个数据中的最大、最小值,得到全距R(2)其次利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距 i ;(3)然后分组,根据分组标志和分组上限确定在组内数据的频数以及频率(4)最后得到全国各地区蔬菜消费量的次数分布表。
1.1回归分析的基本思想及其初步应用
方案2 选用y=bx2+a ,还是 还是y=bx2+cx+a ? 选用 如何求a、 如何求 、b ?
y=bx2+a 非线性关系 变换 t=x2 y=bx+a 线性关系
问题2 问题
问题3 问题
产卵数
400 300 200
气
100
温
0 -40 -30 -20 -10 0 -100 -200 10 20 30 40
教
教法学法 评价分析
3
产卵数
450 400 350 300 250 200 150 100 50 0 -5 -50 0
数 数
气 温
-10
5
10
15
20
25
30
35
40
数
数
数
?
y=bx+a
y = c110c2 x
教材分析
教学设计
教法学法 评价分析
方案2解答
平方变换: 平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
教材分析
教学设计
教法学法 评价分析
探索新知
方案1
350
解:选取气温为解释变量x,产卵数 为预报变量y。
选变量
300 250
200
画散点图
150 100
50
选模型
0 0 3 6 9 12 15 18 21 24 27 30 33 36 39
假设线性回归方程为 :ŷ=bx+a 估计参数 由计算器得: 由计算器得:线性回归方程为y=19.87x-463.73 相关指数R 相关指数R2=r2≈0.8642=0.7464 分析和预测 当x=28时, =19.87×× 时 时 当x=28时,yy =19.87×28-463.73≈ 93 ×28-463.73≈ 93
高中数学 3.2回归分析课时作业(含解析)新人教B版选修2-3
【成才之路】2015-2016学年高中数学 3.2回归分析课时作业 新人教B 版选修2-3一、选择题1.炼钢时钢水的含碳量与冶炼时间有( ) A .确定性关系 B .相关关系 C .函数关系 D .无任何关系[答案] B2.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程的截距为( )A .a ^=y +b ^xB .a ^=y +b ^x C .a ^=y -b ^x D .a ^=y -b ^x [答案] D[解析] 回归直线方程中截距为a ^, 由公式y =b ^ x +a ^得 a ^=y -b ^x .故选D.3.若回归直线方程中的回归系数b =0,则相关系数为( ) A .r =1 B .r =-1 C .r =0 D .无法确定[答案] C[解析] 因为b =∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=0,所以r =∑i =1nx i y i -n x y∑i =1nx 2i -n x2∑i =1ny 2i -n y 2=0.4.下列四个图各反映了两个变量的某种关系,其中可以看作具有较强线性相关关系的是( )A .①③B .①④C .②③D .①②④[答案] B[解析] 由图可知,①④两个图反映了两个变量具有较强的线性相关关系,故选B. 5.设有一个回归方程y =3-5x ,变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位 D .y 平均减少3个单位 [答案] B[解析] ∵-5是斜率的估计值,说明x 每增加一个单位时,y 平均减少5个单位. 故选B.6.观测两个相关变量,得到如下数据:x -1 -2 -3 -4 -5 5 4 3 2 1 y-0.9-2-3.1-3.9-5.154.12.92.10.9A .y ^=0.5x -1 B .y ^=x C .y ^=2x +0.3 D .y ^=x +1[答案] B[解析] 因为x -=0,y -=-0.9-2-3.1-3.9-5.1+5+4.1+2.9+2.1+0.910=0,根据回归直线方程必经过样本中心点(x -,y -)可知,回归直线方程过点(0,0),所以选B.7.已知回归直线斜率的估计值是 1.23,样本平均数x =4,y =5,则回归直线方程为( )A .y ^=1.23x +4 B .y ^=1.23x +5 C .y ^=1.23x +0.08 D .y ^=0.08x +1.23[答案] C 二、填空题8.已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为____________. [答案] 11.69[解析] y 的估计值就是当x =25时的函数值,即0.50x -0.81=11.69. 9.下列五个命题,正确命题的序号为____________. ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.[答案] ③④⑤[解析] 变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.三、解答题10.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (t)与相应的生产能耗y (t 标准煤)的几组对照数据.x 3 4 5 6 y2.5344.5(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=bx +a ;(3)已知该厂技改前100 t 甲产品的生产能耗为90 t 标准煤.试根据(2)求出的线性回归方程预测生产100 t 甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) [解析] (1)由题设所给数据,可得散点图如下图.(2)由对照数据,计算得:∑i =14x 2i =86, x =3+4+5+64=4.5, y =2.5+3+4+4.54=3.5,已知∑i =14x i y i =66.5,所以由最小二乘法确定的回归方程的系数为b =∑i =14x i y i -4x y∑i =14x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7, a =y -b x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y =0.7x +0.35.(3)由(2)的回归方程及技改前生产100 t 甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(t 标准煤).一、选择题1.由变量x 与y 相对应的一组数据(1,y 1)、(5,y 2)、(7,y 3)、(13,y 4)、(19,y 5)得到的线性回归方程为y ^=2x +45,则y -=( )A .135B .90C .67D .63[答案] D[解析] ∵x -=15(1+5+7+13+19)=9,y -=2x -+45,∴y -=2×9+45=63,故选D. 2.两个相关变量满足如下关系:x 10 15 20 25 30 y10031005101010111014A .y ^=0.56x +997.4 B .y ^=0.63x -231.2 C .y ^=50.2x +501.4 D .y ^=60.4x +400.7[答案] A[解析] 利用公式b =∑i -1nx i y i -n xy∑i -1nx 2i -n x 2≈0.56.a =y -b x ≈997.4.∴回归直线方程为y ^=0.56x +997.4. 故选A .简解:x =20,y =1008.6,将x 、y 代入各直线方程检验可知选A .3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( ) A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg [答案] D[解析] 本题考查线性回归方程.D 项中身高为170cm 时,体重“约为”58.79kg,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系.二、填空题4.若预报体重y (kg)和身高x (cm)之间的线性回归方程为y ^=0.849x -85.712,如果要找到体重为41.638kg 的人,____________是在身高为150cm 的人群中.(填“一定”或“不一定”)[答案] 不一定[解析] 体重不仅受身高的影响,还受其他因素影响. 5.已知两个变量x 和y 线性相关,5次试验的观测数据如下:x 100 120 140 160 180 y4554627592那么变量y 关于x [答案] y ^=0.575x -14.9 三、解答题6.针对某工厂某产品产量与单位成本的资料进行线性回归分析:月份 产量(千件)x单位成本(元/件)yx 2xy1 2 73 4 146 2 3 72 9 216 3 4 71 16 284 4 3 73 9 219 5 4 69 16 276 6 5 68 25 340 合计21426791481[解析] 设回归直线方程为y ^=b ^x +a ^,x =216,y =4266=71,∑i =16x 2i =79,∑i =16x i y i =1 481,所以代入公式,b ^=1 481-6×216×7179-6×2162=-105.5≈-1.818 2,a ^=71-(-1.818 2)×216≈77.36,故回归直线方程为y ^=77.36-1.82x .7.在一段时间内,某种商品价格x (万元)和需求量Y (t)之间的一组数据为价格x 1.4 1.6 1.8 2 2.2 需求量Y1210753(1)(2)求出Y 对x 的回归直线方程,并在(1)的散点图中画出它的图象; (3)如价格定为1.9万元,预测需求量大约是多少?(精确到0.01t) [解析] (1)由题设所给数据,可得散点图如下:(2)采用列表的方法计算a 与与回归系数b .序号 xyx 2xy1 1.4 12 1.96 16.8 2 1.6 10 2.56 163 1.8 7 3.24 12.6 4254105 2.2 3 4.84 6.6 ∑93716.662x =15×9=1.8,y =5×37=7.4,b ^=62-5×1.8×7.416.6-5×1.82≈-11.5,a ^=7.4+11.5×1.8=28.1,则Y 对x 的回归直线方程为y ^=a ^+b ^x =28.1-11.5x . (3)当x =1.9时,Y =28.1-11.5×1.9=6.25, 所以价格定为1.9万元,需求量大约是6.25(t).8.已知某地每单位面积菜地年平均使用氮肥量x (kg)与每单位面积蔬菜年平均产量y (t)之间的关系有如下数据:年份1985 1986 1987 1988 1989 1990 1991 1992 x (kg) 70 74 80 78 85 92 90 95 y (t) 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0年份1993 1994 1995 1996 1997 1998 1999 x (kg) 92 108 115 123 130 138 145 y (t)11.511.011.812.212.512.813.0(2)若线性相关,求蔬菜产量y 与使用氮肥量x 之间的回归直线方程,并估计每单位面积施氮肥150kg 时,每单位面积蔬菜的年平均产量.[解析](1)列出下表,并用科学计算器进行相关计算:i 1 2 3 4 5 6 7 8 x i 70 74 80 78 85 92 90 95 y i 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 x i y i 357444544608.4765938.4900 1140i 9 10 11 12 13 14 15 x i 92 108 115 123 130 138 145 y i 11.5 11.0 11.8 12.2 12.5 12.8 13.0 x i y i1058118813571500.616251766.41885x =151515=101,y =151.715≈10.11, ∑i =115x 2i =161125,∑i =115y 2i =1628.55,∑i =115x i y i =16076.8.故蔬菜产量与施用氮肥量的相关系数r =16076.8-15×101×10.11161125-15×10121628.55-15×10.112≈0.8643.由小概率0.05与n -2在附表中查得相关系数临界值r 0.05=0.514,则r >r 0.05,说明有95%的把握认为蔬菜产量与施用氮肥量之间存在着线性相关关系.(2)设所求的回归直线方程为y ^=b ^x +a ^,则b ^=∑i =115x i y i -15x y∑i =115x 2i -15x 2=16076.8-15×101×10.11161125-15×1012≈0.0937, a ^=y -b ^x ≈10.11-0.0937×101=0.6463,∴回归直线方程为y ^=0.0937x +0.6463.∴当每单位面积施氮肥150kg 时,每单位面积蔬菜年平均产量为0.0937×150+0.6463≈14.701(t).[方法总结] 本题主要考查对两个变量的相关性检验和回归分析.(1)使用样本相关系数计算公式来完成;(2)先作统计假设,由小概率0.05与n -2在附表中查得相关系数临界值r 0.05,若r >r 0.05则线性相关,否则不线性相关.。
高中数学选修1-2课时作业3:1.1 回归分析的基本思想及其初步应用
1.1回归分析的基本思想及其初步应用一、选择题1.炼钢时钢水的含碳量与冶炼时间有()A.确定性关系B.相关关系C.函数关系D.无任何关系2.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要__________h.()A.6.5 B.5.5C.3.5 D.0.53.工人月工资y(元)依劳动生产率x(千元)变化的回归方程=50+80x,下列判断正确的是()(1)劳动生产率为1000元时,工资为130元;(2)劳动生产率提高1000元时,则工资提高80元;(3)劳动生产率提高1000元,则工资提高130元;(4)当月工资为210元时,劳动生产率为2000元.A.(1) B.(2)C.(3) D.(4)4.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为()A. =x+1B. =x+2C. =2x+1D. =x-15.y与x之间的线性回归方程=x+必定过()A.(0,0)点B.(,0)点C.(0,)点D.(,)点6.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A. =-10x+200B. =10x+200C. =-10x-200D. =10x-2007.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观察值,计算得i=52,i=228,=478,i y i=1849,则y与x的回归方程是()A. =11.47+2.62xB. =-11.47+2.62xC. =2.62+11.47xD. =11.47-2.62x8.若一个样本的总偏差平方和为256,残差平方和为32,则回归平方和为()A.224 B.288C.320 D.1929.散点图在回归分析过程中的作用是()A.查找个体个数B.比较个体数据大小关系C.探究个体分类D.粗略判断变量是否线性相关10.由一组数据(x1,y1),(x2,y2),…,(x n,y n)得到的回归直线方程=x+,则下列说法不正确的是()A.直线=x+必过点(,)B.直线=x+至少经过点(x1,y1)(x2,y2)……(x n,y n)中的一个点C.直线=x+的斜率为D.直线=x+和各点(x1,y1),(x2,y2),…,(x n,y n)的偏差是该坐标平面上所有直线与这些点的偏差中最小的直线二、填空题11.回归分析是处理变量之间________关系的一种数量统计方法.12.已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为________.13.在线性回归模型中,R2表示________对预报变量变化的贡献率,R2越________,表示回归模型的拟合效果越好.14.已知两个变量x和y之间有线性相关性,5次试验的观测数据如下表:那么变量y关于x的回归方程是________.三、解答题15.某工厂的产品产量与单位成本的资料如下表所示,请进行线性回归分析.16.某5名学生的数学成绩和化学成绩如下表:(1)画出散点图.(2)如果x、y呈线性相关关系,求y对x的线性回归方程.17.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格.18.研究某灌溉渠道水的流速y与水深x之间的关系,测得一组数据如下:(1)求y对x的回归直线方程;(2)预测水深为1.95m时水的流速是多少?[答案]1.[答案]B[解析]通过散点图可以知有相关关系.2.[答案]A[解析]将x=600代入回归方程即得A.3.[答案]B4.[答案]A[解析]A、B、C、D四点在同一条直线上.5.[答案]D[解析](,)为样本点的中心,回归直线过样本点的中心.6.[答案]A[解析]本题主要考查变量的相关性.由负相关的定义知,A正确.7.[答案]A8.[答案]A9.[答案]D[解析]散点图能直观形象地反映两个变量间的关系,可以粗略判断两个变量间是否存在线性关系.10.[答案]B11.[答案]相关12.[答案]11.6913.[答案]解释变量接近114.[答案] =0.575x-14.915.[答案]根据公式计算可得=0.575,=-14.9,所以回归直线方程是=0.575x-14.9. [解析]设回归直线方程为=x+,=,==71,=79,i y i=1 481,∴==≈-1.818 2,=71-(-1.818 2)×≈77.36.回归直线方程为=77.36-1.818 2x.由回归系数为-1.818 2知,产量每增加1 000件,单位成本下降约1.82元.16.[解析](1)散点图如图(2) =73.2,=67.8,=27174,=23167,y i=25054,i∴=≈0.625,=-=22.05,所求回归方程为=22.05+0.625x17.[解析](1)数据对应的散点图如下图所示:(2) =x i=109,l xx=(x i-)2=1570,=23.2,l xy=(x i-)(y i-)=308.设所求回归直线方程为=x+,则==≈0.1962,=-=1.8166.故所求回归直线方程为=0.1962x+1.8166.(3)据(2),当x=150m2时,销售价格的估计值为=0.1962×150+1.8166=31.2466(万元).18.[解析](1)散点图如下图所示.列表计算与回归系数.于是=×14=1.75,=×15.82=1.9775,∑x=24.92,∑x i y i=27.993,∴=≈0.7333,=-=1.9775-0.7333×1.75=0.6942,∴y对x的回归直线方程为=+=0.6942+0.7333x.(2)在本题中回归系数=0.7333的意思是:在此灌溉渠道中,水深每增加0.1m,水的流速平均增加0.7333m/s,=0.6942,可以解释为水的流速中不受水深影响的部分,把x=1.95代入得到=0.6942+0.7333×1.95≈2.12(m/s),计算结果表明:当水深为1.95m时可以预报渠水的流速约为2.12m/s.。
1.1《回归分析》限时练
已知下表所示数据的回归直线方程为,则实数
,若生产
2.5 4.5
),用最小二乘法近似得到回归直线方程为
回归直线过样本的中心点
,则其体重约增加
,则可断定其体重必为
呈现线性相关关系,回归方程为
的线性回归方程=1.2
如图是一组数据的散点图,经最小二乘法计算,得线性回归方程为,则
根据上标可得回归直线方程为=1.3+
限时练第1页,共2页功夫不负有心人
(,⑤在回归直线方程每增加一个单位时,预报变量
)求线性回归方程=x中的、
(最小二乘法求线性回归方程系数公式=,=-).)求线性回归方程;(参考数据:)
,-.
限时练第2页,共2页功夫不负有心人。
第1部分 回归分析 共45页
148
[ -636 931 ]
R2=0.957 F=226 p=0.000
资历增加1年薪 金增长546
管理人员薪金多 6883
中学程度薪金比更 高的少2994
R2,F, p 模型整体上可用
x1~资历(年) x2 = 1~ 管理,x2 = 0~ 非管理
中学:x3=1, x4=0;大 学:x3=0, x4=1; 更高:
a4
-356
[-431 –281]
a5
-3056
[-3171 –2942]
a6
2019
[1894 2100]
R2= 0.9998 F=36701 p=0.0000
200 100
0 -100 -200
0 200 100
0 -100 -200
1
e ~ x1
5
10
15
20
e ~组合
2
3
4
5
6
R2: 0.957 0.999 0.9998
价格差 x1=0.1
y ˆx 1 0 .1 3 0 .2 2 6 7 7 .7 5 5 8 x 2 0 .6 7 1 2 x 2 2
价格差 x1=0.3
y ˆx1 0 .33.4 258 3 .055x21 0 .3 67x2 21
yˆ
yˆ yˆ x2 7.5357 x10.3
其它
中学:x3=1, x4=0 ; 大学:x3=0, x4=1; 更高:x3=0, x4=0
资历每加一年薪金的增长是常数;
管理、教育、资历之间无交互作用
线性回归模型 y a 0 a 1 x 1 a 2 x 2 a 3 x 3 a 4 x 4
人教B版高二数学选修 回归分析(1)-1教案
教案
原创不容易,为有更多动力,请【关注、关注、关注】,谢谢!东宫白庶子,南寺远禅师。
——白居易《远师》
青海一中李清
1
1
(i n
i ===
∑
x 的回归直线方程为 从散点图上可以看出,这三幅图,样本点成条状分布,大
致分布在一条直线附近,具有近似的线性相关关系,但集中程1
2i n
i b x -==
∑527.291.
bx -≈527.591+14.453527.591+14.4531322.506y x ==≈55
x =
的回归直线方程是
【素材积累】
1、一个房产经纪人死后和上帝的对话一个房产经纪人死后,和上帝喝茶。
上
帝认为他太能说了,会打扰天堂的幽静,于是旧把他打入了地狱。
刚过了一个星期,阎王旧满头大汗找上门来说:上帝呀,赶紧把他弄走吧!上帝问:怎么回事?阎王说:地狱的小。
2、机会往往伪装成困难美国名校芝加哥大学的一位教授到访北大时曾提到:芝加哥大学对学生的基本要求是做困难的事。
因为一个人要想有所成旧,旧必须做那些困难的事。
只有做困难的事,才能推动社会发展进步。
【素材积累】
不怕你不懂不会,旧怕你不学不干。
笛里谁知壮士心,沙头空照征人骨。
摘避风的港湾里,找不到昂扬的帆。
如果爱,请深爱;如不爱,请离开。
富人靠资本赚钱,穷人靠知识致富。
20115394王福临数学实验作业(拟合)
有这个方程很容易解出
r>0时,是表示人口箭杆指数规律随时间无限增长,称为指数增长模型。
将上式取对数,可得y=rt+a,y=lnx(t),a=lnx0
二、用matlab编码
t=1790:10:1980;
x=[3.9 5.3 7.2 9.6 12.9 17.1 23.2 31.4 38.6 50.2 62.9 76.0 92 106.5 123.2 131.7 150.7 179.3 204.0 226.5];
3.matlab的学习完全基于对软件的不断联系。只有多上机练习,才能对相关知识熟悉,并灵活运用。
教师签名
年月日
2.旧车价格预测
某年美国旧车价格的调查资料如下表其中xi表示轿车的使用年数,yi表示相应的平均价格。试分析用什么形式的曲线来拟合上述的数据,并预测使用4.5年后轿车的平均价格大致为多少?
三、实验步骤
1.开启软件平台——MATLAB,开启MATLAB编辑窗口;
2.根据各种数值解法步骤编写M文件
3.保存文件并运行;
重庆大学
学生实验报告
实验课程名称数学实验
开课实验室DS1421
学院计算机学院年级大二专业计科三班
学生姓名王福临学号********
开课时间至学年第学期
总成绩
教师签名
数理学院制
开课学院、实验室:数理学院DS1401实验时间:2013年4月22日
课程
名称
数学实验
实验项目
Байду номын сангаас名称
拟合
实验项目类型
验证
演示
综合
设计
xi=linspace(0,10,100);
yi=curvefunl(k,xi);
苏教版高中数学选修二回归分析作业
苏教版选修二回归剖析作业基础达标某运动员训练次数与运动成绩之间的数据关系以下次数(x)32333537394446成绩(y)25343739424851试求y与x之间的回归直线方程.分析:∵x=38,y77272∴x i y i=10756,xi=10280,yii1i1i17x i y i7xy∴b^ =i1=1.6,a^=y-b^x=-722x i7xi1∴回归直线方程为y^=1.6x-21.37.2.观察硫酸铜在水中的溶解度y与温度x的关系时,做了9组试验,其数据以下温度x/℃01020304050607080溶解度y/g14.017.521.226.129.233.340.048.054.8求:(1)回归直线方程;(2)有关系数rx,y 72929分析:(1)利用计算器分别求出,xi,y i,x i y i,利用回归直线公式可求出i1i1i1b^=0.4992,a^=11.60可知,回归直线方程为y^=0.4992x (2)将上述数据代入有关系数公式,可得r=0.9874.3.研究某浇灌渠道水的流速y与水深x之间的关系,测得一组数据以下水深x/m 1.40 1.501.60 1.70 1.80 1.90 2.00 2.10流速y/(m·s-1)1.70 1.791.88 1.95 2.03 2.10 2.16 2.21求y对x的回归直线方程展望水深为1.95m时水的流速是多少分析:可采纳列表的方法计算a^与回归系数b^.序号x y x2xy1 1.40 1.70 1.96 2.3802 1.50 1.79 2.25 2.6853 1.60 1.88 2.56 2.6854 1.70 1.95 2.89 3.315 1.80 2.03 3.24 3.6546 1.90 2.10 3.61 3.9907 2.00 2.16 4.00 4.3208 2.10 2.21 4.41 4.641∑ 14.00 15.82 24.92 27.993于是,x =1×14.00=1.75,y =18827.9938 1.75 1.9775 1111b^=24.92 81.7520.694=15 15a^=1.9775-1115y 对x 的回归直线方程为y^=a^+b^x=0.694+0.733x回归系数b^=0.733 的意思是,在此浇灌渠道中 ,水深每增添 0.1m,水的流速均匀增添 0.073 m/s(本例数据是以 0.1 m 为水深间隔测得的),a^=0.694 能够解说为水的流速中不受水深影响 的部分(2)由(1)中求出的回归直线方程 ,把x=1.95代入,易得m/s).计算结果表示,当水深为1.95m 时能够展望水的流速约为 2.12m/s.从某地成年男子中随机抽取 n 人测得均匀身高 x =172cm, 标准差 x 均匀体重 y=72 4. , s=7.6cm,kg,标准差s y =15.2l xy=0.5.求由身高预计均匀体重的回归方程kg,有关系数r=l xx lyyy^=β^0+β^1x,以及由体重预计均匀身高的回归方程x^=a^+b^y.分析:∵s x =lxx,s y =lyynnlxylxxlyy∴nnnlxy∴β^n 57.761=l xx 7.62n1218.52.8475x i y i 12xy54.24312于是可得 b= i11212 2218.5 )2x i29.808 12 (12xi112β^0 y -x β^1 ×= =72-172 1=-∴由身高预计均匀体重的回归方程为y^=x-lxy由x、y地点的对称性,得b^=n57.76l yy15.22n∴a^=x-y b^=172-∴由体重预计均匀身高的回归方程为x^=0.25y+154 .5.一个工厂在某年里每个月产品的总成本y(万元)与该月产量x(万件)之间有以下一组数据:x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50画出散点图;求月总成本y与月产量x之间的回归直线方程分析:(1)画出的散点图以下图(2)经过计算器可得b^≈1.a^=y-b^x=2.8475-1.21518.5×12所以所求的回归直线方程是y^=1.215x6.已知10只狗的血球体积及红血球数的丈量值以下表:血球体45424648423558403950积x(mm)红血球 6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72数y(百万)若已知两者有关,求出回归直线方程思路剖析:求回归直线方程,就是由公式计算b^与a^的值分析:由题意,得x=44.50,y=7.37,设回归直线方程为同y^=b^x+a^nx i y i nxy则b^=i1≈0.175,a^=-0.43.故所求的回归直线方程为y^=0.175x-0.43.n22xi nxi17.检查者经过咨询男、女大学生在购置食品时能否看营养说明获得的数据以下表所示:看营养说明不看营养说明总计男大学生233255女大学生92534总计 32 5789利用列联表的独立性查验预计看营养说明能否与性别有关系思路剖析:依据列联表中的数据代入公式求得2χ的值,进行比较判断得出相应结论2解:由公式得 χ=n(adbc)2 89(2325329)2(ab)(cd)(ac)(bd)55343257所以我们没有原因以为看营养说明与男女性别有关 ,只管在此次检查中男性看营养说明的比例23比女性看营养说明的比率9高,但我们不可以以为这些男、女大学生中男性比女性看营5534养说明的多.8.某工业部门进行一项研究 ,剖析该部门的产量与生产花费之间的关系 ,从这个工业部门内随机抽选了10 个公司作样本,有以下资料: 产量(千件)x 生产花费(千元)y 40 150 42 140 48 160 55 170 65150产量(千件)x 生产花费(千元)y79 162 88 185100 165 120 190140 185计算x 与y 的有关系数对这两个变量之间能否线性有关进行有关性查验设回归直线方程为y^=b^x+a^,求系数a^,b^. 分析:ix i y i 22x i y i x iy i1 40 150 1600 22500 60002 42 140 1764 19600 58803 48 160 2304 25600 7680 4 55 170 3025 28900 9350 5 65 150 4225 22500 97506 79 162 6241 26244 127987 88 185 7744 34225 16280 8 100 165 10000 27225 165009 120 190 14400 36100 22800 10 140 185 19600 34225 25900 共计777165770903277119132929x102102xi=70903,y ii1i110x i y i=132929i11329291077.7165.7(709031077.72)(27711910165.72)即x与y的有关系数(2)查表明显性水平0.05,自由度10-2=8.相应的有关系数临界值r0.05=0.6319;由于r>r0.05,所以能够以为x与y之间拥有线性有关关系132929 10 77.7165.7b^=709031077.72a^77×.7=134.8.综合运用9.已知10只狗的血球体积及红血球数的丈量值以下表:x:血球体积(mm)y:红血球数(百万)45 6.5342 6.30469.52487.5042 6.9939 6.55508.7235 5.90589.4940 6.20画出上表的散点图求出回归直线并画出图形.分析:(1)见下列图(2)x=1101y=(6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37.10设回归直线的方程为y^=b^x+a^,则nx i y i nxy^i1=0.175,a^=y-b x=-b=n2x i2 nxi1所以所求的回归直线为y^=0.175x-0.43.10.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,一定掌握钢水含碳量和冶炼时间的关系.假如已测得炉料融化完成时钢水的含碳量x与冶炼时间y(从炉料融化完成到出钢的时间)的一列数据,以下表所示:x(0.01%)104180190177147134150191204121y(min)100200210185155135170205235125y与x能否拥有线性有关关系假如y与x拥有线性有关关系,求回归直线方程展望当钢水含碳量为160个0.01%时,应冶炼多少分钟?思路剖析:(1)判断两个变量能否拥有线性有关关系,可经过计算有关系数与临界值关系;(2)设回归直线方程,依公式代入有关量计算可得;(3)把x=160代入回归直线方程求解可得.解:(1)依据题意列表并计算以下:i12345678910x i104180190177147134150191204121y i100200210185155135170205235125x i y i10400360003990032745227851809025500391554794015125x=159.8,y10210210x i=265448,yi=312350,x i y i i=287640i1i1i110x i y i10xy于是r=10i12102 y i2x i210x(10y)i1i1查表得明显性水平0.05与n-2的有关系数临界值r0.05∴r>r0.05.∴y与x拥有线性有关关系(2)设所求的回归直线方程为y^=b^x+a10x i y i10xyb^ =i1≈1.267,a^≈-10210x2x ii1即所求的回归直线方程为y^=1.267x-(3)当x=160时,y^=1.267×160-30.51≈172(min即大概冶炼172min.11.研究某特别药物A有无副作用(比方服用后恶心),给50个患者服用此药,给此外50个患者服用宽慰剂,记录每类样本中出现恶心的数量以下表:有恶心 无恶心 共计 给药A 15 35 50 给宽慰剂4 46 50 共计1981100试问此药物有无恶心的副作用?思路剖析:依据列联表中的数据代入公式求得 2χ的值,与临界值进行比较判断得出相应结论.解:由题意,问题能够概括为独立查验假定H 1:服该药物(A)与恶心(B)独立.为了查验假定,计算2100 (15 46 435)2 统计量χ=50 50 1981故拒绝H 1,即不可以以为药物无恶心副作用,也能够说,我们有99%的掌握说,该药物与副作用(恶心)有关.12.为了认识某地母亲自高 x 与女儿身高 y 的有关关系,随机测得 10对母女的身高 ,以下表所示:母亲自 159160160163159154159158159 157高x/cm女儿身 158159160161161155162157 162156高y/cm试对x 与y 进行一元线性回归剖析,并展望当母亲自高为161cm 时女儿的身高为多少分析:先对x 与y 作有关性查验作统计假定:x 与y 不拥有线性有关关系 由小概率0.05与n-2=8在附表中查得r 0.05(3)x =1101y =1010222+1602++1572)-10×158.82xi10x =(159 i110x i y i -10xy =(159×158+160×159++157×-156)1 10y i 2-10y 2=(1582+1592++1562)-10×159.12i137.2所以r=56.947.6(4)|r|=0.71>0.632,即|r|>r 0.05进而有95%的掌握以为x 与y 之间拥有线性有关关系 ,去求回归直线方程是存心义的回归系数b ^=37.247.6a ^=159.1-所以y 对x 的回归直线方程是 y ^=34.92+0.78x回归系数0.78反应出当母亲自高每增添1cm时女儿身高均匀增添0.78cm,a^=34.92能够解说为女儿身高不受母亲自高变化影响的部分当x=161时,y^这就是说当母亲自高为161cm时女儿的身高大概也靠近161cm.。
回归分析 实验报告
回归分析实验报告1. 引言回归分析是一种用于探索变量之间关系的统计方法。
它通过建立一个数学模型来预测一个变量(因变量)与一个或多个其他变量(自变量)之间的关系。
本实验报告旨在介绍回归分析的基本原理,并通过一个实际案例来展示其应用。
2. 回归分析的基本原理回归分析的基本原理是基于最小二乘法。
最小二乘法通过寻找一条最佳拟合直线(或曲线),使得所有数据点到该直线的距离之和最小。
这条拟合直线被称为回归线,可以用来预测因变量的值。
3. 实验设计本实验选择了一个实际数据集进行回归分析。
数据集包含了一个公司的广告投入和销售额的数据,共有200个观测值。
目标是通过广告投入来预测销售额。
4. 数据预处理在进行回归分析之前,首先需要对数据进行预处理。
这包括了缺失值处理、异常值处理和数据标准化等步骤。
4.1 缺失值处理查看数据集,发现没有缺失值,因此无需进行缺失值处理。
4.2 异常值处理通过绘制箱线图,发现了一个销售额的异常值。
根据业务经验,判断该异常值是由于数据采集错误造成的。
因此,将该观测值从数据集中删除。
4.3 数据标准化为了消除不同变量之间的量纲差异,将广告投入和销售额两个变量进行标准化处理。
标准化后的数据具有零均值和单位方差,方便进行回归分析。
5. 回归模型选择在本实验中,我们选择了线性回归模型来建立广告投入与销售额之间的关系。
线性回归模型假设因变量和自变量之间存在一个线性关系。
6. 回归模型拟合通过最小二乘法,拟合了线性回归模型。
回归方程为:销售额 = 0.7 * 广告投入 + 0.3回归方程表明,每增加1单位的广告投入,销售额平均增加0.7单位。
7. 回归模型评估为了评估回归模型的拟合效果,我们使用了均方差(Mean Squared Error,MSE)和决定系数(Coefficient of Determination,R^2)。
7.1 均方差均方差度量了观测值与回归线之间的平均差距。
在本实验中,均方差为10.5,说明模型的拟合效果相对较好。
《回归分析》课堂实录及反思
《回归分析》课堂实录及反思一.创设情景引入新课师:先请同学们看下面这段视频短片(1'17")师:笑,意犹未尽吧?在这个短片中,我们发现可以根据犯罪嫌疑人留在现场的脚印推测出犯罪嫌疑人的身高,从而缩小侦查范围,提高破案效率.那么,人的脚长和身高之间确实存在着某种联系吗?如果存在,又是一种什么联系呢?我们能不能从数学的角度找到问题的答案?这节课我们就来研究一下人的脚长和身高之间可能存在的联系即进行回归分析(板书:回归分析).为我们以后也能成为神探狄仁杰、大侦探福尔摩斯做好准备.二.回归分析(一).收集数据师:要想得到脚长和身高的关系,首先我们需要收集脚长和身高的相关数据,然后对数据进行分析.那么,这些样本数据我们可以从哪里收集呢?想个办法?生:上网查吧…师:同学们都知道自己的身高吧?生:知道.师:脚长知道吗?生:不知道,要量一量…师:当然不需要大家现在脱掉鞋子进行测量,我这儿有个现成的公式提.如某位同学穿44码的鞋子,则他供给大家:脚长(单位:CM)=(鞋码+10)2的脚长等于27CM.现在,就请同学们按照我们分好的小组每8人一组收集数据,然后2人一小组合作完成下面的表格.生收集数据,完成表格.(二)画散点图x与满足什接下来,我们需要对数据进行分析.那么,这8组数据中的Y么关系?为了更直观清楚,请同学们在给出的平面直角坐标系下标出你收集到的这8组数据所对应的点.生作图.师:因为我们所作出的图象是一些孤立的点,所以,我们把这样的图叫做散点图.这是我作出的散点图.我们发现这8个点应该不满足某个确定的函数关系.但是这8个点从整体上看呈带状分布,我们可以认为大致分布在某x与有近似的线性关系.它大致满足的这条直线我们把它条直线附近,即Y叫做回归直线.师:为什么我们把这样的直线叫做回归直线呢?让我们一起来了解下面的知识背景.(屏幕展示)知识背景:“回归”一词首先由英国著名统计学家高尔顿提出来的。
1889年,他在研究祖先与后代身高之间关系时发现:身材较高的父母他们的孩子平均身高也较高,但这些孩子的平均身高并没有他们的父母平均身高高。
回归分析-高中数学知识点讲解(含答案)
回归分析(北京习题集)(教师版)一.选择题(共2小题)1.(2012秋•西城区期中)下面给出了某池塘中的浮萍蔓延的面积2()y m 与时间t (月)的关系的散点图.以下叙述中不正确的说法是( )A .与函数21y t =+相比,函数2t y =作为近似刻画y 与t 的函数关系的模型更好B .按图中数据显现出的趋势,第5个月时,浮萍的面积就会超过230mC .按图中数据显现出的趋势,浮萍每个月增加的面积约是上个月增加面积的两倍D .按图中数据显现出的趋势,浮萍从2月的24m 蔓延到216m 至少需要经过3个月2.(2009春•大兴区期末)一位母亲记录了儿子3~9岁的身高(单位:)cm ,由此建立身高与年龄的回归模型为ˆ73.937.19yx =+.则下列说法中正确的是( ) A .身高与年龄是一次函数关系 B .这个模型适合所有3~9岁的孩子C .预测这个孩子10岁时,身高一定在145.83cm 以上D .这个孩子在3~9岁之内,年龄每增加1岁,身高平均增加约7.19cm 二.填空题(共5小题)3.(2013春•房山区校级期中)某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)26394954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4.据此模型可知广告费用每增加1万元,销售额平均增加 万元,当广告费用为6万元时可以预测销售额为 万元.4.(2012•丰台区二模)某地区恩格尔系数(%)y 与年份x 的统计数据如下表:年份x 2004 2005 2006 2007 恩格尔系数(%)y4745.543.541从散点图可以看出y 与x 线性相关,且可得回归方程为ˆˆ4055.25ybx =+,据此模型可预测2012年该地区的恩格尔系数(%)为 .5.(2011春•海淀区期中)成年人的身高()y cm 与足长(脚趾到脚跟的长度)()x cm 有很强的线性相关性.有关部门研究获得y 与x 的线性回归方程为ˆ 6.8yx =,如果某人留下的足印长为25cm ,根据上面回归方程可推测此人的身高为 cm .6.(2009春•北京校级期末)许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国 50个州的成年人受过9年或更少教育的百分比( x )和收入低于官方规定的贫困线的人数占本州人数的百分比( y )的数据,建立的回归直线方程为ˆ0.8 4.6yx =+,斜率的估计等于0.8说明 . 7.(2008秋•通州区期中)回归方程ˆ 1.55yx =-,则当4x =时,y 的估计值为 . 三.解答题(共2小题)8.(2009春•房山区期中)某产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下数据:(1)画出散点图.(2)求y 关于x 的回归直线方程.(3)预测广告费为9百万元时的销售额是多少?9.(2009春•东城区校级月考)某产品的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的数据: (Ⅰ)画出表中数据的散点图;(Ⅱ)求出y 对x 的回归直线方程ˆybx a =+,其中1122211()()().nni i i ii i nni ii i x x y y x ynxy b x x xnx a y bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑(Ⅲ)若广告费为9万元,则销售收入约为多少万元?回归分析(北京习题集)(教师版)参考答案与试题解析一.选择题(共2小题)1.(2012秋•西城区期中)下面给出了某池塘中的浮萍蔓延的面积2()y m 与时间t (月)的关系的散点图.以下叙述中不正确的说法是( )A .与函数21y t =+相比,函数2t y =作为近似刻画y 与t 的函数关系的模型更好B .按图中数据显现出的趋势,第5个月时,浮萍的面积就会超过230mC .按图中数据显现出的趋势,浮萍每个月增加的面积约是上个月增加面积的两倍D .按图中数据显现出的趋势,浮萍从2月的24m 蔓延到216m 至少需要经过3个月【分析】本题考查的是函数模型的选择和应用问题.在解答时,首先应该仔细观察图形,结合图形读出过的定点进而确定函数解析式,结合所给月份计算函数值从而获得相应浮萍的面积进而对问题作出判断,至于第D 要充分结合对数运算的运算法则进行计算验证.【解答】解:1t =时,2122t y t =+==,2t =时,215t +=,24t =,3t =时,2110t +=,28t =,由图可知这些点更符合函数2t y =,故A 正确当5x = 时,253230y ==>,故第5个月时,浮萍的面积就会超过230m 成立,故B 正确; 由2x y =知,浮萍每个月增加的面积约是上个月增加面积的两倍,故C 正确 由2x y =知,2x =,4y =,4x =,16y =,即需要经过2个月,故D 不正确; 故选:D .【点评】本题考查的是函数模型的选择和应用问题.在解答的过程当中充分体现了观察图形、分析图形和利用图形的能力,同时对数求值和对数运算的能力也得到了体现,值得同学们体会与反思.2.(2009春•大兴区期末)一位母亲记录了儿子3~9岁的身高(单位:)cm ,由此建立身高与年龄的回归模型为ˆ73.937.19yx =+.则下列说法中正确的是( ) A .身高与年龄是一次函数关系 B .这个模型适合所有3~9岁的孩子C .预测这个孩子10岁时,身高一定在145.83cm 以上D .这个孩子在3~9岁之内,年龄每增加1岁,身高平均增加约7.19cm【分析】根据所给的高与年龄的回归模型,可以估计这个孩子在3~9岁之内,年龄每增加1岁,身高平均约增加多少,这是一个预报值,不是确定的值,在叙述时注意不要出错. 【解答】解:身高与年龄的回归模型为为ˆ73.937.19yx =+. ∴可以估计这个孩子在3~9岁之内,年龄每增加1岁,身高平均约增加7.19cm .选项D 正确;对于A ,身高与年龄是相关关系,不是一次函数关系;对于B ,这个模型只适合这个3~9岁的孩子,其它孩子不一定适合这个模型; 对于C ,可以估计孩子在10岁时可能的身高,这是一个预报值,不是确定的值. 故选:D .【点评】本题考查回归分析的初步应用,是一个基础题,这种根据回归直线方程预报出的结果,是一个估计值,不是确定的值,这是题目要考查的知识点. 二.填空题(共5小题)3.(2013春•房山区校级期中)某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)26394954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4.据此模型可知广告费用每增加1万元,销售额平均增加 9.4 万元,当广告费用为6万元时可以预测销售额为 万元.【分析】首先求出所给数据的平均数,得到样本中心点,根据线性回归直线过样本中心点,求出方程中的一个系数,得到线性回归方程,把自变量为7代入,预报出结果. 【解答】解:3.5x =,42y =,数据的样本中心点在线性回归直线上, 回归方程ˆˆˆybx a =+中的ˆb 为9.4, 429.4 3.5a ∴=⨯+, 9.1a ∴=,∴线性回归方程是ˆ9.49.1yx =+, ∴广告费用每增加1万元,销售额平均增加9.4万元,广告费用为6万元时销售额为ˆ9.469.165.5y=⨯+=, 故答案为:9.4;65.5.【点评】本题考查求回归方程,考查利用回归方程进行预测,解题的关键是根据回归方程必过样本中心点,求出回归系数.4.(2012•丰台区二模)某地区恩格尔系数(%)y 与年份x 的统计数据如下表:从散点图可以看出y 与x 线性相关,且可得回归方程为ˆˆ4055.25ybx =+,据此模型可预测2012年该地区的恩格尔系数(%)为 31.25 .【分析】先计算,x y ,再代入回归方程可得ˆ2b=,从而可预测2012年该地区的恩格尔系数. 【解答】解:由题意,20042005200620072005.54x +++==,4745.543.54144.254y +++==将(2005.5,44.25)代入??4055.25y b x =+,可得ˆ2b= ∴?24055.25y x =+当2012x =时,?220124055.2531.25y =⨯+= 故答案为:31.25【点评】本题考查回归方程及其运用,利用回归方程过样本中心点是关键.5.(2011春•海淀区期中)成年人的身高()y cm 与足长(脚趾到脚跟的长度)()x cm 有很强的线性相关性.有关部门研究获得y 与x 的线性回归方程为ˆ 6.8yx =,如果某人留下的足印长为25cm ,根据上面回归方程可推测此人的身高为 170 cm .【分析】根据得有关部门研究获得y 与x 的线性回归方程,把所给的x 的值代入计算y 的值,即可推测此人的身高. 【解答】解:有关部门研究获得y 与x 的线性回归方程为ˆ 6.8yx =, ∴当25x =时, 6.825170y =⨯=,∴可推测此人的身高为170cm.故答案为:170.【点评】本题考查回归分析的初步应用,本题解题的关键是正确运算线性回归方程,根据所给的自变量的值和线性回归方程得到的结果是一个预报值,而不是准确值,本题是一个容易题目.6.(2009春•北京校级期末)许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比( y)的数据,建立的回归直线方程为ˆ0.8 4.6y x=+,斜率的估计等于0.8说明一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右.【分析】根据线性回归方程中回归系数的意义,即可得出结论.【解答】解:线性回归方程中回归系数为正,从而可知:一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右.故答案为:一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右.【点评】回归直线是对相关关系的一种估计关系式,通过回归直线可对某些事物的发展趋势进行预报,回归直线方程对相应的数据进行预报时,其误差反映了数据的稳定性,即预报的准确度.7.(2008秋•通州区期中)回归方程ˆ 1.55y x=-,则当4x=时,y的估计值为1.【分析】根据所给的线性回归方程,把x的值代入线性回归方程,得到对应的y的值,这里所得的y的值是一个估计值.【解答】解:回归直线方程为?1.55y x=-,4x=,1.545651y∴=⨯-=-=,故答案为:1.【点评】本题考查线性回归方程,考查用线性回归方程估计或者说预报y的值,这是一个基础题,题目主要数字的运算不出错,一般是一个送分题目.三.解答题(共2小题)8.(2009春•房山区期中)某产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下数据:(1)画出散点图.(2)求y关于x的回归直线方程.(3)预测广告费为9百万元时的销售额是多少?【分析】(1)根据表中所给的五组数据,得到对应的五个点的坐标,在平面直角坐标系中画出五个点,得到这组数据的散点图.(2)先求出横标和纵标的平均数,得到这组数据的样本中心点,利用最小二乘法求出线性回归方程的系数,利用样本中心点求出a 的值,写出线性回归方程.(3)将9x =代入回归直线方程求出y 的值即为当广告费支出9(百万元)时的销售额的估计值. 【解答】解:(1)根据表中所给的五组数据,得到对应的五个点的坐标,在平面直角坐标系中画出五个点(2)由散点图知,y 与x 有线性相关,设回归方程为:ˆy bx a =+ 521550145i i x y x ====∑511380i ii x y==∑ˆˆ17.5ay bx =-= 故ˆ 6.517.5yx =+ (3)当9x =时, 6.5917.576y =⨯+=(百万元) 即广告费为9百万元时的销售额预报值是77百万元.【点评】本题考查线性回归方程的求法和应用,本题解题的关键是利用最小二乘法求出线性回归方程的系数,再进一步根据样本中心点求出a 的值,注意把一个自变量的值代入线性回归方程,得到的是一个预报值,本题是一个中档题目.9.(2009春•东城区校级月考)某产品的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的数据: 广告支出x (单位:万元) 1 2 3 4销售收入y (单位:万元)12 28 42 56(Ⅰ)画出表中数据的散点图;(Ⅱ)求出y 对x 的回归直线方程ˆybx a =+,其中1122211()()().nni i i ii i nn i i i i x x y y x ynxyb x x x nx a y bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑(Ⅲ)若广告费为9万元,则销售收入约为多少万元?【分析】()I 根据所给的数据构造有序数对,在平面直角坐标系中画出散点图.()II 观察散点图可知各点大致分布在一条直线附近,得到这组数据符合线性相关,求出利用最小二乘法所需要的数据,做出线性回归方程的系数,得到方程.()III 把9x =代入线性回归方程,估计出当广告费为9万元时,销售收入约为129.4万元.【解答】解:(Ⅰ)作出的散点图如图⋯(4分)(Ⅱ)观察散点图可知各点大致分布在一条直线附近,列出下表:序号 xy2xxy1 1 12 1 12 2 2 28 4 563 3 42 9 126 44 56 16 224 ∑1013830418可得52x =,692y =. 所以122215694184732255304()2ni ii nii x ynxy b xnx ==--⨯⨯===-⨯-∑∑,697352252a y bx =-=-⨯=-. 故y 对x 的回归直线方程73ˆ25y x =-.⋯(8分) (Ⅲ)当9x =时,73ˆ92129.45y=⨯-=.故当广告费为9万元时,销售收入约为129.4万元. (12分)【点评】本题考查线性回归方程的写法和应用,解题的关键是正确求出线性回归方程的系数,本题是一个基础题.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其他
指导
教师
何光辉
成绩
一、实验目的及意义
[1]了解线性回归分析的原理,掌握用MATLAB进行线性回归分析的方法。
[2]通过实例学习如何建立回归模型,如何进行回归统计分析。
[3]通过实验体验用回归分析方法解决实际问题的全过程。
二、实验内容
某公司出口换汇成本分析
对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本。
问题分析
由表可以知道这是一个接近双曲线的回归模型,令商品流转费用率(%)为x ,出口换汇成本为y.
数学模型的建立与求解
根据提供的数据描出对应的点如下:
>> x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00 3.40 6.90];
>> y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40];
根据回归方程可对该模型进行预测:
>> x=6.5;
>> y=0.2513+5.9592/x
y =
1.1681
由此可知商品流转费用率是6.5%的出口换汇成本是1.1681。
总结与体会
1.由本次实验的联系,将理论与实践充分结合,学习和理解了matlab中回归分析问题的求解方法。
2.由应用问题的求解,体会到数学建模在实际问题中的运用非常广泛,充分掌握了插值求解相关问题,matlab的编程需要非常严谨,才能更快更好的得出结果。
重庆大学
学生实验报告
实验课程名称数学实验
开课实验室DS1421
学院计算机学院年级大二专业计科六班
学生姓名王福临学号********
开课时间至学年第学期
总成绩
教师签名
数理学院制
开课学院、实验室:数理学院DS1401实验时间:2013年4月24日
课程
名称
数学实验
实验项目
名称
回归分析
实验项目类型
验证
演示
综合
plot(x,y,'k+')
根据图可以知道其接近双曲线,所以程序如下:
>> x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00 3.40 6.90];
>> y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40];
-0.3009 0.8314
-0.2680 0.8585
-0.9635 0.0773
-0.7286 0.4464
-0.7268 0.3188
-0.2318 0.8019
stats =
0.5812 15.2635 0.0024 0.0750
rcoplot(r,rint)
根据残差图可知回归方程接近y=0.2513+5.9592/x,该回归方程显著,回归模型成立。
>> X=[ones(13,1) (x.^(-1))'];Y=y';
>> [b,bint,r,rint,stats]=regress(Y,X)
b =
0.2513
5.9592
bint =
-0.4929 0.9955
2.6020 9.3163
r =
-0.2701
-0.1757
-0.09060.03Fra bibliotek10.0876
0.4461
-0.0928
0.2652
0.2953
-0.4431
-0.1411
-0.2040
0.2851
rint =
-0.8426 0.3023
-0.7629 0.4116
-0.6338 0.4526
-0.5380 0.6142
-0.4854 0.6605
-0.0148 0.9070
-0.6963 0.5107
3.matlab的学习完全基于对软件的不断联系。只有多上机练习,才能对相关知识熟悉,并灵活运用。
教师签名
年月日
三、实验步骤
1.开启软件平台——MATLAB,开启MATLAB编辑窗口;
2.根据各种数值解法步骤编写M文件
3.保存文件并运行;
4.观察运行结果(数值或图形);
5.写出实验报告,并浅谈学习心得体会。
实验题目:
某公司出口换汇成本分析
对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本。