[推荐学习]2018年秋高中数学课时分层作业17回归分析的基本思想及其初步应用新人教A版选修2_3
【K12教育学习资料】高中数学 第一章 统计案例 1.1回归分析的基本思想及其初步应用(二)课时作业
第一章统计案例 1.1回归分析的基本思想及其初步应用(二)课时作业新人教A版选修1-2明目标、知重点 1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度.1.如果两个变量不呈现线性相关关系,常见的两个变量间的关系还有指数函数关系、二次函数关系.2.两个变量间的非线性关系可以通过对解释变量的变换(对数变换、平方变换等)转化为另外两个变量的线性关系.3.比较不同模型的拟合效果,可以通过残差平方和的大小,相关指数的大小来判断.探究点一非线性回归模型思考1 有些变量间的关系并不是线性相关,怎样确定回归模型?答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,这时可以根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.思考2 如果两个变量呈现非线性相关关系,怎样求出回归方程?答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.例1某地区不同身高的未成年男性的体重平均值如下表:试建立y解根据表中数据画出散点图如图所示.由图看出,样本点分布在某条指数函数曲线y=c1e c2x的周围,于是令z=ln y.由表中数据可得z与x之间的线性回归方程:=0.663+0.020x,则有=e0.663+0.020x.反思与感悟根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y=c1e c2x的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.跟踪训练1 在彩色显影中,由经验知:形成染料光学密度y与析出银的光学密度x由公式y =A (b<0)表示.现测得试验数据如下:试求y对x解 由题给的公式y =A ,两边取自然对数,便得ln y =ln A +b x,与线性回归方程相对照,只要取u =1x,v =ln y ,a =ln A .就有v =a +bu .题给数据经变量置换u =1x,v =ln y 变成如下表所示的数据:可得ln =0.548-x,即 =e =e0.548·≈1.73,这就是y 对x 的回归方程. 探究点二 非线性回归分析思考1 对于两个变量间的相关关系,是否只有唯一一种回归模型来拟合它们间的相关关系? 答 不一定.我们可以根据已知数据的散点图,把它与幂函数、指数函数、对数函数、二次函数图象进行比较,挑选一种拟合比较好的函数,作为回归模型.思考2 对同一个问题建立的两种不同回归模型,怎样比较它们的拟合效果?答 有两种比较方法:(1)计算残差平方和,残差平方和小的模型拟合效果好;(2)计算相关指数R 2,R 2越接近于1的模型拟合效果越好.例 2 为了研究某种细菌随时间x 变化时,繁殖个数y 的变化,收集数据如下:(1)用天数x (2)描述解释变量x 与预报变量y 之间的关系; (3)计算相关指数.解 (1)所作散点图如图所示.(2)由散点图看出样本点分布在一条指数函数y =c 1e c 2x 的周围,于是令z =ln y ,则由计算器得: =(3)∑ni =1 2i =∑ni =1 (y i - i )2=4.816 1,∑i =1(y i -y )2=24 642.8, R 2=1-4.816 124 642.8≈0.999 8,即解释变量天数对预报变量繁殖细菌个数解释了99.98%.反思与感悟 研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后通过图形来分析残差特性,用残差 1, 2,…, n 来判断原始数据中是否存在可疑数据,用R 2来刻画模型拟合的效果.跟踪训练2 对两个变量x ,y 取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:甲y =0.1x +1,乙y =-0.05x 2+0.35x +0.7,丙y =-0.8·0.5x+1.4,试判断三人谁的数学模型更接近于客观实际.解 对甲模型:残差平方和∑4i =1(y i - i )2=0.010 9; 对乙模型:残差平方和∑4i =1(y i - i )2=0.004 9; 对丙模型:残差平方和∑4i =1(y i - i )2=0.000 4. 显然丙的残差平方和最小,故丙模型更接近于客观实际.1.散点图在回归分析中的作用是( ) A .查找个体个数 B .比较个体数据大小关系C.探究个体分类D.粗略判断变量是否相关答案 D2.变量x与y之间的回归方程表示( )A.x与y之间的函数关系B.x与y之间的不确定性关系C.x与y之间的真实关系形式D.x与y之间的真实关系达到最大限度的吻合答案 D3.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( ) A.1 B.-0.5C.0 D.0.5答案 C4.非线性回归分析的解题思路是________.答案通过变量置换转化为线性回归分析[呈重点、现规律]非线性回归问题的处理方法(1)指数函数型y=e bx+a①函数y=e bx+a的图象:②处理方法:两边取对数得ln y=ln e bx+a,即ln y=bx+a.令z=ln y,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出b,a.(2)对数曲线型y=b ln x+a①函数y=b ln x+a的图象:②处理方法:设x′=ln x,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.(3)y =bx 2+a 型处理方法:设x ′=x 2,原方程可化为y =bx ′+a ,再根据线性回归模型的方法求出a ,b .一、基础过关1.下列说法正确的是( )①线性回归方程适用于一切样本和总体; ②线性回归方程一般都有时间性;③样本的取值范围会影响线性回归方程的适用范围; ④根据线性回归方程得到的预测值是预测变量的精确值. A .①③④ B .②③ C .①② D .③④ 答案 B2.某地财政收入x 与支出y 满足回归方程y =x ++e (单位:亿元),其中=0.8,=2,|e |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( ) A .10亿 B .9亿 C .10.5亿 D .9.5亿 答案 C解析 代入数据 =10+e ,因为|e |<0.5, 所以| |<10.5,故不会超过10.5亿.3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ) A .-1 B .0C.12 D .1答案 D4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:A .y =2x -2B .y =(12)xC .y =log 2xD .y =12(x 2-1)答案 D解析 可以代入检验,当x 取相应的值时,所求y 与已知y 相差最小的便是拟合程度最高的. 5.如果散点图的所有点都在一条直线上,则残差均为________,残差平方和为________,相关指数为________. 答案 0 0 16.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z =ln y ,求得线性回归方程为 =0.25x -2.58,则该模型的回归方程为________. 答案 =e0.25x -2.58解析 ∵ =0.25x -2.58,z =ln y ,∴ =e 0.25x -2.58.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:(1)求年推销金额y (2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 解 (1)设所求的线性回归方程为 = x + ,则 =∑i =15(x i -x)(y i -y )∑i =15(x i -x)2=1020=0.5, =y - x =0.4. ∴年推销金额y 关于工作年限x 的线性回归方程为 =0.5x +0.4. (2)当x =11时, =0.5x +0.4=0.5×11+0.4=5.9(万元). ∴可以估计第6名推销员的年推销金额为5.9万元. 二、能力提升 8.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②相关指数R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是( ) A .0 B .1C .2D .3 答案 D解析 ①选用的模型是否合适与残差点的分布有关;对于②③,R 2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.9.为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t .那么下列说法正确的是( )A .直线l 1和l 2有交点(s ,t )B .直线l 1和l 2相交,但是交点未必是点(s ,t )C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合 答案 A解析 由于回归直线一定过(x ,y ), ∴直线l 1和l 2都过(s ,t )点.10.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得:∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i =1 849,则y 与x 的线性回归方程是________. 答案 =11.47+2.62x11.某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求y 关于x 的线性回归方程. 解 (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算.于是可得 =∑i =1x i y i -5x y∑5i =1x 2i -5x 2=1 380-5×5×50145-5×52=6.5, =y - x =50-6.5×5=17.5. 于是所求的线性回归方程是 =6.5x +17.5.12.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)(2)利用(1)中所求出的线性回归方程预测该地2012年的粮食需求量.解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求线性回归方程,先将数据预处理如下:由预处理后的数据,容易算得x =0,y =3.2, =(-4)×(-21)+(-2)×(-11)+2×19+4×2942+22+22+42=26040=6.5, =y - x =3.2.由上述计算结果,知所求线性回归方程为 -257= (x -2 006)+ =6.5(x -2 006)+3.2.即 =6.5(x -2 006)+260.2.(2)利用所求得的线性回归方程,可预测2012年的粮食需求量为6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨). 三、探究与拓展13.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =1nx i =8010=8, y =1n ∑i =1n y i =2010=2,又l xx =∑i =1nx 2i -n x 2=720-10×82=80,l xy =∑i =1nx i y i -n x y =184-10×8×2=24,由此得b =l xy l xx =2480=0.3, a =y -b x =2-0.3×8=-0.4,故所求线性回归方程为y =0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).。
2018版数学新导学同步人教A版选修2-3:课时作业 17回归分析的基本思想及其初步应用含解析
课时作业 17 回归分析的基本思想及其初步应用 |基础巩固|(25分钟,60分)一、选择题(每小题5分,共25分)1.关于回归分析,下列说法错误的是( )A .回归分析是研究两个具有相关关系的变量的方法B .线性相关系数可以是正的或负的C .回归模型中一定存在随机误差D .散点图能明确反映变量间的关系解析:用散点图反映两个变量间的关系时,存在误差,故D 错误,选D. 答案:D2.在一线性回归模型中,计算其相关指数K 2=0.96,下面哪种说法不够妥当( )A .该线性回归方程的拟合效果较好B .解释变量对于预报变量变化的贡献率约为96%C .随机误差对预报变量的影响约占4%D .有96%的样本点在回归直线上解析:由相关指数R 2表示的意义可知A ,B ,C 三种说法都很妥当,相关指数R 2=0.96,其值较大,说明残差平方和较小,绝大部分样本点分布在回归直线附近,不一定有96%的样本点在回归直线上,故选D.答案:D3.工人月工资y (单位:元)关于劳动生产率x (单位:千元)的回归方程y ^=650+80x ,下列说法中正确的个数是( )①劳动生产率为1 000元时,工资为730元; ②劳动生产率提高1 000元,则工资提高80元; ③劳动生产率提高1 000元,则工资提高730元; ④当月工资为810元时,劳动生产率约为2 000元. A .1 B .2 C .3 D .4 解析:代入方程计算可判断①②④正确. 答案:C4.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:由相关系数的定义及散点图所表达的含义,可知r 2<r 4<0<r 3<r 1,故选A. 答案:A5.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归方程为y ^=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A .身高在145.83 cm 左右B .身高在145.83 cm 以上C .身高在145.83 cm 以下D .身高一定是145.83 cm解析:回归方程得到的预报值是预报变量的估计值,它是预报变量可能取值的平均值.答案:A二、填空题(每小题5分,共15分)6.某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由回归方程中系数b ^的含义知家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2547.有5组数据:(1,3),(2,4),(4,5),(3,10),(10,12),去掉________后剩下的4组数据的线性相关性最大.解析:画散点图易知(3,10)明显异常,其余各点均在一条直线附近. 答案:(3,10)8.在研究气温和热茶销售杯数的关系时,若求得相关指数R 2≈0.85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x (0.01%)104180190177147134150191204121y (min)100200210185155135170205235125(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?(2)求回归直线方程.解析:(1)以x轴表示含碳量,y轴表示冶炼时间,可作散点图如图所示.从图中可以看出,各点散布在一条直线附近,即它们线性相关.(2)列出下表,并用科学计算器进行计算:i 12345678910x i104180190177147134150191204121y i100200210185155135170205235125x i y i 10400360003990032745227851809025500391554794015125x-=159.8,y-=172,∑10x2=265 448,∑10y2=312 350,∑10x y=287 640(1)求回归直线方程y ^=b ^x +a ^,其中b ^=-20,a ^=y --b ^x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x -=16(8+8.2+8.4+8.6+8.8+9)=8.5,y -=16(90+84+83+80+75+68)=80,从而a ^=y -+20x -=80+20×8.5=250,故y ^=-20x +250.(2)由题意知,工厂获得利润z =(x -4)y =-20x 2+330x -1 000=-20⎝ ⎛⎭⎪⎫x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润. |能力提升|(20分钟,40分)11.通过下面的残差图,我们发现在采集样本点的过程中,样本点数据不准确的为( )A .第四个B .第五个 由题图可知第六个数据的偏差最大,故选C.∑i =15x 2i =1 660,∑i =15y 2i =327,∑i =15x i y i =620,∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y -)2=53.2)解析:(1)(2)因为x -=18,y -=7.4,∑i =15x 2i =1 660,∑i =15x i y i =620,所以b ^=∑i =15x i y i -5x -y-∑5x 2-5x -2=-1.15,a ^=y --b ^x -=28.1.=所以回归模型拟合效果很好.14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局和某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日 3月10日 4月10日 5月10日 6月10日昼夜温差x (℃) 10 11 13 12 8 6 就诊人数y (人) 22 25 29 26 16 12该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组求线性回归方程,再用被选取的2组数据进行检验.(1)若选取的是1月与6月两组数据,请根据2至5月份的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=a ^+b ^x .(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?⎝ ⎛⎭⎪⎫参考公式:b ^=x 1y 1+x 2y 2+…+x n y n -n x - y -x 21+x 22+…+x 2n -n x-2,a ^=y --b ^x - 解析:(1)由数据求得x -=11,y -=24,由公式求得b ^=187,再由a ^=y --b ^x -=-307,赠送初中数学几何模型【模型二】半角型:图形特征:45°4321A1FB正方形ABCD 中,∠EAF =45° ∠1=12∠BAD 推导说明:1.1在正方形ABCD 中,点E 、F 分别在BC 、CD 上,且∠FAE =45°,求证:EF =BE +DF45°DEa +b-a45°A1.2在正方形ABCD 中,点E 、F 分别在BC 、CD 上,且EF =BE +DF ,求证:∠FAE =45°DEa +b-aa45°ABE挖掘图形特征:a+bx-aa 45°DBa+b-a45°A运用举例:1.正方形ABCD的边长为3,E、F分别是AB、BC边上的点,且∠EDF=45°.将△DAE绕点D逆时针旋转90°,得到△DCM.(1)求证:EF=FM(2)当AE=1时,求EF的长.DE2.如图,△ABC是边长为3的等边三角形,△BDC是等腰三角形,且∠BDC=120°.以D为顶点作一个60°角,使其两边分别交AB于点M,交AC于点N,连接MN,求△AMN的周长.3.如图,梯形ABCD中,AD∥BC,∠C=90°,BC=CD=2AD=4,E为线段CD上一点,∠ABE=45°.(1)求线段AB的长;(2)动点P从B出发,沿射线..BE运动,速度为1单位/秒,设运动时间为t,则t为何值时,△ABP为等腰三角形;(3)求AE-CE的值.变式及结论:4.在正方形ABCD中,点E,F分别在边BC,CD上,且∠EAF=∠CEF=45°.(1)将△ADF绕着点A顺时针旋转90°,得到△ABG(如图1),求证:△AEG≌△AEF;(2)若直线EF与AB,AD的延长线分别交于点M,N(如图2),求证:EF2=ME2+NF2;(3)将正方形改为长与宽不相等的矩形,若其余条件不变(如图3),请你直接写出线段EF,BE,DF之间的数量关系.ABFEDCF。
2018版高中数学人教A版选修2-3课件:3-1 回归分析的基本思想及其初步应用
^
因此,所求的回归直线方程为������ = 0.668������ + 54.96. (3)当 x=200 时,y 的估计值为������ = 0.668 × 200 + 54.96 = 188.56 ≈189. 因此,预测加工 200 个零件所用的工时为 189 min.
^
^
典例透析 题型一 题型二 题型三 题型四
【变式训练 1】 某工厂 1~8 月份某种产品的产量 x(单位:t)与成 本 y(单位:万元)的统计数据如下表:
月份 1 产量/t 5.6 成本/ 130 万元 2 6 .0 136 3 6 .1 143 4 6 .4 149 5 7 .0 157 6 7 .5 172 7 8 .0 183 8 8 .2 188
典例透析 题型一 题型二 题型三 题型四
求线性回归方程 【例1】 一个车间为了规定工时定额,需要确定加工零件所花费的 时间,为此进行了10次试验.测得的数据如下:
零件 数 x/个 加工时 间 y/min 10 62 20 68 30 75 40 81 50 89 60 95 70 102 80 108 90 115 100 122
重难聚焦
2.举例说明怎样确定线性回归的模型 剖析:在确定数据适合哪种模型之前,首先应该对观测数据绘图, 以便进行简单的观测.例如,为了研究建立初始工资与当前工资的 回归模型,首先对观测数据绘图,如下图所示.
重难聚焦
从图中可以发现初始工资与当前工资的趋势大概呈线性关系,可 以建立线性回归方程.如果观测数据不呈线性分布,那么还可以根 据其他方程模型的观测数据分布图形的特点以及对建立各方程后 所得的R2进行比较以便确定一种最佳方程式. 一般说来,如果所有的观测量都落到回归直线上,那么R2等于1;如 果自变量与因变量之间没有回归关系,那么R2等于0. 另外,我们通过对观测数据分布图形的仔细观察还可以发现一些 奇异值,所以还可以通过对数据的检查来消除奇异值.但是,对待奇 异值时要格外小心.
17学年高中数学专题1.1回归分析的基本思想及其初步应用(第2课时)教案新人教A版选修1-2
17学年高中数学专题1.1回归分析的基本思想及其初步应用(第2课时)教案新人教A版选修1-2D残差平方和、回归平方和;了解偏差平方和分解的思想;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1、了解判断刻画模型拟合效果的方法——相关指数和残差分析;2、通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
【教学难点】:1、解释残差变量的含义;2、了解偏差平方和分解的思想。
【课前准备】:课件【教学过程设计】:线上相应的位置的差异()i iyyˆ-是随机误差的效应,称i i iyy eˆˆ-=为残差,()∑=-ni i iyy12ˆ为残差平方和;学生动手计算出例1中的残差(如下表)与残差平方和。
编号 1 2 3 4 5 6 7 8 身高/cm165 165 157 170 175 165 155 170 体重/kg48 57 50 54 64 61 43 59y i 54.373 54.373 47.581 58.618 62.863 54.373 45.883 58.618 e i -6.373 2.627 2.419 -4.618 1.137 6.627 -2.883 0.382 ()361.128ˆ12=-∑=ni iiy y 发,抽象为数学问题中的线性回归问题,从而指导实际问题的解决。
⑶回归平方和:解释变量和随机误差的总效应(总偏差平方和),即总的偏差平方和=回归平方和+残差平方和,所以回归平方和=总的偏差平方和-残差平方和学生动手计算出例1中的回归平方和。
2017-2018学年高中数学 第一章 1.1 回归分析的基本思想及其初步应用(含解析)新人教A版选修1-2
回归分析的基本思想及其初步应用预习课本P2~8,思考并完成以下问题 1.什么是回归分析?2.什么是线性回归模型?3.求线性回归方程的步骤是什么?[新知初探]1.回归分析 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).设其回归直线方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数,由最小二乘法得b ^=∑i =1nx i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -nx y∑i =1nx 2i -n x 2,a ^=y -b ^x .(3)线性回归模型线性回归模型⎩⎪⎨⎪⎧y =bx +a +e ,E e =0,De =σ2,其中a ,b 为模型的未知参数,通常e 为随机变量,称为随机误差.x 称为解释变量,y 称为预报变量.[点睛] 对线性回归模型的三点说明(1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具.(2)线性回归方程y ^=b ^x +a ^中a ^,b ^的意义是:以a ^为基数,x 每增加1个单位,y 相应地平均增加b ^个单位.2.线性回归分析(1)残差:对于样本点(x i ,y i )(i =1,2,…,n )的随机误差的估计值 e ^i =y i -y ^i 称为相应于点(x i ,y i )的残差,∑i =1n(y i -y ^i )2称为残差平方和.(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差, 横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.(3)R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2越接近1,表示回归的效果越好.[小试身手]1.判断下列命题是否正确.(正确的打“√”,错误的打“×”) (1)残差平方和越小, 线性回归方程的拟合效果越好.( )(2)在画两个变量的散点图时, 预报变量在x 轴上,解释变量在y 轴上.( ) (3)R 2越小, 线性回归方程的拟合效果越好.( ) 答案:(1)√ (2)× (3)×2.从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为________.答案:正相关3.在残差分析中, 残差图的纵坐标为________. 答案:残差4.如果发现散点图中所有的样本点都在一条直线上, 则残差平方和等于________, 解释变量和预报变量之间的相关系数等于________.答案:0 1或-1[典例] 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据x 6 8 10 12 y2356(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程 y ^=b ^x +a ^; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. [解] (1)散点图如图:(2)∑i =1nx i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =1nx 2i =62+82+102+122=344. b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3, 故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程知,当x =9时,y ^=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明. [活学活用]某工厂1~8月份某种产品的产量与成本的统计数据见下表:月份 12345678产量(吨) 5.6 6.0 6.1 6.4 7.0 7.5 8.0 8.2 成本(万元)130136143149157172183188以产量为x ,成本为y . (1)画出散点图;(2)y 与x 是否具有线性相关关系?若有,求出其回归方程. 解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x 和y 线性相关关系显著,下面求其回归方程,首先列出下表.计算得x =6.85,y =157.25.∴b ^=∑i =18x i y i -8xy∑i =18x 2i -8x 2=8 764.5-8×6.85×157.25382.02-8×6.852≈22.17, a ^=y -b ^x =157.25-22.17×6.85≈5.39,故线性回归方程为y ^=22.17x +5.39.1.在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:求出y 对x 解:x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4.∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,可得回归系数b ^=∑i =15x i y i -5xy∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15.所以a ^=7.4+1.15×18=28.1所以回归直线方程:y ^=-1.15x +28.1. 列出残差表:则∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2.R 2=1-∑i =15y i -y ^i2∑i =15y i -y2≈0.994.所以回归模型的拟合效果很好. 题点二:非线性回归分析2.为了研究某种细菌随时间x 变化繁殖个数y 的变化,收集数据如下繁殖个数y 612254995190(1)(2)求y与x之间的回归方程.解:(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y1=c1e c2x的周围,于是令z=ln y,则x 12345 6z 1.792.483.223.894.555.25由计算器算得,z=0.69x+1.112,则有y=e0.69x+1.112.(1)当两个变量已明显呈线性相关关系时,则无需作散点图,就可直接求回归直线方程,否则要先判定相关性再求回归方程.判断拟合效果的好坏需要利用R2确定,R2越接近1,说明拟合效果越好.(2)非线性回归方程的求法①根据原始数据(x,y)作出散点图;②根据散点图,选择恰当的拟合函数;③作恰当的变换,将其转化成线性函数,求线性回归方程;④在③的基础上通过相应的变换,即可得非线性回归方程.层级一学业水平达标1.在对两个变量x,y进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(x i,y i),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )A.①②⑤③④B.③②④⑤①C .②④③①⑤D .②⑤④③①解析:选D 对两个变量进行回归分析时,首先收集数据(x i ,y i ),i =1,2,…,n ;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①, 故选D .2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是( ) A .0 B .1 C .2D .3解析:选D ①选用的模型是否合适与残差点的分布有关; 对于②③, R 2的值越大, 说明残差平方和越小, 随机误差越小,则模型的拟合效果越好.3.下图是根据变量x ,y 的观测数据(x i ,y i )(i =1,2,…,10)得到的散点图,由这些散点图可以判断变量x ,y 具有相关关系的图是( )A .①②B .①④C .②③D .③④解析:选D 根据散点图中点的分布情况,可判断③④中的变量x ,y 具有相关的关系. 4.(重庆高考)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A .y ^=0.4x +2.3B .y ^=2x -2.4 C .y ^=-2x +9.5 D .y ^=-0.3x +4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C ,D .且直线必过点(3,3.5)代入A ,B 得A 正确.5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:选B 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 6.以下是某地区的降雨量与年平均气温的一组数据:或“不具有”)解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.答案:不具有7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1. 答案:18.下列说法正确的命题是________(填序号). ①回归直线过样本点的中心(x ,y );②线性回归方程对应的直线y ^=b ^x +a ^至少经过其样本数据点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; ④在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好. 解析:由回归分析的概念知①④正确,②③错误. 答案:①④9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,从而a ^=y +20x =80+20×8.5=250, 故y ^=-20x +250.(2)由题意知, 工厂获得利润z =(x -4)y =-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润.10.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得b ^=6.5, (1)求y 与x 的线性回归方程;(2)现有第二个线性模型:y ^=7x +17,且R 2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由. 解:(1)依题意设y 与x 的线性回归方程为y ^=6.5x +a ^.x =2+4+5+6+85=5,y =30+40+60+50+705=50,∵y ^=6.5x +a ^经过(x ,y ), ∴50=6.5×5+a ^,∴a ^=17.5,∴y 与x 的线性回归方程为y ^=6.5x +17.5. (2)由(1)的线性模型得y i -y ^i 与y i -y 的关系如下表:所以∑i =15(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.∑i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1 000.所以R 21=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845.由于R 21=0.845,R 2=0.82知R 21>R2, 所以(1)的线性模型拟合效果比较好.层级二 应试能力达标1.在建立两个变量y 与x 的回归模型中,分别选择4个不同模型,求出它们相对应的R 2如表,则其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型4解析:选B 线性回归分析中,相关系数为r ,|r |越接近于1, 相关程度越大; |r |越小, 相关程度越小,故其拟合效果最好. 故选B .2.如果某地的财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿解析:选C ∵x =10时,y =0.8×10+2+e =10+e , 又∵|e |≤0.5,∴y ≤10.5.3.某咖啡厅为了了解热饮的销售量y (个)与气温x (℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:由表中数据,得线性回归方程y =-2x +a .当气温为-4 ℃时,预测销售量约为( ) A .68 B .66 C .72D .70解析:选A ∵x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,∴40=-2×10+a ,∴a =60,当x =-4时,y =-2×(-4)+60=68.4.甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和i =1n (y i -y ^i )2如下表:哪位同学的试验结果体现拟合A ,B 两变量关系的模型拟合精度高( ) A .甲 B .乙 C .丙D .丁解析:选D 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中 i =1n(y i -y )2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D .5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z ^=ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为________.解析:因为z ^=0.25x -2.58,z ^=ln y ,所以y =e 0.25x -2.58. 答案:y =e 0.25x -2.586.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2547.下表是某年美国旧轿车价格的调查资料.解:设x 表示轿车的使用年数,y 表示相应的平均价格,作出散点图.由散点图可以看出y 与x 具有指数关系, 令z =ln y ,变换得作出散点图:由图可知各点基本上处于一直线,由表中数据可求出线性回归方程: z ^=8.166-0.298x .因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为y ^=e 8.166-0.298x.8.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解:(1)散点图如图:(2)列下表,并利用科学计算器进行有关计算.于是b ^=346.3-7×21×2.13 447-7×212≈0.104. a ^=2.1-0.104×21=-0.084,因此回归直线方程为y ^=0.104x -0.084.(3)当x =24时,y =0.104×24-0.084=2.412(千万元).。
课时作业1回归分析的基本思想及其初步应用
课时作业1回归分析的基本思想及其初步应用A组基础巩固一、选择题1.在对两个变量x,y进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(x i,y i),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图。
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①解析对两个变量进行回归分析时,首先收集数据(x i,y i),i=1,2,…,n;根据所搜集的数据绘制散点图。
观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①,故选D。
答案 D2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好。
其中正确命题的个数是()A.0 B.1C.2 D.3解析①选用的模型是否合适与残差点的分布有关;对于②③,R2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好。
答案 D3.下图是根据变量x,y的观测数据(x i,y i)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x ,y 具有相关关系的图是( )① ② ③ ④A .①②B .①④C .②③D .③④解析 根据散点图中点的分布情况,可判断③④中的变量x ,y具有相关的关系。
答案 D4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y A .y =x -1 B .y =x +1 C .y =88+12xD .y =176解析 法一:由线性回归直线方程过样本中心(176,176),排除A 、B 答案,结合选项可得C 为正确答案。
高中数学回归分析的基本思想及其初步应用测试题(含答案)
高中数学回归分析的基本思想及其初步应用测试题(含答案)高中数学回归分析的基本思想及其初步应用测试题(含答案)1.1回归分析的基本思想及其初步应用一、选择题1. 下列说法中正确的是()A.任何两个变量都具有相关关系 B.人的知识与其年龄具有相关关系C.散点图中的各点是分散的没有规律 D.根据散点图求得的回归直线方程都是有意义的2. 某同学由与之间的一组数据求得两个变量间的线性回归方程为,已知:数据的平均值为2,数据的平均值为3,则 ( )A.回归直线必过点(2,3) B.回归直线一定不过点(2,3)C.点(2,3)在回归直线上方 D.点(2,3)在回归直线下方3. 在一次试验中,测得的四组值分别是,则Y与X之间的回归直线方程为()A. B. C.D.4. 在对两个变量,进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据、),,…,;它们的相关指数如下,其中拟合效果最好的模型是( )A.模型1的相关指数为0.98B.模型2的相关指数为0.80C.模型3的相关指数为0.50D.模型4的相关指数为0.2510. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R211. 工人月工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元12. 下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② B.①②③ C.①②④ D.①②③④13. 已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为()A.B.C.D.二、填空题14. 在比较两个模型的拟合效果时,甲、乙两个模型的相关指数的值分别约为0.96和0.85,则拟合效果好的模型是.15. 线性回归模型(和为模型的未知参数)中,称为.16. 若一组观测值(x1,y1)(x2,y2)…(xn,yn)之间满足yi=bxi+a+ei (i=1、2. …n)若ei恒为0,则R2为_____三、解答题17. 调查某市出租车使用年限和该年支出维修费用(万元),得到数据如下:使用年限2 3 4 5 6维修费用2.2 3.8 5.5 6.5 7.0(1)求线性回归方程;(2)由(1)中结论预测第10年所支出的维修费用.()18. 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为时的销售价格. 19. 假设关于某设备的使用年限x和所支出的维修费用y (万元),有如下的统计资料:x 2 3 4 5 6y 2 23 85 56 57 0若由资料可知y对x呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?1.1回归分析的基本思想及其初步应用(参考答案)一、选择题1. B2. A3. A4. D5.B6.C7. 解析:通常把自变量称为解析变量,因变量称为预报变量.选B8. D9. A10. B11. C12. C13. C二、填空题14. 甲15. 随机误差16. 解析: ei恒为0,说明随机误差对yi贡献为0.答案:1.三、解答题17.解析:(1) 回归方程为:(2) 预计第10年需要支出维修费用12.38 万元.18. 解析:(1)数据对应的散点图如图所示:(2),,设所求回归直线方程为,则故所求回归直线方程为(3)据(2),当时,销售价格的估计值为:(万元)19. 解析:(1)列表如下:i 1 2 3 4 52 3 4 5 62 23 85 56 57 04 411 422 032 542 04 9 16 25 36于是,线性回归方程为:(2)当x=10时,(万元)即估计使用10年时维修费用是12 38万元。
2018学年高中数学人教A版选修2-3课件:3.1 回归分析的基本思想及其初步应用 精品
y 2.2 4.3 4.8 6.7
若从散点图分析,y 与 x 线性相关,且^y=0.95x+a^,则a^的值等于(
学号:97270058】
A.2.6
B.6.3
C.2
D.4.5
) 【导
【解析】 -x =14(0+1+3+4)=2,-y =2.2+4.3+4 4.8+6.7=4.5,而回归直 线方程过样本点的中心(2,4.5),
图 3-1-1
【解析】 由图易知,①③两个图中的样本点在一条直线附近,因此适合 用线性回归模型拟合.
【答案】 ①③
2.若 y 与 x 之间的一组数据为 x01234 y13556
则 y 对 x 的回归直线一定经过的点是________. 【解析】 由表中数据得 x =0+1+25+3+4=2, y =1+3+55+5+6=4. 因回归直线必过样本中心点( x , y ),所以 y 与 x 的回归直线一定经过的点 是(2,4).
阶
阶
段
段
1
3
3.1 回归分析的基本思想及其初步应用
学
阶 段
业 分 层
2
测
评
1.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用. 2.会求回归直线方程,并用回归直线方程进行预报.(重点) 3.了解最小二乘法的思想方法,理解回归方程与一般函数的区别与联系.(难 点)
[ 基础·初探]
教材整理 1 回归直线方程 阅读教材 P80~P82 探究上面倒数第一行,完成下列问题. 1.回归分析
(3)利用相关指数 R2 刻画回归效果
n
yi-y^i2
i=1
1-
n
yi- y 2
其计算公式为:R2=_______________i=_1__________;
2018版高中数学第三章统计案例课时作业17回归分析的基本思想及其初步应用新人教A版选修2-3
课时作业 17 回归分析的基本思想及其初步应用|基础巩固|(25分钟,60分)一、选择题(每小题5分,共25分)1.关于回归分析,下列说法错误的是( )A .回归分析是研究两个具有相关关系的变量的方法B .线性相关系数可以是正的或负的C .回归模型中一定存在随机误差D .散点图能明确反映变量间的关系解析:用散点图反映两个变量间的关系时,存在误差,故D 错误,选D. 答案:D2.在一线性回归模型中,计算其相关指数K 2=0.96,下面哪种说法不够妥当( ) A .该线性回归方程的拟合效果较好B .解释变量对于预报变量变化的贡献率约为96%C .随机误差对预报变量的影响约占4%D .有96%的样本点在回归直线上解析:由相关指数R 2表示的意义可知A ,B ,C 三种说法都很妥当,相关指数R 2=0.96,其值较大,说明残差平方和较小,绝大部分样本点分布在回归直线附近,不一定有96%的样本点在回归直线上,故选D.答案:D3.工人月工资y (单位:元)关于劳动生产率x (单位:千元)的回归方程y ^=650+80x ,下列说法中正确的个数是( )①劳动生产率为1 000元时,工资为730元; ②劳动生产率提高1 000元,则工资提高80元; ③劳动生产率提高1 000元,则工资提高730元; ④当月工资为810元时,劳动生产率约为2 000元. A .1 B .2 C .3 D .4解析:代入方程计算可判断①②④正确. 答案:C4.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:由相关系数的定义及散点图所表达的含义,可知r 2<r 4<0<r 3<r 1,故选A.答案:A5.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归方程为y ^=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A .身高在145.83 cm 左右B .身高在145.83 cm 以上C .身高在145.83 cm 以下D .身高一定是145.83 cm解析:回归方程得到的预报值是预报变量的估计值,它是预报变量可能取值的平均值. 答案:A二、填空题(每小题5分,共15分)6.某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由回归方程中系数b ^的含义知家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2547.有5组数据:(1,3),(2,4),(4,5),(3,10),(10,12),去掉________后剩下的4组数据的线性相关性最大.解析:画散点图易知(3,10)明显异常,其余各点均在一条直线附近. 答案:(3,10)8.在研究气温和热茶销售杯数的关系时,若求得相关指数R 2≈0.85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.解析:由相关指数R 2的意义可知,R 2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.答案:85% 15%三、解答题(每小题10分,共20分)9.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x 与冶炼时间y (从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x (0.01%) 104 180 190 177 147 134 150 191 204 121 y (min) 100 200 210 185 155 135 170 205 235 125 (1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗? (2)求回归直线方程.解析:(1)以x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图所示.从图中可以看出,各点散布在一条直线附近,即它们线性相关. (2)列出下表,并用科学计算器进行计算:i 1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i10 400 36 000 39 90032 745 22 785 18 090 25 500 39 155 47 940 15 125x -=159.8,y -=172,∑i =110x 2i =265 448,∑i =110y 2i =312 350,∑i =110x i y i =287 640设所求的回归直线方程为y ^=b ^x +a ^,则b ^=∑i =110x i y i -10x -y-∑i =110x 2i -10x-2≈1.267,a ^=y --b ^x -≈-30.47.则回归直线方程为y =1.267x -30.47. 10.某工厂为了对新研究的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件) 90 84 83 80 75 68(1)求回归直线方程y ^=b ^x +a ^,其中b ^=-20,a ^=y --b ^x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x -=16(8+8.2+8.4+8.6+8.8+9)=8.5,y -=16(90+84+83+80+75+68)=80,从而a ^=y -+20x -=80+20×8.5=250,故y ^=-20x +250.(2)由题意知,工厂获得利润z =(x -4)y =-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润. |能力提升|(20分钟,40分)11.通过下面的残差图,我们发现在采集样本点的过程中,样本点数据不准确的为( )A .第四个B .第五个。
2018年秋高中数学课时分层作业1回归分析的基本思想及其初步应用新人教A版选修1_2
课时分层作业(一) 回归分析的基本思想及其初步应用(建议用时:40分钟)[基础达标练]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上B [结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.]2.在回归分析中,相关指数R 2的值越大,说明残差平方和( ) A .越大 B .越小 C .可能大也可能小D .以上均错B [∵R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小,故选B.]3.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x ,y 线性相关,线性回归方程为y =0.7x +a ,估计该制药厂6月份生产甲胶囊产量为( )【导学号:48662007】A .8.0万盒B .8.1万盒C .8.9万盒D .8.6万盒B [回归直线一定过样本点的中心.由已知数据可得x =3,y =6,代入线性回归方程,可得a ^=y -0.7x =3.9,即线性回归方程为y ^=0.7x +3.9.把x =6代入,可近似得y ^=8.1,故选B.]4.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 与x的线性回归方程是( )A.y ^=11.47+2.62xB.y ^=-11.47+2.62xC.y ^=2.62+11.47xD.y ^=11.47-2.62xA [由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x·y∑i =18x 2i -8x 2=1 849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的线性回归方程是y ^=2.62x +11.47,故选A.]5.若某地财政收入x 与支出y 满足回归方程y ^=b ^x +a ^+e i (单位:亿元)(i =1,2,…),其中b ^=0.8,a ^=2,|e i |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )【导学号:48662008】A .10亿元B .9亿元C .10.5亿元D .9.5亿元C [y ^=0.8×10+2+e i =10+e i , ∵|e i |<0.5,∴9.5<y ^<10.5.] 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.1 [根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.] 7.对具有线性相关关系的变量x 和y ,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.【导学号:48662009】y ^=-10+6.5x [由题意知x =2,y =3,b ^=6.5,所以a ^=y -b ^x =3-6.5×2=-10,即回归直线的方程为y ^=-10+6.5x .]8.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.-0.29 [把x =160代入y ^=0.85x -82.71, 得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.] 三、解答题9.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:图111(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x )[解] (1)散点图如图.。
课时分层作业17 回归分析的基本思想及其初步应用
课时分层作业17 回归分析的基本思想及其初步应用则()A.r2<r1<0 B.0<r2<r1C.r2<0<r1D.r2=r1C[画散点图,由散点图可知X与Y是正相关,则相关系数r1>0,U与V 是负相关,相关系数r2<0,故选C.]5.关于残差图的描述错误的是()A.残差图的横坐标可以是样本编号B.残差图的横坐标也可以是解释变量或预报变量C.残差点分布的带状区域的宽度越窄相关指数越小D.残差点分布的带状区域的宽度越窄残差平方和越小C[残差点分布的带状区域的宽度越宽,说明模型拟合精度越高,则残差平方和越小,此时,相关指数R2的值越大,故描述错误的是选项C.]二、填空题6.如图3-1-1四个散点图中,适合用线性回归模型拟合的两个变量的是________(填序号).图3-1-1①③[由题图易知,①③两个图中的样本点在一条直线附近,因此适合用线性回归模型拟合.]7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y^=0.67x +54.9.零件数x(个)1020304050加工时间Y(min)62758189________.【导学号:95032239】68[由表知x=30,设模糊不清的数据为m,则y=15(62+m+75+81+89)=307+m 5,因为y =0.67x +54.9,即307+m 5=0.67×30+54.9,解得m =68.]8.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R 2为________.0.25 [回归平方和=总偏差平方和-残差平方和=80-60=20,故R 2=2080=0.25或R 2=1-6080=0.25.]三、解答题9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x -=16(8+8.2+8.4+8.6+8.8+9)=8.5,y -=16(90+84+83+80+75+68)=80.所以a ^=y --b ^x -=80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000=-20⎝ ⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.10.在一段时间内,某1店一种商品的销售价格x 元和日销售量y 件之间的一组数据为:价格x 元 22 20 18 16 14 日销售量y 件3741435056求出y 参考数据:∑i =15x i y i =3 992,∑i =15x 2i =1 660.【导学号:95032240】[解] 作出散点图(此处略),观察散点图,可知这些点散布在一条直线的附近,故可用线性回归模型来拟合数据.因为x -=22+20+18+16+145=18,y -=37+41+43+50+565=45.4.所以b ^=3 992-5×18×45.41 660-5×182=-2.35,a ^=45.4-(-2.35)×18=87.7. 所以回归方程为y ^=-2.35x +87.7. y i -y ^i 与y i -y -的值如下表:y i -y ^i 1 0.3 -2.4 -0.1 1.2 y i -y --8.4-4.4-2.44.610.6计算得∑i =15(y i -y ^i )2=8.3,∑i =15(y i -y -)2=229.2, 所以R 2=1-8.3229.2≈0.964.因为0.964很接近于1,所以该模型的拟合效果比较好.[能力提升练]一、选择题1.如图3-1-2,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )图3-1-2A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强B [由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.]2.已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y ′=b ′x +a ′,则以下结论正确的是( )【导学号:95032241】A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′C [过(1,0)和(2,2)的直线方程为y ′=2x -2,画出六点的散点图,回归直线的大概位置如图所示,显然,b′>b^,a^>a′,故选C.]二、填空题3.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性进行分析,^,b^)如下表:并用回归分析的方法分别求得相关指数R2与残差平方和Q(a甲乙丙丁R20.670.610.480.72Q(a^,b^)106115124103则能体现A.丁[丁同学所求得的相关指数R2最大,残差平方和Q(a^,b^)最小.此时A,B两变量线性相关性更强.]4.某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:时间二月上旬二月中旬二月下旬三月上旬旬平均气温x(℃)381217旬销售量y(件)55m 3324 由表中数据算出线性回归方程y=b x+a中的b=-2,样本中心点为(10,38).(1)表中数据m=__________.(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__________件.【导学号:95032242】(1)40(2)14[(1)由y=38,得m=40.(2)由a^=y-b^x,得a^=58,故y^=-2x+58,当x =22时,y ^=14,故三月中旬的销售量约为14件.] 三、解答题5.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图3-1-3x y w∑8i =1 (x i -x )2∑8i =1 (w i -w )2 ∑8i =1 (x i -x )(y i -y ) ∑8i =1 (w i -w )(y i -y ) 46.6 563 6.8 289.81.61 469108.8表中w i =x i ,w ]=18∑ i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1 (u i -u )2,α^=v -β^ u .[解](1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.由于d^=∑i=18(w i-w)(y i-y)∑i=18(w i-w)2=108.81.6=68,c^=y-d^w=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)①由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
[k12精品]2017_2018学年高中数学课时跟踪检测一回归分析的基本思想及其初步应用新人教A版选修1_2
课时跟踪检测(一)回归分析的基本思想及其初步应用层级一学业水平达标1.在对两个变量x,y进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(x i,y i),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )A.①②⑤③④B.③②④⑤①C.②④③①⑤ D.②⑤④③①解析:选D 对两个变量进行回归分析时,首先收集数据(x i,y i),i=1,2,…,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①,故选D.2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是( )A.0 B.1C.2 D.3解析:选D ①选用的模型是否合适与残差点的分布有关;对于②③,R2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.3.下图是根据变量x,y的观测数据(x i,y i)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )A.①② B.①④C.②③ D.③④解析:选D 根据散点图中点的分布情况,可判断③④中的变量x ,y 具有相关的关系. 4.(重庆高考)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A .y ^=0.4x +2.3B .y ^=2x -2.4 C .y ^=-2x +9.5 D .y ^=-0.3x +4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C ,D .且直线必过点(3,3.5)代入A ,B 得A 正确.5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:选B 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 6.以下是某地区的降雨量与年平均气温的一组数据:或“不具有”)解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.答案:不具有7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1. 答案:18.下列说法正确的命题是________(填序号). ①回归直线过样本点的中心(x ,y );②线性回归方程对应的直线y ^=b ^x +a ^至少经过其样本数据点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; ④在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好. 解析:由回归分析的概念知①④正确,②③错误. 答案:①④9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,从而a ^=y +20x =80+20×8.5=250, 故y ^=-20x +250.(2)由题意知, 工厂获得利润z =(x -4)y =-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润.10.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得b ^=6.5, (1)求y 与x 的线性回归方程;(2)现有第二个线性模型:y ^=7x +17,且R 2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由. 解:(1)依题意设y 与x 的线性回归方程为y ^=6.5x +a ^.x =2+4+5+6+85=5,y =30+40+60+50+705=50,∵y ^=6.5x +a ^经过(x ,y ), ∴50=6.5×5+a ^,∴a ^=17.5,∴y 与x 的线性回归方程为y ^=6.5x +17.5. (2)由(1)的线性模型得y i -y ^i 与y i -y 的关系如下表:所以∑i =15(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.∑i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1 000.所以R 21=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845.由于R 21=0.845,R 2=0.82知R 21>R 2, 所以(1)的线性模型拟合效果比较好.层级二 应试能力达标1.在建立两个变量y 与x 的回归模型中,分别选择4个不同模型,求出它们相对应的R 2如表,则其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型4解析:选B 线性回归分析中,相关系数为r ,|r |越接近于1, 相关程度越大; |r |越小, 相关程度越小,故其拟合效果最好. 故选B .2.如果某地的财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿解析:选C ∵x =10时,y =0.8×10+2+e =10+e , 又∵|e |≤0.5,∴y ≤10.5.3.某咖啡厅为了了解热饮的销售量y (个)与气温x (℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:由表中数据,得线性回归方程y =-2x +a .当气温为-4 ℃时,预测销售量约为( ) A .68 B .66 C .72D .70解析:选A ∵x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,∴40=-2×10+a ,∴a =60,当x =-4时,y =-2×(-4)+60=68.4.甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和i =1n (y i -y ^i )2如下表:哪位同学的试验结果体现拟合A ,B 两变量关系的模型拟合精度高( )A .甲B .乙C .丙D .丁解析:选D 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中 i =1n(y i -y )2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D .5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z ^=ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为________.解析:因为z ^=0.25x -2.58,z ^=ln y ,所以y =e 0.25x -2.58. 答案:y =e 0.25x -2.586.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2547.下表是某年美国旧轿车价格的调查资料.解:设x 表示轿车的使用年数,y 表示相应的平均价格,作出散点图.由散点图可以看出y 与x 具有指数关系, 令z =ln y ,变换得.作出散点图:由图可知各点基本上处于一直线,由表中数据可求出线性回归方程: z ^=8.166-0.298x .因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为y ^=e 8.166-0.298x.8.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解:(1)散点图如图:(2)列下表,并利用科学计算器进行有关计算.x i 0于是b ^=346.3-7×21×2.13 447-7×212≈0.104. a ^=2.1-0.104×21=-0.084,因此回归直线方程为y ^=0.104x -0.084.(3)当x =24时,y =0.104×24-0.084=2.412(千万元).。
2018届高中数学必修人教版回归分析的基本思想及其初步应用第一课时1课件
施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455
y
500
水稻产量
450
400
350
300
· · · ·
· · ·
施化肥量
10 20 30 40 50
x
解: 1.画出散点图
2.求出 b=4 . 7 5 ,a=2 5 6 . 7 9
1.计算公式
n
(xi - x)(yi - y)
r = i=1
2.相关系数的性质
n
n
(x - x) (y - y) (1)|r|≤1.
2
2
(2)|r|越接近于1,相关程i度越大;|r|越接近于0,i相关程度越小.
i=1
i=1
问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?
负相关
正相关
施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455
1、定义: 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。
注 1):相关关系是一种不确定性关系;
2):
对具有相关关系的两个变量进行统计分析的方法叫回归分析。
分析:由于问题中要求根据身高 预报体重,因此选取身高为自变 量,体重为因变量.
y ˆ=0.849x-85.172身 高 172cm女 大 学 生 体 重
y ˆ=0.849× 172-85.712=60.316(kg)
3.通过探究栏目引入“线性回归模型”。此处可以引导学生们体会函数模型与回归模型之间的差别。
(2)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用一次函数y=bx+a 来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体重的关系:y=bx+a+e其中a和b为模 型的未知参数,e是y与 之间的误差,通常e称为随机误差。
2017-2018学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用 第2课时
3.1 回归分析的基本思想及其初步应用第2课时 线性回归分析A 级 基础巩固一、选择题1法分别求得相关系数rA .甲B .乙C .丙D .丁解析:r 越接近1,相关性越强,残差平方和m 越小,相关性越强,所以选D 正确.y ^=0.95x 4.5,所以4.5=0.95×2+a ,所以a =2.6, 所以回归方程是y ^=0.95x +2.6,所以当x =6时,y 的预测值y ^=0.95×6+2.6=8.3. 答案:B3.若某地财政收入x 与支出y 满足线性回归模型y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A .10亿元B .9亿元C .10.5亿元D .9.5亿元 解析:x =10时,y ^=0.8×10+2=10.因为|e |<0.5,所以年支出预计不会超过10.5亿元. 答案:C4.通过残差图我们发现在采集样本点过程中,样本点数据不准确的是( )A .第四个B .第五个C .第六个D .第八个解析:由题图可知,第六个的数据偏差最大,所以第六个数据不准确. 答案:C5.如图所示,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强解析:由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.答案:B 二、填空题6.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),且e i 恒为0,则R 2为________.解析:由e i 恒为0,知y i =y ^i ,即y i -y ^i =0,答案:17.x ,y 满足如下表的关系:则解析:通过数据发现y 的值与x 的平方值比较接近,所以x ,y 之间的函数模型为y =x 2.答案:y =x 28.关于x 与y ,有如下数据:有如下的两个模型:(1)y =6.5x +17.5;(2)y =7x +17.通过残差分析发现第(1)个线性回归模型比第(2)个拟合效果好.则R 21________R 22,Q 1________Q 2(用大于,小于号填空,R ,Q 分别是相关指数和残差平方和).解析:根据相关指数和残差平方和的意义知R 21>R 22,Q 1<Q 2. 答案:> < 三、解答题9.某服装店经营某种服装,在某周内纯获利y (单位:元)与该周每天销售这种服装件数x 之间的一组数据如下表:(1)(2)画出散点图;(3)求纯获利y 与每天销售件数x 之间的回归方程. 解:(1)x =6,y ≈79.86,即样本点的中心为(6,79.86). (2)散点图如图所示:(3)因为b ^=∑7i =1 (x i -x )(y i -y )∑7i =1 (x i -x )2≈4.75,a ^=y ^-b ^x ≈51.36,所以y ^=4.75x +51.36.10.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得b =6.5. (1)求y 与x 的线性回归方程;(2)现有第二个线性模型:y ^=7x +17,且R 2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.解:(1)依题意设y 与x ^^— x =2+4+5+6+85=5,— y 6.5x +a ^经过(—x ,—y ),所以y 与x =6.5x +17.5 .所以a ^.所以a ^=17.5.(2)由(1)的线性模型得y i -y i 与y i -—y 的关系如下表所示:由于R 21=0.845,R 2=0.82知R 21>R 2,所以(1)的线性模型拟合效果比较好.B 级 能力提升1.根据如下样本数据:得到的回归方程为y =bx +a ,若a =7.9,则x 每增加 1个单位,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加1.2个单位D .减少1.2个单位解析:易知x =15×(3+4+5+6+7)=5,y =15×(4+2.5-0.5+0.5-2)=0.9,所以样本点中心为(5,0.9), 所以0.9=5b +7.9,所以b =-1.4,所以x 每增加1个单位,y 就减少1.4个单位.故选B. 答案:B2.若某函数型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为________,回归平方和为________.解析:因为R 2=1-残差平方和总偏差平方和,0.95=1-89总偏差平方和,所以总偏差平方和为1 780;回归平方和=总偏差平方和-残差平方和=1 780-89=1 691.答案:1 780 1 6913.某运动员训练次数与成绩之间的数据关系如下:(1)(2)求出回归方程; (3)作出残差图; (4)计算相关指数R 2;(5)试预测该运动员训练47次及55次的成绩.解:(1)作出该运动员训练次数(x )与成绩(y )之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)— x =39.25,—y =40.875,=13 180,a ^=— y -b ^—x =-0.003 88.所以回归方程为y ^=1.0415x -0.003 88.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算得相关指数R 2=0.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.(5)由上述分析可知,我们可用回归方程y ^=1.041 5x -0.003 88作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y ≈49和y ≈57. 故预测该运动员训练47次和55次的成绩分别为49和57.。
最新-2018高中数学 第1章18回归分析的基本思想及其初步应用课件 新选修1-2 精品
【解】 (1)散点图如图:
(2) x =15×(88+76+73+66+63)=73.2, y =15×(78+65+71+64+61)=67.8.
5
xiyi=88×78+76×65+73×71+66×64
i=1
+63×61=25054.
5
x2i =882+762+732+662+632=27174.
i=1
i=1
53.2,
5
yi-^yi2
i=1
R2=1-
≈0.994,
5
yi- y 2
i=1
所以回归模型的拟合效果很好.
【思维总结】 回归模型拟合效果的好坏可以通 过计算R2来判断,其值越大,说明模型的拟合效 果越好.
变式训练2 为研究重量x(单位:克)对弹簧长度 y(单位:厘米)的影响,对不同重量的6个物体进 行测量,数据如下表所示:
课堂互动讲练
考点突破
线性回归分析
解答线性回归题目的关键首先应通过散点图 来分析两变量间的关系是否相关,然后利用 求回归方程的公式求解回归方程.
例1 某班5名学生的数学和物理成绩如下表:
学科成绩
学生 A B C D E
数学成绩(x)
87766 86363
物理成绩(y)
76766 85141
(1)画出散点图; (2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成 绩. 【思路点拨】 先画散点图,分析物理与数学成 绩是否有线性相关关系,若相关再利用线性回归 模型求解预报变量.
值在研究总体时,可以作为一个参考.
1.1 回归分析的基本思想及其初步 应用
学习目标 1.了解随机误差、残差、残差图的概念. 2.会通过分析残差判断线性回归模型的拟合 效果. 3.掌握建立回归模型的步骤. 4.通过对典型案例的探究,了解回归分析的 基本思想方法和初步应用.
2017-2018学年高中数学选修1-2课时提升作业一1.1回归分析的基本思想及其初步应用习题含答案
温馨提示:此套题为Word 版,请按住Ctrl ,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word 文档返回原板块。
课时提升作业 一回归分析的基本思想及其初步应用一、选择题(每小题5分,共25分) 1.下列四个命题中正确的是( )①在线性回归模型中,e 是b x+a 预报真实值y 的随机误差,它是一个观测的量;②残差平方和越小的模型,拟合的效果越好;③用R 2来刻画回归方程,R 2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高. A 。
①③ B 。
②④ C.①④ D 。
②③【解析】选B.e 是预报变量y 的随机误差,故①不正确;R 2越接近1,拟合的效果越好,故③不正确。
2.甲、乙、丙、丁4位同学各自对A ,B 两个变量进行回归分析,分别得到散点图与残差平方和∑i=1n(y i —iy )2如表:甲 乙 丙 丁散点图残差 平方115106 124 103哪位同学的试验结果体现拟合A,B 两变量关系的模型拟合精度高?( )A.甲B.乙 C 。
丙 D.丁【解析】选D.根据线性相关的知识,散点图中各样本点带状分布越均匀,同时保持残差平方和越小,回归分析建立的线性回归模型的拟合效果越好。
由试验结果知,丁拟合效果较好些。
3.关于残差的叙述正确的是( ) A.残差就是随机误差 B.残差就是方差 C.残差都是正数D.残差可以用来判断模型拟合的效果【解析】选D.根据残差的意义及作用知,D 正确.4.(2016·大连高二检测)在一次试验中,测得(x ,y)的4组值分别为A(1,2),B (2,3),C(3,4),D(4,5),则y 与x 之间的回归直线方程为( )A. y =x+1 B 。
y =x+2 C 。
y =2x+1 D 。
y =x —1【解析】选A 。
由已知条件可知x −=52,y −=72,而回归直线必经过样本点的中心(52,72),故选项A 符合题意。
2019-2020人教A版数学选修2-3 课时分层作业17 回归分析的基本思想及其初步应用
课时分层作业(十七)回归分析的基本思想及其初步应用(建议用时:60分钟)[基础达标练]一、选择题1.如图所示的是四张残差图,其中回归模型的拟合效果最好的是()B [四张残差图中,只有选项A ,B 中的残差图是水平带状区域分布,且选项B 中的残差点散点分布集中在更狭窄的范围内,所以选项B 中回归模型的拟合效果最好.]2.在回归分析中,相关指数R 2的值越大,说明残差平方和( ) A .越大B .越小C .可能大也可能小D .以上均错B [∵R 2=1-∑i =1n (y i -y ^i )2∑i =1n(y i -y )2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小,故选B.]3.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x ,y 线性相关,线性回归方程为y =0.7x +a ,估计该制药厂6月份生产甲胶囊产量为( )A .8.0万盒B .8.1万盒C .8.9万盒D .8.6万盒B [回归直线一定过样本点的中心.由已知数据可得x =3,y =6,代入线性回归方程,可得a ^=y -0.7x =3.9,即线性回归方程为y ^=0.7x +3.9.把x =6代入,可近似得y ^=8.1,故选B.]4.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18xi y i =1 849,则y 与x 的线性回归方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62xA [由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x - y-∑i =18x 2i -8x 2=1 849-8×6.5×28.5478-8×6.52=367140≈2.62,a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的线性回归方程是y ^=2.62x +11.47,故选A.]5.若某地财政收入x 与支出y 满足回归方程y ^=b ^x +a ^+e i (单位:亿元)(i =1,2,…),其中b ^=0.8,a ^=2,|e i |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A .10亿元B .9亿元C .10.5亿元D .9.5亿元C [y ^=0.8×10+2+e i =10+e i , ∵|e i |<0.5,∴9.5<y ^<10.5.] 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.1 [根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.]7.对具有线性相关关系的变量x 和y ,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.y ^=-10+6.5x [由题意知x =2,y =3,b ^=6.5,所以a ^=y -b ^x =3-6.5×2=-10,即回归直线的方程为y ^=-10+6.5x .]8.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.-0.29 [把x =160代入y ^=0.85x -82.71, 得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.] 三、解答题9.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试预测加工10个零件需要多少时间?(注:b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2,a ^=y -b ^x )[解] (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=0.7,所以a ^=y -b ^x =1.05. 所以y ^=0.7x +1.05.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.10.关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y (1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?附:a ^=y -b ^x -,b ^=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x 2[解] (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3, b ^=∑i =15x i y i-5x -y -∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23.于是a ^=y -b ^x =5-1.23×4=0.08. 所以线性回归方程为y ^=b ^x +a ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.[能力提升练]1.甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和∑i =1n (y i -y ^i )2如下表:) A .甲 B .乙 C .丙D .丁D [根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中∑i =1n(y i -y )2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些,故进D.]2.为研究女大学生体重和身高的关系,从某大学随机选取8名女大学生,其身高和体重数据如下表:利用最小二乘法求得身高预报体重的回归方程为y =0.848x -85.632,据此可求得R 2≈0.64.下列说法正确的是( )A .两组变量的相关系数为0.64B .R 2越趋近于1,表示两纽变量的相关关系越强C .女大学生的身高解释了64%的体重变化D .女大学生的身高差异有64%是由体重引起的C [用最小二乘法求得身高预报体重的回归方程为y ^=0.848x -85.632,据此可求得R 2≈0.64,即女大学生的身高解释了64%的体重变化,而随机误差贡献了剩余的36%,故选C.]3.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z ^=ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为________.y =e0.25x -2.58[因为z ^=0.25x -2.58,z ^=ln y ,所以y =e 0.25x -2.58.]4.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x (单位:千箱)与单位成本y (单位:元)的资料进行线性回归分析,结果如下:x =72,y =71,∑i =16x 2i =79,∑i =16x i y i =1 481.则销量每增加1 000箱,单位成本下降________元.1.818 2 [由题意知b ^=1 481-6×72×7179-6×⎝ ⎛⎭⎪⎫722≈-1.818 2,a ^=71-(-1.818 2)×72≈77.36,y ^=-1.818 2x +77.36,销量每增加1千箱,则单位成本下降1.818 2元.]5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16×(8+8.2+8.4+8.6+8.8+9)=8.5,y =16×(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20⎝ ⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时分层作业(十七) 回归分析的基本思想及其初步应用(建议用时:40分钟)[基础达标练]一、选择题1.设有一个回归方程为y ^=2-2.5x ,则变量x 增加一个单位时,( ) A .y 平均增加2.5个单位 B .y 平均增加2个单位 C .y 平均减少2.5个单位D .y 平均减少2个单位C [由回归方程知x 增加一个单位,y 平均减少2.5个单位.]2.对变量x ,y 进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )A [用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.]3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如表所示:则y 对x 【导学号:95032238】A.y ^=x -1 B.y ^=x +1 C.y ^=88+12xD.y ^=176C [设y 对x 的线性回归方程为y ^=b ^x +a ^,x =176,y =176,检验得y =88+x2过点(x ,y ).]4.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 1C [画散点图,由散点图可知X 与Y 是正相关,则相关系数r 1>0,U 与V 是负相关,相关系数r 2<0,故选C.]5.关于残差图的描述错误的是( ) A .残差图的横坐标可以是样本编号B .残差图的横坐标也可以是解释变量或预报变量C .残差点分布的带状区域的宽度越窄相关指数越小D .残差点分布的带状区域的宽度越窄残差平方和越小C [残差点分布的带状区域的宽度越宽,说明模型拟合精度越高,则残差平方和越小,此时,相关指数R 2的值越大,故描述错误的是选项C.]二、填空题6.如图311四个散点图中,适合用线性回归模型拟合的两个变量的是________(填序号).图311①③ [由题图易知,①③两个图中的样本点在一条直线附近,因此适合用线性回归模型拟合.]7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.【导学号:95032239】68 [由表知x =30,设模糊不清的数据为m ,则y =15(62+m +75+81+89)=307+m5,因为y =0.67x +54.9,即307+m5=0.67×30+54.9, 解得m =68.]8.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R 2为________. 0.25 [回归平方和=总偏差平方和-残差平方和=80-60=20,故R 2=2080=0.25或R2=1-6080=0.25.]三、解答题9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x -=16(8+8.2+8.4+8.6+8.8+9)=8.5,y -=16(90+84+83+80+75+68)=80.所以a ^=y --b ^x -=80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.10.在一段时间内,某淘宝网店一种商品的销售价格x 元和日销售量y 件之间的一组数据为:求出y 关于x 参考数据:∑i =15x i y i =3 992,∑i =15x 2i =1 660.【导学号:95032240】[解] 作出散点图(此处略),观察散点图,可知这些点散布在一条直线的附近,故可用线性回归模型来拟合数据.因为x -=22+20+18+16+145=18,y -=37+41+43+50+565=45.4.所以b ^=3 992-5×18×45.41 660-5×182=-2.35,a ^=45.4-(-2.35)×18=87.7.所以回归方程为y ^=-2.35x +87.7. y i -y ^i 与y i -y -的值如下表:计算得∑i =15(y i -y ^i )2=8.3,∑i =15(y i -y -)2=229.2,所以R 2=1-8.3229.2≈0.964.因为0.964很接近于1,所以该模型的拟合效果比较好.[能力提升练]一、选择题1.如图312,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )图3-1-2A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强B [由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.]2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y ′=b ′x +a ′,则以下结论正确的是( )【导学号:95032241】A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′C [过(1,0)和(2,2)的直线方程为y ′=2x -2, 画出六点的散点图,回归直线的大概位置如图所示,显然,b ′>b ^,a ^>a ′,故选C.] 二、填空题3.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数R 2与残差平方和Q (a ^,b ^)如下表:则能体现A ,B 丁 [丁同学所求得的相关指数R 2最大,残差平方和Q (a ^,b ^)最小.此时A ,B 两变量线性相关性更强.]4.某品牌服装专卖店为了解保暖衬衣的销售量y (件)与平均气温x (℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:由表中数据算出线性回归方程y =b x +a 中的b =-2,样本中心点为(10,38). (1)表中数据m =__________.(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__________件.【导学号:95032242】(1)40 (2)14 [(1)由y =38,得m =40. (2)由a ^=y -b ^ x ,得a ^=58, 故y ^=-2x +58, 当x =22时,y ^=14,故三月中旬的销售量约为14件.] 三、解答题5.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图313表中w i =x i ,w ]=18∑ i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1u i -u v i -v∑ni =1 u i -u2,α^=v -β^u .[解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18w i -wy i -y∑i =18w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6, 所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。