高中数学选修3统计案例之线性回归方程习题课
高中数学线性回归方程讲解练习题
教学步骤及教学内容线性回归方程(参考公式:b=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a=y-b x)1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y^=x+1 B.y^=x+2 C.y^=2x+1 D.y^=x-12.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是()A.甲B.乙C.甲、乙相同D.不确定3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得∑8i=1x i=52,∑8i=1y i=228,∑8i=1x2i=478,∑8i=1x i y i=1849,则其线性回归方程为()A.y^=11.47+2.62x B.y^=-11.47+2.62xC.y^=2.62+11.47x D.y^=11.47-2.62x4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 123 4用水量y 4.543 2.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于______.5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)234 5加工的时间y(小时) 2.534 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程y^=bx+a,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?作业布置家长意见家长签名:2013 年_月_日(第_次)审阅人:1。
高中数学选修2-3统计案例之线性回归方程习题课
1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b 是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1nx i-x y i-y∑i=1nx i-x2∑i=1ny i-y2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系( ).A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( ).A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):棉花产量y3334536540544545455(1)(2)判断是否具有相关关系.[审题视点] (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解(1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( ).A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a^、b^,即可求出线性回归方程.(3)问将x=100代入回归直线方程即可.解(1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得:∑i =14x 2i =86, x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨). 已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b^=∑i=14x i y i-4x·y∑i=14x2i-4x2=66.5-4×4.5×3.586-4×4.52=0.7,a^=y-b^x=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y^=0.7x+0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为( ).A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r=-0.9362,则变量y 和x 之间具有线性相关关系解析:选C.C 中应为R 2越大拟合效果越好.例18.已知回归方程y ^=2x +1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5,当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03. 例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y^=bx+a必过点(x,y);③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x 99.5110.511销售量y 1110865yx具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a^=y-b^x=40,∴回归直线方程为y^=-3.2x+40.答案:y^=-3.2x+40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:身高(cm)14315615917216517117716116416体重(kg)41496179686974696854的身高和体重之间是否有相关关系.解:以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差x(℃)101113128发芽数y(颗)2325302616组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^x +a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=52x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。
2018-2019学年高中数学 第三章 统计案例课后训练 新人教A版选修2-3
第三章 统计案例[A 基础达标]1.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归方程y ^=b ^x +a ^必过样本点的中心(x -,y -) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系 解析:选C.R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 2.下列说法中正确的有:( ) ①若r >0,则x 增大时,y 也相应增大; ②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上. A .①② B .②③ C .①③D .①②③解析:选C.若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故①正确,r <0,表示两个变量负相关,x 增大时,y 相应减小,故②错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故③正确.3.若两个变量的残差平方和是325, i =1n(y i -y ―)2=923,则随机误差对预报变量的贡献率约为( ) A .64.8% B .60% C .35.2%D .40%解析:选C.由题意可知随机误差对预报变量的贡献率约为325923≈0.352.4.有下列数据x 1 2 3 y35.9912.01A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:选A .分别把x =1,2,3,代入求值,求最接近y 的值,即为模拟效果最好,故选A . 5.通过随机询问100名性别不同的小学生是否爱吃零食,得到如下的列联表:由K 2=n (ad (a +b )(c +d )(a +c )(b +d ),计算得K 2=250×50×30×70≈4.762.参照附表,得到的正确结论为( )A .在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B .在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C .有97.5%以上的把握认为“是否爱吃零食与性别有关”D .有97.5%以上的把握认为“是否爱吃零食与性别无关”解析:选A .因为K 2≈4.762>3.841,P (K 2>3.841)=0.05.所以在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”,故选A .6.某种活性细胞的存活率y (%)与存放温度x (℃)之间有如下几组样本数据:6 ℃时,该种细胞的存活率的预报值为________%.解析:设回归直线方程为y ^=-3.2x +a ^,因为x ―=1,y ―=50,则a ^=y ―+3.2x ―=53.2.当x =6时,y ^=-3.2×6+53.2=34. 答案:347.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y =3e 2x +1的图象附近,则可通过转换得到的线性回归方程为________. 解析:由y =3e2x +1,得ln y =ln (3e2x +1),即ln y =ln 3+2x +1,令u =ln y ,v =x ,则线性回归方程为u =1+ln 3+2v . 答案:u =1+ln 3+2x (其中u =ln y )8.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:________的前提下认为患慢性气管炎与吸烟有关. 附:K 2=n (ad -(a +b )(c +d )(a +c )(b +d ).解析:K 2的观测值k =100×(20×55-20×5)240×60×25×75≈22.2>10.828.所以在犯错误的概率不超过0.001的前提下认为患慢性气管炎与吸烟有关. 答案:22.2 0.0019.某学校高三年级有学生1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学),现用分层抽样方法(按A 类、B 类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 c m 作为达标的标准,对抽取的100名学生,得到以下列联表:(1)(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K 2的观测值精确到0.001)? 解:(1)填写列联表如下:身高达标 身高不达标总计 经常参加体育锻炼 40 35 75 不经常参加体育锻炼10 15 25 总计5050100(2)由列联表中的数据,得K 2的观测值为 k =100×(40×15-35×10)275×25×50×50≈1.333<3.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系. 10.某城市理论预测2011年到2015年人口总数与年份的关系如表所示:年份2011+x (年) 0 1 2 3 4 人口数y (十万)5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)据此估计2018年该城市人口总数. 解:(1)散点图如图:(2)因为x ―=0+1+2+3+45=2,y ―=5+7+8+11+195=10,a ^=y ―-b ^x ―=3.6;所以线性回归方程为y ^=3.2x +3.6. (3)令x =7,则y ^=3.2×7+3.6=26.即估计2018年该城市人口总数为26十万.[B 能力提升]11.(2018·河南洛阳3月模拟)某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东、西部各5个城市,得到观看该节目的人数的统计数据(单位:千人),并画出如下茎叶图,其中一个数字被污损.东部 西部 9 8 83 3 72 1 09 · 9(1)求东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数的概率;(2)该节目的播出极大地激发了观众对成语知识学习积累的热情,现从观看节目的观众中随机统计了4位观众学习成语知识的周均时间(单位:小时)与年龄(单位:岁),并整理了如下对照表:年龄x20 30 40 50 周均学习成语知识时间y2.5344.5根据表中数据,试求线性回归方程y ^=b ^x +a ^,并预测年龄为60岁的观众周均学习成语知识的时间.解:(1)设被污损的数字为a ,则a 有10种情况.由88+89+90+91+92>83+83+87+90+a +99,得a <8,所以有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数, 所求概率为810=45.a ^=y -b ^x =3.5-7100×35=2120.所以y ^=7100x +2120.当x =60时,y ^=5.25.即预测年龄为60岁的观众周均学习成语知识的时间为5.25小时.12.(选做题)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如下茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系?(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X 的分布列及数学期望.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d ,P (K 2≥k 0)0.025 0.010 0.005 k 05.0246.6357.879解:(1)由茎叶图可得正常 偏高 合计 男性 16 4 20 女性 12 8 20 合计281240K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=40×(16×8-4×12)220×20×28×12≈1.905<6.635,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系. (2)由样本数据可知,男性正常的概率为45,女性正常的概率为35.此项血液指标为正常的人数X 的可能取值为0,1,2,3,4,P (X =0)=(1-45)2(1-35)2=4625, P (X =1)=C 1245(1-45)(1-35)2+(1-45)2C 1235(1-35)=44625, P (X =2)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫1-352+C 1245⎝ ⎛⎭⎪⎫1-45C 1235·⎝ ⎛⎭⎪⎫1-35+⎝ ⎛⎭⎪⎫1-452⎝ ⎛⎭⎪⎫352=169625, P (X =3)=C 1245⎝ ⎛⎭⎪⎫1-45⎝ ⎛⎭⎪⎫352+⎝ ⎛⎭⎪⎫452C 1235·⎝ ⎛⎭⎪⎫1-35=264625,P (X =4)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫352 =144625, 所以X 的分布列为所以E (X )=0×625+1×625+2×625+3×625+4×625=2.8, 即此项血液指标为正常的人数X 的数学期望为2.8.。
高中数学第三章统计案例3.1第2课时线性回归分析达标练习含解析2_3
第三章统计案例3.1 回归分析的基本思想及其初步应用第2课时线性回归分析A级基础巩固一、选择题1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表所示:分类甲乙丙丁r 0.820。
780.690。
85m 106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁解析:r越接近1,相关性越强,残差平方和m越小,相关性越强,所以选D正确.答案:D2.已知回归方程错误!=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9。
1),则残差平方和是()A.0。
01 B.0。
02 C.0.03 D.0.04解析:因为残差错误!i=y i-错误!i,所以残差的平方和为(4。
9-5)2+(7。
1-7)2+(9.1-9)2=0。
03。
答案:C3.若某地财政收入x与支出y满足线性回归模型y=bx+a +e(单位:亿元),其中b=0.8,a=2,|e|〈0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.10亿元B.9亿元C.10。
5亿元D.9。
5亿元解析:x=10时,错误!=0。
8×10+2=10.因为|e|〈0.5,所以年支出预计不会超过10.5亿元.答案:C4.下列说法中正确的是()①相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱;②回归直线错误!=错误!x+错误!一定经过样本点的中心(x,y);③随机误差e满足E(e)=0,其方差D(e)的大小用来衡量预报的精确度;④相关指数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越好.A.①②B.③④C.①④D.②③解析:①线性相关关系r是衡量两个变量之间线性关系强弱的量,|r|越接近于1,这两个变量线性相关关系越强,|r|越接近于0,线性相关关系越弱,①错误;②回归直线错误!=错误!x +错误!一定通过样本点的中心(x,y),②正确;③随机误差e是衡量预报精确度的一个量,它满足E(e)=0,③正确;④用相关指数R2用来刻画回归的效果,R2越大,说明模型的拟合效果越好,④错误.答案:D5.如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.答案:B二、填空题6.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),且e i恒为0,则R2为________.解析:由e i恒为0,知y i=错误!i,即y i-错误!i=0,答案:17.根据如下样本数据得到的回归方程为错误!=错误!x+错误!,若错误!=5。
高中数学第三章统计案例3_2回归分析课后导练苏教版选修23
高中数学 第三章 统计案例 回归分析课后导练 苏教版选修2-3基础达标某运动员训练次数与运动成绩之间的数据关系如下: 次数(x ) 32 33 35 37 39 44 46 成绩(y )25343739424851试求y 与x 之间的回归直线方程. 解析:∵x =38,y =,∴∑=71i i i y x =10 756,∑=712i i x =10 280,∑=712i i y =11 340.∴b ^=∑∑==--71227177i ii iixxy x yx =,a ^=y -b ^x =.∴回归直线方程为y^=考察硫酸铜在水中的溶解度y 与温度x 的关系时,做了9组试验,其数据如下: 温度x /℃ 0 10 20 30 40 50 60 70 80 溶解度y /g求:(1)回归直线方程;(2)相关系数r . 解析:(1)利用计算器分别求出x ,y ,∑=712i i x ,∑=912i iy,∑=91i ii yx ,利用回归直线公式可求出b ^= 2,a ^=可知,回归直线方程为y^= 2x +.(2)将上述数据代入相关系数公式,可得r= 4.水深x /m 流速y /(m·s -1)(2)预测水深为 m 时水的流速是多少?序号 xy x 2x y1 2 3 4 5 6 7 8 ∑于是,x =81×=,y =81×= 5. b ^=694.0151175.1892.249775.175.18993.272≈=⨯-⨯⨯- =1511≈. a ^= 5-1511×≈.y 对x 的回归直线方程为y^=a ^+b ^x =+.回归系数b ^=的意思是,在此灌溉渠道中,水深每增加 m ,水的流速平均增加 m /s(本例数据是以 m 为水深间隔测得的),a ^=可以解释为水的流速中不受水深影响的部分. (2)由(1)中求出的回归直线方程,把x =代入,易得y^=+×≈(m /s). 计算结果表明,当水深为 m 时可以预测水的流速约为 m /s.4.从某地成年男子中随机抽取n 人,测得平均身高x =172 c m,标准差s x = c m,平均体重y =72k g,标准差s y = k g,相关系数r =yyxx xy l l l =.求由身高估计平均体重的回归方程y ^=β^0+β^1x ,以及由体重估计平均身高的回归方程x ^=a ^+b ^y .解析:∵s x =n l xx,s y =nl yy ,∴nl n l nl yy xxxy •==××=. ∴β^1=26.776.57=nl n l xxxy=1. 于是可得b =212122121)125.18(12808.298475.2125.1812243.541212⨯-⨯⨯-=--∑∑==i ii iixxy x yx ≈. β^0=y -x β^1=72-172×1=-100,∴由身高估计平均体重的回归方程为y^=x -100.由x 、y 位置的对称性,得b^=22.1576.57=nlnlyyxy=.∴a^= x-y b^=172-72×=154.∴由体重估计平均身高的回归方程为x^=+154.5.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据: xy(1)画出散点图;(2)求月总成本y与月产量x之间的回归直线方程.解析:(1)画出的散点图如图所示.(2)通过计算器可得b^≈,a^=y-b^x= ×125.18≈.因此所求的回归直线方程是y^=+.6.已知10只狗的血球体积及红血球数的测量值如下表:血球体积x(mm)45 42 46 48 42 35 58 40 39 50红血球数y(百万)思路分析:求回归直线方程,就是由公式计算b^与a^的值.解析:由题意,得x=,y=,设回归直线方程为同y^=b^x+a^则b^=∑∑==--niiniiix nxy x nyx1221≈,a^=.故所求的回归直线方程为y^=调查者通过询问男、女大学生在购买食品时是否看营养说明得到的数据如下表所示:看营养说明不看营养说明总计男大学生23 32 55女大学生9 25 34总计32 57 89利用列联表的独立性检验估计看营养说明是否与性别有关系?思路分析:根据列联表中的数据代入公式求得χ2的值,进行比较判断得出相应结论.解:由公式得χ2=57323455)9322523(89))()()(()(22⨯⨯⨯⨯-⨯⨯=++++-d b c a d c b a bc ad n ≈<,所以我们没有理由认为看营养说明与男女性别有关,尽管在这次调查中男性看营养说明的比例5523比女性看营养说明的比例349高,但我们不能认为这些男、女大学生中男性比女性看营养说明的多.8.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料: 产量(千件) x 生产费用(千元)y 40 150 42 140 48 160 55 170 65 150产量(千件)x 生产费用(千元)y 79 162 88 185 100 165 120 190 140185(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为y ^=b ^x +a ^,求系数a ^,b ^. i x iy i x i 2y i 2x i y i1 40 150 1600 22500 60002 42 140 1764 19600 58803 48 160 2304 25600 7680 4 55 170 3 025 28 900 9 350 5 65 150 4 225 22 500 9 7506 79 162 6 241 26 244 12 7987 88 185 7 744 34 225 16 280 8 100 165 10 000 27 225 16 5009 120 190 14 400 36 100 22 800 10 140 185 19 600 34 225 25 900 合计7771 65770 903277 119132 929x =,y=,∑=1012i i x =70 903,∑=1012i i y =277 119,∑=101i ii yx =132 929r=)7.16510277119)(7.771070903(7.1657.771013292922⨯-⨯-⨯⨯-,即x 与y 的相关系数r≈.(2)查表显著性水平,自由度10-2=8.相应的相关系数临界值r = 9;因为r>,所以可以认为x 与y 之间具有线性相关关系. (3)b ^=27.7710709037.1657.7710132929⨯-⨯⨯-≈; a ^=综合运用9.已知10只狗的血球体积及红血球数的测量值如下表:x :血球体积(mm)y :红血球数(百万)45 42 46 48 42 39 50 35 58 40(1)画出上表的散点图;(2)求出回归直线并画出图形. 解析:(1)见下图:(2)x =101(45+42+46+48+42+35+58+40+39+50)=, y =101+++++++++=. 设回归直线的方程为y ^=b ^x +a ^,则b ^=∑∑==--ni ini iixn xy x n yx 1221 =,a ^=y -b x =.所以所求的回归直线为y ^=炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x 与冶炼时间y (从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x %) 104 180 190 177 147 134 150 191 204 121 y (mi n ) 100 200 210 185 155 135 170205235125(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.(3)预测当钢水含碳量为160个%时,应冶炼多少分钟? 思路分析:(1)判定两个变量是否具有线性相关关系,可通过计算相关系数与临界值关系;(2)设回归直线方程,依公式代入相关量计算可得;(3)把x =160代入回归直线方程求解可得. 解:(1)根据题意列表并计算如下: i1 2 3 4 5 6 7 8 9 10 x i104 180 190 177 147 134 150 191 204 121 y i100200210185155135170205235125x i y i 10400 36000 39900 32745 22785 18090 25500 39155 47940 15125x =,y =172,∑=1012i ix=265 448,∑=1012i iy=312 350,∑=101i ii yx i=287 640于是r=∑∑∑===---1011012222101)10(1010i i i ii iiy y x xyx yx ≈ 6,查表得显著性水平与n -2的相关系数临界值=, ∴r>.∴y 与x 具有线性相关关系. (2)设所求的回归直线方程为y^=b ^x +a ^,b ^=∑∑==--101221011010i ii iixxy x yx ≈,a ^≈,即所求的回归直线方程为y ^=当x =160时,y ^=×≈172(m i n ),即大约冶炼172 m i n . 11.研究某特殊药物A 有无副作用(比如服用后恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表: 有恶心 无恶心 合计 给药A 153550给安慰剂 4 46 50 合计1981100试问此药物有无恶心的副作用?思路分析:根据列联表中的数据代入公式求得χ2的值,与临界值进行比较判断得出相应结论.解:由题意,问题可以归纳为独立检验假设H 1:服该药物(A )与恶心(B )独立.为了检验假设,计算统计量χ2=81195050)3544615(1002⨯⨯⨯⨯-⨯⨯≈>.故拒绝H 1,即不能认为药物无恶心副作用,也可以说,我们有99%的把握说,该药物与副作用(恶心)有关.12.为了了解某地母亲身高x 与女儿身高y 的相关关系,随机测得10对母女的身高,如下表所示:母亲身高x /c m 159 160 160 163 159 154 159 158 159 157 女儿身高y /c m158 159 160161161155162157162156试对x 与y 进行一元线性回归分析,并预测当母亲身高为161 c m 时女儿的身高为多少? 解析:先对x 与y 作相关性检验.(1)作统计假设:x 与y 不具有线性相关关系. (2)由小概率与n -2=8在附表中查得=. (3)x =101(159+160+…+157)=, y =101(158+159+…+156)=, ∑=-1012210i i x x =(1592+1602+…+1572)-10×=,∑=101i ii yx -10x y =(159×158+160×159+…+157×156)-10××=,∑=1012i iy-10y 2=(1582+1592+…+1562)-10×=,所以r=9.566.472.37⨯≈.(4)|r|=>,即|r|>.从而有95%的把握认为x 与y 之间具有线性相关关系,去求回归直线方程是有意义的. 回归系数b ^=6.472.37≈≈, a ^=所以y 对x 的回归直线方程是y ^=+.回归系数反映出当母亲身高每增加1 c m时女儿身高平均增加 c m,a^=可以解释为女儿身高不受母亲身高变化影响的部分.当x=161时,y^=+×161=.这就是说当母亲身高为161 c m时女儿的身高大致也接近161 c m.。
最新苏教版高中数学必修三《线性回归方程》课时同步练习及解析.docx
(新课标)2018-2019学年苏教版高中数学必修三2.4 线性回归方程课时目标 1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求线性回归方程.1.与函数关系不同,相关关系是一种有关系,但不是确定性的关系.2.能用直线方程________近似表示的相关关系叫做线性相关关系,该方程叫______,给出一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程中的系数a ,b 满足⎩⎪⎨⎪⎧b = a =.上式还可以表示为⎩⎪⎨⎪⎧b = ,a = .一、填空题1.下列两个变量之间的关系,不是函数关系的为______.(填序号) ①匀速行驶车辆的行驶距离与时间; ②圆半径与圆的面积;③正n 边形的边数与内角度数之和; ④人的年龄与身高.2.下列有关线性回归的说法,不正确的是________.①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x 、y 之间的关系; ④任何一组观测值都能得到具有代表意义的线性回归方程.3.工人月工资(元)依劳动生产率(千元)变化的线性回归方程为 =60+90x ,下列判断正确的是________.①劳动生产率为1千元时,工资为50元; ②劳动生产率提高1千元时,工资提高150元;③劳动生产率提高1千元时,工资约提高90元;④劳动生产率为1千元时,工资90元.4.某商品销售量y(件)与销售价格x(元/件)在实际生活中的回归方程可能是________.①=-10x+200;②=10x+200;③=-10x-200;④=10x-200.5.给出两组数据x、y的对应值如下表,若已知x、y是线性相关的,且线性回归方程:y=a+bx,经计算知:b=-1.4,则a=________.x 45678y 121098 66.线性回归方程表示的直线=a+bx必经过点____________.7.若对某个地区人均工资x与该地区人均消费y进行调查统计得y与x具有相关关系,且线性回归方程=0.7x+2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.8.设有一个回归方程=3-2.5x,当变量x增加一个单位时,变量y________个单位.9.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的线性回归方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差______分.二、解答题10.下表是某旅游区游客数量与平均气温的对比表:平均气温(℃)-1410131826数量(百个)202434385064若已知游客数量与平均气温是线性相关的,求回归方程.11.5个学生的数学和物理成绩(单位:分)如下表:学生A B C D E学科数学8075706560物理7066686462画出散点图,判断它们是否具有相关关系,若相关,求出回归方程.能力提升12.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:温度x(℃)010205070溶解度y 66.776.085.0112.3128.0则由此得到回归直线的斜率约为________.13.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0.01% )104181917714713415191204121y(min)10202118515513517205235125若由数据知y对x呈线性相关关系.(1)求线性回归方程.(2)预测当钢水含碳量为160时,应冶炼多少分钟?1.线性回归方程=bx+a中的系数a,b的计算公式为:⎩⎪⎨⎪⎧b =∑ni =1(x i -x )(y i -y )∑n i =1 (x i -x )2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2a =y -b x其中:b 是回归方程的斜率,a 是截距. 2.回归方程的求解过程 计算x ,y ,∑ni =1x 2i ,∑ni =1x i y i ⇓计算b =∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x⇓3.在回归方程 =bx +a 中,当回归系数b >0时,说明两个变量呈正相关关系,它的意义是:当x 每增加一个单位时y 就增加b 个单位;当b <0时,说明两个变量呈负相关关系,它的意义是:当x 每增加一个单位时,y 就减少b 个单位.2.4 线性回归方程知识梳理2. =bx +a 线性回归方程 n ∑ni =1x i y i -(∑ni =1x i )(∑ni =1y i )n ∑ni =1x 2i -(∑ni =1x i )2y -b x∑ni =1x i y i -n x y ∑ni =1x 2i -n x2=∑ni =1(x i -x )(y i -y )∑ni =1(x i -x )2y -b x作业设计 1.④解析 人的年龄与身高具有相关关系. 2.④解析 只有所有的数据点都分布在一条直线附近时,才能得到回归直线. 3.③解析 因工人月工资与劳动生产率变化的线性回归方程为 =60+90x ,当x 由a 提高到a +1时, 2- 1=60+90(a +1)-60-90a =90. 4.①解析 ∵在实际生活中,当销售价格提高时,商品销售量一般要降低,∴排除②、④,又∵③中x>0时 <0不合题意,∴③错. 5.17.4 解析x =15(4+5+6+7+8)=6,y =15(12+10+9+8+6)=9.a =y -b x =9+1.4×6=9+8.4=17.4. 6.(x ,y )解析 由a =y -b x 得y =b x +a , 即点(x ,y )适合方程 =a +bx. 7.87.5%解析 设该地区人均工资收入为y , 则y =0.7x +2.1,当y =10.5时,x =10.5-2.10.7=12.10.512×100%=87.5%. 8.减少2.5解析′=3-2.5(x+1)=3-2.5x-2.5=-2.5,因此,y的值平均减少2.5个单位.9.20解析令两人的总成绩分别为x1,x2.则对应的数学成绩估计为=6+0.4x1,2=6+0.4x2,所以| 1-2|=|0.4(x1-x2)|=0.4×50=20.10.解x=706=353,y=2306=1153,∑6i=1x2i=1+16+100+169+324+676=1 286,∑6i=1x i y i=-20+96+340+13×38+18×50+26×64=3 474.b=∑6i=1x i y i-6x y∑6 i=1x2i-6x2=3 474-6×353×11531 286-6×(353)2≈1.68,a=y-b x≈18.73,即所求的回归方程为=1.68x+18.73.11.解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为线性相关.列表,计算i 1 2 3 4 5x i80 75 70 65 60y i70 66 68 64 62x i y i 56004950476041603720x2i 64005625490042253600x=70,y=66,∑5i=1x2i=24 750,∑5i=1x i y i=23 190设所求回归方程为=bx+a,则由上表可得b=∑5i=1x i y i-5x y∑5 i=1x2i-5x2=90250=0.36,a =y -b x =40.8.∴所求回归方程为 =0.36x +40.8. 12.0.880 9 解析x =30,y =93.6,∑5i =1x 2i =7 900,∑5i =1x i y i =17 035,所以回归直线的斜率b =∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=17 035-5×30×93.67 900-4 500≈0.880 9.13.解 (1)列出下表,并用科学计算器进行计算: i 1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i10400360003990032745227851809025500391554794015 125x =159.8,y =172,∑10i =1x 2i =265 448,∑10i =1y 2i =312 350,∑10i =1x i y i =287 640 设所求线性回归方程为 =bx +a ,b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2≈1.27,a =y -b x ≈-30.95.即所求的线性回归方程为 =1.27x -30.95.(2)当x =160时, =1.27×160-30.95≈172(min ),即大约冶炼172 min .。
一元线性回归分析案例
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的线性相 关关系,因此可以用线性回归方程刻画它们之间 的关系。
第17页/共39页
课题:选修2-3 8.5 回归分析案例
分析:由于问题中要求根 据身高预报体重,因此选 取身高为自变量,体重为 因变量.
再冷的石头,坐上三年也会暖 !
1. 散点图;
2.回归方程: yˆ 0.849x 85.172 身高172cm女大学生体重 yˆ = 0.849×172 - 85.712 = 60.316(kg)
本例中, r=0.798>0.75.这表明体重与身高有很强的线性相关关系,从而也表明我们 建立的回归模型是有意义的。
xi2
2
nx
,......(2)
i 1
i 1
其中x
1 n
n i 1
xi ,
y
1 n
n i 1
yi .
(x, y) 称为样本点的中心。
第8页/共39页
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
1、回归直线方程
1、所求直线方程叫做回归直线方程;
相应的直线叫做回归直线。
2、对两个变量进行的线性分析叫做线性回归分析。
然后,我们可以通过残差 e1, e2 , , en 来判断模型拟合的效果,
判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
编号 1
2
3
4
5
人教版高中数学第三章3.1第2课时线性回归分析
+
8.95
+
9.90
+
10.9
+
11.8)≈9.487,
所以 R2=1-01.40.16378184≈0.999 1, 所以回归模型的拟合效果较好.
(3)由表中数据可以看出残差点比较均匀地落在不超 过 0.15 的狭窄的水平带状区域中,说明选用的线性回归 模型的精度较高,由以上分析可知,弹簧长度与拉力成线 性关系.由残差表中的数值可以看出第 3 个样本点的残差 比较大,需要确认在采集这个数据的时候是否有人为的错 误,如果有的话,需要纠正数据,重新建立回归模型.
由公式得:^z =0.69x+1.115,则有^y=e0.69x+1.115. (2)由计数器得如下数表:
^y 6.08 12.12 24.17 48.18 96.06 191.52 y 6 12 25 49 95 190
R2=1-244.8614621.8≈0.999 8, 即解释变量天数对预报变量繁殖细菌个数解释了 99.98%.
x 21 23 25 27 29 32 35 z 1.946 2.398 3.045 3.178 4.190 4.745 5.784
利用公式求得回归直线方程为^z =0.272x-3.849, 所以^y =e0.272x-3.849
残差:
yi 7
11
21
24
66 115
yi 6.443 11.101
解析:因为^z =0.25x-2.58,^z =ln y,所以 y=e0.25x
-2.58.
答案:y=e0.25x-2.58
类型 1 线性回归分析(自主研析)
[典例 1] 为研究重量 x(单位:克)对弹簧长度 y(单位: 厘米)的影响,对不同重量的 6 个物体进行测量,数据如 下表所示:
3.1_回归分析(三)
xi2 1660, yi2 327, xi yi 620,
i 1 i 1 i 1
ˆ b
x y 5x y
i 1 5
x
i 1
2 i
5x
2
620 5 18 7.4 1.15. 2 1660 5 18
ˆ a 7.4 1.15 18 28.1.
残差图的制作及作用 几点说明: 1、坐标纵轴为残差变量,横轴可以有不同的选择; 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为 2、若模型选择的正确,残差图中的点应该分布在以横 的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数 据;如果数据采集没有错误,则需要寻找其他的原因。 轴为心的带形区域; 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这 样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。 3、对于远离横轴的点,要特别注意。
x
6 9 12 15 18 21 24 27 30 33 36 39
郑平正 制作
最好的模型是哪个?
400 300
400 300 200 100 0
0 5 10 15 20 25 30 35 40
产卵数
产卵数
200 100 0 -100
450 400 350 300 250
产卵数
-40
-30
-20
-10 0 -100 -200
2013-6-13
郑平正 制作
复习回顾
1、线性回归模型: y=bx+a+e, (3)
y=bx+a+e,
E(e)=0,D(e)=
高中数学第三章统计案例1回归分析课后作业含解析北师大版选修2_3 (1)
1 回归分析[A组基础巩固]1.设有一个线性回归方程y=2-2.5x,则变量x增加1个单位时()A.y平均增加2.5个单位B.y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位解析:在线性回归方程y=bx+a中,①当b>0时,说明变量y与x正相关;②当b<0时,说明变量y与x负相关;③x每增加1个单位,y就增加或减少|b|个单位.因为回归直线的斜率为-2.5,即变量x增加1个单位,y平均减少2.5个单位.答案:C2.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u和v正相关B.变量x与y正相关,u和v负相关C.变量x与y负相关,u和v正相关D.变量x与y负相关,u和v负相关解析:由这两个散点图可以判断,变量x与y负相关,u与v正相关.答案:C3.观察两个变量的如下数据:x -1-2-3-4-55432 1y -0.9-2-3.1-3.9-5.15 4.1 2.9 2.10.9若x与y具有线性相关关系,则两个变量间的线性回归方程为()A.y=0.5x-1 B.y=xC.y=2x+0.3 D.y=x+1解析:∵x =0,y =0,∴回归直线必定经过点(0,0),经检验知B 正确. 答案:B4.已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归方程y =bx +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A .b >b ′,a >a ′B .b >b ′,a <a ′C .b <b ′,a >a ′D .b <b ′,a <a ′ 解析:b ′=2,a ′=-2,由公式b =6i =1(x i -x )(y i -y )6i =1(x i -x )2求得. b =57,a =y -b x =136-57×72 =-13,∴b <b ′,a >a ′.选C. 答案:C5.对于指数曲线y =a e bx ,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为( )A .u =c +bxB .u =b +cxC .y =b +cxD .y =c +bx解析:对方程y =a e bx 两边同时取对数,然后将u =ln y ,c =ln a 代入,不难得出u =c +bx .答案:A6.已知x 与y 之间的一组数据如下表:x 0 1 2 3 y2468则可求得y 与x 的线性回归方程y =bx +a 必过点________.解析:x =0+1+2+34=32,y =2+4+6+84=5.所以过点(32,5).答案:(32,5)7.若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,预计小麦产量为________.解析:把x =50代入y =250+4x ,可求得y =450. 答案:450 kg8.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程为y =0.254x +0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 答案:0.2549.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:若加工时间y 与零件个数x 之间有较好的线性相关关系. (1)求加工时间与零件个数的线性回归方程; (2)求加工10个零件需要的时间.解析:(1)由表中数据及计算公式得b =0.7,a =y -b x =1.05,因此,所求的线性回归方程为y =0.7x +1.05.(2)将x =10代入线性回归方程,得y =0.7×10+1.05=8.05(小时),即加工10个零件需要的时间为8.05小时.10.某工厂1~8月份某种产品的产量x (t)与成本y (万元)的统计数据见下表:(1)画出散点图;(2)y 与x 是否具有线性相关关系?若有,求出回归方程. 解析:(1)由表画出散点图如图所示:(2)由(1)中图可看出,这些点基本散布在一条直线附近,可以认为x 和y 线性相关,下面求回归方程:x =6.85,y =157.25,∴b =∑8i =1x i y i -8x ·y ∑8i =1x 2i -8x 2=8 764.5-8×6.85×157.25382.02-8×6.852≈22.17,a =y -b x ≈157.25-22.17×6.85≈5.39. ∴回归方程为y =22.17x +5.39.[B 组 能力提升]1.以下是福建某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积(m 2) 115 110 80 135 105 销售价格(万元)24.821.618.429.222则两个变量间的线性回归方程为( ) A .y =0.5x -1B .y =0.196 2x +1.816 6C .y =2x +1.816 6D .y =0.196 2x +18.016 6解析:因为x =15(115+110+80+135+105)=109,y =15(24.8+21.6+18.4+29.2+22)=23.2,所以两个变量间的回归直线必过点(109,23.2).代入验证知应选B. 答案:B2.一唱片公司欲知打歌费用x (十万元)与唱片销售量y (千张)之间的关系,乃从其所发行的唱片中随机抽取了10张,得如下的资料,∑10i =1x i =28,∑10i =1x 2i =303.4,∑10i =1y i =75,∑10i =1y 2i =598.5,∑10i =1x i y i =237,则y 与x 的相关系数r 的绝对值为________. 解析:由公式r =∑ni =1x i y i -n x y(∑ni =1x 2i -n x 2)(∑ni =1y 2i -n y 2),得r =237-10×2.8×7.5(303.4-10×2.82)×(598.5-10×7.52)=0.3,即|r |=0.3. 答案:0.33.对20艘轮船的研究中,船的吨位区间从192 t 到3 246 t ,船员的数目从5人到32人,对船员人数关于船的吨位进行回归分析得到如下结果:船员人数=9.5+0.006 2×吨位.(1)假定两艘船吨位相差1 000 t ,则船员平均人数相差________;(2)对于最小的船估计的船员人数是________,对于最大的船估计的船员人数是________. 解析:设船员人数分别为y 1,y 2,吨位分别为x 1,x 2则y 1-y 2=(9.5+0.006 2x 1)-(9.5+0.006 2x 2)=0.006 2(x 1-x 2)=0.006 2×1 000=6.2,所以船员平均人数相差6.最小的船所载船员人数为9.5+0.006 2×192≈10,最大的船所载船员人数为9.5+0.006 2×3 246≈29.答案:(1)6 (2)10 294.某地今年上半年患某种传染病人数y 与月份x 之间满足的函数关系模型为y =a e bx ,试确定这个函数解析式.解析:设u =ln y ,c =ln a ,则u =c +bx . 由已知得下表:∑6i =1x i =21,∑6i =1u i =25.359 5,∑6i =1x 2i =91,∑6i =1u 2i ≈107.334, ∑6i =1x i u i =90.342 3,x =3.5,u ≈4.226 58, b =∑6i =1x i u i -6x u ∑6i =1x 2i -6x2≈90.342 3-6×3.5×4.226 5891-6×3.52=1.584 1217.5≈0.09, c =u -b x =4.226 58-0.09×3.5=3.911 58, ∴u =3.911 58+0.09x . ∴y =e 3.911 58·e 0.09x . =e 0.09x +3.91158。
高中数学选择性必修三 8 2 一元线性回归模型及其应用(精讲)(含答案)
8.2 一元线性回归模型及其应用(精讲)考点一 样本中心解小题【例1】(2021·江西赣州市)某产品在某零售摊位上的零售价x (元)与每天的销售量y (个)统计如下表:据上表可得回归直线方程为 6.4151y x =-+,则上表中的m 的值为( ) A .38B .39C .40D .41【答案】D 【解析】由题意1617181917.54x +++==,50343111544m my ++++==,所以115 6.417.51514m+=-⨯+,解得41m =.故选:D . 【一隅三反】1.(2021·江西景德镇市·景德镇一中)随机变量x 与y 的数据如表中所列,其中缺少了一个数值,已知y关于x 的线性回归方程为ˆ0.93yx =+,则缺少的数值为( )A .6B .6.6C .7.5D .8【答案】A【解析】设缺少的数值为m ,由于回归方程为ˆ0.93yx =+过样本中心点(),x y , 且2345645x ++++==,代入0.943 6.6y =⨯+=,所以5679 6.65my ++++==,解得6m =.故选:A.2.(2021·河南信阳市)根据如下样本数据:得到的回归方程为y bx a =+,则( ) A .0a >,0b > B .0a >,ˆ0b < C .0a <,0b > D .0a <,ˆ0b< 【答案】B【解析】由图表中的数据可得,变量y 随着x 的增大而减小,则ˆ0b<, 2345645x ++++==,4 2.50.5230.25y +---==,又回归方程y bx a =+经过点(4,0.2),可得0a >,故选:B .3.(2021·安徽六安市·六安一中)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y (单位:C )存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y 关于x 的线性回归方程0.25y x k =+.)C则当蟋蟀每分钟鸣叫62次时,该地当时的气温预报值为( ) A .33C B .34CC .35CD .35.5C【答案】D【解析】由表格中的数据可得2030405060405x ++++==,2527.52932.536305y ++++==,由于回归直线过样本中心点(),x y ,可得300.2540k =⨯+,解得20k =.所以,回归直线方程为0.2520y x =+.在回归直线方程中,令62x =,可得0.25622035.5y =⨯+=.故选:D.考点二一元线性方程【例2】(2021·兴义市第二高级中学)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示: 通过分析,发现销售量y 对商品的价格x 具有线性相关关系,求 (1)销售量y 对商品的价格x 的回归直线方程; (2)若使销售量为12,则价格应定为多少.附:在回归直线ˆˆy bxa =+中1221ˆni ii nii x y nxyb xnx ==-=-∑∑,ˆˆay bx =- 【答案】(1) 3.240y x =-+ (2) 8.75 【解析】(1)由题意知10x =,8y =,∴999580635551083.28190.25100110.25121ˆ5100b++++-⨯⨯==-++++-⨯,8(3.2)1040a =--⨯=,∴线性回归方程是 3.240y x =-+;(2)令 3.24012y x =-+=,可得8.75x =,∴预测销售量为12件时的售价是8.75元.【一隅三反】1.(2020·河南开封市)配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者的心率y (单位:次/分钟)和配速x (单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,求y 与x 的线性回归方程;(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次.参考公式:线性回归方程ˆˆˆybx a =+中,12()()ˆ()nii i nixx y y b xx =--=-∑∑,ˆˆay bx =- 参考数据:135y =.【答案】(1)25285x y ∧=-+;(2)210分钟,192名. 【解析】(1)由散点图中数据和参考数据得 4.55677.565x ++++==,1001091301651711355y ++++==,()()()51522222211.536(1)300(5)1(26) 1.5(35)25( 1.5)(1)01 1.5ˆiii i i x x y y bx x ==---⨯+-⨯+⨯-+⨯-+⨯-===--+-+++-∑∑,135(25)62ˆ85ˆay bx =-=--⨯=, 所以y 与x 的线性回归方程为25285x y ∧=-+. (2)将160y =代入回归方程得5x =,所以该跑者跑完马拉松全程所花的时间为425210⨯=分钟. 从马拉松比赛的频率分布直方图可知成绩好于210分钟的累积频率为()0.0008500.00242102000.064⨯+⨯-=,有6.4%的跑者成绩超过该跑者,则该跑者在本次比赛获得的名次大约是0.0643000192⨯=名.2.(2020·云南红河哈尼族彝族自治州)随着电商事业的快速发展,网络购物交易额也快速提升,特别是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表:(1)通过分析,发现可用线性回归模型拟合总交易额y 与年份代码t 的关系,请用相关系数加以说明; (2)利用最小二乘法建立y 关于t 的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额. 参考数据:71()()138.5ii i tt y y =--=∑26.7= 2.646≈;参考公式:相关系数()()niit t y y r --=∑;回归方程y bt a ∧∧∧=+中,斜率和截距的最小二乘估计公式分别为:()()()711722211niii ii i niii i tty y t y nx yb tttnx∧====---==--∑∑∑∑,=a y bt ∧∧-.【答案】(1)答案见解析;(2)回归方程为ˆ 4.9 1.2yt =-,预测2021年天猫“双十一”的总交易额约为38百亿.【解析】(1)4t =,721()28ii tt =-=∑,17()()138.5i ii t t yy =--=∑26.7=所以()()138.50.982 2.64626.7niit t y y r --=≈≈⨯⨯∑因为总交易额y 与年份代码t 的相关系数近似为0.98, 说明总交易额y 与年份代码t 的线性相关性很强,从而可用线性回归模型拟合总交易额y 与年份代码t 的关系. (2)因为18.4y =,721()28ii tt =-=∑,所以()()71271()138.5ˆ 4.928i ii i i t t yy bt t ==--==≈-∑∑, ˆˆay b =-,18.4 4.94 1.2b ≈-⨯=- 所以y 关于t 的回归方程为ˆ 4.9 1.2yt =- 又将2021年对应的8t =代入回归方程得:ˆ 4.98 1.238y=⨯-=. 所以预测2021年天猫“双十一”的总交易额约为38百亿.3.(2021·湖北省武昌实验中学高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y (百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若0.75r>,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式()()n ni i i ix x y y x y nx y r---==∑∑0.55≈0.95≈.回归方程y bx a=+中斜率和截距的最小二乘估计公式分别为()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y xb=-.【答案】(1)0.95;答案见解析;(2)0.3 2.5y x=+;610千克.【解析】(1)由已知数据可得2456855x++++==,3444545y++++==,所以()()()()()5131100010316i iix x y y=--=-⨯-+-⨯+⨯+⨯+⨯=∑,====所以相关系数()()50.95iix x y y r --===≈∑.因为0.75r >,所以可用线性回归模型拟合y 与x 的关系.(2)()()()5152160.320iii ii x x y y b x x ==--===-∑∑,450.3 2.5a =-⨯=, 所以回归方程为0.3 2.5y x =+. 当12x =时,0.312 2.5 6.1y =⨯+=,即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.考点三 非一元线性方程【例3】(2020·全国高二课时练习)在一次抽样调查中测得5个样本点,得到下表及散点图.(1)根据散点图判断y a bx =+与1y c k x -=+⋅哪一个适宜作为y 关于x 的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立y 与x 的回归方程;(计算结果保留整数) (3)在(2)的条件下,设=+z y x 且[)4,x ∈+∞,试求z 的最小值.参考公式:回归方程ˆˆˆybx a =+中,()()()1122211ˆn niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)1y c k x -=+⋅;(2)41y x=+;(3)6. 【解析】(1)由题中散点图可以判断,1y c k x -=+⋅适宜作为y 关于x 的回归方程; (2)令1t x -=,则y c kt =+,原数据变为由表可知y 与t 近似具有线性相关关系,计算得4210.50.251.555t ++++==,16125217.25y ++++==,222222416212150.520.2515 1.557.238.4544210.50.255 1.559.3k ⨯+⨯+⨯+⨯+⨯-⨯⨯==≈++++-⨯,所以,7.24 1.551c y kt =-=-⨯=,则41y t =+. 所以y 关于x 的回归方程是41y x=+. (3)由(2)得41z y x x x=+=++,[)4,x ∈+∞, 任取1x 、24x ≥,且12x x >,即124x x >≥,可得()()()21121212121212124444411x x z z x x x x x x x x x x x x -⎛⎫⎛⎫⎛⎫-=++-++=-+-=-+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭()()1212124x x x x x x --=,因为124x x >≥,则120x x ->,1216>x x ,所以,12z z >,所以,函数41z x x =++在区间[)4,+∞上单调递增,则min 44164z =++=. 【一隅三反】1.(2020·江苏省如皋中学高二月考)某种新产品投放市场一段时间后,经过调研获得了时间x (天数)与销售单价y (元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).表中10111,10i i i i w w w x ===∑.(1)根据散点图判断y a bx =+,与dy c x=+哪一个更适合作价格y 关于时间x 的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y 关于x 的回归方程. (3)若该产品的日销售量()g x (件)与时间x 的函数关系为()()100120g x x N x-=+∈,求该产品投放市场第几天的销售额最高?最高为多少元?附:对于一组数据()()()()112233,,,,,,...,,n n u v u v u v u v ,其回归直线vu αβ=+的斜率和截距的最小二乘法估计分别为121()(),()nii i nii vv u u v u u u βαβ==--==--∑∑.【答案】(1)dy c x =+更适合作价格y 关于时间x 的回归方程;(2)120(1)y x=+;(3)第10天,最高销售额为2420元;【解析】(1)根据散点图知dy c x=+更适合作价格y 关于时间x 的回归方程类型; (2)令1w x=,则y c dw =+, 而1011021()()18.4200.92()iii ii w w yy d w w ==--===-∑∑, 37.8200.8920c y dw =-=-⨯=,即有120(1)y x=+;(3)由题意结合(2)知:日销售额为1100()()20(1)(120)f x y g x x x=⋅=+-, ∴2110015()20(1)(120)400(6)f x x x x x=+-=+-, 若1t x =,令221121()655()1020h t t t t =+-=--+, ∴110t =时,max 1121()()1020h t h ==,即10x =天,max 121()(10)400242020f x f ==⨯=元, 所以该产品投放市场第10天的销售额最高,最高销售额为2420元.2.(2021·江苏苏州市)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x t y e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10i i v y i ==⋅⋅⋅,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立y 关于x 的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额y 为250亿元,请预测2021年的研发资金投入额x 为多少亿元?(结果精确到0.01)附:①相关系数()()niix x y y r --=∑,回归直线ˆˆˆya bx =+中:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =- ②参考数据:ln 20.693≈,ln5 1.609≈. 【答案】(1)模型x ty eλ+=的拟合程度更好;(2)(ⅰ)0.180.56ˆx ye +=;(ⅱ)27.56.【解析】(1)设{}i u 和{}i y 的相关系数为1r ,{}i x 和{}i v 的相关系数为2r ,由题意,()()101130.8715iiu u y y r --===≈∑,()()102120.9213iix x v v r --===≈∑,则12r r <,因此从相关系数的角度,模型x ty e λ+=的拟合程度更好.(2)(ⅰ)先建立v 关于x 的线性回归方程,由x ty eλ+=,得ln y t x λ=+,即v t x λ=+,()()()101102112ˆ65iii ii x x v v x x λ==--==-∑∑, 12ˆˆ 5.36260.5665tv x λ=-=-⨯=, 所以v 关于x 的线性回归方程为ˆ0.180.56vx =+, 所以ˆln 0.180.56yx =+,则0.180.56ˆx y e +=.(ⅱ)2021年盈利额250y =(亿元), 所以0.180.56250x e +=,则0.180.56ln 250x +=, 因为ln 2503ln5ln 23 1.6090.693 5.52=+≈⨯+=, 所以 5.520.5627.560.18x -≈≈.所以2021年的研发资金投入量约为27.56亿元.。
高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精讲)(含答案)
8.2 一元线性回归模型及其应用(精讲)考点一样本中心求参数【例1-1】(2021·全国·高二课时练习)若两个变量x,y是线性相关的,且样本()(),1,2,,i ix y i n=的中心点为()3,2.5,则由这组样本数据算得的回归直线方程不可能是( )A.ˆ0.51y x=+B.ˆ0.60.7y x=+C.ˆ0.2 1.9y x=+D.ˆ 1.5y x=-【答案】D【解析】因为0.531 2.5⨯+=,即点()3,2.5在回归直线ˆ0.51y x=+上,所以A有可能;因为0.630.7 2.5⨯+=,即点()3,2.5在回归直线ˆ0.60.7y x=+上,所以B有可能;因为0.23 1.9 2.5⨯+=,即点()3,2.5在回归直线ˆ0.2 1.9y x=+上,所以C有可能;因为3 1.5 1.5 2.5-=≠,即点()3,2.5不在回归直线ˆ 1.5y x=-上,所以D没有可能.故选:D.【例1-2】(2021·广西河池)根据下表中数据求得的线性回归方程是4y x a=-+,则=a( )A .98B .107C .110D .106【答案】D【解析】由已知得,139(456789)66x =+++++=,1(908483807568)806y =+++++=, ∴398046a =-⨯+,即106a =.故选:D 【一隅三反】1.(2021·河北·藁城新冀明中学高二月考)实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .ˆ1yx =+ B .ˆ2y x =+ C .ˆ21y x =+ D .ˆ1y x =- 【答案】A【解析】由已知可得11(1234) 2.5,(2345) 3.544x y =⨯+++==⨯+++=, 所以这组数据的样本中心点为(2.5,3.5), 因为样本中心必在回归直线上,所以把样本中心点代入四个选项中验证,可得只有1y x =+成立, 故选:A.2.(2021·陕西·西北工业大学附属中学 )为了研究某班学生的听力成绩x (单位:分)与笔试成绩y (单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x 与y 之间有线性关系,设其回归直线为y bx a =+,已知201400i i x ==∑,2011580i i y ==∑,1a =-,若该班某学生的听力成绩为26,据此估计其笔试成绩约为( )A .99B .101C .103D .105【答案】C【解析】201400i i x ==∑,故4002020x ==;2011580i i y ==∑,故15807920y ==, 故点()20,79在回归直线上,即79201b =-,得4b =, 即41y x =-,当26x =时,代入计算得到103y =. 故选:C.3.(2021·广东肇庆 )某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间x (单位:小时)与工资y (单位:元)之间的关系如下表:若y 与x 的线性回归方程为ˆ 6.5yx a =+,预测当工作时间为9小时时,工资大约为( ) A .75元 B .76元C .77元D .78元【答案】B【解析】由表格数据知:2456855x ++++==,3040506070505y ++++==,6.55032.517.5a y x ∴=-=-=,∴线性回归方程为ˆ 6.517.5yx =+, 6.5917.576∴⨯+=,即当工作时间为9小时时,工资大约为76元.故选:B.4.(2021·全国·高三专题练习)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得到的实验数据如下表,并由此计算得到回归直线方程ˆ0.850.25yx =-,后来工作人员不慎将下表中的实验数据c 丢失.则上表中丢失的实验数据c 的值为( ) A .1 B .1.5 C .2 D .2.5【答案】D【解析】由表中数据可得3456755x ++++==,34 4.5617.555c c y +++++==,将点17.5(5,)5c +代入ˆ0.850.25yx =-中,得17.50.8550.255c +=⨯-,解得 2.5c =, 所以丢失的实验数据c 的值为2.5.故选:D考点二 线性回归方程【例2】(2021·江西赣州)某特色餐馆开通了美团外卖服务,在一周内的某特色菜外卖份数x (份)与收入y (元)之间有如下的对应数据:(1)画出散点图;(2)请根据以上数据用最小二乘法原理求出收入y 关于份数x 的线性回归方程; (3)据此估计外卖份数为12份时,收入为多少元.注:①参考方式:线性回归方程系数公式1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-;②参考数据:521145ii x ==∑,52113500ii y ==∑,511380i i i x y ==∑.【答案】(1)图象见解析(2) 6.517.5y x =+(3)95.5 【解析】(1)解:作出散点图如下图所示:(2)解:2456855x ++++==,3040605070505y ++++==,已知521145i i x ==∑,511380i i i x y ==∑,则1222551513805550ˆ 6.5145555i iiii x y x ybx x==--⨯⨯===-⨯-∑∑,50 6.5517.5a y bx =-=-⨯=, 因此,线性回归方程为 6.517.5y x =+. (3)解:12x =时,12 6.517.595.5y =⨯+=, 即外卖份数为12份时,收入大约为95.5元. 【一隅三反】1.(2021·贵州·凯里一中 )凯里市2017至2021年农村居民家庭纯收入y (单位:千元)的数据如下表:从表出看出,人均纯收入y 与年份代号t 线性相关,已知516470.i i i t y ==∑.(1)求y 关于t 的线性回归方程y bt a =+;(2)预测2025年的人均纯收入为多少.(附:参考公式:1122211()()()nnii i ii i nniii i tt y y t y nt yb tt tnt====---==--∑∑∑∑,a y bt =-).【答案】(1)0.47 2.59y t =+(2)6.82【解析】(1)由题中表格知,5n =,1(12345)35t =++++=,1(3.1 3.5 3.9 4.6 4.9)45y =++++=,522222211234555i i t==++++=∑,则5152221564.75340.4755535i ii i i t y t yb t t==--⨯⨯===-⨯-∑∑,40.473 2.59a y bt =-=-⨯=,故回归直线方程为0.47 2.59y t =+.(2)当年份为2025年时,对应的年份代码9t =, 所以0.479 2.59 6.82y =⨯+=, 故2025年的人均纯收入约为6.82千元.2.(2021·福建宁德)近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能源企业近5个月的产值如下表:(1)根据上表数据,计算y 与x 的线性相关系数r ,并说明y 与x 的线性相关性强弱;(0.75||1r ≤≤,则认为y 与x 线性相关性很强;0.75r <,则认为y 与x 线性相关性不强) (2)求出y 关于x 的线性回归方程,并预测10月该企业的产值.参考公式:1221,nni ii ii nii x ynx yx ynx y r b a y bx xnx==--===--∑∑∑;参考数据:55522111442,55,52.3i i ii i i i x y x y ======≈∑∑∑.【答案】(1)0.993r =;相关系数较强;(2) 5.210.4y x =+;10月该企业的产值约为41.6亿元 【解析】(1)1234535x ++++==,16+20+27+30+37=265y =,0.993ni ix ynx yr -==≈∑,因为[]0.75,1r ∈,所以y 与x 线性相关性较强. (2)设线性回归方程为:y bx a =+;122144253265.25559ni ii n i i x ynx yb x nx==--⨯⨯===-⨯-∑∑,26 5.2310.4a y bx =-=-⨯=,即 5.210.4y x =+, 10月份对应的代码为6, 5.2610.441.6y =⨯+=,10月该企业的产值约为41.6亿元.3(2021·河南·高二月考 )有时候一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同品牌的一些食品所含热量的百分比记为()1,2,3,,10i x i =⋅⋅⋅和一些美食家以百分制给出的对此种食品口味的评价分数记为()123,,10i y i =⋅⋅⋅,,:参考数据:1220i i x ==∑,1720i i y ==∑,()21272i i x x=-=∑,()()1429i ii x xy y =--=∑参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-(1)已知这些品牌食品的所含热量的百分比i x 与美食家以百分制给出的对此种食品口味的评价分数i y 具有相关关系.试求出回归方程(最后结果精确到0.1);(2)某人只能接受食品所含热量的百分比为20及以下的食品.现在他想从这些食品中随机选取两种购买,求他所选取的两种食品至少有一种是美食家以百分制给出的对此种食品口味的评价分数为75分以上的概率.【答案】(1) 1.637.3y x =+(2)35【解析】(1)解:设所求的回归方程为y bx a =+,由()()()10110214291.6272iii i i x x y y b x x==--==≈-∑∑, 10112210i i x x ==⨯=∑,10117210i i y y ==⨯=∑, 429722237.3272a y bx ∴=-=-⨯≈, ∴所求的回归方程为: 1.637.3y x =+.(2)解:由表可知某人只能接受的食品共有6种,其中美食家以百分制给出的对此种食品口味的评价为75分以上的有2种可记为a ,b ,另外4种记为1,2,3,4.任选两种分别为:(),a b ,(),1a ,(),2a ,(),3a ,(),4a ,(),1b ,(),2b ,(),3b ,(),4b ,()1,2,()1,3,()1,4,()2,3,()2,4,()3,4,共15个基本事件.记“所选取的两种食品至少有一种是美食家以百分制给出的对此食品口味的评价分数为75分以上”为事件A ,则事件A 包含(),a b ,(),1a ,(),2a ,(),3a ,(),1b ,(),2b ,(),3b ,(),4b ,共9个基本事件, 故事件A 发生的概率为()93155P A ==. 4.(2021·陕西·西安中学 )某连锁经营公司所属5个零售店某月的销售额和利润额资料如表.(1)画出销售额和利润额的散点图;(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y 对销售额x 的回归直线方程.(参考公式1221ni ii nii x y n x yb xn x ==-⋅⋅=-⋅∑∑,ˆˆay bx =-) (3)若该公司计划再开一个店想达到预期利润为8百万,请预估销售额需要达到多少.【答案】(1)答案见解析(2)ˆy=0.5x +0.4(3)8百万 【解析】(1)(2)由表中的数据可得,()13567965x =⨯++++=,()123345 3.45y =⨯++++=,515221511256 3.40.520056ˆ65i ii ii x y x ybxx ==-⋅⋅-⨯⨯===-⨯⨯-⋅∑∑,∵回归直线方程恒过样本中心,∴ˆ 3.40.560.4a=-⨯=, 故利润额y 对销售额x 的回归直线方程为ˆy =0.5x +0.4. (3)∵该公司计划再开一个店想达到预期利润为8百万,即0.8千万, ∴0.8=0.5x +0.4,解得x =0.8, 故预计销售额需要达到8百万.考点三 非线性回归方程【例3】(2021·黑龙江·哈尔滨市第六中学校高二期中)某公司在市场调查中,发现某产品的单位定价x (单位:万元)对月销售量y (单位:吨)有影响对不同定价i x 和月销售量i y (1,2,8)i =数据作了初步处理,表中1z x =.经过分析发现可以用by a x=+来拟合y 与x 的关系. (1)求ˆy关于x 的回归方程; (2)若生产1吨产品的成本为0.9万元,那么预计单位定价为多少时,该产品的月利润取最大值,求此时的月利润.附:对于一组数据11(),v ω,22(,)v ω,,(,)n n v ω,其回归直线ˆˆˆvαβω=+的斜率和截距的最小二乘法估计分别为:1122211()()ˆ()nniii i i i nniii i v v v n vn ωωωωβωωωω====---==--∑∑∑∑,ˆˆv αβω=- 【答案】(1)^52y x=-+(2)单位定价为1.5万元时,月利润最大,最大值为0.8万元.【解析】(1)令1z x=,则y a b z =+⋅,则8^1822123956894358208988i ii i i z y z yb z z==-⨯⨯===-⨯--∑∑,^^2a y b z =-⋅=-,∴^52y x=-+. (2)设月利润为W ,则由已知()59934340.92260.810255W y x x x x x ⎛⎫⎛⎫=-=-+-=--+≤-+= ⎪⎪⎝⎭⎝⎭, 当且仅当922x x-=-即 1.5x =时取等号所以单位定价为1.5万元时,月利润最大,最大值为0.8万元. 【一隅三反】1.(2021·重庆市实验中学)某电器企业统计了近10年的年利润额y (千万元)与投入的年广告费用x (十万元)的相关数据,散点图如图,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关数据如表所示:(1)从①y bx a =+;②()0,0ky m x m k =⋅>>;③2y cx dx e =++三个函数中选择一个作为年广告费用x 和年利润额y 的回归类型,判断哪个类型符合,不必说明理由; (2)根据(1)中选择的回归类型,求出y 与x 的回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元) 参考数据:3103.67883.678849.787e≈≈, 参考公式:回归方程ˆˆˆv bu a =+中斜率和截距的最小二乘估计公式分别为1221ˆni i i ni i u v nxybunu==-=-∑∑【答案】(1)选择回归类型k y m x =⋅更好;(2)13y ex =;(3)下一年应至少投入498万元广告费用. 【解析】(1)由散点图知,年广告费用x 和年利润额y 的回归类型并不是直线型的,而是曲线型的, 所以选择回归类型k y m x =⋅更好.(1)对k y m x =⋅两边取对数,得:ln ln ln y k x m =+,即ln v ku m =+,由表中数据得:101102211030.510 1.5 1.51ˆ46.510 1.5 1.5310i i i ii u v uvkuu ==--⨯⨯===-⨯⨯-∑∑,1ˆln 1.5 1.513m v ku ∴=-=-⨯=,m e ∴=, ∴年广告费用x 和年利润额y 的回归方程为13y ex =.(3)由(2)知:13y e x =⋅, 令1310y e x =⋅>得:1310x e>,解得:13 3.6788x >, 33.678849.787x ∴>≈,49.8x ∴≈(十万元),49.8十万元498=万元∴下一年应至少投入498万元广告费用.2.(2021·全国·高二课时练习)某地区不同身高的未成年男性的平均体重如下表,并由表中数据作出如图所示的散点图.(1)根据散点图,判断y a bx =+与x y a b =⋅哪一个能比较近似地反映这个地区未成年男性平均体重y 与身高x 的关系?(给出判断即可,不必说明理由)(2)令ln u y =,根据(1)的判断结果及下表数据,建立y 关于x 的非线性经验回归方程(参考数据:0.66e 1.93≈,0.02e 1.02≈).【答案】(1)x y a b =⋅;(2)ˆ 1.93 1.02x y=⨯. 【解析】(1)根据散点图,知x y a b =⋅能比较近似地反映这个地区未成年男性平均体重y 与身高x 的高度. (2)由ln u y =和x y a b =⋅,得12u c x c =+(1ln c b =,2ln c a =),()()()12111221282ˆ0.0214300iii ii xx uucx x ==--==≈-∑∑,又 2.96u =, 所以21ˆˆ 2.960.021150.66cu c x =-=-⨯=,ˆ0.020.66u x =+, 所以0.020.660.660.02ˆe e e 1.93 1.02x x x y+==⨯=⨯, 所以y 关于x 的非线性经验回归方程为ˆ 1.93 1.02x y=⨯. 3.(2021·黑龙江肇州 )如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2020年1月~2021年1月).根据散点图选择y a =+ln y c d x =+两个模型进行拟合,经过数据处理得到两个回归方程分别为0.9369y =+0.95540.0306ln y x =+,并得到以下一些统计量的值:(1)请利用相关指数2R 判断哪个模型的拟合效果更好;(2)估计该小区2021年6月份的二手房均价.(精确到0.001万元/平方米)参考数据:ln 20.69≈,ln3 1.10≈,ln17 2.83≈,ln192.94≈ 1.41≈ 1.73≈ 4.12≈ 4.36≈.参考公式:相关指数()()221211niii nii y y R y y==-=--∑∑.【答案】(1)模型0.95540.0306ln y x =+;(2)1.044(万元/平方米).【解析】(1)设模型0.9369y =+0.95540.0306ln y x =+的相关指数分别为21R 和22R ,则210.00059110.00605R =-,220.00016410.00605R =-.因为0.0005910.000164>,所以2212R R <.所以模型0.95540.0306ln y x =+的拟合效果更好.(2)由(1)知,模型0.95540.0306ln y x =+的拟合效果更好,利用该模型预测可得,这个小区2021年6月份的在售二手房均价为:0.95540.0306ln18y =+()0.95540.0306ln 22ln3=++ 1.044≈(万元/平方米).。
人教版2019学年高中数学第3章统计案例习题课学案新人教B版选修2_3
第 3章统计案例目 1. 一步理解回剖析的基本思想.2. 认识一些非性回的解法.^^^1.回直方程:y = a + b x 必然点( x , y ).2.用有关系数能够两个量之的________________ 行精准的刻画,运用________的方法研究一些非性有关.一、1.以下法中的是()A.若是量x 与 y 之存在着性有关关系,我依照数据获取的点( x i,y i )( i = 1,2 ,⋯,n) 将散布在某一条直的周边B.若是两个量x 与 y 之不存在性关系,那么依照它的一数据( x i,y i )( i = 1,2 ,⋯,n) 不能够写出一个性方程C.x、y是拥有有关关系的两个量,且 x 对于 y 的性回方程^ ^^y =b x+ a ,^b 叫做回系数D.使求出的性回方程存心,可用假的方法来判断量y 与 x 之可否存在性有关关系^2.回方程是y= 1.5 x-15, ()^^A. y= 1.5 ,x= 15B.15 是回系数aC. 1.5 是回系数^^ a D.x= 10 ,y= 03.有以下法:① 性回剖析就是由本点去找近些本点的一条直的数学方法;②利用本点的散点能够直判断两个量的关系可否能够用性关系表示;③通回方程^y^ ^ =b x+a及其回系数^b,能够估和量的取和化;④因由任何一都能够求得一个回直方程,因此没有必要行有关性.其中正确命个数是()A.1B.2C.3D.44.在两个量x, y 行性回剖析有以下步:① 所求出的回直方程作出解;②收集数据 ( x i,y i ) ,i= 1,2 ,⋯,n;③求回直方程;④依照所收集的数据制散点.若是依照可靠性要求能得出量x,y 拥有性有关的,正确的操作序是()A.①②④③B.③②④①C.②③①④D.②④③①5.了察看两个量x和y之的性有关性,甲、乙两位同学各自独立做了10次和 15次,并且利用性回方法,求得回直分l 、l ,已知两人所得的12数据中,量x 和 y 的数据的平均都相等,且分是s、 t ,那么以下法正确的是 ()A.直l1和l2 必然有公共点(,)s tB.直l1和 l 2 订交,但交点不用然是( s,t )C.必有l1∥l2D.l1与l2必然重合二、填空6.一个了定工定,需要确定加工零件所花的,此行了10次,得的数据以下:零件数 x/个102030405060708090100加工 y/分626875818995102108115122加工y(分)与零件数x(个)之的有关系数r =________(精准到0.000 1).7.依照料,我国能源生自1986 年以来展很快.下面是我国能源生量 ( 位:吨准煤) 的几个数据:年份1986199119962001产量依照有关专家展望,到2010年我国能源生产总量将达到亿吨左右,则专家所选择的回归模型是以下四种模型中的哪一种________. ( 填序号)8.以下说法中正确的选________.( 填序号)项是①回归剖析就是研究两个有关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归剖析的第一步是画散点图或求有关系数;⑤回归剖析就是经过剖析、判断,确定有关变量之间的内在的关系的一种统计方法.三、解答题9.假定学生在初一和初二的数学成绩是线性有关的.若10个学生初一(x)和初二(y)数学分数以下:x74717268767367706574y76757170767965776272试求初一和初二数学分数间的回归直线方程.10.在某化学实验中,测得以下表所示的 6 对数据,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转变物质的质量.x/min123456y/mg(1)设 y 与 x 之间具有关系y= cd x,试依照测量数据估计 c 和 d 的值(精准到0.001);(2)估计化学反应进行到 10 min 时未转变物质的质量( 精准到 0.1) .能力提升11.测得 10 对某国父子身高( 单位:英寸 ) 以下:父亲身高 ( x)60626465666768707274儿子身高 ( y)6670(1)对变量 y 与 x 进行有关性查验;(2)若是 y 与 x 之间拥有线性有关关系,求回归直线方程;(3)若是父亲的身高为 73 英寸,估计儿子的身高.12.某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计获取数据以下:x123510203050100200y1查验每册书的成本费y 与印刷册数的倒数x之间可否拥有线性有关关系?如有,求出y 对 x 的回归方程.1.利用回归剖析可对一些实责问题作出展望.2.非线性回归方程有时其实不给出回归模型,这时我们能够画出已知数据的散点图,把它与我们所学过的各样函数( 幂函数、指数函数、对数函数、二次函数等) 图象进行比较,精选一种拟和比较好的函数,把问题经过变量变换,转变为线性的回归剖析问题,使之获取解决.习题课答案知识梳理2.线性有关程度转变作业设计1. B2. D3. C [ ①反应的正是最小二乘法思想,故正确.②反应的是画散点图的作用,也正确.③讲解的是回归方程^ ^^y =b x+ a 的作用,故也正确.④是不正确的,在求回归方程从前必定进行有关性查验,以表现两变量的关系.] 4. D5.A [ 线性回归直线方程为^^^^^^^^ y = b x+ a . 而a = y - b x ,即a =t- b s,t= b s^+ a .∴ ( s,t ) 在回归直线上.∴直线 l 1和 l 2必然有公共点( s,t ).] 6. 0.999 810剖析x =55, y =,∑ x i2=38 500,10∑ y i2=87 777i =11055 950,i =∑ 1x i y i=,因此 r =错误!≈0.999 8.7.①8.④⑤剖析回归剖析就是研究两个事件的有关性;回归模型是需要经过散点图模拟的;回归模型有线性和非线性之分.10109.解因为 x =71, y = 72.3 ,x2i = 50 520 ,x i y i= 51 467 ,i = 1i = 1^51 467 -10×71×≈1.218 2因此, b =50 520 -10×712^-1.218 2×71=- 14.192 2 ,a =回归直线方程是^= 1.218 2 x- 14.192 2. y10.解(1) 在y=cd x两边取自然对数,令ln y=z, ln c=a, ln d=b,则z=a+bx.由已知数据,得x123456yz^^^由公式得 a ≈3.905 5,b ≈-0.221 9,则线性回归方程为z =3.905 5-0.221 9x.而 ln c=3.905 5,ln d=-0.221 9,故 c≈, d≈,因此 c、 d 的估计值分别为 49.681 , 0.801.(2)当 x=10时,由(1)所得公式可得 y≈5.4(mg).11.解 (1) x =66.8 , y = 67.01 ,1010, x y = 4 476.27 ,∑i=1x i2=44794 ,∑i=1y i2=2, y 2=10x =,∑i=1x i y i=44 842.4.10-10 x y∑ i =1xiyi因此 r =1010-10 x 2- 10 y 2∑ i = 1x2i ∑ i =1y2i =!= ≈81.31≈0.980 2.由小概率与 - 2= 8 在附表中 得r 0.05= ,因 r > 0.05 ,因此有 95%的把nr握 y 与 x 之 拥有 性有关关系.^^ ^(2) 回 直 方程 y=b x + a .10^ ∑i = 1xiyi -10 x y44 842.4 -由 b = 10= 44 794 -= ≈ 0.464 5 ,∑ i =1x2i - 10 x 2^ ^x = 67.01 -0.464 5 ×66. 8≈ 35.981 4.a = y -b 故所求的回 直 方程^= 0.464 5 x + 35.981 4.y(3) 当 x = 73 ^5×73+ 35.981 4≈ 69.9 ,因此当父 身高 73 英寸 ,, y =估 儿子的身高69.9 英寸.1112.解把 x 置 z , 有 z = x ,进而 z 与 y 的数据z 1y可作出散点 ,从 可看出, 后的 本点散布在一条直 的周边,因此能够用性回 方程来 合.1z = 10×(1+ + + + + + + + + 0.005) =1,1y = 10×(10. 15+ 5.52 + 4.08 +⋯+ 1.15) = 3.14 ,101z222+⋯+22∑i2=1 + ++ 0.005 ≈ 1.415 ,i =10y i2=2 2 2 2,∑ + +⋯+ + 1.15 = i = 110∑ z y =1×10.1 5+×5.52+⋯+×i = 1 i i=15.221 02 ,10- 10 z y^∑ ziyii =1因此 b =10≈ 8.976 ,z2i- 10z 2∑i = 1^^a = y - bz = 3.14 -8.976 ×1≈ 1.120 ,^因此所求的 z 与 y 的回方程y= z+1.120.1^又因 z=x,因此y=x+ 1.120.。
线性回归案例ppt课件
2003-1 -1.151 -0.331 0.299 4.085 0.188 11.919 0.004 0.078 21.492 -0.403
2003-2 0.338 -0.611 0.3 1.402 5.369 18.418 -0.669 0.167 20.456 0.211
2003-3 0.722 0.794 0.016 -2.929 0.749 -20.886 -0.733 0.327 21.532 1.085
.
回归分析的根本目的
探寻因变量同自变量之是的数量关系,为此需假设它们之间 的数量关系满足某种函数形式,而最简单最常用的函数形式 就是线性函数。
y i0 1 x i1 2 x i2 p x ip i i1,2,...n,
➢ 其中 0为常 ,j数 (j1,项 2, ,p)为第 j 个解释性变量 xij
…
…
…
…
…
…
…
…
…
…
…
2002-498 0.3 0.5 0.255 3.167 2.5 16.795 -1.419 -0.071 19.701 -0.25
2002-499 0.484 0.127 0.287 -2.593 2.473 -4.511 0.4 0.184 20.199 0.884
2002-500 0.063 -0.416 0 -1.739 2.482 -4.809 1.793 -0.009 19.747 1.017
.
预测
.
令R
2 i
为辅助回归的判定系数
则方差膨胀因子为:
VIFi
1 1 Ri2
它反映了在多大程度上第i个自变量所包含的信息
被其他自变量覆盖
• 当VIF≥10时,说明存在多重共线性。
高中数学选修2-3统计案例之线性回归方程习题课
1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系().A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案 C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v 有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断().A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案 C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):(1)画出散点图;(2)判断是否具有相关关系.[审题视点] (1)用x 轴表示化肥施用量,y 轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解 (1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是().A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200 解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案 A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a ^、b ^,即可求出线性回归方程.(3)问将x =100代入回归直线方程即可. 解 (1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得:i =14x 2i =86,x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨). 已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b ^=∑i =14x i y i -4x ·y ∑i =14x 2i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案 C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:对预处理后的数据,容易算得,x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r =-0.9362,则变量y和x之间具有线性相关关系解析:选C.C中应为R2越大拟合效果越好.例18.已知回归方程y^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5, 当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03.例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y ^=bx +a 必过点(x ,y ); ③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是 90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:9通过分析,发现销售量对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a ^=y -b ^x =40,∴回归直线方程为y ^=-3.2x +40. 答案:y ^=-3.2x +40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.解:以x 轴表示身高,y 轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^ x+a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=5 2 x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系().A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案 C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v 有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断().A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案 C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):(1)画出散点图;(2)判断是否具有相关关系.[审题视点] (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解(1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是().A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200 解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案 A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a ^、b ^,即可求出线性回归方程.(3)问将x =100代入回归直线方程即可. 解 (1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得: i =14x 2i =86, x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨).已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b ^=∑i =14x i y i -4x ·y ∑i =14x 2i-4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为: 90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x/cm 174176176176178儿子身高y/cm 175175176177177则y对x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案 C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:对预处理后的数据,容易算得,x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r =-0.9362,则变量y和x之间具有线性相关关系解析:选C.C中应为R2越大拟合效果越好.例18.已知回归方程y^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5, 当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03.例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y ^=bx +a 必过点(x ,y ); ③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是 90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x 99.5110.511销售量y 11186 5通过分析,发现销售量对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a^=y-b^x=40,∴回归直线方程为y^=-3.2x+40.答案:y^=-3.2x+40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:身高(cm)14315615917216517117716116416体重(kg)41496179686974696854 根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.解:以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^ x+a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=5 2 x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。