高考线性回归方程地总结上课讲义
2025高考数学一轮复习-9.1.2-线性回归方程【课件】
(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出). 根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概 率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千 件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料 成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选 择100元还是90元,请说明理由.
因为 y =3860=45,
8
uiyi-8 u y
i=1
所以b^ =
8
u2i -8 u 2
i=1
=1831..45- 3-8×8×0.03.411×545=06.611=100,
则a^ = y -b^ u =45-100×0.34=11, 所以y^ =11+100u, 所以 y 关于 x 的回归方程为y^=11+10x0.
三、非线性回归问题
知识梳理
解非线性回归分析问题的一般步骤 有些非线性回归分析问题并不给出函数,这时我们可以根据已知数据 画出散点图,与学过的各种函数(幂函数、指数函数、对数函数等)的图 象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量 进行变换,把问题转化为线性回归分析问题,使之得到解决.
n
v2i -n
v
2
i=1
i=1
解 ①当产品单价为100元,设订单数为m千件,因为签订9千件订单的 概率为0.8,签订10千件订单的概率为0.2, 所以E(m)=9×0.8+10×0.2=9.2, 所以企业利润为 100×9.2-9.2×190.20+21=626.8(千元). ②当产品单价为90元,设订单数为n千件, 因为签订10千件订单的概率为0.3,签订11千件订单的概率为0.7, 所以E(n)=10×0.3+11×0.7=10.7,
《线性回归方程》课件
线性回归方程的假设
线性关系
自变量和因变量之间存在线性关系,即它们 之间的关系可以用一条直线来描述。
无异方差性
误差项的方差在所有观测值中保持恒定,没 有系统的变化。
无多重共线性
自变量之间不存在多重共线性,即它们之间 没有高度的相关性。
无自相关
误差项在不同观测值之间是独立的,没有相 关性。
02
线性回归方程的建立
详细描述
在销售预测中,线性回归方程可以用来分析历史销售数据,并找出影响销售的关键因素。通过建立线性回归模型 ,可以预测未来的销售趋势,为企业的生产和营销策略提供依据。
案例二:股票价格预测
总结词
线性回归方程在股票价格预测中具有一定的 应用价值,通过分析历史股票价ቤተ መጻሕፍቲ ባይዱ和影响股 票价格的因素,可以预测未来的股票价格走 势。
04
线性回归方程的应用
预测新数据
1 2
预测新数据
线性回归方程可以用来预测新数据,通过将自变 量代入方程,可以计算出对应的因变量的预测值 。
预测趋势
通过分析历史数据,线性回归方程可以预测未来 的趋势,帮助决策者制定相应的策略。
3
预测异常值
线性回归方程还可以用于检测异常值,通过观察 偏离预测值的点,可以发现可能的数据错误或异 常情况。
确定自变量和因变量
确定自变量
自变量是影响因变量的因素,通 常在研究问题中是可控制的变量 。在建立线性回归方程时,首先 需要确定自变量。
确定因变量
因变量是受自变量影响的变量, 通常是我们关心的结果或目标。 在建立线性回归方程时,需要明 确因变量的定义和测量方式。
收集数据
数据来源
确定数据来源,包括调查、实验、公开数据等,确保数据质量和可靠性。
9.1.2线性回归方程讲义-2021-2022学年高二下学期数学苏教版(2019)选择性必修第二册
编号032 §9.1.2 线性回归方程目标要求1、结合具体实例,了解一元线性回归模型的含义.2、结合具体实例,了解模型参数的统计意义.3、结合具体实例,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.4、结合具体实例,会使用相关的统计软件.5、针对实际问题,会用一元线性回归模型进行预测.学科素养目标本章内容是在学生已经学习过必修课程中的统计知识和概率知识的基础上,通过对典型案例的研究,了解和使用一些常用统计分析方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用,从而形成运用统计的观点认识客观事物的习惯.在本章教学中,应突出对学生应用意识的培养,不能只限于要求学生会解书本上的习题,还要关注学生应用与解决实际问题的能力.应引导、鼓励学生从现实生活中发现问题,并能自觉地运用所学的统计方法加以理解,应尽量给学生提供一定的实践活动机会,可结合数学建模活动,选择一个案例,要求学生亲自实践.重点难点重点:一元线性回归模型参数的最小二乘估计方法; 难点:用一元线性回归模型进行预测.教学过程基础知识点 1.线性回归模型我们将y =___________称为线性回归模型. 2.线性回归方程与最小二乘法(1)线性回归方程:直线=__________称为线性回归方程.其中__称为回归截距,__称为回归系数,__称为回归值. (2),的计算公式=∑i =1n(x i -x)(y i -y )∑i =1n(x i -x )2=________________ ,=______________.【课前小题演练】题1.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .散点图中,解释变量在x 轴,响应变量在y 轴 C .回归模型中一定存在随机误差 D .散点图能明确反映变量间的关系题2.根据如下样本数据:x2 3 4 5 6Y 4 2.5 -0.5 -2 -3得到的经验回归方程为=x+,则( )A.>0,>0 B.>0,<0C.<0,>0 D.<0,<0题3.已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为( )A.=1.5x+2 B.=-1.5x+2C.=1.5x-2 D.=-1.5x-2题4.若某地财政收入x与支出Y满足经验回归方程=x++e i(单位:亿元)(i=1,2,…),其中=0.8,=2,|e i|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A.10亿元B.9亿元C.10.5亿元D.9.5亿元题5.若施肥量x(kg)与水稻产量Y(kg)的经验回归方程为=5x+250,当施肥量为80 kg时,预计水稻产量约为________kg.题6.某种产品的广告费用支出x与销售额Y(单位:百万元)之间有如下的对应数据:x/百万元 2 4 5 6 8Y/百万元30 40 60 50 70(1)画出散点图;(2)求经验回归方程;(3)试预测广告费用支出为10百万元时,销售额多大?【当堂巩固训练】题7.已知x,y的取值如表所示:x234 5y 2.2 3.8 5.5m若y与x线性相关,且回归直线方程为=1.46x-0.61,则表格中实数m的值为( )A.7.69 B.7.5 C.6.69 D.6.5题8.某药厂为了了解某新药的销售情况,将2019年2至6月份的销售额整理如下:月份 2 3 4 5 6 销售额(万元)1925353742根据2至6月份的数据可求得每月的销售额y 关于月份x 的线性回归方程=x +为( )(参考公式及数据:=∑i =1nx i y i -n x y∑i =1n x 2i -n (x )2,=y -x ,∑i =15x i y i =690,∑i =15x 2i =90)A .=5.8x +8.4B .=8.4x +5.8C .=6x -9D .=4x +31.6题9.登山族为了了解某山高y (km )与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x (℃) 18 13 10 -1 山高y (km )24343864由表中数据,得到线性回归方程=-2x +()∈R ,由此请估计出山高为72(km )处气温的度数为( )A .-10B .-8C .-4D .-6题10.根据如下的样本数据:x 1 2 3 y2.133.9得到的回归方程为=bx +a ,则直线ax +by -3=0经过定点( ) A .(-1,-2) B .(-1,2) C .(1,-2)D .(1,2)题11.某同学在研究学习中,收集到某制药厂今年5个月甲胶囊生产产量(单位:万盒)的数据如表所示:x (月份) 1 2 3 4 5 y (万盒)55668若x ,y 线性相关,线性回归方程为=0.7x +,则以下为真命题的是( ) A .x 每增加1个单位长度,则y 一定增加0.7个单位长度 B .x 每增加1个单位长度,则y 必减少0.7个单位长度C.当x=6时,y的预测值为8.1万盒D.线性回归直线=0.7x +经过点(2,6)题12.下列说法:①设有一个回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位;②线性回归方程=x+必过()x,y;③设某地女儿身高y对母亲身高x的一个回归直线方程是=34.92+0.78x,则方程中的=34.92可以解释为女儿身高不受母亲身高变化影响的部分.其中正确的个数是( )A.0 B.1 C.2 D.3题13.(多选题...)两个相关变量x,y的5组对应数据如表:x8.3 8.6 9.9 11.1 12.1y 5.9 7.8 8.1 8.4 9.8根据表格,可得回归直线方程=x+,求得=0.78.据此估计,以下结论正确的是( )A.x=10 B.y=9C.=0.2 D.当x=15时,=11.95题14.(多选题...)已知x与y之间的几组数据如表:x 1 2 3 4 5 6y0 2 1 3 3 4假设根据表格数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据()1,0和()2,2求得的直线方程为y=b′x+a′,则以下结论正确的是( )参考公式:=∑i=1nx i y i-n x y∑i=1nx2i-n(x)2,=y-b x .A.a′=-2 B.b′=2 C.>b′ D.>a′【综合突破拔高】题15.对于指数曲线y=ae bx,令U=ln y,c=ln a,经过非线性回归分析后,可转化的形式为( ) A.U=c+bx B.U=b+cxC.y=c+bx D.y=b+cx题16.若一函数模型为y =sin 2α+2sinα+1,为将y 转化为t 的经验回归方程,则需作变换t 等于( ) A .sin 2αB .(sinα+1)2C .⎝ ⎛⎭⎪⎫sin α+12 2D .以上都不对题17.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62 kg ,他的曾祖父、祖父、父亲、儿子的体重分别为58 kg 、64 kg 、58 kg 、60 kg .如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x 与预报变量的回归方程为=x +,其中=0.5,据此模型预测他的孙子的体重约为( ) A .58 kgB .61 kgC .65 kgD .68 kg题18.(多选题...)月亮公转与自转的周期大约为30天,阴历是以月相变化为依据.人们根据长时间的观测,统计了月亮出来的时间y (简称“月出时间”,单位:小时)与天数x (x 为阴历日数,x ∈N *,且0≤x ≤30)的有关数据,如表,并且根据表中数据,求得y 关于x 的线性回归方程为=0.8x +.x 2 4 7 10 15 22 y8.19.41214.418.524其中,阴历22日是分界线,从阴历22日开始月亮就要到第二天(即23日0:00)才升起.则( ) A .样本点的中心为()10,14.4 B .=6.8C .预报月出时间为16时的那天是阴历13日D .预报阴历27日的月出时间为阴历28日早上4:00题19.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润Y 的统计分析知x ,Y 具备线性相关关系,经验回归方程为=10.47-1.3x ,估计该台机器最为划算的使用年限为______年.题20.以模型y =ce kx 去拟合一组数据时,为了求出非经验回归方程,设z =ln y ,其变换后得到经验回归方程=0.3x +4,则c =________.题21.为了响应中央号召,某日深圳环保局随机抽查了本市市区汽车尾气排放污染物x (单位:ppm )与当天私家车路上行驶的时间y (单位:小时)之间的关系,从某主干路随机抽取10辆私家车,已知x 与y 之间具有线性相关关系,其回归直线方程为=0.3x -0.4,若该10辆车中有一辆私家车的尾气排放污染物为6(单位:ppm ),据此估计该私家车行驶的时间为________小时.题22.某市农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月4日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下数据:日期 12月1日12月2日12月3日12月4日温差 11 13 12 8 发芽数(颗)26322617根据表中12月1日至12月3日的数据,求得线性回归方程=x +中的=-8,则求得的=________;若用12月4日的数据进行检验,检验方法如下:先用求得的线性回归方程计算发芽数,再求与实际发芽数的差,若差值的绝对值不超过2颗,则认为得到的线性回归方程是可靠的,则求得的线性回归方程________(填“可靠”或“不可靠”).题23.如表为收集到的一组数据:x 21 23 25 27 29 32 35 Y711212466115325试建立Y 与x 之间的回归方程.题24.宿州市公安局交警支队依据《中华人民共和国道路交通安全法》第90条规定:所有主干道路凡机动车途经十字路口或斑马线,无论转弯或者直行,遇有行人过马路,必须礼让行人,违反者将被处以100元罚款,记3分的行政处罚.如表是本市一主干路段监控设备所抓拍的5个月内,机动车驾驶员“不礼让行人”行为统计数据:月份x 1 2 3 4 5 违章驾驶员人数y1151101009085(1)若x 与y 之间具有很强的线性相关关系,请利用所给数据求违章驾驶员人数y 与月份x 之间的回归直线方程=x +;(2)预测该路段8月份的“不礼让行人”违章驾驶员的人数.参考公式:=∑i =1nx i y i -n x ·y∑i =1nx 2i -n (x)2,=y -x ,参考数据:∑i =15x i y i =1 420.编号032 §9.1.2 线性回归方程目标要求1、结合具体实例,了解一元线性回归模型的含义.2、结合具体实例,了解模型参数的统计意义.3、结合具体实例,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.4、结合具体实例,会使用相关的统计软件.5、针对实际问题,会用一元线性回归模型进行预测.学科素养目标本章内容是在学生已经学习过必修课程中的统计知识和概率知识的基础上,通过对典型案例的研究,了解和使用一些常用统计分析方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用,从而形成运用统计的观点认识客观事物的习惯.在本章教学中,应突出对学生应用意识的培养,不能只限于要求学生会解书本上的习题,还要关注学生应用与解决实际问题的能力.应引导、鼓励学生从现实生活中发现问题,并能自觉地运用所学的统计方法加以理解,应尽量给学生提供一定的实践活动机会,可结合数学建模活动,选择一个案例,要求学生亲自实践.重点难点重点:一元线性回归模型参数的最小二乘估计方法; 难点:用一元线性回归模型进行预测.教学过程基础知识点 1.线性回归模型我们将y =a +bx +ε称为线性回归模型. 2.线性回归方程与最小二乘法(1)线性回归方程:直线=+x 称为线性回归方程.其中称为回归截距,称为回归系数,称为回归值.(2),的计算公式=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=___∑i =1nx i y i -n x y∑i =1nx 2i -n (x)2___ ,=__y -x __.【课前小题演练】题1.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .散点图中,解释变量在x 轴,响应变量在y 轴 C .回归模型中一定存在随机误差 D .散点图能明确反映变量间的关系【解析】选D .用散点图反映两个变量间的关系时,存在误差. 题2.根据如下样本数据:x 2 3 4 5 6Y 4 2.5 -0.5 -2 -3得到的经验回归方程为=x+,则( )A.>0,>0 B.>0,<0C.<0,>0 D.<0,<0【解析】选B.由题干表中的数据可得,变量Y随着x的增大而减小,则<0,又回归方程为=x+经过(2,4),(3,2.5),可得>0.题3.已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为( )A.=1.5x+2 B.=-1.5x+2C.=1.5x-2 D.=-1.5x-2【解析】选B.设经验回归方程为=x+,由题干中散点图可知变量x,Y之间负相关,经验回归直线在Y轴上的截距为正数,所以<0,>0,因此方程可能为=-1.5x+2.题4.若某地财政收入x与支出Y满足经验回归方程=x++e i(单位:亿元)(i=1,2,…),其中=0.8,=2,|e i|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A.10亿元B.9亿元C.10.5亿元D.9.5亿元【解析】选C.=0.8×10+2+e i=10+e i,因为|e i|<0.5,所以9.5<<10.5.题5.若施肥量x(kg)与水稻产量Y(kg)的经验回归方程为=5x+250,当施肥量为80 kg时,预计水稻产量约为________kg.【解析】把x=80代入经验回归方程可得其预测值=5×80+250=650(kg).答案:650题6.某种产品的广告费用支出x与销售额Y(单位:百万元)之间有如下的对应数据:x/百万元 2 4 5 6 8Y/百万元30 40 60 50 70(1)画出散点图;(2)求经验回归方程;(3)试预测广告费用支出为10百万元时,销售额多大?【解析】(1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 合计 x i 2 4 5 6 8 25 y i 30 40 60 50 70 250 x i y i 60 160 300 300 560 1 380 x 2i416253664145所以x =255 =5,y =2505=50,∑i =15x 2i =145,∑i =15x i y i =1 380.于是可得=∑i =15x i y i -5x y∑i =15x 2i -5x 2=1 380-5×5×50145-52×5=6.5,=y -x =50-6.5×5=17.5. 所以所求的经验回归方程为=6.5x +17.5.(3)根据上面求得的经验回归方程,当广告费用支出为 10百万元时,=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元. 【当堂巩固训练】题7.已知x ,y 的取值如表所示:x 2 3 4 5 y2.23.85.5m若y 与x 线性相关,且回归直线方程为=1.46x -0.61,则表格中实数m 的值为( ) A .7.69 B .7.5 C .6.69 D .6.5 【解析】选D .因为x =2+3+4+54 =72, y =2.2+3.8+5.5+m 4 =11.5+m 4,所以11.5+m 4 =1.46×72-0.61,解得m =6.5.题8.某药厂为了了解某新药的销售情况,将2019年2至6月份的销售额整理如下:月份 2 3 4 5 6 销售额(万元)1925353742根据2至6月份的数据可求得每月的销售额y 关于月份x 的线性回归方程=x +为( )(参考公式及数据:=∑i =1nx i y i -n x y∑i =1n x 2i -n (x )2,=y -x ,∑i =15x i y i =690,∑i =15x 2i =90)A .=5.8x +8.4B .=8.4x +5.8C .=6x -9D .=4x +31.6【解析】选A .由表格中的数据得x =2+3+4+5+65=4,y =19+25+35+37+425=31.6,所以=∑i =15x i y i -5x y∑i =15x 2i -5(x)2=690-5×4×31.690-5×42=5.8, =31.6-5.8×4=8.4,因此,y 关于x 的线性回归方程为=5.8x +8.4.题9.登山族为了了解某山高y (km )与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x (℃) 18 13 10 -1 山高y (km )24343864由表中数据,得到线性回归方程=-2x +()∈R ,由此请估计出山高为72(km )处气温的度数为( )A .-10B .-8C .-4D .-6【解析】选D .由题意可得x =10,y =40,所以=y +2x =40+2×10=60.所以=-2x +60,当=72时,有-2x +60=72,解得x =-6. 题10.根据如下的样本数据:x 1 2 3 y2.133.9得到的回归方程为=bx +a ,则直线ax +by -3=0经过定点( ) A .(-1,-2)B .(-1,2)C .(1,-2)D .(1,2)【解析】选D .由所给数据得x =2,y =3,3i 1=∑(x i -x )(y i -y )=1.8,3i 1=∑(x i -x )2=2,所以b =0.9,a =3-0.9×2=1.2,所以直线ax +by -3=0方程为1.2x +0.9y -3=0,过点(1,2). 题11.某同学在研究学习中,收集到某制药厂今年5个月甲胶囊生产产量(单位:万盒)的数据如表所示:x (月份) 1 2 3 4 5 y (万盒)55668若x ,y 线性相关,线性回归方程为=0.7x +,则以下为真命题的是( ) A .x 每增加1个单位长度,则y 一定增加0.7个单位长度 B .x 每增加1个单位长度,则y 必减少0.7个单位长度 C .当x =6时,y 的预测值为8.1万盒 D .线性回归直线=0.7x +经过点(2,6)【解析】选C .由=0.7x +,得x 每增(减)一个单位长度,y 不一定增加(减少)0.7,而是大约增加(减少)0.7个单位长度,故选项A ,B 错误;由已知表中的数据,可知x =1+2+3+4=55 =3,y =5+5+6+6+85=6,则回归直线必过点(3,6),故D 错误;将(3,6)代入回归直线=0.7x +,解得=3.9,即=0.7x +3.9,令x =6,解得=0.7×6+3.9=8.1万盒. 题12.下列说法:①设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ②线性回归方程=x +必过()x ,y ;③设某地女儿身高y 对母亲身高x 的一个回归直线方程是=34.92+0.78x ,则方程中的=34.92可以解释为女儿身高不受母亲身高变化影响的部分. 其中正确的个数是( ) A .0 B .1 C .2 D .3【解析】选C .设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均减少5个单位,故①错;线性回归方程=x +必过样本中心点()x ,y ,故②正确;设某地女儿身高y 对母亲身高x 的一个回归直线方程是=34.92+0.78x ,当x =0时,=34.92, 方程中的=34.92可以解释为女儿身高不受母亲身高变化影响的部分,故③正确. 题13.(多选题...)两个相关变量x ,y 的5组对应数据如表:x 8.3 8.6 9.9 11.1 12.1 y5.97.88.18.49.8根据表格,可得回归直线方程=x +,求得=0.78.据此估计,以下结论正确的是( )A .x =10B .y =9C .=0.2D .当x =15时,=11.95【解析】选AC .易求得x =10,y =8⇒=y -x =8-0.78×10=0.2,所以=0.78x +0.2. x =15⇒=0.78×15+0.2=11.90.题14.(多选题...)已知x 与y 之间的几组数据如表:x 1 2 3 4 5 6 y21334假设根据表格数据所得线性回归直线方程为=x +,若某同学根据上表中的前两组数据()1,0 和()2,2 求得的直线方程为y =b ′x +a ′,则以下结论正确的是()参考公式:=∑i =1nx i y i -n x y∑i =1nx 2i -n (x)2,=y -b x . A .a ′=-2 B .b ′=2 C .>b ′ D .>a ′【解析】选ABD .因为某同学根据前两组数据()1,0 和()2,2 求得的直线方程为y =b ′x +a ′,所以b ′=2,a ′=-2,根据题意得:x =3.5,y =136,∑i =16x i y i =0+4+3+12+15+24=58,∑i =16x 2i =1+4+9+16+25+36=91,所以=∑i =16x i y i -6x y∑i =16x 2i -6(x)2=57 ,=y -x =136 -57 ×72 =-13 ,所以<b ′,>a ′. 【综合突破拔高】题15.对于指数曲线y =ae bx ,令U =ln y ,c =ln a ,经过非线性回归分析后,可转化的形式为( ) A .U =c +bx B .U =b +cx C .y =c +bxD .y =b +cx【解析】选A .由y =ae bx 得ln y =ln (ae bx ), 所以ln y =ln a +ln e bx ,所以ln y =ln a +bx ,所以U =c +bx .题16.若一函数模型为y =sin 2α+2sinα+1,为将y 转化为t 的经验回归方程,则需作变换t 等于( ) A .sin 2αB .(sinα+1)2C .⎝⎛⎭⎪⎫sin α+12 2D .以上都不对 【解析】选B .因为y 是关于t 的经验回归方程,实际上就是y 是关于t 的一次函数,又因为y =(sin α+1)2,若令t =(sin α+1)2,则可得y 与t 的函数关系式为y =t ,此时变量y 与变量t 是线性相关关系. 题17.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62 kg ,他的曾祖父、祖父、父亲、儿子的体重分别为58 kg 、64 kg 、58 kg 、60 kg .如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x 与预报变量的回归方程为=x +,其中=0.5,据此模型预测他的孙子的体重约为( ) A .58 kgB .61 kgC .65 kgD .68 kg【解析】选B .由于体重是隔代遗传,且呈线性相关, 则取数据(58,58),(64,62),(58,60),得x =58+64+583 =60,y =58+62+603 =60,即样本点的中心为(60,60),代入=x +, 得=60-0.5×60=30,则=0.5x +30, 取x =62,可得=0.5×62+30=61 kg . 故预测他的孙子的体重约为61 kg .题18.(多选题...)月亮公转与自转的周期大约为30天,阴历是以月相变化为依据.人们根据长时间的观测,统计了月亮出来的时间y (简称“月出时间”,单位:小时)与天数x (x 为阴历日数,x ∈N *,且0≤x ≤30)的有关数据,如表,并且根据表中数据,求得y 关于x 的线性回归方程为=0.8x +.x 2 4 710 15 22 y8.19.41214.418.524其中,阴历22日是分界线,从阴历22日开始月亮就要到第二天(即23日0:00)才升起.则( ) A .样本点的中心为()10,14.4 B .=6.8C .预报月出时间为16时的那天是阴历13日D .预报阴历27日的月出时间为阴历28日早上4:00 【解析】选AD .x =2+4+7+10+15+226=10,y =8.1+9.4+12+14.4+18.5+246=14.4,故样本点的中心为()10,14.4 ,选项A 正确;将样本点的中心()10,14.4 代入=0.8x +得=6.4,故选项B 错误;因为=0.8x +6.4,当y =16时,求得x =12,月出时间为阴历12日,选项C 错误;因为阴历27日时,即x =27,代入=0.8×27+6.4=28,日出时间应该为28日早上4:00,选项D 正确. 题19.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润Y 的统计分析知x ,Y 具备线性相关关系,经验回归方程为=10.47-1.3x ,估计该台机器最为划算的使用年限为______年. 【解析】当年利润小于或等于零时应该报废该机器, 当y =0时,令10.47-1.3x =0,解得x ≈8, 故估计该台机器最为划算的使用年限为8年. 答案:8题20.以模型y =ce kx 去拟合一组数据时,为了求出非经验回归方程,设z =ln y ,其变换后得到经验回归方程=0.3x +4,则c =________. 【解析】由题意,得ln (ce kx )=0.3x +4,所以ln c +kx =0.3x +4,所以ln c =4,所以c =e 4. 答案:e 4题21.为了响应中央号召,某日深圳环保局随机抽查了本市市区汽车尾气排放污染物x (单位:ppm )与当天私家车路上行驶的时间y (单位:小时)之间的关系,从某主干路随机抽取10辆私家车,已知x 与y 之间具有线性相关关系,其回归直线方程为=0.3x -0.4,若该10辆车中有一辆私家车的尾气排放污染物为6(单位:ppm ),据此估计该私家车行驶的时间为________小时.【解析】由=0.3x -0.4,令x =6,代入可得=0.3×6-0.4=1.4.所以估计该私家车行驶的时间为1.4小时. 答案:1.4题22.某市农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月4日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下数据:日期 12月1日 12月2日12月3日12月4日温差 11 13 12 8 发芽数(颗)26322617根据表中12月1日至12月3日的数据,求得线性回归方程=x +中的=-8,则求得的=________;若用12月4日的数据进行检验,检验方法如下:先用求得的线性回归方程计算发芽数,再求与实际发芽数的差,若差值的绝对值不超过2颗,则认为得到的线性回归方程是可靠的,则求得的线性回归方程________(填“可靠”或“不可靠”).【解析】由题得x =11+13+123 =12,y =26+32+263 =28,所以样本中心点为(12,28),所以28=×12-8,所以=3;因为=3x -8,所以12月4日的估计值为=3×8-8=16,又|17-16|=1,没有超过2,所以求得的线性回归方程可靠. 答案:3 可靠题23.如表为收集到的一组数据:x 21 23 25 27 29 32 35 Y711212466115325试建立Y 与x【解析】作出散点图,如图.从散点图中可以看出x 与Y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线的周围.令Z =ln Y ,则变换后的样本点分布在直线=x +的周围,这样就可以利用线性经验回归模型来建立非线性经验回归方程了,数据可以转化为:x 21 232527 29 32 35 Z1.9462.3983.0453.1784.1904.7455.784求得经验回归方程为=0.272x -3.849, 所以=e0.272x -3.849.题24.宿州市公安局交警支队依据《中华人民共和国道路交通安全法》第90条规定:所有主干道路凡机动车途经十字路口或斑马线,无论转弯或者直行,遇有行人过马路,必须礼让行人,违反者将被处以100元罚款,记3分的行政处罚.如表是本市一主干路段监控设备所抓拍的5个月内,机动车驾驶员“不礼让行人”行为统计数据:月份x 1 2 3 45 违章驾驶员人数y1151101009085(1)若x 与y 之间具有很强的线性相关关系,请利用所给数据求违章驾驶员人数y 与月份x 之间的回归直线方程=x +;(2)预测该路段8月份的“不礼让行人”违章驾驶员的人数.参考公式:=∑i =1nx i y i -n x ·y∑i =1nx 2i -n (x)2,=y -x ,参考数据:∑i =15x i y i =1 420.【解析】(1)由表中数据得:x =15()1+2+3+4+5 =3,y =15()115+110+100+90+85 =100,=∑i =15x i y i-5x·y∑i=15x2i-5(x)2=1 420-5×3×10055-45=-8,=y-x=100+8×3=124.所以y与x之间的回归直线方程为=-8x+124;(2)由(1)得,=-8x+124,令x=8,得=-8×8+124=60,预测该路段8月份的“不礼让行人”违章驾驶员人数为60人.。
高三数学一轮复习课件:线性回归方程
课堂互动讲练
(3)若由线性回归方程得到的估计数据与 所选出的检验数据的误差均不超过2人, 则认为得到的线性回归方程是理想的, 试问该小组在(2)中所得线性回归方程是 否理想?
课堂互动讲练
解:(1)设“抽到相邻2个月的数据”为事件 A.因为从6组数据中选取2组数据共有15 种情况,每种情况都是等可能出现的, 其中抽到相邻两个月的数据的情况有5种, 所以P(A)= = .4分 1 5 15 3
,a= y -b x .其中
a,b是由观察值按最小二乘法求得 的估计值 ,也叫 回归系数 .
三基能力强化
1.下列关系中,是相关关系的为 ________. ①学生的学习态度与学习成绩之间的关 系; ②教师的执教水平与学生的学习成绩之 间的关系;
三基能力强化
③学生的身高与学生的学习成绩之间的 关系; ④家庭的经济条件与学生的学习成绩之 间的关系. 答案:①②
(1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程.
课堂互动讲练
【思路点拨】 利用散点图观察 收入x和支出y是否线性相关,若呈线性相 关关系,可利用公式来求回归系数,然 后获得回归直线方程.
课堂互动讲练
【解】 (1)作出散点图:
课堂互动讲练
观察发现各个数据对应的点都在一条 直线附近,所以二者呈线性相关关系. (2) = (0.8+1.1+1.3+1.5+1.5+ 1 1.8+2.0+ 2.2 +2.4+2.8)=1.74, x 10 = (0.7+1.0+1.2+1.0+1.3+1.5 1 +1.3+ 1.7 +2.0+2.5)=1.42, y 10
课堂互动讲练
i= 1 i i
∑ x y =0.8×0.7+1.1×1.0+1.3×1.2+
高中数学知识点精讲精析 线性回归方程
6.4 线性回归方程1、确定性函数关系:变量之间可以用函数表示2、相关关系:变量之间具有一定的联系,但不能完全用函数表达引入:某小卖部为了了解热茶销售量与气温的大致的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温对照表如果某天的气温是-5℃,你能根据这些数据预测这天小卖部卖出热茶的杯数么?考虑离差的平方和:一般地,设有n对观察数据如下:仿照前面的方法,可得线性回归方程中系数a,b满足由此二元一次方程组便可依次求出b 、a 的值.相关关系1. 散点图、正相关、负相关2. 数据回归直线方程:样本相关系数:1112211nn n i i i i i i i n ni i i i n x y x y b n x x a y bx =====⎧⎛⎫⎛⎫-⎪⎪⎪⎝⎭⎝⎭⎪=⎪⎛⎫⎨- ⎪⎪⎝⎭⎪⎪=-⎩∑∑∑∑∑)(121n x x x n x +++=)(121n y y y n y +++= ∑=+++=ni nix x x x1222212 ∑=+++=ni niy y y y1222212 ∑=+++=ni nn ii y x y x y x yx 12211 ∑∑==--=n i i ni ii xn x yx n yx b 1221x b y a -=a bx y +=⋂∑∑∑===-⋅--=ni ni i ini ii y y x xyx n yx r 11221)()(时回归直线有意义时回归直线无意义.该市统计调查队随机调查10个家庭,【解析】∴ 回归直线有意义∴ 回归直线:∑∑∑===---=ni ni i i ni ii y n y x n x yx n yx 11221))((1||≤r 05.0||r r >05.0||r r ≤88.321012=∑=i ix∑==10127.22i iy∑==10117.27i ii yx 632.0950.005.0=>=r r 013.0-=a 833.0=b 013.0833.0-=x y(1)检验是否线性相关. (2)求回归方程.(3)若市政府下一步再扩大5千煤气用户.试预测该市煤气消耗量将达到多少. 【解析】解:(1)线性相关(2)(3)代入 所以煤气量达3037万立方米3. 为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本. 【解析】解:(1)随机地将这1003个个体编号为1,2,3, (1003)(2)利用简单随机抽样,先从总体中剔除3个个体(可利用随机数表),剩下的个体数1000能被样本容量50整除,然后再按系统抽样的方法进行.总体中的每个个体被剔除的概率相等(3/1003),也就是每个个体不被剔除的概率相等(1000/1003),采用系统抽样时每个个体被抽取的概率都是(50/1000),所以在整个抽样过程中每个个体被抽取的概率仍然相等,都是4. 某农场种植的甲乙两种水稻,在连续6年中各年的平均产量如下:哪种水稻的产量比较稳定? 【解析】解:因为,所以甲水稻的产量比较稳定5. 已知10只狗的血球体积及红血球的测量值如下:x (血球体积,mm ),y (血红球数,百万)(1)画出上表的散点图;(2)求出回归直线并且画出图形; (3)回归直线必经过的一点是哪一点? 【解析】05.0632.0998.0r r =>=06.6=b 07.0=a x y 06.607.0+=⋂55.05.40=+=x 37.30=⋂y 10035010005010031000=⨯6/)9.683.638.675.69.675.6(+++++=甲x 75.6=177.0=甲S 6/)68.645.638.613.72.768.6(+++++=乙x 75.6=312.0=乙S 乙甲S S <解:(1)见下图(2)设回归直线为则所以所求回归直线的方程为,图形如下:故可得到从而得回归直线方程是点评:借助散点图,可以直观探究两个变量是否具有线形相关关系;运用由最小二乘法思想得到回归直线方程的回归系数和,会由数据求回归直线方程,并利用回归直线方程进行回归分析与预测.50.45)50394058354248464245(101=+++++++++=x 37.7)72.855.620.649.990.599.650.752.930.653.6(101=+++++++++=y a bx y +=⋂176.01221=--=∑∑==ni ini ii xn xxyn yx a 64.0-=-=x a y b 64.0176.0-=⋂x y 75.430770003.399307871752≈⨯-⨯⨯-=b 2573075.43.399≈⨯-=a 25775.4+=⋂x y a b。
新高考数学复习基础知识专题讲义22 回归方程和2×2联表(解析版)
新高考数学复习基础知识专题讲义 知识点22 回归方程和2×2联表知识理解 一.线性关系 1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. (2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关. 2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程: 是两个具有线性相关关系的变量的一组数据的回归方程,其中是待定参数. 的计算公式.注意:回归方程必过样本中心(x,y),这也是做小题的依据和检验所求回归方程是否正确。
(3)相关系数:当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. 二.独立性检验y bx a =+1122()()()n n x y x y x y ,,,,,,a b 、a b 、1122211()()()()nni i i ii i n ni ii i x x y y x y nx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑(1)2×2列联表设X ,Y 为两个变量,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)如下:(2)独立性检验利用随机变量K 2(也可表示为χ2)的观测值22n(ad bc)K (a b)(c d)(a c)(b d)-=++++(其中n =a +b +c +d 为样本容量)来判断“两个变量有关系”的方法称为独立性检验.考向一 一次线性关系【例1-1】(2021·山东高三专题练习)某工厂的每月各项开支x 与毛利润y (单位:万元)之间有如下关系,y 与x 的线性回归方程 6.5y x a =+,则a =( )A .17.5B .17C .15D .15.5 【答案】A【解析】由题意,根据表中的数据,可得2456855x ++++==,3040605070505y ++++==,即样本中心为(5,50),代入y 与x 的线性回归方程为 6.5y x a =+,解得17.5a =.故选:A . 【例1-2】(2021·全国高三专题练习)西尼罗河病毒(WNV )是一种脑炎病毒,WNV 通常是由鸟类携考向分析带,经蚊子传播给人类.1999年8-10月,美国纽约首次爆发了WNV 脑炎流行.在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV 的复制,抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x (千克)和利巴韦林含片产量y (百盒)的统计数据如下:由相关系数r 可以反映两个变量相关性的强弱,||[0.75,1]r ∈,认为变量相关性很强;||[0.3,0.75]r ∈,认为变量相关性一般;||[0,0.25]r ∈,认为变量相关性较弱. (1)计算相关系数r ,并判断变量x 、y 相关性强弱;(2)根据上表中的数据,建立y 关于x 的线性回归方程ˆˆˆybx a =+;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林? 25.69≈.参考公式:相关系数()()niix x y y r--=∑ˆˆˆybx a =+中,()()()121niii ni i x x y y b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)0.97r =≈,x 与y 具有很强的相关性;(2)54.2千克. 【解析】(1)1(12345)35x =⨯++++=,()11620232526225y =⨯++++=, ()()51(13)(1622)(23)(2022)(33)(2322)ii i xx y y x =--=-⨯-+--+-⨯-∑(43)(2522)(53)(2622)25+-⨯-+-⨯-=,()52222221(13)(23)(33)(43)(53)10i i x x =-=-+-+-+-+-=∑,()522221(1622)(2022)(2322)i i y y =-=-+-+-∑22(2522)(2622)66+-+-=,则()()50.97iix x y y r --==≈∑ 所以x 与y 具有很强的相关性.(2)由(1)得,()()()5152125ˆ 2.510iii i i x x y y bx x ==--===-∑∑, ˆˆ22 2.5314.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ 2.514.5yx =+. 当150y =(百盒)时,54.2x =(千克)故要使某组利巴韦林含片产量达到150百盒,估计该组应投入54.2千克利巴韦林. 【举一反三】1.(2021·全国高三专题练习)某工厂某产品产量x (千件)与单位成本y (元)满足回归直线方程77.36 1.82y x =-,则以下说法中正确的是( )A .产量每增加1000件,单位成本约下降1.82元B .产量每减少1000件,单位成本约下降1.82元C .当产量为1千件时,单位成本为75.54元D .当产量为2千件时,单位成本为73.72元 【答案】A【解析】令()77.36 1.82f x x =-,因为(1)()77.36 1.82(1)77.36 1.82 1.82f x f x x x +-=-+-+=-, 所以产量每增加1000件,单位成本约下降1.82元.2.(2021·安徽省六安中学高三开学考试)“关注夕阳、爱老敬老”—某马拉松协会从2013年开始每年向敬老院捐赠物资和现金.下表记录了第x 年(2013年是第一年)与捐赠的现金y (万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程ˆ0.35ymx =+,则预测2019年捐赠的现金大约是( )A .5万元B .5.2万元C .5.25万元D .5.5万元 【答案】C【解析】由已知得,3456 2.534 4.54.5, 3.544x y ++++++====,所以样本点的中心点的坐标为(4.5,3.5),代入ˆ0.35ymx =+, 得3.5 4.50.35m =+,即0.7m =,所以ˆ0.70.35yx =+, 取7x =,得ˆ0.770.35 5.25y=⨯+=, 预测2019年捐赠的现金大约是5.25万元.3.(2021·全国高三专题练习)基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验、某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,结果如下表:(1)请在给出的坐标纸中作出散点图,并用相关系数说明可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系;(2)求y关于x的线性回归方程,并预测该公司2020年2月份的市场占有率;(3)根据调研数据,公司决定再采购一批单车扩大市场,现有采购成本分别为1000元/辆和800元/辆的A、B两款车型报废年限各不相同,考虑到公司的经济效益,该公司决定先对两款单车各100辆进行科学模拟测试,得到两款单车使用寿命频数表如下:经测算,平均每辆单车每年可以为公司带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且用频率估计每辆单车使用寿命的概率,以每辆单车产生利润的期望值为决策依据、如果你是该公司的负责人,你会选择采购哪款车型?参考数据:621()17.5ii x x =-=∑,61()()35i i i x x y y =--=∑36.5≈参考公式:相关系数C ;回归直线方程为ˆˆˆybx a =+,其中121()()ˆ()niii nii x x y y b x x ==--=-∑∑,ˆˆay bx =- 【答案】(1)散点图见解析,可用线性回归模型拟合两变量之间的关系;(2)ˆ29y x =+,23%;(3)应选择B 款车型.【解析】(1)散点图如图所示,111316152021166y +++++==,∴621()76i i y y =-=∑,∴()()350.9636.5niix x y y r --====≈∑,∴两变量之间具有较强的线性相关关系, 故可用线性回归模型拟合两变量之间的关系;(2)121()()35217.5()ˆniii ni i x x y y bx x ==--===-∑∑,又1234563.56x +++++==, ∴ˆˆ162 3.59ay bx =-=-⨯=,∴回归直线方程为ˆ29y x =+; ∴2020年2月的月份代码7x =,∴27923y =⨯+=, ∴估计2020年2月的市场占有率为23%;(3)用频率估计概率,A 款单车的利润X 的分布列为:∴()5000.100.35000.410000.2350E X =-⨯+⨯+⨯+⨯=(元),B 款单车的利润Y 的分布列为:∴()3000.152000.47000.3512000.1400E Y =-⨯+⨯+⨯+⨯=(元), 以每辆单车产生利润的期望值为决策依据,故应选择B 款车型.4.(2021·全国高三专题练习)近年来,“双11”网购的观念逐渐深入人心.某人统计了近5年某网站“双11”当天的交易额,,统计结果如下表:(1)请根据上表提供的数据,用相关系数r 说明y 与x 的线性相关程度,线性相关系数保留三位小数.(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (1i n ≤≤),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果[]1,0.75r -∈-,那么负相关很强;如果[]0.751r ∈,,那么正相关很强;如果(]0.75,0.30r ∈--或[)0.30,0.75r ∈,那么相关性一般;如果[]0.25,0.25r ∈-,那么相关性较弱);(2)求出关于x 的线性y 回归方程,并预测2020年该网站“双11”当天的交易额.参考公式:121()()()ˆniii ni i x x y y bx x ==--=-∑∑,ˆˆay bx =-43.1≈. 【答案】(1)0.998;变量y 与x 的线性相关程度很强;(2)ˆ 4.3 4.1yx =+;29.9百亿元. 【解析】(1)由题意,根据表格中的数据, 可得:1(12345)35x =++++=,1(912172126)175y =++++=,则1()()(13)(917)(53)(2617)43niii x x y y =--=--++--=∑,43.1=≈,所以()()430.99843.1niix x y y r --==≈∑ 所以变量y 与x 的线性相关程度很强.(2)由(1)可得3x =,17y =,1()()43niii x x y y =--=∑,又由2221222(13)(23)(3(3)(43)(53)1)0nii x x ==-+-+-+-+-=-∑,所以121()()43 4.30)ˆ1(niii ni i x x y y bx x ==--===-∑∑,则ˆˆ17 4.33 4.1a y bx=-=-⨯=, 可得y 关于x 的线性回归方程为ˆ 4.3 4.1y x =+ 令6x =,可得ˆ 4.36 4.129.9y=⨯+=, 即2020年该网站“双11”当天的交易额29.9百亿元.考向二 独立性检验【例2】(2021·江苏泰州市·高三期末)2021年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A ”、“B ”、“C ”三个等级,A 、B 等级都是合格品,C 等级是次品,统计结果如下表所示:(表一)(表二)在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?(2)每件玩具的生产成本为30元,A 、B 等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A 等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.附:22()()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.【答案】(1)列联表答案见解析,没有95%的把握认为产品的合格率与厂家有关;(2)甲厂能盈利,乙不能盈利,理由见解析. 【解析】(1)2×2列联表如下()2220075352565 2.38 3.84110010014060K ⨯⨯-⨯=≈<⨯⨯⨯,∴没有95%的把握认为产品的合格率与厂家有关.(2)甲厂10件A 等级,65件B 等级,25件次品, 对于甲厂,单件产品利润X 的可能取值为30,10,34-.X 的分布列如下:()3010341010204E X ∴=⨯+⨯-⨯=>, ∴甲厂能盈利,对于乙厂有10件A 等级,55件B 等级,35件次品, 对于乙厂,单位产品利润Y 的可能取值为30,10,34-,Y 分布列如下:()30103401020205E Y ∴=⨯+⨯-⨯=-<,乙不能盈利. 【举一反三】1.(2021·山东高三专题练习)共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,2021年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,补全下列22⨯列联表,并根据列联表的独立性检验,判断是否有85%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人数为随机变量X,求X的分布列与期望.参考数据:独立性检验界值表其中,22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++【答案】(1)列联表见解析,有85%的把握可以认为经常使用共享单车与年龄有关;(2)分布列见解析,数学期望为0.3.【解析】(1)补全的列联表如下:于是100a =,20b =,60c =,20d =,∴22200(100206020) 2.083 2.0721208016040K ⨯⨯-⨯=≈>⨯⨯⨯,即有85%的把握可以认为经常使用共享单车与年龄有关. (2)由(1)的列联表可知,经常使用共享单车的“非年轻人”占样本总数的频率为20100%10%200⨯=, 即在抽取的用户中出现经常使用单车的“非年轻人”的概率为0.1, ∵~(3,0.1)X B ,0,1,2,3X =∴3(0)(10.1)0.729P X ==-=,(1)0.243P X ==(2)0.027P X ==,3(3)0.10.001P X ===,∴X 的分布列为E X=⨯=.∴X的数学期望()30.10.3【举一反三】1.(2021·全国高三专题练习)某工厂为了提高生产效率,对生产设备进行了技术改造,为了对比技术改造后的效果,采集了技术改造前后各20次连续正常运行的时间长度(单位:天)数据,整理如下:改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21 改造后:32,29,41,18,26,33,42,34,37,39,33,22,42,35,43,27,41,37,38,36 (1)完成下面的列联表,并判断能否有99%的把握认为技术改造前后的连续正常运行时间有差异?(2)工厂的生产设备的运行需要进行维护,工厂对生产设备的生产维护费用包括正常维护费,保障维护费两种.对生产设备设定维护周期为T天(即从开工运行到第kT天,k∈N*)进行维护.生产设备在一个生产周期内设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产设备能连续运行,则只产生一次正常维护费,而不会产生保障维护费;若生产设备不能连续运行,则除产生一次正常维护费外,还产生保障维护费.经测算,正常维护费为0.5万元/次;保障维护费第一次为0.2万元/周期,此后每增加一次则保障维护费增加0.2万元.现制定生产设备一个生产周期(以120天计)内的维护方案:T=30,k=1,2,3,4.以生产设备在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及均值.附:22()()()()()n ad bc K a b c d a c b d -=++++【答案】(1)见解析,有99%的把握认为技术改造前后的连续正常运行时间有差异.(2)见解析;均值为2.275万元. 【解析】(1)列联表为:()224055151510 6.63520202020K ⨯-⨯∴==>⨯⨯⨯∴有99%的把握认为技术改造前后的连续正常运行时间有差异.(2)由题知,生产周期内有4个维护周期,一个维护周期为30天,一个维护周期内,生产线需保障维护的概率为14P =. 设一个生产周期内需保障维护的次数为ξ,则1~4,4B ξ⎛⎫⎪⎝⎭;一个生产周期内的正常维护费为0.542⨯=万元,保障维护费为()()20.210.10.12ξξξξ⨯+=+万元.∴一个生产周期内需保障维护ξ次时的生产维护费为()20.10.12ξξ++万元.设一个生产周期内的生产维护费为X ,则X 的所有可能取值为2,2.2,2.6,3.2,4.()4181214256P X ⎛⎫==-= ⎪⎝⎭ ()31411272.214464P X C ⎛⎫==-= ⎪⎝⎭ ()222411272.6144128P X C ⎛⎫⎛⎫==-=⎪ ⎪⎝⎭⎝⎭ ()3341133.214464P X C ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭ ()41144256P X ⎛⎫=== ⎪⎝⎭所以,X 的分布列为()2 2.2 2.6 3.242566412864256E X ∴=⨯+⨯+⨯+⨯+⨯ 162237.6140.438.44582.4 2.275256256++++===∴一个生产周期内生产维护费的均值为2.275万元.2.(2021·四川成都市·高三一模)一网络公司为某贫困山区培养了100名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富.该公司将这100名“乡土直播员”中每天直播时间不少于5小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”.根据实际评选结果得到了下面22⨯列联表:(1)根据列联表判断是否有95%的把握认为“网红乡土直播员”与性别有关系?(2)在“网红乡土直播员”中按分层抽样的方法抽取6人,在这6人中选2人作为“乡土直播推广大使”.设被选中的2名“乡土直播推广大使”中男性人数为ξ,求ξ的分布列和期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)有95%的把握认为“网红乡土直播员”与性别有关系;(2)分布列见解析;期望为23. 【解析】(1)由题中22⨯列联表,可得()2210010302040 4.762 3.84150503070K ⨯-⨯=≈>⨯⨯⨯.∴有95%的把握认为“网红乡土直播员”与性别有关系. (2)在“网红乡土直播员”中按分层抽样的方法抽取6人, 男性人数为106230⨯=人;女性人数为206430⨯=人. 由题,随机变量ξ所有可能的取值为0,1,2.()022426620155CC P C ξ====,()1124268115C C P C ξ===,()2024261215C C P C ξ===, ∴ξ的分布列为∴ξ的数学期望()28110201251515153E ξ=⨯+⨯+⨯==. 考向三 非一次性回归方程【例3-1】(2021·全国高三专题练习)在一项调查中有两个变量x 和y ,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y 关于x 的回归方程的函数类型是( )A .y a bx =+B .y c =+C .2y m nx =+D .xy p qc =+(0q >)【答案】B【解析】散点图呈曲线,排除A 选项,且增长速度变慢,排除选项C 、D ,故选B .【例3-2】.(2021·全国高三专题练习)根据公安部交管局下发的通知,自2021年6月1日起,将在全国开展“一盔一带”安全守护行动,其中就要求骑行摩托车、电动车需要佩戴头盔,为的就是让大家重视交通安全.某地交警部门根据某十字路口的监测数据,从穿越该路口的骑行者中随机抽查了200人,得到如图所示的列联表:(1)是否有97.5%的把握认为自觉带头盔行为与性别有关?(2)通过一定的宣传和相关处罚措施出台后,交警在一段时间内通过对某路口不带头盔的骑行者统计,得到上面的散点图和如下数据:观察散点图,发现两个变量不具有线性相关关系,现考虑用函数y ax=+对两个变量的关系进行拟合,通过分析得y与1有一定的线性相关关系,并得到以下参考数据(其中1w=):请选择合适的参考数据,求出y关于x的回归方程.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++.) 2k对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为:1221ˆni i i ni i u v nuvunu β==-=-∑∑,ˆˆv u αβ=-. 【答案】(1)没有;(2)100ˆ10yx=+. 【解析】(1)由列联表计算22200(30701090)754.68755.024120804016016K ⨯⨯-⨯===<⨯⨯⨯.故没有97.5%的把握认为骑行者自觉带头盔行为与性别有关. (2)由1w x =,则by a x =+可转化为y a bw =+,又306516y ==, 得6162216173.860.415148.34ˆ1001.49260.16810.48346i ii ii w y wybww ==--⨯⨯====-⨯-∑∑,则ˆˆ511000.4110ay bw =-=-⨯=. 故y 关于x 的回归方程为100ˆ1010010yw x=+=+ 【举一反三】1.(2021·河南周口市·高三月考)已知变量y 关于变量x 的回归方程为0.5ˆbx ye -=,其一组数据如下表所示:若9.1ˆye =,则x =( ) A .5B .6C .7D .8 【答案】B【解析】由0.5ˆbx ye -=,得n 0ˆl .5ybx =-,令ln z y =,则0.5z bx =-,由题意,12342.54x +++==,1346 3.54z +++==,因为(),x z 满足0.5z bx =-,所以3.5 2.50.5b =⨯-,解得 1.6b =, 所以 1.60.5z x =-,所以 1.60.5ˆx ye -=,令 1.60.59.1x e e -=,解得6x =.故选:B.2.(2021·全国高三专题练习)近期,济南公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:表:根据以上数据,绘制了散点图.(1)根据散点图判断,在推广期内y a bx =+与xy c d =⋅(c ,d 均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断,不必说明理由); (2)根据(1)的判断结果及表中的数据,建立y 关于x 的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:车队为缓解周边居民出行压力,以80万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有16的概率享受7折优惠,有13的概率享受8折优惠,有12的概率享受9折优惠,预计该车队每辆车每个月有1万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要()*n n N ∈年才能开始盈利,求n 的值.参考数据:其中lg i i v y =,7117ii v v ==∑ 参考公式:对于一组数据(),i i u v ,()22,u v ,…,(),n n u v ,其回归直线v a u β=+的斜率和截距的最小二乘估计公式分别为:1221ni i i n i i u v nuv u nuβ==-=-∑∑,a v u β=-.【答案】(1)xy c d =⋅;(2)0.253.4710x y =⨯,347;(3)7.【解析】(1)因为散点近似在指数型函数的图象上,所以xy c d =⋅适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型:(2)∵xy c d =⋅,两边同时取常用对数得:()lg lg lg lg xy c dc xd =⋅=+;设lg y v =,∴lg lg v c x d =+,∵4x =, 1.54v =,721140i i x ==∑, ∴717221750.1274 1.547lg 0.25140716287i i i ii x v xv d x x ==--⨯⨯====-⨯-∑∑,把样本中心点()4,1.54代入lg 0.25v c x =+,得:lg 0.54c =,∴0540.25v x =+,∴lg 0.540.25y x =+,∴y 关于x 的回归方程式:0.540.250.540.250.25101010 3.4710x x x y +==⨯=⨯; 把8x =代入上式:∴0.2583.4710347y ⨯=⨯=; 活动推出第8天使用扫码支付的人次为347;(3)记一名乘客乘车支付的费用为Z ,则Z 的取值可能为:2,1.8,1.6,1.4;()20.1P Z ==;()11.80.30.152P Z ==⨯=;()11.60.60.30.73P Z ==+⨯=;()11.40.30.056P Z ==⨯= 所以,一名乘客一次乘车的平均费用为:20.1 1.80.15 1.60.7 1.40.05 1.66⨯+⨯+⨯+⨯=(元), 由题意可知:1.661120.6612800n n ⨯⨯⋅-⨯⋅->,203n >,所以,n 取7;估计这批车大概需要7年才能开始盈利. 3.(2021·全国高三专题练习)某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人.萌宠机器人语音功能让它就像孩子的小伙伴一样和孩子交流,记忆功能还可以记住宝宝的使用习惯,很快找到宝宝想听的内容.同时提供快乐儿歌、国学经典、启蒙英语等早期教育内容,且云端内容可以持续更新.萌宠机器人一投放市场就受到了很多家长欢迎.为了更好地服务广大家长,该公司研究部门从流水线上随机抽取100件萌宠机器人(以下简称产品),统计其性能指数并绘制频率分布直方图(如图1):产品的性能指数在[)50,70的适合托班幼儿使用(简称A 类产品),在[)70,90的适合小班和中班幼儿使用(简称B 类产品),在[]90,110的适合大班幼儿使用(简称C 类产品),A ,B ,C ,三类产品的销售利润分别为每件1.5,3.5,5.5(单位:元).以这100件产品的性能指数位于各区间的频率代替产品的性能指数位于该区间的概率. (1)求每件产品的平均销售利润;(2)该公司为了解年营销费用x (单位:万元)对年销售量y (单位:万件)的影响,对近5年的年营销费用i x ,和年销售量()1,2,3,4,5i y i =数据做了初步处理,得到的散点图(如图2)及一些统计量的值.表中ln i i u x =,ln i i y υ=,5115i i u u ==∑,5115i i υυ==∑.根据散点图判断,by a x =⋅可以作为年销售量y (万件)关于年营销费用x (万元)的回归方程.(i )建立y 关于x 的回归方程;(ii )用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大? (收益=销售利润-营销费用,取 4.15964e =). 参考公式:对于一组数据()()()1122,,,,,,n n u u u υυυ,其回归直线u υαβ=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i nii uu uuυυβ==--=-∑∑,ˆˆu αυβ=-. 【答案】(1)每件产品的平均销售利润为4元(2)(i )1464y x =(ii )该厂应投入256万元营销费. 【解析】(1)设每件产品的销售利润为ξ元,则ξ的所有可能取值为1.5,3.5,5.5, 由直方图可得,A ,B ,C 三类产品的频率分别为0.15、0.45、0.4, 所以,()1.50.15P ξ==,()3.50.45P ξ==,()5.50.4P ξ==, 所以随机变量ξ的分布列为:所以, 1.50.15 3.50.45 5.50.44E ξ=⨯+⨯+⨯=, 故每件产品的平均销售利润为4元;(2)(i )由by a x =⋅得,()ln ln ln ln by a xa b x =⋅=+,令ln u x =,ln y υ=,ln c a =,则c bu υ=+,由表中数据可得,()()()515210.41ˆ0.251.61ii i ii uu buuυυ==--===-∑∑, 则24.8716.30ˆˆ0.25 4.15955cbu υ=-=-⨯=, 所以,ˆ 4.1590.25u υ=+,即14.1594ˆln 4.1590.25ln ln y x e x ⎛⎫=+=⋅ ⎪⎝⎭, 因为 4.15964e =,所以14ˆ64y x =, 故所求的回归方程为1464y x =;(ii )设年收益为z 万元,则()14256z E y x x x ξ=⋅-=-, 设14t x =,()4256f t t t =-,则()()332564464f t t t'=-=-,当()0,4t ∈时,()0f t '>,f t 在()0,4单调递增, 当()4t ,∈+∞时,()0f t '<,ft 在()4,+∞单调递减,所以,当4t =,即256x =时,z 有最大值为768,即该厂应投入256万元营销费,能使得该产品一年的收益达到最大768万元.1.(2021·全国高三专题练习)给出下列说法:①回归直线ˆˆˆybx a =+恒过样本点的中心(,)x y ,且至少过一个样本点; ②两个变量相关性越强,则相关系数||r 就越接近1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5y x =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位. 其中说法正确的是( )A .①②④B .②③④C .①③④D .②④ 【答案】B【解析】对于①中,回归直线ˆˆˆybx a =+恒过样本点的中心(,)x y ,但不一定过一个样本点,所以不强化练习正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5y x =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的. 故选:B.2.(2021·全国高三专题练习)对两个变量x 、y 进行线性相关检验,得线性相关系数10.7859r =,对两个变量u 、v 进行线性相关检验,得线性相关系数20.9568r =-,则下列判断正确的是( ) A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强 B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强 C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v的线性相关性较强D .变量x 与y 负相关,变量u 与v 正相关,变量u 与v 的线性相关性较强 【答案】C【解析】由线性相关系数10.78590r =>知x 与y 正相关, 由线性相关系数20.95680r =-<知u 与v 负相关,又12r r <,所以,变量u 与v 的线性相关性比x 与y 的线性相关性强, 故选:C.3.(2021·河南新乡市·高三一模)2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区2019年11月至2020年11月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码113分别对应2019年11月2020年11月)根据散点图选择y a =+ln y c d x =+两个模型进行拟合,经过数据处理得到的两个回归方程分别为0.9369y =+0.95540.0306ln y x =+,并得到以下一些统计量的值:注:x 是样本数据中x 的平均数,y 是样本数据中y 的平均数,则下列说法不一定成立的是( ) A .当月在售二手房均价y 与月份代码x 呈正相关关系B .根据0.9369y =+2021年2月在售二手房均价约为1.0509万元/平方米C .曲线0.9369y =+0.95540.0306ln y x =+的图形经过点(),x yD .0.95540.0306ln y x =+回归曲线的拟合效果好于0.9369y =+ 【答案】C【解析】对于A ,散点从左下到右上分布,所以当月在售二手房均价y 与月份代码x 呈正相关关系,故A 正确;对于B ,令16x =,由0.9369 1.0509y =+=,所以可以预测2021年2月在售二手房均价约为1.0509万元/平方米,故B 正确; 对于C ,非线性回归曲线不一定经过(),x y ,故C 错误; 对于D ,2R 越大,拟合效果越好,故D 正确.故选:C.4.(2021·全国高三专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )A .24310r r r r <<<<B .42130r r r r <<<<C .42310r r r r <<<<D .24130r r r r <<<< 【答案】A【解析】由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0, 题图2和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以1r 接近于1,2r 接近于1-, 由此可得24310r r r r <<<<. 故选:A .5.(2021·邵阳市第二中学高三其他模拟(文))某种产品的广告费支出x 与销售额y (单位:万元)。
回归直线方程与独立性检验-讲义(学生版)
回归直线方程与独立性检验一、课堂目标1、明确建立回归模型的基本步骤、熟练运用线性回归模型解决非线性相关问题.2、能够运用独立性检验对两个分类变量是否线性相关作出判断.二、直击高考知识模块知识内容全国卷常见题型回归分析一元线性回归模型2020年全国三卷18题解答题回归直线方程独立性检验分类变量2020年全国二卷18题解答题三、知识讲解1. 回归分析知识回顾方法提升考点一:回归直线方程的求解对于一组具有线性相关关系的数据:,,,,,我们知道其回归直线的斜率和截距的最小二乘法估计分别为:其中,,称为样本点的中心,位于回归直线上.【思想方法与技巧】利用线性相关回归分析处理非线性问题:研究两个变量的关系是,我们常常根据样本生成点坐标在平面直角坐标系中作出散点图,观察散点图中样本点的分布.从整体看,如果样本点并没有分布在某一条直线附近,这两个变量之间不具有线性相关关系,也就是非线性相关关系.考点二:相关系数的求解对于变量与随机抽到的对数据,,,,,可以利用相关系数来衡量两个变量之间线性相关关系,样本相关系数的计算公式为:.【思想方法与技巧】利用相关系数评判结果如下:(1)时,表示两个变量正相关;(2)时,表示两个变量负相关;(3)越接近于,表明两个变量的线性相关程度越强;(4)越接近于,表明两个变量的线性相关程度越弱.高考链接1.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的个地块,从这些地块中用简单随机抽样的方法抽取个作为样区,调查得到样本数据,其中和分别表示第个样区的植物覆盖面积(单(1)(2)(3)位:公顷)和这种野生动物的数量,并计算得,,,,.附:相关系数,.求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数).求样本的相关系数(精确到).根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.(1)(2)2.下图是某地区年至年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据年至年的数据(时间变量的值依次为)建立模型①:.根据年至年的数据(时间变量的值依次为)建立模型②:.年份投资额分别利用这两个模型,求该地区年的环境基础设施投资额的预测值.你认为用哪个模型得到的预测值更可靠?并说明理由.3.下图是我国年至年生活垃圾无害化处理量(单位:亿吨)的折线图(1)(2)年份代码年生活垃圾无害化处理量注:年份代码分别对应年亿吨参考数据:,,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明.建立关于的回归方程(系数精确到),预测年我国生活垃圾无害化处理量.方法应用4.随着互联网的兴起,越来越多的人选择网上购物.某购物平台为了吸引顾客提升销售额,每年双十一都会进行某种商品的促销活动,该商品促销活动规则如下:①“价由客定”,即所有参与该商品促销活动的人进行网络报价,每个人并不知晓其他人的报价也不知道参与该商品促销活动的总人数;②报价时间截止后,系统根据当年双十一该商品数量配额,按照参与该商品促销活动人员的报价从高到低分配名额;③每人限购一件,且参与人员分配到名额时必须购买,某位顾客拟参加年双十一该商品促销活动,他为了预测该商品最低成交价,根据该购物平台的公告统计了最近年双十一参与该商品促销活动的人数(见表):年份年份编号参与人数(百万人)12(2)由收集数据的散点图发现,可用线性回归模拟拟合参与人数(百万人)与年份编号之间的相关关系.请用最小二乘法求关于的线性回归方程:,并预测年双十一参与该商品促销活动的人数.该购物平台调研部门对位拟参与年双十一该商品促销活动人员的报价价格进行了一个抽样调查,得到如下的一份频数表:报价区间(千元)频数求这位参与人员报价的平均值和样本方差(同一区间的报价可用该价格区间的中点值代替).假设所有参与该商品促销活动人员的报价可视为服从正态分布且与可分别由①中所求的样本平均值和样本方差估值,若预计年双十一该商品最终销售量为,请你合理预测(需说明理由)该商品的最低成交价.参考公式及数据()回归方程:,其中,.(),,.()若随机变量服从正态分布,则,,.5.我国全面二孩政策已于年月日起正式实施,国家统计局发布的数据显示,从年到年,中国的人口自然增长率变化始终不大,在上下波动(如图).中国内地总人口和自然增长率总人口自然增长率出生率(万人)为了了解年龄介于岁至岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为组,每组选取对夫妻进行调查,统计有生育二孩意愿的夫妻数,得到下表:‰(1)(2)有意愿数(参考数据和公式:,,,,,)设每个年龄区间的中间值为 ,有意愿数为,求样本数据的线性回归直线方程,并求该模型的相关系数(结果保留两位小数).从,,,,这五个年龄段中各选出一对夫妻(能代表该年龄段超过半数夫妻的意愿)进一步调研,再从这对夫妻中任选对夫妻,设其中不愿意生育二孩的夫妻数为,求的分布列和数学期望.(1)(2)6.某小区为了调查居民的生活水平,随机从小区住户中抽取个家庭,得到数据如下:家庭编号月收入(千元)月支出(千元)参考公式:回归直线的方程是:,其中,,.据题中数据,求月支出(千元)关于月收入(千元)的线性回归方程(保留一位小数);从这个家庭中随机抽取个,记月支出超过千家庭个数为,求的分布列与数学期望.7.如表中的数据是一次阶段性考试某班的数学、物理原始成绩:学号数学物理学号数学(1)(2)(3)理用这人的两科成绩制作如下散点图:物理数学学号为号的同学由于严重感冒导致物理考试发挥失常,学号为号的同学因故未能参加物理学科的考试,为了使分析结果更客观准确,老师将、两同学的成绩(对应于图中、两点)剔除后,用剩下的个同学的数据作分析,计算得到下列统计指标:数学学科平均分为,标准差为,物理学科的平均分为,标准差为,数学成绩与物理成绩的相关系数为,回归直线(如图所示)的方程为.若不剔除、两同学的数据,用全部的成绩作回归分析,设数学成绩与物理成绩的相关系数为,回归直线为,试分析与的大小关系,并在图中画出回归直线的大致位置.如果同学参加了这次物理考试,估计同学的物理分数(精确到个位).就这次考试而言,学号为号的同学数学与物理哪个学科成绩要好一些?(通常为了比较某个学生不同学科的成绩水平可按公式统一化成标准分再进行比较,其中为学科原始分,为学科平均分,为学科标准差).(1)(2)8.已知某校个学生的数学和物理成绩如下表:学生的编号数学物理若在本次考试中,规定数学在分以上(包括分)且物理在分以上(包括分)的学生为理科小能手.从这个学生中抽出个学生,设表示理科小能手的人数,求的分布列和数学期望.通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用表示数学成绩,用表示物理成绩,求与的回归方程.参考公式:,其中,.(1)(2)某调查机构为了了解某产品年产量(吨)对价格(千元/吨)和利润的影响,对近五年该产品的年产量和价格统计如下表:求关于的线性回归方程若每吨该产品的成本为千元,假设该产品可全部卖出,预测当年产量为多少时,年利润取到最大值?参考公式:,.(1)(2)10.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间进行分析研究,他们分别记录了月日至月日的每天昼夜温差与实验室每天每棵种子中的发芽数,得到如下资料:日期月日月日月日月日月日温差摄氏度发芽颗该农科所确定的研究方案是:先从这组数据中选取组数据求线性回归方程,再用剩下的组数据进行检验.若选取的组数据恰好是连续天的数据(表示数据来自互不相邻的三天),求的分布列及期望.根据月日至日数据,求出发芽数关于温差的线性回归方程.由所求得线性回归方程得到的估计数据与剩下的检验数据的误差均不超过颗,则认为得到的线性回归方程是可靠的,试问所得的线性回归方程是否可靠?附:参考公式:,.(1)11.在年俄罗斯世界杯期间,莫斯科的部分餐厅经营了来自中国的小龙虾,这些小龙虾均标有等级代码,为得到小龙虾等级代码数值与销售单价之间的关系,经统计得到如下数据:等级代码数值销售单价(元)已知销售单价与等级代码数值之间存在线性相关关系,求关于的线性回归方程(系数精(2)若莫斯科某个餐厅打算从上表的种等级的中国小龙虾中随机选种进行促销,记被选中的种等级代码数值在以下(不含)的数量为,求的分布列及数学期望.参考公式:对一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为:,.(1)(2)12.某动漫影视制作公司长期坚持文化自信,不断挖掘中华优秀传统文化中的动漫题材,创作出一批又一批的优秀动漫影视作品,获得市场和广大观众的一致好评,同时也为公司赢得丰厚的利润.该公司年至年的年利润关于年份代号的统计数据如下表(已知该公司的年利润与年份代号线性相关):年份年份代号年利润(单位:亿元)求关于的线性回归方程,并预测该公司年(年份代号记为)的年利润.当统计表中某年年利润的实际值大于由()中线性回归方程计算出该年利润的估计值时,称该年为级利润年,否则称为级利润年.将()中预测的该公司年的年利润视作该年利润的实际值,现从年至年这年中随机抽取年,求恰有年为级利润年的概率.参考公式:,.2. 独立性检验知识回顾方法提升考点:独立性检验求解步骤(1)准确作出列联表;(2)统计假设成立;(3)计算;(4)将上一步计算得到的观测值与临界值比较,从而接收或拒绝假设.【思想方法与技巧】1、在列联表中,越小,说明两个分类变量之间关系越弱;越大,说明两个分类变量之间关系越强.2、(1)制作列联表时要注意表中相关数据的位置及对应,避免出错;(2)作的列联表的独立性检验时,要求表中的个数据都要大于,因此,在选取样本容量时一定要注意.高考链接13.某学生兴趣小组随机调查了某市天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)(2)(3)锻炼人次空气质量等级(优)(良)(轻度污染)(中度污染)分别估计该市一天的空气质量等级为,,,的概率.求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表).若某天的空气质量等级为或,则称这天“空气质量好”;若某天的空气质量等级为或,则称这天“空气质量不好”.根据所给数据,完成下面的列联表;并根据列联表,判断是否有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次人次空气质量好空气质量不好附:.第一种生产方式第二种生产方式14.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取名工人,将他们随机分成两组,每组人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:)绘制了如下茎叶图:(1)(2)(3)根据茎叶图判断哪种生产方式的效率更高?并说明理由.求名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:超过不超过第一种生产方式第二种生产方式根据()中的列联表,能否有的把握认为两种生产方式的效率有差异?附:,(1)(2)(3)15.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取个网箱,测量各箱水产品的产量(单位:),其频率直方图如下:频率组距箱产量旧养殖法频率组距箱产量新养殖法附:.设两种养殖方法的箱产量相互独立,记表示事件:旧养殖法的箱产量低于, 新养殖法的箱产量不低于,估计的概率.填写下面列联表,并根据列联表判断是否有的把握认为箱产量与养殖方法有关.箱产量箱产量旧养殖法新养殖法根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到).方法应用(1)(2)(3)16.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区名患者的相关信息,得到如下表格:潜伏期(单位:天)人数求这名患者的潜伏期的样本平均数(同一组中的数据用该组区间的中点值作代表).该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过天为标准进行分层抽样,从上述名患者中抽取人,得到如下列联表.请将列联表补充完整,并根据列联表判断是否有的把握认为潜伏期与患者年龄有关.潜伏期天潜伏期天总计岁以上(含岁)岁以下总计附:,其中.以这名患者的潜伏期超过天的频率,代替该地区名患者潜伏期超过天发生的概率,每名患者的潜伏期是否超过天相互独立.为了深入研究,该研究团队随机调查了名患者,其中潜伏期超过天的人数最有可能(即概率最大)是多少?17.为了提高生产效益,某企业引进了一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取件产品进行质量检测,所有产品质量指标值均在以内,规定质量指标值大于的产品为优质品,质量指标值在的产品为合格品.旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标值如频数分布表所示.(1)(2)(3)频率组距质量指标值质量指标值频数合计请分别估计新、旧设备所生产的产品的优质品率.优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高.根据已知图表数据填写下面列联表(单位:件),并判断是否有的把握认为“产品质量高与新设备有关”.非优质品优质品合计新设备产品旧设备产品合计附:,其中.用频率代替概率,从新设备所生产的产品中随机抽取件产品,其中优质品数为件,求的分布列及数学期望.18.冬天的北方室外温度极低,若轻薄保暖的石墨烯发热膜能用在衣服上,可爱的医务工作者行动会更方便,石墨烯发热膜的制作:从石墨中分离出石墨烯,制成石墨烯发热膜,从石墨分离石墨烯的一(1)(2)种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶,现在有材料,材料供选择,研究人员对附着在材料,材料上再结晶各做了次试验,得到如下等高条形图.材料试验结果材料试验结果石墨烯再结晶试验试验成功试验失败根据上面的等高条形图,填写如下列联表,判断是否有的把握认为试验成功与材料有关.材料材料合计成功不成功合计研究人员得到石墨烯后,再制作石墨烯发热膜有三个环节:①透明基底及胶层,②石墨烯层,③表面封装层,第一,二环节生产合格的概率均为,第三个环节生产合格的概率为,且各生产环节相互独立,已知生产吨的石墨烯发热膜的固定成本为万元,若生产不合格还需进行修复,第三个环节的修复费用为元,其余环节修复费用均为元.如何定价,才能实现每生产吨石墨烯发热膜获利可达万元以上的目标.附:参考公式:,其中.19.由团中央学校部、全国学联秘书处、中国青年报社共同举办的年度全国“最美中学生”寻访活动结果出炉啦,此项活动于年月启动,面向全国中学在校学生,通过投票方式寻访一批在热爱祖国、勤奋学习、热心助人、见义勇为等方面表现突出、自觉树立和践行社会主义核心价值观的“最美中学生”.现随机抽取了名学生的票数,绘成如图所示的茎叶图,若规定票数在票以上(包括票)定义为风华组.票数在票以下(不包括票)的学生定义为青春组.(1)(2)(3)在这名学生中,青春组学生中有男生人,风华组学生中有女生人,试问有没有的把握认为票数分在青春组或风华组与性别有关.如果用分层抽样的方法从青春组和风华组中抽取人,再从这人中随机抽取人,那么至少有人在青春组的概率是多少?用样本估计总体,把频率作为概率,若从该地区所有的中学(人数很多)中随机选取人,用表示所选人中青春组的人数,试写出的分布列,并求出的数学期望.附:;其中,独立性检验临界表:(1)(2)(3)20.为了保障全国第四次经济普查顺利进行,国家统计局从东部选择江苏,从中部选择河北、湖北,从西部选择宁夏,从直辖市中选择重庆作为国家综合试点地区,然后再逐级确定普查区域,直到基层的普查小区.在普查过程中首先要进行宣传培训,然后确定对象,最后入户登记.由于种种情况可能会导致入户登记不够顺利,这为正式普查提供了宝贵的试点经验.在某普查小区,共有家企事业单位,家个体经营户,普查情况如下表所示:普查对象类型顺利不顺利合计企事业单位个体经营户合计写出选择个国家综合试点地区采用的抽样方法.根据列联表判断是否有的把握认为“此普查小区的入户登记是否顺利与普查对象的类别有关”.以频率作为概率,某普查小组从该小区随机选择家企事业单位,家个体经营户作为普查对象,入户登记顺利的对象数记为,写出的分布列,并求的期望值.附:.(1)(2)(3)21.黄冈市有很多名优土特产,黄冈市的蕲春县就有闻名于世的“蕲春四宝”(蕲竹、蕲艾、蕲蛇、蕲龟),很多人慕名而来旅游,通过随机询问名不同性别的游客在购买“蕲春四宝”时是否在来蕲春县之前就知道“蕲春四宝”,得到如下列联表:男女总计事先知道“蕲春四宝”事先不知道“蕲春四宝”总计附:.写出列联表中各字母代表的数字.由以上列联表判断,能否在犯错误的概率不超过的前提下认为购买“蕲春四宝”和是否“事先知道’蕲春四宝’有关系”?从被询问的名事先知道“蕲春四宝”的顾客中随机选取名顾客,求抽到的女顾客人数的分布列及其数学期望.(1)22.在一次爱心捐款活动中,小李为了了解捐款数额是否和居民自身的经济收入有关,随机调查了某地区的个捐款居民每月平均的经济收入.在捐款超过元的居民中,每月平均的经济收入没有达到元的有个,达到元的有个;在捐款不超过元的居民中,每月平均的经济收入没有达到元的有个.参考数据当时,无充分证据判定变量,有关联,可以认为两变量无关联;当时,有的把握判定变量,有关联;当时,有的把握判定变量,有关联;当时,有的把握判定变量,有关联.附:,其中.在下图表格空白处填写正确数字,并说明是否有以上的把握认为捐款数额是否超过元和居民每月平均的经济收入是否达到元有关?每月平均经济收入达到元每月平均经济收入没有达到元合计捐款超过元 捐款不超过元(2)合计将上述调查所得到的频率视为概率.现在从该地区大量居民中,采用随机抽样方法每次抽取个居民,共抽取次,记被抽取的个居民中经济收入达到元的人数为,求和期望的值.(1)(2)23.2016年月日,“国际教育信息化大会”在山东青岛开幕.为了解哪些人更关注“国际教育信息化大会”,某机构随机抽取了年龄在岁之间的人进行调查,某机构随机抽取了在之间的人进行调查,经统计“青少年”与“中老年”的人数之比为.根据已知条件完成下面的列联表,并判断能否有的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”.关注不关注合计青少年中老年合计现从抽取的青少年中采取分层抽样的办法选取人进行问卷调查,在这人中再选取人进行面对面询问,记选取的人中关注“国际教育信息化大会”的人数为,求的分布列及数学期望.附:参考公式:,其中.临界值表:(1)(2)24.为了研究家用轿车在高速公路上的车速情况,交通部门对名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在名男性驾驶员中,平均车速超过的有人,不超过的有人.在名女性驾驶员中,平均车速超过的有人,不超过的有人.完成下面的列联表,并判断是否有的把握认为平均车速超过的人与性别有关.平均车速超过人数平均车速不超过人数合计男性驾驶员人数 女性驾驶员人数合计以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取辆,记这辆车中驾驶员为男性且车速超过的车辆数为,若每次抽取的结果是相互独立的,求的分布列和数学期望.参考公式与数据:,其中,对服务满意对服务不满意合计对商品满意 对商品不满意合计(1)(2)25.近年来,我国电子商务蓬勃发展.年“”期间,某网购平台的销售业绩高达亿元人民币,与此同时,相关管理部门推出了针对该网购平台的商品和服务的评价系统.从该评价系统中选出次成功交易,并对其评价进行统计,网购者对商品的满意率为,对服务的满意率为,其中对商品和服务都满意的交易为次.根据已知条件完成下面的列联表,并回答能否有的把握认为“网购者对商品满意与对服务满意之间有关系”?若将频率视为概率,某人在该网购平台上进行的次购物中,设对商品和服务都满意的次数为随机变量,求的分布列和数学期望.附:(其中为样本容量)26.万众瞩目的第届全国冬季运动运会(简称“十四冬”)于年月日在呼伦贝尔市盛大开幕,期间正值我市学校放寒假,寒假结束后,某校工会对全校名教职工在“十四冬”期间每天收看比赛转播的时间作了一次调查,得到如图频数分布直方图:。
数学必修3知识导引 2.4线性回归方程 含解析 精品
6.4线性回归方程案例探究在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?分析:凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素.例如,是否喜欢物理,用在物理学习上的时间等等.在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.例如,圆的面积S与半径r 之间就是确定性函数关系,可以用函数S=πr2表示.一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.例如,人的体重与身高有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.自学导引1.在实际问题中,变量之间的常见关系有两类:一类是确定性关系,另一类是相关关系.2.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.3.请你说出确定性关系与相关关系的相同点和不同点.答案:相同点:均是指两个变量的关系.不同点:相关关系是一种非确定的关系.确定性关系是自变量与函数值之间的关系,可以用一个函数表示.这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.这种关系不能用一个确定的函数来表示.4.你是否还能举出一些现实生活中存在的相关关系的问题?答案:例如,商品销售收入与广告支出经费之间的关系;粮食产量与施肥量之间的关系;人体的脂肪含量与年龄之间的关系,等等.5.将n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.6.(1)当两个变量成正相关时,散点图有什么特点?(2)当两个变量成负相关时,散点图又有什么特点?答案:(1)散点图中的点散布在从左下角到右上角的区域.(2)散点图中的点散布在从左上角到右下角的区域.7.对于散点图可以作出如下判断:(1)当所有的样本点都落在某一函数曲线上,变量之间具有函数关系;(2)当所有的样本点都落在某一函数曲线附近,变量之间具有相关关系;(3)当所有的样本点都落在某一直线附近,变量之间具有线性相关关系.8.回归直线是怎样定义的?答案:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.疑难剖析【例1】 下表是某地年降雨量与年平均气温的统计数据,判断两变量有相关关系吗?求回归直线方程有意义吗?思路分析:用回归直线进行拟合两变量关系的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,以公式求出a, b ,并写出线性回归方程.解:以x 轴为年平均气温,y 轴为年降雨量可得相应的散点图:因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没有必要用回归直线进行拟合,用公式求得的回归方程也是没有意义的.思维启示:要判断两个变量是否具有线性相关关系,可先作出散点图,再观察散点是否在一条直线附近,如果是,则二者具有线性相关关系;否则,二者不具有线性相关关系. 思维陷阱:解此题的第(2)小问时不要盲目地去求回归方程.观察两相关变量得如下数据:求两变量间的回归方程.错解:求线性回归直线方程的步骤: 第一步:列表x i ,y i ,x i y i ; 第二步:计算x ,y,∑=ni ix12,∑=ni iy12,∑=ni ii yx 1;第三步:代入公式计算b, a 的值; 第四步:写出回归直线方程.列表:计算得:x =0, y =0∑=1012i ix=110,∑=1012i iy=310,∑=101i ii yx =110∴b=1010110010110)(101021012101=*-*-=--∑∑==x x yx yx i i i iia=y -b x =0-1*0=0故所求回归直线方程为yˆ=x. 正解:作两个变量的散点图(图略),从散点图中看出,点不在某条直线附近,分散得很开.因此,变量x 和y 不具有线性相关关系,也就不存在线性回归方程.【例2】 某班学生每周用于数学学习的时间x (单位:h )与数学成绩y (单位:分)之间有如下数据:某同学每周用于数学学习的时间为18小时,试预测该生数学成绩. 思路分析:首先应该利用表中数据通过计算去判断数学学习的时间x 与数学成绩y 是否具有线性相关关系.若有,则可求出回归方程;然后在方程中令x=18,可求出该生数学成绩.解:因为学习时间与学习成绩之间具有线性相关关系.利用科学计算器计算到如下表所示的数据:于是可得b=53.34.1544.545)(101021012101≈=--∑∑==x xyx yx i ii iia=y -b x =74.9-3.53×17.4≈13.5 故所求回归直线方程为y=3.53x+13.5当x=18时,yˆ=3.53×18+13.5=77.04≈77 故该同学预计可得77分左右.思维启示:两个有线性相关关系的变量间的关系可以用线性回归方程来表示,而对总体的预测可依据回归直线方程进行.【例3】 一般说,一个人的身高越高,他的手就越大.为了调查这一问题,对10名高三男生的身高与右手一揸长测量得如下数据:(单位:cm )(1)依据上述数据制作散点图,发现两者有何相关关系吗? (2)如果近似成线性关系,求线性回归方程.(3)如果一个学生身高185 cm ,估计他的右手一揸长.思路分析:首先作出散点图;利用散点图去判断两变量是否具有线性关系;若具有线性关系,再利用公式求出方程;最后利用方程去解答第三小问.解:(1)散点图如下:可见,身高与右手一揸长之间的总体趋势成一条直线,即他们线性相关.(2)设线性回归方程为yˆ=bx+a 由上述数据计算可得x =174.8, y =21.7∑=1012i ix=305 730,∑=101i ii yx =37 986∴b=21012101)(1010x xyx yx i ii ii--∑∑===303.08.174107303057.218.17410986372≈⨯-⨯⨯- a=y -b x =-31.264∴方程为yˆ=0.303x-31.264. (3)当x=185时, yˆ=24.79. 思维启示:先作出散点图,若两变量具有线性关系,再利用公式求出方程.拓展迁移【拓展点1】 如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x 轴的变量为__________. 答案:播放次数【拓展点2】 有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第一列表示此种食品所含热量的百分比,第二列数据表示由一些美食家以百分制给出的对此种食品口味的评价.(1)求出回归直线方程;(2)关于两个变量之间的关系,得出的结论是什么?答案:(1) yˆ=1.565x+37.827 (2)由回归方程知道,食品所含热量越大,口味记录越好,反之亦然.【拓展点3】 某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:(1)作出散点图;(2)如果y与x之间具有线性相关关系,求回归方程;(3)估计尿汞含量为9毫克/升时消光系数.答案:(1)散点图略.(2)由散点图可知y与x线性相关.设回归方程为yˆ=bx+A.计算可得回归方程为yˆ=36.95x-11.3.(3)当x=9时,yˆ=36.95×9-11.3=321.25≈321。
高中数学2.4线性回归方程 PPT课件 图文
i=1
∴回归直线方程为y^=1.143x+0.571.
课前探究学习
课堂讲练互动
活页规范训练
题型三 利用回归直线对总体进行估计 【例3】 (14分)下表提供了某厂节能降耗技术改造后生产甲 产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几 组对照数据.
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小平方法求出y关于x的线
即最贴近已知的数据点,最能代表变量x与y之间的关系.
课前探究学习
课堂讲练互动
活页规范训练
(2)利用回归直线对总体进行估计 利用回归直线,我们可以进行预测,若回归直线方程为:y^= bx+a,则 x=x0 处的估计值为:y^=bx0+a.
课前探究学习
课堂讲练互动
活页规范训练
题型一 相关关系的判断 【例1】 下列两个变量之间的关系中,①角度和它的余弦 值;②正方形的边长和面积;③正n边形的边数和其内角度数之 和;④人的年龄和身高.不是函数关系的是________.(填序号) [思路探索] 函数关系是一种变量之间确定性的关系.而相 关关系是非确定性关系. 解析 选项①②③都是函数关系,可以写出它们的函数表 达式:f(θ)=cos θ,g(a)=a2,h(n)=nπ-2π,④不是函数关系, 对于相同年龄的人群中,仍可以有不同身高的人. 答案 ④
xi2-n x 2
n
xi- x 2
i=1
i=1
a= y -b x .
想一想:1.相关关系是不是都为线性关系? 提示 不是.有些变量间的相关关系是非线性相关的. 2.散点图只描述具有相关关系的两个变量所对应点的图形吗? 提示 不是.两个变量统计数据所对应的点的图形都是散点图.
高中数学:2.4《线性回归方程课件》课件(苏教版必修三)
Part
02
线性回归方程的建立与求解
线性回归方程的建立方法
STEP 01
散点图观察
STEP 02
确定回归系数
通过绘制散点图,观察自 变量与因变量之间的关系 ,初步判断是否具有线性 关系。
STEP 03
检验残差
通过观察残差图或计算残 差平方和,检验模型的拟 合效果,判断是否需要进 一步调整模型。
根据最小二乘法原理,通 过计算得到回归系数,从 而确定线性回归方程的斜 率和截距。
以是( )
习题
A. ŷ = 1.23x + 4 B. ŷ = 1.23x + 5
C. ŷ = 1.23x + 4.5 D. ŷ = 1.23x + 3
3、题目:已知回归直线的斜率的估计值是1.23,且样本点的中心为(4,5),则回归直线的方 程可以是( )
习题
01
A. ŷ = 1.23x + 4 B. ŷ = 1.23x +5
预测性
利用线性回归方程可以对 未知数据进行预测。
线性回归方程的应用场景
经济预测
科学实验
通过对历史数据的分析,利用线性回 归方程预测未来经济指标的变化趋势 。
在科学实验中,通过控制变量法来研 究自变量和因变量之间的线性关系, 并利用线性回归方程进行数据分析。
销售预测
根据历史销售数据和市场调查,利用 线性回归方程预测未来产品的销售情 况。
增加自变量
增加自变量可以更好地解释因变 量的变化,从而优化线性回归方 程。
调整模型形式
根据实际情况调整模型形式,可 以更好地拟合数据,从而优化线 性回归方程。
Part
04
线性回归方程的实例分析
高中数学第2章统计2.4线性回归方程课件
判断两个变量是否具有相关关系,主要有两种方法: 一是根据相关关系的定义进行判断,看这两个变量是否具 有不确定性.二是利用散点图,看散点图中的点是否都落 在某一函数曲线附近.
[活学活用]
关于人体的脂肪含量(百分比)与年龄关系的研究中,得到 如下一组数据:
年龄
23
27
39
41
45
49
50
53
脂肪
9.5
2.散点图 (1)概念:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在 平面直角坐标系中,用来表示两个变量的一组数据的图形叫做 散点图. (2)作法:建立平面直角坐标系,用横坐标表示一个变量, 用纵坐标表示另一个变量,将给出的数据所表示的点在坐标系 内描出,即可得到散点图.
[点睛] 对于散点图要注意以下几点. ①若所有的样本点都落在某一函数曲线上,则变量间具有 函数关系. ②若所有的样本点都落在某一函数曲线附近,则变量间就 具有相关关系. ③若散点图中的点的分布没有什么规律,则这两变量之间 不具有相关关系,它们之间是相互独立的.
5
5
975, xiyi=12 952.
i=1
5
i=1
x- y xiyi-5- -2 x2 i -5 x
5
b=
12 952-5× 109× 23.2 154 = = ≈0.196 2, 785 60 975-5× 1092
a=- y - b- x =23.2-0.196 2×109≈1.814 2. ∴回归直线方程为^ y =0.196 2x+1.814 2. (3)当x=96时,^ y ≈20.6. 2 因此,96 m 的新房屋大约为20.6万元.
(3)当x=10时,^ y =1.23× 10+0.08=12.38, 所以估计使用10年时维修费用是12.38万元. (4)由线性回归方程知,使用年限每增加一年维修费用就 提高1.23万元.
第22讲线性回归方程讲义-高三艺考数学一轮复习
第22讲:线性回归方程【课型】复习课【教学目标】1.了解相关关系、散点图,会判断两变量是否成线性相关关系2.能利用最小二乘法求线性回归方程的两个系数【预习清单】【基础知识梳理】1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. :在一个统计数表中,为了更清楚地看出x 和y 是否具有相关关系,常将x 的取值作为横坐标,将y 的相应取值作为纵坐标,在直角坐标中描点(xi ,yi )(i =1,2,…,n),这样的图形叫做散点图.3.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)回归方程为y =b x +a ,其中b =∑n i =1x i y i -n x -·y -∑n i =1x 2i-n x -2,a =y --b x -. (4)注意:①自变量x 每增加1个单位,函数值平均增加或减少b 个单位。
②所以线性回归方程均过点(x -,y -).(x -,y -)称为样本中心点。
【引导清单】考向一:相关关系的判断例1:已知变量x 和y 满足关系yx +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关【解析】因为yx +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =by +a ,b >0,则z =by +abx +b +a ,故x 与z 负相关.考向二:线性回归方程及其应用例2:已知具有相关关系的两个变量x ,y 的几组数据如下表所示:x 2 4 6 8 10y 3 6 7 10 12(1)请根据上表数据在网络纸中绘制散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =b x +a ,并估计当x =20时y 的值.参考公式:b =∑n i =1x i y i -n x - y -∑n i =1x 2i-n x -2,a =y --b x -.【解】(1)散点图如图所示:(2)依题意x -=15×(2+4+6+8+10)=6,y -=15×,∑=51i x i 2=4+16+36+64+100=220,∑=51i x i y i =6+24+42+80+120=272,b ^=∑5i =1x i y i -5x -y -∑5i =1x 2i -5x -2=272-5×6×220-5×62=4440,所以a ^×y ^x +1,故当x =20时,y =23. 【训练清单】【变式训练1】对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,4,5),得表1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,4,5),得表2.由这两个表可以判断( ) x 与y 正相关,u 与v 正相关 B .变量x 与y 负相关,u 与v 正相关 C .变量x 与y 负相关,u 与v 负相关D .变量x 与y 正相关,u 与v 负相关【解析】选D.由题可知,随着x 的增大,对应的y 值增大,其散点图呈上升趋势,故x 与y 正相关;随着u 的增大,v 减小,其散点图呈下降趋势,故u 与v 负相关.【变式训练2】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,计算得∑=101i i x =80,∑=101i i y =20,ii i y x ∑=101=184,∑=1012i i x y 关于月收入x 的线性回归方程为y =b x +a ,(1)判断变量x 与y 正相关还是负相关(2)y 关于x 的线性回归方程y =b x +a ,若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是多少千元?【解析】(1)由题意,知n =10,x =110∑=101i i x =8,y =110∑=101i i y =2,∴b ^=184-10×8×2720-10×82=0.3,a ^×8=-0.4,∴y ^x -0.4,∵0.3>0,∴变量x 与y 正相关.(2)当x =7时,y ^×7-0.4=1.7(千元).【巩固清单】( )【解析】球的表面积与体积是函数关系.2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( )A.y =-10x +200B.y =10x +200C.y =-10x -200D.y =10x -200x 1 2 3 4 5 y u 1 2 3 4 5 v 25 20 21 15 13【解析】选A.因为商品销售量y (件)与销售价格x (元/件)负相关,所以b ^<0,排除B ,D.又因为x =0时,y >0,所以应选A.3.下列四个散点图中,变量x 与y 之间具有负的线性相关关系的是( )【解析】观察散点图可知,只有D 选项的散点图表示的是变量x 与y 之间具有负的线性相关关系.4.改革开放以来,我国教育事业发展迅速,某省把近10年来农村、县城、地级市和省城每年考入大学的百分比作为因变量,把年份x 作为自变量得到四条回归直线.省城y x ,地级市y x ,县城y x ,农村y x ,则四个区域中,大学入学率年增长率最快的区域是( )A .省城B .地级市C .县城D .农村【解析】四条回归直线,斜率最大的是省城,故选A.5.对于下列表格所示的五个散点,已知求得的回归直线方程为y xm 的值为( )A.8 C .8.4【解析】依题意得x -=15×(196+197+200+203+204)=200,y -=15×(1+3+6+7+m )=17+m 5,因为回归直线必经过样本点的中心,所以17+m 5×200-155,解得m =8.6.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b ,a =y --b x -.据此估计,该社区一户年收入为15万元家庭的年支出为( )万元 B .万元 万元 D .万元【解析】 由题意知,x =85=10,y -=错误!=8,所以错误!×,所以当x =15时,y ^×15+0.4=11.8(万元).7.经调查某地若干户家庭的年收入x (万元)和年饮食支出y (万元)具有线性相关关系,并得到y 关于x 的回归直线方程:y x ,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】x 变为x +1,y ,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.8.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^x +a^,则a ^=________. x 0 1 3 4y【解析】由已知得x =2,y ,因为回归方程经过点(x ,y ),所以a ×2=2.6.9.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,x 196 197 200 203 204 y 1 3 6 7 m收入x (万元) 支出y (万元)y i )(i =1,2,…,6)都在曲线y =bx 2-13附近波动.经计算∑6i =1x i =11,∑6i =1y i =13,∑6i =1x 2i =21,则实数b 的值为________.【解析】令t =x 2,则曲线的回归方程变为线性的回归方程,即y =bt -13,此时t=∑6i =1x 2i 6=72,y =∑6i =1y i 6=136,代入y =bt -13,得136=b ×72-13,解得b =57. 10(1)求y (2)利用(1)中的回归方程,预测t =8时,细菌繁殖个数.【解析】 (1)由表中数据计算得,t -=5,y -=4,5.8))((t 51i i =--∑=y y t i,10)(t 251i i =-∑=t ,85.0105.8)(t))((t 251i i 51i i ==---=∑∑==t y y t b i ,a =y --b t -=-0.25. 所以回归方程为y ^t -0.25.(2)将t =8代入(1)的回归方程中得y ^×t =8时,细菌繁殖个数为6.55千个.。
苏教版高中数学必修三《2.4线性回归方程》课件
人口/亿 0.6 0.6 2 4.1 4.7 5.4 10.3 11.6
Hale Waihona Puke (2)年份与人口是相关关系吗?如果是,是正相关还是负相关?你觉得用 什么函数模型模拟效果比较好? 解答
由图可知,我国在1000年到2000年间的人口数量与年份是相关关系,且 为正相关.因为增长速度越来越快, 用指数模型模拟效果比较合适.
思考1
若散点大致分布在一条直线附近,如何确定这条直线比较合理?
答案
应该使散点整体上最接近这条直线.
思考2
任何一组数据都可以由最小二乘法得出线性回归方程吗? 答案
用最小二乘法求线性回归方程的前提是先判断所给数据是否具 有线性相关关系(可利用散点图来判断),否则求出的线性回归 方程是无意义的.
梳理
线性回归方程: 能用直线方程 y^=bx+a 近似表示的相关关系叫做 线性相关 关系,该方 程叫 线性回归方程 . 最小平方法是一种求回归直线的方法,用这种方法求得的回归直线能使 样本数据的点到回归直线的距离的平方和最小.
机动车辆数x/103辆 95 110 112 120 129 135 150 180 交通事故数y/103件 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13
反思与感悟
对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线 形,若呈直线形,再依系数 a,b 的计算公式,算出 a,b.求 a,b 时,先 计算平均数 x ,y ;接着计算 xi 与 yi 的积,然后求∑xiyi 及∑x2i ;最后将结 果代入公式求 b;用 a= y -b x 求 a.
跟踪训练3 下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果, y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.
高中数学人教A版必修三2.3.2《线性回归方程》课件
2、回归直线方程
定义:一般地,设x与y是具有相关关系的两个变量,且相应 于n组观测值的n个点(xi,yi)(i=1,2,…,n)大致分布在 一条直线附近,求在整体上与这n个最接近的一条直线.设此直 线方程为y^=bx+a.
这里在y的上方加记号“^”,是为了区分实际值y,表示当 x取值xi(i=1,2,…n)时,y相应的观察值为yi,而直线上对 应于xi的纵坐标是yi^=bxi+a. y^=bx+a叫做y对x的回归直线方 程,a、b叫做回归系数.
2.3 变量间的相关关系
2.3.2 线性回归方程
本课主要学习变量间的相关关系的相关内容,具体 包括线性回归方程的求解。
本课开始回顾了上节课所学变量间的相关关系与散 点图的相关内容,紧接着引入回归直线的定义及特征, 回归直线方程的定义及求法(最小二乘法),并且通过 例题和习题进行讲解。最后通过习题进行加深巩固。
有部分课件由于控制文件大小,内容不完整,请联系购买完整版
1. 理解线性回归。 2. 了解回归直线方程的求解方法。
(1)如果所有的样本点都落在某一函数曲线上,就用该函数来 描述变量之间的关系,即变量之间具有函数关系.
(2)如果所有的样本点都落在某一函数曲线附近,变量之间就 有相关关系。
(3)如果所有的样本点都落在某一直线附近,变量之间就 有线性相关关系 .
y 水稻产量
500
450
400
350
(施化肥量)
300
10 20
30
40
50
x
3、最小二乘法
假设我们已经得到两个具有线性相关的变量的一组数 据(x1,y1),(x2,y2),…(xn,yn).
n
n
(xi x)( yi y)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考线性回归方程地总结第二讲 线性回归方程一、相关关系:1、⎩⎨⎧<=1||1||r r 不确定关系:相关关系确定关系:函数关系2、相关系数:∑∑∑===-⋅---=ni ini ini iiy y x x y y x x r 12121)()())((,其中:(1)⎩⎨⎧<>负相关正相关00r r ;(2)相关性很弱;相关性很强;3.0||75.0||<>r r例题1:下列两个变量具有相关关系的是( )A.正方形的体积与棱长;B.匀速行驶的车辆的行驶距离与行驶时间;C.人的身高和体重;D.人的身高与视力。
例题2:在一组样本数据),,,2)(,(),,(),,(212211不全相等n n n x x x n y x y x y x ΛΛ≥的散点图中,若所有样本点),2,1)(,(n i y x i i Λ=都在直线121+-=x y 上,则样本相关系数为( )21.21.1.1.--D C B A 例题3:r 是相关系数,则下列命题正确的是:(1)]75.0,1[--∈r 时,两个变量负相关很强;(2)]1,75.0[∈r 时,两个变量正相关很强;(3))75.0,3.0[]3.0,75.0(或--∈r 时,两个变量相关性一般; (4)(4)1.0=r 时,两个变量相关性很弱。
3、散点图:初步判断两个变量的相关关系。
例题4:在画两个变量的散点图时,下列叙述正确的是( ) A.预报变量在x 轴上,解释变量在y 轴上; B.解释变量在x 轴上,预报变量在y 轴上; C.可以选择两个变量中的任意一个变量在x 轴上; D.可以选择两个变量中的任意一个变量在y 轴上;例题5:散点图在回归分析过程中的作用是( )A.查找个体个数B.比较个体数据的大小C.研究个体分类D.粗略判断变量是否线性相关二、线性回归方程:1、回归方程:a x b yˆˆˆ+= 其中2121121)())((ˆxn x yx n yx x x y yx x bn i i ni ii n i i ni ii--=---=∑∑∑∑====,x b y aˆˆ-=(代入样本点的中心) 例题1:设),(),,(),,(2211n n y x y x y x Λ是变量n y x 的和个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(过一、二、四象限),以下结论正确的是( )A.直线l 过点),(y xB.当n 为偶数时,分布在l 两侧的样本点的个数一定相同C.的和y x 相关系数在0到1之间D.的和y x 相关系数为直线l 的斜率 例题2:工人月工资y (元)依劳动生产率x (千元)变化的回归直线方程为x y9060ˆ+=,下列判断正确的是( ) A.劳动生产率为1000元时,工资为150元; B.劳动生产率提高1000元时,工资平均提高150元; C.劳动生产率提高1000元时,工资平均提高90元; D.劳动生产率为1000元时,工资为90元;例题3:设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据)2,1)(,(n i y x i i Λ=,用最小二乘法建立的回归方程为71.8585.0ˆ-=x y,则不正确的是( ) A.y 与x 具有正的线性相关关系; B.回归直线过样本点的中心),(y x C.若该大学某女生身高增加1cm,则其体重约增加0.85kg D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg例题4:为了了解儿子的身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( )A.1-=x y B.1+=x y C.x y 2188+= D.176=y2、残差:(1)残差图:横坐标为样本编号,纵坐标为每个编号样本对应的残差。
(2)残差图呈带状分布在横轴附近,越窄模型拟合精度越高。
(3)残差平方和∑=-ni i i yy 12)ˆ(越小,模型拟合精度越高。
3、相关指数:∑∑==---=n i ini i iy yyyR 12122)()ˆ(1(1)其中:∑=-ni i i yy 12)ˆ(为残差平方和;∑=-ni i y y 12)(为总偏差平方和。
(2))1,0(2∈R ,越大模型拟合精度越高。
例题5:下列说法正确的是( )(1)残差平方和越小,相关指数2R 越小,模型拟合效果越差; (2)残差平方和越大,相关指数2R 越大,模型拟合效果越好; (3)残差平方和越小,相关指数2R 越大,模型拟合效果越好; (4)残差平方和越大,相关指数2R 越小,模型拟合效果越差; A.(1)(2) B.(3)(4) C.(1)(4) D.(2)(3) 例题6:关于回归分析,下列说法错误的是( )A.在回归分析中,变量间的关系若是非确定关系,则因变量不能由自变量唯一确定;B.线性相关系数r 可以是正的,也可以是负的C.样本点的残差可以是正的,也可以是负的D.相关指数2R 可以是正的,也可以是负的例题7:下列命题正确的是( )(1)线性相关系数r 越大,两个变量的线性相关性越强,反之,线性相关性越弱;(2)残差平方和越小的模型,拟合的效果越好;(3)用相关指数2R 来刻画回归效果,2R 越小,说明模型的拟合效果越好; (4)随机误差e 是衡量预报精确度的一个量,但它是一个不可观测的量;(5)i eˆ表示相应于点),(i i y x 的残差,且0ˆ1=∑=ni i e 。
A.(1)(3)(5) B.(2)(4)(5) C.(1)(2)(4) D.(2)(3)例题8:已知x 与y 之间的几组数据如下表:假设根据上表数据所得的线性回归直线方程为a x b yˆˆˆ+=。
若某同学根据上表中的前两个数据)2,2(),0,1(求得的直线方程为a x b y '+'=,则下列结论正确的是( )A.a a b b'>'>ˆ,ˆ B.a a b b '<'>ˆ,ˆ C.a a b b '>'<ˆ,ˆ D.a a b b '<'<ˆ,ˆ 例题9:关于某设备的使用年限x (年)和所支出的维修费用y (万元)有下表所示的资料:(1)线性回归方程a x b yˆˆˆ+=中的回归系数b a ˆ,ˆ; (2)残差平方和与相关指数2R ,作出残差图,并对该回归模型的拟合精度作出适当判断;(3)使用年限为10年时,维修费用大约是多少?三、非线性回归模型:例题1:如果样本点分布在某一条指数函数曲线bx ae y =的周围,其中a 和b 是参数,通过两边取自然对数的方法,把指数关系式变成对数关系式后,下列哪个变换结果是正确的( )A.a bx y ln ln ⋅=B.a bx y ln ln +=C.a bx y ln ln ln ⋅=D.a bx y ln ln ln += 例题2:下列回归方程中, 是线性回归方程; 是非线性回归方程。
(1)27.3688.0ˆ+=x y(2)8.1225.0ˆ2-=x y (3)x e y 3.16.2ˆ= (4)x y5.14ˆ-= (5)xe y 185.038.1ˆ-=例题3:某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费和年销售量(i=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值。
表中w 1 ,w u r =1881i w =∑1(Ⅰ)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程; (Ⅲ)以知这种产品的年利率z 与x 、y 的关系为z=0.2y-x 。
根据(Ⅱ)的结果回答下列问题:(i ) 年宣传费x=49时,年销售量及年利润的预报值是多少? (ii ) 年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据(u 1 v 1),(u 2 v 2)…….. (u n v n ),其回归线v=αβ+u 的斜率和截距的最小二乘估计分别为:^^^121()(),()niii nii u u v v v u u u βαβ==--==--∑∑四、独立性检验:例题1:下表是一个22⨯列联表:的值分别为 。
例题2:可以粗略的判断两个分类变量是否有关系的是( ) A.散点图 B.残差图 C.等高条形图 D.以上都不对例题3:在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) A.d c c b a a ++与 B.d a c d c a ++与 C.c b c d a a ++与 D.ca cd b a ++与例题4:在判断两个分类变量是否有关系的常用方法中,最为精确的方法是( ) A.考察随机误差e B.考察线性相关系数r C.考察相关指数2R D.考察独立性检验中的2K例题5:在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()。
①若2k 的观测值满足635.62≥k ,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有 99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99&的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误。
A. ①B. ①③C. ③D. ②例题6:在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数):数学成绩与物理成绩之间有()把握有关。
A. B. C. D.。