【高中】2018最新高中数学必修三练习:2.4线性回归方程(二) Word版含答案
高中数学线性回归方程讲解练习题
教学步骤及教学内容线性回归方程(参考公式:b=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a=y-b x)1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y^=x+1 B.y^=x+2 C.y^=2x+1 D.y^=x-12.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是()A.甲B.乙C.甲、乙相同D.不确定3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得∑8i=1x i=52,∑8i=1y i=228,∑8i=1x2i=478,∑8i=1x i y i=1849,则其线性回归方程为()A.y^=11.47+2.62x B.y^=-11.47+2.62xC.y^=2.62+11.47x D.y^=11.47-2.62x4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 123 4用水量y 4.543 2.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于______.5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)234 5加工的时间y(小时) 2.534 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程y^=bx+a,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?作业布置家长意见家长签名:2013 年_月_日(第_次)审阅人:1。
线性回归方程
2.4 线性回归方程
上面这些方法虽然都有一定道理,但总让人感到 可靠性不强.实际上,我们希望从整体上看,应该使 得该直线与散点图中的点最接近.
如何衡量直线与散点图中的点的接近程度?
用类似于估计总体平均数的思想:
考虑所有数据点到直线的距离的 平方和; 距离计算不方便 化斜为直
苏教版高中数学教材必修3
第2章 统计
2.4 线性回归方程
例 求三点(3,10),(7,20), (11,24)的线性回归方程. 解(1)作出散点图:
30 25 20 15 10 5 0 0 5 10 15
x y
i 1
3 i 1
3
i 1 3
i
3 7 11 21; 10 20 24 54;
2.4 线性回归方程
苏教版高中数学教材必修3
第2章 统计
2.4 线性回归方程
在学校里,老师对学生经常这样说:“如果你的数 学成绩好,那么你的物理学习就不会有什么大的问题” 确实,凭我们的学习经验可知,学生的物理成绩和 数学成绩之间存在一种相关关系,当然,除此以外,还 存在其它影响物理成绩的因素,例如,是否喜欢物理, 用在物理学习上的时间等等.当我们主要考虑数学成绩对 物理成绩影响时,就是要考虑两者之间的相关关系. 我们日常生活中存在许多相关关系的问题: 1.商品销售收入与广告支出经费之间的关系; 2.粮食产量与施肥量之间的关系; 3.人体脂肪和年龄之间的关系;
i 1 i 1
n
n
n S5 当a= 时, Q(a,b) 取得最小值; 2m
a
( y
i 1
n
i
bxi )
n
江苏省宿迁中学高中数学必修三练习:2-4线性回归方程二 含答案 精品
2.4线性回归方程(二)【新知导读】1.对于线性相关系数r ,下列说法正确的是 ( )A .(0,)r ∈+∞时,r 越大,相关程度越高;反之相关程度越低B .(,)r ∈-∞+∞时,r 越大,相关程度越高,反之相关程度越低C .1r ≤时,r 越接近于1,相关程度越高;r 越接近于0,相关程度越低D .以上说法都不正确2.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的.他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y 与父亲的身高x 的回归直线方程y a bx ∧=+中,b ( ) A .在(-1,0)内 B .等于0 C .在(0,1)内 D .在[1,)+∞内3.由一组样本数据11(,)x y ,22(,)x y ,...,(,)n n x y 得到的线性回归方程为y bx a ∧=+,那么下面说法不正确的是 ( ) A .直线y bx a ∧=+经过点(,)x yB .直线y bx a ∧=+至少经过11(,)x y ,22(,)x y ,...,(,)n n x y 中的一个点C .直线y bx a ∧=+的斜率为1221ni ii nii x y nx yxnx==--∑∑D .直线y bx a ∧=+和各点11(,)x y ,22(,)x y ,...,(,)n n x y 的偏差21[()]niii y bx a =-+∑是该坐标平面上所有直线与这些点的偏差中最小的 【范例点睛】例1 测得10对某国父子身高(单位:英寸)如下:(2) 如果y 与x 之间具有线性相关关系,求回归直线方程; (3) 如果父亲的身高为73英寸,估计儿子的身高.【课外链接】1.现有一个由身高预测体重的回归方程,体重预测值=4(磅/英寸)×身高-130磅.其中体重和身高分别以磅和英寸为单位.如果将它们分别以kg 、cm 为单位(1英寸≈2.5cm ,1磅≈0.45kg).回归方程应该是_ _________________________________. 【随堂演练】1.对于回归分析,下列说法错误的是 ( )A .在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B .线性相关系数可以是正的或负的C .在回归分析中,如果21r =,说明x 与y 之间完全线性相关 D .相关样本系数(,)r ∈-∞+∞ 2.线性回归方程y bx a ∧=+必过( )A .(0,0)点B .(x ,0)点C .(0,y )点D .(x ,y )点3.为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为1l 和2l .假设两个人在试验中发现对变量x 的观察数据的平均值都是m ,对变量y 观察的平均值都是t ,那么下列说法正确的是( ) A .1l 和2l 有交点(,)m tB .1l 和2l 相交,但交点不一定是(,)m tC .1l 和2l 必定平行D .1l 和2l 必定重合4.在研究硝酸钠的可溶性时,对不同的温度观察它在水中的溶解度,得观察结果如下:由此得到回归直线的斜率是__________________(保留4位有效数字).5.下面数据是从年龄在40到60岁的男子中随机抽取6个个体,分别测得的每个个体心脏功能水平y (满分100分)以及相应的每天花在看电视上的时间x (小时).则x 与y 的相关系数为______________________ .6.若施肥量x 与水稻产量y 的线性回归方程为5250y x ∧=+,当施肥量为80kg 时,预计的水稻产量为______________kg .7.为了研究三月下旬的平均气温(x )与四月十二号前棉花害虫化蛹高峰日(y )的关系,某地区观察了1996年至2001年的情况,得到下面数据:(1)据气象预测,该地区在2002年三月下旬平均气温为27oC ,试估计2002年四月化蛹高峰日为哪天;(2)对变量x 、y 进行相关性检验.8.证明恒等式11()()n ni i i i i i x y nx y x x y y ==-=--∑∑,其中11ni i x x n ==∑,1ni i y y ==∑,从而回归直线的斜率还可以写成121()()()niii nii x x y y x x ==---∑∑.9.以下是一位销售经理收集来的销售员每年销售额y 和销售经验年数x 的关系:(1)依据这些数据画出散点图并作直线78 4.2y x ∧=+,计算2()iiy y ∧-∑;(2)依据这些数据由最小二乘法估计线性回归方程,并据此计算1021()iii y y ∧=-∑.10.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,数据如下:(1) 计算x 与y 的相关系数,并对x 与y 进行相关性分析; (2) 如果y 与x 之间具有线性相关关系,求线性回归方程.2.4线性回归方程(二) 【新知导读】 1.C 2.C 3.B 【范例点睛】例1.(1)66.8x =,67.01y =,102144794ii x==∑,102144941ii y==∑,4476.27xy ≈,24462.24x =,24490.34y ≈,10144842.4i i i x y ==∑,1010i ix y x yr -∴=∑79.70.980181.31≈=≈≈.因为0.9801r =接近1,所以y 与x 具有较强的相关关系,也就是说y 与x 之间具有线性相关关系.(2)设回归直线方程为y bx a ∧=+,由101102211044842.444762.74479444622.410i ii i i x y x yb x x==--=≈--∑∑79.7171.6= 0.4645≈,67.010.464566.835.98a y bx =-≈-⨯≈,所以所求直线方程为0.464539.98y x ∧=+.(3)当73x =时,0.46457335.9869.9y =⨯+≈,所以当父亲身高为73英寸时,估计儿子的身高为69.9英寸. 【课外链接】体重预测值=0.72(kg/cm)×身高-58.5kg 【随堂演练】1.D 2.D 3.A4.0.8809 5.-0.9023 6.6507.解:(1)61129.136i i x x ===∑,6117.56i i y y ===∑,6215130.92i i x ==∑,611222.6i i i x y ==∑,6162216 2.26i ii ii x y x yb xx==-∴==--∑∑,7.5( 2.2)29.1371.6a y bx =-=--⨯=,∴回归直线方程为2.271.6y x ∧=-+.当27x =时, 2.22771.612.2y ∧=-⨯+=.据此,可估计该地区2002年4月12日或13日化蛹高峰日.(2)660.9342i ix y x yr -==∑,r 的值接近于1,所以变量x ,y 存在线性相关关系. 8.证明:11111()()()n n n n niii iiii iiii i i i i x x y y x y xy x y x y x y x y y x nx y =====--=--+=--+∑∑∑∑∑11n ni i i i i i x y nx y nx y nx y x y nx y ===--+=-∑∑,∴回归直线的斜率为1221()ni ii nii x y nx yxn x ==-=-∑∑121()()()niii nii x x y y x x ==---∑∑.9.解:(1)散点图与直线78 4.2y x ∧=+的图形如图所示,对1,3,...,13x =,82.2,90.6,94.8,94.8,y ∧=103.2,111.6,120,120,124.2,132.6,1021()178.48i i i y y ∧=-=∑.(2)1011710i i x x ===∑,1021()142xx i i l x x ==-=∑,108y =,101()()xy i i i l x x y y ==--∑ 568=,所以5684142xyxx l b l ===,1084780a y bx =-=-⨯=,480y x ∧∴=+.84,92,96,96,104,112,120,120,124,132i y ∧=,1021()170i i i y y ∧=-=∑.10.解:(1)由题意可得77777.710x ==,1657165.710y ==,102170903i i x ==∑,1021277119i i y ==∑,101132929i ii x y==∑.r =0.806≈,因此x 与y 之间具有显著的相关性.(2)21329291077.7165.70.397709031077.7b -⨯⨯=≈-⨯,165.70.397a =-77.7134.8⨯=,所以线性回归方程为0.397134.8y x ∧=+.。
2018-2019苏教版高中数学苏教版必修三学案:第二单元 2.4 线性回归方程 -含答案
学习目标 1. 了解相关关系、线性相关的概念;2.会根据散点图判断数据是否具有相关关系;3.会求线性回归方程,并能根据线性回归方程做出合理判断.知识点一相关关系思考数学成绩y与学习数学所用时间t之间的关系,能否用函数关系刻画?梳理相关关系:与函数关系不同,相关关系是一种变量之间__________的联系,但不是__________的关系.知识点二散点图1.散点图:将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形.2.利用散点图可以大致确定两个变量是不是有相关关系,以及相关性强弱.知识点三最小平方法及线性回归方程思考1若散点大致分布在一条直线附近,如何确定这条直线比较合理?思考2任何一组数据都可以由最小二乘法得出线性回归方程吗?梳理线性回归方程:能用直线方程________________近似表示的相关关系叫做____________关系,该方程叫________________.最小平方法是一种求回归直线的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离的平方和最小.给出一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),用最小平方法求得线性回归方程的系数a ,b 满足⎩⎪⎨⎪⎧b = ,a = .上式还可以表示为 ⎩⎪⎨⎪⎧b == ,a = .类型一 变量之间相关关系的判断例1 在下列两个变量的关系中,哪些是相关关系? (1)正方形边长与面积之间的关系; (2)作文水平与课外阅读量之间的关系; (3)人的身高与年龄之间的关系; (4)降雪量与交通事故发生率之间的关系.反思与感悟 如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么. 跟踪训练1 有下列关系:①老师的执教水平与学生的学习成绩之间的关系; ②曲线上的点与该点的坐标之间的关系; ③苹果的产量与气候之间的关系;④森林中的同一种树木,其横截面直径与高度之间的关系; ⑤学生与其学号之间的关系.其中有相关关系的是________.(填序号) 类型二 散点图及应用例2 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:画出散点图,分析年龄与人体脂肪含量的关系.反思与感悟画散点图时应注意合理选择单位长度,避免图形过大或过小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.相关关系的散点图不一定分布在一条直线附近,也可能是曲线.跟踪训练2下表为我国在公元1000年到2000年间的人口数量.(1)试画出散点图;(2)年份与人口是相关关系吗?如果是,是正相关还是负相关?你觉得用什么函数模型模拟效果比较好?反思与感悟函数关系与相关关系之间有密切联系,可以用函数关系来模拟相关关系,也可借助散点图来发现两变量之间的函数关系,在一定条件下,两种关系还可相互转化.类型三线性回归方程的求法及应用例3下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系.如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.反思与感悟对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,若。
高中数学-线性回归方程
【变式1】 下列两个变量中具有相关关系的是________(填 写相应的序号).
①正方体的棱长和体积;②角的弧度数和它的正弦值;③ 单产为常数时,土地面积和总产量;④日照时间与水稻的亩产 量.
解析 正方体的棱长x和体积V存在着函数关系V=x3;角的 弧度数α和它的正弦值y存在着函数关系y=sin α;单产为常数a公 斤/亩土地面积x(亩)和总产量y(公斤)之间也存在着函数关系y= ax.日照时间长,则水稻的亩产量高,这只是相关关系,应选④.
性回归方程;
(3) 已 知 该 厂 技 改 前 100 吨 甲 产 品 的 生 产 能 耗 为 90 吨 标 准
i=1
i=1
∴b=1129.03--55××442×5=1.23, a=5-1.23×4=0.08. ∴所求线性回归方程为y^=1.23x+0.08.
课前探究学习
课堂讲练互动
活页规范训练
【变式2】 某商店统计了近6个月某商品的进价x与售价y(单 位:元),对应数据如下:
x 3 5 2 8 9 12 y 4 6 3 9 12 14 求y对x的回归直线方程.
是一种理想关系模型 是更为一般的情况
课前探究学习
课堂讲练互动
活页规范训练
2.回归直线方程 (1)回归直线方程的思想方法 ①回归直线:观察散点图的特征,发现各点大致分布在一
条直线的附近,就称这两个变量之间具有线性相关的关系,这
条直线叫做回归直线.
可见,根据不同的标准可画出不同的直线来近似表示这种
线性关系.比如,可以连接最左侧点和最右侧点得到一条直
课前探究学习
课堂讲练互动
活页规范训练
自学导引 1.与函数关系不同,相关关系是一种有关系,但不是
高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精练)(含答案)
8.2 一元线性回归模型及其应用(精练)【题组一 样本中心求参数】1.(2021·全国·高二单元测试)某公司生产某种婴幼儿纸尿裤的产量x 与相应的生产能耗y 有如下样本数据:已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )A .ˆ0.72 2.05yx =+ B .ˆ0.720.35yx =+ C .ˆ0.720.26yx =+ D .ˆ0.350.72yx =+ 【答案】C【解析】设回归直线方程为ˆˆ0.72yx a =+,由样本数据,可得 4.5x =, 3.5y =, 因为回归直线经过点(),x y ,所以ˆ3.50.72 4.5a=⨯+,解得ˆ0.26a =, 所以回归直线方程为ˆ0.720.26yx =+. 故选:C .2.(2021·江西·吉安一中高二开学考试 )已知x 与y 之间的一组数据:()()()()13253749,,,,,,,,则y 与x 的线性回归方程为y bx a =+必过( )A .()26,B .()38,C .()2.56,D .()3.58,【答案】C【解析】由题意可知:1234 2.54x +++==,357964y +++==, ∴y 与x 的线性回归方程必过点()2.5,6.故选:C.3(2021·河南·孟津县第一高级中学 )为了庆祝建党100周年,某网站从7月1日开始推出党史类书籍免费下载活动,已知活动推出时间x (单位:天)与累计下载量y (单位:万次)的统计数据如表所示:根据上表,利用最小二乘法得到回归直线方程 1.4ˆˆyx a =+,据此模型预测,活动推出11天的累计下载量约A .13.8万次B .14.6万次C .16万次D .18万次【答案】C【解析】由表格数据知4567868910126,955x y ++++++++====,由回归直线方程的性质,得ˆ1.469a⨯+=,所以ˆ0.6a =,故ˆ 1.40.6y x =+, 所以当11x =时, 1.4110.616y =⨯+=(万次), 故选:C.4.(2021·河北·藁城新冀明中学高二月考)(多选)随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:根据所给数据,得出y 关于t 的回归直线方程为273y bt =+,则下列说法正确的是( ) A .该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B .y 关于t 的回归直线方程为18273y t =-+ C .估计该市2020年烧烤店盈利店铺的个数为147D .预测从2025年起,该市烧烤店盈利店铺的个数将不超过100 【答案】ABC【解析】由已知数据得3t =,219y =,故A 正确;因为y 关于t 的回归直线过点()3,219,所以2193273b =+,所以18b =-, 所以y 关于t 的回归直线方程为18273y t =-+.故B 正确;2020年的年份代码为7,故2020年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.故C 正确; 令18273100t -+≤,由*t N ∈,得10t ≥,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故D 不正确,故选:ABC.5.(2021·广东惠州 )(多选)某种产品的价格x (单位:元/kg )与需求量y (单位:kg )之间的对应数据如根据表中的数据可得回归直线方程为14.4y bx =+,则以下结论正确的是( ) A .y 与x 正相关 B .y 与x 负相关C .样本中心为()20,8D .该产品价格为35元/kg 时,日需求量大约为3.4kg【答案】BC【解析】由表格数据,随着价格x 的增加,需求量y 随之减少,所以y 与x 负相关. 因为1015202530205x ++++==,111086585y ++++==,故样本中心为()20,8由回归直线14.4y bx =+必过样本点的中心()20,8, 所以有82014.4b =⨯+,解得0.32b =-,所以当35x =时,0.323514.4 3.2y =-⨯+=,日需求量不为最大 故选:BC6.(2021·重庆市秀山高级中学校 )(多选)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD【解析】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD.7.(2021·贵州·贵阳一中 )某产品的广告费用x 与销售额y 的统计数据如下表:根据上表已得回归方程为8.6.8ˆ5yx =-,表中一数据模糊不清,请推算该数据的值为___________. 【答案】12【解析】由题中数据可得3,8.63 5.820x y ==⨯-=,故空白数据为12. 故答案为:128.(2021·全国·高二课时练习)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且回归直线方程为ˆ0.95 2.6yx =+,那么表格中的数据m 的值为______.【答案】6.7 【解析】013424x +++==, 2.2 4.3 4.811.344m m y ++++==, 把(),x y 的坐标代入回归直线方程得11.30.952 2.64m+=⨯+, 解得 6.7m =. 故答案为:6.79.(2021·全国·高二课时练习)蟋蟀鸣叫的频率P (每分钟鸣叫的次数)与气温T (单位:℃)有着很大的关系.某观测人员根据下表中的观测数据计算出P 关于T 的线性回归方程ˆ 5.2168PT =-,则下表中k 的值为______.【答案】51【解析】计算()138414239404T =⨯+++=,()110929443644k P k +=⨯+++=, 将点10940,4k +⎛⎫ ⎪⎝⎭的坐标代入P 与T 的线性回归方程ˆ 5.2168P T =-中,得109 5.2401684k +=⨯-, 解得51k =. 故答案为:51.10.(2021·福建宁德·高三期中)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:由最小二乘法得到回归方程ˆ0.6754.9yx =+,则a =___________. 【答案】75 【解析】1020304050305x ++++==,62688189600.25a y a ++++==+,因为线性回归方程过样本中心点,所以600.20.673054.975a a +=⨯+⇒=,故答案为:75 【题组二 线性回归方程】1.(2021·河北·藁城新冀明中学高二月考)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件;(3)各组残差见解析,残差平方和为3.8182. 【解析】(1)解:散点图如下:(2)解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818i i i y y=--+++--==++∑. 2.(2021·甘肃张掖)某家庭2015~2019年的年收入和年支出情况统计如表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(系数精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2021年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2021年的年支出金额.附:回归方程ˆˆˆybx a =+中的斜率的最小二乘估计公式为()()()1122211ˆnni iiii i nniii i x ynx y xxy y b xnxxx====---==--∑∑∑∑.【答案】(1)ˆ0.780.24yx =+;(2)7.65万元. 【解析】(1)依题意,1(99.61010.411)105x =++++=,1(7.37.588.58.7)85y =++++=,则()5212.32i i x x=-=∑,()()511.8i ii x xy y =--=∑,则有()()()125151.8ˆ0.782.32iii ii x x y y bx x ==--==≈-∑∑,则ˆˆ0.24a y bx =-≈, 所以y 关于x 的线性回归方程为ˆ0.780.24yx =+; (2)当2021年的年收入为9.5万元时,即9.5x =,ˆ0.789.50.247.65y=⨯+=, 所以预测该家庭2021年的年支出金额为7.65万元.3.(2021·云南师大附中)大气污染物PM 2.5的浓度超过一定的限度会影响人的健康.为了研究PM 2.5的浓度是否受到汽车流量的影响,研究人员选择了24个社会经济发展水平相近的城市,在每个城市选择一个交通点统计24小时内过往的汽车流量x (单位:千辆),同时在低空相同的高度测定该时间段空气中的PM 2.5的平均浓度y(单位:μg/m 3),制作了如图所示的散点图:(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明(精确到0.01); (2)建立y 关于x 的回归方程;(3)我国规定空气中的PM 2.5浓度的安全标准为24小时平均依度75μg/m 3,某城市为使24小时的PM 2.5浓度的平均值在60~130μg/m 3,根据上述回归方程预测汽车的24小时流量应该控制在什么范围内?附:参考数据: 1.4x =,95y =,2421() 2.1i i x x =-=∑,2421()60343i i y y =-=∑,241()()294i i i x x y y =--=∑,357.参考公式:相关系数()()nii xx y y r --∑,回归方程ˆˆˆya bx =+中斜率和截距的最小二乘估计公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)答案见解析;(2)140101y x =-;(3)24小时的车流量应该控制在1150~1650辆. 【解析】1)由题得2940.82357r =≈, 因为y 与x 的相关系数近似为0.82,说明y 与x 具有很强的相关性, 从而可以用线性回归模型拟合y 与x 的关系.(2)由95y =得2412421()()ˆ()iii ii x x y y bx x ==--=-∑∑2941402.1==,95140 1.4101a y bx =-=-⨯=-, 所以y 关于x 的回归方程为140101y x =-. (3)当60y =时,由14010160x -=得 1.15x =; 当130y =时,由140101130x -=得 1.65x =. 所以24小时的车流量应该控制在1150~1650辆.4.(2021·全国·高三专题练习)实施新规后,某商场2020年1月份至10月份的收入情况如表.并计算得101890i i i x y ==∑,1021385i i x ==∑,101150i i y ==∑75.99.(1)是否可用线性回归模型拟合y 与x 的关系?请用相关系数r 加以说明;(当0.751r ≤≤时,那么变量x ,y 有较强的线性相关关系)(2)建立y 关于x 的回归方程ˆˆˆybx a =+(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)y 与x 有较强的线性相关关系,可用线性回归模型拟合,说明答案见解析;(2)ˆ0.810.7yx =+,预测该商场12月份的收入为20万元.【解析】(1)由题中数据得1011155 5.51010i i x x ===⨯=∑,10111150151010i i y y ===⨯=∑,1010 5.515825x y =⨯⨯=,于是得1010111()()1089082565i i i i i x x y y x y y x ==--=-=-=∑∑,75.99,从而10()()650.8675.99iix x y y r --==≈∑,0.75||1r ≤≤, 所以y 与x 有较强的线性相关关系,可用线性回归模型拟合;(2)由(1)知1011065i i i x y x y =-=∑,而1021385i i x ==∑,221010 5.5302.5x =⨯=,从而得10122110106565ˆ0.8385302.582.510i ii i i x y ybx xx ==-===≈--∑∑,65ˆˆ15 5.510.782.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ0.810.7yx =+,当12x =时,ˆ0.81210.720y =⨯+≈, 从而预测该商场12月份的收入为20万元.5(2021·河南许昌 )某新型外贸出口公司对2021年过去9个月的出口销售数据进行整理,得到了今年第x 个月份与截止该月底的销售额y (单位:万元)之间的关系,如下表:(1)若y 与x 满足线性关系,求出y 关于x 的回归方程;(ˆa,ˆb 精确到整数位) (2)预测该公司10月份的销售额附:参考数据:913087i i y ==∑;9117524i i i x y ==∑;921285i i x ==∑;参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ35169yx =+;(2)答案见解析. 【解析】(1)5x =,343y =,919175249534317524154352089i i i x y xy =∴-=-⨯⨯=-=∑92221952859560ii x=-⨯=-⨯=∑,2089ˆ3560b ∴=≈, 2089ˆ343516960a=-⨯≈, ˆ35169yx ∴=+ (2)当10x =时,ˆ3510169519y=⨯+=, 所以预测该公司10月份销售额为519万元.6.(2021·福建·莆田第二十五中学高三月考)2021年东京奥运会,中国举重选手8人参赛,7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表 (1)根据表中的数据,求出运动员举重成绩y 与运动员的体重x 的回归直线方程(保留1位小数); (2)某金牌运动员抓举成绩为170公斤,挺举成绩为204公斤,则该运动员最有可能是参加的哪个级别的举重?参考数据:()()()992112620,7076i i i i i x x x x y y ==-=--=∑∑;参考公式:()()()121ˆˆˆ,niii nii x x yy bay bx xx ==--==--∑∑. 【答案】(1) 2.7155.4y x =+;(2)83公斤级举重. 【解析】(1)依题意,5459647076839199106789x ++++++++==,2913043373533633894064214303669y ++++++++==,()()()1217076ˆ 2.702620nii i nii xx y y bxx ==--===-∑∑, 则366 2.778155.4a y bx =-=-⨯=, 故回归方程为: 2.7155.4y x =+.(2)该运动员的抓举和挺举的总成绩为374公斤,根据回归方程可知:374 2.7155.4x =+, 解得81x ≈,即该运动员的体重应该在81公斤左右,即参加的应该是83公斤级举重.7.(2021·西藏·拉萨中学高二月考)珠海国际赛车场(简称ZIC)位于珠海经济特区金鼎镇.创建于1996年,是中国国内第一座符合国际汽车联盟一级方程式标准的国际级赛车场.目前该赛事已打造成集赛车竞技运动、汽车文化极致体验、主题休闲度假为一体的超级汽车文化赛事娱乐综合体.为了减少对环境的污染,某环保部门租用了特制环保车清洁现场垃圾.通过查阅近5年参会人数(万人)与所需环保车辆数量(辆),得到如下统计表:(1)根据统计表所给5组数据,求出关于,x y 的线性回归方程ˆˆy bxa =+. (2)已知租用的环保车平均每辆的使用成本费用C (元)与数量(辆)的关系为3000200035,N 2900t t 35,N t t t C t +<<∈⎧=⎨≥∈⎩,主办方根据实际参会人数投入所需环保车,租车每辆支付费用6000元,超出实际需要的车辆,主办方不支付任何费用.预计本次赛车会大约有14万人参加,根据(1)中求出的线性回归方程,预测环保部门在确保清洁任务完成的前提下,应租用多少辆环保车?获得的利润是多少? (注:利润L =主办方支付费用-使用成本费用C ).参考公式:()()()1122211ˆ,ˆˆn niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑ 【答案】(1) 2.32y x =+;(2)为确保完成任务,需要租用35辆环保车,获得的利润108500元. 【解析】(1)11981012105x ++++==2823202529255y ++++== ()()()()()()()()()22222131******** 2.310111091081010101210ˆb ⨯+-⨯-+-⨯-++⨯===-+-+-+-+- ˆˆ2ay bx =-= 关于,x y 的线性回归方程 2.32y x =+ (2)将14x =代入 2.32y x =+得34.2y =为确保完成任务,需要租用35辆环保车, 所以290035101500C =⨯=获得的利润600035101500108500L =⨯-=元8.(2021·江西·新余市第一中学高二月考)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 中至少有一个数小于25”的概率;(2)请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程y bx a =+.(参考公式:回归直线方程为y bx a =+,其中()1221ni ii nii x y nxyb xn x==-=-∑∑,a y bx =-)【答案】(1)710(2)532y x =-【解析】(1)从3月1日至3月5日中任选2天,m ,n 构成的基本事件(m ,n )有:(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个.记“m ,n 至少有一个数小于25”为事件A ,包括:(23,25),(23,30),(23,26),(23,16),(25,16),30,16),(26,16),共有7个基本事件 由古典概型概率公式:7()10P A = (2)11131225302612,27,33x y ++++==== 22221125133012263122751113123122b ⨯+⨯+⨯-⨯⨯==++-⨯. 于是,5271232a =-⨯=-故所求线性回归方程为532y x =- 9.(2021·全国·高二单元测试)某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (1)求y 关于t 的线性回归方程;(2)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121()()()niii nii t t y y b tt ==--=-∑∑,a y bt =-.【答案】(1)ˆ0.5 3.3yt =+;(2)分布列见解析;期望为98. 【解析】(1)根据2018年的抽样数据可得2018年的人均纯收入为1(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210+++++++++= 千元,根据2019年的抽样数据可得2019年的人均纯收入为1(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910+++++++++=千元,由所给的数据得1(1234567)47t =++++++=,1(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37y =++++++=, ∴721()941014928i i t t =-=++++++=∑,71()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614ii i tt y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,∴71721()()14ˆ0.528()ii i ii tt y y btt ==--===-∑∑, 则ˆˆ 5.30.54 3.3ay bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3yt =+; (2)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X 的可能取值为0,1,2,3,则35385(0)28C P X C ===,12353815(1)28C C P X C ===,21353815(2)56C C P X C ===,33381(1)56C P X C ===,∴随机变量X 的分布列为则X 的分布列为:则5151519()0123282856568E X =⨯+⨯+⨯+⨯= 【题组三 非线性回归方程】1.(2021·福建·泉州科技中学 )数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99⨯盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33⨯)内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP 上进行一段时间的训练,每天的解题平均速度y (秒)与训练天数x (天)有关,经统计得到如表的数据:现用by a x=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP 上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1i t x =)参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-⋅.【答案】(1)1000130y x=+,经过100天训练后,每天解题的平均速度y 约为140秒;(2)243256.【解析】(1)由题意,1(990990450320300240210)5007y =++++++=,令1t x=,设y 关于t 的线性回归方程为y bt a =+,则 717221184570.3750010000.5577i ii i i t y t yb t t==-⨯-⨯-===⋅∑∑,则50010000.37130a =-⨯=. ∴1000130y t =+,又1t x=,∴y 关于x 的回归方程为1000130y x=+, 故100x =时,140y =.∴经过100天训练后,每天解题的平均速度y 约为140秒.(2)设比赛再继续进行X 局小明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负.当2X =时,小明4:1胜,∴339(2)4416P X ==⨯=;当3X =时,小明4:2胜,∴123339(3)144432P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭;当4X =时,小明4:3胜,∴21333327(4)1444256P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭.∴小明最终赢得比赛的概率为99272431632256256++=. 2.(2021·云南大理 )2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.y x =+,模型②:ˆ14.4y =;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7yx a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)模型②拟合精度更高、更可靠,72.93亿;(2)投入17亿元比投入20亿元时收益小. 【解析】(1)对于模型①, 对应的15222740485460=387y ++++++=,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ14.472.93=≈y. (2)当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.3.(2021·全国·高二单元测试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产的产品数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下散点图.参考数据:(其中1iu x =) (1)观察散点图判断,by a x=+与y c dx =+哪一个适宜作为非原料成本y 与生产的产品数量x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)试预测生产该产品10千件时,每件产品的非原料成本为多少元? 【答案】(1)b y a x =+;(2)100ˆ11y x=+;(3)21元.【解析】(1)由题意,根据题设中的散点图,可得这些点分布在b y a x =+的两侧,所以选择函数by a x=+作为非原料成本y 与生产的产品数量x 的回归方程类型. (2)令1u x =,则by a x=+可转化为y a bu =+,则y 与u 的关系可看成线性相关关系. 因为360458y ==,所以8182218183.480.344561ˆ1001.5380.1150.618i ii ii u yu y b uu==-⋅-⨯⨯====-⨯-∑∑,则ˆˆ451000.3411a y bu =-=-⨯=,所以ˆ11100y u =+,代入1u x =,得100ˆ11y x=+.(3)当10x =时,100ˆ112110y=+=,所以预测生产该产品10千件时,每件产品的非原料成本为21元. 4.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①2y x αβ=+,②e x t y λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.现该公司对收集的近12年的年研发资金投入量i x 和年销售额i y (1,2,,12i =⋅⋅⋅)的数据作了初步处理,令2u x =,ln v y =,经计算得到如下数据:(1)设u 和y 的样本相关系数为1r ,x 和v 的样本相关系数为2r ,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立y 关于x 的非线性经验回归方程;(ii)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 约为多少亿元? 参考数据为308477=⨯9.4868, 4.4998e 90≈.【答案】(1)模型e x t y λ+=的拟合效果更好;(2)(i)0.018 3.84ˆe x y+=;(ii)36.66亿元. 【解析】(1)()()121215000.8625000iiu u y y r --====∑,()()12214100.91770.211iix x v v r --====≈⨯∑,因为12r r <,所以从样本相关系数的角度判断,模型e x t y λ+=的拟合效果更好. (2)(i)先建立v 关于x 的经验回归方程. 由e x t y λ+=,得ln y x t λ=+,即v λx t =+.()()()121122114ˆ0.018770iii ii x x v v x x λ==--==≈-∑∑, ˆˆ 4.20.01820 3.84tv x λ=-=-⨯=, 所以v 关于x 的经验回归方程为0.01838ˆ.4vx +=, 所以0.0134ˆln 8.8x y=+,即0.018 3.84ˆe x y +=.(ii)若下一年销售额y 需达到90亿元,则由0.018 3.84ˆe x y+=,得0.018 3.8490e x +=, 又 4.4998e 90≈,所以4.49980.018 3.84x ≈+, 所以 4.4998 3.8436.660.018x -≈≈,所以预测下一年的研发资金投入量约为36.66亿元.5.(2021·全国·高二课时练习)噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D (单位:dB )与声音能量I (单位:2W cm -⋅)之间的关系,将测量得到的声音强度D 和声音能量I 的数据作了初步处理,得到如图所示的散点图:参考数据:111.0410I -⨯=,45.7D =,11.5W =-,()1022111.5610i i I I-=-=⨯∑,()10210.51i i W W=-=∑,()()101116.8810iii IID D -=--=⨯∑,()()1015.1i i i W W D D =-⋅-=∑,其中lg i i W I =,101110i i W W ==∑.(1)根据散点图判断,11D a b I =+与22lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归模型?(给出判断即可,不必说明理由)(2)求声音强度D 关于声音能量I 的非线性经验回归方程.(3)假定当声音强度大于60dB 时,会产生噪声污染.城市中某点P 处共受到两个声源的影响,这两个声源的声音能量分别是a I 和b I ,且101410a bI I +=.已知点P 处的声音能量等于a I 与b I 之和.请根据(2)中的非线性经验回归方程,判断点P 处是否受到噪声污染,并说明理由.【答案】(1)22lg D a b I =+更适合;(2)ˆ10lg 160.7DI =+;(3)P 会受到噪声污染,理由见解析. 【解析】(1)22lg D a b I =+更适合. (2)设ˆˆD bW a =+,则 ∵()()()10110215.1ˆ100.51iii i i W W D D bW W==--===-∑∑, ∴ˆˆ160.7a D bW=-=, ∴D 关于W 的经验回归方程是ˆ10160.7DW =+,则D 关于I 的非线性经验回归方程是ˆ10lg 160.7DI =+. (3)设点P 处的声音能量为1I ,则1a b I I I =+. ∵101410a bI I +=, ∴()101010141410105910b a a b a b a b a b I I I I I I I I I I I ---=+=++=++≥⎛⎫⎛⎫ ⎪⎝⨯ ⎪⎝⎭⎭(当且仅当10310a I =,93510bI =⨯时等号成立) 根据(2)中非线性经验回归方程,知点P 处的声音强度D 的预报值的最小值,()10min 10lg 910160.710lg960.760D -=⨯+=+>,∴点P 会受到噪声污染.6.(2021·福建·福州三中高二期中)某地从2月20日开始的连续7天的某传染病累计确诊人数如下表:由上述表格得到如下散点图.(1)根据散点图判断lg =+y a b x 与x y c d =⋅(,c d 均为大于0的常数)哪一个更适合作为累计确诊人数y 与天数x 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)3月20日,该地的疾控中心接受了1000份血液样本,假设每份样本的检验结果是阳性还是阴性是相互独立的,且每份样本是阳性的概率是0.6,试剂把阳性样本检测出阳性结果的概率是0.99(试剂存在阳性样本检测不出来的情况,但不会把阴性样本检测呈阳性样本),求这1000份样本中检测出呈阳性的份数的期望.参考数据:其中11lg ,7i i i i v y v v ===∑参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线ˆvu αβ=+的斜率和截距的最小二乘估计公式分别为1221,ni i i ni i u v nuvv u unuβαβ==-==--∑∑,v u αβ=-.【答案】(1)0.253.4710x x y c d y =⋅=⨯; (2)594【解析】(1)由散点图可知,x y c d =⋅更适合作为累计确诊人数y 与天数x 的回归方程类型. 把x y c d =⋅两边取对数,得lg lg lg y c x d =+, 令lg v y =,则lg lg v c x d =+,1(1234567)47x =++++++=,7211.54140i i v x ===∑,, 7172221750.1274 1.54lg 0.25140747i i i i i x v xvd x x==--⨯⨯===-⨯-∑∑,所以lg 1.540.2540.54c =-⨯=,则0.540.25v x =+, 所以y 关于x 的回归方程为0.253.4710x y =⨯; (2)设这1000份样本中检测出呈阳性的份数为X , 每份样本检测出阳性的概率为0.60.990.594P =⨯=, 由题意可知,(10000.594)XB ,,所以()10000.594594E X =⨯=份.故这1000份样本中检测出呈阳性的份数的期望为594.7.(2021·山西太原·高二期中(文))为了更好的指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中ln i i w y =(1)根据散点图判断,可采用x y a b =⋅作为这个地区未成年男性体重y 千克与身高x 厘米的回归方程.利用表中数据建立y 关于x 的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常? 参考数据:0.020.71751.02,2,1.0231.99e e ===. 参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,nii i nii uu v v v u uu βαβ==--==--∑∑.【答案】(1)2 1.02x y =⨯;(2)体重偏胖. 【解析】(1)由x y a b =⋅,得ln ln ln y a x b =+⋅, 设ˆˆˆw cx d=+,由表格中数据,得801ˆ0.02400050c ===, ˆ 3.40.021350.7d=-⨯=, 则0.70.02ln 0.7,ln 0.02,2, 1.02a b a e b e ======, 则y 关于x 的回归方程为2 1.02x y =⨯.(2)当175x =时,1752 1.02231.9963.98y =⨯=⨯=,因为63.98 1.276.77678⨯=<,所以该名在校男生的体重偏胖.。
2019—2020年最新苏教版高中数学必修三同步练测2.4线性回归方程及解析.docx
(新课标)2019—2020学年苏教版高中数学必修三2.4 线性回归方程同步练测一、填空题(本题共8小题,每小题8分,共64分) 1.观察下列各图形:其中两个变量x 、y 具有相关关系的图是 . 2.下列变量之间的关系是函数关系的是 .①已知二次函数y =ax 2+bx +c ,其中,a ,c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-;②光照时间和果树亩产量; ③降雪量和交通事故发生率; ④每亩施用肥料量和粮食亩产量.3.已知回归方程yˆ=1.5-15,则下列说法正确的是 . ①y =1.5x -15; ②是回归系数; ③是回归系数; ④=10时,=0.4.以下是两个变量x 和y 的一组数据:x 1 2 3 4 5 6 7 8建议用时 实际用时满分 实际得分45分钟100分y 1 4 91625364964则这两个变量间的线性回归方程为 .5.对有线性相关关系的两个变量建立的回归直线方程y ^=a +bx 中,回归系数b . ①可以小于0; ②大于0; ③能等于0; ④只能小于0. 6.给出下列关系:①正方形的边长与面积之间的关系;②某化妆品的销售量与广告宣传费之间的关系; ③人的身高与视力之间的关系;④雾天的能见度与交通事故的发生率之间的关系; ⑤学生与其学号之间的关系. 其中具有相关关系的是________.7.已知回归方程y ^=4.4x +838.19,则可估计x 与y 的增长速度之比约为________. 8.下表是某厂1~4月份用水量(单位:百吨)的一组数据,月份x 1 2 3 4 用水量y4.5432.5由其散点图知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ,则 =________.二、解答题(本题共2小题,共36分)9.(本小题满分16分)2009年12月某班主任为了对本班学生的月考成绩进行分析,决定从全班25名女同学,15名男同学中随机抽取一个容量为8的样本进行分析. (1)如果按性别比例分层抽样,应选男、女生各多少人.(2)随机抽取8位,若这8位同学的数学、物理分数对应如下表:学生编号1 2 3 4 5 6 7 8 数学分数x60 65 70 75 80 85 90 95 物理分数y72778848899395根据上表数据用散点图说明物理成绩y 与数学成绩x 之间是否具有线性相关性?如果具有线性相关性,求y 与x 的线性回归方程(系数精确到0.01).如果不具有线性相关性,请说明理由. 参考公式:回归直线的方程是:y ^=bx +a ,其中b =∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x ,y ^i 是与x i 对应的回归估计值.参考数据:x =77.5,y =84.875,∑i =18(x i-x )2≈1050,∑i =18(x i-x )(y i-y )=687.5.10.(本小题满分20分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:如果与是线性相关的,求回归直线方程.零件数 (/个) 10 20 30 40 50 60 70 80 90 100加工时间(/分)62 68 75 81 89 95 1021081151222.4 线性回归方程同步练测答案一、填空题1.③④ 解析:相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关.①②是不相关的,而③④是相关的.2.① 解析:由函数关系和相关关系的定义可知,①中=b 2-4,因为是已知常数,b 为自变量,所以给定一个的值,就有唯一确定的与之对应,所以与之间是一种确定的关系,是函数关系.②③④中两个变量之间的关系都是随机的、不确定的,所以不是函数关系.3.① 解析:回归直线方程为yˆ=+,其中是回归系数.对回归方程y ˆ=+有=y -x ,即y =x +.4.y ^=9x -15 解析:根据数据可得x =4.5,y =25.5,∑i =1nx 2i=204,∑i =1nx i y i=1 296.b =1221ni ii n i i x ynx y x nx==--∑∑=1 296-8×4.5×25.5204-8×4.52=9,a =y -b x =25.5-9×4.5=-15.∴ y ^=9x -15.5.① 解析:当b =0时,r =0,这时不具有线性相关关系,但b 能大于0也能小于0.6.②④ 解析:①正方形的边长与面积之间的关系是函数关系;②化妆品的销售量与广告宣传费之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系; ③人的身高与视力之间的关系既不是函数关系,也不是相关关系; ④能见度与交通事故的发生率之间具有相关关系; ⑤学生与其学号之间的关系是一种确定的对应关系.综合以上可知,②④具有相关关系,而①是函数关系,⑤是确定的对应关系.③中的两者之间没有因果关系 7.522解析:x 与y 的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.8.5.25 解析:x =2.5,y =3.5,∴a =y -b x =3.5-(-0.7)×2.5=5.25.二、解答题9.解:(1)选男生15×840=3(人),选女生25×840=5(人).(2)以数学成绩x 为横坐标,物理成绩y 为纵坐标作散点图如图.从散点图可以看出这些点大致分布在一条直线附近,并且在逐步上升,故物理成绩与数学成绩具有正相关性. 设y 与x 的线性回归方程是y ^=bx +a ,根据所给的数据,可以计算出b =≈0.65,a ≈84.875-0.65×77.5=34.5,所以y 与x 的线性回归方程是y ^=0.65x +34.5. 10.解:列出下表:1 2 3 4 5 6 7 8 9 101020 30 40 50 60 708090100626875818995102108115122用计算器求得:x =55,y =91.7,=∑∑==--101221011010i ii iix xyx yx =25510385007.91551055950⨯-⨯⨯-≈0.668.=y-x≈91.7-0.668×55=54.96.即所求的回归直线方程为yˆ=0.668+54.96.。
高中数学:2.4《线性回归方程课件》课件(苏教版必修三)
Part
02
线性回归方程的建立与求解
线性回归方程的建立方法
STEP 01
散点图观察
STEP 02
确定回归系数
通过绘制散点图,观察自 变量与因变量之间的关系 ,初步判断是否具有线性 关系。
STEP 03
检验残差
通过观察残差图或计算残 差平方和,检验模型的拟 合效果,判断是否需要进 一步调整模型。
根据最小二乘法原理,通 过计算得到回归系数,从 而确定线性回归方程的斜 率和截距。
以是( )
习题
A. ŷ = 1.23x + 4 B. ŷ = 1.23x + 5
C. ŷ = 1.23x + 4.5 D. ŷ = 1.23x + 3
3、题目:已知回归直线的斜率的估计值是1.23,且样本点的中心为(4,5),则回归直线的方 程可以是( )
习题
01
A. ŷ = 1.23x + 4 B. ŷ = 1.23x +5
预测性
利用线性回归方程可以对 未知数据进行预测。
线性回归方程的应用场景
经济预测
科学实验
通过对历史数据的分析,利用线性回 归方程预测未来经济指标的变化趋势 。
在科学实验中,通过控制变量法来研 究自变量和因变量之间的线性关系, 并利用线性回归方程进行数据分析。
销售预测
根据历史销售数据和市场调查,利用 线性回归方程预测未来产品的销售情 况。
增加自变量
增加自变量可以更好地解释因变 量的变化,从而优化线性回归方 程。
调整模型形式
根据实际情况调整模型形式,可 以更好地拟合数据,从而优化线 性回归方程。
Part
04
线性回归方程的实例分析
高中数学 2.4《线性回归方程》素材 苏教版必修3
线性回归方程导学一、学法指导利用样本数据的情况估计总体数据的情况,这是统计的基本思想.线性回归方程是从样本中各个数据之间的相关关系入手,来分析验证样本中各个数据的特点规律,进而对总体数据的相关关系作出估计.因此学好线性回归方程,要在进一步体会统计的基本思想和方法的基础上,还要回忆我们已学过的两个变量之间存在的函数关系(即确定性关系).学习本节时,首先要知道变量相互关系有两种:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我 们称它们为相关关系;其次是如何判断和分析具有相关关系的两个或多个变量,也就是如何寻找具有相关关系的两个变量中非确定性关系的某种确定性.本节的难点问题是建立回归直线方程的思想方法,其关键是如何用数学的方法来刻画“从整体上看各点与直线的距离最小”,即最贴近已知的数据点,最能代表变量x 与y 之间的关系,这就是“最小二乘法”的思想.另外还要注意,进行回归分析,通常先进行相关性检验,若能确定两个变量具有线性相关性,再去求其线性回归方程,否则所求方程毫无意义. 二、知识点概要 1.相关关系所谓相关关系是自变量取值一定时,因变量的取值带有一定的随机性. 对相关关系的理解应注意以下几点:(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,它也可能是伴随关系. (3)在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断. 2.回归分析对具有相关关系的两个变量进行统计分析的方法叫做回归分析.通俗地讲,回归分析就是寻找相关关系中非确定性关系的某种确定性. 3.散点图我们把一组具有相关关系的两个变量的数据()(123)i i x y i n ,,,,,对应的点(即样本点)画在坐标系内,得到的图形叫做散点图.利用散点图可以判断变量之间有无相关关系,所以判断两个变量之间是否存在某种关系时,必须从散点图入手.画出散点图,可以作出如下判断:(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即说明变量之间具有函数关系;(2)如果所有的样本点都落在某一函数曲线附近,则说明变量之间具有相关关系;(3)如果所有的样本点都落在某一直线附近,则变量之间具有线性相关关系.4.正相关、负相关线性相关关系又分为正相关和负相关.正相关是指两个变量具有相同的变化趋势,即从整体上来看一个变量会随另一个变量变大而变大.从散点图可以看出因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域.负相关是指两个变量具有相反的变化趋势,即从整体上来看一个变量会随另一个变量变大而变小.负相关的散点图中的点分布在左上角到右下角的区域.由此,我们得出判断两个变量之间到底是不是具有线性相关关系,可以用“数据”说话,画出散点图更具有说服力.5.回归直线和回归直线方程如果散点图中的点的分布从整体上看大致在一条直线附近,就称这两变量之间具有线性相关关系.这条直线叫做这两个变量的回归直线,回归直线的方程叫做回归方程.这里注意,只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性相关关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述这两个变量之间的关系.(1)求回归直线方程的思想方法观察散点图的特征,发现各点大致分布在一条直线的附近.类似图中的直线可画出不止一条,比如可以连接最左侧点和最右侧点得到一条直线,也可以让画出的直线上方的点和下方的点数目相等,……,但这些能保证各点与此直线在整体上是最接近的吗?它们虽然都有一定的道理,却总让人感到可靠性不强.那么,其中的哪一条直线最能代表变量x与y之间的关系呢?实际上求回归直线方程的关键是如何用数学的方法来刻画“从整体上看各点与此直线的距离最小”,即最贴近已知的数据点,最能代表变量x与y之间的关系.最能代表变量x与y之间关系的直线的特征是直线与这n个点的离差的平方和最小.(2)回归直线方程的求法根据最小二乘法的思想和公式,利用计算器或计算机,可以方便地求出回归方程.利用计算机求回归方程(Excel软件):在Excel的工作表中添加“图表”得到散点图后,用鼠标选中散点,单击鼠标右键,单击“添加趋势线”,在出现的对话框中单击类型标签,选择“线性”,单击“选项”标签,选中“显示公式”单选框,最后点击“确定”即可.利用科学计算器求回归方程:大多科学计算器都有回归计算(REG模式),但不同的计算器参数可能不同,这里不作详细介绍.一般在输入数据后按相应按键可直接得到a和b,这样就可以写出回归方程y bx a=+,非常简便,同学们在使用前一定要看懂计算器的使用说明书.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并且可根据情况进行估测、补充.因此,学过回归直线方程以后,应能积极应用回归直线方程解决一些相关的实际问题,并进一步体会回归直线的应用价值. (3)相关系数与相关性检验给定()(123)i i x y i n =,,,,,,只要123n x x x x ,,,,不全相等,就能求出一条回归直线,但它有无意义可是一个大问题.由于根据散点图看数据点是否大致在一直线附近主观性太强,为此可以利用样本相关系数来衡量两个变量之间线性关系的强弱. 样本相关系数:()()nii xx y y r --=∑叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量它们之间的线性相关程度.1r ≤,且|r|越接近于1,相关程度越高;r 越接近于0,相关程度越低.统计学认为,相关变量的相关系数: [10.75]r ∈--,时,两变量负相关很强; [0.751]r ∈,时,两变量正相关很强;(]0.750.3r ∈--,或[)0.30.75,时,两变量相关性一般;[0.250.25]r ∈-,时,两变量相关程度很弱.三、特别提示1.相关关系的理解.借助实例(如数学成绩与物理成绩之间的关系,粮食产量与施肥量之间的关系,吸烟与健康之间的关系,父母身高与子女身高之间的关系等)明确相关关系与函数关系不同,它是一种非确定性的关系,即一个变量取值一定时,另一个变量的取值带有一定的随机性.相关关系包括正相关和负相关.2.相关关系的研究方法:散点图法和写出回归直线方程y bx a =+,其中11112222111n n n n i i i i i i i i i i n n ni i i i i i n x y x y x y nx y b x nx n x x a y bx =======⎧⎛⎫⎛⎫--⎪ ⎪⎪⎝⎭⎝⎭⎪==⎪⎛⎫⎨-- ⎪⎪⎝⎭⎪⎪=-⎩∑∑∑∑∑∑∑,.3.线性回归思想:把相关关系(不确定性关系)转化为函数关系(确定性关系).当两个具有相关关系的变量近似满足一次函数关系时,所进行的回归分析又叫线性回归分析,所求的函数关系y bx a =+就是线性回归方程.4.求线性回归直线方程前应对数据进行线性相关分析,其关键是求a b ,,由于计算量大,因此计算过程要注意分层次、按步骤进行. 线性回归中的相关系数线性回归问题在生活中应用广泛,求解回归直线方程时,应该先判断两个变量是否是线性相关,若相关再求其直线方程,判断两个变量有无相关关系的一种常用的简便方法是绘制散点图;另外一种方法是量化的检验法,即相关系数法.下面为同学们介绍相关系数法. 一、关于相关系数法统计中常用相关系数r 来衡量两个变量之间的线性相关的强弱,当i x 不全为零,y i 也不全为零时,则两个变量的相关系数的计算公式是:()()nnii i ixx y y x ynx yr ---==∑∑r 就叫做变量y 与x 的相关系数(简称相关系数).说明:(1)对于相关系数r ,首先值得注意的是它的符号,当r 为正数时,表示变量x ,y 正相关;当r 为负数时,表示两个变量x ,y 负相关;(2)另外注意r 的大小,如果[]0.751r ∈,,那么正相关很强;如果[]10.75r ∈--,,那么负相关很强;如果(]0.750.30r ∈--,或[)0.300.75r ∈,,那么相关性一般;如果[]0.250.25r ∈-,,那么相关性较弱.下面我们就用相关系数法来分析身边的问题,确定两个变量是否相关,并且求出两个变量间的回归直线. 二、典型例题剖析77(1)对变量y 与x 进行相关性检验;(2)如果y 与x 之间具有线性相关关系,求回归直线方程; (3)如果父亲的身高为73英寸,估计儿子身高.解:(1)66.8x =,67y =,102144794i i x ==∑,102144929.22i i y ==∑,4475.6x y =,24462.24x =,24489y =,10144836.4i i i x y ==∑,所以10i ix ynx yr -=∑44836.4104475.6(4479444622.4)(44929.2244890)-⨯=--80.40.9882.04=≈≈, 所以y 与x 之间具有线性相关关系. (2)设回归直线方程为y a bx =+,则101102211010i ii i i x yxyb x x==-=-∑∑44836.4447560.46854479444622.4-=≈-,670.468566.835.7042a y bx =-=-⨯=.故所求的回归直线方程为0.468535.7042y x =+.(3)当73x =英寸时,0.46857335.704269.9047y =⨯+=, 所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.点评:回归直线是对两个变量线性相关关系的定量描述,利用回归直线,可以对一些实际问题进行分析、预测,由一个变量的变化可以推测出另一个变量的变化.这是此类问题常见题型.例2 10其中x 为高一数学成绩,y 为高二数学成绩. (1)y 与x 是否具有相关关系;(2)如果y 与x 是相关关系,求回归直线方程. 解:(1)由已知表格中的数据,利用计算器进行计算得101710ii x==∑,101723i i y ==∑,71x =,72.3y =,10151467i i i x y ==∑.102150520ii x==∑,102152541i i y ==∑.1010i ix yx yr -=∑0.78=≈.由于0.78r ≈,由0.780.75>知,有很大的把握认为x 与y 之间具有线性相关关系. (2)y 与x 具有线性相关关系,设回归直线方程为y a bx =+,则1011022211051467107172.31.2250520107110i ii i i x yx yb x x==--⨯⨯==≈-⨯-∑∑, 72.3 1.227114.32a y bx =-=-⨯=-.所以y 关于x 的回归直线方程为 1.2214.32y x =-.点评:通过以上两例可以看出,回归方程在生活中应用广泛,要明确这类问题的计算公式、解题步骤,并会通过计算确定两个变量是否具有相关关系.方方面面评说回归直线方程一、回归分析对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法.两个变量具有相关关系是回归分析的前提.(2)对于关系不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行回归分析.(3)通过散点图的观察,一般地,若图中数据大致分布在一条直线附近,那么这两个变量近似成线性相关关系.(4)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义. 二、回归直线方程一般地,设x 与y 是具有相关关系的两个变量,且对应于n 组观测值的n 个点(()12)i i x y i n =,,,,,大致分布在一条直线的附近,求在整体上与这n 个点最接近的一条直线,记此直线方程为y a bx =+ (1)这里在y 的上方加记号“^”,是为了区分Y 的实际值y ,表示当x 取值(12)i x i n =,,,时,Y 相应的观察值为i y ,而直线上对应于i x 的纵坐标是i y a bx =+.(1)式叫做Y 对x 的回归直线方程,a ,b 叫做回归系数. 三、求回归直线方程的思想方法 在观察散点图特征时,我们会发现有时各点大致分布在一条直线的附近,且画出不止一条类似的直线,而最能代表变量x 与y 之间关系的直线的特征,即为n 个离差的平方和最小.设所求直线方程为y a bx =+,其中a ,b 是待定系数,则(12)i i y a bx i n =+=,,,. 于是得到各个离差()(12)i i i i y y y bx a i n -=-+=,,,. 显然,离差i i y y -的符号有正有负,若将它们相加会造成相互抵消,故采用n 个离差的平方和21()ni i i Q y bx a ==--∑,采用最小二乘法可求出使Q 为最小值时的a 和b .1122211()()()nnii i ii i nniii i xx y y x ynxyb xx xnx====---==--∑∑∑∑, a y bx =-,其中11n i i x x n ==∑,11ni i y y n ==∑.四、求回归直线方程的一般步骤(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出a ,b ,并写出回归直线方程.注:计算a ,b 时由于计算量较大,所以在计算时应借助技术手段(如计算器或计算机),认真细致,谨防计算中产生错误.例 在10年期间,某城市居民收入与某种商品的销售额之间的关系见下表.(1)画出散点图;(2)如果散点图中各点大致分布在一条直线的附近,求x 与y 之间的回归直线方程; (3)试预测居民年收入50亿元时这种商品的销售额.解题指导:只有散点图大致表现为线性时,求回归直线方程才有实际意义. 解:(1)散点图如图所示:(2)通过观察散点图可知各点大致分布在一条直线的附近.列出下表,利用计算器进行计算.序号 xy2x2yxy1 32.2 25.0 1036.84 625 805 2 31.1 30.0967.21900 933 3 32.9 34.0 1082.41 1156 1118.6 4 35.8 37.0 1281.64 1369 1324.6 5 37.1 39.0 1376.41 1521 1446.9 6 38.0 41.0 1444 1681 1558 7 39.0 42.0 1521 17645 1638 8 43.0 44.0 1849 1936 1892 9 44.6 48.0 1989.162304 2140.8 1046.0 51.0211626012346∑379.7 391 14663.67 15857 15202.91011022211015202.9379.739.1 1.447379.71014663.671010i ii ii x yx y b xx==--⨯==≈⎛⎫--⨯ ⎪⎝⎭∑∑。
(完整word版)高中数学新教材人教版目录
高中数学目录必修一第一章1.1 会合与会合的表示方法1.1.1 会合的观点1.1.2 会合的表示方法第二章2.1 函数2.1.1 函数2.1.2 函数的表示方法2.1.3 函数的单一性2.1.4 函数的奇偶性2.1.5 用计算机作函数图像(选学)2.2 一次函数和二次函数2.2.1 一次函数的性质与图像2.2.2 二次函数的性质与图像2.3 函数的应用( 1)2.4 函数与方程2.4.1 函数的零点2.4.2 求函数零点近似解的一种计算方法----二分法第三章基本初等函数(1)3.1 指数与指数函数3.1.1 实数指数幂及其运算3.1.2 指数函数3.2 对数与对数函数3.2.1 对数及其运算3.2.2 对数函数3.2.3 指数函数与对数函数的关系3.3 幂函数3.4 函数的应用( 2)必修二第一章立体几何初步1.1 空间几何体1.1.1 组成空间几何体的基本元素1.1.2 棱柱棱锥棱台的构造特点1.1.3 圆柱圆锥圆台和球1.1.4 投影与直观图1.1.5 三视图1.1.6 棱柱棱锥棱台和球的表面积1.1.7 柱锥台和球的体积1.2 点线面之间的地点关系1.2.1 平面的基天性质与推论1.2.2 空间中的平行关系1.2.3 空间中的垂直关系第二章平面分析几何初步2.1 平面直角坐标系中的基本公式2.1.1 数轴上的基本公式2.1.2 平面直角坐标系中的基本公式2.2 直线的方程2.2.1 直线方程的观点与直线的斜率2.2.2 直线方程的集中形式2.2.3 两条直线的地点关系2.2.4 点到直线的距离2.3 圆的方程2.3.1 圆的标准方程2.3.2 圆的一般方程2.3.3 直线与圆的地点关系2.3.4 圆与圆的地点关系2.4 空间直角坐标系2.4.1 空间直角坐标系2.4.2 空间两点距离公式必修三第一章算法初步1.1 算法与程序框图1.1.1 算法的观点1.1.2 程序框图1.1.3 算法的三种基本逻辑构造和框图表示1.2 基本算法语句1.2.1 赋值输入输出语句1.2.2 条件语句1.2.3 循环语句1.3 中国古代数学中的算法事例第二章统计2.1 随机抽样2.1.1 简单的随机抽样2.1.2 系统抽样2.1.3 分层抽样2.1.4 数据的采集2.2 用样本预计整体2.2.1 用样本的频次散布预计整体的散布2.2.2 用样本的数字特点预计整体的数字特点2.3 变量的有关性2.3.1 变量间的互相关系2.3.2 两个变量的线性有关第三章概率3.1 事件与概率3.1.1 随机现象3.1.2 事件与基本领件空间3.1.3 频次与概率3.1.4 概率的加法公式3.2 古典概型3.2.1 古典概型3.2.2 概率的一般加法公式(选学)3.3 随机数的含义与应用3.3.1 几何概型3.3.2 随机数的含义与应用3.4 概率的应用必修四第一章基本的初等函数(2)1.1 随意角的观点与弧度制1.1.1 角的观点的推行1.1.2 弧度制和弧度制与角度制的换算1.2 随意角的三角函数1.2.1 三角函数的定义1.2.2 单位圆与三角函数线1.2.3 同角三角函数的基本关系式1.2.4 引诱公式1.3 三角函数的图像与性质1.3.1 正弦函数的图像与性质1.3.2 余弦函数正切函数的图像与性质1.3.3 已知三角函数值求角第二章平面向量2.1 向量的线性运算2.1.1 向量的观点2.1.2 向量的加法2.1.3 向量的减法2.1.4 数乘向量2.1.5 向量共线的条件和轴上向量坐标运算2.2 向量的分解和向量的坐标运算2.2.1 平面向量基本定理2.2.2 向量的正交分解与向量的直角坐标运算2.2.3 用平面向量坐标表示向量共线条件2.3 平面向量的数目积2.3.1 向量数目积的物理背景与定义2.3.2 向量数目积的运算律2.3.3 向量数目积的坐标运算与胸怀公式2.4 向量的应用2.4.1 向量在几何中的应用2.4.2 向量在物理中的应用第三章三角恒等变换3.1 和角公式3.1.1 两角和与差的余弦3.1.2 两角和与差的正弦3.1.3 两角和与差的正切3.2 倍角公式和半角公式3.2.1 倍角公式3.2.2 半角的正弦余弦和正切3.3 三角函数的积化和差与和差化积必修五第一章解三角形1.1 正弦定理和余弦定理1.1.1 正弦定理1.1.2 余弦定理1.2 应用举例第二章数列2.1 数列2.1.1 数列2.1.2 数列的递推公式(选学)2.2 等差数列2.2.1 等差数列2.2.2 等差数列的前n 项和2.3 等比数列2.3.1 等比数列2.3.2 等比数列的前n 项和第三章不等式3.1 不等关系与不等式3.1.1 不等关系与不等式3.1.2 不等式性质3.2 均值不等式3.3 一元二次不等式及其解法3.4 不等式的实质应用3.5 二元一次不等式(组)与简单的线性规划问题3.5.1 二元一次不等式(组)所表示的平面地区3.5.2 简单线性规划选修 2-1第一章常用逻辑用语1.1 命题与量词1.1.1 命题1.1.2 量词1.2 基本逻辑联络词1.2.1 且与或1.2.2 非(否认)1.3 充足条件必需条件与命题的四种形式1.3.1 推出与充足条件必需条件1.3.2 命题的四种形式第二章圆锥曲线方程2.1 曲线方程2.1.1 曲线与方程的观点2.1.2 由曲线求它的方程由方程研究曲线性质2.2 椭圆2.2.1 椭圆的标准方程2.2.2 椭圆的几何性质2.3 双曲线2.3.1 双曲线的标准方程2.3.2 双曲线的几何性质2.4 抛物线2.4.1 抛物线的标准方程2.4.2 抛物线的几何性质2.5 直线与圆锥曲线第三章空间向量与几何体3.1 空间向量及其运算3.1.1 空间向量的线性运算3.1.2 空间向量的基本定理3.1.3 两个向量的数目积3.1.4 空间向量的直角坐标运算3.2 空间向量在立体几何中的应用3.2.1 直线的方向向量与直线的向量方程3.2.2 平面的法向量与平面的向量表示3.2.3 直线与平面的夹角3.2.4 二面角及其胸怀3.2.5 距离(选学)选修 2-2第一章导数及其应用1.1 导数1.1.1 函数的均匀变化率1.1.2 刹时速度与导数1.1.3 导数的几何1.2 导数的运算1.2.1 常数函数与幂函数的导数1.2.2 导数公式表及数学软件的应用1.2.3 导数的四则运算法例1.3 导数的应用1.3.1 利用导数判断函数的单一性1.3.2 利用导数研究函数的极值1.3.3 导数的实质应用1.4 定积分与微积分的基本定理1.4.1 曲边梯形面积与定积分1.4.2 微积分基本定理第二章推理与证明2.1 合情推理与演绎推理2.1.1 合情推理2.1.2 演绎推理2.2 直接证明与间接证明2.2.1 综合法与剖析法2.2.2 反证法2.3 数学概括法2.3.1 数学概括法2.3.2 数学概括法应用举例第三章数系的扩大与复数3.1 数系的扩大与复数的观点3.1.1 实数系3.1.2 复数的观点3.1.3 复数的几何意义3.2 复数的运算3.2.1 复数的加法与减法3.2.2 复数的乘法3.2.3 复数的除法选修 2-3第一章计数原理1.1 基本计数原理1.2 摆列与组合1.2.1 摆列1.2.2 组合1.3 二项式定理1.3.1 二项式定理1.3.2 杨辉三角第二章概率2.1 失散型随机变量及其散布列2.1.1 失散型随机变量2.1.2 失散型随机变量的散布列2.1.3 超几何散布2.2 条件概率与实践的独立性2.2.1 条件概率2.2.2 事件的独立性2.2.3 独立重复试验与二项散布2.3 随机变量的数字特点2.3.1 失散型随机变量的数学希望2.3.2 失散型随机变量的方差2.4 正态散布第三章统计事例3.1 独立性查验3.2 回归剖析选修 4-4第一章坐标系1.1 直角坐标系平面上的伸缩变换1.1.1 直角坐标系1.1.2 平面上的伸缩变换1.2 极坐标系1.2.1 平面上点的极坐标1.2.2 极坐标与直角坐标的关系1.3 曲线的极坐标方程1.4 圆的极坐标方程1.4.1 圆心在极轴上且过极点的圆1.4.2 圆心在点( a,∏ /2 )处且过极点的圆1.5 柱坐标系和球坐标系1.5.1 柱坐标系1.5.2 球坐标系第二章参数方程2.1 曲线的参数方程2.1.1 抛射体的运动2.1.2 曲线的参数方程2.2 直线与圆的参数方程2.2.1 直线的参数方程2.2.2 圆的参数方程2.3 圆锥曲线的参数方程2.3.1 椭圆的参数方程2.3.2 双曲线的参数方程2.3.3 抛物线的参数方程2.4 一些常有曲线的参数方程2.4.1 摆线的参数方程2.4.2 圆的渐开线的参数方程。
线性回归方程(高中数学)
线性回归方程(高中数学)篇一:高中数学《线性回归方程》教案(2)线性回归方程教学目标:(1)了解非确定性关系中两个变量的统计方法;(2)掌握散点图的画法及在统计中的作用;(3)掌握回归直线方程的实际应用。
教学重点: 线性回归方程的求解。
教学难点: 回归直线方程在现实生活与生产中的应用。
教学过程:一、复习练习1.下例说法不正确的是( B )A.在线性回归分析中,x和y都是变量;B.变量之间的关系若是非确定关系,那么x不能由y唯一确定;C.由两个变量所对应的散点图,可判断变量之间有无相关关系;D.相关关系是一种非确定性关系.2.已知回归方程y??0.5x?0.81,则x=25时, y的估计值为__11.69____.,24)的线性回归方程是(D )3.三点(3,10),(7,20),(11 1.75?1.75x By??1.75?5.75x Ay1.75?5.75x Dy??1.75?1.75x C y4.我们考虑两个表示变量x与y之间的关系的模型,?为误差项,模型如下:模型1:y?6?4x:;模型2:y?6?4x?e.(1)如果x?3,e?1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型.解(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x值一定得到相同的y值.所以是确定性模型;模型2中相同的x值,因?不同,且?为误差项是随机的,所以模型2是随机性模型。
二、典例分析例1、一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:程.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知: x?55,y?91.7,?xi?38500,?yi?87777,?xiyi?55950 22i?1i?1i?1101010bxy10xyiii?11010?xi2?10xi?12?55950?10?55?91.7?0.668 238500?10?55a?y?bx?91.7?0.668?55?54.96因此,所求线性回归方程为y?bx?a?0.668x?54.96例2、已知10只狗的血球体积及红血球数的测量值如下:(1)画出上表的散点图;(2)求出回归直线方程并画出图形.解:x?1(45?42?46?48?42?35?58?40?39?50)?44.50 10y?1(6.53?6.30?9.52?7.50?6.99?5.90?9.49?6.20?6.55?8.72)=7.37 10设回归直线方程为y?bx?a则b??xy?10xyiii?11010?xi?12i?10x2?0.175a?y?bx= -0.418所以所求回归直线的方程为y?0.175x?0.148例3、以下是收集到的新房屋销售价格y与房屋的大小x 的数据:上回归直线;(3)计算此时Q(a,b)和Q(2,0.2)的值,并作比较.解:(1)(2) n?5,?xi?15i?545,?109,?yi?116,?23.2, i?155?xi?152i?60952,?xiyi?12952 i?1b?5?12952?545?116?0.1962,a?23.2?0.1962?109?1.8166 25?60952?545所以,线性回归方程为y?0.1962x?1.8166(3) Q(1.8166,0.1962)?5.171,Q(2,0.2)?7.0由此可知,求得的a?1.8166,b?0.9162是函数Q(a,b)取最小值的a,b值.三、课堂练习1.为了考察两个变量x和y之间的线性相关性,甲乙两位同学各自独立做了10次和15次实验,并且利用线性回归直线分别为l1,l2,已知两人获得的实验数据中,变量x和y的数据平均值都相等,且分别为s,t那么下例说话正确的是() A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t)C.必有l1// l2 D.l1和l2与必定重合2.已知关于某设备的使用年限x与所支出的维修费用y (万元),有如下统计资料:设y对x程线性相关关系.试求:(1)线性回归方程y?bx?a的回归系数a,b;(2)估计使用年限为10年时,维修费用多少?四、回顾小结:求线性回归方程的步骤:?(1)、(2)计算xi与yi的积,求?xiyi,2(3)计算?x2,y?i,i(4)将上述有关结果代入公式,求b,a写出回归直线方程.五、课外作业:课本第82页第9题.篇二:高中数学线性回归方程讲解练习题1审阅人:2篇三:线性回归方程[高考数学总复习][高中数学课时训] 线性回归方程基础自测①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.1.下列关系中,是相关关系的为(填序号).答案①②2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x 的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号). ①直线l1,l2有交点(s,t)②直线l1,l2相交,但是交点未必是(s,t) ③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合答案① 3.下列有关线性回归的说法,正确的是(填序号). ①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③ 4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;?x+a?,可以估计和预测变量的取值和变化趋势. ?=b?及回归系数b③通过回归直线y其中正确命题的序号是. 答案①②③=0.50x-0.81,则x=25时,y?的估计值为 . 5.已知回归方程为y答案11.69例 1 下面是水稻产量与施化肥量的一组观测数据:施化肥量水稻产量15 20 25 30 35 40 45 320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.例2 (14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程. 解(1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. (2)=110n7分110(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,=(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,9分 =bxyi?1nii?n?≈0.813 6,2ixi?1n2a=1.42-1.74×0.813 6≈0.004 3,13分=0.813 6x+0.004 3. ∴回归方程y14分例 3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;x+a=b;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解(1)散点图如下图:(2)=43?4?5?64=4.5,=2.5?3?4?4.54=3.5xi?14iyi=3×2.5+4×3+4×5+6×4.5=66.5. xi?12i=32+42+52+62=864=∴bxyii?14i4=2i66.5?4?3.5?4.586?4?4.52=0.7xi?142=3.5-0.7×4.5=0.35. =-b=0.7x+0.35. ∴所求的线性回归方程为y(3)现在生产100吨甲产品用煤y=0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.(1)试画出散点图;(2)判断两个变量是否具有相关关系. 解(1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由资料看y与x呈线性相关,试求回归方程. 解=30,= 566.7?76.0?85.0?112.3?128.05=93.6.=bi?15i?1iyi?5?≈0.880 9.2ixa52=93.6-0.880 9×30=67.173. =-b=0.880 9x+67.173. ∴回归方程为y3.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少?(3)假定产量为6 000件时,单位成本为多少元? 66i解(1)n=6,xi?1=21,yi?1i=426,=3.5,=71, 662xii?1=79,xyii?1i=1 481,6=bxi?16i?1iyi?6?=2i1481?6?3.5?7179?6?3.52=-1.82.xa62=71+1.82×3.5=77.37. =-bx=77.37-1.82x. =a+b回归方程为y?=-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有: (2)因为单位成本平均变动b产量每增加一个单位即 1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x=6,代入回归方程:y=77.37-1.82×6=66.45(元)当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是.答案a,c,b=1.5x-15,则下列说法正确的有个. 2.回归方程y①=1.5-15 ②15是回归系数a ③1.5是回归系数a ④x=10时,y=0 答案 13.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为y=8.25x+60.13,下列叙述正确的是.①该地区一个10岁儿童的身高为142.63 cm ②该地区2~9岁的儿童每年身高约增加8.25 cm。
高中数学第2章统计2.4线性回归方程(2)教案苏教版必修3(new)
2。
4 线性回归方程第2课时导入新课在上一节课中问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油量y如下表:从表里数据得出油量y与时间t之间的函数关系式为y=2x(x≥0).并且在直角坐标系里很容易作出它们的图象,我们知道各点在同一条直线上。
再看下面的问题(即上一节课的练习2):某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表:请大家动手作出热茶销售量与气温的坐标图,说说它的特点,能得到什么规律?分析:该图中所有点不像第一个问题中函数关系的图象对应的点在同一条直线上,但是分布也是很有规律,它们散布在从左上角到右下角的区域,因此,可以得到规律是随着气温的增加,热茶卖出的杯数在减少。
但究竟以什么样的方式在减少呢?这就是今天要继续学习的内容——线性回归方程.推进新课新知探究以横坐标x表示气温,纵坐标y表示热茶销量,建立平面直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到上图,今后我们称这样的图为散点图。
1。
散点图(scatterplot):表示具有相关关系的两个变量的一组数据的图形叫做散点图。
散点图形象地反映了各对数据的密切程度。
粗略地看,散点分布具有一定的规律。
在本图中这些点散布的位置也是值得注意的,它们散布在从左上角到右下角的区域,对于这种相关关系,我们称它为负相关.如果点散布在从左下角到右上角的区域.对于这种相关关系,我们称它为正相关.请学生举例:两个变量之间是正相关的关系.例如:某小卖部卖的冷饮销售量与气温之间的关系.再看上节课的练习 1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:如果作出散点图如右图,它是散布在从左下角到右上角的区域,也是正相关的关系.回到解热茶销售量与气温之间的关系的散点图来,从图中可以得到规律是随着气温的增加,热饮的销售量在减少,究竟以什么样的方式减少呢?分析:分布情况是在从左上角到右下角的区域的某条直线附近摆动。
高中数学必修三练习题(精编)
高中数学必修三练习题(精编)必修三第三章测试卷一、选择题:1.从甲、乙、丙三人中任选两名代表,甲被选中的概率是( 1/3 )。
2.将骰子向桌面上先后抛掷2次,其中向上的数之积为12的结果有( 2 )种。
3.在面积为S的△ABC的内部任取一点P,则△PBC的面积小于△ABC面积的概率为( 1/3 )。
4.从一批产品中取出三件产品,设A=“三件产品全不是次品”,B=“三件产品全是次品”,C=“三件产品不全是次品”,则下列结论正确的是( A )A与C互斥。
5.如图,是由一个圆、一个三角形和一个长方形构成的组合图形,现用红、蓝两种颜色为其涂色,每个图形只能涂一种颜色,则三个形状颜色不全相同的概率为( 3/8 )。
6.给甲、乙、丙三人打电话,若打电话的顺序是任意的,则第一个打电话给甲的概率是( 1/3 )。
7.在区间[-π,π]内随机取两个数分别记为a,b,则使得函数f(x)=x2+2ax-b2+π2有零点的概率为( 1/2 )。
8.如图所示,茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中有一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是( 27/49 )。
9.节日前夕,XXX在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮相互独立,且都在通电后的4秒内任一时刻等可能发生,然后每串彩灯以4秒内间隔闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过2秒的概率是( 1/3 )。
10.一个数学兴趣小组有女同学2名,男同学3名,现从这个数学兴趣小组中任选2名同学参加数学竞赛,则参加数学竞赛的2名同学中,女同学人数不少于男同学人数的概率为( 3/10 )。
11.掷一枚均匀的正六面体骰子,设A表示事件“出现2点”,B表示“出现奇数点”,则P(A∪B)等于( 1/2 )。
12.如图,在圆心角为直角的扇形OAB中,分别以OA,OB为直径作两个半圆,在扇形OAB内随机取一点,则此点取自阴影部分的概率是(1/2π )。
2.4 线性回归方程
-1
杯数
20
24
34
38
50
64
如果某天的气温是-50C,你能根据这些数据预测这天小卖部卖处热茶 的杯数吗?
x
x1
x2
x3
…
xn
y
y1
y2
y3
…
yn
若上面数据满足线性相关关系,那么 y bx a
则称为这n个数据的线性回归方程.
其中
n
n
n
n
xi yi
xi
yi
b
i 1
i 1
i 1
n
n
i 1
20
10 -5 0
E DC
B A
5 15 25 35 x
答:都分布在同一条直线的附近.
象这样能用直线方程 y bx来表a示两个变量之间的相关关系我
们把它称为线性相关关系.
某小卖部为了了解热茶销售量与气温之间的系, 随机统计并制作了某6天卖出热茶的杯数与当天气 温的对照表:
气温
26
18
13
10
4
高中数学 必修3
思考下列问题:
两个变量之间的常见关系有几种?
(1)确定性的函数关系,变量之间的关系可以用函数表示. (2)相关关系,变量之间有一定的联系,但不能完全用函数来表示.
A 1.球的体积和球的半径具有( )
A.函数关系
B.相关关系
C.不确定关系
D.无任何关系
D 2.下列两个变量之间的关系不是函数关系的是( )
50
64
气 26 18 13 10 4 -1
温
y
杯 20 24 34 38 50 数
为了了解热茶销
售与气温的大致关系,
江苏省宿迁中学苏教版高中数学必修三练习24线性回归方程二 含答案
2.4线性回归方程(二) 【新知导读】r ,下列说法正确的是 ( )1.对于线性相关系数 )(0,??rr ?越大,相关程度越高;反之相关程度越低A 时,.r ?(??,??)r 越大,相关程度越高,反之相关程度越低 时,B .r ?1rr 越接近于.0,越接近于1,相关程度越低 时,相关程度越高;CD .以上说法都不正确2.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的.他x y 的在儿子的身高与父亲的身高的研究结果是子代的平均身高向中心回归.根据他的结论,?bx ??ay b ( ) 中,回归直线方程0 .等于内 BA .在(-1,0)),??[1 .在 D 内C .在(0,1)内?)y )(x ,x ,y )(x ,y (a ?y ?bx ,那.由一组样本数据3,得到的线性回归方程为,.,..n 1n 122 ( ) 么下面说法不正确的是? a ?y ?bx )x ,y ( 经过点A .直线?)yy )(x ,,(x ,y )(xa ??ybx B .直线中的一个点,,.至少经过..,n 21n 12n?ynxy ?x ii ?1?i a ?y ?bxC .直线的斜率为n 2?2nxx ?i 1?in ??2y ,,(xy )(x ,()xy ))]?(bxa [y ?a ??ybx 是该坐和各点,..的偏差D .直线,.,n 2n 121ii 1i ?标平面上所有直线与这些点的偏差中最小的 【范例点睛】 测得例1 10对某国父子身高(如下:单位:英寸)x 父亲身高() 60 62 64 65 66 67 68 70 72 74y x 进行相关性检验; 与 (1)对变量x y 之间具有线性相关关系,求回归直线方程;如果 与 (2)英寸,估计儿子的身高.73如果父亲的身高为 (3). 【课外链接】1.现有一个由身高预测体重的回归方程,体重预测值=4(磅/英寸)×身高-130磅.其中体重和身高分别以磅和英寸为单位.如果将它们分别以kg 、cm 为单位(1英寸≈2.5cm ,1磅≈0.45kg).回归方程应该是_ _________________________________. 【随堂演练】1.对于回归分析,下列说法错误的是 ( )A .在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B .线性相关系数可以是正的或负的2?r 1x y 之间完全线性相关C .在回归分析中,如果与,说明r ?(??,??) .相关样本系数D ?a ?y ?bx ( ).线性回归方程必过2 xxyy (点点,0) C .)(0,,)点(0,0)A .点 B . D(.x y 次150100和次和之间的线性相关性,甲、乙两位同学各自独立做了3.为了考察两个变量llx 的和假设两个人在试验中发现对变量.求得回归直线分别为试验,并且利用线性回归方法,12m y t 观察的平均值都是)观察数据的平均值都是,那么下列说法正确的是(,对变量ll ),t (m 和A .有交点12ll )t (m , .相交,但交点不一定是和B 12ll 和C .必定平行12ll 和D .必定重合12 .在研究硝酸钠的可溶性时,对不同的温度观察它在水中的溶解度,得观察结果如下:4由此得到回归直线的斜率是__________________(保留4位有效数字).5.下面数据是从年龄在40到60岁的男子中随机抽取6个个体,分别测得的每个个体心脏功能x的相关系数为______________________ .与则?250??5xy x时,预计的水稻80kg的线性回归方程为,当施肥量为6.若施肥量与水稻产量.产量为______________kgx y的关系,某地区(为了研究三月下旬的平均气温())与四月十二号前棉花害虫化蛹高峰日7.年的情况,得到下面数据:年至2001观察了199620011999 2000 1996 1997 1998 年份o xC24.4 29.6 32.9 28.7 30.3 28.9) (y 19 6 1 10 1 8o27C,试估计2002年三月下旬平均气温为2002年四月化蛹高峰日为据气象预测,(1)该地区在y x进行相关性检验.、对变量哪天;(2)????yxy)(y?y)x??xy?nxy?x(x?,从而回归直8.,其中,证明恒等式nnnn1?)y)(y?(x?x iii?1.线的斜率还可以写成n?2)(x?x i1?i iiiiii n11i?i?1i?1?in???2)?yy(x?78?4.2y;计算依据这些数据画出散点图并作直线(2)依据这些数据由最,(1)ii10??2)y(y?.小二乘法估计线性回归方程,并据此计算ii1i?10.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,数据如下:产量(件) 40424855657988100 120 140xx yy进行相关性分析;与的相关系数,并对与计算(1)x y之间具有线性相关关系,求线性回归方程.如果(2)与2.4线性回归方程(二)【新知导读】1.C 2.C 3.B【范例点睛】? 1010??2266.8?x?x44941y?44794xy?67.01y?4476.27,,,例1.,(1),ii1i?i?110yxy?10x ii1022?1?i4462.24x?44842.4y?x??r4490.34y?,,,ii1010221i???22)?y(10xy?10x)(ii1i?1i?44842.4?10?4476.2779.779.7???0.9801?.因为81.316611.74844903.4)44622.4)(44941.93?(44794?yy xx0.9801r?具有较强的相关关系,所以与也就是说接近与1,之间具有线性相关关系.(2)10?yx?10xy ii44842.4?44762.779.7?1?i??bay?bx??,由设回归直线方程为?2x?x10i1?i1044794?44622.4171.62a?y?bx?67.01?0.4645?66.8?35.980.4645?,所,以所求直线方程为?39.98x?y?0.464569.935.98??73?y?0.464573x?73.(3)时,,所以当父亲身高为当英寸.英寸时,估计儿子的身高为69.9 】【课外链接58.5kg ×身高-体重预测值=0.72(kg/cm) 】【随堂演练3.A 2.D 1.D6.650 5.-4.0.8809 0.9023????21222.6y?5130.92y??y?7.5xx?x?x29.13,666611,7.解:(1),,iiiii661??1i?1i?1ii6?yx?6yx ii?1?i??b??2.2a?y?bx?7.5?(?2.2)?29.13?71.6?回归直,线,方程为622x?6x i1?i??12.2?71.6272.2?y???2.2?y?x71.6?27?x4年2002.据此,可估计该地区时,.当.6?y6xxy?ii1i???0.9342r r的值接近于13日化蛹高峰日.(2),月12日或6622??22)(yxy?6x)(?6ii1?i?1i y x存在线性相关关系.,1,所以变量8.证明:nnnnn?????yy?ynxxy?xy)?xxy?x?(x?x)(y?y)?x(y?xy?iiiiiiiiii11i?1i?i?1i?1i???i?1?ynxyx??xy?nxy?nxy?nxy??,回归直线的斜率为n?ynxy?x iinn?)yy?x?x)((ii1?i.n?iiiin?221i?1i?)xxn(?i1?in2)(x?x i1i??x?4.2y?78的图形如图所示,散点图与直线解:(1)9.?82.2,90.6,94.8,94.8,y?103.2,1,3,...,13x?,对???10??2178.48)?y(y?111.6,120,120,124.2,132.6,.ii1i?10101012?x?7x(x?x)(y?y)??(x?x)142ll?108y?,,(2),xxixyiii101?1i?1ii?l568?xy80?4x??y80??4?7?a?y?bx1084?b??568?,所以,,.142l xx10???284,92,96,96,104,112,120,120,124,132y?170y)?(y?,.iii1?i10101657777??22277119y70903??x?xy77.7??165.7?由题意可得,解:(1),,,10.?132929x?y?r.ii10101??1ii10165.7??77.7?13292910ii22)165.7?10?)(27711977.7?10?(709031?i132929?10?77.7?165.7??0.397b x y0.806?,与(2)之间具有显著的相关性.,因此277.7?1070903??134.8x?0.397y?134.80.397165.7a???77.7?,所以线性回归方程为.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.4线性回归方程(二)
【新知导读】
1.对于线性相关系数r ,下列说法正确的是 ( )
A .(0,)r ∈+∞时,r 越大,相关程度越高;反之相关程度越低
B .(,)r ∈-∞+∞时,r 越大,相关程度越高,反之相关程度越低
C .1r ≤时,r 越接近于1,相关程度越高;r 越接近于0,相关程度越低
D .以上说法都不正确
2.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的.他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y 与父亲的身高x 的回归直线方程y a bx ∧
=+中,b ( )
A .在(-1,0)内
B .等于0
C .在(0,1)内
D .在[1,)+∞内
3.由一组样本数据11(,)x y ,22(,)x y ,...,(,)n n x y 得到的线性回归方程为y bx a ∧=+,那么下面说法不正确的是 ( )
A .直线y bx a ∧=+经过点(,)x y
B .直线y bx a ∧=+至少经过11(,)x y ,22(,)x y ,...,(,)n n x y 中的一个点
C .直线y bx a ∧=+的斜率为1
221n i i
i n i i x y nx y x
nx ==--∑∑
D .直线y bx a ∧=+和各点11(,)x y ,22(,)x y ,...,(,)n n x y
的偏差21[()]n i i i y bx a =-+∑是该坐标平面上所有直线与这些点的偏差中最小的
【范例点睛】
例1 测得10对某国父子身高(单位:英寸)如下:
(2) 如果y 与x 之间具有线性相关关系,求回归直线方程;
(3) 如果父亲的身高为73英寸,估计儿子的身高.。