高中数学线性回归方程检测试题附答案
高一数学一元线性回归案例试题
高一数学一元线性回归案例试题1. (2014•重庆一模)某小卖部销售一品牌饮料的零售价x (元/瓶)与销量y (瓶)的关系统计如下:已知x ,y 的关系符合线性回归方程,其中,.当单价为4.2元时,估计该小卖部销售这种品牌饮料的销量为( ) A.20 B.22 C.24 D.26 【答案】D【解析】利用平均数公式计算平均数,,利用b=﹣20求出a ,即可得到回归直线方程,把x=4.2代入回归方程求出y 值. 解:===3.5;==40,∴a=40﹣(﹣20)×3.5=110,∴回归直线方程为:=b +a=﹣20+110, 当=4.2时,=﹣20×4.2+110=26, 故选:D .点评:本题考查回归方程的求法,考查学生的计算能力,运算要细心.2. (2014•新余二模)已知某产品连续4个月的广告费用x i (i=1,2,3,4)千元与销售额y i (i=1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息: ①x 1+x 2+x 3+x 4=18,y 1+y 2+y 3+y 4=14;②广告费用x 和销售额y 之间具有较强的线性相关关系; ③回归直线方程=bx+a 中的b=0.8(用最小二乘法求得); 那么,当广告费用为6千元时,可预测销售额约为( ) A .3.5万元 B .4.7万元 C .4.9万元D .6.5万元【答案】B【解析】求出数据的中心点的坐标,代入回归直线方程求得系数a ,根据广告费用为6千元,求得预报变量y 的值. 解:∵=,=, ∴数据的中心为(,), 则=0.8×+a ,∴a=﹣,当广告费用为6千元时,可预测销售额y=0.8×6﹣0.1=4.7(万元). 故选:B .点评:本题考查了线性回归分析思想,考查了学生的数据处理能力,在回归分析中数据的中心在回归直线上.3. (2014•辽宁模拟)从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x (cm )160165170175180)A.70.09kg B.70.12kg C.70.55kg D.71.05kg【答案】B【解析】根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出的值,现在方程是一个确定的方程,根据所给的x的值,代入线性回归方程,预报身高为172cm的高三男生的体重解:由表中数据可得==170,==69∵(,)一定在回归直线方程=0.56x+上故69=0.56×170+解得=﹣26.2故=0.56x﹣26.2当x=172时,=0.56×172﹣26.2="70.12"故选B.点评:本题主要考查线性回归方程的求解与运用,解题的关键是线性回归方程经过样本点的中心同时注意理解线性回归方程中相关系数的意义.4.(2014•郑州模拟)某车间加工零件的数量x与加工时间y的统计数据如表:现已求得上表数据的回归方程中的值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为()A.84分钟B.94分钟C.102分钟D.112分钟【答案】C【解析】根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,代入样本中心点求出a的值,写出线性回归方程.将x=100代入回归直线方程,得y,可以预测加工100个零件需要102分钟,这是一个预报值,不是生产100个零件的准确的时间数.解:由表中数据得:=20,=30,又值为0.9,故a=30﹣0.9×20=12,∴y=0.9x+12.将x=100代入回归直线方程,得y=0.9×100+12=102(分钟).∴预测加工100个零件需要102分钟.故选C.点评:本题考查线性回归方程的求法和应用,解题的关键是正确应用最小二乘法求出线性回归方程的系数的运算,再一点就是代入样本中心点可以求出字母a的值,是一个中档题目.5.(2012•吉安县模拟)已知x,y的取值如表:x1234从散点图分析,y与x线性相关,且回归方程为,则a=()A.﹣0.15B.﹣0.26C.﹣0.35D.﹣0.61【答案】A【解析】首先求出这组数据的横标和纵标的平均数,写出这组数据的样本中心点,把样本中心点代入线性回归方程求出a的值,解:∵,∴这组数据的样本中心点是(2.5,4.5),∵y与x线性相关,且,,∴4.5=1.86×2.5+a,,∴a=﹣0.15,故选A.点评:本题考查线性回归方程的求解和应用,是一个基础题6.(2012•湘潭模拟)一位母亲记录了儿子3~7岁时的身高,并根据记录数据求得身高(单位:cm)与年龄的回归模型为.若用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是()A.身高一定是145cm B.身高在145cm以上C.身高在145cm左右D.身高在145cm以下【答案】C【解析】根据回归模型为,将x=10代入即可得到预测值.解:根据回归模型为,可得x=10时,=145cm故可预测10岁时的身高在145cm左右故选C.点评:本题考查回归模型的运用,解题的关键是理解回归模型的含义,从而合理预测.7.(2011•丰台区二模)已知x,y的取值如下表:从散点图可以看出y与x线性相关,且回归方程为,则a=()【答案】B【解析】本题考查的知识点是线性回归直线的性质,由线性回归直线方程中系数的求法,我们可知在回归直线上,满足回归直线的方程,我们根据已知表中数据计算出,再将点的坐标代入回归直线方程,即可求出对应的a值.解:∵点在回归直线上,计算得,∴回归方程过点(2,4.5)代入得4.5=0.95×2+a∴a=2.6;故选B.点评:本题就是考查回归方程过定点,考查线性回归方程,考查待定系数法求字母系数,是一个基础题8.(2010•沈阳三模)已知两个统计案例如下:①为了探究患慢性支气管炎与吸烟关系,调查了339名50岁以上的人,调查结果如表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析②取平均值B.①独立性检验②回归分析C.①回归分析②独立性检验D.①独立性检验②取平均值【答案】B【解析】本题考查的知识点是回归分析和独立性检验的概念及用法,回归分析主要判断两个定量变量之间的相关关系,而独立性检验主要用来分析两个定性变量(或称分类变量)的关系,由题目可知①中两个变量是定性变量(或称分类变量),②中两个变量是两个定量变量,分析即可得到答案.解:∵①中两个变量是定性变量(或称分类变量),②中两个变量是两个定量变量,∴对这些数据的处理所应用的统计方法是:①独立性检验②回归分析故选B点评:要判断处理数据时应采用的统计方法,关键是要分析数据中两个变量是定性变量还是定量变量,回归分析主要判断两个定量变量之间的相关关系,而独立性检验主要用来分析两个定性变量(或称分类变量)的关系.9.(2005•上海模拟)某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:A.计算机,营销,物流B.机械,计算机,化工C.营销,贸易,建筑D.机械,营销,建筑,化工【答案】B【解析】由于用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,根据表格的数据可以分别求出所有行业的应聘人数与招聘人数比值,然后根据这些比值即可求解.解:依题意得化工行业的应聘人数小于招聘人数,物流的应聘人数小于招聘人数,且比值化工行业大于物流机械的应聘人数大于招聘人数,故选B.点评:本题的考点是回归分析,主要考查了统计表的识别能力,解题的关键是会根据表格找出以后条件解决问题.10.实验测得四组(x,y)的值分别为(1,2),(2,3),(3,4),(4,4),则y与x间的线性回归方程是()A.y=﹣1+x B.y=1+x C.y=1.5+0.7x D.y=1+2x【答案】C【解析】根据所给的四对数据,算出y与x的平均数,把所求的平均数代入求b的公式,算出b 的值,再把它代入求a的式子,求出a的值,写出线性回归方程即可.解:根据题意得:==2.5,==3.25,b==0.7,a=﹣b=3.25﹣0.7×2.5=1.5,∴y与x间的线性回归方程是y=1.5+0.7x.故选:C.点评:本题考查线性回归方程的求法,在一组具有相关关系的变量的数据间,利用最小二乘法做出线性回归方程的系数,再代入样本中心点求出a的值,本题是一个基础题.。
(完整版)数学必修三回归分析经典题型(带答案)
数学必修三回归分析经典题型1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7ˆ+=x y用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 以下 D.身高在145.83cm 左右 【答案】D【解析】解:把x=10代入可以得到预测值为145.83,由于回归模型是针对3-9岁的孩子的,因此这个仅仅是估计值,只能说左右,不能说在上或者下,没有标准。
选D2.对有线性相关关系的两个变量建立的线性回归方程$y =$a+b $x ,关于回归系数b $,下面叙述正确的是________.①可以小于0;②大于0;③能等于0;④只能小于0. 【答案】①【解析】由b$和r 的公式可知,当r =0时,这两变量不具有线性相关关系,但b 能大于0也能小于0.3.对具有线性相关关系的变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是$y =3x +20,若101i i x =∑=18,则101i i y =∑=________.【答案】254【解析】由101i i x =∑=18 1.8.因为点在直线$y =3x +2025.4. 所以101i i y =∑=25.4×10=254.4.下表是某厂1~4由散点图可知,用水量其线性回归直线方程是y =-0.7x +a ,则a 等于________. 【答案】5.252.53.5,∵回归直线方程过定点, ∴3.5=-0.7×2.5+a. ∴a =5.25.5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到线性回归方程$y =b$x +$a ,那么下列说法正确的是________.①直线$y =b$x +$a 必经过点(x ,y ); ②直线$y =b$x +$a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ③直线$y =b$x +$a 的斜率为1221ni ii nii x ynx y xnx==--∑∑;④直线$y =b $x +$a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差$21()ni i i b a y x =⎡⎤⎣⎦∑$-+是该坐标平面上的直线与这些点的最小偏差.【答案】①③④【解析】回归直线的斜率为b ,故③正确,回归直线不一定经过样本点,但一定经过样本中心,故①正确,②不正确.6.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 【答案】185【解析】设父亲身高为173176,b$= $a=-b $ 176-1×173=3, ∴$y =x +3,当x =182时,$y =185.7.下表是关于宿州市服装机械厂某设备的使用年限(年)和所需要的维修费用y (万元)的几组统计数据:)请根据上表提供的数据,用最小二乘法求出y 关于的线性回归方程;(2)估计使用年限为10年时,维修费用为多少?【答案】解:(1)0.08 1.23yx =+线性回归方程为 (2)估计使用年限为10年时,维修费用为12.38万元. 【解析】(1)先求然后利用公可求出回归直线y ax b =+方程.(2)把x=10代入回归直线方程可得y 的值,就可得所求的值.解:(1906543222222512=++++=∑=i ixΘ又x y 23.108.0+=∴线性回归方程为 (2)把10=x 代入回归方程得到:38.121023.108.0=⨯+=y∴估计使用年限为10年时,维修费用为12.38万元.。
高二线性回归方程试题及答案
回归直线方程1、某公司为了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的. [附:回归直线的斜率和截距的最小二乘估计公式分别为.] (1)根据频率分布直方图计算图中各小长方形的宽度;(2)试估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入(单位:万元) 1 2 3 4 5 销售收益(单位:万元)2 3 27由表中的数据显示,与之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出关于的回归直线方程.401221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-==--∑∑4x y x y y x2、某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调()完成列联表,并判断在犯错误的概率不超过的前提下,能否认为选题与性 别有关.(Ⅰ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中共抽取8人进行问卷.若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为,求的分布列及数学期望. 附: ,其中.ξξE ξ()()()()()22n ad bc K a b c d a c b d -=++++n a b c d =+++3、面向全市招聘事业编工作人员,由人事、劳动、纪检等部门联合组织招聘考试,招聘考试分为两个阶段:笔试和面试.现将所有参赛选手参加笔试的成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表.(Ⅰ)求出上表中的x,y,z,s,p的值;(Ⅱ)按规定,笔试成绩不低于90分的应聘人员可以参加面试,且面试的方式采用单循环,以参加面试人员胜出的场数决定是否录用(即参加面试的所有人员中每两人必需进行一个场次的PK比赛).已知松山区有两名应聘人员取得面试资格,在所有的比赛中,求有松山区选手参加比赛的概率.答案1、某公司为了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的. [附:回归直线的斜率和截距的最小二乘估计公式分别为.] (1)根据频率分布直方图计算图中各小长方形的宽度;(2)试估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入(单位:万元) 1 2 3 4 5 销售收益(单位:万元)2 3 27由表中的数据显示,与之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出关于的回归直线方程.解:(1)设各小长方形的宽度为,由频率分布直方图中各小长方形的面积总和为1,可知,故,即图中各小长方形的宽度为2. …3分(2)由(1)知各小组依次是, 其中点分别为,对应的频率分别为,故可估计平均值为.7分 (3)由(2)可知空白栏中填5.由题意可知, ,401221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-==--∑∑4x y x y y x m (0.080.10.140.120.040.02)0.51m m +++++⋅==2m =[0,2),[2,4),[4,6),[6,8),[8,10),[10,12]1,3,5,7,9,110.16,0.20,0.28,0.24,0.08,0.0410.1630.250.2870.2490.08110.045⨯+⨯+⨯+⨯+⨯+⨯=12345232573, 3.855x y ++++++++====,,根据公式,可求得 ………………10分, ………………11分 所以所求的回归直线方程为. ………………12分2、某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调()完成列联表,并判断在犯错误的概率不超过的前提下,能否认为选题与性别有关.(Ⅰ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中共抽取8人进行问卷.若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为,求的分布列及数学期望. 附: ,其中.【解析】(Ⅰ)51122332455769i ii x y=⨯+⨯+⨯+⨯+⨯==∑522222211234555ii x==++++=∑26953 3.8121.2,555ˆ310b-⨯⨯===-⨯3.8 1.230ˆ.2a=-⨯= 1.20.2y x =+ξξE ξ()()()()()22n ad bc K a b c d a c b d -=++++n a b c d =+++,故不能认为选题与性别有关.…………………5分(Ⅱ)选择“坐标系与参数方程”与选择“不等式选讲”的人数比例为100:60=5:3, 所以抽取的8人中倾向“坐标系与参数方程”的人数为5,倾向“不等式选讲”的人 数为3.依题意,得,,,, . …………………9分 故的分布列如下:所以. …………………12分 3、面向全市招聘事业编工作人员 ,由人事、劳动、纪检等部门联合组织招聘考试,招聘考试分为两个阶段:笔试和面试.现将所有参赛选手参加笔试的成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表.(Ⅰ)求出上表中的x ,y ,z ,s ,p 的值;(Ⅱ)按规定,笔试成绩不低于90分的应聘人员可以参加面试,且面试的方式采用单循环,以参加面试人员胜出的场数决定是否录用(即参加面试的所有人员中每两人必需进行一个场次的 PK 比赛).已知松山区有两名应聘人员取得面试资格,在所有的比赛中,求有松山区选手参加比赛的概率. 解:(1)由题意知,参加招聘考试的人员共有p == 50人, ∴x == 0.18, 22160(9001800) 3.74 5.0241055510060K -=≈<⨯⨯⨯3,1,1,3=--ξ33381(3)56C P C =-==ξ12533815(1)56C C P C =-==ξ21533830(1)56C C P C ===ξ30533810(3)56C C P C ===ξξ115301033(1)135********E =-⨯+-⨯+⨯+⨯=ξ160.32950y = 50×0.38 = 19, Z = 50﹣9﹣19﹣16 = 6, S = = 0.12 ----------------------------------------------------------6分(Ⅱ)由(Ⅱ)知,参加面试的应聘人员共6人.若参加面试的6人分别记为:S 1 , S 2 , a , b , c , d .( 其中S 1 , S 2 表示松山区的参赛选手,a , b , c , d 表示其他旗、县的选手)则所有的比赛为: (S 1 , S 2 ) (S 1 , a ) (S 1 ,b ) (S 1 ,c ) (S 1 , d ) (S 2 , a ) (S 2 , b ) (S 2 , c ) (S 2 ,d ) (a , b ) ( a , c ) ( a , d ) ( b , c ) (b , d ) (c , d ) 共十五个场次的比赛,有松山区选手出现的比赛有9场. 若有松山区选手参加比赛的事件为:A 则P (A ) =-------------------------------12分65035。
线性回归方程(人教A版)(含答案)
线性回归方程(人教A版)一、单选题(共8道,每道12分)1.人的年龄与人体脂肪的百分数的回归方程为:,如果某人36岁,那么这个人的脂肪含量( )A.一定是B.在附近的可能性比较大C.无任何参考数据D.以上解释均无道理答案:B解题思路:试题难度:三颗星知识点:可线性化的回归分析2.根据如下样本数据:得到的回归方程为,则( )A. B.C. D.答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析3.已知变量与负相关,且由观测数据算得样本平均数,,则由该观测数据算得的线性回归方程可能是( )A. B.C. D.答案:D解题思路:试题难度:三颗星知识点:可线性化的回归分析4.对具有线性相关关系的变量,测得一组数据如下表:根据上表,利用最小二乘法得到它们的回归直线方程为,则的值为( )A.1B.1.5C.2D.2.5答案:B解题思路:试题难度:三颗星知识点:可线性化的回归分析5.某单位为了解办公楼用电量与气温之间的关系,随机统计了四个用电量与当地平均气温,并制作了对照表:由表中数据得到线性归回方程,当气温为时,预测用电量为( )A.68度B.52度C.12度D.28度答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析6.根据如下样本数据:得到回归方程,则( )A.,B.,C.,D.,答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析7.某样本数据如下表所示:假设根据表中数据所得线性回归直线方程为,某同学根据表中的两组数据和求得的直线方程为,根据散点图的分布情况,判断以下结论正确的是( )A.,B.,C.,D.,答案:D解题思路:试题难度:三颗星知识点:可线性化的回归分析8.实验测得四组的值分别为,,,,则与间的线性回归方程是( )A. B.C. D.答案:C解题思路:试题难度:三颗星知识点:可线性化的回归分析。
高中数学回归分析精选题
回归分析精选题20道一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-3.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R 依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R 为( )A .0.95B .0.81C .0.74D .0.365.已知四个命题:①在回归分析中,2R 可以用来刻画回归效果,2R 的值越大,模型的拟合效果越好; ②在独立性检验中,随机变量2K 的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212yx =+中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1; 其中真命题是( )A .①④B .②④C .①②D .②③6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+ D .210xy=7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好 D .若12a a <,则12b b >,B 的拟合效果更好8.下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32yx =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A .总偏差平方和B .残差平方和C .回归平方和D .相关指数二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A .运用最小二乘法求得的回归直线一定经过样本点的中心(x ,)yB .若相关系数r 的绝对值越接近于1,则相关性越强C .若相关指数2R 的值越接近于0,表示回归模型的拟合效果越好D .在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高 三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是 .15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 .17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 . 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380 i iix y==∑,521145)iix==∑回归分析精选题20道参考答案与试题解析一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g【分析】根据回归方程为ˆ0.8585.71yx =-,0.85>,可知A ,B ,C 均正确,对于D 回归方程只能进行预测,但不可断定. 【解答】解:对于A ,0.85>,所以y 与x 具有正的线性相关关系,故正确;对于B ,回归直线过样本点的中心(x ,)y ,故正确;对于C ,回归方程为ˆ0.8585.71yx =-,∴该大学某女生身高增加1c m ,则其体重约增加0.85k g,故正确;对于D ,170xc m=时,ˆ0.8517085.7158.79y =⨯-=,但这是预测值,不可断定其体重为58.79k g,故不正确故选:D .【点评】本题考查线性回归方程,考查学生对线性回归方程的理解,属于中档题. 2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-【分析】本题考查的知识点是回归分析的基本概念,根据某商品销售量y (件)与销售价格x(元/件)负相关,故回归系数应为负,再结合实际进行分析,即可得到答案.【解答】解:由x 与y 负相关, 可排除B 、D 两项,而C 项中的ˆ102000yx =--<不符合题意.故选:A .【点评】两个相关变量之间的关系为正相关关系,则他们的回归直线方程中回归系数为正;两个相关变量之间的关系为负相关关系,则他们的回归直线方程中回归系数为负.3.有一散点图如图所示,在5个(,)D后,下列说法正确的是()x y数据中去掉(3,10)A.残差平方和变小B.相关系数r变小C.相关指数2R变小D.解释变量x与预报变量y的相关性变弱【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和,的变化情况.【解答】解:从散点图可分析得出:只有D点偏离直线远,去掉D点,变量x与变量y的线性相关性变强,相关系数变大,相关指数变大,残差的平方和变小,故选:A.【点评】本题考查了利用散点图分析数据,判断变量的相关性问题,属于运用图形解决问题的能力,属于容易出错的题目.4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R为()A.0.95B.0.81C.0.74D.0.36【分析】根据两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,由此选出选项中的答案.【解答】解:两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,在所给的四个选项中0.95是相关指数最大的值,∴其拟合效果也最好.故选:A.【点评】本题考查了相关指数,这里不用求相关指数,而是根据所给的相关指数判断模型的拟合效果,解题的关键是理解相关指数越大拟合效果越好.5.已知四个命题:①在回归分析中,2R可以用来刻画回归效果,2R的值越大,模型的拟合效果越好;②在独立性检验中,随机变量2K的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212y x=+中,当解释变量x每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;其中真命题是()A.①④B.②④C.①②D.②③【分析】对4个选项分别进行判断,即可得出结论.【解答】解:①相关指数2R是用来刻画回归效果的,2R表示解释变量对预报变量的贡献率,2R越接近于1,表示解释变量和预报变量的线性相关关系越强,越趋近0,关系越弱,故2R的值越大,说明回归模型的拟合效果越好,故①正确.②由2K的计算公式可知,对分类变量X与Y的随机变量2K的观测值k来说,k越小,判断“X与Y有关系”的把握越小,随机变量2K的值越大,说明两个分类变量有关系的可能性越大,故②正确;③在回归直线方程ˆ0.212=+中,当解释变量x每增加一个单位时,预报变量ˆy平均增加y x0.2个单位,故③错误.④两个随机变量相关性越强,则相关系数的绝对值越接近于1;两个随机变量相关性越弱,则相关系数的绝对值越接近于0,故④不正确.故选:C.【点评】本题以命题的真假判断为载体,考查了抽样方法,相关系数,回归分析,独立性检验等知识点,难度不大,属于基础题.6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+D .210xy=【分析】将(1,0.2),(2,0.39),(3,0.78)分别代入0.2y x=,20.10.1yx x=+,40.2lo g yx=+和210xy=中,验证即可.【解答】解:将(1,0.2),(2,0.39),(3,0.78)代入0.2y x=,当3x=时,0.6y=,和0.78相差较大;将(1,0.2),(2,0.39),(3,0.78)代入20.10.1y x x=+,当2x=时,0.6y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入40.2lo g y x=+,当2x=时,0.7y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入210xy =,当1x =时,0.2y =,当2x =时,0.4y =,与0.39相差0.01, 当3x=时,0.8y=,和0.78相差0.02;综合以上分析,选用函数关系210xy =较为近似.故选:D .【点评】本题考查了函数模型的应用问题,也考查了运算求解能力,是基础题.7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好D .若12a a <,则12b b >,B 的拟合效果更好【分析】比较两个模型的拟合效果时,如果模型残差平方和越小,则相应的相关指数2R 越大,该模型拟合的效果越好,即可得出结论.【解答】解:比较两个模型的拟合效果时,如果模型残差平方和越小, 则相应的相关指数2R 越大,该模型拟合的效果越好. 故选:C .【点评】本题是基础题.考查残差平方和、相关指数. 8.下列结论正确的是()①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④【分析】本题是一个对概念进行考查的内容,根据相关关系的定义与回归分析的统计意义进行判断.【解答】解:①函数关系是一种确定性关系,这是一个正确的结论. ②相关关系是一种非确定性关系,是一个正确的结论.③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对. 与③对比,依据定义知④是正确的, 故选:C .【点评】本题的考点是相关关系,对本题的正确判断需要对相关概念的熟练掌握. 9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟【分析】根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,代入样本中心点求出a 的值,写出线性回归方程.将100x=代入回归直线方程,得y ,可以预测加工100个零件需要102分钟,这是一个预报值,不是生产100个零件的准确的时间数. 【解答】解:由表中数据得:20x =,30y=,又ˆb 值为0.9,故300.92012a=-⨯=,0.912y x ∴=+.将100x=代入回归直线方程,得0.910012102y =⨯+=(分钟).∴预测加工100个零件需要102分钟.故选:C .【点评】本题考查线性回归方程的求法和应用,解题的关键是正确应用最小二乘法求出线性回归方程的系数的运算,再一点就是代入样本中心点可以求出字母a 的值,是一个中档题目. 10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =【分析】根据回归分析中相关指数2R 越接近于1,拟合效果越好,即可得出答案. 【解答】解:回归分析中,相关指数2R 越接近于1,拟合效果越好; 越接近0,拟合效果越差,由模型2对应的2R 最大,其拟合效果最好. 故选:C .【点评】本题考查了利用相关指数判断模型拟合效果的应用问题,是基础题. 11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32y x =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 【分析】根据题意,对选项种的命题分析判断正误即可.【解答】解:对于A ,在残差图中,纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,所以A 正确;对于B,散点图中的一组点全部位于直线ˆ32=-+的图象上,则x,y成负相关,且相关y x关系最强,此时相关系数1r=-,所以B错误;对于C,若残差平方和越小,则残差点分布的带状区域的宽度越窄,其相关性越强,相关指数2R越大,所以C正确;对于D,回归分析中,变量间的关系若是非确定关系,即变量间的关系不是函数关系,因变量不能由自变量唯一确定,所以D正确.故选:B.【点评】本题考查了统计知识的概念与应用问题,掌握相关概念的含义是解题的关键,是基础题.12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是() A.总偏差平方和B.残差平方和C.回归平方和D.相关指数【分析】本题考查的回归分析的基本概念,根据拟合效果好坏的判断方法我们可得,数据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.【解答】解:拟合效果好坏的是由残差的平方和来体现的,而拟合效果即数据点和它在回归直线上相应位置的差异故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.故选:B.【点评】拟合效果好坏的是由残差的平方和来体现的,也可以理解为拟合效果即数据点和它在回归直线上相应位置的差异,故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A.运用最小二乘法求得的回归直线一定经过样本点的中心(x,)yB.若相关系数r的绝对值越接近于1,则相关性越强C.若相关指数2R的值越接近于0,表示回归模型的拟合效果越好D.在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高【分析】利用回归分析中的相关知识对四个选项逐一分析判断即可.【解答】解:对于A,回归方程必定经过样本中心(x,)y,故选项A正确;对于B,由相关系数的意义可知,相关系数r的绝对值越接近于1,则相关性越强,故选项B正确;对于C ,若相关指数2R 的值越接近于1,表示回归模型的拟合效果越好,故选项C 错误; 对于D ,在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高,故选项D 正确. 故选:A B D .【点评】本题考查了回归分析的理解,主要考查了回归方程的性质,相关系数的意义等,属于基础题.三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是13(2,8).【分析】根据回归方程必过点(,)x y ,计算出,x y 即可求得答案. 【解答】解:35289121362x+++++==,4639121486y+++++==,回归方程必过点(,)x y ,∴该直线必过的定点是13(2,8).故答案为:13(2,8).【点评】本题考查了回归方程,线性回归方程必过样本中心点(,)x y ,这是线性回归中最常考的知识点,希望大家熟练掌握.属于基础题.15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是 106.5【分析】根据表中数据计算x 、y ,代入回归直线方程求得ˆa的值, 写出回归直线方程,利用方程求出10x =时ˆy的值即可. 【解答】解:根据表中数据,计算1(24568)55x=⨯++++=,1(2040607080)545y =⨯++++=,代入回归直线方程ˆˆ10.5y x a=+中,求得ˆ5410.55 1.5a =-⨯=,∴回归直线方程为ˆ10.5 1.5yx =+,据此模型预测,10x=时,ˆ10.510 1.5106.5y=⨯+=,即y 的估计值是106.5. 故答案为:106.5.【点评】本题考查了线性回归方程的应用问题,是基础题. 16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 0.5 .【分析】首先求出这组数据的横标和纵标的平均数,写出这组数据的样本中心点,把样本中心点代入线性回归方程求出m 的值. 【解答】解:0123342x +++==,3 5.5715.544m m y++++==,∴这组数据的样本中心点是3(2,15.5)4m +, 关于y 与x 的线性回归方程ˆ 2.10.85y x =+,∴15.532.10.8542m +=⨯+,解得0.5m =,m∴的值为0.5.故答案为:0.5.【点评】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是一个运算量比较小的题目,并且题目所用的原理不复杂,是一个好题.17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 75%.【分析】根据y 与x 具有线性相关关系,且满足回归方程,和该城市居民人均消费水平为,把消费水平的值代入线性回归方程,可以估计该市的职工均工资水平,做出人均消费额占人均工资收入的百分比. 【解答】解:y与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,该城市居民人均消费水平为7.5y=,∴可以估计该市的职工均工资水平7.50.6 1.5x =+,10x ∴=,∴可以估计该城市人均消费额占人均工资收入的百分比约为7.5100%75%10⨯=,故答案为:75%【点评】本题考查线性回归方程的应用,考查用线性回归方程估计方程中的一个变量,利用线性回归的知识点解决实际问题. 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-【分析】(1)用数组(,)m n 表示选出2天的发芽情况,用列举法可得m ,n 的所有取值情况,分析可得m ,n 均不小于25的情况数目,由古典概型公式,计算可得答案;(2)根据所给的数据,先做出x ,y 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.(3)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的.【解答】解:(1)用数组(,)m n 表示选出2天的发芽情况,m,n 的所有取值情况有(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(30,26),共有10个设“m ,n 均不小于25”为事件A ,则包含的基本事件有(25,30),(25,26),(30,26) 所以3()10P A =,故事件A 的概率为310(2)由数据得12,27xy ==,3972x y=,31977i i i x y ==∑,321434i i x ==∑,23432x =由公式,得9779725ˆ4344322b -==-,5ˆ271232a=-⨯=-所以y 关于x 的线性回归方程为5ˆ32yx =-(3)当10x =时,ˆ22y=,|2223|2-<,当8x=时,ˆ17y=,|1716|2-<所以得到的线性回归方程是可靠的.【点评】本题考查回归直线方程的计算与应用,涉及古典概型的计算,是基础题,在计算线性回归方程时计算量较大,注意正确计算.19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.【分析】(1)利用描点法作出散点图;(2)把数据代入公式,利用最小二乘法求回归方程的系数,可得回归直线方程; (3)把10x=代入回归方程得y 值,即为预报变量.【解答】解:(1)散点图如图,由图知y 与x 间有线性相关关系.(2)4x=,5y=,52190i i x ==∑,51112.3i i i x y ==∑,∴112.354512.3ˆ 1.239054210a-⨯⨯===-⨯;ˆˆ5 1.2340.08a y b x =-=-⨯=.(3)线性回归直线方程是ˆ 1.230.08y x =+,当10x=(年)时,ˆ 1.23100.0812.38y=⨯+=(万元),即估计使用10年时,支出总费用是12.38万元.【点评】本题考查了线性回归直线方程的求法及利用回归方程估计预报变量,解答此类问题的关键是利用公式求回归方程的系数,计算要细心.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y 对x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380i i i x y ==∑,521145)i i x ==∑【分析】(1)根据表格数据,可得散点图;(2)先求出横标和纵标的平均数,代入求系数b 的公式,利用最小二乘法得到系数,再根据公式求出a 的值,写出线性回归方程,得到结果.(3)允许每小时的产品中有缺点的零件最多为89个,即线性回归方程的预报值不大于89,写出不等式,解关于x 的一次不等式,得到要求的机器允许的转数. 【解答】解:(1)散点图如图;(2)5x =,50y=,511380i i i x y ==∑,521145i i x ==∑∴13805550ˆ 6.5145555b-⨯⨯==-⨯⨯,ˆˆ17.5ay b x =-=∴回归直线方程为:ˆ 6.517.5yx =+;(3)由89y …得6.517.589x+…,解得11x …∴机器的运转速度应控制11转/秒内【点评】本题考查线性回归分析,考查线性回归方程,考查线性回归方程的应用,考查不等式的解法,是一个综合题目.。
苏教版高中数学必修三练习:2.4线性回归方程(二)含答案
2.4 线性回归方程(二)【新知导读】1.关于线性有关系数 r ,以下说法正确的选项是( )A.r(0, ) 时, r 越大,有关程度越高;反之有关程度越低B.r( ,) 时, r 越大,有关程度越高,反之有关程度越低C.r1时, r 越靠近于1,有关程度越高;r 越靠近于0,有关程度越低D.以上说法都不正确2.“回归”一词是在研究儿女的身高与父亲母亲的身高之间的遗传关系时,由高尔顿提出的.他的研究结果是子代的均匀身高向中心回归.依据他的结论,在儿子的身高y 与父亲的身高x 的回归直线方程y a bx 中,b( )A.在 (-1,0)内B.等于0C.在 (0,1) 内D.在[1,) 内3.由一组样本数据( x1 , y1 ) , (x2 , y2 ) ,..., ( x n , y n ) 获得的线性回归方程为y bx a ,那么下边说法不正确的选项是( )A.直线y bx a 经过点 ( x, y)B.直线y bx a 起码经过 (x1, y1 ) , (x2 , y2 ) ,..., (x n , y n ) 中的一个点nx i y i nx yC.直线y bxi1a 的斜率为n22x i nxi1na)] 2是该坐D.直线y bx a 和各点 (x1, y1 ) , (x2 , y2 ) ,..., ( x n , y n ) 的误差 [ y i (bx ii 1标平面上全部直线与这些点的误差中最小的【典范点睛】例 1 测得 10 对某国父子身高 ( 单位:英寸 ) 以下:父亲自高 ( x )60626465666768707274儿子身高 ( y ) 63.565.26665.566.967.167. 468.370.170(1)对变量 y 与x进行有关性查验;(2)假如 y 与x之间拥有线性有关关系,求回归直线方程;(3)假如父亲的身高为 73 英寸,估计儿子的身高.【课外链接】1.现有一个由身高展望体重的回归方程,体重展望值= 4( 磅 / 英寸 ) ×身高- 130 磅.此中体重和身高分别以磅和英寸为单位.假如将它们分别以 kg、cm为单位 (1 英寸≈ 2.5cm,1 磅≈ 0.45kg) .回归方程应当是 _ _________________________________ .【随堂操练】1.关于回归剖析,以下说法错误的选项是( )A.在回归剖析中,变量间的关系假如非确立性关系,那么因变量不可以由自变量独一确立B.线性有关系数能够是正的或负的C.在回归剖析中,假如r 2 1 ,说明x与 y 之间完整线性有关D.有关样本系数r(,)2.线性回归方程y bx a 必过()A. (0,0) 点 B .( x,0)点 C .(0,y )点D.( x , y )点3.为了观察两个变量x 和y之间的线性有关性,甲、乙两位同学各自独立做了100 次和 150 次试验,而且利用线性回归方法,求得回归直线分别为 l1和 l2.假定两个人在试验中发现对变量x 的察看数据的均匀值都是m ,对变量y察看的均匀值都是 t ,那么以下说法正确的选项是()A.l1和l2有交点 (m, t )B.l1和l2订交,但交点不必定是 ( m,t )C.l1和l2必然平行D.l1和 l2必然重合4.在研究硝酸钠的可溶性时,对不一样的温度察看它在水中的溶解度,得察看结果以下:温度 x010205070溶解度 y66.776.085.0112.3128.0由此获得回归直线的斜率是__________________( 保存 4 位有效数字 ) .5.下边数据是从年纪在 40 到 60岁的男子中随机抽取 6 个个体,分别测得的每个个体心脏功能水平 y (满分100分)以及相应的每日花在看电视上的时间x (小时).看电视平4.4 4.6 2.75.8 4. 6 4.6均时间 x心脏功能525369578965水平 y则 x 与y的有关系数为______________________.6.若施肥量x 与水稻产量y 的线性回归方程为y 5x 250 ,当施肥量为80kg 时,估计的水稻产量为 ______________kg.7.为了研究三月下旬的均匀气温( x ) 与四月十二号前棉花害虫化蛹顶峰日( y ) 的关系,某地域察看了 1996 年至 2001 年的状况,获得下边数据:年份199619971998199920002001x (o C )24.429.632.928.730.328.9y19611018(1) 据气象展望,该地域在 2002 年三月下旬均匀气温为27 o C ,试估计2002年四月化蛹顶峰日为哪天; (2)对变量 x 、y进行有关性查验.n n8.证明恒等式x i y i nx y( x i x)( y ii 1i 1n( x i x)( y i y)线的斜率还能够写成i1.nx)2(x ii 19.以下是一位销售经理采集来的销售员每年销售额销售1 n ny i,进而回归直y) ,此中 x x i, yn i 1i1y 和销售经验年数x 的关系:经验13446810101113 x (年)年销售额809792102103111119123117136 y (千元 )(1) 依照这些数据画出散点图并作直线y78 4.2 x ,计算( y i y i )2;(2)依照这些数据由最10.小二乘法估计线性回归方程,并据此计算( y i y i )2i 110.某工业部门进行一项研究,剖析该部门的产量与生产花费之间的关系,数据以下:产量(件)40424855657988100120140花费(元)150140160170150162185165190185(1)计算 x 与y的有关系数,并对x 与y进行有关性剖析;(2)假如 y 与x之间拥有线性有关关系,求线性回归方程.2.4 线性回归方程(二) 【新知导读 】1.C2.C3.B 【典范点睛 】x66.8 , y 67.0110210244941 ,x y4476.27例 1.(1),x i 44794,y i ,i 1i 1102210x i y i 10x yyri 1x4462.24 ,,x i y i44842.4 ,4490.34i 1102102(x iy i2 10x )(210 y )i 1i 144842.410 4476.2779.779.70.9801 .由于(4479444622.4)(44941.93 44903.4) 6611.74881.31r0.9801 靠近 1, 所以 y 与 x 拥有较强的有关关系, 也就是说 y 与 x 之间拥有线性有关关系. (2)10x i y i10x y44762.779.7设回归直线方程为y bx a ,由 bi 144842.410 210 x44794 44622.4 171.62i10.4645 , ay bx 67.01 0.4645 66.835.98,所以所求直线方程为y0.4645 x 39.98 .(3) 当 x 73 时, y0.4645 73 35.9869.9 ,所以当父亲自高为 73英寸时,估计儿子的身高为 69.9 英寸.【课外链接 】体重展望值= 0.72(kg/cm) ×身高- 58.5kg【随堂操练 】1. D2. D3. A4. 0.88095.- 0.90236. 6507. 解: (1) x16x i 29.13 , y16 y i626x i y i 1222.6 ,6 i 1 6 i 1 7.5 ,x i5130.92 ,i 1i 16x i y i6x ybi 1 2.2 , a ybx 7.5( 2.2) 29.1371.6 ,回归直线方程为622x i 6xi 1y 2.2x 71.6 .当 x 27 时, y 2.2 27 71.6 12.2 .据此,可估计该地域2002 年 46x i y i 6xy月 12 日或 13 日化蛹顶峰日. (2) ri 10.9342 ,Q r 的值靠近于6622( x i 2 y i 26 x )(6 y )i 1i 11, 所以变量 x , y 存在线性有关关系.8. 证明:nnnnn( x i x)( y i y)(x i y i xy i x i y x y)x i y i xy i yx i nx yi 1i 1i 1i 1i 1nnnx i y i nx yx i y i nx y nx ynx yx i y i nx y,回归直线的斜率为i 1ni 1i 12n( x) 2x ii 1n(x ix)( y iy)i 1.nx)2( x ii 19. 解: (1) 散点图与直线 y78 4.2x 的图形以下图,对 x1,3,...,13 , y82.2,90.6,94.8,94.8, 103.2,10)2111.6,120,120,124.2,132.6 ,i 1 ( y i y i178.48 .(2) x1 10 x i7 , l xx10 ( x i x)2 142 , y 108 , l xy10(x ix)( y iy)10 i1i 1i 1568 ,所以 blxy568 4 , a y bx108 47 80, y4x 80 .l xx14210y i ) 2y i84,92,96,96,104,112,120,120,124,132 ,( y i 170 .i1777165710210210.解:(1) 由题意可得 x77.7 ,y 165.7 , x i 70903 , y i 277119 ,10 10 i 1i 1 10132929 10 77.7 165.7x i y i132929 . r(70903 10 77.72 )(277119 10 165.72 )i 10.806 ,所以x与 y 之间拥有明显的有关性.(2)1329291077.7165.70.397,b1077.7270903a 165.7 0.397 77.7 134.8,所以线性回归方程为y 0.397 x134.8 .。
北师大高中数学选择性必修第一册第七章课时作业49一元线性回归【含答案】
北师大高中数学选择性必修第一册第七章课时作业49一元线性回归(原卷版)一、选择题1.为研究变量x和y的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线l1和l2,两人计算知相同,也相同,下列正确的是()A.l1与l2一定重合B.l1与l2一定平行C.l1与l2相交于点()D.无法判断l1和l2是否相交2.为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),由最小二乘法求得线性回归方程为=0.67x+54.9.若已知x1+x2+x3+x4+x5=150,则y1+y2+y3+y4+y5=()A.75B.155.4C.375D.466.23.已知变量x,y之间具有线性相关关系,其回归方程为Y=aX-(1-a),若x i=5,y i=8,则a的值为()A. B.C. D.14.为了研究某班学生的数学成绩X(分)和物理成绩Y(分)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出Y与X之间有线性相关关系,设其线性回归方程为Y=.已知x i=750,y i=800,=1.2,该班某学生的物理成绩为86,据此估计其数学成绩约为()A.81B.80C.93D.945.学校小卖部为了研究气温对饮料销售的影响,经过统计,得到一个卖出饮料数与当天气温的对比表:摄氏温度-1381217饮料瓶数3405272122根据上表可得回归方程Y=中的为6,据此模型预测气温为30℃时销售饮料瓶数为()A.141B.191C.211D.2416.已知具有线性相关关系的变量X,Y,设其样本点为A i(x i,y i)(i=1,2,…,8),线性回归方程为Y=,若+…+=(6,2)(O为原点),则=()A. B.-C. D.-7.(多选题)下列说法错误的有()A.线性回归方程适用于一切样本和总体B.线性回归方程一般都有局限性C.样本取值的范围会影响线性回归方程的适用范围D.线性回归方程得到的预测值是预测变量的精确值8.(多选题)已知具有线性关系的五个样本点A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6,4),用最小二乘法得到线性回归方程l1:Y=bX+a,过点A1,A2的直线方程l2:y=mx+n,下列结论正确的是()A.m>b,a>nB.直线l1过点A3C.(y i-bx i-a)2≥(y i-mx i-n)2D.|y i-bx i-a|≥|y i-mx i-n|二、填空题9.已知变量X,Y线性相关,由观测数据算得样本的平均数=4,=5,线性回归方程Y=bX+a中的系数b,a满足b+a=4,则线性回归方程为Y=.10.某公司为确定明年投入某产品的广告支出,对近5年的年广告支出X(单位:万元)与年销售额Y(单位:万元)进行了初步统计,如下表所示,经测算,年广告支出X与年销售额Y满足线性回归方程Y =6.4X+18,则a的值为55.(保留整数)年广告支出X/万元23578年销售额Y/万元2837a6070 11.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间X(单位:小时)与当天投篮命中率Y之间的关系:时间X12345命中率Y0.40.50.60.60.4小李这5天的平均投篮命中率为0.5;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为0.53.三、解答题12.通过市场调查,得到某种产品的资金投入X(单位:万元)与获得的利润Y(单位:万元)的数据,如表所示:资金投入X23456利润Y23569线性回归方程Y=中系数计算公式:.(1)根据上表提供的数据,用最小二乘法求线性回归方程Y=;(2)现投入资金10万元,求获得利润的估计值为多少万元?13.2013年以来精准扶贫政策的落实,使我国扶贫工作有了新进展,贫困发生率由2012年底的10.2%下降到2018年底的1.4%,创造了人类减贫史上的中国奇迹.“贫困发生率”是指低于贫困线的人口占全体人口的比例,2012年至2018年我国贫困发生率的数据如下表:年份(t)2012201320142015201620172018贫困发生10.28.57.2 5.7 4.5 3.1 1.4率Y(%)(1)从表中所给的7个贫困发生率数据中任选两个,求两个都低于5%的概率;(2)设年份代码X=t-2015,利用线性回归方程,分析2012年至2018年贫困发生率Y与年份代码X的相关情况,并估计2019年贫困发生率.附:回归直线Y=的斜率和截距的最小二乘估计公式分别为.(的值保留到小数点后三位)14.某数学老师身高177cm,他爷爷,父亲,儿子的身高分别是174 cm,171cm和183cm,因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高是()附:线性回归方程Y=中系数计算公式分别为:,其中为样本均值.A.185cmB.186cmC.187cmD.188cm15.已知关于变量x,y的一组数据如表所示.x23456y34689对于表中数据,现给出如下拟合直线:①y=x+1;②y=2x-1;③y=;④y=x.根据最小二乘法的思想得到拟合程度最好的直线是.(填序号)16.下表是某原料在市场上从2013年至2019年这7年中每年的平均价格(单位:千元/吨)数据:年份2013201420152016201720182019年份代号X1234567平均价格Y2.963.22 3.49 3.704.05 4.46 4.81(单位:千元/吨)(1)求出Y关于X的线性回归方程;(系数精确到0.01)(2)以(1)的结论为依据,预测2032年该原料价格.预估该原料价格在哪一年突破1万元/吨?参考数据:y i=26.69,x i y i=115.35,≈104.43,=140.参考公式:回归方程Y=中斜率和截距的最小二乘估计公式分别为.北师大高中数学选择性必修第一册第七章课时作业49一元线性回归(解析版)一、选择题1.为研究变量x和y的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线l1和l2,两人计算知相同,也相同,下列正确的是(C)A.l1与l2一定重合B.l1与l2一定平行C.l1与l2相交于点()D.无法判断l1和l2是否相交解析:因为两个人在试验中发现对变量x的观测数据的平均值都是,对变量y的观测数据的平均值都是,所以两组数据的样本中心点是(),因为回归直线经过样本的中心点,所以l1和l2都过().故选C.2.为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),由最小二乘法求得线性回归方程为=0.67x+54.9.若已知x1+x2+x3+x4+x5=150,则y1+y2+y3+y4+y5=(C)A.75B.155.4C.375D.466.2解析:由题意,可得=30,代入线性回归方程,可得=0. 67×30+54.9=75,所以y1+y2+y3+y4+y5=5×=375,故选C.3.已知变量x,y之间具有线性相关关系,其回归方程为Y=aX-(1-a),若x i=5,y i=8,则a的值为(A)A. B.C. D.1解析:依题意知,而直线Y=aX-(1-a)一定经过点(),所以a-1+a=,解得a=.故选A.4.为了研究某班学生的数学成绩X(分)和物理成绩Y(分)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出Y与X之间有线性相关关系,设其线性回归方程为Y=.已知x i=750,y i=800,=1.2,该班某学生的物理成绩为86,据此估计其数学成绩约为(B)A.81B.80C.93D.94解析:=75,=80,故=-10,即Y=1.2X -10,当Y=86时,86=1.2X-10,解得X=80.故选B.5.学校小卖部为了研究气温对饮料销售的影响,经过统计,得到一个卖出饮料数与当天气温的对比表:摄氏温度-1381217饮料瓶数3405272122根据上表可得回归方程Y=中的为6,据此模型预测气温为30℃时销售饮料瓶数为(B)A.141B.191C.211D.241解析:由表格得=7.8,=57.8.因为回归方程过点(),且=6,所以57.8=6×7.8+,解得=11.所以回归方程为Y=6X+11.当x=30℃时,Y=6×30+11=191.故选B.6.已知具有线性相关关系的变量X,Y,设其样本点为A i(x i,y i)(i=1,2,…,8),线性回归方程为Y=,若+…+=(6,2)(O为原点),则=(B)A. B.-C. D.-解析:因为+…+=(x1+x2+…+x8,y1+y2+…+y8)=(8,8)=(6,2),所以8=6,8=2⇒,因此,∴,故选B.7.(多选题)下列说法错误的有(AD)A.线性回归方程适用于一切样本和总体B.线性回归方程一般都有局限性C.样本取值的范围会影响线性回归方程的适用范围D.线性回归方程得到的预测值是预测变量的精确值解析:样本或总体具有线性相关关系时,才可求线性回归方程,而且由线性回归方程得到的函数值是近似值,而非精确值,因此线性回归方程有一定的局限性,所以A、D错误.故选AD.8.(多选题)已知具有线性关系的五个样本点A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6,4),用最小二乘法得到线性回归方程l1:Y=bX+a,过点A1,A2的直线方程l2:y=mx+n,下列结论正确的是(AB)A.m>b,a>nB.直线l1过点A3C.(y i-bx i-a)2≥(y i-mx i-n)2D.|y i-bx i-a|≥|y i-mx i-n|解析:由题意可得,=3,=2,则=0.6,=0.2,所以线性回归方程l1为Y=0.6X+0.2,直线l2的方程为y=x,即b=0.6,a=0.2,m=1,n =0,故A正确;又3×0.6+0.2=2,则直线l1过A3,故B正确;因为(y i-bx i-a)2=0.8,(y i-mx i-n)2=9,故C错误;又|y i-bx i-a|=1.6,|y i-mx i-n|=5,故D错误;综上,正确的是AB.故选AB.二、填空题9.已知变量X,Y线性相关,由观测数据算得样本的平均数=4,=5,线性回归方程Y=bX+a中的系数b,a满足b+a=4,则线性回归方程为Y=.解析:由题知,点(4,5)在回归直线上,则4b+a=5,又b+a=4,所以a=,b=,即线性回归方程为Y=.10.某公司为确定明年投入某产品的广告支出,对近5年的年广告支出X(单位:万元)与年销售额Y(单位:万元)进行了初步统计,如下表所示,经测算,年广告支出X与年销售额Y满足线性回归方程Y =6.4X+18,则a的值为55.(保留整数)年广告支出X/万元23578年销售额Y/万元2837a6070解析:根据所给数据求出=5,,∵根据()在线性回归方程Y=6.4X+18上,∴=6.4×5+18,解得a=55.11.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间X(单位:小时)与当天投篮命中率Y之间的关系:时间X12345命中率Y0.40.50.60.60.4小李这5天的平均投篮命中率为0.5;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为0.53.解析:小李这5天的平均投篮命中率×(0.4+0.5+0.6+0.6+0.4)=0.5,=3,=0.01,=0.5-0.03=0.47.∴回归方程为Y=0. 01X+0.47,则当X=6时,Y=0.53.∴预测小李该月6号打6小时篮球的投篮命中率为0.53.三、解答题12.通过市场调查,得到某种产品的资金投入X(单位:万元)与获得的利润Y(单位:万元)的数据,如表所示:资金投入X23456利润Y23569线性回归方程Y=中系数计算公式:.(1)根据上表提供的数据,用最小二乘法求线性回归方程Y=;(2)现投入资金10万元,求获得利润的估计值为多少万元?解:(1)由题意得=4,=5.x i y i=2×2+3×3+4×5+5×6+6×9=117,=22+32+42+52+62=90.∴=1.7,∴=5-1.7×4=-1.8.∴线性回归方程为Y=1.7X-1.8.(2)当X=10时,Y=1.7×10-1.8=15.2(万元),∴当投入资金10万元时,获得利润的估计值为15.2万元.13.2013年以来精准扶贫政策的落实,使我国扶贫工作有了新进展,贫困发生率由2012年底的10.2%下降到2018年底的1.4%,创造了人类减贫史上的中国奇迹.“贫困发生率”是指低于贫困线的人口占全体人口的比例,2012年至2018年我国贫困发生率的数据如下表:年份(t)2012201320142015201620172018贫困发生10.28.57.2 5.7 4.5 3.1 1.4率Y(%)(1)从表中所给的7个贫困发生率数据中任选两个,求两个都低于5%的概率;(2)设年份代码X=t-2015,利用线性回归方程,分析2012年至2018年贫困发生率Y与年份代码X的相关情况,并估计2019年贫困发生率.附:回归直线Y=的斜率和截距的最小二乘估计公式分别为.(的值保留到小数点后三位)解:(1)由数据表可知,贫困发生率低于5%的年份有3个,从7个贫困发生率中任选两个共有=21种情况,选中的两个贫困发生率低于5%的情况共有=3种情况,∴所求概率为P=.(2)由题意得=0,==5.8,x i y i=-3×10.2-2×8.5-7.2+0+4.5+2×3.1+3×1.4=-39.9,=9+4+1+0+1+4+9=28,∴=-1.425,=5.8,∴线性回归方程为Y=-1.425X+5.8.∵-1.425<0,∴2012年至2018年贫困发生率逐年下降,平均每年下降1.425%.当X=2019-2015=4时,Y=-1.425×4+5.8=0.1.∴2019年的贫困发生率估计为0.1%.14.某数学老师身高177cm,他爷爷,父亲,儿子的身高分别是174cm,171cm和183cm,因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高是(B)附:线性回归方程Y=中系数计算公式分别为:,其中为样本均值.A.185cmB.186cmC.187cmD.188cm解析:设数学老师孙子的身高为y4根据题意,列表如下:父亲身高X/cm174171177183儿子身高Y/cm171177183y4根据上表第1列到第3列数据可得,=174,=177,∴===1,=177-1×174=3,所以线性回归方程为Y=X+3,y4=183+3=186.故选B.15.已知关于变量x,y的一组数据如表所示.x23456y34689对于表中数据,现给出如下拟合直线:①y=x+1;②y=2x-1;③y=;④y=x.根据最小二乘法的思想得到拟合程度最好的直线是③.(填序号)解析:列表得x23456y34689y=x+134567y=2x-1357911y=6y=x369故s1=(3-3)2+(4-4)2+(6-5)2+(8-6)2+(9-7)2=9,s2=(3-3)2+(4-5)2+(6-7)2+(8-9)2+(9-11)2=7,s3=+(6-6)2+,s4=(3-3)2++(6-6)2++(9-9)2=,由s3最小知直线③是拟合程度最好的直线.16.下表是某原料在市场上从2013年至2019年这7年中每年的平均价格(单位:千元/吨)数据:年份2013201420152016201720182019年份代号X1234567平均价格Y2.963.22 3.49 3.704.05 4.46 4.81(单位:千元/吨)(1)求出Y关于X的线性回归方程;(系数精确到0.01)(2)以(1)的结论为依据,预测2032年该原料价格.预估该原料价格在哪一年突破1万元/吨?参考数据:y i=26.69,x i y i=115.35,≈104.43,=140.参考公式:回归方程Y=中斜率和截距的最小二乘估计公式分别为.解:(1),=4,=≈0.31,×4≈2.59,故回归方程为Y=0.31X+2.59.(2)2032年对应的年份代号为20,由(1)可知,Y=0.31×20+2.59=8.79,故预测2032年该原料的价格为8.79千元/吨.由不等式0.31x+2.59≥10,解得x≥23.90,故年份代号至少为24时该原料的价格才能突破1万元/吨.年份代号为24时对应2036年.故预估该原料在2036年的价格突破1万元/吨.。
高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精练)(含答案)
8.2 一元线性回归模型及其应用(精练)【题组一 样本中心求参数】1.(2021·全国·高二单元测试)某公司生产某种婴幼儿纸尿裤的产量x 与相应的生产能耗y 有如下样本数据:已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )A .ˆ0.72 2.05yx =+ B .ˆ0.720.35yx =+ C .ˆ0.720.26yx =+ D .ˆ0.350.72yx =+ 【答案】C【解析】设回归直线方程为ˆˆ0.72yx a =+,由样本数据,可得 4.5x =, 3.5y =, 因为回归直线经过点(),x y ,所以ˆ3.50.72 4.5a=⨯+,解得ˆ0.26a =, 所以回归直线方程为ˆ0.720.26yx =+. 故选:C .2.(2021·江西·吉安一中高二开学考试 )已知x 与y 之间的一组数据:()()()()13253749,,,,,,,,则y 与x 的线性回归方程为y bx a =+必过( )A .()26,B .()38,C .()2.56,D .()3.58,【答案】C【解析】由题意可知:1234 2.54x +++==,357964y +++==, ∴y 与x 的线性回归方程必过点()2.5,6.故选:C.3(2021·河南·孟津县第一高级中学 )为了庆祝建党100周年,某网站从7月1日开始推出党史类书籍免费下载活动,已知活动推出时间x (单位:天)与累计下载量y (单位:万次)的统计数据如表所示:根据上表,利用最小二乘法得到回归直线方程 1.4ˆˆyx a =+,据此模型预测,活动推出11天的累计下载量约A .13.8万次B .14.6万次C .16万次D .18万次【答案】C【解析】由表格数据知4567868910126,955x y ++++++++====,由回归直线方程的性质,得ˆ1.469a⨯+=,所以ˆ0.6a =,故ˆ 1.40.6y x =+, 所以当11x =时, 1.4110.616y =⨯+=(万次), 故选:C.4.(2021·河北·藁城新冀明中学高二月考)(多选)随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:根据所给数据,得出y 关于t 的回归直线方程为273y bt =+,则下列说法正确的是( ) A .该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B .y 关于t 的回归直线方程为18273y t =-+ C .估计该市2020年烧烤店盈利店铺的个数为147D .预测从2025年起,该市烧烤店盈利店铺的个数将不超过100 【答案】ABC【解析】由已知数据得3t =,219y =,故A 正确;因为y 关于t 的回归直线过点()3,219,所以2193273b =+,所以18b =-, 所以y 关于t 的回归直线方程为18273y t =-+.故B 正确;2020年的年份代码为7,故2020年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.故C 正确; 令18273100t -+≤,由*t N ∈,得10t ≥,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故D 不正确,故选:ABC.5.(2021·广东惠州 )(多选)某种产品的价格x (单位:元/kg )与需求量y (单位:kg )之间的对应数据如根据表中的数据可得回归直线方程为14.4y bx =+,则以下结论正确的是( ) A .y 与x 正相关 B .y 与x 负相关C .样本中心为()20,8D .该产品价格为35元/kg 时,日需求量大约为3.4kg【答案】BC【解析】由表格数据,随着价格x 的增加,需求量y 随之减少,所以y 与x 负相关. 因为1015202530205x ++++==,111086585y ++++==,故样本中心为()20,8由回归直线14.4y bx =+必过样本点的中心()20,8, 所以有82014.4b =⨯+,解得0.32b =-,所以当35x =时,0.323514.4 3.2y =-⨯+=,日需求量不为最大 故选:BC6.(2021·重庆市秀山高级中学校 )(多选)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD【解析】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD.7.(2021·贵州·贵阳一中 )某产品的广告费用x 与销售额y 的统计数据如下表:根据上表已得回归方程为8.6.8ˆ5yx =-,表中一数据模糊不清,请推算该数据的值为___________. 【答案】12【解析】由题中数据可得3,8.63 5.820x y ==⨯-=,故空白数据为12. 故答案为:128.(2021·全国·高二课时练习)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且回归直线方程为ˆ0.95 2.6yx =+,那么表格中的数据m 的值为______.【答案】6.7 【解析】013424x +++==, 2.2 4.3 4.811.344m m y ++++==, 把(),x y 的坐标代入回归直线方程得11.30.952 2.64m+=⨯+, 解得 6.7m =. 故答案为:6.79.(2021·全国·高二课时练习)蟋蟀鸣叫的频率P (每分钟鸣叫的次数)与气温T (单位:℃)有着很大的关系.某观测人员根据下表中的观测数据计算出P 关于T 的线性回归方程ˆ 5.2168PT =-,则下表中k 的值为______.【答案】51【解析】计算()138414239404T =⨯+++=,()110929443644k P k +=⨯+++=, 将点10940,4k +⎛⎫ ⎪⎝⎭的坐标代入P 与T 的线性回归方程ˆ 5.2168P T =-中,得109 5.2401684k +=⨯-, 解得51k =. 故答案为:51.10.(2021·福建宁德·高三期中)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:由最小二乘法得到回归方程ˆ0.6754.9yx =+,则a =___________. 【答案】75 【解析】1020304050305x ++++==,62688189600.25a y a ++++==+,因为线性回归方程过样本中心点,所以600.20.673054.975a a +=⨯+⇒=,故答案为:75 【题组二 线性回归方程】1.(2021·河北·藁城新冀明中学高二月考)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件;(3)各组残差见解析,残差平方和为3.8182. 【解析】(1)解:散点图如下:(2)解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818i i i y y=--+++--==++∑. 2.(2021·甘肃张掖)某家庭2015~2019年的年收入和年支出情况统计如表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(系数精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2021年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2021年的年支出金额.附:回归方程ˆˆˆybx a =+中的斜率的最小二乘估计公式为()()()1122211ˆnni iiii i nniii i x ynx y xxy y b xnxxx====---==--∑∑∑∑.【答案】(1)ˆ0.780.24yx =+;(2)7.65万元. 【解析】(1)依题意,1(99.61010.411)105x =++++=,1(7.37.588.58.7)85y =++++=,则()5212.32i i x x=-=∑,()()511.8i ii x xy y =--=∑,则有()()()125151.8ˆ0.782.32iii ii x x y y bx x ==--==≈-∑∑,则ˆˆ0.24a y bx =-≈, 所以y 关于x 的线性回归方程为ˆ0.780.24yx =+; (2)当2021年的年收入为9.5万元时,即9.5x =,ˆ0.789.50.247.65y=⨯+=, 所以预测该家庭2021年的年支出金额为7.65万元.3.(2021·云南师大附中)大气污染物PM 2.5的浓度超过一定的限度会影响人的健康.为了研究PM 2.5的浓度是否受到汽车流量的影响,研究人员选择了24个社会经济发展水平相近的城市,在每个城市选择一个交通点统计24小时内过往的汽车流量x (单位:千辆),同时在低空相同的高度测定该时间段空气中的PM 2.5的平均浓度y(单位:μg/m 3),制作了如图所示的散点图:(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明(精确到0.01); (2)建立y 关于x 的回归方程;(3)我国规定空气中的PM 2.5浓度的安全标准为24小时平均依度75μg/m 3,某城市为使24小时的PM 2.5浓度的平均值在60~130μg/m 3,根据上述回归方程预测汽车的24小时流量应该控制在什么范围内?附:参考数据: 1.4x =,95y =,2421() 2.1i i x x =-=∑,2421()60343i i y y =-=∑,241()()294i i i x x y y =--=∑,357.参考公式:相关系数()()nii xx y y r --∑,回归方程ˆˆˆya bx =+中斜率和截距的最小二乘估计公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)答案见解析;(2)140101y x =-;(3)24小时的车流量应该控制在1150~1650辆. 【解析】1)由题得2940.82357r =≈, 因为y 与x 的相关系数近似为0.82,说明y 与x 具有很强的相关性, 从而可以用线性回归模型拟合y 与x 的关系.(2)由95y =得2412421()()ˆ()iii ii x x y y bx x ==--=-∑∑2941402.1==,95140 1.4101a y bx =-=-⨯=-, 所以y 关于x 的回归方程为140101y x =-. (3)当60y =时,由14010160x -=得 1.15x =; 当130y =时,由140101130x -=得 1.65x =. 所以24小时的车流量应该控制在1150~1650辆.4.(2021·全国·高三专题练习)实施新规后,某商场2020年1月份至10月份的收入情况如表.并计算得101890i i i x y ==∑,1021385i i x ==∑,101150i i y ==∑75.99.(1)是否可用线性回归模型拟合y 与x 的关系?请用相关系数r 加以说明;(当0.751r ≤≤时,那么变量x ,y 有较强的线性相关关系)(2)建立y 关于x 的回归方程ˆˆˆybx a =+(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)y 与x 有较强的线性相关关系,可用线性回归模型拟合,说明答案见解析;(2)ˆ0.810.7yx =+,预测该商场12月份的收入为20万元.【解析】(1)由题中数据得1011155 5.51010i i x x ===⨯=∑,10111150151010i i y y ===⨯=∑,1010 5.515825x y =⨯⨯=,于是得1010111()()1089082565i i i i i x x y y x y y x ==--=-=-=∑∑,75.99,从而10()()650.8675.99iix x y y r --==≈∑,0.75||1r ≤≤, 所以y 与x 有较强的线性相关关系,可用线性回归模型拟合;(2)由(1)知1011065i i i x y x y =-=∑,而1021385i i x ==∑,221010 5.5302.5x =⨯=,从而得10122110106565ˆ0.8385302.582.510i ii i i x y ybx xx ==-===≈--∑∑,65ˆˆ15 5.510.782.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ0.810.7yx =+,当12x =时,ˆ0.81210.720y =⨯+≈, 从而预测该商场12月份的收入为20万元.5(2021·河南许昌 )某新型外贸出口公司对2021年过去9个月的出口销售数据进行整理,得到了今年第x 个月份与截止该月底的销售额y (单位:万元)之间的关系,如下表:(1)若y 与x 满足线性关系,求出y 关于x 的回归方程;(ˆa,ˆb 精确到整数位) (2)预测该公司10月份的销售额附:参考数据:913087i i y ==∑;9117524i i i x y ==∑;921285i i x ==∑;参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ35169yx =+;(2)答案见解析. 【解析】(1)5x =,343y =,919175249534317524154352089i i i x y xy =∴-=-⨯⨯=-=∑92221952859560ii x=-⨯=-⨯=∑,2089ˆ3560b ∴=≈, 2089ˆ343516960a=-⨯≈, ˆ35169yx ∴=+ (2)当10x =时,ˆ3510169519y=⨯+=, 所以预测该公司10月份销售额为519万元.6.(2021·福建·莆田第二十五中学高三月考)2021年东京奥运会,中国举重选手8人参赛,7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表 (1)根据表中的数据,求出运动员举重成绩y 与运动员的体重x 的回归直线方程(保留1位小数); (2)某金牌运动员抓举成绩为170公斤,挺举成绩为204公斤,则该运动员最有可能是参加的哪个级别的举重?参考数据:()()()992112620,7076i i i i i x x x x y y ==-=--=∑∑;参考公式:()()()121ˆˆˆ,niii nii x x yy bay bx xx ==--==--∑∑. 【答案】(1) 2.7155.4y x =+;(2)83公斤级举重. 【解析】(1)依题意,5459647076839199106789x ++++++++==,2913043373533633894064214303669y ++++++++==,()()()1217076ˆ 2.702620nii i nii xx y y bxx ==--===-∑∑, 则366 2.778155.4a y bx =-=-⨯=, 故回归方程为: 2.7155.4y x =+.(2)该运动员的抓举和挺举的总成绩为374公斤,根据回归方程可知:374 2.7155.4x =+, 解得81x ≈,即该运动员的体重应该在81公斤左右,即参加的应该是83公斤级举重.7.(2021·西藏·拉萨中学高二月考)珠海国际赛车场(简称ZIC)位于珠海经济特区金鼎镇.创建于1996年,是中国国内第一座符合国际汽车联盟一级方程式标准的国际级赛车场.目前该赛事已打造成集赛车竞技运动、汽车文化极致体验、主题休闲度假为一体的超级汽车文化赛事娱乐综合体.为了减少对环境的污染,某环保部门租用了特制环保车清洁现场垃圾.通过查阅近5年参会人数(万人)与所需环保车辆数量(辆),得到如下统计表:(1)根据统计表所给5组数据,求出关于,x y 的线性回归方程ˆˆy bxa =+. (2)已知租用的环保车平均每辆的使用成本费用C (元)与数量(辆)的关系为3000200035,N 2900t t 35,N t t t C t +<<∈⎧=⎨≥∈⎩,主办方根据实际参会人数投入所需环保车,租车每辆支付费用6000元,超出实际需要的车辆,主办方不支付任何费用.预计本次赛车会大约有14万人参加,根据(1)中求出的线性回归方程,预测环保部门在确保清洁任务完成的前提下,应租用多少辆环保车?获得的利润是多少? (注:利润L =主办方支付费用-使用成本费用C ).参考公式:()()()1122211ˆ,ˆˆn niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑ 【答案】(1) 2.32y x =+;(2)为确保完成任务,需要租用35辆环保车,获得的利润108500元. 【解析】(1)11981012105x ++++==2823202529255y ++++== ()()()()()()()()()22222131******** 2.310111091081010101210ˆb ⨯+-⨯-+-⨯-++⨯===-+-+-+-+- ˆˆ2ay bx =-= 关于,x y 的线性回归方程 2.32y x =+ (2)将14x =代入 2.32y x =+得34.2y =为确保完成任务,需要租用35辆环保车, 所以290035101500C =⨯=获得的利润600035101500108500L =⨯-=元8.(2021·江西·新余市第一中学高二月考)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 中至少有一个数小于25”的概率;(2)请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程y bx a =+.(参考公式:回归直线方程为y bx a =+,其中()1221ni ii nii x y nxyb xn x==-=-∑∑,a y bx =-)【答案】(1)710(2)532y x =-【解析】(1)从3月1日至3月5日中任选2天,m ,n 构成的基本事件(m ,n )有:(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个.记“m ,n 至少有一个数小于25”为事件A ,包括:(23,25),(23,30),(23,26),(23,16),(25,16),30,16),(26,16),共有7个基本事件 由古典概型概率公式:7()10P A = (2)11131225302612,27,33x y ++++==== 22221125133012263122751113123122b ⨯+⨯+⨯-⨯⨯==++-⨯. 于是,5271232a =-⨯=-故所求线性回归方程为532y x =- 9.(2021·全国·高二单元测试)某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (1)求y 关于t 的线性回归方程;(2)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121()()()niii nii t t y y b tt ==--=-∑∑,a y bt =-.【答案】(1)ˆ0.5 3.3yt =+;(2)分布列见解析;期望为98. 【解析】(1)根据2018年的抽样数据可得2018年的人均纯收入为1(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210+++++++++= 千元,根据2019年的抽样数据可得2019年的人均纯收入为1(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910+++++++++=千元,由所给的数据得1(1234567)47t =++++++=,1(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37y =++++++=, ∴721()941014928i i t t =-=++++++=∑,71()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614ii i tt y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,∴71721()()14ˆ0.528()ii i ii tt y y btt ==--===-∑∑, 则ˆˆ 5.30.54 3.3ay bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3yt =+; (2)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X 的可能取值为0,1,2,3,则35385(0)28C P X C ===,12353815(1)28C C P X C ===,21353815(2)56C C P X C ===,33381(1)56C P X C ===,∴随机变量X 的分布列为则X 的分布列为:则5151519()0123282856568E X =⨯+⨯+⨯+⨯= 【题组三 非线性回归方程】1.(2021·福建·泉州科技中学 )数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99⨯盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33⨯)内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP 上进行一段时间的训练,每天的解题平均速度y (秒)与训练天数x (天)有关,经统计得到如表的数据:现用by a x=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP 上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1i t x =)参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-⋅.【答案】(1)1000130y x=+,经过100天训练后,每天解题的平均速度y 约为140秒;(2)243256.【解析】(1)由题意,1(990990450320300240210)5007y =++++++=,令1t x=,设y 关于t 的线性回归方程为y bt a =+,则 717221184570.3750010000.5577i ii i i t y t yb t t==-⨯-⨯-===⋅∑∑,则50010000.37130a =-⨯=. ∴1000130y t =+,又1t x=,∴y 关于x 的回归方程为1000130y x=+, 故100x =时,140y =.∴经过100天训练后,每天解题的平均速度y 约为140秒.(2)设比赛再继续进行X 局小明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负.当2X =时,小明4:1胜,∴339(2)4416P X ==⨯=;当3X =时,小明4:2胜,∴123339(3)144432P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭;当4X =时,小明4:3胜,∴21333327(4)1444256P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭.∴小明最终赢得比赛的概率为99272431632256256++=. 2.(2021·云南大理 )2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.y x =+,模型②:ˆ14.4y =;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7yx a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)模型②拟合精度更高、更可靠,72.93亿;(2)投入17亿元比投入20亿元时收益小. 【解析】(1)对于模型①, 对应的15222740485460=387y ++++++=,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ14.472.93=≈y. (2)当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.3.(2021·全国·高二单元测试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产的产品数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下散点图.参考数据:(其中1iu x =) (1)观察散点图判断,by a x=+与y c dx =+哪一个适宜作为非原料成本y 与生产的产品数量x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)试预测生产该产品10千件时,每件产品的非原料成本为多少元? 【答案】(1)b y a x =+;(2)100ˆ11y x=+;(3)21元.【解析】(1)由题意,根据题设中的散点图,可得这些点分布在b y a x =+的两侧,所以选择函数by a x=+作为非原料成本y 与生产的产品数量x 的回归方程类型. (2)令1u x =,则by a x=+可转化为y a bu =+,则y 与u 的关系可看成线性相关关系. 因为360458y ==,所以8182218183.480.344561ˆ1001.5380.1150.618i ii ii u yu y b uu==-⋅-⨯⨯====-⨯-∑∑,则ˆˆ451000.3411a y bu =-=-⨯=,所以ˆ11100y u =+,代入1u x =,得100ˆ11y x=+.(3)当10x =时,100ˆ112110y=+=,所以预测生产该产品10千件时,每件产品的非原料成本为21元. 4.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①2y x αβ=+,②e x t y λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.现该公司对收集的近12年的年研发资金投入量i x 和年销售额i y (1,2,,12i =⋅⋅⋅)的数据作了初步处理,令2u x =,ln v y =,经计算得到如下数据:(1)设u 和y 的样本相关系数为1r ,x 和v 的样本相关系数为2r ,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立y 关于x 的非线性经验回归方程;(ii)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 约为多少亿元? 参考数据为308477=⨯9.4868, 4.4998e 90≈.【答案】(1)模型e x t y λ+=的拟合效果更好;(2)(i)0.018 3.84ˆe x y+=;(ii)36.66亿元. 【解析】(1)()()121215000.8625000iiu u y y r --====∑,()()12214100.91770.211iix x v v r --====≈⨯∑,因为12r r <,所以从样本相关系数的角度判断,模型e x t y λ+=的拟合效果更好. (2)(i)先建立v 关于x 的经验回归方程. 由e x t y λ+=,得ln y x t λ=+,即v λx t =+.()()()121122114ˆ0.018770iii ii x x v v x x λ==--==≈-∑∑, ˆˆ 4.20.01820 3.84tv x λ=-=-⨯=, 所以v 关于x 的经验回归方程为0.01838ˆ.4vx +=, 所以0.0134ˆln 8.8x y=+,即0.018 3.84ˆe x y +=.(ii)若下一年销售额y 需达到90亿元,则由0.018 3.84ˆe x y+=,得0.018 3.8490e x +=, 又 4.4998e 90≈,所以4.49980.018 3.84x ≈+, 所以 4.4998 3.8436.660.018x -≈≈,所以预测下一年的研发资金投入量约为36.66亿元.5.(2021·全国·高二课时练习)噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D (单位:dB )与声音能量I (单位:2W cm -⋅)之间的关系,将测量得到的声音强度D 和声音能量I 的数据作了初步处理,得到如图所示的散点图:参考数据:111.0410I -⨯=,45.7D =,11.5W =-,()1022111.5610i i I I-=-=⨯∑,()10210.51i i W W=-=∑,()()101116.8810iii IID D -=--=⨯∑,()()1015.1i i i W W D D =-⋅-=∑,其中lg i i W I =,101110i i W W ==∑.(1)根据散点图判断,11D a b I =+与22lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归模型?(给出判断即可,不必说明理由)(2)求声音强度D 关于声音能量I 的非线性经验回归方程.(3)假定当声音强度大于60dB 时,会产生噪声污染.城市中某点P 处共受到两个声源的影响,这两个声源的声音能量分别是a I 和b I ,且101410a bI I +=.已知点P 处的声音能量等于a I 与b I 之和.请根据(2)中的非线性经验回归方程,判断点P 处是否受到噪声污染,并说明理由.【答案】(1)22lg D a b I =+更适合;(2)ˆ10lg 160.7DI =+;(3)P 会受到噪声污染,理由见解析. 【解析】(1)22lg D a b I =+更适合. (2)设ˆˆD bW a =+,则 ∵()()()10110215.1ˆ100.51iii i i W W D D bW W==--===-∑∑, ∴ˆˆ160.7a D bW=-=, ∴D 关于W 的经验回归方程是ˆ10160.7DW =+,则D 关于I 的非线性经验回归方程是ˆ10lg 160.7DI =+. (3)设点P 处的声音能量为1I ,则1a b I I I =+. ∵101410a bI I +=, ∴()101010141410105910b a a b a b a b a b I I I I I I I I I I I ---=+=++=++≥⎛⎫⎛⎫ ⎪⎝⨯ ⎪⎝⎭⎭(当且仅当10310a I =,93510bI =⨯时等号成立) 根据(2)中非线性经验回归方程,知点P 处的声音强度D 的预报值的最小值,()10min 10lg 910160.710lg960.760D -=⨯+=+>,∴点P 会受到噪声污染.6.(2021·福建·福州三中高二期中)某地从2月20日开始的连续7天的某传染病累计确诊人数如下表:由上述表格得到如下散点图.(1)根据散点图判断lg =+y a b x 与x y c d =⋅(,c d 均为大于0的常数)哪一个更适合作为累计确诊人数y 与天数x 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)3月20日,该地的疾控中心接受了1000份血液样本,假设每份样本的检验结果是阳性还是阴性是相互独立的,且每份样本是阳性的概率是0.6,试剂把阳性样本检测出阳性结果的概率是0.99(试剂存在阳性样本检测不出来的情况,但不会把阴性样本检测呈阳性样本),求这1000份样本中检测出呈阳性的份数的期望.参考数据:其中11lg ,7i i i i v y v v ===∑参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线ˆvu αβ=+的斜率和截距的最小二乘估计公式分别为1221,ni i i ni i u v nuvv u unuβαβ==-==--∑∑,v u αβ=-.【答案】(1)0.253.4710x x y c d y =⋅=⨯; (2)594【解析】(1)由散点图可知,x y c d =⋅更适合作为累计确诊人数y 与天数x 的回归方程类型. 把x y c d =⋅两边取对数,得lg lg lg y c x d =+, 令lg v y =,则lg lg v c x d =+,1(1234567)47x =++++++=,7211.54140i i v x ===∑,, 7172221750.1274 1.54lg 0.25140747i i i i i x v xvd x x==--⨯⨯===-⨯-∑∑,所以lg 1.540.2540.54c =-⨯=,则0.540.25v x =+, 所以y 关于x 的回归方程为0.253.4710x y =⨯; (2)设这1000份样本中检测出呈阳性的份数为X , 每份样本检测出阳性的概率为0.60.990.594P =⨯=, 由题意可知,(10000.594)XB ,,所以()10000.594594E X =⨯=份.故这1000份样本中检测出呈阳性的份数的期望为594.7.(2021·山西太原·高二期中(文))为了更好的指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中ln i i w y =(1)根据散点图判断,可采用x y a b =⋅作为这个地区未成年男性体重y 千克与身高x 厘米的回归方程.利用表中数据建立y 关于x 的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常? 参考数据:0.020.71751.02,2,1.0231.99e e ===. 参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,nii i nii uu v v v u uu βαβ==--==--∑∑.【答案】(1)2 1.02x y =⨯;(2)体重偏胖. 【解析】(1)由x y a b =⋅,得ln ln ln y a x b =+⋅, 设ˆˆˆw cx d=+,由表格中数据,得801ˆ0.02400050c ===, ˆ 3.40.021350.7d=-⨯=, 则0.70.02ln 0.7,ln 0.02,2, 1.02a b a e b e ======, 则y 关于x 的回归方程为2 1.02x y =⨯.(2)当175x =时,1752 1.02231.9963.98y =⨯=⨯=,因为63.98 1.276.77678⨯=<,所以该名在校男生的体重偏胖.。
高中数学线性回归方程检测试题(附答案)
高中数学线性回归方程检测试题(附答案)高中苏教数学③2. 4线性回归方程测试题一、选择题1.下列关系属于线性负相关的是()A.父母的身高与子女身高的关系B.身高与手长C.吸烟与健康的关系D.数学成绩与物理成绩的关系答案:C2.由一组数据得到的回归直线方程,那么下面说法不正确的是()A.直线必经过点B.直线至少经过点中的一个点C.直线 a的斜率为D.直线和各点的总离差平方和是该坐标平面上所有直线与这些点的离差平方和中最小的直线答案:B3.实验测得四组的值为,则y与x之间的回归直线方程为()A.B.C.D.答案:A4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是,那么下列说法正确的是()A.直线和一定有公共点B.直线和相交,但交点不一定是C.必有直线D.和必定重合答案:A二、填空题5.有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系(2)曲线上的点与该点的坐标之间的关系(3)苹果的产量与气候之间的关系(4)森林中的同一种树木,其断面直径与高度之间的关系(5)学生与他(她)的学号之间的关系其中,具有相关关系的是.答案:(1)(3)(4)6.对具有相关关系的两个变量进行的方法叫做回归分析.用直角坐标系中的坐标分别表示具有的两个变量,将数据表中的各对数据在直角坐标系中描点得到的表示具有相关关系的两个变量的一组数据的图形,叫做.答案:统计分析;相关关系;散点图7.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数、方差分别为,则新数据的平均数是,方差是,标准差是.答案:;;8.已知回归直线方程为,则可估计x与y增长速度之比约为.答案:三、解答题9.某商店统计了近6个月某商品的进价x与售价y(单位:元)的对应数据如下:3 5 2 8 9 124 6 3 9 12 14求y对x的回归直线方程.解:,,回归直线方程为.10.已知10只狗的血球体积及红血球的测量值如下:45 42 46 48 426.53 6.30 9.257.580 6.9935 58 40 39 505.90 9.496.20 6.557.72x(血球体积,ml),y(红血球数,百万)(1)画出上表的散点图;(2)求出y对x的回归直线方程并且画出图形.解:(1)见下图(2),设回归直线方程为,则,.图形如下:11.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:尿汞含量:2 4 6 8 10消光系数 64 134 205 285 360(1)画出散点图;(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)估计尿汞含量为9毫克/升时的消光系数.解:(1)(2)由散点图可知与线性相关,设回归直线方程为.列表:1 2 3 4 52 4 6 8 1064 134 205 285 360128 536 1230 2280 3600 回归直线方程为.(3)当时,.。
(完整)线性回归方程高考题
线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量•(吨)与相应的生产能耗T (吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 *关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值: M 1 _二〉[;+ j :亠_「丄 4 湎5)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:若有数据知y对x呈线性相关关系.求:(1)填出下图表并求出线性回归方程$二bx+a的回归系数匸,;(2)估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程/ ' ■■--■■■,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利;气元)与该周每天销售这种服装件数二之间的一组数据关系如下表:7 7口 F =冰=4 刃叹2>必=3487已知:.-1(I )画出散点图;(11)求纯利=与每天销售件数卞之间的回归直线方程.5、某种产品的广告费用支出「与销售额丁之间有如下的对应数据:(1)画出散点图:(2)求回归直线方程;(3)据此估计广告费用为10时,销售收入丁的值.6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(I )请画出上表数据的散点图;(II )请根据上表提供的数据,求出y关于x的线性回归方程 - 1■-; (III )已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II )求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?S 〔工厂一刃迟矶”7、以下是测得的福建省某县某种产品的广告费支出 x 与销售额y (单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8 销售额y3040605070(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支 出x 与销售额y (单位:百万元)之间的一般规律吗? (2) 求y 关于x 的回归直线方程;(3) 预测当广告费支出为2 (百万元)时,则这种产品的销售额为多少?(百万元)&在某种产品表面进行腐蚀线实验,得到腐蚀深度y 与腐蚀时间t 之间对应的一组 数据:时间t (s ) 5 10 15 |2030 |深度y (门m )610101316 1(1) 画出散点图;(2) 试求腐蚀深度y 对时间t 的回归直线方程。
高中数学专题03线性回归方程及其应用分项汇编(含解析)新人教A版必修3(2021年整理)
2018版高中数学专题03 线性回归方程及其应用分项汇编(含解析)新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高中数学专题03 线性回归方程及其应用分项汇编(含解析)新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高中数学专题03 线性回归方程及其应用分项汇编(含解析)新人教A版必修3的全部内容。
专题03 线性回归方程及其应用一、选择题1.【北京101中学2016-2017学年下学期高二年级期中考试】一位母亲记录了自己儿子3~9岁的身高数据(略),由此建立的身高与年龄的回归模型为y=7。
19x+73。
93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A. 身高一定是145。
83cmB。
身高在145.83cm以上C. 身高在145。
83cm左右D。
身高在145.83cm以下【答案】C【解析】由回归模型可得y=7。
1910x+73.93=145.83,所以预测这个孩子10岁时的身高在145.83cm左右.2.【吉林省辽源市田家炳高级中学2017—2018学年高二下学期3月月考】有位同学家开了个小卖部,他为了研究气温对热饮销售的影响,经过统计得到一天所卖的热饮杯数(y)与当天气温(x℃)之间的线性关系,其回归方程为ˆy=-2。
35x+147.77.如果某天气温为2℃,则该小卖部大约能卖出热饮的杯数是( )A。
140 B. 143 C. 152 D。
156【答案】B点睛:本题主要考查的知识点是线性回归方程的应用,即根据所给的或者是做出的线性回归方程,预报y 的值,这是一些解答题目中经常会出现的一个问题,是一个基础题。
高中数学苏教版必修3分层测评习题16线性回归方程含解析
学业分层测评 (十六 )(建议用时: 45 分钟 )[ 学业达标 ]一、填空题1.以下对于线性回归的判断,正确的为 ________.(填序号 )①若散点图中全部点都在一条直线邻近,则这条直线为回归直线;②已知线性回归方程为 ^= - ,则 = 时, 的预计值为 ;y 0.50x 0.81 x 25 y 11.69③线性回归方程的意义是它反应了样本整体的变化趋向.【分析】 能使全部数据点都在它邻近的直线不只一条,而据回归直线的定^义知,只有按最小平方法求得直线y =a +bx 才是线性回归方程,①不对,③正^ ^确 .将 x =25 代入 y = 0.50x -0.81,解得 y =11.69,②正确 .【答案】②③2.(2015 南·通高一月考 )甲、乙两同学各自独立地观察两个变量 X 、 Y 的线性有关关系时,发现两人对 X 的察看数据的均匀值相等,都是 s ,对 Y 的察看数据的均匀值也相等,都是 t ,各自求出的回归直线分别是 l 1,2,则直线 1 与 2 必经lll过同一点 ________.【分析】- -经过的同一点由回归方程必过样本中心 ( x , y )知,直线 l 1, l 2 为 (s ,t).【答案】(s , t)3.已知某工厂在 2015 年每个月产品的总成本 y(万元 )与月产量 x(万件 )之间有线^性有关关系,回归方程为 y = 1.215x +0.974,若月产量增添 4 万件时,则预计成本增添 ________万元 .【分析】由^y 1=1.215x 1+0.974,^y 2=1.215(x 1 +4)+0.974,^ ^得y 2- y 1 =1.215×4=4.86(万元 ).【答案】 4.864.某台机器置后的运年限x(x=1,2,3,⋯ )与当年利 y 的剖析知具性有关关系,回方程y=10.47-1.3x,估台机器使用 ________年最合算 .【分析】只需利不数,使用机器就算合算,即y≥0,因此10.47- 1.3x≥0,解得 x≤8.05,因此台机器使用8 年最合算 .【答案】85.(2015 ·州高一 )已知 x,y 的取以下表所示:x0134y 2.2 4.3 4.8 6.7^从散点剖析, y 与 x 性有关,且 y=0.95x+ a, a=________.【分析】--=4.4,因此 4.4= 0.95×2+a,解得 a=2.5.由条件知 x =2, y【答案】 2.56.下表供给了某厂能降耗技改造后,在生 A 品程中的量x(位:吨 )与相的生能耗 y(位: 103 kJ)几的数据:x3456y 2.5t 4 4.5依据上表供给的数据,求出 y 对于 x 的性回方程y=0.7x+0.35,那么表中 t 的 ________.【分析】--+ 0.35,得由 y=0.7 x2.5+t+4+ 4.53+4+5+64=0.7×4+0.35,11+ t故4=3.5,即 t= 3.【答案】37.依据以下本数据x345678y 4.0 2.5-0.50.5- 2.0-3.0^获得的回归方程为 y=bx+a,则以下判断正确的选项是 ________.①a>0, b>0;② a>0, b<0;③ a<0, b>0;④ a<0, b<0.【分析】作出散点图以下:^察看图象可知,回归直线y=bx+ a 的斜率 b<0,^当 x=0 时, y=a>0.故 a>0,b<0.【答案】②8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm 和 182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归剖析的方法预测他孙子的身高为 ________cm. 【导学号: 90200059】【分析】设父亲自高为 x cm,儿子身高为 y cm,则x173170176y1701761820× -6 +-3 ×0+3×6x = 173, y = 176,b==1,02+9+9a= y - b x = 176-1×173=3,^^∴y= x+ 3,当 x=182 时, y=185.【答案】185二、解答题9.从某居民区随机抽取10 个家庭,经统计第i 个家庭的月收入x i (单位:千101010元 )与月积蓄 y i单位:千元)的数据资料,获得i =,i =,i i =,(x80y20x y184i =1i =1i =1102=720.x ii =1^(1)求家庭的月积蓄y 对月收入 x 的线性回归方程 y=bx+a;(2)判断变量 x 与 y 之间是正有关仍是负有关;(3)若该居民区某家庭月收入为 7千元,展望该家庭的月积蓄 .-1n80【解】(1)由题意知 n=10, x=n x i=10=8,i =1- 1 n20y=n y i=10=2,i=1n-222-×=,又x i-n x =72010 880n i=1--x i y i-n x y = 184-10× 8× 2= 24,i=124由此得 b=80= 0.3,--a= y - b x =2- 0.3× 8=- 0.4,^故所求线性回归方程为 y=0.3x-0.4.(2)因为变量 y 的值随 x 值的增添而增添 (b= 0.3>0),故 x 与 y 之间是正有关 .(3)将 x=7 代入线性回归方程能够展望该家庭的月积蓄约为y=0.3×7-0.4=1.7(千元 ).10.某种产品的广告支出x 与销售额 y(单位:百万元 )之间有以下的对应关系x2 4 5 6 8y 3040 60 50 70(1)假定 y 与 x 之间拥有线性有关关系,求线性回归方程;(2)若实质销售额许多于 60 百万元,则广告支出应当许多于多少?【解】-1(1) x =5(2+4+5+6+8)= 5,-1y = 5(30+40+ 60+ 50+70)=50,5x i 2= 22+42+52+ 62+82= 145.i =15x i y i =2×30+ 4× 40+5×60+6×50+ 8×70=1 380.i =15--x i y i -5 x yi =11 380-5×5×50 ∴b == 145- 5× 52 = 6.5,5 2-2x i -5 xi =1-- =- × = ,a = y -b x50 6.5 5 17.5 ^∴线性回归方程为 y =6.5x +17.5.^(2)由线性回归方程得 y ≥60,85即 6.5x +17.5≥ 60,∴x ≥13≈ 6.54, ∴广告花费支出应许多于 6.54 百万元 .[ 能力提高 ]1.某产品的广告花费 x 与销售额 y 的统计数据以下表:广告花费 x(万元 ) 4 2 3 5 销售额 y(万元 )49263954^中的 b 为 9.4,据此模型展望广告花费为 6依据上表可得回归方程 y =bx +a万元时销售额为 ________万元 .【分析】-,-=,由题意可知 x =y3.542则 42=9.4×3.5+a,a=9.1,^y=9.4× 6+ 9.1= 65.5.【答案】65.52.期中考试后,某校高一 (9)班对全班 65 名学生的成绩进行剖析,获得数学^成绩 y 对总成绩 x 的回归直线方程为 y=6+0.4x.由此能够预计:若两个同学的总成绩相差 50 分,则他们的数学成绩大概相差________分. 【导学号: 90200060】【分析】令两人的总成绩分别为 x1,2x .则对应的数学成绩预计为^^y1=6+0.4x1,y2= 6+ 0.4x2,^^-x )|=0.4×50=20.1212【答案】203.已知 x 与 y 之间的几组数据以下表:x123456y021334假定依据上表数据所得线性回归方程为^^^,若某同学依据上表中的前y=b +x a两组数据 (1,0) 和 (2,2) 求得的直线方程为^′,^y= b′ x+ a′,则 ba________b________a′ (填“ >、”“ <或”“=” ).【分析】由两组数据(1,0)和(2,2)可求得直线方程为y= 2x-2,b′=2,a′^=- 2. 而利用线性回归方程的公式与已知表格中的数据,可求得 b =6--x y- 6 x ·yi i713i =158-6×2×65^ -^-13571^62-2=91- 6×72=7, a= y-b x =6-7×2=-3,因此 b<b′,x i-6 x2 i=1^a>a′ .【答案】< >4.某农科所对冬天日夜温差大小与某反季节大豆新品种抽芽多少之间的关系进行剖析研究,他们分别记录了12 月 1 日至 12 月 5 日的每日日夜温差与实验室每日每 100 棵种子中的抽芽数,获得以下资料:日期12月1日12月 2日12月 3日12月4日12月5日温差 x(℃)101113128抽芽数 y(颗)2325302616该农科所确立的研究方案是:先从这 5 组数据中选用 2 组,用剩下的 3 组数据求回归直线方程,再对被选用的 2 组数据进行查验 .(1)若选用的是 12 月 1 日与 12 月 5 日的两组数据,请依据12月2日至 12^月 4 日的数据,求出 y 对于 x 的回归直线方程 y=bx+a;(2)若由回归直线方程获得的预计数据与所选出的查验数据的偏差均不超出2 颗,则以为获得的回归直线方程是靠谱的,试问(1)中所得的回归直线方程能否靠谱?【解】(1)由数据求得,--=27,x=12, y由公式求得,5--b=2,a= y -b x =- 3.^5因此 y 对于 x 的回归直线方程为 y=2x- 3.^5(2)当 x=10 时, y=2×10- 3= 22,|22-23|<2;^5当 x=8 时, y=2×8-3=17,|17-16|<2.因此该研究所获得的回归直线方程是靠谱的.。
2019—2020年最新苏教版高中数学必修三同步练测2.4线性回归方程及解析.docx
(新课标)2019—2020学年苏教版高中数学必修三2.4 线性回归方程同步练测一、填空题(本题共8小题,每小题8分,共64分) 1.观察下列各图形:其中两个变量x 、y 具有相关关系的图是 . 2.下列变量之间的关系是函数关系的是 .①已知二次函数y =ax 2+bx +c ,其中,a ,c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-;②光照时间和果树亩产量; ③降雪量和交通事故发生率; ④每亩施用肥料量和粮食亩产量.3.已知回归方程yˆ=1.5-15,则下列说法正确的是 . ①y =1.5x -15; ②是回归系数; ③是回归系数; ④=10时,=0.4.以下是两个变量x 和y 的一组数据:x 1 2 3 4 5 6 7 8建议用时 实际用时满分 实际得分45分钟100分y 1 4 91625364964则这两个变量间的线性回归方程为 .5.对有线性相关关系的两个变量建立的回归直线方程y ^=a +bx 中,回归系数b . ①可以小于0; ②大于0; ③能等于0; ④只能小于0. 6.给出下列关系:①正方形的边长与面积之间的关系;②某化妆品的销售量与广告宣传费之间的关系; ③人的身高与视力之间的关系;④雾天的能见度与交通事故的发生率之间的关系; ⑤学生与其学号之间的关系. 其中具有相关关系的是________.7.已知回归方程y ^=4.4x +838.19,则可估计x 与y 的增长速度之比约为________. 8.下表是某厂1~4月份用水量(单位:百吨)的一组数据,月份x 1 2 3 4 用水量y4.5432.5由其散点图知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ,则 =________.二、解答题(本题共2小题,共36分)9.(本小题满分16分)2009年12月某班主任为了对本班学生的月考成绩进行分析,决定从全班25名女同学,15名男同学中随机抽取一个容量为8的样本进行分析. (1)如果按性别比例分层抽样,应选男、女生各多少人.(2)随机抽取8位,若这8位同学的数学、物理分数对应如下表:学生编号1 2 3 4 5 6 7 8 数学分数x60 65 70 75 80 85 90 95 物理分数y72778848899395根据上表数据用散点图说明物理成绩y 与数学成绩x 之间是否具有线性相关性?如果具有线性相关性,求y 与x 的线性回归方程(系数精确到0.01).如果不具有线性相关性,请说明理由. 参考公式:回归直线的方程是:y ^=bx +a ,其中b =∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x ,y ^i 是与x i 对应的回归估计值.参考数据:x =77.5,y =84.875,∑i =18(x i-x )2≈1050,∑i =18(x i-x )(y i-y )=687.5.10.(本小题满分20分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:如果与是线性相关的,求回归直线方程.零件数 (/个) 10 20 30 40 50 60 70 80 90 100加工时间(/分)62 68 75 81 89 95 1021081151222.4 线性回归方程同步练测答案一、填空题1.③④ 解析:相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关.①②是不相关的,而③④是相关的.2.① 解析:由函数关系和相关关系的定义可知,①中=b 2-4,因为是已知常数,b 为自变量,所以给定一个的值,就有唯一确定的与之对应,所以与之间是一种确定的关系,是函数关系.②③④中两个变量之间的关系都是随机的、不确定的,所以不是函数关系.3.① 解析:回归直线方程为yˆ=+,其中是回归系数.对回归方程y ˆ=+有=y -x ,即y =x +.4.y ^=9x -15 解析:根据数据可得x =4.5,y =25.5,∑i =1nx 2i=204,∑i =1nx i y i=1 296.b =1221ni ii n i i x ynx y x nx==--∑∑=1 296-8×4.5×25.5204-8×4.52=9,a =y -b x =25.5-9×4.5=-15.∴ y ^=9x -15.5.① 解析:当b =0时,r =0,这时不具有线性相关关系,但b 能大于0也能小于0.6.②④ 解析:①正方形的边长与面积之间的关系是函数关系;②化妆品的销售量与广告宣传费之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系; ③人的身高与视力之间的关系既不是函数关系,也不是相关关系; ④能见度与交通事故的发生率之间具有相关关系; ⑤学生与其学号之间的关系是一种确定的对应关系.综合以上可知,②④具有相关关系,而①是函数关系,⑤是确定的对应关系.③中的两者之间没有因果关系 7.522解析:x 与y 的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.8.5.25 解析:x =2.5,y =3.5,∴a =y -b x =3.5-(-0.7)×2.5=5.25.二、解答题9.解:(1)选男生15×840=3(人),选女生25×840=5(人).(2)以数学成绩x 为横坐标,物理成绩y 为纵坐标作散点图如图.从散点图可以看出这些点大致分布在一条直线附近,并且在逐步上升,故物理成绩与数学成绩具有正相关性. 设y 与x 的线性回归方程是y ^=bx +a ,根据所给的数据,可以计算出b =≈0.65,a ≈84.875-0.65×77.5=34.5,所以y 与x 的线性回归方程是y ^=0.65x +34.5. 10.解:列出下表:1 2 3 4 5 6 7 8 9 101020 30 40 50 60 708090100626875818995102108115122用计算器求得:x =55,y =91.7,=∑∑==--101221011010i ii iix xyx yx =25510385007.91551055950⨯-⨯⨯-≈0.668.=y-x≈91.7-0.668×55=54.96.即所求的回归直线方程为yˆ=0.668+54.96.。
高中线性回归习题含答案
高二选修1—2线性回归习题1. 独立性检验,适用于检查______变量之间的关系 ( )A.线性B.非线性C.解释与预报D.分类2. 样本点),(,),,(),,(2211n n y x y x y x 的样本中心与回归直线a x b yˆˆˆ+=的关系( ) A.在直线上 B.在直线左上方 C. 在直线右下方 D.在直线外3 已知数列 ,11,22,5,2,则52是这个数列的 ( )A.第6项B.第7项C.第19项D.第11项4 用数学归纳法证明)5,(22≥∈>*n N n n n 成立时,第二步归纳假设正确写法是( )A.假设k n =时命题成立B.假设)(*∈=N k k n 时命题成立C.假设)5(≥=n k n 时命题成立D.假设)5(>=n k n 时命题成立5 .确定结论“X 与Y 有关系”的可信度为5.99℅时,则随即变量2k 的观测值k 必须( )A.大于828.10B.小于829.7C.小于635.6D.大于706.26.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是 ( )A .①②③B .①②C .②③D .①③④ 7.在线性回归模型y bx a e =++中,下列说法正确的是A .y bx a e =++是一次函数B .因变量y 是由自变量x 唯一确定的C .因变量y 除了受自变量x 的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e 的产生D .随机误差e 是由于计算不准确造成的,可以通过精确计算避免随机误差e 的产生8.对相关系数r ,下列说法正确的是 ( )A .||r 越大,线性相关程度越大B .||r 越小,线性相关程度越大C .||r 越大,线性相关程度越小,||r 越接近0,线性相关程度越大D .||1r ≤且||r 越接近1,线性相关程度越大,||r 越接近0,线性相关程度越小9.在独立性检验中,统计量2K 有两个临界值:3.841和6.635;当2K >3.841时,有95%的把握说明两个事件有关,当2K >6.635时,有99%的把握说明两个事件有关,当2K ≤3.841时,认N M PCBA 为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2000人,经计算的2K =20.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者有关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病10必过点 .11.已知,x y R +∈,且2x y +>, 求证:1x y +与1y x +中至少有一个小于212. 如图P 是ABC ∆所在平面外一点,,PA PB CB =⊥平面PAB ,M 是PC 的中点,N 是AB 上的点,3AN NB =。
高学期线性回归方程同步练习题(文科)(教师版)
高二第二学期第一章线性回归方程同步练习题(文科)(1)一、选择题1 . 下列两个变量之间的关系哪个不是函数关系( D ) A .角度和它的余弦值 B.正方形边长和面积 C .正n边形的边数和它的内角和 D.人的年龄和身高2.某市纺织工人的月工资(元)依劳动生产率(千元)变化的回归方程为y=50+80x ,则下列说法中正确的是( C )A .劳动生产率为1000元时,月工资为130元B .劳动生产率提高1000元时,月工资提高约为130元C .劳动生产率提高1000元时,月工资提高约为80元D .月工资为210元时,劳动生产率为2000元 3.设有一个回归方程为y=2-1.5x ,则变量x 每增加一个单位时,y 平均 ( C ) A .增加1.5单位 B .增加2单位 C .减少1.5单位 D .减少2单位4.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( A )A.y ^=x +1 B.y ^=x +2 C.y ^=2x +1 D.y ^=x -15.由一组样本(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=a +bx ,下面有四种关于回归直线方程的论述:(1)直线y ^=a +bx 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;(2)直线y ^=a +bx 的斜率是∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2;(3)直线y ^=a +bx 必过(x ,y )点; (4)直线y ^=a +bx 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑ni =1 (y i -a -bx i )2是该坐标平面上所有的直线与这些点的偏差中最小的直线.其中正确的论述有( D )A .0个 B .1个C .2个 D .3个解析 线性回归直线不一定过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的任何一点;b =∑ni =1x i y i -n x y∑ni =1x 2i -n x 2就是线性回归直线的斜率,也就是回归系数;线性回归直线过点(x ,y );线性回归直线是平面上所有直线中偏差∑ni =1(y i -a -bx i )2取得最小的那一条.故有三种论述是正确的,选D. 6.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i =1849,则其线性回归方程为( A ) A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x解析 利用回归系数公式计算可得a =11.47,b =2.62,故y ^=11.47+2.62x . 7. 下列变量之间的关系是函数关系的是( A )A .已知二次函数c bx ax y ++=2,其中a ,b 是已知常数,取b 为自变量,因变量是这个函数的判别式ac b Δ42-=B .光照时间和果树的亩产量C .降雪量和交通事故发生率D .每亩用肥料量和粮食亩产量 8. 列有关线性回归的说法,不正确是( D )A.变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.线性回归直线方程最能代表观测值x ,y 之间的关系D.任何一组观测值都能得到具有代表意义的回归直线方程 9.已知x 与y 之间的一组数据:则y 对x 的线性回归方程y =bx +A. (2,2) B. (1.5,3.5) C. (1,2) D. (1.5,4)10. 设回归直线方程为y =2-1.5x ,若变量x 增加1个单位,则( C ). A. y 平均增加1.5个单位 B. y 平均增加2个单位 C. y 平均减少1.5个单位 D. y 平均减少2个单位二、填空题11.下列关系中,是相关关系的为 (填序号).①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系. 答案 ①②12.下列有关线性回归的说法,正确的是 (填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度 ③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程 答案 ①②③13.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=b ˆx +a ˆ及回归系数b ˆ,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 .答案 ①②③14.下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其截面直径与高度之间的关系;⑤学生的身高与其学号之间的关系,其中有相关关系的是___①③④_____(填序号).15.已知回归方程为yˆ=0.50x-0.81,则x=25时,y ˆ的估计值为 .答案 11.69 16.下表是某厂1~4由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是y ^=-0.7x +a ,则a 等于______.解析 x =2.5,y =3.5,∵回归直线方程过定点(x ,y ),∴3.5=-0.7×2.5+a .∴a =5.25. 17.某服装商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程y =bx +a 中的b ≈-2,气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为________件.答案 46解析 由所提供数据可计算得出x =10,y =38,又b ≈-2代入公式a =y -b x 可得a =58,即线性回归方程y ^=-2x +58,将x =6代入可得.18.正常情况下,年龄在18岁到38岁的人们,体重y (kg )依身高x (cm )的回归方程为y=0.72x-58.5。
苏教版高中数学必修三练习:2.4线性回归方程(一)含答案
2.4 线性回归方程(一)【新知导读】1. 以下两个变量之间的关系中,哪个不是函数关系()A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和其内角和 D .人的年纪和身高2.回归直线方程y bx a 中的 y 是展望值,与实质中的y 关系为()A.y y 越小,说明回归偏差越小B.y y 越大,说明回归偏差越小C.y y 越小,说明回归偏差越小D.y y 越小,说明回归偏差越小3.回归直线方程的系数a,b的最小二乘法预计中,使函数Q (a, b) 最小, Q 函数指()n nA.( y i a bx i ) 2B.y i a bx ii1i 1C.( y i a bx i )2D. y i a bx i【典范点睛】例 1.以下是采集到的新房子销售价钱y 与房子的大小x 的数据:房子大小 x(m2 )80105110115135销售价钱 y (万元)18.42221.624.829.2(1) 画出数据的散点图;(2) 用最小二乘法预计求线性回归方程,并在散点图中加上回归直线;(3)计算此时 Q (a,b) 和 Q(2,0.2)的值,并作比较.【课外链接】1.假定学生在初一和初二数学成绩是线性有关的.若10 个学生初一(x)和初二( y)数学分数如下:x74717268767367706574y76757170767965776272试求初一和初二数学分数间的线性回归方程.【随堂操练】1.以下说法错误的选项是()A.假如变量和之间存在线性有关关系,那么依据它们的一组数据获得一列点(x i , y i ) ( i1,2,3,..., n )将漫步在某向来线的邻近B.假如变量和之间不存在线性有关关系,那么依据它们的一组数据(x i , y i ) ( i1,2,3,..., n )不可以写出一个线性方程C.设x,y是拥有线性有关关系的两个变量,且x对于y的线性回归方程为y bx a ,此中 a, b 叫做回归系数D.在回归剖析中,变量间的关系假如非确立性的关系,则因变量不可以由自变量独一确立2.三点 (3,10),(7,20),(11,24)的线性回归方程是( )A.y 5.75 1.75x B. y 1.75 5.75xC.y 1.75 5.75x D. y 5.75 1.75x3.已知x,y之间的一组数据:x0123y1357则 y 与x的线性回归方程y bx a 必过( )A. (2,2) 点 B .(1.5,0)点 C . (1,2)点 D . (1.5,4)点4.设有一个回归方程为y 3x 2,变量 x 增添一个单位时,则y 均匀增添______个单位.5.已知线性回归方程为y 0.50 x 0.81 ,则x25 时, y 的预计值为_____________.6.某地域某种病的发病人数奉上涨趋向,统计近四年这类病的新发病人数的线性回归剖析以下表表示:年份 ( x )该年新发病人数 ( y)x2003.5 ,y2540.25i i200224004444x i y i[x i ][y i ]20032491b i 1i 1i194.7444x i2[x i ] 2 20042586i 1i 120052684a y bx186623如不加控制,仍按这个趋向发展下去,请展望从2006 年初到 2009 年末的四年时间里,该地域这种病的新发病总人数为 _______________ .7x 与y之间的关系的模型,为偏差项,模型以下:.我们考虑两个表示变量模型 1:y6 4 x ;模型2: y 6 4x.(1) 假如x 3 , 1 ,分别求两个模型中的y 值;(2)分别说明以上两个模型是确立性模型仍是随机性模型.8.在 10 年时期,某城市居民的年收入与某种商品的销售额之间的关系以下表所示:第几年城市居民收入x (亿元)某商品销售额y (万元) 132.225.0231.130.0332.934.0435.837.0537.139.0638.041.0739.042.0843.044.0944.648.01046.051.0(1) 画出散点图; (2)假如散点图中的各点大概散布在一条直线邻近,求 y 与x间的线性回归方程.9.已知对于某设施的使用年限x 与所支出的维修花费y (万元),有以下统计资料:使用年限 x23456维修花费 y 2.2 3.8 5.5 6.57.0设 y 对x呈线性有关关系.试求: (1) 线性回归方程y bx a 的回归系数 a ,b;(2)预计使用年限为 10 年,维修花费是多少?10.在钢线含量对于电阻的效应的研究中,获得以下的数据:碳含量 x(%)0.100.300.400.550.700.800.96电阻 y (200C时,微欧)1518192122.623.826(1)画出散点图 (2) 求线性回归方程.2.4 线性回归方程(一)【新知导读】1.D 2.C3.A【典范点睛】例 1. (1)5555(2)n5,x i545 , x109 ,y i116 , y 23.2 ,x i60952 ,i 1i1i 155129525451160.1962 ,a23.20.1962 109 1.8166x i y i12592 , b,i 15 60952 5452线性回归方程为y0.1962 x 1.8166 ;(3)Q (1.8166,0.1962) 5.1771 , Q(2,0.2)7.0 ,由此可知,求得的a 1.8166, b0.1962是使函数Q (a,b)取最小值的a, b 值.【课外链接】Q x7152y 72.310解:,x i50520,,x i y i51467,所以i 1i1b 10514677107231.2182,a72.3 1.2182 7114.912,因此回归直线方程为10505207102y 1.2182 x14.192.【随堂操练】1.B 2 .D 3. B 4.3 5 .11.69 6. 139497. 解: (1)模型 1:y64x64318 ;模型2: y6 4 x 6 4 3119 .(2) 模型 1中同样的 x 值必定获得同样的y 值,因此是确立性模型;模型2中同样的 x 值,因的不一样,所得 y 值不必定同样,且为偏差项是随机的,因此模型 2 是随机性模型.8.解: (1)102(2)由题意: x 37.97,y39.1 ;x i14633.67 ,i 110i 1x i y i15202.9 ,于是10i x i y i10 x y15202.91037.9739.1b1 1.447 , a y bx 39.1 1.447 10210 x14663.6710 37.9722i 137.97 15.843.因此所求线性回归方程为y bx a 1.447 x 15.843.525112.354 59.解: (1) x 4 , y 5 ,x i90 ,x i y i112.3 ,于是回归系数 bi 1i 190542,a y bx 5 1.23 4 0.08 ;(2)线性回归方程是y 1.23x 0.08,当x 10年时,1.23y 1.23 10 0.08 12.38 (万),即预计使用10年时,维修花费是12.38万元.10.解: (1)(2) 可求得y13.958412.5503 x。
《9.1 线性回归分析》(同步训练)高中数学选择性必修第二册_苏教版_2024-2025学年
《9.1 线性回归分析》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、某地区近五年内每年的GDP(单位:亿元)如下表所示:年份 | GDP–|—– 2016 | 300 2017 | 320 2018 | 350 2019 | 370 2020 | 400若要用线性回归分析预测该地区2021年的GDP,以下哪项说法是正确的?A、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为410亿元B、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为420亿元C、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为400亿元D、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为400亿元2、已知一组数据的线性回归方程为(y=1.5x+20),若将(x)的值增加 2,则(y)的值将()。
A、减少 3B、减少 2C、增加 3D、增加 23、(单选题)若线性回归方程为y = 3x + 1,当x增加1个单位时,y大约增加多少个单位?A. 1个单位B. 3个单位C. 4个单位D. 2个单位4、给定一组数据点((x1,y1),(x2,y2),...,(x n,y n)),假设我们已经计算出了线性回归方程(y=ax+b)中的斜率(a)和截距(b)。
如果增加一个新数据点((x n+1,y n+1))到这组数据中,那么新的线性回归方程中的斜率(a′)相对于原来的斜率(a):A. 一定会变大B. 一定会变小C. 可能会变大,可能会变小,也可能会不变D. 一定不会改变5、某校为研究学生身高与体重之间的关系,随机抽取了10名学生的身高和体重数据,并建立了线性回归方程y=50x+35(其中x为身高,y为体重),若某学生的身高为1.75米,则该学生的预测体重约为:A. 70千克B. 75千克C. 80千克D. 85千克6、某研究机构对两种不同品牌的学习卡片销售情况进行了统计,得到了两组数据,为了找到哪种学习卡片的销售趋势更好的线性回归方程,第一组(品牌A)的广告费用与销售额数据如下:广告费用x(元)分别为100、200、300、400、500,对应的销售额y(万元)分别为15、25、35、45、55。
2019-2020学年高一数学苏教版必修3同步练习:2.4 线性回归方程 Word版含答案
2.4 线性回归方程1、某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( )A. 63.6万元B. 65.5万元C. 67.7万元D. 72.0万元2、某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为0.66.52ˆ16yx =+,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A.83%B.72%C.67%D.66%3、变量X 与Y 相对应的一组数据为()()()()()10,1,11.3,2,11.8,3,12.5,4,13,5,变量U 与V 相对应的一组数据为()()()()()10,5,11.3,4,11.8,3,12.5,2,13,1.1r 表示变量X 与Y 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( ) A.210r r <<B.210r r <<C.210r r <<D.21r r =4、四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且 2.34.4ˆ7623yx =-; ②y 与x 负相关且 3.476 5.6ˆ48yx =-+; ③y 与x 正相关且 5.43.4ˆ7893yx =+; ④y 与x 正相关且 4.326 4.5ˆ78yx =--. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆyx =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆyx =-+ 6、为了解某社区居民的家庭年收入与年支出的关系,随机调査了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y bx a =+,其中0.76,b a y bx ==-,据此估计,该社区一户年收入为15万元家庭的年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元7、为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为1l 和2l ,已知两个人在试验中发现对变量x 的观测数据的平均值恰好相等,都是s ,对变量y 的观测数据的平均值也恰好相等,都是t ,那么下列说法正确的是( ) A.直线1l 和2l 有交点(),s tB.直线1l 和2l 相交,但是交点未必是(),s tC.直线1l 和2l 由于斜率相等,所以必定平行D.直线1l 和2l 必定重合 8、根据如下样本数据得到的回归方程为ˆybx a =+,则( ) A. 0a >,0b < B. 0a >,0b > C. 0a <,0b < D. 0a <,0b >9、某校金融专业的学生学习《统计学》的时间x 与考试成绩y 之间可建立线性回归方程ˆya bx =+,经计算,方程为200.8ˆy x =-,则该方程参数中( ) A. a 值错误 B.b 值错误 C. a 、b 值都错误 D. a 、b 值都正确10、如图,有5组数据,为使剩下的4组数据的线,性相关性最大,则应去掉( ).A.(1,2)B.(3,5)C.(4,10)D.(5,10)11、调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:0.25402ˆ.31yx =+,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加__________万元.12、某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm ,170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm .13、在一组样本数据11(,)x y ,22(,)x y ,…(),n n x y ,(2n ≥,12,,,n x x x ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i x y ()1,2,,i n =⋅⋅⋅都在直线112y x =+上,则这组样本数据的样本相关系数为__________. 14已知与之间的几组数据如下表: x 1 2 3 4 5 6 y 0 2 1 3 3 4假设根据上表数据所得线性回归直线方程为.若某同学根据上表中的前两组数据和求得的直线方程为则以下结论正确的是①;②;③;④15、某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程ˆˆˆybx a =+,其中ˆ20b =-,ˆˆa y bx =-; (2)预计在今后的销售中,销量与单价仍然服从题(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)答案以及解析1答案及解析: 答案:B解析:由表可计算4235742x +++==, 49263954424y +++==,∵点7,422⎛⎫ ⎪⎝⎭在回归直线ˆˆˆy bx a =+上,且ˆb 为9.4,所以7429.4ˆ2a =⨯+, 解得ˆ9.1a=, 故回归方程为9.4.1ˆ9y x =+, 令6x =,得ˆ65.5y=。
苏教版高中数学必修三练习:2.4线性回归方程(一)含答案
2.4线性回归方程(一)【新知导读】1.下列两个变量之间的关系中,哪个不是函数关系 ( ) A .角度和它的余弦值 B .正方形边长和面积 C .正n 边形的边数和其内角和 D .人的年龄和身高2.回归直线方程y bx a ∧=+中的y ∧是预测值,与实际中的y 关系为 ( ) A .y y ∧-越小,说明回归偏差越小 B .y y ∧-越大,说明回归偏差越小 C .y y ∧-越小,说明回归偏差越小D .y y ∧-越小,说明回归偏差越小3.回归直线方程的系数a ,b 的最小二乘法估计中,使函数(,)Q a b 最小,Q 函数指( )A .21()niii y a bx =--∑ B .1niii y a bx=--∑C .2()i i y a bx -- D .i i y a bx --【范例点睛】例1.以下是收集到的新房屋销售价格y 与房屋的大小x 的数据:(3)计算此时(,)Q a b 和(2,0.2)Q 的值,并作比较. 【课外链接】1.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一()x 和初二()y 数学分数如下:【随堂演练】1.下列说法错误的是( )A .如果变量η和ξ之间存在线性相关关系,那么根据它们的一组数据得到一列点(,)i i x y (1,2,3,...,i n =)将散步在某一直线的附近B .如果变量η和ξ之间不存在线性相关关系,那么根据它们的一组数据(,)i i x y (1,2,3,...,i n =)不能写出一个线性方程C .设x ,y 是具有线性相关关系的两个变量,且x 关于y 的线性回归方程为y bx a ∧=+,其中,a b 叫做回归系数D .在回归分析中,变量间的关系若是非确定性的关系,则因变量不能由自变量唯一确定 2.三点(3,10),(7,20),(11,24)的线性回归方程是 ( ) A . 5.75 1.75y x ∧=- B . 1.75 5.75y x ∧=+ C . 1.75 5.75y x ∧=- D . 5.75 1.75y x ∧=+ 3.已知x ,y 之间的一组数据:则y 与x 的线性回归方程y bx a =+必过 ( )A .(2,2)点B .(1.5,0)点C .(1,2)点D .(1.5,4)点4.设有一个回归方程为32y x ∧=+,变量x 增加一个单位时,则y 平均增加______个单位.5.已知线性回归方程为0.500.81y x ∧=-,则25x =时,y 的估计值为_____________. 6.某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病人数的线性回归分析如下表表示:如不加控制,仍按这个趋势发展下去,请预测从2006年初到2009年底的四年时间里,该地区这种病的新发病总人数为_______________.7.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:64y x =+;模型2:64y x δ=++. (1) 如果3x =,1δ=,分别求两个模型中的y 值; (2) 分别说明以上两个模型是确定性模型还是随机性模型.8.在10年期间,某城市居民的年收入与某种商品的销售额之间的关系如下表所示:(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线附近,求y与x间的线性回归方程.9.已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料:设y 对x 呈线性相关关系.试求:(1)线性回归方程y bx a ∧=+的回归系数a ,b ; (2)估计使用年限为10年,维修费用是多少?10.在钢线含量对于电阻的效应的研究中,得到以下的数据:(1)画出散点图(2)求线性回归方程.2.4线性回归方程(一) 【新知导读】 1.D 2.C 3.A 【范例点睛】 例1.(1)(2)5n =,51545ii x==∑,109x =,51116i i y ==∑,23.2y =,55160952i i x ==∑,5112592i i i x y ==∑,25129525451160.1962560952545b ⨯-⨯=≈⨯-,23.20.1962109 1.8166a =-⨯≈, ∴线性回归方程为0.1962 1.8166y x =+;(3)(1.8166,0.1962) 5.1771Q ≈,(2,0.2)7.0Q ≈,由此可知,求得的 1.8166a =,0.1962b =是使函数(,)Q a b 取最小值的a ,b 值. 【课外链接】 解:71x =Q ,52150520ii x==∑,72.3y =,10151467i ii x y==∑,所以210514677107231.21821050520710b ⨯-⨯=≈⨯-,72.3 1.21827114.912a =-⨯=-,所以回归直线方程为1.218214.192y x ∧=-.【随堂演练】1. B2. D3.B4. 35. 11.696.139497.解:(1)模型1:6464318y x =+=+⨯=;模型2:64643119y x δ=++=+⨯+=. (2)模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型. 8. 解:(1)(2)由题意:37.97x =,39.1y =;102114633.67ii x==∑,10115202.9i ii x y==∑,于是1011022211015202.91037.9739.11.44714663.671037.9710i ii i i x y x yb x x==--⨯⨯==≈-⨯-∑∑,39.1 1.447a y bx =-=-⨯37.9715.843≈-.所以所求线性回归方程为 1.44715.843y bx a x ∧=+=-.9.解:(1)4x =,5y =,52190i i x ==∑,51112.3i i i x y ==∑,于是回归系数2112.35459054b -⨯⨯=-⨯ 1.23=,5 1.2340.08a y bx =-=-⨯=;(2)线性回归方程是 1.230.08y x ∧=+,当10x =年时,1.23100.0812.38y ∧=⨯+=(万),即估计使用10年时,维修费用是12.38万元.10.解:(1)(2)可求得13.958412.5503y x ∧=+。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学线性回归方程检测试题(附答案)高中苏教数学③
2. 4线性回归方程测试题一、选择题
1.下列关系属于线性负相关的是()
A.父母的身高与子女身高的关系B.身高与手长C.吸烟与健康的关系D.数学成绩与物理成绩的关系
答案:C
2.由一组数据得到的回归直线方程,那么下面说法不正确的是()
A.直线必经过点B.直线至少经过点中的一个点
的斜率为C.直线 aD.直线和各点的总离差平方和是该坐标平面上所有直线与这些点的离差平方和中最小的直
线
答案:B3.实验测得四组的值为,则y与x之间的回归直线方程为()
A.B.D.C.页 1 第
答案:A
4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是,那么
下列说法正确的是()
A.直线和一定有公共点B.直线和相交,但交点不一定是C.必有直线
D.和必定重合答案:A
二、填空题5.有下列关系:
(1)人的年龄与他(她)拥有的财富之间的关系
(2)曲线上的点与该点的坐标之间的关系
)苹果的产量与气候之间的关系(3(4)森林中的同一种树木,其断面直径与高度之间的关系
(5)学生与他(她)的学号之间的关系
其中,具有相关关系的是. 43)()(1答案:()6.对具有相关关系的两个变量进行的方法叫做回归分析.用页 2 第
直角坐标系中的坐标分别表示具有的两个变量,将数据表中的各对数据在直角坐标系中描点得到的表示具有相关关系的两个变量的一组数据的图形,叫做.
答案:统计分析;相关关系;散点图7.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数、方差分别为,则新数据的平均数是,方差是,标准差是.
答案:;;8.已知回归直线方程为,则可估计x与y 增长速度之比约为.
答案:三、解答题
9.某商店统计了近6个月某商品的进价x与售价y(单位:元)的对应数据如下:
3 5 2 8 9 12
4 6 3 9 12 14求y对 x的回归直线方程.解:,,回归直线方程为.10.已知10只狗的血球体积及红血球的测量值如下:
45 42 46 48 42
6.53 6.30 9.25
7.580 6.99页 3 第
35 58 40 39 50
5.90 9.49
6.20 6.55
7.72x(血球体积,ml),y(红血球数,百万)
)画出上表的散点图;(1(2)求出y对x的回归直线方程并且画出图形.
解:(1)见下图
,)(2 设回归直线方程为,则,.
图形如下:11.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:
2 4 6 8 10 尿汞含量:消光系数 64 134 205 285 360(1)画出散点图;
(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)估计尿汞含量为9毫克/升时的消光系数.
解:
(1)(2)由散点图可知与线性相关,设回归直线方程
为.列表:
页 4 第
1 2 3 4 5
2 4 6 8 1064 134 205 285 360 128 536 1230 2280 3600
回归直线方程为.
(3)当时,.
页 5 第。