高二线性回归方程试题及答案

合集下载

高二数学试卷带答案解析

高二数学试卷带答案解析

高二数学试卷带答案解析考试范围:xxx ;考试时间:xxx 分钟;出题人:xxx 姓名:___________班级:___________考号:___________1.答题前填写好自己的姓名、班级、考号等信息 2.请将答案正确填写在答题卡上一、选择题1.已知变量和满足关系,变量与正相关.下列结论中正确的是( )A .与正相关,与负相关B .与正相关,与正相关C .与负相关,与负相关D .与负相关,与正相关2..若椭圆交于A ,B 两点,过原点与线段AB中点的连线的斜率为,则的值是( )3.关于空间两条直线、与平面,下列命题正确的是( ) A .若,则 B .若,则 C .,则 D .若则4. 抛物线的准线方程是A .B .C .D .5.如图,在正方体中,分别为的中点,则异面直线与所成的角等于( ) A .B .C .D .6.已知在R上开导,且,若,则不等式的解集为()A. B. C. D.7.函数在区间内是增函数,则实数的取值范围是()A. B. C. D.8.若,则下列结论一定正确的是A. B. C. D.9.与椭圆共焦点且过点的双曲线方程是()A.B.C.D.10.下表是之间的一组数据,则的线性回归直线必过点A.B.C.D.11.已知函数,则()A.32 B.16 C. D.12.给出函数的一条性质:“存在常数,使得对于定义域中的一切实数均成立”,则下列函数中具有这条性质的函数是()A. B. C. D.13.已知是球表面上的点,,,,,则球的表面积等于A.4 B.3 C.2 D.14.下列命题中错误的是A.如果平面⊥平面,那么平面内一定存在直线平行于平面B.如果平面不垂直于平面,那么平面内一定不存在直线垂直于平面C如果平面⊥平面,平面⊥平面,,那么⊥平面D.如果平面⊥平面,那么平面内所有直线都垂直于平面15.如右图的流程图,若输出的结果,则判断框中应填A. B. C. D.16.已知直线与椭圆相交于A,B两点,若椭圆的离心率为,焦距为2,则线段AB的长是()A. B. C. D.217.已知各项为正数的等比数列中,,,则等于()A.B.7C.6D.18.用数学归纳法证明由到时,不等式左边应添加的项是()A.B.C.D.19.a,b,c成等比数列是b=的()A.充分但不必要条件B.必要但不充分条件C.充要条件D.既不充分又不必要条件20.现有一段长为18m的铁丝,要把它围成一个底面一边长为另一边长2倍的长方体形状的框架,当长方体体积最大时,底面的较短边长是()A.1 m B.1.5 m C.0.75 m D.0.5 m二、填空题21.对于任意实数,不等式恒成立,则实数的取值范围是;22.已知命题p :所有有理数都是实数,命题q:正数的对数都是负数.则下列命题中为真命题的是________(填所有真命题的序号).①(¬p)∨q;②p∧q;③p∨q;④(¬p)∨(¬q).23.已知关于的不等式的解集为,则关于的不等式的解集为________.24.设f(x)是定义在R上的函数.且满足,如果25.为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互相不相同,则样本数据中的最大值为________.26.2010年广州亚运会组委会要从小张、小赵、小李、小罗、小王五名志愿者中选派四人分别从事翻译、导游、礼仪、司机四项不同工作,若其中小张和小赵只能从事前两项工作,其余三人均能从事这四项工作,则不同的选派方案共有 *** .(用数字回答)K^S*5U.C#O27.已知圆锥的母线长为5cm,侧面积为15πcm2,则此圆锥的体积为 cm3.28.如图所示的是2008年北京奥运会的会徽,其中的“中国印”由四个色块构成,可以用线段在不穿越其他色块的条件下将其中任意两个色块连接起来(如同架桥).如果用三条线段将这四个色块连接起来,不同的连接方法的种数共有种.29.已知有限集.如果中元素满足,就称为“复活集”,给出下列结论:①集合是“复活集”;②若,且是“复活集”,则;③若,则不可能是“复活集”;④若,则“复合集”有且只有一个,且.其中正确的结论是.(填上你认为所有正确的结论序号).30.过抛物线的焦点作直线交抛物线于两点,若,则直线的倾斜角。

高二线性回归方程试题及答案

高二线性回归方程试题及答案

回归直线方程1、某公司为了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的. [附:回归直线的斜率和截距的最小二乘估计公式分别为.] (1)根据频率分布直方图计算图中各小长方形的宽度;(2)试估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入(单位:万元) 1 2 3 4 5 销售收益(单位:万元)2 3 27由表中的数据显示,与之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出关于的回归直线方程.401221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-==--∑∑4x y x y y x2、某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调()完成列联表,并判断在犯错误的概率不超过的前提下,能否认为选题与性 别有关.(Ⅰ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中共抽取8人进行问卷.若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为,求的分布列及数学期望. 附: ,其中.ξξE ξ()()()()()22n ad bc K a b c d a c b d -=++++n a b c d =+++3、面向全市招聘事业编工作人员,由人事、劳动、纪检等部门联合组织招聘考试,招聘考试分为两个阶段:笔试和面试.现将所有参赛选手参加笔试的成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表.(Ⅰ)求出上表中的x,y,z,s,p的值;(Ⅱ)按规定,笔试成绩不低于90分的应聘人员可以参加面试,且面试的方式采用单循环,以参加面试人员胜出的场数决定是否录用(即参加面试的所有人员中每两人必需进行一个场次的PK比赛).已知松山区有两名应聘人员取得面试资格,在所有的比赛中,求有松山区选手参加比赛的概率.答案1、某公司为了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的. [附:回归直线的斜率和截距的最小二乘估计公式分别为.] (1)根据频率分布直方图计算图中各小长方形的宽度;(2)试估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入(单位:万元) 1 2 3 4 5 销售收益(单位:万元)2 3 27由表中的数据显示,与之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出关于的回归直线方程.解:(1)设各小长方形的宽度为,由频率分布直方图中各小长方形的面积总和为1,可知,故,即图中各小长方形的宽度为2. …3分(2)由(1)知各小组依次是, 其中点分别为,对应的频率分别为,故可估计平均值为.7分 (3)由(2)可知空白栏中填5.由题意可知, ,401221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-==--∑∑4x y x y y x m (0.080.10.140.120.040.02)0.51m m +++++⋅==2m =[0,2),[2,4),[4,6),[6,8),[8,10),[10,12]1,3,5,7,9,110.16,0.20,0.28,0.24,0.08,0.0410.1630.250.2870.2490.08110.045⨯+⨯+⨯+⨯+⨯+⨯=12345232573, 3.855x y ++++++++====,,根据公式,可求得 ………………10分, ………………11分 所以所求的回归直线方程为. ………………12分2、某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调()完成列联表,并判断在犯错误的概率不超过的前提下,能否认为选题与性别有关.(Ⅰ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中共抽取8人进行问卷.若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为,求的分布列及数学期望. 附: ,其中.【解析】(Ⅰ)51122332455769i ii x y=⨯+⨯+⨯+⨯+⨯==∑522222211234555ii x==++++=∑26953 3.8121.2,555ˆ310b-⨯⨯===-⨯3.8 1.230ˆ.2a=-⨯= 1.20.2y x =+ξξE ξ()()()()()22n ad bc K a b c d a c b d -=++++n a b c d =+++,故不能认为选题与性别有关.…………………5分(Ⅱ)选择“坐标系与参数方程”与选择“不等式选讲”的人数比例为100:60=5:3, 所以抽取的8人中倾向“坐标系与参数方程”的人数为5,倾向“不等式选讲”的人 数为3.依题意,得,,,, . …………………9分 故的分布列如下:所以. …………………12分 3、面向全市招聘事业编工作人员 ,由人事、劳动、纪检等部门联合组织招聘考试,招聘考试分为两个阶段:笔试和面试.现将所有参赛选手参加笔试的成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表.(Ⅰ)求出上表中的x ,y ,z ,s ,p 的值;(Ⅱ)按规定,笔试成绩不低于90分的应聘人员可以参加面试,且面试的方式采用单循环,以参加面试人员胜出的场数决定是否录用(即参加面试的所有人员中每两人必需进行一个场次的 PK 比赛).已知松山区有两名应聘人员取得面试资格,在所有的比赛中,求有松山区选手参加比赛的概率. 解:(1)由题意知,参加招聘考试的人员共有p == 50人, ∴x == 0.18, 22160(9001800) 3.74 5.0241055510060K -=≈<⨯⨯⨯3,1,1,3=--ξ33381(3)56C P C =-==ξ12533815(1)56C C P C =-==ξ21533830(1)56C C P C ===ξ30533810(3)56C C P C ===ξξ115301033(1)135********E =-⨯+-⨯+⨯+⨯=ξ160.32950y = 50×0.38 = 19, Z = 50﹣9﹣19﹣16 = 6, S = = 0.12 ----------------------------------------------------------6分(Ⅱ)由(Ⅱ)知,参加面试的应聘人员共6人.若参加面试的6人分别记为:S 1 , S 2 , a , b , c , d .( 其中S 1 , S 2 表示松山区的参赛选手,a , b , c , d 表示其他旗、县的选手)则所有的比赛为: (S 1 , S 2 ) (S 1 , a ) (S 1 ,b ) (S 1 ,c ) (S 1 , d ) (S 2 , a ) (S 2 , b ) (S 2 , c ) (S 2 ,d ) (a , b ) ( a , c ) ( a , d ) ( b , c ) (b , d ) (c , d ) 共十五个场次的比赛,有松山区选手出现的比赛有9场. 若有松山区选手参加比赛的事件为:A 则P (A ) =-------------------------------12分65035。

线性回归方程(人教A版)(含答案)

线性回归方程(人教A版)(含答案)

线性回归方程(人教A版)一、单选题(共8道,每道12分)1.人的年龄与人体脂肪的百分数的回归方程为:,如果某人36岁,那么这个人的脂肪含量( )A.一定是B.在附近的可能性比较大C.无任何参考数据D.以上解释均无道理答案:B解题思路:试题难度:三颗星知识点:可线性化的回归分析2.根据如下样本数据:得到的回归方程为,则( )A. B.C. D.答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析3.已知变量与负相关,且由观测数据算得样本平均数,,则由该观测数据算得的线性回归方程可能是( )A. B.C. D.答案:D解题思路:试题难度:三颗星知识点:可线性化的回归分析4.对具有线性相关关系的变量,测得一组数据如下表:根据上表,利用最小二乘法得到它们的回归直线方程为,则的值为( )A.1B.1.5C.2D.2.5答案:B解题思路:试题难度:三颗星知识点:可线性化的回归分析5.某单位为了解办公楼用电量与气温之间的关系,随机统计了四个用电量与当地平均气温,并制作了对照表:由表中数据得到线性归回方程,当气温为时,预测用电量为( )A.68度B.52度C.12度D.28度答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析6.根据如下样本数据:得到回归方程,则( )A.,B.,C.,D.,答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析7.某样本数据如下表所示:假设根据表中数据所得线性回归直线方程为,某同学根据表中的两组数据和求得的直线方程为,根据散点图的分布情况,判断以下结论正确的是( )A.,B.,C.,D.,答案:D解题思路:试题难度:三颗星知识点:可线性化的回归分析8.实验测得四组的值分别为,,,,则与间的线性回归方程是( )A. B.C. D.答案:C解题思路:试题难度:三颗星知识点:可线性化的回归分析。

线性回归方程练习及答案

线性回归方程练习及答案

13.(09·江苏理)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投1021.(本题满分12分)下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x (吨)与相应的生产能耗(1)(2)请根据上表提供的数据,求出y 关于x 的回归直线方程; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?13.(09·江苏理)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10[答案] 25[解析] x 甲=6+7+7+8+75=7,x 乙=6+7+6+7+95=7,∴s 2甲=(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)25=25, s 2乙=(7-6)2+(7-7)2+(7-6)2+(7-7)2+(7-9)25=65, 21.(本题满分12分)下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x (吨)与相应的生产能耗(1)(2)请根据上表提供的数据,求出y 关于x 的回归直线方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?[解析] (1)散点图如图.(2)x -=4.5,y -=3.5,b ^=∑x i y i -4x - y -∑x 2i -4x -2=66.5-6386-81=0.7,a ^=3.5-0.7×4.5=0.35,∴回归直线方程为y ^=0.7x +0.35. (3)90-(0.7×100+0.35)=19.65(t) ∴降低了19.65吨.教你如何用WORD 文档标签: 杂谈1. 问:WORD答:分节,不同。

2. 问:请问word 部改了?答:在插入分隔符里,个字来。

线性回归方程.附答案docx

线性回归方程.附答案docx

线性回归方程一、考点、热点回顾一、相关关系:1、⎩⎨⎧<=1||1||r r 不确定关系:相关关系确定关系:函数关系2、相关系数:∑∑∑===-⋅---=ni ini ini iiy y x x y y x x r 12121)()())((,其中:(1)⎩⎨⎧<>负相关正相关00r r ;(2)相关性很弱;相关性很强;3.0||75.0||<>r r3、散点图:初步判断两个变量的相关关系。

二、线性回归方程:1、回归方程:a x b yˆˆˆ+= 其中2121121)())((ˆxn x yx n yx x x y yx x bn i i ni ii n i i ni ii--=---=∑∑∑∑====,x b y aˆˆ-=(代入样本点的中心) 2、残差:(1)残差图:横坐标为样本编号,纵坐标为每个编号样本对应的残差。

(2)残差图呈带状分布在横轴附近,越窄模型拟合精度越高。

(3)残差平方和∑=-ni i iyy12)ˆ(越小,模型拟合精度越高。

3、相关指数:∑∑==---=n i ini i iy yyyR 12122)()ˆ(1(1)其中:∑=-ni i iyy12)ˆ(为残差平方和;∑=-ni i y y 12)(为总偏差平方和。

(2))1,0(2∈R ,越大模型拟合精度越高。

二、典型例题+拓展训练典型例题1:在一组样本数据),,,2)(,(),,(),,(212211不全相等n n n x x x n y x y x y x ≥的散点图中,若所有样本点),2,1)(,(n i y x i i =都在直线121+-=x y 上,则样本相关系数为( ) 21.21.1.1.--D C B A典型例题2:设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据)2,1)(,(n i y x i i =,用最小二乘法建立的回归方程为71.8585.0ˆ-=x y ,则不正确的是( )A.y 与x 具有正的线性相关关系;B.回归直线过样本点的中心),(y xC.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg扩展2.一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试(1)对变量y 与x 进行相关性检验;(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?典型例题3.为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好.52211521()155110.8451000()i i i ii y y R yy ==-=-=-=-∑∑,221R =-521521()18010.821000()ii i ii yy y y ==-=-=-∑∑,84.5%>82%,所以甲选用的模型拟合效果较好.扩展1.下列说法正确的是( )(1)残差平方和越小,相关指数2R 越小,模型拟合效果越差; (2)残差平方和越大,相关指数2R 越大,模型拟合效果越好; (3)残差平方和越小,相关指数2R 越大,模型拟合效果越好; (4)残差平方和越大,相关指数2R 越小,模型拟合效果越差;A.(1)(2)B.(3)(4)C.(1)(4)D.(2)(3)扩展2.关于某设备的使用年限x (年)和所支出的维修费用y (万元)有下表所示的资料:若由资料知,y 对x 呈线性相关关系,求:(1)线性回归方程a x b yˆˆˆ+=中的回归系数b a ˆ,ˆ; (2)残差平方和与相关指数2R ,作出残差图,并对该回归模型的拟合精度作出适当判断; (3)使用年限为10年时,维修费用大约是多少?三、典型例题4.非线性回归模型:某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费和年销售量(i=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值。

高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精练)(含答案)

高中数学选择性必修三 精讲精炼 8  一元线性回归模型及其应用(精练)(含答案)

8.2 一元线性回归模型及其应用(精练)【题组一 样本中心求参数】1.(2021·全国·高二单元测试)某公司生产某种婴幼儿纸尿裤的产量x 与相应的生产能耗y 有如下样本数据:已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )A .ˆ0.72 2.05yx =+ B .ˆ0.720.35yx =+ C .ˆ0.720.26yx =+ D .ˆ0.350.72yx =+ 【答案】C【解析】设回归直线方程为ˆˆ0.72yx a =+,由样本数据,可得 4.5x =, 3.5y =, 因为回归直线经过点(),x y ,所以ˆ3.50.72 4.5a=⨯+,解得ˆ0.26a =, 所以回归直线方程为ˆ0.720.26yx =+. 故选:C .2.(2021·江西·吉安一中高二开学考试 )已知x 与y 之间的一组数据:()()()()13253749,,,,,,,,则y 与x 的线性回归方程为y bx a =+必过( )A .()26,B .()38,C .()2.56,D .()3.58,【答案】C【解析】由题意可知:1234 2.54x +++==,357964y +++==, ∴y 与x 的线性回归方程必过点()2.5,6.故选:C.3(2021·河南·孟津县第一高级中学 )为了庆祝建党100周年,某网站从7月1日开始推出党史类书籍免费下载活动,已知活动推出时间x (单位:天)与累计下载量y (单位:万次)的统计数据如表所示:根据上表,利用最小二乘法得到回归直线方程 1.4ˆˆyx a =+,据此模型预测,活动推出11天的累计下载量约A .13.8万次B .14.6万次C .16万次D .18万次【答案】C【解析】由表格数据知4567868910126,955x y ++++++++====,由回归直线方程的性质,得ˆ1.469a⨯+=,所以ˆ0.6a =,故ˆ 1.40.6y x =+, 所以当11x =时, 1.4110.616y =⨯+=(万次), 故选:C.4.(2021·河北·藁城新冀明中学高二月考)(多选)随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:根据所给数据,得出y 关于t 的回归直线方程为273y bt =+,则下列说法正确的是( ) A .该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B .y 关于t 的回归直线方程为18273y t =-+ C .估计该市2020年烧烤店盈利店铺的个数为147D .预测从2025年起,该市烧烤店盈利店铺的个数将不超过100 【答案】ABC【解析】由已知数据得3t =,219y =,故A 正确;因为y 关于t 的回归直线过点()3,219,所以2193273b =+,所以18b =-, 所以y 关于t 的回归直线方程为18273y t =-+.故B 正确;2020年的年份代码为7,故2020年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.故C 正确; 令18273100t -+≤,由*t N ∈,得10t ≥,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故D 不正确,故选:ABC.5.(2021·广东惠州 )(多选)某种产品的价格x (单位:元/kg )与需求量y (单位:kg )之间的对应数据如根据表中的数据可得回归直线方程为14.4y bx =+,则以下结论正确的是( ) A .y 与x 正相关 B .y 与x 负相关C .样本中心为()20,8D .该产品价格为35元/kg 时,日需求量大约为3.4kg【答案】BC【解析】由表格数据,随着价格x 的增加,需求量y 随之减少,所以y 与x 负相关. 因为1015202530205x ++++==,111086585y ++++==,故样本中心为()20,8由回归直线14.4y bx =+必过样本点的中心()20,8, 所以有82014.4b =⨯+,解得0.32b =-,所以当35x =时,0.323514.4 3.2y =-⨯+=,日需求量不为最大 故选:BC6.(2021·重庆市秀山高级中学校 )(多选)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD【解析】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD.7.(2021·贵州·贵阳一中 )某产品的广告费用x 与销售额y 的统计数据如下表:根据上表已得回归方程为8.6.8ˆ5yx =-,表中一数据模糊不清,请推算该数据的值为___________. 【答案】12【解析】由题中数据可得3,8.63 5.820x y ==⨯-=,故空白数据为12. 故答案为:128.(2021·全国·高二课时练习)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且回归直线方程为ˆ0.95 2.6yx =+,那么表格中的数据m 的值为______.【答案】6.7 【解析】013424x +++==, 2.2 4.3 4.811.344m m y ++++==, 把(),x y 的坐标代入回归直线方程得11.30.952 2.64m+=⨯+, 解得 6.7m =. 故答案为:6.79.(2021·全国·高二课时练习)蟋蟀鸣叫的频率P (每分钟鸣叫的次数)与气温T (单位:℃)有着很大的关系.某观测人员根据下表中的观测数据计算出P 关于T 的线性回归方程ˆ 5.2168PT =-,则下表中k 的值为______.【答案】51【解析】计算()138414239404T =⨯+++=,()110929443644k P k +=⨯+++=, 将点10940,4k +⎛⎫ ⎪⎝⎭的坐标代入P 与T 的线性回归方程ˆ 5.2168P T =-中,得109 5.2401684k +=⨯-, 解得51k =. 故答案为:51.10.(2021·福建宁德·高三期中)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:由最小二乘法得到回归方程ˆ0.6754.9yx =+,则a =___________. 【答案】75 【解析】1020304050305x ++++==,62688189600.25a y a ++++==+,因为线性回归方程过样本中心点,所以600.20.673054.975a a +=⨯+⇒=,故答案为:75 【题组二 线性回归方程】1.(2021·河北·藁城新冀明中学高二月考)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件;(3)各组残差见解析,残差平方和为3.8182. 【解析】(1)解:散点图如下:(2)解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818i i i y y=--+++--==++∑. 2.(2021·甘肃张掖)某家庭2015~2019年的年收入和年支出情况统计如表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(系数精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2021年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2021年的年支出金额.附:回归方程ˆˆˆybx a =+中的斜率的最小二乘估计公式为()()()1122211ˆnni iiii i nniii i x ynx y xxy y b xnxxx====---==--∑∑∑∑.【答案】(1)ˆ0.780.24yx =+;(2)7.65万元. 【解析】(1)依题意,1(99.61010.411)105x =++++=,1(7.37.588.58.7)85y =++++=,则()5212.32i i x x=-=∑,()()511.8i ii x xy y =--=∑,则有()()()125151.8ˆ0.782.32iii ii x x y y bx x ==--==≈-∑∑,则ˆˆ0.24a y bx =-≈, 所以y 关于x 的线性回归方程为ˆ0.780.24yx =+; (2)当2021年的年收入为9.5万元时,即9.5x =,ˆ0.789.50.247.65y=⨯+=, 所以预测该家庭2021年的年支出金额为7.65万元.3.(2021·云南师大附中)大气污染物PM 2.5的浓度超过一定的限度会影响人的健康.为了研究PM 2.5的浓度是否受到汽车流量的影响,研究人员选择了24个社会经济发展水平相近的城市,在每个城市选择一个交通点统计24小时内过往的汽车流量x (单位:千辆),同时在低空相同的高度测定该时间段空气中的PM 2.5的平均浓度y(单位:μg/m 3),制作了如图所示的散点图:(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明(精确到0.01); (2)建立y 关于x 的回归方程;(3)我国规定空气中的PM 2.5浓度的安全标准为24小时平均依度75μg/m 3,某城市为使24小时的PM 2.5浓度的平均值在60~130μg/m 3,根据上述回归方程预测汽车的24小时流量应该控制在什么范围内?附:参考数据: 1.4x =,95y =,2421() 2.1i i x x =-=∑,2421()60343i i y y =-=∑,241()()294i i i x x y y =--=∑,357.参考公式:相关系数()()nii xx y y r --∑,回归方程ˆˆˆya bx =+中斜率和截距的最小二乘估计公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)答案见解析;(2)140101y x =-;(3)24小时的车流量应该控制在1150~1650辆. 【解析】1)由题得2940.82357r =≈, 因为y 与x 的相关系数近似为0.82,说明y 与x 具有很强的相关性, 从而可以用线性回归模型拟合y 与x 的关系.(2)由95y =得2412421()()ˆ()iii ii x x y y bx x ==--=-∑∑2941402.1==,95140 1.4101a y bx =-=-⨯=-, 所以y 关于x 的回归方程为140101y x =-. (3)当60y =时,由14010160x -=得 1.15x =; 当130y =时,由140101130x -=得 1.65x =. 所以24小时的车流量应该控制在1150~1650辆.4.(2021·全国·高三专题练习)实施新规后,某商场2020年1月份至10月份的收入情况如表.并计算得101890i i i x y ==∑,1021385i i x ==∑,101150i i y ==∑75.99.(1)是否可用线性回归模型拟合y 与x 的关系?请用相关系数r 加以说明;(当0.751r ≤≤时,那么变量x ,y 有较强的线性相关关系)(2)建立y 关于x 的回归方程ˆˆˆybx a =+(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)y 与x 有较强的线性相关关系,可用线性回归模型拟合,说明答案见解析;(2)ˆ0.810.7yx =+,预测该商场12月份的收入为20万元.【解析】(1)由题中数据得1011155 5.51010i i x x ===⨯=∑,10111150151010i i y y ===⨯=∑,1010 5.515825x y =⨯⨯=,于是得1010111()()1089082565i i i i i x x y y x y y x ==--=-=-=∑∑,75.99,从而10()()650.8675.99iix x y y r --==≈∑,0.75||1r ≤≤, 所以y 与x 有较强的线性相关关系,可用线性回归模型拟合;(2)由(1)知1011065i i i x y x y =-=∑,而1021385i i x ==∑,221010 5.5302.5x =⨯=,从而得10122110106565ˆ0.8385302.582.510i ii i i x y ybx xx ==-===≈--∑∑,65ˆˆ15 5.510.782.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ0.810.7yx =+,当12x =时,ˆ0.81210.720y =⨯+≈, 从而预测该商场12月份的收入为20万元.5(2021·河南许昌 )某新型外贸出口公司对2021年过去9个月的出口销售数据进行整理,得到了今年第x 个月份与截止该月底的销售额y (单位:万元)之间的关系,如下表:(1)若y 与x 满足线性关系,求出y 关于x 的回归方程;(ˆa,ˆb 精确到整数位) (2)预测该公司10月份的销售额附:参考数据:913087i i y ==∑;9117524i i i x y ==∑;921285i i x ==∑;参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ35169yx =+;(2)答案见解析. 【解析】(1)5x =,343y =,919175249534317524154352089i i i x y xy =∴-=-⨯⨯=-=∑92221952859560ii x=-⨯=-⨯=∑,2089ˆ3560b ∴=≈, 2089ˆ343516960a=-⨯≈, ˆ35169yx ∴=+ (2)当10x =时,ˆ3510169519y=⨯+=, 所以预测该公司10月份销售额为519万元.6.(2021·福建·莆田第二十五中学高三月考)2021年东京奥运会,中国举重选手8人参赛,7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表 (1)根据表中的数据,求出运动员举重成绩y 与运动员的体重x 的回归直线方程(保留1位小数); (2)某金牌运动员抓举成绩为170公斤,挺举成绩为204公斤,则该运动员最有可能是参加的哪个级别的举重?参考数据:()()()992112620,7076i i i i i x x x x y y ==-=--=∑∑;参考公式:()()()121ˆˆˆ,niii nii x x yy bay bx xx ==--==--∑∑. 【答案】(1) 2.7155.4y x =+;(2)83公斤级举重. 【解析】(1)依题意,5459647076839199106789x ++++++++==,2913043373533633894064214303669y ++++++++==,()()()1217076ˆ 2.702620nii i nii xx y y bxx ==--===-∑∑, 则366 2.778155.4a y bx =-=-⨯=, 故回归方程为: 2.7155.4y x =+.(2)该运动员的抓举和挺举的总成绩为374公斤,根据回归方程可知:374 2.7155.4x =+, 解得81x ≈,即该运动员的体重应该在81公斤左右,即参加的应该是83公斤级举重.7.(2021·西藏·拉萨中学高二月考)珠海国际赛车场(简称ZIC)位于珠海经济特区金鼎镇.创建于1996年,是中国国内第一座符合国际汽车联盟一级方程式标准的国际级赛车场.目前该赛事已打造成集赛车竞技运动、汽车文化极致体验、主题休闲度假为一体的超级汽车文化赛事娱乐综合体.为了减少对环境的污染,某环保部门租用了特制环保车清洁现场垃圾.通过查阅近5年参会人数(万人)与所需环保车辆数量(辆),得到如下统计表:(1)根据统计表所给5组数据,求出关于,x y 的线性回归方程ˆˆy bxa =+. (2)已知租用的环保车平均每辆的使用成本费用C (元)与数量(辆)的关系为3000200035,N 2900t t 35,N t t t C t +<<∈⎧=⎨≥∈⎩,主办方根据实际参会人数投入所需环保车,租车每辆支付费用6000元,超出实际需要的车辆,主办方不支付任何费用.预计本次赛车会大约有14万人参加,根据(1)中求出的线性回归方程,预测环保部门在确保清洁任务完成的前提下,应租用多少辆环保车?获得的利润是多少? (注:利润L =主办方支付费用-使用成本费用C ).参考公式:()()()1122211ˆ,ˆˆn niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑ 【答案】(1) 2.32y x =+;(2)为确保完成任务,需要租用35辆环保车,获得的利润108500元. 【解析】(1)11981012105x ++++==2823202529255y ++++== ()()()()()()()()()22222131******** 2.310111091081010101210ˆb ⨯+-⨯-+-⨯-++⨯===-+-+-+-+- ˆˆ2ay bx =-= 关于,x y 的线性回归方程 2.32y x =+ (2)将14x =代入 2.32y x =+得34.2y =为确保完成任务,需要租用35辆环保车, 所以290035101500C =⨯=获得的利润600035101500108500L =⨯-=元8.(2021·江西·新余市第一中学高二月考)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 中至少有一个数小于25”的概率;(2)请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程y bx a =+.(参考公式:回归直线方程为y bx a =+,其中()1221ni ii nii x y nxyb xn x==-=-∑∑,a y bx =-)【答案】(1)710(2)532y x =-【解析】(1)从3月1日至3月5日中任选2天,m ,n 构成的基本事件(m ,n )有:(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个.记“m ,n 至少有一个数小于25”为事件A ,包括:(23,25),(23,30),(23,26),(23,16),(25,16),30,16),(26,16),共有7个基本事件 由古典概型概率公式:7()10P A = (2)11131225302612,27,33x y ++++==== 22221125133012263122751113123122b ⨯+⨯+⨯-⨯⨯==++-⨯. 于是,5271232a =-⨯=-故所求线性回归方程为532y x =- 9.(2021·全国·高二单元测试)某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (1)求y 关于t 的线性回归方程;(2)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121()()()niii nii t t y y b tt ==--=-∑∑,a y bt =-.【答案】(1)ˆ0.5 3.3yt =+;(2)分布列见解析;期望为98. 【解析】(1)根据2018年的抽样数据可得2018年的人均纯收入为1(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210+++++++++= 千元,根据2019年的抽样数据可得2019年的人均纯收入为1(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910+++++++++=千元,由所给的数据得1(1234567)47t =++++++=,1(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37y =++++++=, ∴721()941014928i i t t =-=++++++=∑,71()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614ii i tt y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,∴71721()()14ˆ0.528()ii i ii tt y y btt ==--===-∑∑, 则ˆˆ 5.30.54 3.3ay bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3yt =+; (2)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X 的可能取值为0,1,2,3,则35385(0)28C P X C ===,12353815(1)28C C P X C ===,21353815(2)56C C P X C ===,33381(1)56C P X C ===,∴随机变量X 的分布列为则X 的分布列为:则5151519()0123282856568E X =⨯+⨯+⨯+⨯= 【题组三 非线性回归方程】1.(2021·福建·泉州科技中学 )数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99⨯盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33⨯)内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP 上进行一段时间的训练,每天的解题平均速度y (秒)与训练天数x (天)有关,经统计得到如表的数据:现用by a x=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP 上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1i t x =)参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-⋅.【答案】(1)1000130y x=+,经过100天训练后,每天解题的平均速度y 约为140秒;(2)243256.【解析】(1)由题意,1(990990450320300240210)5007y =++++++=,令1t x=,设y 关于t 的线性回归方程为y bt a =+,则 717221184570.3750010000.5577i ii i i t y t yb t t==-⨯-⨯-===⋅∑∑,则50010000.37130a =-⨯=. ∴1000130y t =+,又1t x=,∴y 关于x 的回归方程为1000130y x=+, 故100x =时,140y =.∴经过100天训练后,每天解题的平均速度y 约为140秒.(2)设比赛再继续进行X 局小明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负.当2X =时,小明4:1胜,∴339(2)4416P X ==⨯=;当3X =时,小明4:2胜,∴123339(3)144432P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭;当4X =时,小明4:3胜,∴21333327(4)1444256P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭.∴小明最终赢得比赛的概率为99272431632256256++=. 2.(2021·云南大理 )2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.y x =+,模型②:ˆ14.4y =;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7yx a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)模型②拟合精度更高、更可靠,72.93亿;(2)投入17亿元比投入20亿元时收益小. 【解析】(1)对于模型①, 对应的15222740485460=387y ++++++=,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ14.472.93=≈y. (2)当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.3.(2021·全国·高二单元测试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产的产品数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下散点图.参考数据:(其中1iu x =) (1)观察散点图判断,by a x=+与y c dx =+哪一个适宜作为非原料成本y 与生产的产品数量x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)试预测生产该产品10千件时,每件产品的非原料成本为多少元? 【答案】(1)b y a x =+;(2)100ˆ11y x=+;(3)21元.【解析】(1)由题意,根据题设中的散点图,可得这些点分布在b y a x =+的两侧,所以选择函数by a x=+作为非原料成本y 与生产的产品数量x 的回归方程类型. (2)令1u x =,则by a x=+可转化为y a bu =+,则y 与u 的关系可看成线性相关关系. 因为360458y ==,所以8182218183.480.344561ˆ1001.5380.1150.618i ii ii u yu y b uu==-⋅-⨯⨯====-⨯-∑∑,则ˆˆ451000.3411a y bu =-=-⨯=,所以ˆ11100y u =+,代入1u x =,得100ˆ11y x=+.(3)当10x =时,100ˆ112110y=+=,所以预测生产该产品10千件时,每件产品的非原料成本为21元. 4.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①2y x αβ=+,②e x t y λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.现该公司对收集的近12年的年研发资金投入量i x 和年销售额i y (1,2,,12i =⋅⋅⋅)的数据作了初步处理,令2u x =,ln v y =,经计算得到如下数据:(1)设u 和y 的样本相关系数为1r ,x 和v 的样本相关系数为2r ,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立y 关于x 的非线性经验回归方程;(ii)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 约为多少亿元? 参考数据为308477=⨯9.4868, 4.4998e 90≈.【答案】(1)模型e x t y λ+=的拟合效果更好;(2)(i)0.018 3.84ˆe x y+=;(ii)36.66亿元. 【解析】(1)()()121215000.8625000iiu u y y r --====∑,()()12214100.91770.211iix x v v r --====≈⨯∑,因为12r r <,所以从样本相关系数的角度判断,模型e x t y λ+=的拟合效果更好. (2)(i)先建立v 关于x 的经验回归方程. 由e x t y λ+=,得ln y x t λ=+,即v λx t =+.()()()121122114ˆ0.018770iii ii x x v v x x λ==--==≈-∑∑, ˆˆ 4.20.01820 3.84tv x λ=-=-⨯=, 所以v 关于x 的经验回归方程为0.01838ˆ.4vx +=, 所以0.0134ˆln 8.8x y=+,即0.018 3.84ˆe x y +=.(ii)若下一年销售额y 需达到90亿元,则由0.018 3.84ˆe x y+=,得0.018 3.8490e x +=, 又 4.4998e 90≈,所以4.49980.018 3.84x ≈+, 所以 4.4998 3.8436.660.018x -≈≈,所以预测下一年的研发资金投入量约为36.66亿元.5.(2021·全国·高二课时练习)噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D (单位:dB )与声音能量I (单位:2W cm -⋅)之间的关系,将测量得到的声音强度D 和声音能量I 的数据作了初步处理,得到如图所示的散点图:参考数据:111.0410I -⨯=,45.7D =,11.5W =-,()1022111.5610i i I I-=-=⨯∑,()10210.51i i W W=-=∑,()()101116.8810iii IID D -=--=⨯∑,()()1015.1i i i W W D D =-⋅-=∑,其中lg i i W I =,101110i i W W ==∑.(1)根据散点图判断,11D a b I =+与22lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归模型?(给出判断即可,不必说明理由)(2)求声音强度D 关于声音能量I 的非线性经验回归方程.(3)假定当声音强度大于60dB 时,会产生噪声污染.城市中某点P 处共受到两个声源的影响,这两个声源的声音能量分别是a I 和b I ,且101410a bI I +=.已知点P 处的声音能量等于a I 与b I 之和.请根据(2)中的非线性经验回归方程,判断点P 处是否受到噪声污染,并说明理由.【答案】(1)22lg D a b I =+更适合;(2)ˆ10lg 160.7DI =+;(3)P 会受到噪声污染,理由见解析. 【解析】(1)22lg D a b I =+更适合. (2)设ˆˆD bW a =+,则 ∵()()()10110215.1ˆ100.51iii i i W W D D bW W==--===-∑∑, ∴ˆˆ160.7a D bW=-=, ∴D 关于W 的经验回归方程是ˆ10160.7DW =+,则D 关于I 的非线性经验回归方程是ˆ10lg 160.7DI =+. (3)设点P 处的声音能量为1I ,则1a b I I I =+. ∵101410a bI I +=, ∴()101010141410105910b a a b a b a b a b I I I I I I I I I I I ---=+=++=++≥⎛⎫⎛⎫ ⎪⎝⨯ ⎪⎝⎭⎭(当且仅当10310a I =,93510bI =⨯时等号成立) 根据(2)中非线性经验回归方程,知点P 处的声音强度D 的预报值的最小值,()10min 10lg 910160.710lg960.760D -=⨯+=+>,∴点P 会受到噪声污染.6.(2021·福建·福州三中高二期中)某地从2月20日开始的连续7天的某传染病累计确诊人数如下表:由上述表格得到如下散点图.(1)根据散点图判断lg =+y a b x 与x y c d =⋅(,c d 均为大于0的常数)哪一个更适合作为累计确诊人数y 与天数x 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)3月20日,该地的疾控中心接受了1000份血液样本,假设每份样本的检验结果是阳性还是阴性是相互独立的,且每份样本是阳性的概率是0.6,试剂把阳性样本检测出阳性结果的概率是0.99(试剂存在阳性样本检测不出来的情况,但不会把阴性样本检测呈阳性样本),求这1000份样本中检测出呈阳性的份数的期望.参考数据:其中11lg ,7i i i i v y v v ===∑参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线ˆvu αβ=+的斜率和截距的最小二乘估计公式分别为1221,ni i i ni i u v nuvv u unuβαβ==-==--∑∑,v u αβ=-.【答案】(1)0.253.4710x x y c d y =⋅=⨯; (2)594【解析】(1)由散点图可知,x y c d =⋅更适合作为累计确诊人数y 与天数x 的回归方程类型. 把x y c d =⋅两边取对数,得lg lg lg y c x d =+, 令lg v y =,则lg lg v c x d =+,1(1234567)47x =++++++=,7211.54140i i v x ===∑,, 7172221750.1274 1.54lg 0.25140747i i i i i x v xvd x x==--⨯⨯===-⨯-∑∑,所以lg 1.540.2540.54c =-⨯=,则0.540.25v x =+, 所以y 关于x 的回归方程为0.253.4710x y =⨯; (2)设这1000份样本中检测出呈阳性的份数为X , 每份样本检测出阳性的概率为0.60.990.594P =⨯=, 由题意可知,(10000.594)XB ,,所以()10000.594594E X =⨯=份.故这1000份样本中检测出呈阳性的份数的期望为594.7.(2021·山西太原·高二期中(文))为了更好的指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中ln i i w y =(1)根据散点图判断,可采用x y a b =⋅作为这个地区未成年男性体重y 千克与身高x 厘米的回归方程.利用表中数据建立y 关于x 的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常? 参考数据:0.020.71751.02,2,1.0231.99e e ===. 参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,nii i nii uu v v v u uu βαβ==--==--∑∑.【答案】(1)2 1.02x y =⨯;(2)体重偏胖. 【解析】(1)由x y a b =⋅,得ln ln ln y a x b =+⋅, 设ˆˆˆw cx d=+,由表格中数据,得801ˆ0.02400050c ===, ˆ 3.40.021350.7d=-⨯=, 则0.70.02ln 0.7,ln 0.02,2, 1.02a b a e b e ======, 则y 关于x 的回归方程为2 1.02x y =⨯.(2)当175x =时,1752 1.02231.9963.98y =⨯=⨯=,因为63.98 1.276.77678⨯=<,所以该名在校男生的体重偏胖.。

高二数学试卷带答案解析

高二数学试卷带答案解析

高二数学试卷带答案解析考试范围:xxx;考试时间:xxx分钟;出题人:xxx姓名:___________班级:___________考号:___________1.答题前填写好自己的姓名、班级、考号等信息2.请将答案正确填写在答题卡上一、选择题1.已知某车间加工零件的个数与所花费时间之间的线性回归方程为,则加工600个零件大约需要的时间为A. B. C. D.2.椭圆+=1的右焦点到直线y=x的距离是 ()A. B. C.1 D.3.某单位200名职工中,年龄在岁以上占,岁占,岁以下占;现要从中抽取40名职工作样本。

若用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第组抽出的号码为,则第8组抽出的号码应是___①_;若用分层抽样方法,则40岁以下年龄段应抽取__②_人.①②两处应填写的数据分别为().A. B. C. D.4.在对某样本进行实验时,测得如下数据:则与之间的回归直线方程为()3254A、B、C、D、5.在展开式中的系数为,则()A. B. C. D.6.设函数,则( )A.为的极小值点B.为的极大值点C.为的极小值点D.为的极大值点7. ABCD为长方形,AB=4,BC=2,O为AB的中点。

在长方形ABCD内随机取一点,取到的点到O的距离小于2的概率为()A. B. C. D.8.下列关于函数、函数的定义域、函数的值域、函数的对应法则的结构图正确的是()9.(2012春•武汉校级期末)若三直线2x+3y+8=0,x﹣y﹣1=0和x+ky=0相交于一点,则k=()A.﹣2 B. C.2 D.10.某天上午要排语文、数学、体育、计算机四节课,其中体育不排在第一节,那么这天上午课程表的不同排法共有()A.6种 B.9种 C.18种 D.24种11.《九章算术》是我国古代数学名著,在其中有道“竹九问题”“今有竹九节,下三节容量四升,上四节容量三升.问中间二节欲均容各多少?”意思为 :今有竹九节,下三节容量和为4升,上四节容量之和为3升,且每一节容量变化均匀(即每节容量成等差数列).问每节容量各为多少?在这个问题中,中间一节的容量为()A. B. C. D.12.函数是定义在R上的偶函数,且满足时,,若方程恰有三个不相等的实数根,则实数的取值范围是()A. B. C. D.13.已知为上的可导函数,且,均有,则有()A.,B.,C.,D.,14.设x>0,y>0,M=,N=+,则M,N的大小关系是()A.M>NB.M<NC.M=ND.不确定15.在如图所示的“茎叶图”表示的数据中,众数和中位数分别是().A.23与26B.31与26C.24与30D.26与3016.某几何体的三视图如图所示,则该几何体的体积是()A.B.C.D.17.若,,分别为正三角形的边,,的中点,以△为底面,把△,△,△折起使,,重合为一点,则下列关于线段与的论述不正确的为()A.垂直 B.长度相等 C.异面 D.夹角为18.若,则等于()A B CD19.已知函数(且)是上的减函数,则的取值范围是( )A .B .C .D .20.已知集合则A .B .C .D .二、填空题 21.若数列{},(n ∈N )是等差数列,则有数列b =(n ∈N )也是等差数列,类比上述性质,相应地:若数列{c }是等比数列,且c >0(n ∈N ),则有d ="____________" (n ∈N )也是等比数列。

线性回归习题答案

线性回归习题答案

线性回归习题答案线性回归是统计学中一种常见的数据分析方法,用于建立自变量与因变量之间的线性关系模型。

在实际应用中,线性回归模型常用于预测、趋势分析和关联度分析等领域。

下面将通过一些典型的线性回归习题来探讨其应用。

习题一:某公司根据过去几年的销售数据,建立了一个线性回归模型来预测未来的销售额。

已知公司的广告费用与销售额之间存在着一定的线性关系。

根据模型,当广告费用为1000元时,预测的销售额为15000元。

求该模型的回归方程。

解答:假设回归方程为y = a + bx,其中y表示销售额,x表示广告费用。

根据已知条件,可以得到一个方程:15000 = a + 1000b。

进一步,如果再给出另外一个广告费用与销售额的数据点,就可以求解出回归方程的具体参数a和b。

习题二:某城市的房价与房屋面积之间存在一定的线性关系。

已知一套房子的面积为120平方米,根据线性回归模型预测其价格为80万元。

求该模型的回归方程。

解答:假设回归方程为y = a + bx,其中y表示房价,x表示房屋面积。

根据已知条件,可以得到一个方程:80 = a + 120b。

同样地,如果再给出另外一个房屋面积与价格的数据点,就可以求解出回归方程的具体参数a和b。

习题三:某公司根据市场调研数据,建立了一个线性回归模型来分析产品销售量与价格之间的关系。

已知当产品价格为10元时,预测的销售量为1000个。

根据该模型,求当产品价格为15元时的预测销售量。

解答:假设回归方程为y = a + bx,其中y表示销售量,x表示产品价格。

根据已知条件,可以得到一个方程:1000 = a + 10b。

根据该方程,可以求解出参数a和b的具体值。

然后,将x取15,代入回归方程中,即可得到当产品价格为15元时的预测销售量。

通过以上习题的解答,我们可以看到线性回归模型在实际问题中的应用。

通过建立合适的回归方程,我们可以通过已知的自变量值来预测因变量的取值。

这对于企业决策、市场分析以及经济预测等方面都具有重要意义。

高二第二学期第一章线性回归方程同步练习题(文科)(1)(教师版)

高二第二学期第一章线性回归方程同步练习题(文科)(1)(教师版)

高二第二学期第一章线性回归方程同步练习题(文科)(1)一、选择题1 . 下列两个变量之间的关系哪个不是函数关系( D ) A .角度和它的余弦值 B.正方形边长和面积 C .正n边形的边数和它的内角和 D.人的年龄和身高2.某市纺织工人的月工资(元)依劳动生产率(千元)变化的回归方程为y=50+80x ,则下列说法中正确的是( C )A .劳动生产率为1000元时,月工资为130元B .劳动生产率提高1000元时,月工资提高约为130元C .劳动生产率提高1000元时,月工资提高约为80元D .月工资为210元时,劳动生产率为2000元 3.设有一个回归方程为y=2-1.5x ,则变量x 每增加一个单位时,y 平均 ( C ) A .增加1.5单位 B .增加2单位 C .减少1.5单位 D .减少2单位4.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( A )A.y ^=x +1 B.y ^=x +2 C.y ^=2x +1 D.y ^=x -15.由一组样本(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=a +bx ,下面有四种关于回归直线方程的论述:(1)直线y ^=a +bx 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;(2)直线y ^=a +bx 的斜率是∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2;(3)直线y ^=a +bx 必过(x ,y )点; (4)直线y ^=a +bx 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑ni =1 (y i -a -bx i )2是该坐标平面上所有的直线与这些点的偏差中最小的直线.其中正确的论述有( D )A .0个 B .1个C .2个 D .3个解析 线性回归直线不一定过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的任何一点;b =∑ni =1x i y i -n x y∑ni =1x 2i -n x 2就是线性回归直线的斜率,也就是回归系数;线性回归直线过点(x ,y );线性回归直线是平面上所有直线中偏差∑ni =1(y i -a -bx i )2取得最小的那一条.故有三种论述是正确的,选D. 6.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i =1849,则其线性回归方程为( A ) A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x解析 利用回归系数公式计算可得a =11.47,b =2.62,故y ^=11.47+2.62x . 7. 下列变量之间的关系是函数关系的是( A )A .已知二次函数c bx ax y ++=2,其中a ,b 是已知常数,取b 为自变量,因变量是这个函数的判别式ac b Δ42-=B .光照时间和果树的亩产量C .降雪量和交通事故发生率D .每亩用肥料量和粮食亩产量 8. 列有关线性回归的说法,不正确是( D )A.变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.线性回归直线方程最能代表观测值x ,y 之间的关系D.任何一组观测值都能得到具有代表意义的回归直线方程 9.已知x 与y 之间的一组数据:则y 对x 的线性回归方程y =bx +A. (2,2) B. (1.5,3.5) C. (1,2) D. (1.5,4)10. 设回归直线方程为y =2-1.5x ,若变量x 增加1个单位,则( C ). A. y 平均增加1.5个单位 B. y 平均增加2个单位 C. y 平均减少1.5个单位 D. y 平均减少2个单位二、填空题11.下列关系中,是相关关系的为 (填序号).①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系. 答案 ①②12.下列有关线性回归的说法,正确的是 (填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度 ③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程 答案 ①②③13.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=b ˆx +a ˆ及回归系数b ˆ,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 .答案 ①②③14.下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其截面直径与高度之间的关系;⑤学生的身高与其学号之间的关系,其中有相关关系的是___①③④_____(填序号).15.已知回归方程为yˆ=0.50x-0.81,则x=25时,y ˆ的估计值为 .答案 11.69 16.下表是某厂1~4由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是y ^=-0.7x +a ,则a 等于______.解析 x =2.5,y =3.5,∵回归直线方程过定点(x ,y ),∴3.5=-0.7×2.5+a .∴a =5.25. 17.某服装商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程y =bx +a 中的b ≈-2,气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为________件.答案 46解析 由所提供数据可计算得出x =10,y =38,又b ≈-2代入公式a =y -b x 可得a =58,即线性回归方程y ^=-2x +58,将x =6代入可得.18.正常情况下,年龄在18岁到38岁的人们,体重y (kg )依身高x (cm )的回归方程为y=0.72x-58.5。

2022年山东省烟台市第二十三中学高二数学理下学期期末试题含解析

2022年山东省烟台市第二十三中学高二数学理下学期期末试题含解析

2022年山东省烟台市第二十三中学高二数学理下学期期末试题含解析一、选择题:本大题共10小题,每小题5分,共50分。

在每小题给出的四个选项中,只有是一个符合题目要求的1. 表中提供了某厂节能降耗技术改造后生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据.根据下表提供的数据,求出y关于x的线性回归方程为=0.7x+0.35,那么表中t的值为()A.3 B.3.15 C.3.5 D.4.5参考答案:A【考点】回归分析的初步应用.【专题】计算题.【分析】先求出这组数据的样本中心点,样本中心点是用含有t的代数式表示的,把样本中心点代入变形的线性回归方程,得到关于t的一次方程,解方程,得到结果.【解答】解:∵由回归方程知=,解得t=3,故选A.【点评】本题考查回归分析的初步应用,考查样本中心点的性质,考查方程思想的应用,是一个基础题,解题时注意数字计算不要出错.2. “杨辉三角” 是中国古代重要的数学成就,在南宋数学家杨辉所著的《详解九章算法》一书中出现,它比西方的“帕斯卡三角形”早了300多年,如图是杨辉三角数阵,记a n为图中第n行各个数之和,S n 为{a n}的前n项和,则A. 1024 B. 1023 C. 512 D. 511参考答案:B【分析】依次算出前几行的数值,然后归纳总结得出第行各个数之和的通项公式,最后利用数列求和的公式,求出【详解】由题可得:,,,,,依次下推可得:,所以为首项为1,公比为2的等比数列,故;故答案选B【点睛】本题主要考查杨辉三角的规律特点,等比数列的定义以及前项和的求和公式,考查学生归纳总结和计算能力,属于基础题。

3. 关于x的不等式mx2﹣mx﹣1<0的解集是全体实数,则m应满足的条件是()A.[﹣4,0] B .(﹣4,0] C .[0,4)D .(﹣4,0)参考答案:B【考点】二次函数的性质.【专题】函数思想;综合法;不等式的解法及应用.【分析】若m=0.则﹣1<0恒成立,若m≠0,由不等式的解集是全体实数可知f(x)=mx2﹣mx﹣1开口向下,△<0,列出不等式解出m的范围.【解答】解:当m=0时,不等式为﹣1<0,恒成立;当m≠0时,∵不等式mx2﹣mx﹣1<0的解集是全体实数,∴,解得﹣4<m<0.综上,m的取值范围是(﹣4,0].故选:B.【点评】本题考查了二次不等式与二次函数的关系,对m进行讨论是关键.4. 观察式子:,,,,则可归纳出式子为()A.B.C.D.参考答案:C5. 如右图,阴影部分面积为()A.B.C.D.参考答案:B略6. 下列说法中运用了类比推理的是()A. 人们通过大量试验得出掷硬币出现正面向上的概率为0.5B. 在平面内,若两个正三角形的边长的比为1:2,则它们的面积比为1:4.从而推出:在空间中,若两个正四面体的棱长的比为1:2,则它们的体积比为1:8C. 由数列的前5项猜出该数列的通项公式D. 数学中由周期函数的定义判断某函数是否为周期函数参考答案:B【分析】根据归纳推理、类比推理、和演绎推理对四个选项逐一判断,最后选出正确的答案.【详解】选项A:是归纳推理;选项B:是类比推理;选项C:是归纳推理;选项D:是演绎推理.【点睛】本题考查了类比推理,熟练掌握归纳推理、类比推理、和演绎推理的定义是解题的关键.7. 已知多项式f(x)=4x5+2x4+3.5x3﹣2.6x2+1.7x﹣0.8,用秦九韶算法算f(5)时的V1值为( )A.22 B.564.9 C.20 D.14130.2参考答案:A考点:秦九韶算法.专题:算法和程序框图.分析:利用秦九韶算法可得f(x)=((((4x+2)x+3.5)x﹣2.6)x+1.7)x﹣0.8,即可得出.解答:解:∵f(x)=((((4x+2)x+3.5)x﹣2.6)x+1.7)x﹣0.8,∴v0=4,v1=4×5+2=22.故选:A.点评:本题考查了秦九韶算法,属于基础题.8. 已知垂直时k值为 ( )A.17 B.18 C.19D.20参考答案:C9. 我国古代称直角三角形为勾股形,并且直角边中较小者为勾,另一直角边为股,斜边为弦。

2021-2022学年河南省南阳市高二年级下册学期第三次考试数学(文)试题【含答案】

2021-2022学年河南省南阳市高二年级下册学期第三次考试数学(文)试题【含答案】

2021-2022学年河南省南阳市高二下学期第三次考试数学(文)试题一、单选题1.为了研究某种细菌在特定环境下,随时间变化繁殖情况,得如下实验数据,计算得回归直线方程为.由以上信息,得到下表中的值为( )0.850.25y x =-c 天数(天)x 34567繁殖个数(千个)y 2.5344.5cA .5B .6C .7D .8【答案】B【分析】根据已知数据求得,根据点(在回归直线上,求得,进而根据表格中数据,利用x ,x y y 平均数的定义求得的值c 【详解】, ,3456755x ++++==0.850.250.8550.254y x =-=⨯-=()2.534 4.54520,6,c c ∴++++=⨯=∴=故选B.【点睛】本题考查线性回归方程的性质:点(在回归直线上,涉及平均数的计算,属基础题.)x y 2.关于相关关系,下列说法不正确的是( )A .相关关系是一种非确定关系B .相关关系越大,两个变量的相关性越强r C .当两个变量相关且相关系数时,表明两个变量正相关0r >D .相关系数的绝对值越接近1,表明两个变量的相关性越强r 【答案】B【分析】根据相关系数的定义与性质,对选项中的命题逐一判断正误即可得结果.【详解】对于A ,相关关系不同于函数关系,它是一种非确定的关系,A 正确;对于B ,只有两个变量为正相关时,相关关系越大,两个变量的相关性越强,B 错误;r 对于C ,当两个变量相关且相关系数时,说明两个变量正相关,C 正确;0r >对于D ,相关系数的绝对值越接近1,表明两个变量的相关性越强,D 正确,r 故选:B.3.为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取x y 10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为y x ,已知,,,该班某学生的脚长为25,据此估计其身高为 ˆˆˆy bx a =+101220i i a ==∑1011610i i y ==∑ˆ4b =()A .165B .168C .173D .178【答案】C【解析】由已知求得,的值,结合求得,可得线性回归方程,取求得值即可.x y ˆ4b =ˆa25x =y 【详解】解:,,10112202210i i x x ====∑1011161016110i i y y ====∑又,,ˆˆˆy bx a =+ˆ4b =.∴ˆˆ16142273a y bx =-=-⨯=关于的线性回归方程为.y ∴x ˆ473yx =+取,得(厘米).25x =42573173y =⨯+=故选:.C 【点睛】本题考查线性回归方程的求法,考查计算能力,属于基础题.4.祖冲之是中国古代数学家、天文学家,他将圆周率推算到小数点后第七位.利用随机模拟的方法也可以估计圆周率的值,如图程序框图中rand 表示产生区间上的随机数,则由此可估计的[]0,1π近似值为( )A .B .C .D .0.001n 0.002n 0.003n 0.004n【答案】D 【解析】在上产生1000对随机数得到点,当时将点的个数累加得到输出[]0,1,x y (,)x y 221x y +≤值,即可类比为在一个边长为1的正方形中随机产生点,点在以正方形的两边为半径的扇形内的n 概率等于扇形面积与正方形面积之比即可求的近似值;π【详解】由程序框图可知,落在正方形内的1000个点,其中落在圆内有(如图),n所以,故,故选:D .41000nπ≈0.004n π≈【点睛】本题考查了程序流程图、概率,由程序流程图理解应用随机数的几何含义,结合概率与几何图形的面积关系求的近似值;π5.如图是为了求出满足的最小偶数,那么在和两个空白框中,可以分321000->n nn 别填入A .和B .和1000>A 1=+n n 1000>A 2=+n nC .和D .和1000≤A 1=+n n 1000≤A 2=+n n 【答案】D【详解】由题意,因为,且框图中在“否”时输出,所以判定框内不能输入321000->n n,故填,又要求为偶数且初始值为0,所以矩形框内填,故选1000>A 1000≤A n 2=+n n D.点睛:解决此类问题的关键是读懂程序框图,明确顺序结构、条件结构、循环结构的真正含义.本题巧妙地设置了两个空格需要填写,所以需要抓住循环的重点,偶数该如何增量,判断框内如何进行判断可以根据选项排除.6.用反证法证明命题“三角形三个内角至少有一个不大于”时,应假设( )60︒A .三个内角都不大于60︒B .三个内角都大于60︒C .三个内角至多有一个大于60︒D .三个内角至多有两个大于60︒【答案】B【分析】根据反证法的知识确定正确选项.【详解】反证法证明命题“三角形三个内角至少有一个不大于”时,应假设“三角形三个内角都大60︒于.”60︒7.如图,第n 个图形是由正n +2边形“扩展”而来,(n =1、2、3、…),则在第n 个图形中共有( )个顶点.A .(n +2)(n +3)B .(n +1)(n +2)C .D .n2n【答案】A【分析】根据图形总结规律:第n 个图形对应的是以正n +2边形的每个边再作正n +2边形.【详解】第n 个图形对应的是以正n +2边形的每个边再作正n +2边形∴第n 个图形中共有顶点个数为:()()()()()22223n n n n n ++++=++故选:A .8.小明早上步行从家到学校要经过有红绿灯的两个路口,根据经验,在第一个路口遇到红灯的概率为0.4,在第二个路口遇到红灯的概率为0.5,在两个路口连续遇到红灯的概率是0.2.某天早上小明在第一个路口遇到了红灯,则他在第二个路口也遇到红灯的概率是A .0.2B .0.3C .0.4D .0.5【答案】D【解析】根据条件概率,即可求得在第一个路口遇到红灯,在第二个路口也遇到红灯的概率.【详解】记“小明在第一个路口遇到红灯”为事件,“小明在第二个路口遇到红灯”为事件A B “小明在第一个路口遇到了红灯,在第二个路口也遇到红灯”为事件C 则,,()0.4P A =()0.5P B =()0.2P AB =()0.2(|)0.5()0.4P AB P B A P A ===故选D.【点睛】本题考查了条件概率的简单应用,属于基础题.9.甲罐中有5个红球,2个白球和3个黑球,乙罐中有4个红球,3个白球和3个黑球.先从甲罐中随机取出一球放入乙罐,分别以,和表示由甲罐取出的球是红球,白球和黑球的事件;1A 2A 3A 再从乙罐中随机取出一球,以B 表示由乙罐取出的球是红球的事件.则下列结论中正确的是①;②;③事件B 与事件相互独立;④,,是两两互斥的事件.()25P B =()1511P B A =1A 1A 2A 3A A .②④B .①③C .②③D .①④【解析】根据条件概率的计算,结合题意,即可容易判断.【详解】由题意,,是两两互斥的事件,1A 2A 3A ,,;()151102P A ==()221105P A ==()3310P A =,由此知,②正确;()11552111112P B A ⨯==,;()2411P B A =()3411P B A =而()()()()123P B P A B P A B P A B =++()()()()()()112233P A P B A P A P B A P A P B A =++.1514349211511101122=⨯+⨯+⨯=由此知①③不正确;,,是两两互斥的事件,由此知④正确;1A2A 3A 对照四个命题知②④正确;故选:A.【点睛】本题考查互斥事件的判断,以及条件概率的求解,属基础题.10.曲线的中心在231sin 4πρθ⎛⎫+=+⎪⎝⎭A .第一象限B .第二象限C .第三象限D.第四象限【答案】D【解析】先将曲线极坐标方程化为直角坐标方程,再将其化为标准形式,找到圆心,即可得出答案.【详解】,即,231sin 4πρθ⎛⎫+=+⎪⎝⎭212sin 2cos ρρθρθ+=-+将代入上式,得,cos sin x y ρθρθ=⎧⎨=⎩22122x y y x ++=-+因此曲线的标准方程为:,22(1)(+1)1x y -+=故其中心为,在第四象限,(1,1)-故选:D.【点睛】本题主要考查极坐标方程化为直角坐标方程,结合了圆的相关知识,属于基础题.11.已知中,,角,,的对边分别为,,,其内切圆半径为,由Rt ABC 90A ∠=A B C a b c r ,又,可得.类比上述方法可得:三楼锥12ABC S bc =△111222ABC S ar br cr =++△bcr a b c =++中,若,平面,设的面积为,的面积为,-P ABC 90BAC ∠= PA ⊥ABC ABC 1S PAB2S 的面积为,的面积为,则该三棱锥内切球的半径是( )PAC △3S PBC 4S A BCD【答案】B【分析】设,,,则,PA a =AB b =AC c =1136P ABC ABC V S PA abc -=⋅⋅=△12abc =,化简得到答案.123412abc R S S S S =+++【详解】设,,,则,PA a =AB b =AC c =1136P ABC ABC V S PA abc-=⋅⋅=△又,∴.123411113333p ABC V S R S R S R S R-=+++12341234132P ABCabc V R S S S S S S S S -==++++++又∵,,.∴.∴,112=S bc 212S ab =312S ac =22212318S S S a b c=12abc =∴R =故选:B.【点睛】本题考查了类比推理,意在考查学生的计算能力和推理能力.二、填空题12.已知复数,则___________52i i 1i z =++||z =【分析】根据复数的基本运算法则进行化简即可.【详解】由题知,,()()()52i 1i i 12i i 2ii 1i 11i z -=+=+-++=+所以||z ==13.已知点A 是曲线上任意一点,则点A 到直线的距离的最小值是2sin ρθ=πsin(43ρθ+=_______.【答案】##52 2.5【分析】求得曲线、直线的直角坐标方程,利用点到直线距离公式,结合2sin ρθ=πsin(43ρθ+=圆的几何性质求得正确答案.【详解】曲线,化为直角坐标方程为,2sin ρθ=22sin ρρθ=222x y y +=,圆心为,半径为,22+(1)1x y -=()0,11直线,,πsin(43ρθ+=1sin 42ρθθ⎛⎫= ⎪ ⎪⎝⎭80y +-=圆心到直线的距离为,()0,172d ==则圆上的点到直线的最小距离为,75122-=即点A 到直线的最小距离为.πsin(43ρθ+=52故答案为:5214.若函数在上单调递增,则实数的取值范围是______.()x af x e x =+[]1,2a 【答案】(],e -∞【分析】求出导函数,利用,用分离参数法即可求出a 的范围.()0f x '≥【详解】因为,所以,()x f x e ax =+2()x a f x e x '=-又函数在上单调递增,()x af x e x =+[]1,2所以在恒成立,2()0x af x e x '=-≥[]1,2x ∈分离参数可得在恒成立,2x a x e ≤[]1,2x ∈令,,()2xg x x e =()()2220x x x g x xe x e xe x '=+=+>所以在上单调递增,()2xg x x e =[]1,2x ∈所以,所以,()()1g x g e≥=a e ≤故答案为:.(],e -∞15.假设有两箱零件,第一箱内装有10件,其中有2件次品;第二箱内装有20件,其中有3件次品.现从两箱中随意挑选一箱,然后从该箱中随机取1个零件,则取出的零件是次品的概率是___________.【答案】740【分析】设表示从第箱取到的零件是次品,表示从第一箱中取零件,表示从第二箱中取零i A i B B 件,结合全概率公式,即可求解.【详解】设(,2)表示从第箱取到的零件是次品,表示从第一箱中取零件,表示从第i A 1i =i B B 二箱中取零件,由全概率计算公式得取出的零件是次品的概率是:.()()()()()12P A P A B P B P A B P B =+2131710220240=⨯+⨯=故答案为:.740三、解答题16.设,i 为虚数单位,复数在复平面对应的点为,已知为实数.()i ,z x y x y R =+∈z (),Z x y 2i z z +-(1)求的轨迹方程;(),Z xy (2)求的取值范围.1z -【答案】(1),点除外;(2).220x y -+=()0,1⎫+∞⎪⎪⎭【分析】(1)由,根据为实数得到关于,的方程,即可得到的轨迹方程;i z x y =+2i z z +-x y (,)Z x y (2)求出,利用二次函数的性质求出范围即可.|1|z -【详解】解:(1)()()()()2i 1i 22i i i i 1i 1i x y x y z x y z x y x y x y ++--⎡⎤+++⎣⎦==-+-+---⎡⎤⎡⎤⎣⎦⎣⎦()()()()()222121i1x x y y xy x y x y ++-+-+-⎡⎤⎣⎦=+-因为为实数,所以2i z z +-()()210xy x y -+-=所以的轨迹方程为,点除外(),Z x y 220x y -+=()0,1(2==≥所以的取值范围1z -⎫+∞⎪⎪⎭17.我校筹办高中生排球比赛,设计两种赛事方案:方案一和方案二、为了了解参赛学生对活动方案是否支持,对全体参赛学生进行简单随机抽样,抽取了名参赛学生,获得数据如表:100方案一方案二支持不支持支持不支持男生人20人40人40人20女生人30人10人20人20假设所有参赛学生对活动方案是否支持相互独立.(1)根据所给数据,判断是否有的把握认为方案一的支持率与参赛学生的性别有关?99.5%(2)在抽出的名参赛学生中,按是否支持方案二分层抽样抽出了人,从这人中随机抽取10055人,求抽取的人中“恰有人支持,人不支持”的概率.2211附:,.()()()()()22n ad bc K a b c d a c b d -=++++n a b c d =+++()20P K k ≥0.1000.0500.0100.0050.0010k 2.706 3.841 6.6357.87910.828【答案】(1)有的把握认为方案一的支持率与参赛学生的性别有关;(2).99.5%35【分析】(1)计算的观测值,结合临界值表可得出结论;2K(2)分析可知所抽取的人中,支持方案二有人,分别记为、、,不支持方案二有人,53A B C 2分别记为、,列举出所有的基本事件,并确定事件“所抽取的人中“恰有人支持,人不支持””a b 211所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率.【详解】(1),()22100201030405016.6677.879505040603K ⨯⨯-⨯==≈>⨯⨯⨯所以,有的把握认为方案一的支持率与参赛学生的性别有关;99.5%(2)由表中数据可得,抽取人中,支持方案二的有人,不支持方案二的有人,1006040所以采用分层抽样抽出的人中,支持方案二有人,不支持方案二有人,56053100⨯=4052100⨯=支持方案二的人记为、、,不支持方案二的人记为、,3A B C 2a b 从这人中随机抽取人,所有可能情况有:52、、、、、、、、、共种,(),A B (),A C (),A a (),A b (),B C (),B a (),B b (),C a (),C b (),a b 10其中抽取的人中“恰有人支持,人不支持”的有种,2116所以所求的概率.63105P ==18.下图是我国2011年至2017年生活垃圾无害化处理量(单位∶亿吨)的折线图.由折线图看出,可用线性回归模型拟合与的关系,请建立关于的回归方程(系数精确到)y t y t 0.01,并预测2022年我国生活垃圾无害化处理量.参考数据:.77119.32,40.17i i i i i y t y ====∑∑参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:ˆˆˆy a bt =+()()()1122211ˆˆˆn ni i i ii i n n ii i i t t y y t y nt y b ay bt t t t nt ====---⋅==⋅=---∑∑∑∑【答案】,预测2022年我国生活垃圾无害化处理量约为亿吨.0.1002ˆ.9yt =+ 2.12【分析】由折线图中数据和参考数据及公式求得,,进而得关于的回归方程,将2022年对b a y t 应的代入回归方程可以预测2022年我国生活垃圾无害化处理量.12t =【详解】由折线图中数据和参考数据得,,12747t +++== 9.327y =所以,.7172219.32740.1774 2.8970.103140716287i i i i i t y t y bt t ==-⋅-⨯⨯===≈-⨯-∑∑ 9.32 2.89 6.4340.927287a y b t =-⋅=-⨯=≈ 所以,关于的回归方程为:.y t 0.100.92y t =+将2022年对应的代入回归方程得,12t =0.10120.92 2.12y =⨯+=所以预测2022年我国生活垃圾无害化处理量约为亿吨.2.1219.某公司为研究某种图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.x y u821()i i x x =-∑81()()i i i x x y y =-⋅-∑821()i i u u =-∑81()()i i i u u y y =-⋅-∑15.25 3.630.2692085.5230.3-0.7877.049表中,1i i u x =8118i i u u ==∑(1)根据散点图判断:与哪一个模型更适合作为该图书每册的成本费y 与印刷y a bx =+dy c x =+数量x 的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程(结果精确到0.01);(3)若该图书每册的定价为9.22元,则至少应该印刷多少册才能使销售利润不低于80000元?(假设能够全部售出,结果精确到1)附:对于一组数据,其回归直线的斜率和截距的最小二乘估计1122(,),(,,,),()n n v v v ωωω⋯ v αβω=+ 分别为,.121()()()n i i i n i i v v ωωβωω==--=-∑∑ˆˆv αβω=-【答案】(1)更适合;(2);(3)至少印刷11120册才能使销售利润不d y c x =+ 8.961.22y x =+低于80000元.【分析】(1)由散点图可知成反比例函数模型,故更适合;d y c x =+(2) 令,根据表中的数据计算即可得y 关于u 的线性回归方程为,进而得y 关于1u x = 1.228.96y u =+x 的回归方程为; 8.961.22y x =+(3)根据题意只需解不等式即可得答案.8.969.22 1.2280x x x ⎛⎫-+≥ ⎪⎝⎭【详解】(1)由散点图判断,更适合作为该图书每册的成本费y (单位:元)与印刷数量d y c x =+(单位:千册)的回归方程.x (2)令,先建立y 关于u 的线性回归方程,1u x =由于,81821()()7.0498.9578.960.787()i i i ii u u y y du u ==-⋅-==≈≈-∑∑所以, 3.638.9570.269 1.22c y d u =-⋅=-⨯≈ 所以y 关于u 的线性回归方程为,1.228.96y u =+所以y 关于x 的回归方程为8.961.22y x =+(3)假设印刷千册,依题意得,x 8.969.22 1.2280x x x ⎛⎫-+≥ ⎪⎝⎭解得,11.12x ≥所以至少印刷11120册才能使销售利润不低于80000元.【点睛】本题考查非线性回归方程及其应用,考查将非线性回归问题转化为线性回归问题求解,考查运算能力,数据分析处理能力,属于中档题.其中在解题的过程中,要注重回归方程的公式的正确计算,注意所给数据的正确应用.20.在5道试题中有3道代数题和2道几何题,每次从中随机抽出1道题,抽出的题不再放回.求:(1)第1次抽到代数题且第2次抽到几何题的概率;(2)在第1次抽到代数题的条件下,第2次抽到几何题的概率.【答案】(1);(2).31012【分析】(1)设事件表示“第1次抽到代数题”,事件表示“第2次抽到几何题”,然后利用古典A B 概型公式代入求解出与;(2)由(1)的条件,代入条件概率公式即可求解.()P A ()P AB 【详解】解:(1)设事件表示“第1次抽到代数题”,事件表示“第2次抽到几何题”,A B 则,所以第1次抽到代数题且第2次抽到几何题的概率为.()131535C P A C ==()11321154310C C P AB C C ==(2)由(1)可得,在第1次抽到代数题的条件下,第2次抽到几何题的概率为.()()()3110325P AB P B A P A ===21.在数列中,, ,且,,成等比数列.{}n a 11a =()101n n n a a c ca +=>+1a 2a 5a (1)证明数列是等差数列,并求的通项公式;1n a ⎧⎫⎨⎬⎩⎭{}n a (2)设数列满足,其前n 项和为,证明:.{}n b ()2141n n n b n a a +=+n S 1nS n <+【答案】(1)证明见解析,121n a n =-(2)证明见解析【分析】(1)由两边取倒数,化简即可得出,根据已知与等差数列的定义11n n n a a ca +=+111n n c a a +-=证明数列是等差数列,即可求出通项公式,结合,,成等比数列,转化求解即可;1n a ⎧⎫⎨⎬⎩⎭1a 2a 5a (2)根据已知结合小问1化简通项,即可利用裂项相消法,求解数列之和,即可根据函数值{}n b 域证明结论.【详解】(1),11n n n a a ca +=+ ,1111n n n n ca c a a a ++∴==+,111n n c a a +∴-=,11a = ,111a ∴=数列是首项为1,公差为的等差数列,∴1n a ⎧⎫⎨⎬⎩⎭c ,即,()111n n c a ∴=+-()111n a n c =+-,,成等比数列,1a 2a 5a ,2215a a a ∴=,解得或(舍),2111114c c ⎛⎫∴=⨯ ⎪++⎝⎭2c =0故;121n a n =-(2)由小问1可得,,121n a n =-1121n a n +=+,()()2221211414141212141n n n n b n a a n n n n ++∴=+=+⨯⨯=-+-,2224122111141412121n n n n n -+==+=+----+,12n n S b b b ∴=+++ ,1111111113352121n n =+-++-+++--+ ,1121n n =+-+,1021n >+ .1n S n ∴<+。

苏教版数学高二数学 1.2《回归分析》基础训练(苏教版选修1-2)

苏教版数学高二数学 1.2《回归分析》基础训练(苏教版选修1-2)

1.下列变量之间是线性相关关系的是________. ①人的身高与视力;②角的大小与所对的圆弧长; ③收入水平与纳税水平;④某地人的出生率与树林覆盖率.解析:②为确定性关系,①④不具有线性相关关系. 答案:③2.散点图在回归分析过程中的作用是________. ①查找个体个数;②比较个体数据大小关系; ③探究个体分类;④粗略判断变量是否线性相关.解析:散点图在回归分析中,能粗略判断变量间的相关关系. 答案:④3.已知x ,y 之间的一组数据:x 1.081.121.191.28y2.25 2.37 2.40 2.55 y 与x 之间的线性回归方程y =a +b x 必过定点________.解析:由已知可知线性回归方程一定过定点(x ,y ),因此求出x =1.1675,y =2.3925,故填(1.1675,2.3925).答案:(1.1675,2.3925)4.设有一个回归方程为y ^=2-2.5x ,则变量x 增加一个单位时,y 平均________个单位.解析:线性回归方程y ^=a ^+b ^x 中a ^,b ^的意义是:以a ^为基数,x 每增加1个单位,y 相应地平均增加b ^个单位.答案:减少2.5一、填空题1.下列说法:①回归方程适用于一切样本和总体;②样本取值的范围会影响回归方程的适用范围;③回归方程得到的预报值,是预报变量的精确值.其中正确的是________.解析:回归方程反映的是两个线性相关变量间的相关关系,它能预测变量的值,但不是精确值.答案:②2.关于相关系数r 的临界值r 0.05的说法:①临界值r 0.05是一个定值;②若|r |≤r 0.05,则否定假设H 0,表明有95%的把握认为x ,y 具有较强的线性相关关系;③若|r |>r 0.05,则没有理由拒绝假设H 0,即没有充分的理由认为y 与x 之间有线性相关关系;④临界值r 0.05不是一个定值,它的值可由检验水平0.05及n -2在附表中查到.其中正确的序号为________.解析:②中应改为“|r |>r 0.05”;③中应改为“|r |≤r 0.05”才正确;①、④矛盾,其中④中的表述正确.答案:④3.如图所示,有5组(x ,y )数据,去掉一组数据后,要使剩下的4组数据的相关系数最大,应去掉________点.解析:由散点图可知,D 点偏离最远,所以去掉D 点后,剩下4组数据的相关系数最大.答案:D4.若某地财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过________亿.解析:代入数据得y =10+e ,因为|e |≤0.5,所以|y |≤10.5,故不会超过10.5亿. 答案:10.55.(2011年高考广东卷)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:时间x 12345命中率0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李每月6号打篮球6小时的投篮命中率为________.解析:小李这5天的平均投篮命中率 y =0.4+0.5+0.6+0.6+0.45=0.5.可求得小李这5天的平均打篮球时间x =3.根据表中数据可求得b ^=0.01,a ^=0.47,故回归直线方程为y ^=0.47+0.01x ,将x =6代入得6号打6小时篮球的命中率约为0.53. 答案:0.5 0.536.已知回归直线的斜率的估计值为 1.23.样本点的中心为(4,5),则回归直线方程是________.解析:由斜率的估计值为 1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.答案:y ^=1.23x +0.087.(2011年高考山东卷改编)某产品的广告费用x 与销售额y 的统计数据如下表广告费用x (万元)4235销售额y (万元) 49 26 39 54 根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为________.解析:∵x =4+2+3+44=72,y =49+26+39+544=42,又y ^=b ^x +a ^必过(x ,y ),∴42=72×9.4+a ^,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元). 答案:65.5万元8.观测两相关变量得如下数据:x-1-2-3-4-553421 y -9 -7 -5 -3 -1 1 5 3 79根据表中数据可得y 与x 之间的线性回归方程是________.(填序号)①y ^=12x -1;②y ^=x ;③y ^=2x +13;④y ^=x +1.解析:由表中数据可求得x =0,y =0,所以填②. 答案:②9.(2011年高考陕西卷改编)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是________.①x 和y 的相关系数为直线l 的斜率; ②x 和y 的相关系数在0到1之间;③当n 为偶数时,分布在l 两侧的样本点的个数一定相同;④直线l 过点(x ,y ).解析:因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近于1,两个变量的线性相关程度越强,所以①②错误.当n 为偶数时,分布在l 两侧的样本点的个数不一定相同,所以③错误.因为回归直线一定过样本点的中心,所以④正确.答案:④ 二、解答题10.某矿山采煤的单位成本y 与采煤量x 有关,其数据如下: 采煤量/千克 289298316322327329 329 331 350 单位成本/元43.5 42.9 42.1 39.6 39.138.5383837(1)作出散点图;(2)求出y 对x 的回归直线方程(结果保留3位小数). 解:(1)作出散点图,如图所示.(2)由图表可得x ≈321.222,y ≈39.856,∑i =19x 2i =931337,∑i =19x i y i =114892.7.所以b ^=∑i =19x i y i -9x y∑i =19x 2i -9(x )2≈-0.123,a ^=y -b ^x ≈79.366.故y 对x 的回归直线方程为y ^=-0.123x +79.366.11.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转速度的变化而变化,下表为抽转速x (转/秒)1614128每小时生产有缺点的零件数y (件)11 9 8 5(1)利用散点图或相关系数r 的大小判断变量y 对x 是否线性相关?为什么? (2)如果y 对x 有线性相关关系,求线性回归方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?(最后结果精确到0.001,参考数据:656.25≈25.617,16×11+14×9+12×8+8×5=438,162+142+122+82=660,112+92+82+52=291)解:(1)x =12.5,y =8.25,∑4i =1(x i -x )(y i -y )=25.5, ∑4i =1(x i -x)2∑4i =1(y i -y )2=656.25≈25.617,∴r 0.05≈0.995,由检验水平0.05及n -2=2,在附录1中查得r 0.05=0.950, 因为0.995>0.950,∴y 与x 具有线性相关关系.(2)∑4i =1(x i -x )2=35, ∴b ^≈0.729,a ^=y -b ^x ≈-0.863. ∴线性回归方程为y ^=0.729x -0.863. (3)0.729x -0.863≤10,解得x ≤14.901, 故机器运转速度应在每秒14转之内.12.下表为某百货公司1~6月份销售量与利润之间的数量关系:月份1月2月3月4月5月6月现从具有线性相关关系这六组数据中选取4组数据求线性回归方程,再用剩下的2组数据进行检验.(1)根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的线性回归方程是理想的,试问所得线性回归方程是否理想?解:(1)由表中数据求得x =11,y =24,∑5i =2x i y i =11×25+13×29+12×26+8×16=1092,∑5i =2x 2i =112+132+122+82=498,∴b ^=∑5i =2x i y i -4x -y -∑5i =2x 2i -4x 2=1092-4×11×24498-4×112=3614=187, a ^=y -b ^x =24-187×11=-307.所以y 关于x 的线性回归方程为y ^=187x -307.(2)当x =10时,y =187×10-307=1507,此时|1507-22|<2;当x =6时,y =187×6-307=787,此时|787-12|<2.所以所得的线性回归方程是理想的.。

高二数学秋季讲义之线性回归方程(学生版)

高二数学秋季讲义之线性回归方程(学生版)

学科培优 数学“线性回归方程”学生姓名 授课日期 教师姓名授课时长线性回归方程在全国卷中有所考察,往往以解答题形式出现,考察难度中等,主要掌握以下内容即可:①会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.知识梳理1:相关关系和函数关系在实际问题中,变量之间的常见关系有两类:一类是确定性函数关系,变量之间的关系可以用函数表示。

例如正方形的面积S 与其边长之间的函数关系(确定关系);一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达。

例如一块农田的水稻产量与施肥量的关系(非确定关系) 相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。

相关关系与函数关系的异同点:相同点:均是指两个变量的关系。

不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。

知识梳理2:求回归直线方程的思想方法观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条?引导学生分析,最能代表变量x 与y 之间关系的直线的特征:即n 个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为,其中a 、b 是待定系数。

则,于是得到各个偏差。

x 2x S =ˆybx a =+ˆ(1,2,,)i i ybx a i n =+=⋅⋅⋅⋅显见,偏差的符号有正负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和表示n 个点与相应直线在整体上的接近程度。

记。

上述式子展开后,是一个关于a ,b 的二次多项式,应用配方法,可求出使Q 为最小值时的a ,b 的值,即其中【试题来源】【题目】下列各组变量哪个是函数关系,哪个是相关关系? (1)电压U 与电流I (2)圆面积S 与半径R(3)自由落体运动中位移s 与时间t (4)粮食产量与施肥量 (5)人的身高与体重(6)广告费支出与商品销售额【试题来源】【题目】下列有关样本相关系数的说法不正确的是( )A .相关系数用来衡量变量x 与y 之间的线性相关程度B .|r |≤1,且|r |越接近于1,相关程度越大C .|r |≤1,且|r |越接近0,相关程度越小D .|r |≥1,且|r |越接近1,相关程度越小【试题来源】【题目】由一组样本(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=a +ˆˆ(),(1,2,...)i i i yy y bx a i n -=-+=ˆˆi yy -2221122()()....()n n Q y bx x y bx a y bx a =--+--++--21()ni i i Q y bx a ==--∑⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x n x y x n y x b n1i 22i n1i i i 1111,n ni i i i x x y y n n ====∑∑bx ,下面有四种关于回归直线方程的论述: (1)直线y ^=a +bx至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;(2)直线y ^=a +bx 的斜率是∑ni =1x i y i -n x y ∑n i =1x 2i -nx2;(3)直线y ^=a +bx 必过(x ,y )点;(4)直线y ^=a +bx 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑ni =1 (y i -a -bx i )2是该坐标平面上所有的直线与这些点的偏差中最小的直线.其中正确的论述有( ) 【选项】A .0个B .1个C .2个D .3个【试题来源】2015全国卷1【题目】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.46.6 56.3 6.8 289.8表中i w =,w =1881i i w =∑(Ⅰ)根据散点图判断,y=a+bx 与y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,……,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为:【试题来源】【题目】已知10只狗的血球体积及红血球的测量值如下:x(血球体积,mm),y(血红球数,百万)(1)画出上表的散点图;(2)求出回归直线并且画出图形。

回归分析练习题及参考答案

回归分析练习题及参考答案

1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元北京辽宁上海江西河南贵州陕西 224601122634547485154442662454973264490115462396220816082035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(0.05α=)。

(6)如果某地区的人均GDP为5000元,预测其人均消费水平。

(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

解:(1)可能存在线性关系。

(2)相关系数:(3)回归方程:734.6930.309y x=+回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

系数(a)模型非标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1 .998a.996 .996 247.303a. 预测变量: (常量), 人均GDP。

人均GDP对人均消费的影响达到99.6%。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

线性回归方程

线性回归方程

线性回归方程一、解答题1.为了适应高考改革,某中学推行“创新课堂”教学.高一平行甲班采用“传统教学”的教学方式授课,高一平行乙班采用“创新课堂”的教学方式授课,为了比较教学效果,期中考试后,分别从两个班中各随机抽取20名学生的成绩进行以上的把握认为“成绩优秀与教学方式有关”?2.现从上述样本“成绩不优秀”的学生中,抽取3?人进行考核,记“成绩不优秀”的乙班人数为X,求X的分布列和期望.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.100?名学生进行调查.下面是根据调查结果绘制的学生日均使用手机时间的频数分布表和频率分布直方图,将使用手机时间不低于80分钟的学生称为“手机迷”。

:附:随机变量22()()()()()n ad bcKa b c d a c b d-=++++(其中n a b c d=+++为样本总量).参考数据2()P K k≥0.150 0.100 0.050 0.025k 2.072 2.706 3.841 5.024.2.在高二的抽查中,已知随机抽到的女生共有55名,其中10名为“手机迷”.根据已知条件完成下面的22⨯列联表,并?非手机迷手机迷合计男女合计3.某中学为了解中学生的课外阅读时间,决定在该中学的1200名男生和800名女生中按分层抽样的方法抽取20?名学生,对他们的课外阅读时间进行问卷调查。

现在按课外阅读时间的情况将学生分成三类:A类(不参加课外阅读),B 类(参加课外阅读,但平均每周参加课外阅读的时间不超过3?小时),C类(参加课外阅读,且平均每周参加课外阅读的A类B类C类男生x 5 3女生y 3 390%的把握认为“参加课外阅读与否”与性别有关;男生女生总计不参加课外阅读参加课外阅读总计,记X为抽取的这3?名女生中A类人数和C类人数差的绝对值,求X的数学期望。

附:2 2()n ad bc k-=2()P k k≥0.10 0.05 0.01k 2.706 3.841 6.635模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1500名学生(其中男生900人,女生600 人)中,采用分层抽样的方法从中抽取n 名学生进行调查. 1.已知抽取的n 名学生中含女生20人,求n 的值及抽取到的男生人数;2.学校计划在高一上学期开设选修中的“物理”和“地理”两个科目,为了了解学生对这两个科目的选课情况,对在1的条件下抽取到的n 名学生进行问卷调查(假定每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查结果得到的22⨯列联表. 请将列联表补充完整,并判断是否有99%的把握认为选择科目与性别有关?说名,再从这5名学生中抽取2人了解学生对“地理”的选课意向情况,求2人中至少有1名男生的概率. 附:参考公式及数据()()()()()22n ad bc k a b c d a c b d -=++++2男性且休闲方式都是读书的概率是多少? .()()()()()2n ad bc k a b c d a c b d -=++++,其中n a b c d =+++.6.某市春节期间7家超市的广告费支出 x (万元)和销售额y (万元)数据如下:;2.用对数回归模型拟合y 与x 的关系,可得回归方程: 12l 22ˆn yx =+,经计算得出线性回归模型和对数模型的2R 分别约为0.75和0.97,请用说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额.参数数据及公式: 772118,42,2794,708,i i i i i x y x y x ======∑∑1221,,l ˆˆˆn 20.7ni ii nii x y n xybay bx xnx ==--==-≈-∑∑ 7.一只药用昆虫的产卵数y 与一定范围内的温度x 有关, 现收集了该种药用昆虫的6组观测数据如下表:经计算得: 1266i i x x ===∑,1336i i y y ===∑,1()()557i i i x x y y =--=∑,621()84i i x x =-=∑,621()3930i i y y =-=∑线性回归模型的残差平方和621()236.64iii y y =-=∑,8.06053167e ≈,其中,i i x y 分别为观测数据中的温度和产卵数, 1,2,3,4,5,6i =1.若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+ (精确到0.1); 2.若用非线性回归模型求得y 关于x 的回归方程为0.23030.06ˆxye =,且相关指数20.9522.R =①试与1中的回归模型相比,用2R 说明哪种模型的拟合效果更好.②用拟合效果好的模型预测温度为35C 时该种药用昆虫的产卵数(结果取整数). 附:一组数据()()()1122,,?,,?...,,,?n n x y x y x y 其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计为121()()()ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-;相关指数22121()1()niii nii y y R y y ==-=--∑∑.8.《中华人民共和国道路交通安全法》第47条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,《中华人民共和国道路交通安全法》第90?条规定:对不礼让行人的驾驶员处以扣3?分,罚款50元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为统计1.请利用所给数据求违章人数y 与月份之间的回归直线方程ˆˆˆybx a =+ 2.预测该路口7?月份的不“礼让斑马线”违章驾驶员人数3.交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如?参考公式: 1122211()()ˆˆˆ,()nni iiii i nni ii i x y nx y x x y y bay bx x nxx x ====---===---∑∑∑∑, 22()()()()()n ad bc K a b c d a c b d -=++++ (其中n a b c d =+++)2()P K k ≥ 0.150 0.100 0.050 0.025 0.010 0.005 0.001 k2.072 2.7063.841 5.024 6.635 7.879 10.8289.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位: t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,,8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.表中i i w x =18i i w w ==∑.1.根据散点图判断, y a bx =+与y c x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)2.根据1的判断结果及表中数据,建立y 关于x 的回归方程.3.已知这种产品的年利润z 与x ,y 的关系为0.2z y x =-.根据2的结果回答下列问题: ①年宣传费49x =时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()11,u v ,()22,u v ,…, (),n n u v 其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 10.如今,中国的“双十一”已经从一个节日变成了全民狂欢的“电商购物日”.某淘宝电商分析近8年“双十一”期间的宣传费用x (单位:万元)和利润y (单位:十万元)之间的关系,得到下列数据:x 2 3 4 5 6 8 9 11y 1 2 3 3 4 5 681.请用相关系数r 说明y 与 x 之间是否存在线性相关关系(当0.81r >时,说明y 与 x 之间具有线性相关关系);2.根据1的判断结果,建立y 与 x 之间的回归方程,并预测当24x =时,对应的利润ˆy为多少(ˆˆˆ,,b a y 精确到0.1). 附参考公式:回归方程中ˆˆˆybx a =+中ˆb 和ˆa 最小二乘估计分别为1221ˆni ii nii x ynx y b xnx ==-=-∑∑,ˆˆay bx =-, 相关系数()()12211ni i i nniii i x ynx yr xx yy ===-=--∑∑∑参考数据: ()()88882221111241,356,8.25,6i i iiii i i i x y x xx yy ======-≈-=∑∑∑∑.11.为了监控某种零件的一条生产线的生产过程,检验员每隔30min 从该生产线上随机抽取一个零件,并测量其尺寸(单位: cm ).下面是检验员在一天内依次抽取的16个零件的尺寸抽取次序 1 2345 6 7 8 零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次序 910111213141516零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得16119.9716i i x x ===∑,16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑, ()()()16162118.518.439,8.5 2.78i i i i x x i ==-≈--=-∑∑其中i x 为抽取的第i 个零件的尺寸, 1,2,16i =。

线性回归方程检测试题(附答案)

线性回归方程检测试题(附答案)

线性回归方程检测试题(附答案)高中苏教数学③2.4线性回归方程测试题一、选择题1.下列关系属于线性负相关的是()A.父母的身高与子女身高的关系B.身高与手长C.吸烟与健康的关系D.数学成绩与物理成绩的关系答案:C2.由一组数据得到的回归直线方程,那么下面说法不正确的是()A.直线必经过点B.直线至少经过点中的一个点C.直线a的斜率为D.直线和各点的总离差平方和是该坐标平面上所有直线与这些点的离差平方和中最小的直线答案:B3.实验测得四组的值为,则y与x之间的回归直线方程为()A.B.C.D.答案:A4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是,那么下列说法正确的是()A.直线和一定有公共点B.直线和相交,但交点不一定是C.必有直线D.和必定重合答案:A二、填空题5.有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系(2)曲线上的点与该点的坐标之间的关系(3)苹果的产量与气候之间的关系(4)森林中的同一种树木,其断面直径与高度之间的关系(5)学生与他(她)的学号之间的关系其中,具有相关关系的是.答案:(1)(3)(4)6.对具有相关关系的两个变量进行的方法叫做回归分析.用直角坐标系中的坐标分别表示具有的两个变量,将数据表中的各对数据在直角坐标系中描点得到的表示具有相关关系的两个变量的一组数据的图形,叫做.答案:统计分析;相关关系;散点图7.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数、方差分别为,则新数据的平均数是,方差是,标准差是.答案:;;8.已知回归直线方程为,则可估计x与y增长速度之比约为.答案:三、解答题9.某商店统计了近6个月某商品的进价x与售价y(单位:元)的对应数据如下:352891246391214求y对x的回归直线方程.解:,,,,,,回归直线方程为.10.已知10只狗的血球体积及红血球的测量值如下:45424648426.536.309.257.5806.9935584039505.909.496.206.557.72x(血球体积,ml),y(红血球数,百万)(1)画出上表的散点图;(2)求出y对x的回归直线方程并且画出图形.解:(1)见下图(2),,,设回归直线方程为,则,.图形如下:11.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:尿汞含量:246810消光系数64134205285360(1)画出散点图;(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)估计尿汞含量为9毫克/升时的消光系数.解:(1)(2)由散点图可知与线性相关,设回归直线方程为.列表:12345246810 64134205285360 128536123022803600,.回归直线方程为.(3)当时,.。

2020年高考数学一轮复习专题6.5相关系数及回归方程练习(含解析)

2020年高考数学一轮复习专题6.5相关系数及回归方程练习(含解析)

6.5 相关系数及回归方程两个变量间的相关关系:①有关概念:相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.如果一个变量的值由小变大时另一个变量的值由小变大,这种相关称为正相关;如果一个变量的值由小变大时另一个变量的值由大变小,这种相关称为负相关;如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系.②回归方程: 是两个具有线性相关关系的变量的一组数据的回归方程,其中是待定参数. 的计算公式.考向一 样本中心【例1-1】某种产品的广告费支出与销售额之间有如下对应数据(单位:百万元),根据下表求出关于的线性回归方程为,则表中的值为( )A. B. C. D.y bx a =+1122()()()n n x y x y x y ,,,,,,a b 、a b 、1122211()()()()nni i i ii i nni ii i x x y y x y nx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑x y y x 6.5175ˆ.yx =+a 505456.564【答案】B【解析】根据规律知道回归直线一定过样本中心,故得到,将坐标代入方程得到的值为.故答案为:B. 【例1-2】已知表中数据y 与x 有较好的线性关系,通过计算得到y 关于x 的线性回归方程为ˆˆ1.05yx a =+,则相应于下列各点的残差中绝对值最小的是( )A .(2,4)B .(4,6)C .(8,10)D .(10,12.5)【答案】D【解析】ˆˆˆ6,8.3,8.3 1.056,2, 1.052x y aa y x ==∴=⨯+∴=∴=+, 相应于点(2,4),(4,6),(8,10),(10,12.5)的残差分别为0.1,0.2,0.4,0---,故选D.【举一反三】1.“关注夕阳、爱老敬老”—某马拉松协会从2013年开始每年向敬老院捐赠物资和现金.下表记录了第x 年(2013年是第一年)与捐赠的现金y (万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程.ˆ035ymx =+,则预测2019年捐赠的现金大约是( ) A .5万元B .5.2万元C .5.25万元D .5.5万元【答案】C5,196x y a ==+6.5175ˆ.yx =+a 54【解析】由已知得,29t =, 所以样本点的中心点的坐标为(4.5,3.5),代入.ˆ035ymx =+, 得3.5 4.50.35m =+,即0.7m =,所以0.7035ˆ.x y=+, 取7x =,得ˆ0.770.35 5.25y=⨯+=, 预测2019年捐赠的现金大约是5.25万元.2.某同学将收集到的6组数据对,制作成如图所示的散点图(各点旁的数据为该点坐标),并由这6组数据计算得到回归直线l :y bx a =+$$$和相关系数r .现给出以下3个结论:①0r >;②直线l 恰过点D ;③1b >. 其中正确结论的序号是( )A .①②B .①③C .②③D .①②③【答案】A【解析】由图像可得,从左到右各点是上升排列的,变量具有正相关性,所以0r >,①正确; 由题中数据可得: 1.5 2.4 3.54 5.8 6.846x +++++==, 2.1 2.8 3.3 3.5 4.35 3.56y +++++==,所以回归直线过点(4,3.5)D ,②正确;又61621()()10.360.514120.14()iii ii x x yy b x x ==--==≈<-∑∑,③错误.故选A 3.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱【答案】A【解析】∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选:A.考向二回归方程【例2】某人经营淡水池塘养草鱼,根据过去40期的养殖档案,该池塘的养殖重量X (百斤)都在20百斤以上,其中不足40百斤的有8期,不低于40百斤且不超过60百斤的有20期,超过60百斤的有12期.根据统计,该池塘的草鱼重量的增加量y (百斤)与使用某种饵料的质量x (百斤)之间的关系如图所示.(1)根据数据可知y 与x 具有线性相关关系,请建立y 关于x 的回归方程ˆˆˆybx a =+;如果此人设想使用某种饵料10百斤时,草鱼重量的增加量须多于5百斤,请根据回归方程计算,确定此方案是否可行?并说明理由.(2)养鱼的池塘对水质含氧量与新鲜度要求较高,某商家为该养殖户提供收费服务,即提供不超过3台增氧冲水机,每期养殖使用的冲水机运行台数与鱼塘的鱼重量X 有如下关系:若某台增氧冲水机运行,则商家每期可获利5千元;若某台冲水机未运行,则商家每期亏损2千元.视频率为概率,商家欲使每期冲水机总利润的均值达到最大,应提供几台增氧冲水机? 附:对于一组数据()()()1122,,,,n n x y x y x y ,其回归方程ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为1221ˆni ii ni i x y nxy bx nx ==-=-∑∑()()()121,niii ni i x x y y x x ==--=-∑∑ˆˆay bx =- 【答案】(1)337y 1313x =+$当10x =时,此方案可行.(2)应提供2台增氧冲水机 【解析】(1)依题意,5,4,x y ==()()5126iii x x y x =--=∑()()()515213ˆ,13iii i i x x y y bx x ==--∴==-∑∑337ˆ451313a y bx =-=-⨯=$所以3371313y x =+$当10x =时,67ˆ513y=>,故此方案可行. (2)设盈利为Y ,安装1台时,盈利5000Y =, 安装2台时,12040,3000,5X Y p <<==;440,10000,5X Y p ==…. 14()300010000860055E Y ∴=⨯+⨯=安装3台时,12040,1000,5X Y p <<==; 4060,8000,X Y =剟3;5P =160,15000,5X Y P >==. 13()1000800055E Y ∴=⨯+⨯11500080005+⨯=.86008000>,故应提供2台增氧冲水机.【举一反三】1.李克强总理在2018年政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力.某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌.为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据(),(1,2,,6)i i x y i =,如表所示:已知611606i i y y ===∑.(1)若变量,x y 具有线性相关关系,求产品销量y (百件)关于试销单价x (千元)的线性回归方程ˆˆˆy bx a =+;(2)用(1)中所求的线性回归方程得到与i x 对应的产品销量的估计值i y .当销售数据(),i i x y 对应的残差的绝对值ˆ1i i y y -≤时,则将销售数据(),i i x y 称为一个“好数据”.现从6个销售数据中任取3个子,求“好数据”个数ξ的分布列和数学期望()E ξ.(参考公式:线性回归方程中ˆˆ,ba 的估计值分别为1221ˆˆˆ,)ni ii nii x y nxyb ay bx xnx =-=-==--∑∑. 【答案】(1) ˆ482yx =-+ (2)见解析 【解析】(1)由611606i i y y ===∑,可求得48t =,故11910ni ii x y==∑,=1980nx y ,21199ni i x ==∑,2=181.5nx ,代入可得122119101980704199181.517.5ni ii ni i x y nx yb x nx==---====---∑∑,ˆˆ604 5.582ay bx =-=+⨯=, 所以所求的线性回归方程为ˆ482yx =-+. (2)利用(1)中所求的线性回归方程ˆ482yx =-+可得,当13x =时,170y =;当24x = 时,266y =;当35x =时,362y =;当46x =时,458y =;当57x =时,554y =;当68x =时,650y =.与销售数据对比可知满足||1(1,2,,6)i i y y i -≤=的共有4个“好数据”:(3,70)、(4,65)、(5,62)、(6,59) 于是ξ的所有可能取值为1,2,31242361(1)5C C P C ξ===,2142363(2)5C C P C ξ===,3042361(3)5C C P C ξ===, ∴ξ 的分布列为:所以1232555E ξ=⨯+⨯+⨯=.考向三 非线性回归【例3】近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:根据以上数据,绘制了如图所示的散点图.(1)根据散点图判断,在推广期内,y a bx =+与(,xy c d c d =⋅均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表l 中的数据,求y 关于x 的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如表所示:已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客,享受7折优惠的概率为16,享受8折优惠的概率为13,享受9折优惠的概率为12.根据所给数据以事件发生的频率作为相应事件发生的概率,估计一名乘客一次乘车的平均费用. 参考数据:其中lg i i u y =,7117i i u u ==∑.【答案】(1)xy c d =⋅适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型;(2)y 关于x 的回归方程式为:0.25ˆ 3.4710xy=⨯,第8天使用扫码支付的人次为347人次;(3)1.66元.【解析】(1)根据散点图判断,x y c d =⋅适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型;(2)由(1)知回归方程为x y c d =⋅,两边同时取常用对数得:()lg lg lg lg xy c dc d x =⋅=+⋅,设lg y u =,lg lg u c d x ∴=+⋅,又4x =, 1.54u =,721140i i x ==∑,7172221750.1274 1.547lg 0.2514074287i ii i i x u xu d x x==--⨯⨯∴====-⨯-∑∑,把样本中心点()4,1.54代入lg lg u c d x =+⋅,即1.54lg 0.254c =+∙,解得:4ˆl 0.5gc=, 0.5405ˆ.2ux ∴=+, lg 0.540.25y x ∴=+,y ∴关于x 的回归方程式为:()0.540.250.540.250.2510101040ˆ 3.71xx x y +==⨯=⨯,把8x =代入上式得,23.4734ˆ107y=⨯=, 活动推出第8天使用扫码支付的人次为347人次;(3)记一名乘客乘车支付的费用为Z ,则Z 的取值可能为:2,1.8,1.6,1.4, 则()20.1P Z==,()11.80.30.152P Z ==⨯=, ()11.60.60.30.73P Z ==+⨯=,()11.40.30.056P Z ==⨯=; 分布列为:所以,一名乘客一次乘车的平均费用为:20.1 1.80.15 1.60.7 1.40.05 1.66⨯+⨯+⨯+⨯=(元). 【举一反三】1.为方便市民出行,倡导低碳出行.某市公交公司推出利用支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,在推广期内采用随机优惠鼓励市民扫码支付乘车.该公司某线路公交车队统计了活动推广期第一周内使用扫码支付的情况,其中 (单位:天)表示活动推出的天次, (单位:十人次)表示当天使用扫码支付的人次,整理后得到如图所示的统计表1和散点图. 表1:(1)由散点图分析后,可用作为该线路公交车在活动推广期使用扫码支付的人次关于活动推出天次的回归方程,根据表2的数据,求此回归方程,并预报第8天使用扫码支付的人次(精确到整数).表2:表中,.(2)推广期结束后,该车队对此期间乘客的支付情况进行统计,结果如表3.表3:统计结果显示,扫码支付中享受5折支付的频率为,享受7折支付的频率为,享受9折支付的频率为.已知该线路公交车票价为1元,将上述频率作为相应事件发生的概率,记随机变量为在活动期间该线路公交车搭载乘客一次的收入(单位:元),求的分布列和期望.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为参考数据:,,.【答案】(1) ,人次为2447 (2)见解析【解析】(1)由题意得,,,关于的线性回归方程为,关于的回归方程为,当时,,第8天使用扫码支付的人次为2447;(2)由题意得的所有取值为0.5,0.7,0.9,1,,,,,的分布列为:1.有下列说法:①若某商品的销售量y (件)关于销售价格x (元/件)的线性回归方程为5350y x =-+,当销售价格为10元时,销售量一定为300件;②线性回归直线y bx a =+$$$一定过样本点中心(,)x y ;③若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;⑤在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好;其中正确的结论有几个( ) A .1 B .2C .3D .4【答案】B【解析】①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误; ②由最小二乘法可知,回归直线必过(),x y ,②正确;③若两个随机变量为负相关,若线性相关性越强,相关系数r 越接近1-,③错误; ④残差图中,带状区域越窄,模型拟合度越高,④错误;⑤相关指数2R 越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确. 可知正确的结论为:②⑤,共2个本题正确选项:B2.已知下表为x 与y 之间的一组数据,若y 与x 线性相关,则y 与x 的回归直线y bx a =+必过点( )A .(2,2)B .(1.5,0)C .(1,2)D .(1.5,4)【答案】D【解析】由题可得32x =,4y =, 22223333(0)(14)(1)(34)(2)(54)(3)(74)102222ˆ233335(0)(1)(2)(3)2222b --+--+--+--===-+-+-+-,3ˆ4212a=-⨯=,则回归方程为ˆ21yx =+,将A ,B ,C ,D 四项分别代入方程,只有(1.5,4)这个点在直线上,故选D 。

多元线性回归模型习题及答案

多元线性回归模型习题及答案

多元线性回归模型一、单项选择题1.在由n = 30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为(D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B )A. G (消费)=500+4(收入)B. Q d (商品需求)=10+4(收入)+ P (价格)C.Qs (商品供给)=20+ P (价格)D. 1 (产出量)=L 0'(劳动)£”(资本)3 .用一组有30个观测值的样本估计模型工=b 0 + b i x i t + b 2x 21 + u t 后,在的显著性水平上对b i 的显著性作t 检验,则b i 显著地不等于零的条件是其统计量t 大于等于(Ct (30) t (28) t (27) F (1,28)A. 0.05B. 0.025C. 0.025D. 0.025ln y = ln b + b In x + u , b ,,4 .模型 乙 0 i t t 中,i 的实际含义是(B )A. x 关于y 的弹性B. y 关于x 的弹性C. x 关于y 的边际倾向D. y 关于x的边际倾向5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C )A.异方差性B.序列相关C.多重共线性D.高拟合优度 6 .线性回归模型y = b + bx + b x + ... + b x + u 中,检验H :b = 0(i = 0,1,2,...k ) 时,所用的统计量服从(1 C 2 22 k kt t 0 t (n-k+1) (n-k-2) (n-k-1) (n-k+2)7 . 调整的判定系数与多重判定系数之间有如下关系( D )— n — 1— n — 1 A. R 2 = ------------ R 2B. R 2 = 1 ------------- R 2n 一 k 一 1 n 一 k 一 1 n 一 1n 一 1 ~C. R 2 = 1 ----------- (1+ R 2)D, R 2 = 1 ----------- (1-R 2)n 一 k 一 1n 一 k 一 18 .关于经济计量模型进行预测出现误差的原因,正确的说法是(C )。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归直线方程
1、某公司为了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的. [附:回归直线的斜率和截距的最小二乘估计公式分别为
.] (1)根据频率分布直方图计算图中各小长方形的宽度;
(2)试估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);
(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:
广告投入(单位:万元) 1 2 3 4 5 销售收益(单位:万
元)
2 3 2
7
由表中的数据显示,与之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出关于的回归直线方程.
401
2
2
1
ˆˆˆ,n
i i
i n
i
i x y nx y
b
a
y bx x
nx ==-==--∑∑4x y x y y x
2、某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调
()完成列联表,并判断在犯错误的概率不超过的前提下,能否认为选题与性 别有关.
(Ⅰ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中
共抽取8人进行问卷.若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为,求的分布列及数学期望. 附: ,其中.
ξξE ξ()
()()()()
2
2
n ad bc K a b c d a c b d -=
++++n a b c d =+++
3、面向全市招聘事业编工作人员,由人事、劳动、纪检等部门联合组织招聘考试,招聘考试分为两个阶段:笔试和面试.现将所有参赛选手参加笔试的成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表.
(Ⅰ)求出上表中的x,y,z,s,p的值;
(Ⅱ)按规定,笔试成绩不低于90分的应聘人员可以参加面试,且面试的方式采用单循环,以参加面试人员胜出的场数决定是否录用(即参加面试的所有人员中每两人必需进行一个场次的PK比赛).已知松山区有两名应聘人员取得面试资格,在所有的比赛中,求有松山区选手参加比赛的概率.
答案
1、某公司为了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的. [附:回归直线的斜率和截距的最小二乘估计公式分别为
.] (1)根据频率分布直方图计算图中各小长方形的宽度;
(2)试估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);
(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:
广告投入(单位:万元) 1 2 3 4 5 销售收益(单位:万
元)
2 3 2
7
由表中的数据显示,与之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出关于的回归直线方程.
解:(1)设各小长方形的宽度为,由频率分布直方图中各小长方形的面积总和为1,可知
,故,即图中各小长方形的宽度为
2. …3分
(2)由(1)知各小组依次是, 其中点分别为,
对应的频率分别为,
故可估计平均值为.7分 (3)由(2)可知空白栏中填5.
由题意可知, ,
401
2
2
1
ˆˆˆ,n
i i
i n
i
i x y nx y
b
a
y bx x
nx ==-==--∑∑4x y x y y x m (0.080.10.140.120.040.02)0.51m m +++++⋅==2m =[0,2),[2,4),[4,6),[6,8),[8,10),[10,12]1,3,5,7,9,110.16,0.20,0.28,0.24,0.08,0.0410.1630.250.2870.2490.08110.045⨯+⨯+⨯+⨯+⨯+⨯=1234523257
3, 3.855
x y ++++++++=
===
,
,
根据公式,可求得 ………………10分
, ………………11分 所以所求的回归直线方程为. ………………12分
2、某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调
()完成列联表,并判断在犯错误的概率不超过的前提下,能否认为选题与性
别有关.
(Ⅰ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中
共抽取8人进行问卷.若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为,求的分布列及数学期望. 附: ,其中.
【解析】(Ⅰ)
5
1122332455769i i
i x y
=⨯+⨯+⨯+⨯+⨯==∑5
2222221
1234555i
i x
==++++=∑26953 3.812
1.2,555ˆ310
b
-⨯⨯===-⨯3.8 1.230ˆ.2a
=-⨯= 1.20.2y x =+ξξE ξ()
()()()()
2
2
n ad bc K a b c d a c b d -=
++++n a b c d =+++
,故不能认为选题与性别有关.…………………5分
(Ⅱ)选择“坐标系与参数方程”与选择“不等式选讲”的人数比例为100:60=5:3, 所以抽取的8人中倾向“坐标系与参数方程”的人数为5,倾向“不等式选讲”的人 数为3.
依题意,得,,,
, . …………………9分 故的分布列如下:
所以. …………………12分 3、面向全市招聘事业编工作人员 ,由人事、劳动、纪检等部门联合组织招聘考试,招聘考试分为两个阶段:笔试和面试.现将所有参赛选手参加笔试的成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表.
(Ⅰ)求出上表中的x ,y ,z ,s ,p 的值;
(Ⅱ)按规定,笔试成绩不低于90分的应聘人员可以参加面试,且面试的方式采用单循环,以参加面试人员胜出的场数决定是否录用(即参加面试的所有人员中每两人必需进行一个场次的 PK 比赛).已知松山区有两名应聘人员取得面试资格,在所有的比赛中,求有松山区选手参加比赛的概率. 解:(1)由题意知,参加招聘考试的人员共有p =
= 50人, ∴x =
= 0.18, 2
2
160(9001800) 3.74 5.0241055510060
K -=≈<⨯⨯⨯3,1,1,3=--ξ33381
(3)56C P C =-==ξ12533815(1)56
C C P C =-==ξ21533830
(1)56C C P C ===ξ30
533810(3)56
C C P C ===ξξ11530103
3(1)135********
E =-⨯
+-⨯+⨯+⨯=ξ16
0.32
9
50
y = 50×0.38 = 19, Z = 50﹣9﹣19﹣16 = 6, S = = 0.12 ----------------------------------------------------------6分
(Ⅱ)由(Ⅱ)知,参加面试的应聘人员共6人.
若参加面试的6人分别记为:S 1 , S 2 , a , b , c , d .( 其中S 1 , S 2 表示松山区的参赛选手,a , b , c , d 表示其他旗、县的选手)
则所有的比赛为: (S 1 , S 2 ) (S 1 , a ) (S 1 ,b ) (S 1 ,c ) (S 1 , d ) (S 2 , a ) (S 2 , b ) (S 2 , c ) (S 2 ,d ) (a , b ) ( a , c ) ( a , d ) ( b , c ) (b , d ) (c , d ) 共十五个场次的比赛,有松山区选手出现的比赛有9场. 若有松山区选手参加比赛的事件为:A 则P (A ) =
-------------------------------12分
6
50
3
5。

相关文档
最新文档