最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》达标训练

合集下载

高中数学《1.1回归分析的基本思想及其初步应用》评估训练 新人教A版选修1-2

高中数学《1.1回归分析的基本思想及其初步应用》评估训练 新人教A版选修1-2

第一章统计案例1.1 回归分析的基本思想及其初步应用双基达标限时20分钟1.下列命题中正确的是( ).①任何两个变量都具有相关关系②圆的周长与圆的半径具有相关关系③某商品的需求量与该商品的价格是一种非确定性关系④根据散点图求得的线性回归方程可能是没有意义的⑤两个变量的线性相关关系可以通过线性回归方程,把非确定性问题转化为确定性问题进行研究A.①③④B.②④⑤C.③④⑤D.②③⑤解析显然①是错误的,而②中圆的周长与圆的半径的关系为:C=2πR,是一种确定性的函数关系,故应选C.答案 C2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( ).A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.答案 A3.在判断两个变量y与x是否相关时,选择了4个不同的模型,它们的相关指数R2分别为:模型1的相关指数R2为0.98,模型2的相关指数R2为0.80,模型3的相关指数R2为0.50,模型4的相关指数R2为0.25.其中拟合效果最好的模型是( ).A.模型1 B.模型2C.模型3 D.模型4解析相关指数R2能够刻画用回归模型拟合数据的效果,相关指数R2的值越接近于1,说明回归模型拟合数据的效果越好.答案 A4.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),且e i 恒为0,则R 2为________.解析 由e i 恒为0,知y i =y ^i ,即y i -y ^i =0,故R 2=1-∑i =1ny i -y ^i 2∑i =1ny i -y2=1-0=1.答案 15.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程是________.解析 由斜率的估计值为 1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4),即y ^=1.23x +0.08.答案 y ^=1.23x +0.086.某个服装店经营某种服装,在某周内纯获利y (元)与该周每天销售这种服装件数x 之间的一组数据如下表:(1)(2)画出散点图.(3)求纯获利y 与每天销售件数x 之间的回归方程. 解 (1)x =6,y ≈79.86,中心点(6,79.86). (2)散点图如下:(3)因为b ^=∑i =17x i -xy i -y ∑i =17x i -x 2≈4.75,a ^=y -b ^x ≈51.36,所以y ^=4.75x +51.36.综合提高 限时25分钟7.为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( ). A .l 1和l 2有交点(s ,t )B .l 1与l 2相交,但交点不一定是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合解析 都过样本中心点(s ,t ),但斜率不确定. 答案 A8.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件计算得y ^=0.577x -0.448(x 为人的年龄,y 为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( ). A .年龄为37岁的人体内脂肪含量都为20.90% B .年龄为37岁的人体内脂肪含量为21.01%C .年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D .年龄为37岁的大部分的人体内脂肪含量为31.5%解析 当x =37时,y ^=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%. 答案 C9.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________. 解析 由表格得(x ,y )为(10,38),又(x ,y )在回归直线y ^=b ^x +a ^上,且b ^≈-2,∴38=-2×10+a ^,a ^=58,所以y ^=-2x +58,当x =6时,y ^=-2×6+58=46. 答案 4610.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下:x =72,y =71,∑i =16x 2i =79,∑i =16x i y i =1 481,b ^=1 481-6×72×7179-6×⎝ ⎛⎭⎪⎫722≈-1.818 2, a ^=71-(-1.818 2)×72≈77.36,则销量每增加1千箱,单位成本下降________元.解析 由已知可得,y ^=-1.818 2x +77.36,销量每增加1千箱,则单位成本下降1.818 2元. 答案 1.818 211.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y 与x 解 由数值表可作散点图如右图.根据散点图可知y 与x 近似地呈反比例函数关系,设y =k x ,令t =1x,则y =kt ,原数据变为:由散点图可以看出y 与t 呈近似的线性相关关系.列表如下:续表所以t =1.55,y =7.2.所以b ^=∑i =15t i y i -5t y∑i =15t 2i -5t 2=4.134 4,a ^=y -b ^t =0.8.所以y ^=4.134 4t +0.8.所以y 与x 的回归方程是y ^=4.134 4x+0.8.12.(创新拓展)某运动员训练次数与成绩之间的数据关系如下:(1)(2)求出回归方程; (3)作出残差图; (4)计算相关指数R 2;(5)试预测该运动员训练47次及55次的成绩.解 (1)作出该运动员训练次数(x )与成绩(y )之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)x =39.25,y =40.875,∑i =18x 2i =12 656,∑i =18x i y i =13 180,∴b ^=∑i =18x i y i -8x y∑i =18x 2i -8x 2=1.041 5,a ^=y -b ^x =-0.003 88,∴回归方程为y ^=1.0415x -0.003 88. (3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)计算得相关指数R 2=0.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.(5)由上述分析可知,我们可用回归方程y ^=1.041 5x -0.003 88作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y ≈49和y ≈57. 故预测该运动员训练47次和55次的成绩分别为49和57.。

高中数学人教A版选修(1-2) 1.1 同步练习 《回归分析的基本思想及其初步应用》(人教A版)

高中数学人教A版选修(1-2) 1.1 同步练习 《回归分析的基本思想及其初步应用》(人教A版)

《回归分析的基本思想及其初步应用》同步练习1. 在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x轴上,预报变量在y轴上(C)可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上2. 两个变量y与x的回归模型中,通常用R2来刻画回归的效果,则正确的叙述是()A. R2越小,残差平方和小B. R2越大,残差平方和大C. R2与残差平方和无关D.R2越小,残差平方和大3. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R21. 在分析两个分类变量之间是否有关系时,常用到的图表有 。

2. 在残差分析中,残差图的纵坐标为________________。

3. 设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系。

根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中正确的是________(填序号)。

(1)y 与x 具有正的线性相关关系;(2)回归直线过样本点的中心(x ,y );(3)若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ;(4)若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg.4. 下列有关线性回归的说法,不正确的是________(填序号)。

①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x ,y 之间的关系;④任何一组观测值都能得到具有代表意义的回归直线方程。

在回归分析中,通过模型由解释变量计算预报变量的值时,应注意什么问题?答案和解析一、选择题1.B ;【解析】通常把自变量x 称为解析变量,因变量y 称为预报变量。

最新人教版高中数学选修1-2《独立性检验的基本思想及其初步应用》达标训练

最新人教版高中数学选修1-2《独立性检验的基本思想及其初步应用》达标训练

更上一层楼基础·巩固1.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足( )A.K 2>3.841B.K 2<3.841C.K 2>6.635D.K 2<6.635思路解析:利用两个临界值来判断.若有95%的把握说事件A 和B 有关,则K 2>3.841. 答案:A2.下列说法正确的有______________个.( )①对事件A 与B 的检验无关时,即两个事件互不影响 ②事件A 与B 关系越密切,则K 2就越大 ③K 2的大小是判定事件A 与B 是否有关的唯一根据 ④若判定两事件A 与B 有关,则A 发生B 一定发生A.1B.2C.3D.4思路解析:充分利用独立性检验的意义来分析.①符合事件独立的意义,故正确;②中的关系密切不等于相关,所以不对;③不是唯一根据,还有独立事件的判断、假设检验等方法;④独立性检验推断的是相关的把握,有犯错误的可能. 答案:A3.为了探究色盲是否与性别有关,在调查的500名男性中有39名患色盲,500名女性中有6名患色盲,那么你认为色盲与性别有关的把握为( )A.0B.95%C.99%D.都不正确思路解析:计算出K 2与两个临界值比较.K 2=50050095545)461649439(10002⨯⨯⨯⨯-⨯⨯≈25.340 3>6.635.所以有99%的把握说色盲与性别有关. 答案:C4.下列关于K 2的说法正确的是( )A.K 2在任何相互独立问题中都可以用于检验两分类变量有关还是无关B.K 2的值越大,两个事件的相关性就越大C.K 2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.K 2=212121122211)(++++-n n n n n n n n n思路解析:结合独立性检验的基本思想及公式来判断.用K 2检验时数据必须大于5,故A 错;K 2检验研究的是相关的把握而不是相关性,故B 错;D 的公式中少了平方. 答案:C思路解析:利用独立性检验来判定,将K 2与两个临界值进行比较得出答案.解:K 2=73174545)7353810(902⨯⨯⨯⨯-⨯⨯≈0.635<3.841.所以学生的成绩与班级无关.综合·应用请问性别和读营养说明之间在多大程度上有关系? 思路解析:求K 2与两个临界值比较得到答案.解:K 2=36362844)2028816(722⨯⨯⨯⨯-⨯⨯≈8.416.因为K 2≈8.416>7.879,所以有99.5%的把握认为性别和读营养说明之间有关系.7.吃零食是中学生中普通存在的现象,吃零食对中学生身体发育有诸多不利影响,影响了孩子试推断男生与女生谁更喜欢吃零食.思路解析:首先根据独立性检验推断它们之间是否有关系,然后结合数据得出结论.解:由公式K 2=40456817)1240285(852⨯⨯⨯⨯-⨯⨯≈4.722.因为K 2≈4.722>3.841,所以有95%的把握认为“性别与吃零食”有关. 又因为女生中吃零食的比例较大,所以女生更喜欢吃零食.8.为了解决初二平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下列是初中二年级平面几何期中测验成绩统计表的一部分,试分析研究思路解析:通过独立性检验看加强教学是否与成绩有关,然后比较临界值得出结论.解:由公式K 2=56445050)12183832(1002⨯⨯⨯⨯-⨯⨯≈16.234.因为K 2≈16.234>10.828,所以有99.9%的把握认为“在初中一年级代数教学中加强概念和推理教学与初中二年级平面几何期中测验成绩”有关系.思路解析:求出K 2,然后与两个临界值比较得出结论.解:由公式K 2=15015054246)1141836132(3002⨯⨯⨯⨯-⨯⨯≈7.317.因为K 2≈7.317>6.635,所以有99%的把握认为新措施对防治“非典”是有效的.。

最新人教A版选修1-2高中数学拔高习题(一)1.1回归分析的基本思想及其初步应用和答案

最新人教A版选修1-2高中数学拔高习题(一)1.1回归分析的基本思想及其初步应用和答案

温馨提示:课时提升作业(一)回归分析的基本思想及其初步应用(25分钟60分)一、选择题(每小题5分,共25分)1.下列三个说法:(1)残差平方和越小的模型,拟合的效果越好;(2)用R2来刻画回归的效果时,R2的值越小,说明模型拟合的效果越好;(3)直线 y= b x+a 和各点(x1,y1),(x2,y2),…,(x n,y n)的偏差[y i-( b x i+a )]2是该坐标平面上所有直线中与这些点的偏差最小的直线.其中正确的个数为( )A.1个B.2个C.3个D.4个【解析】选B.由R2的定义可知:R2越接近于1,表明两个随机变量线性相关性越强,所以(2)不正确,其余说法正确.2.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得回归直线方程 y= b x+a 中 b≈-2,预测当气温为-4℃时,用电量的度数约为( )A.68℃B.67℃C.66℃D.65℃【解析】选A.由表格得(,)为(10,40),又(,)在回归方程 y= b x+a 上且 b≈-2,所以40=10×(-2)+ a ,解得: a =60,所以 y=-2x+60.当x=-4时, y=-2×(-4)+60=68. 3.(2014·重庆高考)已知变量x 与y 正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据测算的线性回归方程可能是 ( )A. y=0.4x+2.3 B. y =2x-2.4 C. y=-2x+9.5 D. y =-0.3x+4.4 【解题指南】根据正相关可知斜率为正,再根据线性回归方程经过点(,)可求出结果.【解析】选A.由正相关可知斜率为正,故可排除C,D 两项,又因为 y =0.4x+2.3经过点(3,3.5),故A 项正确.【补偿训练】(2015·临沂高二检测)某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:度)之间有下列数据关系:甲、乙、丙三位同学对上述数据进行了研究,分别得到了x 与y 之间的三个线性回归方程:①y=-x+2.8,②y=-x+3,③y=-1.2x+2.6;其中正确的是 ( ) A.①B.②C.③D.①③【解析】选 A.回归方程 y= b x+a 表示的直线必过点(,),即必过点(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①. 4.(2015·泰安高二检测)在回归分析中,R 2的值越大,说明残差平方和 ( ) A.越大 B.越小 C.可能大也可能小 D.以上均错【解析】选B.因为R 2= n2iii 1n 2i i 1(yy )1(y y)==---∑∑,所以当R 2越大时,(y i - iy )2越小,即残差平方和越小. 5.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程 y= b x+a ,其中 b =0.76, a =- b .据此估计,该社区一户年收入为15万元家庭的年支出为 ( ) A.11.4万元 B.11.8万元 C.12.0万元D.12.2万元【解题指南】样本中心点(,)一定在回归直线上. 【解析】选B.由题意得 ==10, ==8,所以a=8-0.76×10=0.4, 所以 y=0.76x+0.4,把x=15代入得到 y =11.8. 二、填空题(每小题5分,共15分)6.在研究身高和体重的关系时,求得相关指数R 2≈ ,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.【解析】结合R 2的计算公式R 2= n2iii 1n 2ii 1(yy )1(yy)==---∑∑可知,当R 2=0.64时,身高解释了64%的体重变化. 答案:0.647.若根据10名儿童的年龄x(岁)和体重y(kg)数据用最小二乘法得到用年龄预报体重的回归方程是 y=2x+7,已知这10名儿童的年龄分别是2,3,3,5,2,6,7,3,4,5,则这10名儿童的平均体重是 . 【解析】由题意可得=2+7,又=4,所以=15.答案:15kg8.(2015·扬州高二检测)某校高二(8)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)构成如下数据(15,79),(23,97),(16,64),(24,92),(12,58),求得的回归直线方程为 y =2.5x+a ,则某同学每周学习20小时,估计数学成绩约为 分. 【解析】=×(15+23+16+24+12)=18, =×(79+97+64+92+58)=78,把(,)代入 y=2.5x+a ,可求得a =33, 把x=20代入 y =2.5x+33得 y =2.5×20+33=83. 答案:83三、解答题(每小题10分,共20分) 9.关于x 与y 有如下数据关系:为了对x,y 两个变量进行统计分析,现有以下两种线性模型:甲模型 y =6.5x+17.5,乙模型 y=7x+17,试比较哪一个模型拟合的效果更好. 【解析】= 52iii 152ii 1(yy )1(yy)==---∑∑=1-=0.845,= 52iii 152ii 1(yy )1(yy)==---∑∑=1-=0.82,84.5%>82%,所以甲模型拟合效果更好.【拓展延伸】R 2=1- n2ii 1n2ii 1(y y)1(yy)==---∑∑的意义R2越大,残差平方和越小,从而回归模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近1,表示回归的效果越好(因为R2越接近1,表示解释变量和预报变量的线性相关性越强).10.(2015·深圳高二检测)PM2.5是指大气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如表:(1)根据上表数据,请在下列坐标系中画出散点图.(2)根据上表数据,用最小二乘法求出y关于x的线性回归方程 y= b x+a .(3)若周六同一时间段车流量是25万辆,试根据(2)求出的线性回归方程预测,此时PM2.5的浓度为多少(保留整数).【解析】(1)散点图如图所示.(2)因为==54,==74,(xi-)(yi-)=4×5+3×4+3×4+4×5=64,(xi-)2=(-4)2+(-3)2+32+42=50,b=5i ii152ii1(x x)y y(x x)==---∑∑()==1.28,a =- b=74-1.28×54=4.88,故y关于x的线性回归方程是 y=1.28x+4.88.(3)当x=25时, y=1.28×25+4.88=36.88≈37,所以可以预测此时PM2.5的浓度约为37微克/立方米.(20分钟40分)一、选择题(每小题5分,共10分)1.(2015·眉山高二检测)已知样本点散落在某一条曲线y= a bxe+ 附近,作变换z= lny,利用线性回归模型来求其中的参数a,b,则拟合其变换后的样本点的直线方程为( )A.z bx aB.z bx eaC.z bx lnaD.z bxln a=+ =+ =+ =+【解析】选A.对方程y= a bxe+ 两边取以e为底的对数即得.2.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归直线方程为 y=2x+a,若样本点(r,1)与(1,s)的残差相同,则有( )A. r=sB.s=2rC.s=3-2rD.s=2r+1【解析】选C.由残差的定义可得,1-(2r+a)=s-(2+a),化简得s=3-2r.【延伸探究】若将题中的“ y=2x+a”改为“ y=bx+a”,同时将“样本点(r,1)与(1,s)”改为“样本点(1,1)与(2,4)”,则b= .【解析】由残差的定义可得1-(b+a)=4-(2b+a),化简得b=3.答案:3二、填空题(每小题5分,共10分)3.已知回归方程为 y=2x+1,而实验得到的一组数据为(2,4.9),(3,7.1),(4,9.1),则残差平方和为.【解析】(yi- y i)2=(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.答案:0.034.(2015·石家庄高二检测)已知一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn ,yn),其样本点的中心为(2,3),若其回归直线的斜率估计值为-1.2,则该回归直线方程为.【解析】由题意可设回归直线为 y=-1.2x+a ,由于回归直线过样本点的中心(2,3),故有3=-1.2×2+a ,解得a =5.4,故回归直线方程为 y=-1.2x+5.4.答案: y=-1.2x+5.4【补偿训练】(2014·渭南高二检测)已知x与y之间的几组数据如下表:则y与x的线性回归方程 y= b x+a 过点( )A.(0,1)B.(1,4)C.(2,5)D.(5,9)【解析】选C.因为==2,==5,所以根据线性回归方程必过样本中心点,可得 y= b x+a 必过(2,5).三、解答题(每小题10分,共20分)5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程 y= b x+a ,其中 b=-20, a =- b.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解题指南】(1)利用线性回归系数公式求出a , b的值,从而可确定回归直线方程.(2)利用二次函数求最值.【解析】(1)由于=×(8+8.2+8.4+8.6+8.8+9)=8.5,=×(90+84+83+80+75+68)=80,又 b=-20,所以a =- b=80+20×8.5=250,从而回归直线方程为 y=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.【拓展延伸】建立回归模型的基本步骤(1)确定解释变量和预报变量.(2)画散点图,观察是否存在线性相关关系.(3)确定回归方程的类型,如 y= b x+a .(4)按最小二乘法估计回归方程中的参数.(5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.6.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程=t+.(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程=t+中, ni ii 1n 22i i 1t yntybay bt.t nt ,==-==--∑∑ 【解题指南】(1)直接利用回归系数公式求解即可.(2)利用回归方程代入直接进行计算即可.【解析】(1)列表计算如下:n n i i i 1i 1nn222tt ity i i i 1i 1ty tt115136n 5,t t 3,y y 7.2.n 5n 5t nt 555310,t y nty 120537.212,121.2,10a y t 7.21.23 3.6,============-=-⨯==-=-⨯⨯======⨯=∑∑∑∑ 这里又从而b-b -l l l l故所求回归方程为=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).【补偿训练】(2015·西安高二检测)下表是某年美国旧轿车价格的调查资料,以x(年)表示轿车的使用年数,y(美元)表示相应的年均价格,求y 关于x 的非线性回归方程.【解题指南】画出散点图或进行相关性检验,确定两变量x,y 是否线性相关.由散点图得x,y 之间的回归模型.然后转化为线性回归模型进行拟合,预报回归模型,求回归方程.【解析】画散点图如图1所示,看出y 与x 呈指数关系,于是令z=lny.变换后得数据:画散点图如图2所示,由图可知各点基本处于一条直线, 由于==5.5, ==6.5274,10i ii 11022i i 1x z10xzb0.298,az bx 6.527 40.298 5.58.166,x 10x==-==-=-=+⨯≈-∑∑ 所以由表中数据可得线性回归方程为z=8.166-0.298x,因此旧轿车的平均价格对使用年数的非线性回归方程为 y=e 8.166-0.298x .。

高中数学人教版选修1-2课时自测 当堂达标:1.1 回归分析的基本思想及其初步应用含答案

高中数学人教版选修1-2课时自测 当堂达标:1.1 回归分析的基本思想及其初步应用含答案

故回归模型的拟合效果较好.
i=1
5
5
5
5‒
=1660, ∑ y2i =327, ∑ xiyi=620, ∑ (yi- yi )2=0.3, ∑ y (yi- )2=53.2.)
i=1
i=1
i=1
i=1
【解析】(1)散点图如图所示:


5
5
5
(2)因为 x =18, y =7.4, ∑ x2i =1660, ∑ y2i =327, ∑ xiyi=620,
课时自测·当堂达标
1.在画两个变量的散点图时,下列叙述正确的是( )
A.预报变量在 x 轴上,解释变量在 y 轴上 B.解释变量在 x 轴上,预报变量在 y 轴上 C.可以选择两个变量中任意一个变量在 x 轴上
D.可以选择两个变量中任意一个变量在 y 轴上
【解析】选 B.结合线性回归模型 y=bx+a+e 可知,解释变量在 x 轴上,预报变量在 y 轴上.
【解析】由题意知,加工 600 个零件大约需要时间 y=0.01×600+0.5=6.5(h).
答案:6.5
4.已知某商品的价格 x(元)与需求量 y(件)之间的关系有如下一组数据:
x
14
16
18
2022Leabharlann y1210
7
5
3
(1)画出 y 关于 x 的散点图.
(2)求出回归直线方程.


5
(3)计算 R2 的值,并说明回归模型拟合程度的好坏(参考数据: x =18, y =7. 4, ∑ x2i
2.下列哪些变量是相关关系?( )
A.出租车车费与行驶的路程
B.房屋面积与房屋价格 C.人的身高与体重 D.铁块的大小与质量

人教新课标版数学高二-人教A版选修1-2练习 1.1回归分析的基本思想及其初步应用

人教新课标版数学高二-人教A版选修1-2练习 1.1回归分析的基本思想及其初步应用

第一章 统计案例1.1 回归分析的基本思想及其初步应用A 级 基础巩固一、选择题1.已知x 和y 之间的一组数据x 0 1 2 3 y1357则y 与x 的线性回归方程y ^=b x +a 必过点( ) A .(2,2) B.⎝⎛⎭⎫32,0 C .(1,2)D.⎝⎛⎭⎫32,4解析:∵x -=14(0+1+2+3)=32,y -=14(1+3+5+7)=4,∴回归方程y ^=b ^x +a ^必过点⎝⎛⎭⎫32,4. 答案:D2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x -5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:①中y 与x 负相关而斜率为正,不正确;④中y 与x 正相关而斜率为负,不正确. 答案:D3.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如表:甲 乙 丙 丁 R 20.980.780.500.85A .甲B .乙C .丙D .丁解析:相关指数R 2越大,表示回归模型的效果越好. 答案:A4.如图所示的是四个残差图,其中回归模型的拟合效果最好的是( )解析:残差图中,只有A 、B 是水平带状区域分布,且B 中残差点散点分布集中在更狭窄的范围内所以B 项中回归模型的拟合效果最好.答案:B5.(2015·福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)6.27.58.08.59.8根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:先求a ^,再利用回归直线方程预测.由题意知,x -=8.2+8.6+10.0+11.3+11.95=10,y -=6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 答案:B 二、填空题6.如果散点图中的所有的点都在一条斜率不为0的直线上,则残差为________,相关指数R 2=________.解析:由题意知,y i =y ^i ∴相应的残差e ^i =y i -y ^i =0.相关指数R 2=1-答案:0 17.甲、乙、丙、丁4位同学各自对A ,B 两变量做回归分析,分别得到散点图与残差平方和如表:甲乙 丙 丁散点图残差平方和115106124103解析:由图表知,丁同学拟合的残差平方和为103最小.即R 2最大,所以丁的拟合效果好,精度高.答案:丁8.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据(由资料显示y与x 呈线性相关关系):根据上表提供的数据得到回归方程y =b x +a 中的b =6.5,预测销售额为115万元时约需________万元广告费.解析:x -=15(2+4+5+6+8)=5,y -=15(30+40+60+50+70)=50,由b ^=6.5知,a ^=y --b ^·x -=50-6.5×5=17.5, ∴y ^=17.5+6.5x ,当y ^=115时,解得x =15. 答案:15 三、解答题9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销售与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x -=16(8+8.2+8.4+8.6+8.8+9)=8.5,y -=16(90+84+83+80+75+68)=80,又b ^=-20,所以a ^=y --b ^x -=80+20×8.5=250, 从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000 =-20(x -8.25)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.10.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有关的统计资料如表所示.使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0(1)求线性回归方程y ^=b ^x +a ^;(2)若相关指数R 2=0.958 7,说明其含义; (3)估计使用年限为10年时,维修费用是多少? 解:(1)由已知数据制成表:i 1 2 3 4 5 合计 x i 2 3 4 5 6 20 y i2.23.85.56.57.025由此可得x -=4,y =5,∴回归直线方程为y ^=1.23x +0.08.(2)R 2=0.958 7,说明该设备的维修费用有95.87%由使用年限引起的.所以回归模型的拟合效果好.(3)回归直线方程为y ^=1.23x +0.08,当x =10(年)时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.B 级 能力提升1.(2014·重庆卷)已知变量x 与y 正相关,且由观测数据算得样本平均数x -=3,y -=3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4解析:因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 与D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B 中的直线方程进行检验,可以排除B ,只有A 可能.答案:A2.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:把x =160代入y ^=0.85x -82.71, 得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29. 答案:-0.293.(2015·重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中,b ^=解:(1)由题设条件列表计算如下:i t i y i t2i t i y i12345123455678101491625512213250∑153655120这里n=5,t-=1n∑i=1nt i=155=3,y=1n∑i=1ny i=365=7.2.从而b^=l tyl tt=1210=1.2,a^=y--b^t-=7.2-1.2×3=3.6,故所求回归方程为y^=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y^=1.2×6+3.6=10.8(千亿元).。

高中数学选修1-2同步练习题库:回归分析的基本思想及其初步应用(选择题:较易)

高中数学选修1-2同步练习题库:回归分析的基本思想及其初步应用(选择题:较易)

回归分析的基本思想及其初步应用(选择题:较易)1、某工厂生产某种产品的产量(吨)与相应的生产能耗(吨标准煤)有如下几组样本数据:根据相关检验,这组样本数据具有线性相关关系,通过线性回归分析,求得其回归直线的斜率为,则这组样本数据的回归直线方程是( )A .B .C .D .2、某研究机构在对具有线性相关的两个变量和进行统计分析时,得到如表数据.由表中数据求得关于的回归方程为,则在这些样本点中任取一点,该点落在回归直线下方的概率为( )4 6 8 10 121 2 3 5 6A. B. C. D.3、对于自变量x 和因变量y ,当x 取值一定时,y 的取值带有一定的随机性,x ,y 之间的这种非确定性关系叫做( )A .函数关系B .线性关系C .相关关系D .回归关系4、散点图在回归分析过程中的作用是( )A .查找个体个数B .比较个体数据大小关系C .探究个体分类D .粗略判断变量是否线性相关5、已知的取值如下表所示:若与线性相关,且,则()A.2.2 B.2.9 C.2.8 D. 2.66、设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是().A.变量x和y之间呈现正相关关系B.各样本点(x n,y n)到直线l的距离都相等C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(,)7、在下列各图中,两个变量具有相关关系的图是()A.(1)(2) B.(1)(3) C.(2)(4) D.(2)(3)8、下列说法错误的是()A.是或的充分不必要条件B.若命题,则C.线性相关系数的绝对值越接近1,表示两变量的相关性越强D.用频率分布直方图估计平均数,可以用每个小矩形的高乘以底边中点横坐标之和9、某产品近四年的广告费x万元与销售额y万元的统计数据如下表,根据此表可得回归方程中的=9.4,据此模型预测下一年该产品广告费预算为60万元时,其销售额为( )万元.A.650 B.655 C.677 D.72010、某单位1-4月份用水量(单位:百吨)的一组数据如下表所示:根据收集到的数据,由最小二乘法可求得线性回归方程,则()A. B.0.7 C. D.0.7511、若线性回归方程为=2-3.5x,则当变量x增加一个单位时,变量y ()A.减少3.5个单位 B.增加2个单位C.增加3.5个单位 D.减少2个单位12、已知线性相关的两个变量之间的几组数据如下表:变量x2.72.933.24.2变量y4649m5355且回归方程为,经预测时,的值为60,则m=( )A. 50B. 51C. 52D. 5313、下列关于样本相关系数的说法不正确的是A.相关系数用来衡量与间的线性相关程度 B.且越接近于0,相关程度越小C.且越接近于1,相关程度越大 D.且越接近于1,相关程度越大14、下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为=0.7x+0.35,则下列结论错误的是x3456y2.5t44.5A. 产品的生产能耗与产量呈正相关B. t的值是3.15C. 回归直线一定过(4.5,3.5)D. A产品每多生产1吨,则相应的生产能耗约增加0.7吨15、两个变量之间的线性相关程度越低,其线性相关系数的数值()A.越接近于-1 B.越接近于0 C.越接近于1 D.越小16、若线性回归方程为=2-3.5x,则当变量x增加一个单位时,变量y ()A.减少3.5个单位 B.增加2个单位C.增加3.5个单位 D.减少2个单位17、对于线性回归方程,下列说法中不正确的是()A.叫做回归系数 B.当>0,每增加一个单位,平均增加个单位C.回归直线必经过点 D.叫做回归系数18、对两个变量x,y进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…(x n,y n),则下列说法中不正确的是A.由样本数据得到的回归方程必过样本点的中心B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.两个随机变量的线性相关性越强,相关系数的绝对值越接近于1.19、对于给定的样本点所建立的模型A和模型B,它们的残差平方和分别是的值分别为b1,b2,下列说法正确的是()A.若a1<a2,则b1<b2,A的拟合效果更好B.若a1<a2,则b1<b2,B的拟合效果更好C.若a1<a2,则b1>b2,A的拟合效果更好D.若a1<a2,则b1>b2,B的拟合效果更好20、已知与之间的一组数据:12343.24.87.5若关于的线性回归方程为,则的值为().A. 1B. 0.85C. 0.7D. 0.521、甲、乙、丙、丁四位同学各自对两变量的线性相关性做试验,并用回归分析方法分别求得相关系数与残差平方和如下表:甲乙丙丁0.820.780.690.85106115124103则哪位同学的试验结果体现两变量有更强的线性相关性()A. 甲B. 乙C. 丙D. 丁22、某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表统计数据表:根据数据表可得回归直线方程,其中,,据此模型预测广告费用为9万元时,销售轿车台数为()广告费用(万元)23456销售轿车(台数)3461012A. 17B. 18C. 19D. 2023、已知、取值如下表:从所得的散点图分析可知:与线性相关,且线性回归方程为,则()A.1.30 B.1.45 C.1.65 D.1.8024、身高与体重有关系可以用________来分析.()A.残差 B.回归分析C.等高条形图 D.独立检验25、观察两个变量(存在线性相关关系)得如下数据:-10-6.99-5.01-2.983.9857.998.01-9-7-5-34.9978则两变量间的线性回归方程为()A. B. C. D.26、下表提供了某厂节能降耗技术改造后在生产产品过程中记录的产量(吨)与相应的生产能耗(吨)的几组相对应数据:34562.544.5根据上表提供的数据,求出关于的线性回归方程为,那么表中的值为()A. 3B. 3.15C. 3.5D. 4.527、经统计用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系,对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如表:x1516181922y102115115120由表中样本数据求得回归方程为,则()A. B. C. D. 与的大小无法确定28、某产品的广告费用万元与销售额万元的统计数据如表:广告费用2345销售额26394954根据上表可得回归方程,据此模型预测,广告费用为6万元时的销售额为()万元A. 63.6 B. 65.5 C. 72 D. 67.729、对两个变量、进行线性回归分析,计算得到相关系数,则下列说法中正确的是()A.与正相关 B.与具有较强的线性相关关系C.与几乎不具有线性相关关系 D.与的线性相关关系还需进一步确定30、已知具有线性相关关系的两个变量,之间的一组数据如下:1232.24.34.86.7且回归方程是,则()A. 2.5B. 3.5C. 4.5D. 5.531、具有线性相关关系的变量,满足一组数据如表所示,若与的回归直线方程为,则的值是()12318A. 4B.C. 5D. 632、设有一个回归方程,变量增加一个单位时,()A.平均增加3个单位 B.平均减少3个单位C.平均增加5个单位 D.平均减少5个单位33、某产品近四年的广告费x万元与销售额y万元的统计数据如下表,根据此表可得回归方程中的=9.4,据此模型预测下一年该产品广告费预算为60万元时,其销售额为( )万元.A.650 B.655 C.677 D.72034、下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为=0.7x+0.35,则下列结论错误的是x3456y2.5t44.5A. 产品的生产能耗与产量呈正相关B. t的值是3.15C. 回归直线一定过(4.5,3.5)D. A产品每多生产1吨,则相应的生产能耗约增加0.7吨35、下列说法错误的是( )A.回归直线过样本点的中心B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C.在回归直线方程中,当解释变量每增加1个单位时,预报变量平均增加0.2个单位D.对分类变量与,随机变量的观测值越大,则判断“与有关系”的把握程度越小36、某商品销售量(件)与销售价格(元/件)负相关,则其回归方程可能是()A. B. C. D.37、变量之间的一组相关数据如下表所示:45678.27.86.65.4若之间的线性回归方程为,则的值为()A. -0.96B. -0.94C. -0.92D. -0.9838、对具有线性相关关系的变量有一组观测数据( i=1,2,…,8),其回归直线方程是且,,则实数是()A. B. C. D.39、设某大学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,则下列结论中不正确的是()A.与具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加1,则其体重约增加0.85D.若该大学某女生身高增加170,则可断定其体重必为58.7940、已知回归方程,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A.0.01 B.0.02C.0.03 D.0.0441、下列有关回归直线方程的叙述:①反映与之间的函数关系;②反映与之间的函数关系;③表示与之间的不确定关系;④表示最接近与之间真实关系的一条直线.其中正确的是()A.①② B.②③C.③④ D.①④42、下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② B.①②③ C.①②④ D.①②③④43、设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(=1,2,,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg44、(5分)(2011•陕西)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n次方个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()A.直线l过点B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同45、从某高中随机选取5名高三男生,其身高和体重的数据如表所示:身高x(cm)160165170175180体重y(kg)6366707274根据上表可得回归直线方程:=0.56x+,据此模型预报身高为172cm的高三男生的体重为()A.70.09kgB.70.12kgC.70.55kgD.71.05kg46、下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题个数为( )A.2 B.3 C.4 D.547、一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:转速x/(rad/s)1614128每小时生产有缺点的零件数y/件11985若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制所在的范围是()A.10转/s以下B.15转/s以下C.20转/s以下D.25转/s以下参考答案1、C2、A3、C4、D5、D6、D7、D8、D9、B10、A11、A12、C13、C14、B15、B16、A17、D18、C19、C20、D21、D22、C23、B24、B25、B26、A27、B28、B29、B30、C31、A32、D33、B34、B35、D36、C37、A38、A39、D40、C41、D42、C43、D44、A45、B46、B47、B【解析】1、由题意可知,,线性回归方程过样本中心,所以只有C选项满足。

高中数学人教版选修1-2课堂10分钟达标练:1.1 回归分析的基本思想及其初步应用 探究导学课型 Word版含答案

高中数学人教版选修1-2课堂10分钟达标练:1.1 回归分析的基本思想及其初步应用 探究导学课型 Word版含答案

温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。

关闭Word文档返回原板块。

课堂10分钟达标练1.关于随机误差产生的原因分析正确的是( )(1)用线性回归模型来近似真实模型所引起的误差;(2)忽略某些因素的影响所产生的误差;(3)对样本数据观测时产生的误差;(4)计算错误所产生的误差.A.(1)(2)(4)B.(1)(3)C.(2)(4)D.(1)(2)(3)【解析】选D.理解线性回归模型y=bx+a+e中随机误差e的含义是解决此问题的关键,随机误差可能由于观测工具及技术产生,也可能因忽略某些因素产生,也可以是回归模型产生,但不是计算错误.2.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的R2如下,其中拟合效果最好的模型是( )A.模型1的R2为0.98B.模型2的R2为0.80C.模型3的R2为0.50D.模型4的R2为0.25【解析】选A.R2的取值范围为[0,1],其中R2=1,即残差平方和为0,此时预测值与观测值相等,y与x是函数关系,也就是说在相关关系中R2越接近于1,说明随机误差的效应越小,y与x相关程度越大,模型的拟合效果越好.R2=0,说明模型中x与y无关.3.若施化肥量x与水稻产量y的回归直线方程为=5x+250,当施化肥量为80kg时,预报水稻产量为.【解析】当x=80kg时,=5×80+250=650(kg).答案:650kg4.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),若e i恒为0,则R2的值为.【解析】由e i恒为0,知y i=,即y i-=0,故R2=答案:15.为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)作出散点图并求线性回归方程.(2)求出R2.【解析】(1)散点图如图所示=×(5+10+15+20+25+30)=17.5,=×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,=2275,x i y i=1076.2计算得,≈0.183,≈6.285,所求回归直线方程为=0.183x+6.285.(2)列表如下:--所以(y i-)2≈0.01318,(y i-)2=14.6784.所以,R2=1-≈0.9991,回归模型的拟合效果较好.关闭Word文档返回原板块。

高二数学人教A版选修1-2练习:1.1回归分析的基本思想及其初步应用

高二数学人教A版选修1-2练习:1.1回归分析的基本思想及其初步应用

学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】 B2.在回归分析中,相关指数R 2的值越大,说明残差平方和( ) A .越大B .越小C .可能大也可能小D .以上均错【解析】 ∵R 2=1-,∴当R 2越大时, (y i -y ^i )2越小,即残差平方和越小,故选B.【答案】 B3.已知x 和y 之间的一组数据则y 与x 的线性回归方程y =b x +a 必过点( ) A .(2,2) B.⎝⎛⎭⎫32,0 C .(1,2)D.⎝⎛⎭⎫32,4【解析】 ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4,∴回归方程y ^=b ^x +a ^必过点⎝⎛⎭⎫32,4. 【答案】 D4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )【导学号:81092003】A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理【解析】 将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】 B5.若一函数模型为y =ax 2+bx +c (a ≠0),为将y 转化为t 的线性回归方程,则需作变换t =( )A .x 2B .(x +a )2 C.⎝⎛⎭⎫x +b 2a 2 D .以上都不对【解析】 y 关于t 的线性回归方程,实际上就是y 关于t 的一次函数,又因为y =a ⎝⎛⎭⎫x +b2a 2+4ac -b 24a,所以可知选项C 正确.【答案】 C 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.【解析】 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.【答案】 17.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.【解析】 把x =160代入y ^=0.85x -82.71, 得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29. 【答案】 -0.298.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.【答案】 0.254 三、解答题9.关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:(1)线性回归方程:(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3, b ^=∑i =15x i y i -5x -y-∑i =15x 2i -5x2=112.3-5×4×590-5×42=1.23. 于是a ^=y -b ^x =5-1.23×4=0.08. 所以线性回归方程为y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元. 10.关于x 与y 有如下数据:为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲模型y ^=6.5x +17.5,乙模型y ^=7x +17,试比较哪一个模型拟合的效果更好.【解】 R 2甲=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1551 000=0.845,R 2乙=1-∑i =15y i -y ^i2∑i =15y i -y2=1-1801 000=0.82,因为84.5%>82%,所以甲模型拟合效果更好.[能力提升]1.某学生四次模拟考试时,其英语作文的减分情况如下表:( )A .y =0.7x +5.25B .y =-0.6x +5.25C .y =-0.7x +6.25D .y =-0.7x +5.25【解析】 由题意可知,所减分数y 与模拟考试次数x 之间为负相关,所以排除A.考试次数的平均数为x =14×(1+2+3+4)=2.5,所减分数的平均数为y =14×(4.5+4+3+2.5)=3.5.即直线应该过点(2.5,3.5),代入验证可知直线y = -0.7x +5.25成立,选D.【答案】 D2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′【解析】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2, a ′=0-2×1=-2. 求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136, ∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57,a ^=136-57×3.5=136-52=-13,∴b ^<b ′,a ^>a ′. 【答案】 C3.已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.【解析】 x =0+1+3+44=2,y =2.2+4.3+4.8+m 4=11.3+m 4,把(x -,y -)代入回归方程得11.3+m4=0.95×2+2.6,解得m =6.7.【答案】 6.74.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:2组数据用于回归方程检验.(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(3)请预测温差为14 ℃的发芽数.【解】 (1)由数据求得,x =12,y =27,∑i =13x 2i =434,∑i =13x i y i =977.由公式求得,b ^=52,a ^=y -b ^x =-3.所以y 关于x 的线性回归方程为y ^=52x -3.(2)当x =10时,y ^=52×10-3=22,|22-23|<2;当x =8时,y ^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的. (3)当x =14时,有y ^=52×14-3=35-3=32,所以当温差为14 ℃时的发芽数约为32颗.。

最新整理高中数学人教A版选修1-2学业分层测评1 回归分析的基本思想及其初步应用 Word版含解析.doc

最新整理高中数学人教A版选修1-2学业分层测评1 回归分析的基本思想及其初步应用 Word版含解析.doc

学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】 B2.(2016·泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平方和( )A .越大B .越小C .可能大也可能小D .以上均错【解析】 ∵R 2=1-∑i =1n(y i -y ^i )2∑i =1n (y i -y )2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小,故选B. 【答案】 B3.(2016·西安高二检测)已知x 和y 之间的一组数据x 0 1 2 3 y1357则y 与x 的线性回归方程y ^=b ^x +a ^必过点( ) A .(2,2)B.⎝ ⎛⎭⎪⎫32,0C .(1,2)D.⎝ ⎛⎭⎪⎫32,4 【解析】 ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4, ∴回归方程y ^=b ^x +a ^必过点⎝ ⎛⎭⎪⎫32,4.【答案】 D4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )【导学号:19220003】A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理【解析】 将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】 B5.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元【解析】 样本点的中心是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.【答案】 B 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为________.【解析】根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.【答案】 17.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y^-5=1.23(x-4),即y^=1.23x+0.08.【答案】y^=1.23x+0.087.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:x 1020304050y 62■758189 由最小二乘法求得回归方程为y^=0.67x+54.9,现发现表中有一个数据模糊不清,请推断该点数据的值为________.【解析】由题意可得x=15(10+20+30+40+50)=30,设要求的数据为t,则有y=15(62+t+75+81+89)=307+t5,因为回归直线y^=0.67x+54.9过样本点的中心(x,y),所以307+t5=0.67×30+54.9,解得t=68.【答案】688.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y 对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】以x+1代x,得y^=0.254(x+1)+0.321,与y^=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.【答案】 0.254 三、解答题9.(2016·包头高二检测)关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x 2 3 4 5 6 y2.23.85.56.57.0如由资料可知y 对x 呈线性相关关系.试求:(1)线性回归方程:⎝ ⎛⎭⎪⎪⎫a ^=y -b ^x -,b ^=∑i =1nx i y i -n x -y -∑i =1nx 2i-n (x )2(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3, b ^=∑i =15x i y i -5x -y -∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23.于是a ^=y -b ^x =5-1.23×4=0.08. 所以线性回归方程为y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元. 10.关于x 与y 有如下数据:x24568y 30 40 60 50 70为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲模型y ^=6.5x +17.5,乙模型y ^=7x +17,试比较哪一个模型拟合的效果更好.【解】 R 2甲=1-∑i =15(y i -y ^i )2∑i =15 (y i -y )2=1-1551 000=0.845,R 2乙=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1801 000=0.82,因为84.5%>82%,所以甲模型拟合效果更好.[能力提升]1.某学生四次模拟考试时,其英语作文的减分情况如下表:考试次数x 1 2 3 4 所减分数y4.5432.5显然所减分数y 与模拟考试次数x 之间有较好的线性相关关系,则其线性回归方程为( )A .y =0.7x +5.25B .y =-0.6x +5.25C .y =-0.7x +6.25D .y =-0.7x +5.25【解析】 由题意可知,所减分数y 与模拟考试次数x 之间为负相关,所以排除A.考试次数的平均数为x =14×(1+2+3+4)=2.5,所减分数的平均数为y =14×(4.5+4+3+2.5)=3.5.即直线应该过点(2.5,3.5),代入验证可知直线y =-0.7x +5.25成立,选D.【答案】 D2.已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′【解析】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2, a ′=0-2×1=-2. 求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57, a ^=136-57×3.5=136-52=-13, ∴b ^<b ′,a ^>a ′. 【答案】 C3.(2016·江西吉安高二检测)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.x 0 1 3 4 y 2.24.34.8m【解析】 x =0+1+3+44=2,y =2.2+4.3+4.8+m 4=11.3+m 4,把(x -,y -)代入回归方程得11.3+m 4=0.95×2+2.6,解得m =6.7.【答案】 6.74.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料: 日期 12月 1日 12月 2日 12月 3日 12月 4日 12月 5日 温差x (℃) 10 11 13 12 8 发芽y (颗)2325302616该农科所确定的研究方案是:先从这5组数据中选取3组数据求线性回归方程,剩下的2组数据用于回归方程检验.(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(3)请预测温差为14 ℃的发芽数.【解】 (1)由数据求得,x =12,y =27,∑i =13x 2i =434,∑i =13x i y i =977. 由公式求得,b ^=52,a ^=y -b ^x =-3.所以y 关于x 的线性回归方程为y ^=52x -3. (2)当x =10时,y ^=52×10-3=22,|22-23|<2; 当x =8时,y ^=52×8-3=17,|17-16|<2. 所以该研究所得到的线性回归方程是可靠的. (3)当x =14时,有y ^=52×14-3=35-3=32, 所以当温差为14 ℃时的发芽数约为32颗.。

最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》主动成长

最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》主动成长

主动成长夯基达标1.若回归直线方程中的回归系数b =0时,则相关系数( ) A.R =1 B.R =-1 C.R =0D.无法确定解析:b =()∑∑==---ni i ni i ix x yy x x121)()(,R =()∑∑∑===-⋅---ni i n i ini i iy y x xyy x x12121)()()(,若b =0,则R =0.答案:C2.若某地财政收入x 与支出Y 满足线性回归方程Y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( ) A.10亿 B.9亿 C.10.5亿 D.9.5亿解析:代入数据y =10+e ,因为|e |<0.5,所以|y |≤10.5,故不会超过10.5亿. 答案:CA.yˆ=0.56x ˆ+997.4 B.yˆ=0.63x ˆ-231.2 C.yˆ=50.2x ˆ+501.4 D.yˆ=60.4x ˆ+400.7 解析:直接使用回归直线方程的系数公式即可.答案:A4.对相关系数R ,下列说法正确的是( ) A.|R |越大,相关程度越大 B.|R |越小,相关程度越大 C.|R |大小与相关程度无关D.|R |≤1且|R |越接近1,相关程度越大,|R |越接近0,相关程度越小解析:由两个变量的相关系数公式可知相关程度的强弱与|R |与1的接近程度有关,|R |越接近1,相关程度越大,|R |越接近0,相关程度越小. 答案:D5.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由此得到回归直线的斜率是 .解析:代入b =()∑∑==---ni ini i ix xyy x x121)()(即可求出.答案:0.880 96.用身高(cm )预报体重(K g )满足y ˆ=0.849x -85.712,若要找到41.638 K g 的人, 是在150 cm 中.解析:体重不只受身高的影响,还可能受其他因素的影响. 答案:不一定两变量的回归直线方程为 ,该函数模型的残差平方和为 ,相关指数为 .解析:方程可由计算器直接算得,残差平方和:∑=-ni iyy12)ˆ(=126.34. 相关指数:R 2=1-()∑∑==--ni ini iyyy y 1212)ˆ(=0.957.答案: yˆ=0.817x +9.5 126.34 0.957 8.对于一组数据的两个函数模型,其残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选 .解析:残差平方和越小,函数模型对数据拟合效果越好,反之,残差平方和越大,函数模型对数据拟合程度越差. 答案:第一种9.若某函数模型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为 ,回归平方和为 .解析:由题中条件可知残差平方和占总偏差平方和的比例为1-0.95=0.05, 所以总偏差平方和05.089=1 780,回归平方和为1 780×0.95=1 691或1 780-89=1 691. 答案:1 780 1 691 走近高考1.(2004浙江杭州中考)2003年春季,我国部分地区SARS 流行,党和政府采取果断措施,防治结合,很快使病情得到控制,下表是某同学记载的5月1日至5月12日每天北京市SARS图1-1-3下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②若日期与人数具有线性相关关系,则相关系数R与临界值R0.05应满足|R|>R0.05;③根据此散点图,可以判断日期与人数具有一次函数关系.其中正确的个数为( )A.0B.1C.2D.3答案:C2.下表是1957年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,Y表示相应的年均价格,求关于的回归方程.由散点图看出y与x呈指数关系,于是令z=ln y.变换后得数据:由图可知,各点基本上处于一直线,由表中数据可得线性回归方程zˆ=8.165-0.297x.因此旧车的平均价格对使用年数的非线性回归方程为yˆ=e8.165-0.297x.求关于的非线性回归方程.解:根据收集数据,作散点图.根据已有函数知识,发现样本点分布在某一条指数函数周围,Y =c 1e c 2x(其中c 1,c 2是待定参数).令z =ln y ,则有y =e z, ∴e z =e lnc 1+c 2x. z =c 2x +ln c 1=bx +a ,由散点图可知,与线性相关,故采用一元线性回归模型,由表中数算得:x =1 954,L xz =∑=-ni i x x 1)((z i -z )=1.23,z =11.01,L xx =∑=-ni i x x 12)(=60.∴b =xxxzL L ≈0.021. a =z -b x =-30.02.∴zˆ=a +bx =0.021x -30.02, 即ln y =0.021x -30.02.∴y =e 0.021x -30.02.因此,所求非线性回归方程为y =e 0.021x -30.02.点评:有些非线性的回归问题可化为线性问题来考虑,通过变换变量来实现.。

数学新人教A版选修1-211回归分析的基本思想及其初步应用(同步练习)

数学新人教A版选修1-211回归分析的基本思想及其初步应用(同步练习)

1.1 回归分析的根本思想及其初步应用例题:1. 在画两个变量的散点图时,下面哪个表达是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B )解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上解析:通常把自变量x 称为解析变量,因变量y 称为预报变量.选B2. 假设一组观测值〔x 1,y 1〕〔x 2,y 2〕…〔x n ,y n 〕之间满足y i =bx i +a+e i (i=1、2. …n)假设e i 恒为0,那么R 2为解析: e i 恒为0,说明随机误差对y i 奉献为0. 答案:1.x 2 3 4 5 6 y 22 38556570〔1〕线性回归方程;〔2〕估计使用年限为10年时,维修费用是多少? 解:〔1〕列表如下: i 1 23 4 5 i x2 3 4 5 6 i y 2238556570i i y x 441142203254202i x491625 364=x , 5=y , 90512=∑=i ix , 3.11251=∑=i i i y x于是23.145905453.112552251251=⨯-⨯⨯-=--=∑∑==xx yx yx b i i i ii , ∴线性回归方程为:08.023.1^+=+=x a bx y 〔2〕当x=10时,38.1208.01023.1^=+⨯=y 〔万元〕 即估计使用10年时维修费用是1238万元 课后练习:1. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,那么正确的表达是〔 〕 A.身高一定是145.83cm; B.身高在145.83cm 以上;C.身高在145.83cm 以下;D.身高在145.83cm 左右.2. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为0.98 B.模型2的相关指数2R 为0.80 C.模型3的相关指数2R 为0.50D.模型4的相关指数2R 为0.253.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和C.回归平方和D.相关指数R 24.工人月工资〔元〕依劳动生产率〔千元〕变化的回归直线方程为ˆ6090y x =+,以下判断正确的选项是〔〕 A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元5.线性回归模型y=bx+a+e 中,b=_______,a=_________e 称为_________6. 假设有一组数据的总偏差平方和为100,相关指数为0.5,那么期残差平方和为_______ 回归平方和为____________7. 一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:转速x(转/秒) 16 1412 8每小时生产有缺点的零件数y 〔件〕 11 9 8 5〔1〕变量y 对x 进行相关性检验; 〔2〕如果y 对x 有线性相关关系,求回归直线方程; 〔3〕假设实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?第一章:统计案例答案1.1 回归分析的根本思想及其初步应用1. D2.A3.B4.C5.a=ˆy bx-,e 称为随机误差 6. 50,507. 〔1〕r=0.995,所以y 与x 有线性性相关关系 〔3〕x 小于等于14.9013。

(测试)高中数学人教版选修1-2(文科) 第一章 统计案例 1.1 回归

(测试)高中数学人教版选修1-2(文科) 第一章 统计案例 1.1 回归

高中数学人教版选修1-2(文科)第一章统计案例 1.1 回归分析的基本思想及其初步应用(I)卷姓名:________ 班级:________ 成绩:________一、单选题 (共8题;共16分)1. (2分)关于回归分析,下列说法错误的是()A . 回归分析是研究两个具有相关关系的变量的方法B . 线性相关系数可以是正的或负的C . 回归模型中一定存在随机误差D . 散点图能明确反映变量间的关系2. (2分)对变量与,分别选择了4个不同的回归方程甲、乙、丙、丁,它们的相关系数分别为: ,, , . 其中拟合效果最好的是方程().A . 甲B . 乙C . 丙D . 丁3. (2分) (2017高二下·石家庄期末) 已知回归方程为: =3﹣2x,若解释变量增加1个单位,则预报变量平均()A . 增加2个单位B . 减少2个单位C . 增加3个单位D . 减少3个单位4. (2分)实验测得四组的值分别为,则y关于x的线性回归方程必过点()A . (2,8)B . (2.5,8)C . (10,31)D . (2.5,7.75)5. (2分)样本点的样本中心与回归直线的关系()A . 在直线上B . 在直线左上方C . 在直线右下方D . 在直线外6. (2分)已知x与y之间的数据如下表所示,x 1.08 1.12 1.20 1.32y 2.25 2.36 2.40 2.55则y与x之间的线性回归方程过点()A . (0,0)B . (1.18,0)C . (0,2.39)D . (1.18,2.39)7. (2分) (2020高二上·湖南月考) 党的十九大报告中指出:从2020年到2035年,在全面建成小康社会的基础上,再奋斗15年,基本实现社会主义现代化.若到2035年底我国人口数量增长至14.4亿,由2013年到2019年的统计数据可得国内生产总值()(单位:万亿元)关于年份代号的回归方程为(),由回归方程预测我国在2035年底人均国内生产总值(单位:万元)约为()A . 14.04B . 202.16C . 13.58D . 140508. (2分) (2018高二下·舒城期末) 下列说法中正确的是()①相关系数用来衡量两个变量之间线性关系的强弱,越接近于,相关性越弱;②回归直线一定经过样本点的中心;③随机误差满足,其方差的大小用来衡量预报的精确度;④相关指数用来刻画回归的效果,越小,说明模型的拟合效果越好.A . ①②B . ③④C . ①④D . ②③二、填空题 (共3题;共3分)9. (1分) (2017高二上·佳木斯期末) 在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:价格99.51010.511销售量1110865由散点图可知,销售量与价格之间有较好的线性相关关系,其线性回归方程是:,则________.10. (1分) (2020高二上·新疆月考) 已知变量x,y线性相关,其一组数据如下表所示.若根据这组数据求得y关于x的线性回归方程为,则 ________.x1245y 5.49.610.614.411. (1分) (2018高二下·遵化期中) 某高中随机选取5名高三男生,其身高和体重的数据如下表所示:根据上表可得回归直线方程,根据模型预测身高为174厘米高三男生体重为________三、解答题 (共3题;共25分)12. (5分)研究性学习小组为了解某生活小区居民用水量y(吨)与气温x(℃)之间的关系,随机统计并制作了5天该小区居民用水量与当天气温的对应表:日期9月5日10月3日10月8日11月16日12月21日气温x(℃)1815119﹣3用水量y(吨)5746363724(Ⅰ)若从这随机统计的5天中任取2天,求这2天中有且只有1天用水量低于40吨的概率(列出所有的基本事件);(Ⅱ)由表中数据求得线性回归方程=x+中的,试求出的值,并预测当地气温为5℃时,该生活小区的用水量.13. (10分) (2019高二下·蕉岭月考) 为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下表格:日期4月1日4月7日4月15日4月21日4月30日温差x/℃101113128发芽数y/颗2325302616参考公式: ,参考数据:(1)从这5天中任选2天,记发芽的种子数分别为 ,求事件“ 均不小于25”的概率;(2)若由线性回归方程得到的估计数据与月份所选5天的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的. 请根据4月7日,4月15日与4月21日这三天的数据,求出关于的线性回归方程,并判定所得的线性回归方程是否可靠?14. (10分)假设某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:x23456y 2.2 3.8 5.5 6.57.0试求:(1) y与x之间的回归方程;(2)当使用年限为10年时,估计维修费用是多少?参考答案一、单选题 (共8题;共16分)答案:1-1、考点:解析:答案:2-1、考点:解析:答案:3-1、考点:解析:答案:4-1、考点:解析:答案:5-1、考点:解析:答案:6-1、考点:解析:答案:7-1、考点:解析:答案:8-1、考点:解析:二、填空题 (共3题;共3分)答案:9-1、考点:解析:答案:10-1、考点:解析:答案:11-1、考点:解析:三、解答题 (共3题;共25分)答案:12-1、考点:解析:答案:13-1、略答案:13-2、考点:解析:答案:14-1、答案:14-2、考点:解析:第11 页共11 页。

最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》课后训练2

最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》课后训练2

1.1 回归分析的基本思想及其初步应用练习1.下列两个变量之间的关系是相关关系的是( ) A .正方体的棱长和体积 B .角的弧度数和它的正弦值 C .速度一定时的路程和时间 D .日照时间与水稻的亩产量2.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归方程 y =bx +a 必过样本点的中心(x ,y )B .残差点较均匀地落在水平的带状区域中的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好D .样本点散布在回归直线附近的原因是随机误差的存在3.设有一个回归方程为 y =2-2.5x ,如果变量x 增加一个单位,则( )A .y 平均增加2.5个单位B .y 平均增加2个单位C .y 平均减少2.5个单位D .y 平均减少2个单位4.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 5.甲、乙、丙、丁4位同学各自对A ,B 两变量做回归分析,分别得到散点图与残差平方和21()niii y y =-∑如下表:115106124103哪位同学的试验结果体现拟合A 两变量关系的模型拟合精度高?( )A .甲B .乙C .丙D .丁6.下表是某厂1~4月份用水量(单位:百吨)的一组数据,由某散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是y =-0.7x + a ,则 a=__________.7.身高x (cm)和体重y (kg)满足线性回归方程 y =0.849x -85.712,若某人的体重为41.633 kg ,则身高应为__________cm.(精确到1 cm)为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲 y =6.5x +17.5,乙 y =7x +17,则模型__________(填“甲”或“乙”)拟合的效果更好.9.有一位同学家里开了一个小卖部,他为了研究气温对热茶销售杯数的影响,经过统(2)预测气温为-10 ℃时热茶的销售杯数.10.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)的有关统计资料如下表所示:若由资料知y 对x 呈线性相关关系.试求:(1)线性回归方程 y bxa =+ 的回归系数 a ,b ; (2)求相关指数R 2;(3)估计使用年限为10年时,维修费用是多少?参考答案1. 答案:D 因为相关关系就是两个变量之间的一种非确定性关系,故可由两个变量之间的关系确定答案.选项A ,B ,C 均为确定性关系,即函数关系,而选项D 中日照时间与亩产量的关系是不确定的,故选D.2. 答案:C R 2越大,说明模型的拟合效果越好,故选C.3. 答案:C ∵ y =2-2.5x ,即b=-2.5, ∴当变量x 增加一个单位时,y 平均减少2.5个单位.故选C.4. 答案:C 观察图象易知选项C 正确.5. 答案:D 根据线性相关的知识,散点图中各样本点带状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2表达式中21()nii y y =-∑为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D.6. 答案:5.25 ∵x =2.5,y =3.5,b =-0.7, ∴ a=3.5+0.7×2.5=5.25. 7. 答案:150 由 y =0.849x -85.712=41.633,解得x ≈150. 8. 答案:甲 设甲模型的相关指数为21R ,则25251251()155111000()iii ii y y R y y ==-=-=--∑∑=0.845; 设乙模型的相关指数为22R ,则2218011000R =-=0.82. 因为21R >22R ,所以甲模型拟合效果更好.9. 分析:根据样本点数据画出散点图,利用散点图直观分析热茶销售杯数y 与气温x 具有线性相关关系,利用线性回归方程中参数的计算公式可得线性回归方程.解:(1)所给数据的散点图如图所示.由图可看出,这些点在一条直线附近,可以用线性回归方程来刻画y 与x 之间的关系.因为x =16911,y =122811, 由公式计算得b≈-2.352, a y bx =- ≈147.772, 所以y 对x 的线性回归方程为 y =-2.352x +147.772.(2)当气温为-10 ℃时,由回归方程可以预报热茶的销售杯数为 y =-2.352×(-10)+147.772=171.292≈171.由此可得x =4,y =5,51521()()()iii ii x x y y bx x ==--=-∑∑ =1.23,ay bx =- =5-1.23×4=0.08, 故 y =1.23x +0.08.(2)R 2=251521()1()iii ii y y y y ==---∑∑=0.651115.78-≈0.958 7. (3)回归直线方程为 y =1.23x +0.08,当x =10时, y =1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.。

人教课标版高中数学选修1-2《回归分析的初步思想及其基本应用》基础训练

人教课标版高中数学选修1-2《回归分析的初步思想及其基本应用》基础训练

《回归分析的初步思想及其基本应用》基础过关题组一 变量之间的相关关系 1.对变量x y 、有观测数据()(),1,2,,10i i x y i =,得散点图①;对变量u v 、有观测数据()(),1,2,,10i i u v i =,得散点图②.由这两个散点图可以判断( )A.变量x 与y 正相关,u 与v 正相关B.变量x 与y 正相关,u 与v 负相关C.变量x 与y 负相关,u 与v 正相关D.变量x 与y 负相关,u 与v 负相关2.某公司在上半年的月收人x (单位:万元)与月支出y (单位:万元)的统计资料如表所示:根据统计资料,得( )A.月收入的中位数是15万元,x 与y 有正相关关系B.月收入的中位数是17万元,x 与y 有负相关关系C.月收人的中位数是16万元,x 与y 有正相关关系D.月收人的中位数是16万元,x 与y 有负相关关系 题组二 线性回归分析3.已知变量x 与y 之间的回归直线方程为32y x ∧=-+,若10117i i x ==∑,则101i i y =∑的值等于( ) A.3B.4C.0.4D.404.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且回归方程为0.6 1.2y x ∧=+.若某城市职工人均工资为5千元, 估计该城市人均消费额占人均工资收人的百分比为( ) A.66% B.67% C.79% D.84%题组三 残差分析5.已知方程0.8582.71y x ∧=-是根据某校女大学生的身高预报体重的回归方程,其中x 的单位是cm ,y ∧的单位是kg ,那么针对某个体(160,53)的残差是____.题组四 相关指数6.在一组样本数据()()()()12,,,,,,2,,,,i i i i n n n x y x y x y n x x x ≥不全相等的散点图中,若所有样本点()(),1,2,i i x y i n =都在直线112y x =+上,则这组样本数据的样本相关指数为( ) A.-l B.0 C.12 D.17.在判断两个变量y 与x 是否相关时,选择了4个不同的模型,模型1的相关指数2R 为0.98,模型2的相关指数2R 为0.85,模型3的相关指数2R 为0.57,模型4的相关指数2R 为0.22.其中拟合效果最好的模型是____. 易错易混题组易混点1相关关系与函数关系8.设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系.根据一组样本数据()(),1,2,i i x y i n =,用最小二乘法建立的回归方程为0.8585.71y x ∧=-,则下列结论中不正确的是( )A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(),x yC.若该大学某女生身高增加1cm ,则其体重约增加0.85kgD.若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 9.关于对回归方程 3.57 2.13y x ∧=-的说法中正确的为( ) A.与函数关系式 3.57 2.13y x =-等同 B.该回归方程对应的直线的斜率为2.13 C.当1x =时, 1.44y = D.y 与x 具有负相关关系易混点 准确理解两个变量之间是否存在确定性关系是区分相关关系和函数关系的关键.利用回归直线方程进行预测时,预报值不一定是预报变量的精确值,不能将预报变量的预报值与真实值相混淆. 易混点2 回归直线方程与普通直线方程10.某产品的广告费用x 与y 销售额的统计数据如下表:根据上表可得回归方程y b x a ∧∧∧=+中的b ∧为9.4,据此模型预测广告费用为6万元时销售额为( ) A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元11. 为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立进行了10次和15次试验,并且利用线性回归方法,求得回归直线分别为12l l 、.已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( ) A.1l 和2l 必定平行 B.1l 和2l 必定重合C.1l 和2l —定有公共点(),s tD.1l 与2l 相交,但交点不一定是(),s t12.—个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:由表中数据,求得线性回归方程y b x a ∧∧∧=+,已知回归直线在y 轴上的截距为56.5,根据回归方程,预测加工102分钟的零件个数约为____.参考答案 1.答案:C解析:题图①中的数据y 随x 的增大而减小,因此变量x 与y 负相关;题图②中的数据v 随u 的增大而增大,因此变量u 与v 正相关,故选C. 2.答案:C解析:月收入的中位数是1517162+=,由表可知随月收入的增加,月支出增加,故x 与y 有正相关关系,故选C. 3.答案:B解析:依题意171.710x ==,而直线32y x ∧=-+一定经过样本点的中心(),x y ,所以3232 1.70.4y x ∧=-+=-+⨯=,所以710.4104i i y ==⨯=∑.4.答案:D 解析:y 与x 具有线性相关关系,满足回归方程0.6 1.2y x ∧=+,该城市职工人均工资为5千元,5,x ∴=∴可以估计该城市的职工人均消费额j 0.65 1.2 4.2,y =⨯+=∴可以估计该城市人均消费额占人均工资收人的百分比4.284%5=. 5.答案:见解析解析:将160x =代入0.8582.71y x ∧=-,得0.8516082.7153.29y ∧=⨯-=,所以残差5353.290.29e y y ∧∧=-=-=-. 6.答案:D解析:因为所有样本点都在直线112y x =+上,所以这组样本数据完全正相关,故其相关指数为1. 7.答案:见解析解析:相关指数2R 能够刻画用回归模型拟合数据的效果,相关指数2R 的值越接近于1,说明回归模型拟合数据的效果越好. 8.答案:D解析:由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确;又线性回归方程必过样本点的中心(),x y ,故B 正确;由线性回归方程中系数的意义知,身高每增加1cm ,其体重约增加0.85kg ,故C 正确;当某女生的身高为170cm 时,其体重的估计值是58.79kg ,而不是具体值,故D 不正确. 9.答案:D解析:根据回归直线方程的性质,并结合相关关系与函数关系知,只有选项D 符合题意. 10.答案:B解析:由表中数据可得()()114235 3.5,492639544244x y =⨯+++==⨯+++=.又9.4b ∧=,所以429.4 3.59.1a y b x ∧∧=-=-⨯=,故回归方程为9.49.1y x ∧=+.当6x =时,9.469.165.5y ∧=⨯+=,故选 B. 11.答案:C解析:回归直线必经过样本点的中心. 12.答案:见解析解析:回归直线在y 轴上的截距为56.5,56.5,a ∧∴=∴线性回归方程为56.5y b x ∧∧=+.又由表中数据知1020304050646975829030,7655x y ++++++++====,把(30,76)代入回归方程,得763056.5b ∧=+,解得0.65,b ∧=∴回归直线方程为0.6556.5y x ∧=+.当102y ∧=时,70x =,故预测加工102分钟的零件个数约为70.。

高中数学1.1回归分析的基本思想及其初步应用练习新人教A版选修1-2

高中数学1.1回归分析的基本思想及其初步应用练习新人教A版选修1-2

第一章 1.1 回归分析的基本思想及其初步应用一、选择题1.对变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u 、v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 [答案] C[解析] 图1中的数据y 随x 的增大而减小,因此变量x 与y 负相关;图2中的数据随着u 的增大,v 也增大,因此变量u 与v 正相关,故选C .2.已知x 和y 之间的一组数据x 0 1 2 3 y1357则y 与x 的线性回归方程y ^=b x +a 必过点( ) A .(2,2) B .(32,0)C .(1,2)D .(32,4)[答案] D[解析] ∵x -=14(0+1+2+3)=32,y -=14(1+3+5+7)=4,∴回归方程y ^=b ^x +a ^必过点(32,4). 3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ) A .y ^=-10x +200 B .y ^=10x +200 C .y ^=-10x -200 D .y ^=10x -200[答案] A[解析] 本题主要考查变量的相关性.由负相关的定义排除B ,D ,由x =1时,y >0排除C .4.已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要__________h .( )A .6.5B .5.5C .3.5D .0.5[答案] A[解析] 将x =600代入回归方程即得A . 5.关于随机误差产生的原因分析正确的是( ) (1)用线性回归模型来近似真实模型所引起的误差; (2)忽略某些因素的影响所产生的误差; (3)对样本数据观测时产生的误差; (4)计算错误所产生的误差. A .(1)(2)(4) B .(1)(3) C .(2)(4) D .(1)(2)(3)[答案] D[解析] 理解线性回归模型y =bx +a +e 中随机误差e 的含义是解决此问题的关键,随机误差可能由于观测工具及技术产生,也可能因忽略某些因素产生,也可以是回归模型产生,但不是计算错误.6.(2015·青岛高二检测)在下列各组量中:①正方体的体积与棱长;②一块农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是( )A .①②B .②④C .③④D .②③④[答案] D[解析] ①是函数关系V =a 3;⑤电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系.②③④中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系.二、填空题7.回归分析是处理变量之间________关系的一种数量统计方法. [答案] 相关[解析] 回归分析是处理变量之间相关关系的一种数量统计方法. 8.已知x 、y 的取值如下表:若x 、y 具有线性相关关系,且回归方程为y =0.95x +a ,则a 的值为________. [答案] 2.6[解析] 由已知得x -=2,y -=4.5,而回归方程过点(x -,y -),则4.5=0.95×2+a , ∴a =2.6.9.当建立了多个模型来拟合某一组数据时,为了比较各个模型的拟合效果,我们可以通过计算________来确定.(1)残差平方和 (2)相关指数R 2(3)相关系数r [答案] (1)(2) 三、解答题10.(2015·沈阳联考)某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:(1)以工作年限为自变量,推销金额为因变量y ,作出散点图; (2)求年推销金额y 关于工作年限x 的线性回归方程;(3)若第6名推销员的工作年限为11年,试估计他的年推销金额. [解析] (1)依题意,画出散点图如图所示,(2)从散点图可以看出,这些点大致在一条直线附近,设所求的线性回归方程为y ^=b ^x +a ^.则b ^=∑i =15x i -x -y i -y-∑i =15x i -x-2=1020=0.5,a ^=y --b ^x -=0.4, ∴年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4. (3)由(2)可知,当x =11时, y ^=0.5x +0.4=0.5×11+0.4=5.9(万元).∴可以估计第6名推销员的年销售金额为5.9万元.一、选择题1.(2015·福建理)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)6.27.58.08.59.8根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元[答案] B [解析] x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,a ^=y -b ^x =8-0.76×10=0.4,所以当x =15时,y ^=b ^x +a ^=11.8.2.甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:) A .甲 B .乙 C .丙 D .丁[答案] D[解析] r 越接近1,相关性越强,残差平方和m 越小,相关性越强,故选D . 3.由一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=b ^x +a ^,则下列说法不正确的是( )A .直线y ^=b ^x +a ^必过点(x ,y )B .直线y ^=b ^x +a ^至少经过点(x 1,y 1)(x 2,y 2)……(x n ,y n )中的一个点C .直线y ^=b ^x +a ^的斜率为∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2D .直线y ^=b ^x +a ^和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差是该坐标平面上所有直线与这些点的偏差中最小的直线[答案] B4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:) A .y =2x -2B .y =(12)xC .y =log 2xD .y =12(x 2-1)[答案] D[解析] 可以代入检验,当x 取相应的值时,所求y 与已知y 相差平方和最小的便是拟合程度最高的.二、填空题5.已知线性回归方程y ^=0.75x +0.7,则x =11时,y 的估计值是________. [答案] 8.95[解析] 将x =11代入y ^=0.75x +0.7,求得y ^=8.25+0.7=8.95.6.某市居民2011~2015年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表:出有________线性相关关系.[答案] 13 正[解析] 把2011~2015年家庭年平均收入按从小到大顺序排列为11.5,12.1,13,13.3,15,因此中位数为13(万元),由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题7.(2015·重庆文)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 附:回归方程y ^=b ^t +a ^中,b ^=∑i =1nt i y i -n t y∑i =1nt 2i -n t 2,a ^=y -b ^t .[解析] (1)5i =1由上表,t =3,y =365=7.2,∑i =15t 2i =55,∑i =15t i y i =120.∴b ^=120-5×3×7.255-5×9=1.2.a ^=y -b ^t =7.2-1.2×3=3.6.∴所求回归直线方程y ^=1.2t +3.6.(2)当t =6时,代入y ^=1.2×6+3.6=10.8(千亿元). ∴预测该地区2015年的人民币储蓄存款为10.8千亿元.8.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 2时的销售价格. [解析] (1)数据对应的散点图如下图所示:(2)x =15∑5 i =1x i =109,l xx =∑5i =1 (x i -x )2=1 570, y =23.2,l xy =∑5i =1 (x i -x )(y i -y )=308.设所求回归直线方程为y ^=b ^x +a ^,则b ^=l xy l xx =3081 570≈0.196 2,a ^=y -b ^x =1.816 6.故所求回归直线方程为y ^=0.196 2x +1.816 6. (3)据(2),当x =150m 2时,销售价格的估计值为 y ^=0.196 2×150+1.816 6=31.246 6(万元).。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

更上一层楼
基础·巩固
1.下列说法中错误的是( )
A.如果变量η与ξ之间存在着线性相关关系,则我们根据实验数据得到的点(x i ,y i )(i=1,2, …,n)将散布在某一条直线的附近
B.如果两个变量η与ξ之间不存在着线性相关关系,那么根据它们的一组数据(x i ,y i )(i=1,2, …,n)不能写出一个线性方程
C.设x,y 是具有相关关系的两个变量,且x 关于y 的线性回归方程为y ˆ=bx+a ,b 叫做回归系

D.为使求出的线性回归方程有意义,可用统计假设检验的方法来判定变量η与ξ之间是否存在线性相关关系
思路解析:依据线性相关的基本思想来逐个分析.如果两个变量η与ξ之间不存在着线性相关关系,可以转换为线性相关问题,故B 错误.其他几个选项由线性回归的基本思想可以得出.
答案:B
A.(0,0)
B.(x ,0)
C.(0,y )
D.(x ,y )
思路解析:由线性回归方程的求解过程及意义来解.代入点(y x ,),方程b x a y
ˆˆˆ+=成立. 答案:D
3.某化工厂为预测某产品的回收率y ,需要研究它的原料有效成分含量x 之间的相关关系,现取了8对观察值,计算得
∑=8
1
i i
x
=1x i =52,
∑=81
i i y =228,∑=8
1
2i i
x
=478,
∑=8
1
i i
i y
x =1 849,
则y
ˆ对x 的回归直线方程为( ) A.y
ˆ=11.47+2.62x B.y ˆ=-11.47+2.62x C.y
ˆ=2.62+11.47x D.y ˆ=11.47-2.62x 思路解析:将所得的数据代入b
ˆ=∑∑==--n
i i
n
i i
i x n x
y
x n y
x 1
2
21
计算.
b
ˆ=2
2)
8
52(4478228
52)81
(41849⨯-⨯⨯⨯-≈2.62,a ˆ=11.47.
答案:A
4.下列两个变量之间的关系,不是函数关系的是( )
A.角度和它的余弦值
B.正方形的边长与面积
C.正n 边形的边数和顶点角度之和
D.人的年龄和身高
思路解析:是否为函数关系主要取决于能否用一个准确的函数关系表示出它们来.A 、B 、C 中都存在一个确定的函数关系,只有人的年龄与身高不存在. 答案:D 综合·应用
5.为了考察两个变量y 与x 的线性相关性,测得x,y 的13对数据,若y 与x 有线性相关关系,则相关系数r 的取值范围是________________.
思路解析:这是相关性检验涉及的问题,应由相关性检验的临界值表查得自由度为13-2=11时的r 0.05得出结论.当自由度n-2=11时查表得r 0.05=0.553,又因为其是相关关系,所以r 的范围为(0.553,1). 答案:(0.553,1)
6.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响到冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x 与冶炼时间y(从炉
(2)如果y 与x 具有线性相关关系,求回归直线方程.
(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?
思路解析:求出相关性系数r 进行相关性检验,再利用公式求解.
于是查表得相应于显著水平0.05和n-2的相关系数临界值r 0.05=0.632.
代入公式得r,由r >r 0.05知y 与x 具有线性相关关系.
(2)设所求的回归直线方程为a x b y ˆˆˆ+=,其中b
ˆ=∑∑==--10
1
2
210
1
1010i i
i i
i x x
y x y
x ,得b ˆ=1.267,∴a
ˆ=-30.51. 所以所求的线性回归方程为y=1.267x-30.51.
(3)当x=160时,y=1.267×160-30.51≈172 min,即大约冶炼172 min.。

相关文档
最新文档