2014年高中数学 第一章 统计 相关性与最小二乘估计训练 北师大版必修3
北师大版高中数学必修三最小二乘估计同步练习必修三.docx
最小二乘估计同步练习◆知识检测1.5个学生的数学和物理成绩如下表:学生 A B C D E学科数学80 75 70 65 60物理70 66 68 64 62画出散点图,并判断它们是否有相关关系。
2.在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg):施化肥量15 20 25 30 35 40 45x水稻产量330 345 365 405 445 450 455y(1)在图1-8-1中画出散点图;(2)试判断施化肥量x与水稻产量y是否线性相关?3.对于线性回归方程25=xy,当28.4+.275x时,y的估计值是_______.=4.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据.x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.871.982.07y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.263.36 3.50(1)画出散点图;(2)判断x与y是否具有线性相关关系?若有,求出月总成本y与月产量x之间的回归直线方程.◆能力提高1.工人月工资(元)依劳动生产率(千元)变化的回归方程为x=,50+y80下列判断正确的是()A.劳动生产率为1000元时工资为130元B.劳动生产率提高1000元时,工资提高80元C.劳动生产率提高1000元时,工资提高130元D.当月工资为210元时,劳动生产率为2000元2.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用最小二乘法,求得回归方程所对应的直线分别为和1l 2l ,已知两个人在试验中发现对变量x 的观测数据的平均值为S ,对变量y 的观测数据的平均值为t ,那么下列说法正确的是( )A .有交点与21l l (S ,t )B .有交点与21l l ,但交点不一定是(S ,t )C .和1l 2l 必定平行D .和1l 2l 必定重合3. 一机器可以按各种不同的速度运转,其生产的物件有一些会有缺点,每小时生产有缺点物件的多少,随机器运转的速度而变化,下列为其试验结果:则机器速度的影响每小时生产有缺点物件数和回归线性方程为___________.4. 已知某宠物医院要对狗的血液某项指标进行检测,已测得10只狗的血球体积及红血球数的值如下表:(1) 画出上表的散点图;(2) 求出回归直线并画出图形.5. 1907年一项关于16艘轮船的研究中,船的吨位区间为192吨到3246吨,船员的数目从5人到32人,船员人数关于船的吨位的回归分析得到如下结果:船员人数=吨位⨯+0062.05.9.(1) 假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2) 对于最小的船估计的船员数是多少?对于最大的船估计的船员数是多少?◆技能培养1.有人说:“人的两臂平伸,两中指尖之间的距离就等于这人的身高。
高中数学北师大版必修三学案:第一章 统计 8 最小二乘估计
[学习目标]1.了解最小二乘法.2.理解线性回归方程的求法.3.掌握线性回归方程的意义.知识点一最小二乘法1.定义:如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用下面的表达式来刻画这些点与直线y =a +bx 的接近程度:[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2.使得上式达到最小值的直线y =a +bx 就是我们所要求的直线,这种方法称为最小二乘法. 2.应用:利用最小二乘法估计时,要先作出数据的散点图.如果散点图呈现出线性关系,可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,我们就要利用其他的工具进行拟合. 知识点二回归直线的求法 1.回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.回归方程与最小二乘法我们用y i -y ^i 来刻画实际观察值y i (i =1,2,…,n )与y ^i 的偏离程度,y i -y ^i 越小,偏离越小,直线就越贴近已知点.我们希望y i -y ^i 的n 个差构成的总的差量越小越好,这才说明所找的直线是最贴近已知点的.由于把y i -y ^i 这个差量作和会使差量中的正负值相互抵消,因此我们用这些差量的平方和即Q =i =1n (y i -a -bx i )2作为总差量,回归直线就是所有直线中Q 取最小值的那一条.因为平方又叫二乘方,所以这种使“差量平方和最小”的方法叫做最小二乘法.用最小二乘法求回归方程中的a ^,b ^有下面的公式:⎩⎪⎨⎪⎧b ^=i =1n (x i -x )(y i-y )i =1n (x i -x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x ,其中x =1n ∑i =1n x i ,y =1n ∑i =1ny i .这样,回归方程的斜率为b ^,截距为a ^,即回归方程为y ^=b ^x +a ^. 思考任何一组数据都可以由最小二乘法得出回归方程吗?答用最小二乘法求回归方程的前提是先判断所给数据具有线性相关关系(可利用散点图来判断),否则求出的回归方程是无意义的.题型一变量间相关关系的判断例1某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1)画出散点图; (2)求回归方程. 解(1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.于是可得,b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=1380-5×5×50145-5×52=6.5,a ^=y -b ^x =50-6.5×5=17.5.于是所求的回归方程是y ^=6.5x +17.5. 反思与感悟1.求回归方程的步骤 (1)列表x i ,y i ,x i y i . (2)计算x ,y ,∑i =1nx 2i ,∑i =1ny 2i ,∑i =1nx i y i .(3)代入公式计算b ^,a ^的值.(4)写出回归方程y ^=a ^+b ^x . 2.求回归方程的适用条件两个变量具有线性相关性,若题目没有说明相关性,则必须对两个变量进行相关性判断.跟踪训练1某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:已知记忆力x 和判断力y 解x =6+8+10+124=9,y =2+3+5+64=4,∑4i =1x 2i =62+82+102+122=344, ∑4i =1x i y i =6×2+8×3+10×5+12×6=158,b =158-4×9×4344-4×81=1420=0.7,a =y -b x =4-0.7×9=-2.3. 则所求的线性回归方程为y =0.7x -2.3. 题型二利用线性回归方程对总体进行估计例2有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.解(1)散点图如图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程y=-2.352x+147.772.(4)当x=2时,y=143.068.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.反思与感悟用线性回归方程进行数据拟合的一般步骤是:(1)把数据列成表格;(2)作散点图;(3)判断是否线性相关;(4)若线性相关,求出系数b,a的值(一般也列成表格的形式,用计算器或计算机计算);(5)写出回归直线方程y=a+b x.跟踪训练22014年元旦前夕,某市统计局统计了该市2013年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)解(1)依题意可计算得:x =6,y =1.83,x 2=36, x y =10.98,又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b =∑i =110x i y i -10x y∑i =110x 2i -10x 2≈0.17,a =y -b x =0.81,∴y =0.17x +0.81.∴所求的线性回归方程为y =0.17x +0.81. (2)当x =9时,y =0.17×9+0.81=2.34.可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.1.炼钢时钢水的含碳量与冶炼时间有() A .确定性关系B .相关关系 C .函数关系D .无任何关系 答案B解析炼钢时钢水的含碳量除了与冶炼时间有关外,还受冶炼温度等的影响,故为相关关系.2.设有一个回归方程为y ^=-1.5x +2,则变量x 增加一个单位时() A .y 平均增加1.5个单位B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位 答案C解析∵两个变量线性负相关,∴变量x 增加一个单位,y 平均减少1.5个单位.3.某商品的销售量y (单位:件)与销售价格x (单位:元/件)负相关,则其回归方程可能是()A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200D.y ^=10x -200 答案A解析结合图象(图略),知选项B ,D 为正相关,选项C 不符合实际意义,只有选项A 正确. 4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 答案D解析当x =170时,y ^=0.85×170-85.71=58.79,体重的估计值为58.79kg.5.正常情况下,年龄在18岁到38岁的人,体重y (kg)对身高x (cm)的回归方程为y ^=0.72x -58.2,张明同学(20岁)身高178cm ,他的体重应该在________kg 左右. 答案69.96解析用回归方程对身高为178cm 的人的体重进行预测,当x =178时,y ^=0.72×178-58.2=69.96(kg).1.判断变量之间有无相关关系,简便可行的方法就是绘制散点图.根据散点图,可看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关. 2.求回归直线的方程时应注意的问题(1)知道x 与y 呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^、b ^的值时,要先算出b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.。
北师大版高中数学必修三第一章《统计》测试卷(包含答案解析)(1)
一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
高中数学 第一章 统计 1.71.8 相关性 最小二乘估计时
高中数学第一章统计 1.7-1.8 相关性最小二乘估计时课后训练北师大版必修31.有关线性回归方程的说法,不正确的是( ).A.相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.线性回归方程能代表线性相关的两个变量之间的关系D.任一组数据都有线性回归方程2.判断下列图形中具有相关关系的两个变量是哪一个?( ).3.设有一个线性回归方程y=2-1.5x,当变量x增加1个单位时( ).A.y平均增加1.5个单位B.y平均减少1.5个单位C.y平均增加2个单位D.y平均减少2个单位4.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程y=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ).A.83% B.72% C.67% D.66%5.日最低气温与纬度之间具有____关系,球的半径与体积之间具有____关系.6.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖售量为__________杯.7(2)y与x是否呈线性相关关系,若是,求其线性回归方程.参考答案1.答案:D2.答案:C3.答案:B4.答案:A解析:该城市居民人均消费水平7.675=0.66x +1.562,解得x ≈9.2621,则估计该城市人均消费额占人均工资收入的百分比约为7.675100%83%9.2621⨯≈. 5. 答案:相关 函数6. 答案:70解析:根据表格中的数据可求得14x =(18+13+10-1)=10,14y =(24+34+38+64)=40. ∴a y bx =-=40-(-2)×10=60.∴y =-2x +60.当x =-5时,y =-2×(-5)+60=70.7. 解:画出其散点图.观察散点图,可以发现5个样本点都落在一条直线附近,所以变量x 、y 属于线性相关.8. 解:(1)散点图如图所示:(2)由图可以看出y 与x 线性相关.27.5x =,49.5y =,10219 625i i x =∑=,10117 275i i i x y =∑=.设线性回归方程为y =bx +a , 由101102211010i ii i i x y x y b xx ==-⋅=-∑∑1727513612.596257562.5-=-≈1.78, a y bx =-=49.5-1.78×27.5=0.55.故所求线性回归方程为y =1.78x +0.55.。
北师大版高中数学必修3第一章统计-8最小二乘法-典题题库(一)(带详细答案)
北师大版高中数学必修3第一章统计-8最小二乘法-典题题库(一)一、选择题(共47小题,每小题5.0分,共235分)1.已知x,y是两个具有线性相关关系的变量,现有这两个变量的十个样本点(x1,y1)(x2,y 2),…,(x10,y10),同学甲利用最小二乘法得到回归直线l1:=x+,同学乙将十个样本点中的两个点连起来得到拟合直线l2:y=dx+c,则下列判断一定正确的是()A.(yi-bxi-a)2≤(yi-dxi-c)2B.(yi-bxi-a)2≥(yi-dxi-c)2C.|yi-bxi-a|≤|yi-dxi-c|D.|yi-bxi-a|≥|yi-dxi-c|【答案】A【解析】根据最小二乘法得到回归直线l1:=x+,将十个样本点中的两个点连起来得到拟合直线l2:y=dx+c,可得(yi-bxi-a)2≤(yi-dxi-c)2.2.最小二乘法的原理是()A.使得[yi-(a+bxi)]最小B.使得[yi-(a+bxi)2]最小C.使得[-(a+bxi)2]最小D.使得[yi-(a+bxi)]2最小【答案】D【解析】最小二乘法是一种数学优化技术,它通过最小化误差的平方和找到一组数据的最佳函数匹配,是用最简的方法求得一些绝对不可知的真值,而令误差平方之和为最小,∴最小二乘法的原理是使得[yi-(a+bxi)]2最小.3.已知变量xi,yi具有相关关系,其散点图如图所示,则它们分别对应的相关系数ri(i=1,2,3,4)的大小关系是()A.r1>r3>r4>r2B.r3>r1>r2>r4C.r3>r1>r4>r2D.r1>r3>r2>r4【答案】A【解析】由给出的四组数据的散点图可以看出,图1和图3是正相关,相关系数大于0,图2和图4是负相关,相关系数小于0,图1和图2的点相对更加集中,所以相关性要强,所以r1接近于1,r2接近于-1,由此可得r2<r4<r3<r1.4.若变量y与x之间的相关系数r=-0.936 2,则变量y与x之间()A.不具有线性相关关系B.具有线性相关关系C.它们的线性相关关系还需要进一步确定D.不确定【答案】B【解析】∵相关系数的绝对值越大,越具有强大相关性,相关系数r=-0.936 2,相关系数的绝对值约接近1,相关关系较强.5.在由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的点所构成的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-2x+1上,则这组样本数据中变量x,y的相关系数为()A.-2B.-1C. 1D. 2【答案】B【解析】∵直线2x+y-1=0的斜率k=-2,且若所有样本点(xi,yi)(i=1,2,3,…,n)都在直线y =-2x+1上,∴说明这组数据的样本完全负相关,则相关系数达到最小值-1.6.下列说法正确的是()A.相关关系与函数关系都是一种确定关系,也是一种因果关系B.某同学研究卖出的热饮杯数y与气温x之间的关系,得到回归方程=-2.352x+147.767,则气温为2摄氏度时,一定可卖出143杯热饮C.相关系数|r|越大时相关性越强D.相关系数|r|越大时相关性越弱【答案】C【解析】对于A,相关关系不是确定的关系,函数关系是确定的关系,∴A错误;对于B,根据回归方程=-2.352x+147.767得出,气温为2摄氏度时,可能卖出143杯热饮,∴B错误;对于C,相关系数|r|越大,相关性越强,∴C正确;对于D,相关系数|r|越大时相关性越弱是错误的,∴D错误.7.两个变量之间的线性相关程度越低,则其线性相关系数的数值()A.越小B.越接近于-1C.越接近于0D.越接近于1【答案】C【解析】由相关系数r的绝对值越趋近于1,相关性越强;越趋近于0,相关性越弱,可得C正确.8.下列结论正确的是()①相关关系是一种非确定性关系;②任一组数据都有回归方程;③散点图能直观地反映数据的相关程度.A.①②B.②③C.①③D.①②③【答案】C【解析】相关关系的两个变量x,y存在一定的联系,但无法确定具体的关系,∴相关关系是一种非确定性关系,∴①正确;不是任一组数据都有相关关系,∴不一定都有回归方程,∴②错误;根据散点图能直观地反映数据的相关程度,∴③正确.9.对相关系数r,下列说法正确的是()A. |r|越大,线性相关程度越大B. |r|越小,线性相关程度越大C. |r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大D. |r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小【答案】D【解析】两个变量之间的相关系数,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值越接近于0,表示两个变量之间几乎不存在线性相关.10.对于两个变量y和x进行线性相关检验,已知n是观察值组数,r是相关系数,且已知:①n=7,r=0.953 3;②n=15,r=0.301,③n=17,r=0.999 1,④n=3,r=0.9950,则变量y和x具有线性相关关系的是()A.①和②B.①和③C.②和④D.③和④【答案】B【解析】相关系数r的绝对值越大,线性相关程度越大.11.下列说法中正确的是()A.任何两个变量都具有相关关系B.人的知识与其年龄具有相关关系C.散点图中的各点是分散的没有规律D.根据散点图求得的线性回归方程都是有意义的【答案】B【解析】变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系.根据相关变量的定义知A不正确,B正确.在平面直角坐标系中用描点的方法得到的表示具有相关关系的两个变量的一组数据的图形叫做散点图,如果两个变量是线性相关的,散点图中的各点是有规律,线性回归方程最能代表观测值x、y之间的线性相关关系,故C不正确.只有具有线性相关的两个观测值才能得到具有代表意义的线性回归方程,故D不正确.综上可知B正确.12.如图所示,图中有5组数据,去掉某组数据后(填字母代号),剩下的4组数据的线性相关性最强()A.EB.CC.DD.A【答案】A【解析】∵A、B、C、D四点分布在一条直线附近且贴近某一直线,E点离得远.∴去掉E点剩下的4组数据的线性相关性最大.13.下列说法中正确的是()①某地区感染流感人数与外来流感患者人数是具有相关关系的两个变量;②两个变量之间没有确定的函数关系,则这两个变量相关;③如果两个变量之间具有线性相关关系,那么回归直线经过样本中心点;④y与x有相关关系,且线性回归方程为=0.5+2x,则y与x正相关.A.①②③B.①②④C.①③④D.①②③④【答案】C【解析】①某地区感染流感人数与外来流感患者人数存在一定的联系,是具有相关关系的两个变量,∴①正确;②两个变量之间没有确定的函数关系,则这两个变量不一定相关,∴②错误;③如果两个变量之间具有线性相关关系,那么回归直线经过样本中心点,∴③正确;④y与x有相关关系,且线性回归方程为=0.5+2x,回归系数为2>0,则y与x正相关,∴④正确.14.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线=x +及回归系数,可以估计和预测变量的取值和变化趋势.其中正确的命题是()A.①②B.①③C.②③D.①②③【答案】D【解析】线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法,找拟合效果最好的直线,故①正确;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示,故②正确;通过回归直线=x+及回归系数,可以估计和预测变量的取值和变化趋势,故③正确.综上可知①②③正确.15.下列关于线性回归,说法正确的是()①变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到的表示具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x、y之间的线性相关关系;④任何一组观测值都能得到具有代表意义的线性回归方程.A.①②③B.①③④C.②③④D.①②④【答案】A【解析】变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系,根据相关变量的定义知①正确;在平面直角坐标系中用描点的方法得到的表示具有相关关系的两个变量的一组数据的图形叫做散点图,故②正确;线性回归方程最能代表观测值x、y之间的线性相关关系,故③正确;只有具有线性相关的两个观测值才能得到具有代表意义的线性回归方程,故④不正确.综上可知①②③正确.16.小明同学根据下表记录的产量x(吨)与能耗y(吨标准煤)对应的四组数据,用最小二乘法求出了y 关于x的线性回归方程=0.7x+,据此模型预报产量为7万吨时能耗为()A. 5B. 5.25C. 5.5D. 5.75【答案】B【解析】由图表可知==4.5,==3.5,所以样本中心点为(4.5,3.5).把样本中心点代入=0.7x+,得3.5=0.7×4.5+,=0.35.所以线性回归方程为=0.7x+0.35.则预报产量为7万吨时能耗为=0.7×7+0.35=5.25(万吨).17.若根据10名儿童的年龄x(岁)和体重y(kg)数据用最小二乘法得到用年龄预报体重的线性回归方程是=2x+7,已知这10名儿童的年龄分别是2、3、3、5、2、6、7、3、4、5,则这10名儿童的平均体重是()A. 17 kgB. 16 kgC. 15 kgD. 14 kg【答案】C【解析】年龄的平均值为=4,所以中心点坐标为(4,)代入线性回归方程成立,因此=2×4+7=15,即平均体重为15 kg.18.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的线性回归方程为=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg【答案】D【解析】根据线性回归方程为=0.85x-85.71知,0.85>0,所以y与x具有正的线性相关关系,故A正确;又因为回归直线过样本点的中心(,),故B正确;因为=0.85x-85.71,所以该大学某女生身高增加1 cm,则其体重约增加0.85 kg,故C正确;当x=170 cm时,=0.85×170-85.71=58.79(kg),但这是预测值,不可断定其体重为58.79 kg,故D不正确.19.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得线性回归方程=0.74x+50.则m+n的值为()A. 137B. 129C. 121D. 118【答案】B【解析】由题意得=50,=0.74,又∵=-,∴=+=50+0.74×30=72.2,∴62+m+n+81+89=5×72.2=361,∴m+n=129.20.已知一组样本点(xi,yi)(其中i=1,2,3,…,30),根据最小二乘法求得的线性回归方程是=x+,则下列说法正确的是()A.若所有样本点都在=x+上,则变量间的相关系数为1B.至少有一个样本点落在回归直线=x+上C.对所有的预报变量xi(i=1,2,3,…,30),bxi+a的值一定与yi有误差D.若=x+斜率b>0,则变量x与正相关【答案】D【解析】所有样本点都在=x+上,则变量间的相关系数为±1,故A错误;回归直线必过样本数据中心点,但样本点可能全部不在回归直线上,故B错误;若所有的样本点都在=x+上,则bxi+a的值与yi相等,故C错误;相关系数r与符号相同,若=x+斜率>0,则r>0,样本点应分布从左到右应该是上升的,则变量x与y正相关,故D正确.21.设有3个点(x1,y1),(x2,y2),(x3,y3),由最小二乘法来刻画直线y=a+bx与这3个点的接近程度时,其表达式是()A. |x1-(a+bx1)|+|x2-(a+bx2)|+|x3-(a+bx3)|B. [x1-(a+bx1)]2+[x2-(a+bx2)]2+[x3-(a+bx3)]2C. |y1-(a+bx1)|+|y2-(a+bx2)|+|y3-(a+bx3)|D. [y1-(a+bx1)]2+[y2-(a+bx2)]2+[y3-(a+bx3)]2【答案】D【解析】根据最小二乘法原理知,实测值yi与计算值y计=a+bxi的离差(yi-y计)的平方和最小为判断依据,所以,由最小二乘法来刻画直线y=a+bx与这3个点的接近程度时,其表达式是[y1-(a+bx1)]2+[y2-(a+bx2)]2+[y3-(a+bx3)]2.22.最小二乘法是指通过求函数Q(a,b)的最小值而得出回归直线的方法.其中函数Q(a,b)是指()A. (y1-bx1-a)2B. |yi-bxi-a|C.(yi-bxi-a)2D.|yi-bxi-a|【答案】C【解析】利用最小二乘法的定义可知:Q(a,b)=(yi-bxi-a)2.23.下列说法正确的有()①最小二乘法指的是把各个离差加起来作为总离差,并使之达到最小值的方法;②最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;③线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;④因为由任何一观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.A. 1个B. 2个C. 3个D. 4个【答案】B【解析】根据最小乘法的定义可知把各个离差的平方加起来作为总的离差,并使之达到最小值的方法,所以②正确;③正确;线性回归方程就是贴近样本点的直线,故选B.24.以下有关线性回归分析的说法不正确的是()A.通过最小二乘法得到的线性回归直线经过样本的中心(,)B.用最小二乘法求线性回归方程,是寻求使(yi-bxi-a)2最小的a,b的值C.相关系数r越小,表明两个变量相关性越弱D.R2=1-越接近1,表明回归的效果越好【答案】C【解析】两个变量的相关关系分为正相关和负相关,相关系数越接近1或-1时,表明两个变量的相关性越强,相关系数越接近0则相关性越弱.所以C项的表述不正确,故选C.25.以下有关线性回归分析的说法不正确的是()A.通过最小二乘法得到的线性回归直线经过样本的中心(,)B.用最小二乘法求线性回归方程,是寻求使(yi-bxi-a)2最小的a,b的值C.在回归分析中,变量间的关系若是非确定性关系,但因变量也能由自变量唯一确定D.如果回归系数是负的,y的值随x的增大而减小【答案】C【解析】根据题意,回归分析中,通过最小二乘法得到的线性回归直线经过样本的中心(,)成立,对于用最小二乘法求线性回归方程,是寻求使(yi-bxi-a)2最小的a,b的值满足成立,对于如果回归系数是负的,y的值随x的增大而减小,类似于斜率为负数,成立.排除法选C.具有相关关系的两个变量不一定是因果关系.26.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()A.直线l过点(,)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同【答案】A【解析】所有线性回归直线必过中心点(,),所以A正确.27.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得线性回归方程=x+,其中=0.76,=-,据此估计,该社区一户收入为15万元家庭年支出为()A. 11.4万元B. 11.8万元C. 12.0万元D. 12.2万元【答案】B【解析】由题意可得=(8.2+8.6+10.0+11.3+11.9)=10,=(6.2+7.5+8.0+8.5+9.8)=8,代入线性回归方程可得=8-0.76×10=0.4,∴线性回归方程为=0.76x+0.4,把x=15代入方程可得=0.76×15+0.4=11.8.28.一名小学生的年龄和身高(单位:cm)的数据如下表:由散点图可知,身高y与年龄x之间的线性回归方程为=8.8x+,预测该学生10岁时的身高为()A. 154 cmB. 153 cmC. 152 cmD. 151 cm【答案】B【解析】由题意,=7.5,=131,代入线性回归方程=8.8x+,得131=8.8×7.5+,可得=65,∴=8.8x+65.∴当x=10时,=8.8×10+65=153.29.已知具有线性相关的两个变量x,y之间的一组数据如下:且线性回归方程是=0.95x+,则当x=6时,y的预测值为()A. 8.4B. 8.3C. 8.2D. 8.1【答案】B【解析】由已知可得==2,==4.5,∴=4.5=0.95×2+=1.9+,∴=2.6,∴回归方程是=0.95x+2.6.当x=6时,y的预测值=0.95×6+2.6=8.3.30.某产品的广告费用x与销售额y的统计数据如下表:根据上表可得线性回归方程=x+中的=10.6,据此模型预报广告费用为10万元时销售额为()A. 112.1万元B. 113.1万元C. 111.9万元D. 113.9万元【答案】C【解析】∵==3.5,==43,∵数据的样本中心点在线性回归直线上,=x+中的=10.6,∴43=10.6×3.5+,∴=5.9,∴线性回归方程是=10.6x+5.9,∴广告费用为10万元时销售额为10.6×10+5.9=111.9(万元).31.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作量与当天平均气温,并制作了对照表:由表中数据得到线性回归方程=-2x+,当气温为-4℃时,预测用电量均为()A. 68度B. 52度C. 12度D. 28度【答案】A【解析】由表格得=(18+13+10-1)=10,=(24+34+38+64)=40.∴(,)为(10,40),又(,)在线性回归方程=x+上,∴40=10×(-2)+,解得=60,∴=-2x+60,当x=-4时,=-2×(-4)+60=68.32.已知某产品连续4个月的广告费xi(千元)与销售额yi(万元)(i=1,2,3,4)满足xi=18,yi=14,若广告费用x和销售额y之间具有线性相关关系,且线性回归方程为=0.8x+,那么广告费用为6千元时,可预测的销售额为()A. 3.5万元B. 4.7万元C. 4.9万元D. 6.5万元【答案】B【解析】由题意,=4.5,=3.5,代入=0.8x+,可得3.5=0.8×4.5+,所以=-0.1,所以=0.8x-0.1,所以x=6时,=0.8×6-0.1=4.7.33.某设备的使用年限x(单位:年)与所支付的维修费用y(单位:千元)的一组数据如表:从散点图分析:y与x线性相关,根据上表中数据可得其线性回归方程:=x+中的=1.54.由此预测该设备的使用年限为6年时需支付的维修费用约是()A. 7.2千元B. 7.8千元C. 8.1千元D. 9.5千元【答案】C【解析】∵由表格可知==3.5,==4.25,∴这组数据的样本中心点是(3.5,4.25),根据样本中心点在线性回归直线上,得4.25=+1.54×3.5,∴=-1.14,∴这组数据对应的线性回归方程是=1.54x-1.14,∵x=6,∴=1.54×6-1.14=8.1.34.某餐厅的每天原料费支出x与该天的营业额y(单位:万元)之间具有相关关系,其线性回归方程为=1.5x+3,已知某天此餐厅的营业额为6万元,则其当天原料费开支()A.恰为12万元B.近似为12万元C.恰为2万元D.近似为2万元【答案】D【解析】某餐厅的每天原料费支出x与该天的营业额y(单位:万元)之间具有相关关系,其线性回归方程为=1.5x+3,已知某天此餐厅的营业额为6万元,可得6=1.5x+3,解得x=2.某天此餐厅的营业额为6万元,则其当天原料费开支近似为2万元.35.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有相关关系,且线性回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为()A. 66%B. 67%C. 79%D. 84%【答案】D【解析】∵y与x具有线性相关关系,满足线性回归方程=0.6x+1.2,该城市的职工人均工资为x=5,∴可以估计该市的职工人均工资水平y=0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比约为=84%.36.一位母亲在孩子的成长档案中记录了年龄和身高间的数据(截取其中部分):根据以上样本数据,建立了身高y(cm)与年龄x(周岁)的线性回归方程为=7.19x+,可预测该孩子10周岁时的身高为()A. 142.8 cmB. 145.9 cmC. 149.8 cmD. 151.7 cm【答案】B【解析】由已知可得,=(3+4+5+6+7+8+9)=6,=(94.8+104.2+108.7+117.8+124.3+130.8+139.1)=117.1,将(6,117.1)代入=7.19x+得,=73.96,故=7.19x+73.96,当x=10时,=71.9+73.96=145.86≈145.9.37.如表给出的是某产品的产量x(吨)与生产能耗y(吨)的对应数据:根据上表提供的数据,得出y关于x的线性回归方程为=0.7x+,试预测当产量x=8时,生产能耗y约为()A. 4.95吨B. 5.57吨C. 5.95吨D. 6.75吨【答案】C【解析】由表中数据可得:==4.5,==3.5,∵回归直线一定经过样本数据中心点,故=-0.7=3.5-0.7×4.5=0.35,y关于x的线性回归方程为=0.7x+0.35,预测当产量x=8时,生产能耗y=0.7×8+0.35=5.95(吨).38.已知随机变量x,y的值如表所示:如果y与x线性相关且线性回归方程为=x+,则当x的值为9时的值为()A. 7B. 8C. 9D.【答案】B【解析】根据表格可以得到=3,=5,∴将样本中心点(3,5)代入方程得5=3+,∴=,∴=x+,∴x=9时,=×9+=8.39.大学生小赵计划利用假期进行一次短期打工体验,已知小赵想去某工厂打工,老板告知每天上班的时间(单位:小时)和工资(单位:元),如表所示:根据计算,小赵得知这段时间每天打工工资与每天工作时间满足的线性回归方程为=11.4x+5.9,若小赵在假期内打5天工,工作时间(单位:小时)分别为8,8,9,9,12,则这5天小赵获得工资的方差为()A. 112B. 240C. 376D. 484【答案】C【解析】由题意,==6.5,代入=11.4x+5.9,可得=80,∴=80,∴m=140,∴小赵在假期内打5天工的工资的平均值为=112,方差为[(90-112)2×2+(120-112)2×2+(140-112)2]=376.40.某农场给某种农作物施肥量x(单位:吨)与其产量y(单位:吨)的统计数据如表:由表中的数据,得到线性回归方程为=9.4x+,当施肥量x=6时,该农作物的预报产量是() A. 72.0B. 67.7C. 65.5D. 63.6【答案】C【解析】∵=3.5,=42,∵数据的样本中心点在线性回归直线上,线性回归方程=x+中为9.4,∴42=9.4×3.5+,∴=9.1,∴线性回归方程是=9.4x+9.1,∴施肥量为6万元时该农作的预报产量为9.4×6+9.1=65.5(吨).41.西华三高高二文科班数学兴趣小组为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程=x+中≈-2,预测当气温为-4℃时,用电量约为()A. 58度B. 66度C. 68度D. 70度【答案】C【解析】==10,==40.∵=-2,=-,∴=40+10×2=60,∴线性回归方程=-2x+60.当x=-4时,=-2×(-4)+60=68,预测当气温为-4℃时,用电量约为68.42.已知非线性回归方程为y=20.2x-1,则x=50时y的估计值为()A. 0B. 29C. 210D. 1【答案】B【解析】因为非线性回归方程为y=20.2x-1,所以x=50时,y的估计值为29.43.一位母亲记录了儿子3~9岁的身高,收集了好几组数据(略),由此建立的身高与年龄的回归模型为=7.18x+73.95,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高在145.75 cm以上B.身高在145.75 cm左右C.身高一定是145.75 cmD.身高在145.75 cm以下【答案】B【解析】将x=10代入线性回归方程得=71.8+73.95=145.75.由于线性回归方程预测的数值估计值与真实值之间存在误差,故孩子10岁时身高在145.75 cm左右.44.已知某车间加工零件的个数x与所花费时间(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要的时间为()A. 6.5 hB. 5.5 hC. 3.5 hD. 0.5 h【答案】A【解析】某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要的时间为=0.01×600+0.5=6.5(h).45.某产品的广告费用支出x(万元)与产品销售额y(万元)之间的统计数据如表:求得回归直线方程为=x+17.5,若投入12万元的广告费用,估计销售额为()A. 82.5万元B. 90万元C. 95.5万元D. 100.5万元【答案】C【解析】由题中表格数据得:=5,=50,∴=-=17.5=50-5,解得=6.5,∴=6.5x+17.5,当x=12时,=6.5×12+17.5=95.5(万元).46.两个相关变量满足如下关系:两变量的线性回归方程为()A.=0.63x-231.2B.=0.56x+997.4C.=50.2x+501.4D.=60.4x+400.7【答案】B【解析】由题意可得=(10+15+20+25+30)=20,=(1 003+1 005+1 010+1 011+1 014)=1 008.6,∵xiyi=10×1 003+15×1 005+20×1 010+25×1 011+30×1 014=101 000,5=5×20×1 008.6=100860,52=5×20×20=2 000,=102+152+202+252+302=2 250,∴==0.56,∴=-=1 008.6-0.56×20=997.4.∴两变量的直线回归方程为=0.56x+997.4.47.网上大型汽车销售点销售某品牌A型汽车,在2015年双十一期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系:已知A型汽车的月销售量y与价格x符合如下线性回归方程:=x+80,若A型汽车价格降到19万元,预测月销量大约是()A. 39B. 42C. 45D. 50【答案】B【解析】=(25+23.5+22+20.5)=22.75,=(30+33+36+39)=34.5,∵=x+80,∴34.5=×22.75+80,∴=-2,当x=19时,y=19×(-2)+80=42.二、填空题(共7小题,每小题5.0分,共35分)48.已知x、y的取值如下表:从散点图分析,y与x线性相关,且线性回归方程为=0.95x+,则=__________.【答案】2.6【解析】点(,)在回归直线上,计算得=2,=4.5,代入得=2.6.49.在2014年3月15日那天,某物价部门对市内的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:由最小二乘法求得线性回归方程为=-3.2x+40,发现表中有一个数据模糊不清,则该处数据的值为__________.【答案】11【解析】由题意,==10,∵=-3.2x+40,∴=8,∴所求数据为5×8-10-8-6-5=11.50.患感冒与昼夜温差大小相关,居民小区诊所的某医生记录了四月份四个周一的温差情况与因患感冒到诊所看病的人数如下表:用最小二乘法求出y关于x的线性回归方程为__________.(参考公式:【答案】=x-【解析】由数据得==11,==24,由参考公式,得==,=24-×11=-.所以y关于x的线性回归方程为=x-.51.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程为___________________________________________________.【答案】=0.7x+0.35【解析】∵由题意知==4.5,==3.5,∴==0.7,=3.5-0.7×4.5=3.5-3.15=0.35.∴要求的线性回归方程是=0.7x+0.35.52.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程中的=x+中的≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量的件数约为________.【答案】46【解析】由表格得(,)为(10,38),又(,)在线性回归方程=x+上且≈-2,∴38=10×(-2)+,解得=58,∴=-2x+58.当x=6时,=-2×6+58=46.53.如果在一次试验中,测得(x,y)的四组数值分别是根据上表可得线性回归方程=-5x+,据此模型预报当x为20时,的值为________.【答案】26.5【解析】∵==17.5,==39.∴线性回归方程过点(17.5,39),代入=-5x+得,39=-5×17.5+,∴=126.5∴当x=20时,=-5×20+126.5=26.5.54.调查某电脑公司的三名产品推销员,其工作年限与年推销金额数据如表:由表中数据算出线性回归方程=x+中的=,若该电脑公司第四名推销员的工作年限为6年,则估计他的年推销金额为________万元.【答案】3【解析】由条件可知,==6,==3,代入线性回归方程,可得=,所以=x+,当x=6时,=3,估计他的年推销金额为3万元.三、解答题(共46小题,每小题12.0分,共552分)55.下表提供了某新生婴儿成长过程中时间x(月)与相应的体重y(公斤)的几组对照数据.(1)如y与x具有较好的线性关系,请根据表中提供的数据,求出线性回归方程:=x+;(2)由此推测当婴儿生长满五个月时的体重为多少?(参考公式和数据:=,=-,xiyi=27.5)【答案】解(1)==1.5,==4.=02+12+22+32=14,∴==,=4-×1.5=.∴y关于x的线性回归方程为=x+.(2)当x=5时,=+=6.45.由此推测当婴儿生长满五个月时的体重为6.45公斤.【解析】56.某电视机的广告支出x(单位:万元)与销售收入y(单位:万元)之间有如表所对应的关系:(1)求出y对x的线性回归方程;(2)若广告费为9万元,则销售收入为多少万元?(参考公式:=,=-)【答案】解(1)=,=,所以=,=-=-2,故y对x的线性回归方程为=x-2.(2)当x=9时,y=129.4,故若广告费为9万元,则销售收入为129.4万元.【解析】57.一般来说,一个人脚掌越长,他的身高就越高.现对10名成年人的脚掌长x与身高y进行测量,得到数据(单位:cm)作为一个样本如下表示.(1)在上表数据中,以“脚掌长”为横坐标,“身高”为纵坐标,作出散点图后,发现散点在一条直线附近,试求“身高”与“脚掌长”之间的线性回归方程=x+;(2)若某人的脚掌长为26.5 cm,试估计此人的身高.(参考数据:(xi-)(yi-)=577.5,(xi-)2=82.5)【答案】解(1)记样本中10个人的“脚掌长”为xi(i=1,2,…,10),“身高”为yi(i=1,2,…,10),则===7.∵==24.5,==171.5,。
高中数学北师大版必修3最小二乘估计课后作业Word版含答案
高中数学北师大版必修3最小二乘估计课后作业Word版含答案§8最小二乘估计一、非标准1.已知回归直线的斜率的估计值是1.23,样本点的中心是(4,5),则线性回归方程是( )A.y=4+1.23xB.y=5+1.23xC.y=0.08+1.23xD.y=1.23+0.08x解析:由已知得b=1.23,=4,=5,于是a=-b=5-1.23×4=0.08,因此线性回归方程为y=1.23x+0.08.答案:C2.用回归直线方程的系数a,b的最小二乘法估计a,b,使函数Q(a,b)的值最小,则Q函数是指( )A.(y i-a-bx i)2B.(y i-a-bx i)C.y i-a-bx iD.(y i-a-bx i)2答案:A3.某地区调查了2~9岁的儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为y=8.25x+60.13,下列叙述正确的是( )A.该地区一个10岁儿童的身高为142.63cmB.该地区2~9岁的儿童每年身高约增加8.25cmC.该地区9岁儿童的平均身高是134.38cmD.利用这个模型可以准确地预算该地区每个2~9岁儿童的身高解析:由y=8.25x+60.13知斜率的估计值为8.25,说明每增加一个单位年龄,约增加8.25个单位身高,故选B.答案:B4.某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时的销售额为( )A.63.6万元B.65.5万元C.67.7万元D.72.0万元解析:∵=3.5,=42,又y=bx+a必过(),∴42=3.5×9.4+a,∴a=9.1.∴线性回归方程为y=9.4x+9.1.∴当x=6时,y=9.4×6+9.1=65.5(万元).答案:B5.已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归方程为y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是( )A.b>b',a>a'B.b>b',a<a'< bdsfid="107" p=""></a'<>C.ba'D.b<b',a<a'< bdsfid="111" p=""></b',a<a'<>解析:b'==2,a'=0-2×1=-2.x i y i=0+4+3+12+15+24=58,=3.5,=1+4+9+16+25+36=91,∴b=,a=×3.5=-,∴ba'.故选C.答案:C6.下表是某厂1到4用水量y与月份x之间具有线性相关关系,其线性回归方程为y=-0.7x+a,则a的值为.解析:由已知得=2.5,=3.5,因此3.5=-0.7×2.5+a,解得a=5.25.答案:5.257.在一项关于16艘轮船的研究中,船的吨位区间从192t~3246t,船员的人数从5到32,由船员人数y关于吨位x的回归分析得到:y=9.5+0.0062x,假定两艘轮船的吨位相差1000 t,船员平均人数相差,对于最小的船估计的船员人数是,对于最大的船估计的船员人数是.解析:由线性回归方程知船的吨位每增加1000t,则人数增加0.0062×1000≥6(人),又分别令x=192和3246,即可估算船员人数.答案:6 10 298.2014年6月22日,某市物价部门对本市的5家商场的一天销售量及其价格进行调查,5家由数据对应的散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n=.解析:(9+9.5+m+10.5+11)=8+(11+n+8+6+5)=6+,线性回归方程一定经过样本中心(),所以6+=-3.2×+40,即3.2m+n=42,由解得故n=10.答案:109.某连锁经营公司所属5个零售店某月的销售额和利润额如下表:万元(1)画出散点图,观察散点图,说明两个变量是否线性相关;(2)用最小二乘法计算利润额y对销售额x的线性回归方程;(3)当销售额为4千万元时,估计利润额的大小.解:(1)散点图如下图.由散点图可以看出变量x,y线性相关.(2)设线性回归方程是y=bx+a,=3.4,=6,所以b==0.5,a=-b=3.4-6×0.5=0.4,即利润额y对销售额x的线性回归方程为y=0.5x+0.4.(3)当销售额为4千万元时,利润额为y=0.5×4+0.4=2.4(百万元).10.(1)利用所给数据求年需求量与年份之间的线性回归方程y=bx+a;(2)利用(1)中所求出的直线方程预测该地2015年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面来求线性回归方程,为此对数据预处理如下:对预处理后的数据,容易算得=0,=3.2.b===6.5,a=-b =3.2.由上述计算结果,知所求线性回归方程为y-257=b(x-2010)+a=6.5(x-2010)+3.2,即y=6.5(x-2010)+260.2.①(2)利用直线方程①,可预测2015年的粮食需求量为6.5×(2015-2010)+260.2=6.5×5+260.2=292.7(万吨).。
高中数学必修3第一章(统计)测试题(北师大版).doc
高中数学必修3第一章(统计)检测题班级姓名得分一、选择题:(本题共10小题,每小题3分,共30分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( ).A.简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,然后分层抽样2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.下列说法错误的是( ).A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大4.下列说法中,正确的是( ).A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).A.甲班10名学生的成绩比乙班10名学生的成绩整齐B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度6.下列说法正确的是( ).A.根据样本估计总体,其误差与所选择的样本容量无关B.方差和标准差具有相同的单位C.从总体中可以抽取不同的几个样本D.如果容量相同的两个样本的方差满足S12<S22,那么推得总体也满足S12<S22是错的7.右图是根据《湖南统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为()29 1 1 5 8 (A)304.6(B)303.63 0 2 63 1 0 24 7 (C)302.6 (D)301.68.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。
高中数学第一章统计1.8最小二乘估计课后梯度测评北师大版必修3
高中数学第一章统计1.8最小二乘估计课后梯度测评北师大版必修3一、选择题1.过三点(3,10),(7,20),(11,24)的线性回归直线方程是( )A.y=1.75-5.75x B.y=-1.75+5.75xC.y=5.75+1.75x D.y=5.75-1.75x答案 C解析根据求线性回归方程的方法,利用公式可得到答案.2.抽测10只某种白炽灯的使用寿命x,结果如下(单位:h):1067,919,1196,785,t,936,918,1156,920,918,若x-=997,则t大约是( )A.1120 B.1124 C.1155 D.1128答案 C3.在线性回归方程中,b表示( )A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均变化量D.当y增加一个单位时,x的平均变化量答案 C解析本题主要考查线性回归方程中a,b的含义.4.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到线性回归方程y=bx+a,那么下列说法中错误的是( )A.直线y=bx+a必经过点(x-,y-)B.直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一个点C.直线y=bx+a的斜率为b=∑i=1nx i y i-n x-y-∑i=1nx2i-n x-2D.直线y=bx+a和各点(x1,y1),(x2,y2),…,(x n,y n)的偏差的平方和∑i=1n[y i-(bx i+a)]2是该坐标平面上所有直线与这些点的偏差的平方和中最小的答案 B解析 理解线性回归方程的真正含义.因为y -=b x -+a ,其中x -=1n(x 1+x 2+…+x n ),y-=1n(y 1+y 2+…+y n ),显然回归直线经过点(x -,y -).故A 是正确的.回归直线最能近似刻画点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的变化趋势,但并不一定经过某些点.故B 是错误的.对于C 、D 只需了解相应概念便会得出正确结论.5.下列叙述中:①变量间关系有函数关系,还有相关关系; ②回归函数即用函数关系近似地描述相互关系;③∑ni =1x i =x 1+x 2+…+x n ; ④线性回归方程y ^=bx +a 中,b =∑ni =1 (x i -x -)(y i -y -)∑ni =1(x i -x -)2,a =y --b x -; ⑤线性回归方程一定可以近似地表示所有相关关系. 其中正确的有( ) A .①②③ B .①②④⑤ C .①②③④ D .③④⑤答案 C解析 利用直接法逐个判断可知,①②③④正确,而⑤线性回归方程可以近似地表示具有线性相关关系,而不能表示其他相关关系.6.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成份含量x 之间的相关关系,现取了8对观察值,计算得:∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i =1849,则y 与x 的回归方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62xC.y ^=2.62+22.47x D.y ^=11.47-2.62x 答案 A解析 把题目所给的数据代入公式分别求系数a 和b 即可. 二、填空题7.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.答案 0.254解析 本小题主要考查了利用回归直线方程,对数据进行估计.以x +1代x ,得0.254(x +1)+0.321,与0.254x +0.321相减可得,年饮食支出平均增加0.254万元.8.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如下:x 3 5 2 8 9 12 y46391214则x -=________,y =________,∑6i =1x 2i =________,∑6i =1x i y i =________,回归方程为________.答案 6.5 8 327 396 y ^=1.4x +0.571解析 根据公式代入即可求得,也可以利用计算器求得,x -=6.5,y -=8,∑6i =1x 2i =327,∑6i =1x i y i =396,回归方程为y ^=1.4x +0.571.9.假设学生在初中的英语成绩和高一英语成绩是线性相关的.现有10名学生的初中英语成绩(x )和高一英语成绩(y )如下:x 74 71 72 68 76 73 67 70 65 74 y76757170767965776272答案 1.2182解析 求斜率即求回归方程中的b ,按照公式进行即可,即需要依次计算出x -=71,∑10i =1x 2i=50520,y -=72.3,∑10i =1x i y i =51467,所以b =51467-10×71×72.350520-10×712≈1.2182,所以斜率为1.2182.三、解答题10.在10年期间,一城市居民的年收入与某种商品的销售额有如下数据:(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的线性回归方程.解(1)散点图如图.(2)由图可知,y与x线性相关,列表计算如下:所以b =15202.9-10×37.97×39.114663.67-10×37.972≈1.447,a =39.1-1.447×37.97≈-15.843,因此,所求线性回归方程为y =1.447x -15.843.11.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?解 (1)由条件可知,x -=15∑i =15x i =5405=108,y -=15∑i =15y i =4205=84,∑i =15(x i -x -)(y i -y -)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,∑i =15(x i -x -)2=(-8)2+(-6)2+02+62+82=200,b =∑i =15(x i -x -)(y i -y -)∑i =15(x i -x -)2=144200=0.72, a =y --b x -=84-0.72×108=6.24,故y 关于x 的线性回归方程为y ^=0.72x +6.24.(2)当x =200时,y ^=0.72×200+6.24=150.24.所以可以预测此时PM2.5的浓度约为150.24微克/立方米. 12.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y ^=bx +a ; (2)利用(1)中所求出的直线方程预测该地2020年的粮食需求量.解 本题考查回归分析的基本思想及其初步应用、回归直线的意义和求法、数据处理的基本方法和能力,考查运用统计知识解决简单实际应用问题的能力.(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程.为此对数据预处理如下:对预处理后的数据,容易算得x =0,y =3.2,b =(-4)×(-21)+(-2)×(-11)+2×19+4×2942+22+22+42=26040=6.5, a =y --b x -=3.2.由上述计算结果,知所求回归直线方程为y ^-257=b (x -2014)+a =6.5(x -2014)+3.2,即y ^=6.5(x -2014)+260.2. ①(2)利用直线方程①,可预测2020年的粮食需求量为6.5×(2020-2014)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).(未写近似值不扣分)13.日常生活中,某些东西所含的热量比较高,对我们的身体有一定的影响,下表给出了不同类型八种饼干的数据,第一列数据表示八种饼干各含热量的百分比,第二列数据表示顾客对八种饼干所给予分数(百分制).(1)(2)关于两个变量之间的关系,你能得出什么结论?(3)为什么人们更喜欢吃位于回归直线上方的饼干而不是下方的饼干? 解 (1)先把数据列成表:由上表分别计算x ,y 的平均数得x -=1878,y -=6098,代入公式⎩⎪⎨⎪⎧b =∑ni =1x i y i -n x -y -∑ni =1x 2i -n x - 2,a =y --b x -,得b =14426-8×1878×60984555-8×⎝ ⎛⎭⎪⎫18782=190.625183.875≈1.037,a =6098-1.036710×1878=76.125-24.2331≈51.9. 则回归直线方程y ^=1.037x +51.9.(2)回归直线方程y ^=1.037x +51.9中的回归系数b =1.037,它的意义是热量比每增加一个百分比,口味记录平均增加1.037分.(3)因为饼干所含有的热量百分比相同时,人们的满意率比较高;并且满意率相同时,位于回归直线上方的饼干所含热量百分比较低,人们比较喜欢吃热量百分比较低的食品.所以人们喜欢吃位于回归直线上方的饼干.。
高中数学北师大版必修3第一章《统计》(最小二乘估计第二课时)word教案
§1.8最小二乘法一、教学目标:经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二、教学重难点:重点:了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解 教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
三、教学方法:动手操作,合作交流。
四、教学过程:(一)、利用最小二乘法推导回归系数公式。
回顾上节课:师:我们现在来求距离和。
怎么求?生:利用点到直线的距离公式师生共同:只要求出使距离和最小的a 、b 即可。
但是,我们知道点到直线的距离公式计算复杂。
怎么办呢?以样本数据点A 为例, 可以看出:在RT △ABC 中,(教师动画演示)按照一对一的关系,直角边AC 越小,斜边AB 越小,当AC 无限小时,AB 跟AC 可近似看作相等。
求AC 麻烦,不妨求AB 生:B A AB y y =-师:它表示自变量x 取值一定时,纵坐标的偏差。
假设我们已经得到两个具有线性相关关系的变量的一组数据:11(,)x y 22(,)x y ……(,)n n x y 。
当自变量x 取i x (i =1,2,……,n )时,可以得到ˆi ybx a =+(i =1,2,……,n ),它与实际收集到的i y 之间的偏差是 ˆ()i i i i y yy bx a -=-+(i =1,2,……,n ) 这样用n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。
总的偏差为1ˆ()n iii y y=-∑,偏差有正有负,易抵消,所以采用绝对值1ˆniii y y =-∑,由于带绝对值计算不方便所以换成平方,222221122331ˆ()()()()()niin n i Q y yy bx a y bx a y bx a y bx a ==-=--+--+--+⋅⋅⋅+--∑现在的问题就归结为:当a ,b 取什么值时Q 最小。
高中数学 第一章 统计 1.8 最小二乘估计学案(含解析)北师大版必修3-北师大版高一必修3数学学案
§8 最小二乘估计知识点 最小二乘法及回归直线方程[填一填]1.最小二乘法设x 、y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,y ^的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =∑i =1n(y i -a -bx i )2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q 取最小值的那一条,由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫作最小二乘法.2.回归直线方程的系数计算公式[答一答]利用最小二乘法的思想求得线性回归方程的步骤是什么? 提示:第一步:先求x ,y ,x 2,x y .第二步:求∑i =1nx 2i ,第三步:求∑i =1nx i y i .第四步:代入公式求b =∑i =1nx i y i -n x y∑i =1nx 2i -n x2.第五步:代入公式a =y -b x . 代入直线方程得:y =bx +a .对回归直线方程的几点说明(1)(x i ,y i )(i =1,2,…,n )的中心点(x ,y )在回归直线上. (2)由回归直线方程知x 处的估计值为y =a +bx .(3)回归直线使得样本数据中的点到它的距离的平方和最小. (4)求回归直线方程,计算量大,一般应学会使用计算器求解. (5)利用回归直线方程可以对总体进行估计.类型一 最小二乘法与回归直线方程的理解【例1】 下列有关线性回归方程的系数a ,b 的公式正确的是( )【思路探究】 符号∑i =1na i 表示n 个实数a 1,a 2,…,a n 的和.【解析】 由线性回归方程的概念我们知道,线性回归方程的系数公式b =x 1y 1+x 2y 2+…+x n y n -n x -y-x 21+x 22+…+x 2n -n x2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x2,a =y -b x ,易知A 正确.【答案】 A回归直线方程的系数a ,b ,用最小二乘法估计a ,b 使函数Q (a ,b )最小,Q (a ,b )=( A ) A.∑i =1n(y i -a -bx i )2B.∑i =1n|y i -a -bx i |C .(y i -a -bx i )2D .|y i -a -bx i |解析:由最小二乘法的定义知通过求Q =(y 1-bx 1-a )2+(y 2-bx 2-a )2+…+(y n -bx n -a )2的最小值而得到回归直线的方法,叫作最小二乘法,故Q (a ,b )=∑i =1n(y i -bx i -a )2,故选A.类型二 求回归直线方程【例2】 某市近5年的煤气消耗量与使用煤气户数如下表:年份 2014 2015 2016 2017 2018 x /万户 1 1.1 1.5 1.6 1.8 y /百万立方米 6791112(1)检验是否线性相关; (2)求y 对x 的回归直线方程.【思路探究】 根据表中的数据→作出散点图→判断是否线性相关→若是,则根据公式求得a ,b →得回归直线方程【解】 (1)作出散点图,观察呈线性相关,如图所示.(1)x =1+1.1+1.5+1.6+1.85=75,y =6+7+9+11+125=9,∑i =15x 2i =12+1.12+1.52+1.62+1.82=10.26, ∑i =15x i y i =1×6+1.1×7+1.5×9+1.6×11+1.8×12=66.4.∴b =∑i =15x i y i -5x y∑i =15x 2i -5x2=66.4-5×75×910.26-5×4925=17023,a =y -b x =9-17023×75=-3123,∴y 对x 的回归直线方程为y =17023x -3123.规律方法 求回归直线方程的步骤:(1)先把数据制成表,从表中计算出∑i =1nx i ,∑i =1ny i ,∑i =1nx 2i ,∑i =1nx i y i ;(2)计算回归系数a ,b .公式为⎩⎪⎨⎪⎧b =∑i =1nx i y i -n x y ∑i =1nx 2i-n x2,a =y -b x ;(3)写出回归直线方程y =bx +a .某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y2356解:x =6+8+10+124=9,y =2+3+5+64=4,∑i =14x 2i =62+82+102+122=344, ∑i =14x i y i =6×2+8×3+10×5+12×6=158,b =158-4×9×4344-4×92=1420=0.7,a =y -b x =4-0.7×9=-2.3.则所求的线性回归方程为y =0.7x -2.3.类型三 回归直线方程的应用【例3】 假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0若由资料知y 对x 呈线性相关关系.试求: (1)回归直线方程y =bx +a ;(2)估计使用年限为10年时,维修费用是多少?【思路探究】 先求回归直线方程,若回归直线方程为y =bx +a ,则在x =x 0处的估计值为y 0=bx 0+a .【解】 (1)制表如下:于是有b =112.3-5×4×590-5×42=12.310=1.23.a =y -b x =5-1.23×4=0.08. 故回归直线方程是y =1.23x +0.08.(2)根据回归直线方程是y =1.23x +0.08,当x =10年时,y =1.23×10+0.08=12.38(万元),即估计使用10年时,维修费用是12.38万元.规律方法 (1)知道x 与y 呈线性相关关系,无需进行相关性检验.否则,应首先进行相关性检验.如果本身两个变量不具备相关关系,或者说,它们之间相关关系不显著即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)在求方程时,由于一步代入很烦琐,所以要分步求解,即分别求得x ,y ,x ·y ,x2,∑i =1nx 2i ,∑i =1n x i y i ,再代入公式求a ,b .某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:x 2 4 5 6 8 y3040605070(1)画出散点图; (2)求线性回归方程;(3)预测当广告费支出为7百万元时的销售额. 解:(1)(2)从散点图可以发现,y 与x 具有线性相关关系,利用计算器求得:x =5,y =50,∑i =15x2i =145,∑i =15x i y i =1 380,设回归方程为y =bx +a ,则b =∑i =15x i y i -5x y∑i =15x 2i -5x2=1 380-5×5×50145-5×52=6.5,a=y-b x=50-6.5×5=17.5,故所求线性回归方程为y=6.5x+17.5.(3)当x=7时,y=6.5×7+17.5=63.所以,当广告费支出为7百万元时,销售额约为6 300万元.——规范解答——数形结合在线性相关性中的应用【例4】(12分)下表数据是退水温度x(℃)对黄硐延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.x(℃)300400500600700800y(%)405055606770(1)画出散点图;(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的线性回归方程;(4)估计退水温度是1 000 ℃时,黄硐延长性的情况.【思路点拨】根据所给数据画出散点图,然后可借助函数的思想分析.【满分样板】(1)散点图如图所示:4分(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.5分(3)列出下表,并用科学计算器进行有关计算.于是可得:【思维启迪】(1)在研究两个变量是否存在某种关系时,必须从散点图入手,对于散点图,可以做出如下判断:①如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;②如果所有的样本点都落在某一函数曲线附近,那么变量之间具有相关关系;③如果所有的样本点都落在某一直线附近,那么变量之间具有线性相关关系.(2)利用散点图判断两个变量之间是否具有线性相关关系,体现了数形结合思想的作用,而用回归直线方程进行估计又体现了函数与方程思想的应用.下表是某机构记载的某市5月1号到5月12号每天某传染病治愈者的数据,并根据这些数据绘制了散点图,如图.下列说法正确的是①③(填序号).①根据此散点图,可以判断人数与日期具有线性相关关系;②根据此散点图,可以判断人数与日期具有一次函数关系;③后三天治愈者人数占这12天治愈者总人数的30%多;④后三天中每天治愈者人数均超过这12天内治愈者总人数的20%.解析:由散点图可以明显看出日期与人数具有线性相关关系,故①正确,②不正确.这12天治愈者总人数为100+109+…+203=1 722,而后三天治愈者人数为175+186+203=564,后三天治愈者人数占这12天治愈者总人数的30%还多,故③正确,④不正确.一、选择题 1.下列叙述中:①变量间关系有函数关系,又有相关关系; ②回归函数即用函数关系近似地描述相关关系; ③∑i =1nx i =x 1+x 2+…+x n ;④线性回归方程y =bx +a 中,b =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a =y -b x ;⑤线性回归方程一定可以表示相关关系. 其中正确的有( C ) A .①②③ B .①②④⑤ C .①②③④D .③④⑤解析:线性回归方程只能近似地表示线性相关关系. 2.线性回归方程y =bx +a 必过( D ) A .(0,0)点 B .(x ,0)点 C .(0,y )点D .(x ,y )点解析:回归直线系数a 、b 有公式a =y -b x ,所以y =a +b x ,故直线必过定点(x ,y ).3.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( A )A .y =x +1B .y =x +2C .y =2x +1D .y =x -1解析:本题中x 与y 完全线性相关. 二、填空题4.用身高x (cm)预测体重y (kg)满足y =0.849x -85.712,若要找到41.638 kg 的人,不一定是在150 cm 中.(填“一定”或“不一定”)解析:因为统计的方法是可能犯错误的.利用线性回归方程预测变量的值不是精确值.但一般认为实际测量值应在预测值左右.5.某地区近10年居民的年收入x 与支出y 之间的关系大致符合y =0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则年支出的估计是12.1亿元.解析:因为居民年收入x 与支出y 之间的大致关系为y =0.8x +0.1.所以当收入为x =15时,y =0.8×15+0.1=12.1.三、解答题6.某个服装店经营某种服装,在某周内获纯利润y (元)与该周每天销售这种服装件数x 之间的一组数据关系见下表:x 3 4 5 6 7 8 9 y66697381899091已知∑i =17x 2i =280,∑i =17x i y i =3 487. (1)求x ,y ; (2)画出散点图;(3)求纯利润y 与每天销售件数x 之间的回归直线方程. 解:(1)x =3+4+5+6+7+8+97=6(件),y =66+69+73+81+89+90+917=5597≈79.86(元).(2)散点图如下:(3)由散点图知,y 与x 有线性相关关系.设回归直线方程为y =bx +a .由∑i =17x 2i =280,∑i =17x i y i =3 487,x =6,y =5597,得b =3 487-7×6×5597280-7×36=13328=4.75,a =5597-6×4.75≈51.36,故回归直线方程为y =4.75x +51.36.。
高中数学第一章统计1_7相关性自主练习北师大版必修3
高中数学第一章统计 1.7 相关性自主练习北师大版必修3我夯基我达标1.在下列各图中,每个图的两个变量具有相关关系的图是( )图1-7-7A.(1)(2)B.(1)(3)C.(2)(4)D.(2)(3)思路解析:相关关系有两种情况,所有点看上去都在一条直线附近波动,是线性相关;若所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关的.(3)(4)是不相关的.答案:A2.在下列量与量的关系中,是相关关系的为( )①正方体的体积与棱长间的关系②一块农田的水稻产量与施肥量之间的关系③人的身高与年龄④家庭的支出与收入⑤某户家庭用电量与电价间的关系A.②③B.③④C.④⑤D.②④思路解析:①中正方体的体积与棱长之间是确定的函数关系.③⑤都不具备相关关系,所以应选D.答案:D3.下列变量之间的关系是函数关系的是( )①已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac②光照时间和果树亩产量③降雪量和交通事故发生率④每亩施用肥料量和粮食亩产量思路解析:理解函数关系和相关关系的定义和它们之间的关系是解决本题的关键.由函数关系和相关关系的定义可知.①中Δ=b2-4ac,因为a、c是已知常数,b为自变量,所以给定一个b的值,就有唯一确定的Δ与之对应,所以Δ与b之间是一种确定的关系,是函数关系.②③④中两个变量之间的关系都是随机的、不确定的,所以不是函数关系.答案:①4.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x 2 4 5 6 8y30 40 60 50 70(1)根据上表中的数据制成散点图,你能从散点图中发现广告费支出与销售额之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来表示这种线性关系;(3)如果广告费支出为7百万元,请估计此时的销售额为多少.思路分析:本题数据较小,作散点图时可以用手工作图,但要保证精确度.解:(1)散点图如下图所示.从散点图中,可以看出广告费支出与销售额之间的总体趋势成一条直线,它们之间是线性相关的.(2)所画直线如上图.(3)如果广告费支出为7百万元,则销售额大约为63百万元.我综合我发展5.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据. x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)判断x与y是否具有线性关系.思路分析:先画散点图,再根据散点图判断是否具有相关关系,是否线性相关.解:(1)画出的散点图如下图所示.(2)由散点图可判断知x、y具有线性关系.6.影响消费水平的原因是很多的,其中重要的一项是工资收入.研究这两个变量的关系的一个方法是通过随机抽样的方法,在全国范围内收集被调查者的工资收入和他们的消费状况.下面的数据来自国家统计局颁布的统计年鉴(2000年版),是祖国大陆31个省、自治区、直辖市的职工平均工资与居民消费水平(单位:元).省、区、北京天津河北山西内蒙古辽宁吉林黑龙江市职工平14 054 11 056 7 022 6 065 6 342 7 895 7 158 7 094 均工资居民消7 040 7 346 5 033 3 932 3 765 6 366 5 216 5 632 费水平省、区、上海江苏浙江安徽福建江西山东河南市职工平16 641 9 171 11 201 6 516 9 490 6 749 7 656 6 494 均工资居民消11 943 6 239 7 985 4 985 6 255 3 482 6 060 4 214湖北湖南广东广西海南重庆四川贵州市职工平6 991 9 269 12 245 6 776 6 8657 182 7 249 6 595 均工资居民消5 292 5 290 8 987 4 987 4 7006 190 4 876 4 334 费水平省、区、云南西藏陕西甘肃青海宁夏新疆市职工平8 276 12 962 6 931 7 427 9 081 7 392 7 611均工资居民消4 933 4 685 4 520 4 615 4 384 3 813 3 988费水平(1)根据上表数据,制成散点图,你能从散点图中发现工资收入与消费水平之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;(3)如果一居民年平均工资收入为9 300元,请估计一下该居民的消费水平.思路分析:应用散点图来分析,散点图的制作通常有两种:一是手工绘图;二是用计算机作图.手工作图比较烦琐,也易出现误差,不够精确,我们通常利用计算机作图,简单而又准确.解:(1)散点图如图.从散点图中可以看出,消费水平随职工平均工资的增长而成增长趋势,近似地看成一条直线,也就是说它们之间是线性相关的.(2)下面,我们用一条直线近似地表示这种线性相关.(3)该居民的消费水平在5 300元左右.7.有人收集了10年中某城市居民年收入(即此城市所有居民在一年内的收入的总和)与某种商品的销售额的有关数据(单位:亿元):第n年 1 2 3 4 5 6 7 8 9 10年收入32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0 销售额25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0(1)画出散点图.你能从散点图中发现居民年收入与某种商品销售额之间的近似关系吗?(2)如果它们之间近似成线性关系,请画出一条直线来近似表示这种关系.思路分析:利用计算机作出散点图,由散点图来分析.解:(1)散点图如下图.从散点图中,可以看出年收入与销售额之间的总体趋势成一条直线,也就是说它们之间是线性相关的.(2)所画直线如左图.。
北师大版高中数学必修3第一章统计-8最小二乘法-典题题库(二)(带详细答案)
北师大版高中数学必修3第一章统计-8最小二乘法-典题题库(二)一、选择题(共50小题,每小题5.0分,共250分)1.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是()A.直线l1和l2相交,但是交点未必是点(s,t)B.直线l1和l2有交点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合【答案】B【解析】∵两组数据变量x的观测值的平均值都是s,对变量y的观测值的平均值都是t,∴两组数据的样本中心点都是(s,t).∵数据的样本中心点一定在线性回归直线上,∴回归直线l1和l2都过点(s,t).∴两条直线有公共点(s,t).2.已知呈线性相关关系的变量x,y之间的关系如下表所示,则回归直线一定过点()A. (0.1,2.11)B. (0.2,2.85)C. (0.3,4.08)D. (0.275,4.797 5)【答案】D【解析】线性回归方程必过样本中心点(,).∵==0.275,==4.797 5,∴线性回归方程必过(0.275,4.797 5).3.已知x与y之间的一组数据如表,则y与x的线性回归方程=x+必过()A.点(2,2)B.点(1.5,0)C.点(1,2)D.点(1.5,4)【答案】D【解析】由题意知,y与x的线性回归方程=x+必过样本中心点,==1.5,==4,∵=x+=x+(-) =(x-)+,∴线性回归方程必过(1.5,4).4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:经检验,这组样本数据具有线性相关关系,那么对于加工零件的个数x与加工时间y这两个变量,下列判断正确的是()A.成正相关,其回归直线经过点(30,75)B.成正相关,其回归直线经过点(30,76)C.成负相关,其回归直线经过点(30,76)D.成负相关,其回归直线经过点(30,75)【答案】B【解析】由表格数据知,加工时间随加工零件的个数的增加而增加,故两变量为正相关,又由=(10+20+30+40+50)=30,=(64+69+75+82+90)=76,故回归直线过样本中心点(30,76).5.已知变量x与y负相关,且由观测数据算得样本平均数=4,=4.5,则由该观测数据算得的线性回归方程可能是()A.=0.4x+2.3B.=2x-2.4C.=-0.3x-3.3D.=-2x+12.5【答案】D【解析】变量x与y负相关,排除选项A,B;线性回归方程经过样本中心,把=4,=4.5,代入C不成立,代入D成立.6.根据如下样本数据得到的回归方程为=x+,则()A.a>0,b<0B.a>0,b>0C.a<0,b<0D.a<0,b>0【答案】D【解析】样本平均数=5.5,=-0.25,∴(xi-)(yi-)=23.75,(xi-)2=17.5,∴=>0,∴=-0.25-·5.5<0.7.某工厂生产某种产品的产量x(吨)与相应的生产能耗y(吨标准煤)有如表几组样本数据:据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得其回归直线的斜率为0.7,则这组样本数据的线性回归方程是()A.=0.7x+0.35B.=0.7x+1C.=0.7x+2.05D.=0.7x+0.45【答案】A【解析】设线性回归方程=0.7x+,由样本数据可得,=4.5,=3.5.因为回归直线经过点(,),所以3.5=0.7×4.5+,解得=0.35.8.已知一个线性回归方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则等于()A. 58.5B. 46.5C. 60D. 75【答案】A【解析】∵x∈{1,7,5,13,19},∴==9,∴=1.5×9+45=58.5.9.根据样本数据得到线性回归方程=x+,其中=9.1,则等于()A. 9.4B. 9.5C. 9.6D. 9.7【答案】A【解析】样本平均数=3.5,=42,∵样本数据中心点必在回归直线上,线性回归方程=x+,其中=9.1,∴=9.4.10.由下表可计算出变量x,y的线性回归方程为()A.=0.35x+0.15B.=-0.35x+0.25C.=-0.35x+0.15D.=0.35x+0.25【答案】A【解析】==3,==1.2,∴==0.35,=1.2-0.35×3=0.15,∴线性回归方程为=0.35x+0.15.11.如表是x和y之间的一组数据,则y关于x的线性回归方程必过()A.点(2,3)B.点(3,5)C.点(2.5,4)D.点(2.5,5)【答案】C【解析】由已知得:=(1+2+3+4)=2.5,=(1+3+5+7)=4,故y关于x的线性回归方程必过点(2.5,4).12.已知x与y之间的一组数据:则y与x的线性回归方程=x+必过点()A. (1,2)B. (5,2)C. (2,5)D. (2.5,5)【答案】C【解析】由表中数据可得:=(0+1+2+3+4)=2,=(1+3+5+7+9)=5,所以回归直线一定经过样本数据中心点(2,5),故选C.13.已知某种产品的支出广告额x与利润额y(单位:万元)之间有如下对应数据:则线性回归方程必过()A. (5,36)B. (5,35)C. (5,30)D. (4,30)【答案】A【解析】由题意可知线性回归方程必过样本中心坐标(,),即(5,36).14.已知变量x与y之间的线性回归方程为=-3+2x,若xi=17,则i的值等于()A. 3B. 4C. 0.4D. 40【答案】B【解析】∵i=17,∴=1.7,∵变量x与y之间的线性回归方程为=-3+2x,∴=-3+2×1.7=0.4,∴i=4.15.内江市某镇2009年至2015年中,每年的人口总数y(单位:万)的数据如下表:若t与y之间具有线性相关关系,则其线性回归方程=t+一定过点() A. (3,9)B. (9,3)C. (6,14)D. (4,11)【答案】A【解析】=(0+1+2+3+4+5+6)=3,=(8+8+8+9+9+10+11)=9,∴线性回归方程=t+一定过点(3,9).16.根据如下样本数据得到的线性回归方程必过点()A. (2,2)B. (1.5,2)C. (2,4)D. (1.5,4)【答案】C【解析】由表中数据可得:=(0+1+2+3+4)=2,=(1+3+4+5+7)=4,回归直线一定经过样本数据中心点(2,4),故选C.17.观察两个变量(存在线性相关关系)得如下数据:则两变量间的线性回归方程为()A.=x+1B.=xC.=2x+D.=x+1【答案】B【解析】根据表中数据,得=(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,=(-9-7-5-3+4.01+4.99+7+8)=0.∴两变量x、y间的线性回归方程过样本中心点(0,0),可以排除A、C、D选项,B选项符合题意.18.某镇2008年至2014年中,每年的人口总数y(单位:万)的数据如表:若t与y之间具有线性相关关系,则其线性回归直线=t+一定过点() A. (4,11)B. (6,14)C. (3,9)D. (9,3)【答案】C【解析】由题意,==3,==9,故线性回归直线=t+一定过点(3,9).19.如果在一次实验中,测得数对(x,y)的四组数值分别是A(1,2),B(2,3),C(3,6),D(4,7),则y与x之间的线性回归方程是()A.=x+1.9B.=1.8xC.=0.95x+1.04D.=1.05x-0.9【答案】B【解析】==2.5,==4.5,所以线性回归方程经过点(2.5,4.5).对于A,当x=2.5时,y=2.5+1.9=4.4≠4.5,对于B,当x=2.5时,y=1.8×2.5=4.5,对于C,当x=2.5时,y=0.95×2.5+1.04=3.415≠4.5;对于D,当x=2.5时,y=1.05×2.5-0.9=1.725≠4.5.20.对具有线性相关关系的变量x,y,有一组观测数据(xi,yi)(i=1,2,…,8),其线性回归方程是:=x+,且x1+x2+x3+…+x8=3,y1+y2+y3+…+y8=6,则实数的值是()A.B.C.D.【答案】D【解析】∵x1+x2+x3+…+x8=3,y1+y2+y3+…+y8=6,∴=,=,∴样本中心点的坐标为(,),代入线性回归方程,得=×+,∴=.21.在2010年3月15日那天,哈市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归方程是=-3.2x+,(参考公式:线性回归方程:=x+,=-),则等于()A.-24B. 35.6C. 40.5D. 40【答案】D【解析】==10,==8,=-=8-(-3.2)×10=40.故选D.22.已知x,y的取值如下表所示:如果y与x呈线性相关,且线性回归方程为=x+,则等于()A.-B.C.-D.【答案】A【解析】∵线性回归方程为=x+,线性回归方程过样本中心点,==3,==5,∴线性回归方程过点(3,5),∴5=3+,∴b=-.23.已知x与y之间的一组数据:已求得关于y与x的线性回归方程为=2.1x+0.85,则m的值为() A. 1B. 0.85C. 0.7D. 0.5【答案】D【解析】∵==,==,∴这组数据的样本中心点是(,),∵关于y与x的线性回归方程=2.1x+0.85,∴=2.1×+0.85,解得m=0.5.24.某种商品的广告费支出x与销售额y(单位:万元)之间有如下对应数据,根据表中提供的数据,得出y与x的线性回归方程为=6.5x+17.5,则表中的m的值为()A. 45B. 50C. 55D. 60【答案】D【解析】由题意,=(2+4+5+6+8)=5,=(30+40+m+50+70)=38+,∵y关于x的线性回归方程为=6.5x+17.5,∴38+=6.5×5+17.5,∴38+=50,∴=12,∴m=60.25.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法得线性回归方程=0.68x+54.6,表中有一个数据模糊不清,请你推断该数据的值为()A. 68B. 68.2C. 70D. 75【答案】A【解析】设表中有一个模糊看不清数据为m.由表中数据得=30,=,由最小二乘法求得线性回归方程=0.68x+54.6,将=30,=代入线性回归方程,得m=68.26.对于下列表格所示五个散点,已知求得的线性回归方程为=0.8x-155,则实数m的值为()A. 8B. 8.2C. 8.4D. 8.5【答案】A【解析】由题意,=(196+197+200+203+204)=200,=(1+3+6+7+m)=,代入=0.8x-155,可得=0.8×200-155,m=8.27.对具有线性相关关系的变量x,y,测得一组数据如下表:根据上表,利用最小二乘法得它们的线性回归方程为=10.5x+,则的值等于()A. 1B. 1.5C. 2D. 2.5【答案】B【解析】∵==5,==54,∴这组数据的样本中心点是(5,54),把样本中心点代入线性回归方程=10.5x+,∴54=10.5×5+,∴=1.5.28.根据如图样本数据得到的线性回归方程为=bx+a,若样本点的中心为(5,0.9).则当x每增加1个单位时,就()A.增加1.4个单位B.减少1.4个单位C.增加7.9个单位D.减少7.9个单位【答案】B【解析】由题意,==0.9,所以a+b=6.5,①因为样本中心为(5,0.9),所以0.9=5b+a,②联立①②可得b=-1.4,a=7.9,所以=-1.4x+7.9,所以x每增加1个单位,就减少1.4个单位.29.对于下列表格所示的五个散点,已知求得的线性回归方程为=0.76x-71.则实数m的值为()A. 6.8B. 7C. 7.2D. 7.4【答案】B【解析】由题意可得=(98+99+100+101+102)=100,同理可得=(2+3+5+m+8)=,代入线性回归方程可得=0.76×100-71,解得m=7.30.表格提供了某工厂节能降耗技术改造后,一种产品的产量x(单位:吨)与相应的生产能耗y(单位:吨)的几组对应数据:根据表中提供的数据,求得y关于x的线性回归方程为=0.7x+0.35,那么表格中t的值为() A. 3.5B. 3.25C. 3.15D. 6【答案】D【解析】==4.5,==2+,∵y关于x的线性回归方程为=0.7x+0.35,∴2+=0.7×4.5+0.35,∴t=6.31.根据如下样本数据得到的线性回归方程为=x+.若=7.9,则的值为() A. 1.4B.-1.4C. 1.2D.-1.2【答案】D【解析】样本平均数=5,=1.9,∵样本数据中心点必在回归直线上,将=5,=1.9代入=x+7.9得,1.9=5+7.9,解得=-1.2.32.已知x,y如下表所示,若x和y线性相关,且线性回归方程是=x+2.4,则等于()A. 0.7B. 0.8C. 0.9D. 1【答案】A【解析】根据所给的数据,得到=3,=4.5,∴这组数据的样本中心点是(3,4.5),∵线性回归方程一定过样本中心点,∴4.5=3+2.4,∴=0.7.33.根据如下样本数据得到的回归方程为=x+,则m的值为()A. 1B.C. 4D. 5【答案】C【解析】由题意,=1.5,=5+,∵y关于x的线性回归方程为=x+,根据线性回归方程必过样本的中心,∴5+=×1.5+,∴m=4.34.已知x、y取值如表:从所得的散点图分析可知:y与x线性相关,且=x+0.6,则等于() A. 0.95B. 1.00C. 1.10D. 1.15【答案】C【解析】由题意知,==4,=5,从而代入线性回归方程有=1.10.35.某种产品的广告费支出x与销售额y(单位:万元)之间有如下一组数据:若y与x之间的关系符合线性回归方程=6.5x+,则的值是()A. 17.5B. 27.5C. 17D. 14【答案】A【解析】由表格得=5,=50.∵y关于x的线性回归方程为=6.5x+,∴50=6.5×5+,∴=17.5.36.具有线性相关关系得变量x,y,满足一组数据如表所示,若y与x的线性回归方程为=3x-,则m的值()A. 4B.C. 5D. 6【答案】A【解析】由表中数据得,=,=,由最小二乘法求得线性回归方程=3x-,将=,=代入线性回归方程,得m=4.37.下表是降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为=0.7x+0.35,那么表中m 值为()A. 4B. 3.15C. 4.5D. 3【答案】D【解析】根据所给的表格可以求出==4.5,==,∵这组数据的样本中心点在线性回归直线上,∴=0.7×4.5+0.35,∴m=3.38.已知x、y的取值如下表,从散点图可以看出y与x线性相关,且线性回归方程为=0.7x+,则等于()A. 1.25B. 1.05C. 1.35D. 1.45【答案】B【解析】=(2+3+4+5)=3.5,=(2.5+3+4+4.5)=3.5,∴线性回归方程过点(3.5,3.5),代入得3.5=0.7×3.5+.∴=1.05.39.已知具有线性相关的两个变量x,y之间的一组数据如表:且线性回归方程是=0.95x+2.6,则t等于()A. 6.7B. 6.6C. 6.5D. 6.4【答案】A【解析】由题意可得,==2,==,线性回归方程是=0.95x+2.6,可得=0.95×2+2.6,解得t=6.7.40.下表为某班5位同学身高x(单位:cm)与体重y(单位kg)的数据,若两个度量间的线性回归方程为=1.16x+,则的值为()A.-122.2B.-121.04C.-91D.-92.3【答案】B【解析】由题意可得,==169,==75.因为回归直线经过样本中心,所以75=1.16×169+,解得=-121.04.41.已知x,y的取值如表:从所得的散点图分析,y与x线性相关,且=0.95x+,则等于() A. 2B. 3C. 2.1D. 3.1【答案】C【解析】由题意可知,==2,==4.因为回归直线经过样本中心,所以4=0.95×2+,解得=2.1.42.已知关于某设备的使用年限x(年)和所支出的费用y(万元),有如表所示的统计资料:根据上表提供的数据,求出了y关于x的线性回归方程为=1.23x+0.08,那么统计表中t的值为()A. 5.5B. 5.0C. 4.5D. 4.8【答案】A【解析】由题意可得=(2+3+4+5+6)=4,=(2.2+3.8+t+6.5+7.0)=3.9+0.2t,由回归方程过点(,)可得3.9+0.2t=1.23×4+0.08,解得t=5.5.43.已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归方程为=x+,根据中间两组数据(4,3)和(5,4)求得的直线方程为y=bx+a,则与b,与a的大小为()A.>b,>aB.>b,<aC.<b,>aD.<b,<a【答案】C【解析】由题意可知n=4,===4.5,===3.5,则===0.7,=-=3.5-0.7×4.5=0.35,过(4,3)和(5,4)的直线方程为=,即y=x-1,则b=1,a=-1,则<b,>a.44.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其线性回归方程是=x+,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是()A.B.C.D.【答案】B【解析】∵x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,∴=,=,∴样本中心点的坐标为(,),代入线性回归方程得,=×+,∴=.45.下面是学校当天食堂某窗口5天中出售的冷饮杯数和当天最高气温的记录数据,根据以下数据得线性回归方程为:=1.25x+,则等于()A. 6B. 7C. 8D. 9【答案】B【解析】=(25+27+32+22+34)=28,=(36+37+48+37+52)=42.把(,)代入线性回归方程得42=1.25×28+,解得=7.46.已知某产品的广告费用x(万元)与销售额y(万元)所得的数据如表:经分析,y与x有较强的线性相关性,且=0.95x+,则等于()A. 2.6B. 2.4C. 2.7D. 2.5【答案】A【解析】由题意可知,==2,==4.5.因为回归直线经过样本中心,所以4.5=0.95×2+,解得=2.6.47.某产品的广告费用x与销售额y的统计数据如表已知由表中4组数据求得线性回归方程=8x+14,则表中的a的值为()A. 37B. 38C. 39D. 40【答案】C【解析】==3.5,==.∴=8×3.5+14,解得a=39.48.已知具有线性相关关系的两个量x,y之间的一组数据如表:且线性回归方程是=0.95x+2.6,则m的值为()A. 4.5B. 4.6C. 4.7D. 4.8【答案】D【解析】==2,==.∴=0.95×2+2.6,解得m=4.8.49.某学生的四次500米测试成绩如下表(单位:分钟)所用时间y与测试次数x的线性回归方程为:=x+5.25,则等于()A. 0.7B.-0.6C. 0.6D.-0.7【答案】D【解析】由题意,==2.5,==3.5,代入y=x+5.25,可得3.5=2.5+5.25,所以=-0.7.50.由观测的样本数据算得变量x与y满足线性回归方程=0.6x-0.5,已知样本平均数=5,则样本平均数的值为()A. 0.5B. 1.5C. 2.5D. 3.5【答案】C【解析】线性回归方程=0.6x-0.5,已知样本平均数=5,则样本平均数=0.6×5-0.5=2.5.二、填空题(共30小题,每小题5.0分,共150分)51.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如表所示:由表可得回归直线方程为=-4x+,据此模型预测零售价为15元时,每天的销售量为________个.【答案】49【解析】∵由表格可知==17.5,==39,∴这组数据的样本中心点是(17.5,39),根据样本中心点在线性回归直线上,满足=-4x+,∴39=-4×17.5,∴=109,∴这组数据对应的线性回归方程是=-4x+109,∴当x=15时,=-4×15+109=49.52.调查某公司的四名推销员,其工作年限与年推销金额如表:由表中数据算出线性回归方程为=x+.若该公司第五名推销员的工作年限为8年,则估计他(她)的年推销金额为________万元.【答案】【解析】由条件可知=(3+5+10+14)=8,=(2+3+7+12)=6,代入线性回归方程,可得=-,所以=x-,当x=8时,=,估计他的年推销金额为万元.53.某工厂的某种型号的机器的使用年限x和所支出的维修费用y(万元)的统计资料如表:根据上表数据可得y与x之间的线性回归方程=0.7x+,据此模型估计,该机器使用年限为14年时的维修费用约为________万元.【答案】7.5【解析】∵由表格可知=9,=4,∴这组数据的样本中心点是(9,4),根据样本中心点在线性回归直线=0.7x+上,∴4=0.7×9+,∴=-2.3,∴这组数据对应的线性回归方程是=0.7x-2.3,∵x=14,∴=7.5.54.某研究机构对儿童记忆能力x和识图能力y进行统计分析,得到如下数据:由表中数据,求得线性回归方程为=x+,若某儿童的记忆能力为12时,则他的识图能力为________.【答案】9.5【解析】由表中数据得=7,=5.5,由(,)在直线=x+上,得=-,即线性回归方程为=x-.所以当x=12时,=×12-=9.5,即他的识图能力为9.5.55.某地区恩格尔系数y(%)与年份x的统计数据如下表:从散点图可以看出y与x线性相关,且可得线性回归方程=x+4 055.25,据此模型可预测2013年该地区的恩格尔系数(%)为________.【答案】29.25【解析】∵点(,)在回归直线上,计算得==2 005.5,==44.25,∴线性回归方程过点(2 005.5,44.25),代入得44.25=2 005.5×+4 055.25,∴=-2,当x=2013(年)时,该地区的恩格尔系数是2 013×(-2)+4 055.25=29.25.所以根据线性回归方程的预测,到2013年,该地区的恩格尔系数是29.25.56.如表是某单位1~4月份水量(单位:百吨)的一组数据:由散点图可知,用水量y与月份x之间有较强的线性相关关系,其线性回归方程是=-0.7x+,由此可预测该单位第5个月的用水量是________百吨.【答案】1.75【解析】==2.5,==3.5.∴3.5=-0.7×2.5+,解得=5.25.∴线性回归方程是=-0.7x+5.25.当x=5时,=-0.7×5+5.25=1.75.57.从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:根据上表可得线性回归方程:=0.56x+,据此模型预报身高为172 cm的高三男生的体重为________kg.【答案】70.12【解析】由表中数据可得==170,==69,∵(,)一定在线性回归方程=0.56x+上,∴69=0.56×170+,解得=-26.2,∴=0.56x-26.2,当x=172时,=0.56×172-26.2=70.12.58.某单位为了了解用电量y度与气温x(℃)之间的关系,统计了某4天的用电量与当天气温,数据如表:由表中数据可得线性回归方程中的=x+中的=-2,预测当气温为5 ℃时,该单位的用电量约为________度.【答案】50【解析】由题意,=×(18+13+10-1)=10,=(24+34+38+64)=40,将(10,40)代入线性回归方程中=x+中,且=-2,∴40=10×(-2)+,解得=60,∴=-2x+60,∴当x=5时,=-2×5+60=50.59.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定价格进行试销,得到数据如下表:根据上表可得线性回归方程=x+中的=-20,据此模型预报单价为10元时的销量为________件.【答案】50【解析】=(8+8.2+8.4+8.6+8.8+9)=8.5,=(90+84+83+80+75+68)=80.∵=-20,=x+,∴=80+20×8.5=250,∴线性回归方程为=-20x+250,当x=10时,=50.60.某产品的广告费x(万元)与销售额y(万元)的统计数据如表:根据如表可知线性回归方程=7x+,若广告费用为10万元,则预计销售额为________万元.【答案】73.5【解析】依题意知,=4.5,=35,利用线性回归方程恒过样本中心点,得35=4.5×7+,∴=3.5,∴当x=10时,=10×7+3.5=73.5.61.在一次考试中,5名学生的数学和物理成绩如表:(已知学生的数学和物理成绩具有线性相关关系)现已知其线性回归方程为=0.36x+,则根据此线性回归方程估计数学得80分的同学的物理成绩为______(四舍五入到整数).【答案】70【解析】由已知数据得,==70,==66,线性回归方程为=0.36x+,则66=0.36×70+,∴=40.8.线性回归方程为=0.36x+40.8,当x=80时,=0.36×80+40.8≈70.62.在一定范围内,对7块土质相同、形状大小也相同的试验田进行化肥用量对水稻产量影响的试验,得到的对应数据如表(单位:kg):根据表可得线性回归方程=x+中的为4.8,据此估计,当化肥用量为55 kg时,水稻产量为________kg.【答案】519.3【解析】由已知可得:=(15+20+25+30+35+40+45)=30,=(330+345+365+405+445+450+455)≈399.3,∵线性回归方程=x+中的为4.8,故=399.3-4.8×30=255.3,当化肥用量为55 kg时,水稻产量约为=4.8×55+255.3=519.3.63.某产品的广告费用x万元与销售额y万元的统计数据如下表:根据上表可得回归方程=x+中为9.4,据此模型预报广告费用为6万元时,销售额为65.5,则,m分别为________.【答案】9.1,54【解析】∵线性回归方程=x+中为9.4,据此模型预报广告费用为6万元时,销售额为65.5,∴=9.1,∴=9.4x+9.1,∵=(4+2+3+5)=3.5,∴=(49+26+39+m)=42,∴m=54.64.某公司的广告费支出x与销售额y(单位:万元)之间有下列对应数据:由资料显示y对x呈线性相关关系.根据上表提供的数据得到线性回归方程=x+中的=6.5,预测销售额为115万元时约需________万元广告费.参考公式:线性回归方程为=x+,其中=,=-.【答案】15【解析】∵==5,==50,∴这组数据的样本中心点是(5,50),∵=6.5,∴=6.5x+,把样本中心点代入得=17.5,∴线性回归方程是=6.5x+17.5,当y=115时,x≈15.65.某商品在5家商场的售价x(元)和销售量y(件)之间的一组数据如下表所示:由散点图可知,销售量y与价格x之间有较好的线性相关关系,且线性回归方程是=-3.2x+4a,则a=________.【答案】10【解析】根据题意得,==10,==+6,因为回归直线过样本中心点(,),所以+6=-3.2×10+4a,解得a=10.66.某产品的广告费用x与销售额y的统计数据如表:根据表格已得线性回归方程为=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值为________.【答案】37【解析】设该数据的值为a,依题意知,=3.5,=(131+a),∵利用线性回归方程恒过样本中心点,∴(131+a)=3.5×9.4+9.1,∴a=37.67.已知下列表格所示的数据的线性回归方程为=3.8x+,则的值为________.【答案】242.8【解析】由表格可知,样本中心横坐标为=4,纵坐标为=258.由回归直线经过样本中心点,所以258=3.8×4+,=242.8.68.某单位为了制定节能减排的目标,先调查了用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据,得线性回归方程=-2x+,则=________.【答案】60【解析】由表格得==10,==40,(,)在线性回归方程=-2x+上,∴40=10×(-2)+,解得=60.69.为了研究某种细菌在特定环境下,随时间变化繁殖情况,得如下实验数据,计算得回归直线方程为=0.85x-0.25.由以上信息,得到下表中c的值为_______________.【答案】6【解析】∵=(3+4+5+6+7)=5,=(2.5+3+4+4.5+c)=,∴这组数据的样本中心点是(5,),把样本中心点代入线性回归方程=0.85x-0.25,∴=0.85×5-0.25,∴c=6.70.一位大学生在暑期社会实践活动中,为了解农村家庭年储蓄y与年收入x的关系,抽取了20个家庭进行调查,根据获得的数据计算得xi=100,yi=40,并得到家庭年储蓄y对年收入x的线性回归方程为=x-1.5,则=________.【答案】0.7【解析】因为x i=100,y i=40,所以=5,=2,代入=x-1.5,可得2=5-1.5,所以=0.7.71.已知下表所示数据的线性回归方程为=4x+242.则实数a=________.【答案】262【解析】由题意,=4,=(1 028+a),代入=4x+242,可得(1 028+a)=4×4+242,∴a=262.72.某产品的广告费用x(单位:万元)的统计数据如下表:根据上表可得线性回归方程=9.4x+9.1,表中有一数据模糊不清,请推算该数据的值为________.【答案】39【解析】设●为a,则由题意,=3.5,=(129+a),代入=9.4x+9.1,可得(129+a)=9.4×3.5+9.1,∴a=39.73.某脑科研究机构对高中学生的记忆力x和判断力y进行统计分析,得到下表数据:由散点图可以看出x与y具有线性关系,若线性回归方程为=x-2.3,则=________.【答案】0.7【解析】∵线性回归方程经过样本中心点坐标,∴==9,==4,将样本中心点(9,4)代入线性回归方程为=x-2.3,可得4=×9-2.3.解得=0.7.74.对具有线性相关关系的变量x,y,测得一组数据如下表,若y与x的线性回归方程为=3x-,则m=________.【答案】4【解析】由题意,=1.5,=,∴样本中心点的坐标为(1.5,),∵回归直线必过样本中心点,y与x的线性回归方程为=3x-,∴=3×1.5-1.5,∴m=4.75.根据如下样本数据得到的线性回归方程为=x+.若=7.9,则的值为________.【答案】-1.4【解析】由题意可得=(3+4+5+6+7)=5,=(4+2.5-0.5+0.5-2)=0.9,∵线性回归方程为=x+.若=7.9,且回归直线过点(5,0.9),∴0.9=5+7.9,解得=-1.4.76.某企业对自己的拳头产品的销售价格(单位:元)与月销售量(单位:万件)进行调查,其中最近五个月的统计数据如下表所示:由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归直线方程是:=-3.2x+40,则n=________.【答案】10【解析】由题意,==10,==,因为线性回归方程是:=-3.2x+40,所以=-32+40,所以n=10.77.高三某学习小组对两个相关变量收集到6组数据如下表:由最小二乘法得到线性回归方程=0.82x+11.3,发现表中有两个数据模糊不清,则这两个数据的和是_____________________________________________________.【答案】89【解析】由表中数据得:=35,=(151+m+n),由最小二乘法求得线性回归方程=0.82x+11.3,将=35,=(151+m+n),代入线性回归方程,得m+n=89.78.已知相关变量x,y之间的一组数据如下表所示,回归直线=x+所表示的直线经过的定点为(1.5,5),则mn=________.【答案】12【解析】∵线性回归方程经过中心点坐标,∴==1.5;==5,解得m=6,n=2.∴mn=12.79.下表提供了某学生做题数量x(道)与做题时间y(分钟)的几组对应数据:根据上表提供的数据,求出y关于x的线性回归方程为=0.7x+0.35,则表中t的值为________.【答案】3【解析】由题意,==4.5,==,∵y对x 的线性回归方程是=0.7x+0.35,∴=0.7×4.5+0.35,∴t=3.80.对具有相关性的变量x、y,其样本中心为(2,3),若y与x 的线性回归方程为=mx -,则m =________.【答案】【解析】∵回归直线必过样本中心点(2,3),y与x 的线性回归方程为=mx -,∴3=2m -,∴m =.三、解答题(共0小题,每小题12.0分,共0分)41。
高中数学 第一章 统计 相关性与最小二乘估计训练 北师大版必修3
相关性与最小二乘估计变量间的相关性是统计的重要内容,通过收集实际问题中两个有关联变量的数据作出散点图,由散点图直观认识变量间的相关性。
若线性相关,根据最小二乘法建立线性回归方程是这一节的重要内容。
在各类考试中,本节难度不大,是基础题,主要考查变量间相关性的判断、画散点图、求线性回归方程以及利用线性回归方程对总体进行估计等,下面举例剖析。
1用定义判断两个变量间的相关性例1下列关系中,具有相关性的是( )①人的身高与体重;②学生的身高与学生的学习成绩; ③教师的执教水平与学习成绩;④球的表面积与球的半径。
A ①② B ①③ C ②③ D ②④解析:人的身高越高,一般来说体重越大,具有相关性;学生的身高与学习成绩不具有相关性;教师的执教水平越高,一般来说学生的学习成绩越好,具有相关性;球的半径确定,表面积也随之确定,所以球的表面积与球的半径之间是函数关系,不具有相关性,故选B. 点评:相关性是指两个变量间确实有关系,但又不具备函数关系所要求的确定性,两个变量间的关系具有随机性和不确定性,主意并不是任何两个变量间都有相关性。
2用散点图判断两个变量间的相关性例2下面的4个三点图中,两个变量具有相关性的是( )A ①②B ①③C ②④D ③④解析:由图可知①是一次函数关系,不是相关关系;②的所有点在一条直线附近波动,是线性相关的;③的散点不具任何关系,是不相关的;④的散点在某曲线附近波动是非线性相关的,即两个变量具有相性的是②④,故选C.点评:散点图直观的描述了两个变量间有没有相关性。
由散点图判断相关关系有两种情况,若所有的点看上去都在一条直线波动,是线性相关的;若所有的点看上去都某条曲线附近波动,是非线性相关德。
这两种情况都说明两个变量间具有相关性。
3求回归方程及应用例3某车间为了规定工时定额,数据如下:(1)在图1中画出表中数据的散点图,并判断两个 变量之间是否具线性相关?(2)求加工时间y 与零件个数x 之间的回归直线方程, 并在图1中画出回归直线;(3)试预测加工10个零件需要多少时间.(注:x b y axn xy x n yx bni ini ii ˆˆ,ˆ1221-=--=∑∑==) 解析:(1)散点图如图2, y 与x 具有线性相关系. (2)由表中数据得5.3)5432(41=+++=x , 5.3)5.4435.2(41=+++=y , ,54251694412=+++=∑=i ix,5.525.4544335.2241=⨯+⨯+⨯+⨯=∑=i ii yx05.15.37.05.3ˆˆ,7.05.34545.35.345.52ˆ2=⨯-=-==⨯-⨯⨯-=∴x b y a b, 故回归直线方程为05.17.0ˆ+=x y. (3)当10=x 时,05.805.1107.0ˆ=+⨯=y(小时) 所以预测加工10个零件需要8.05小时.点评:求线性回归方程的基本步骤:①画出两个变量的散点图,观察它们是否具有相关性; ②线性相关,用最小二乘法估计线性回归方程中的参数; ③写出回归直线方程.由于求回归方程时计算量太大,因此计算时要认真细致力求准确.2图。
(常考题)北师大版高中数学必修三第一章《统计》检测卷(有答案解析)(4)
一、选择题1.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,82.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元4.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2B .-0.7C .-0.2D .0.77. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50 B .70和67C .75和50D .75和679.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.510.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .2911.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s12.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .91二、填空题13.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 14.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 15.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示: 等级A + AB + BB -C + CC -D + DE 分数 7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B级及以上,平均分是64分,这个班级选考物理学业水平等级考的.人数至少为______人16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:^y=0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.18.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
高中数学 第一章 统计 1.8 最小二乘估计自我小测 北师
高中数学第一章统计 1.8 最小二乘估计自我小测北师大版必修31.根据一组数据判断两个变量是否线性相关时,应选( ).A.茎叶图 B.频率分布直方图C.散点图 D.频率折线图2.下列两个变量中具有相关关系的是( ).A.正方体的体积与棱长B.匀速行驶的车辆的行驶距离与时间C.人的身高与体重D.人的身高与视力3.下列关系中为相关关系的有( ).①学生的学习态度和学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A.①② B.①③ C.②③ D.②④4.能从各散点图中点的分布状况,直观上判断两个量之间有线性相关关系的是( ).5.下列两个变量之间的关系不是函数关系的是______.①角度和它的余弦值②正方形的边长和周长③正n边形的边数和内角和④人的体重和身高6.下面各组变量之间具有相关关系的是______(填上正确答案的序号).①高原含氧量与海拔高度.②速度一定时,汽车行驶的路程和所用的时间.③学生的成绩和学生的学号.④父母的身高和子女的身高.7.某个男孩的年龄与身高的统计数据如下:8.在7块并排的、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg):(1)(2)判断它们是否具有线性相关关系.参考答案1.答案:C2.解析:函数关系是一种确定的关系,而相关关系则是一种不确定的关系.A,B两项为函数关系,C项是相关关系,D项则无任何关系.答案:C3.答案:A4.解析:在选项A中,点的分布毫无规则,横轴、纵轴表示的两个量之间的相关程度很小.在选项B中,所有的点严格地分布在一条直线上,横轴、纵轴表示的两个量之间有确定的关系——函数关系.在选项C中,点的分布基本上集中在一个带状区域内,横轴、纵轴表示的两个变量之间有线性相关关系.在选项D中,点的分布基本上集中在某条曲线两侧带状区域内,因此横轴、纵轴表示的两个变量也有相关关系,只是它是非线性相关关系.答案:C5.解析:由函数关系与相关关系的概念即知.答案:④6.答案:①④7.解:散点图如右.由散点图可清楚地看到,在一定的范围内,这个男孩的年龄与身高具有明显的线性相关关系.8.分析:(1)以施化肥量为横坐标,其对应的观测值为纵坐标,在平面直角坐标系中描点,得散点图;(2)由散点图分析是否具有线性相关关系,如果散点图中的点分布在一条直线附近,说明两个变量具有线性相关关系,否则不具有线性相关关系.解:(1)散点图如图所示.(2)观察散点图,知散点图中的点分布在一条直线附近,则水稻产量与施化肥量之间具有线性相关关系.。
【统计】高中数学第一章统计18最小二乘估计自主练习北师大版必修3
【关键字】统计高中数学第一章统计 1.8 最小二乘估计自主练习北师大版必修3我夯基我达标1.设有一个返回方程y=2-1.5x,则变量x增加一个单位时( )A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位思路解析:(2-1.5x1)-(2-1.5x2)=-1.5(x1-x2),若变量x增加一个单位,即x1-x2=1,则y平均减少1.5个单位,所以应选C.答案:C2.线性返回方程y=a+bx必定过( )A.(0,0)B.(,0)C.(0,)D.(,)思路解析:由公式中的a=-b,得=b+a,又(xi,yi)(i=1,2,…,n)的中心点(,)恰好满足方程=b+a,故线性返回方程y=a+bx必过(,)点.答案:D3.近10年来,某市社会商品零售总额与职工工资总额数据如下(单位:亿元):工资总额x23.8 27.6 31.6 32.4 33.7 34.9 43.2 52.8 63.8 73.4 社会商品总额y41.4 51.8 61.7 67.9 68.7 77.5 95.9 137.4 155.0 175.0建立社会商品零售总额y与职工工资总额x的线性返回方程是( )A.y=2.799 1x-27.248 5B.y=2.799 2x-23.549 3C.y=2.699 2x-23.749 3D.y=2.899 2x-23.749 4思路解析:利用计算器容易求得,xi,yi,xi2,xiyi,代入公式求出a、b得方程为y=2.799 2x-23.549 3.答案:B4.针对某工厂某产品产量与单位成本的资料进行线性返回分析如下:月份产量(千件)x i单位成本(元/件)y ix i2x i y ia=71-(-1.8182)×621≈77.371 2 73 4 146则产量每增加1 000件,单位成本下降_______元.思路解析:由上表可得y=-1.818 2x+77.37,产量每增加1千件,则单位成本下降 1.818 2元.答案:1.818 25.某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病人数的线性返回分析如下表所示:年份(x i) 该年新发病人数(y i)x=1 997.5,y=2 540.25 1996 2 4001997 2 49119982 586b =∑∑==--412241i ii iixn xyx n yx =94.7a =y -b x =-186 62319992 684如果不加控制,仍按这个趋势发展下去,请预测从2000年初到2003年底的四年时间里,该地区这种病的新发病总人数约为_______.思路解析:由上表可得:y=94.7x-186 623,当x 分别取2 000,2 001,2 002,2 003时,得估计值分别为:2 777,2 871.7,2 966.4,3 061.1,则总人数约为 2 777+2 871.7+2 966.4+3 061.1≈11 676. 答案:11 6766.在10年期间,一城市居民的年收入与某种商品的销售额之间的关系有如下数据. 第n 年 1 2 3 4 5 居民年收入x (亿元) 32.2 31.1 32.9 35.8 37.1某商品销售额y (万元) 25.0 30.0 34 37 39.0 第n 年6 7 8 9 10 居民年收入x (亿元) 38.0 39.0 43 44.6 46.0 某商品销售额y (万元) 4142424851.0(1)画出散点图;(2)如果它们具有线性关系,请用Excel 软件求出返回直线方程.思路分析:通过散点图检验两个变量是否具有线性相关关系后,再求返回方程.从散点图能看出它们有较好的线性关系. 解:(1)根据数据画出散点图.(2)从散点图看出它们具有线性关系,可以用最小二乘估计方法或用Excel 软件求出返回直线方程y=1.447x-15.843.7.某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下: 月人均收入x (元) 300 390 420 504 570 700 760 800 850 1 080 月人均生活费y (元) 255 324 330 345 450 520 580 650 700 750 利用上述资料: (1)画出散点图;(2)如果变量x 与y 之间具有线性相关关系,求出返回直线方程; (3)测算人均收入为280元时,人均生活费支出应为多少元?思路分析:这是一个实际应用的返回分析问题,其实就是找出返回方程,通过返回直线方程来分析月人均收入与月人均生活费的关系. 解:(1)散点图如图所示.(2)返回直线方程为y=0.707 61x+39.371 03.(3)测算人均收入为280元时,人均生活费支出应为237.5元.我综合我发展8.每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度(单位:kg/cm2)之间的关系有如下数据. x 150 160 170 180 190 200 y 56.9 58.3 61.6 64.6 68.1 71.3x 210 220 230 240 250 260 y74.1 77.4 80.2 82.6 86.4 89.7(1)利用散点图判断它们的相关性;(2)如果y 与x 之间具有线性相关关系,求返回直线方程.思路分析:求返回直线方程和相关系数,通常是用计算器来完成的.在有的较专门的计算器中,可通过直接按键得出返回直线方程的系数和相关系数,而如果要用一般的科学计算器进行计算,先列出相应的表格,有了表格中的那些相关数据,返回方程中的系数和相关系数就都容易求出了.解:(1)画出散点图.(2)从散点图看出y 与x 具有线性关系,可以用计算机或计算器求出线性返回方程y=0.304x+10.283.9.以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系: 销售经验(年) 1 3 4 4 6 8 10 10 11 13 年销售额(千元) 80 97 92 102 103 111 119 123 117 136 (1)依据这些数据画出散点图并作直线y=78+4.2x,计算 (2)依据这些数据由最小二乘法求回归直线方程,并据此计算∑=-1012;)ˆ(i ii y y(3)比较(1)和(2)中的平方和∑=-1012)ˆ(i i iyy的大小,谁更好一些? 思路分析:由回归方程的系数的计算公式进行计算.通过本题的解答体会最小二乘估计的优越性.解:(1)散点图与直线y ^=78+4.2x 的图形如下图所示,对x =1,3,…,13,有y ^=82.2,90.6,94.8,94.8,103.2,111.6,120,120,124.2,132.6,∑=-1012)ˆ(i i iyy=178.48. (2)∑∑===-===1011012,142)(,108,7101i i i i x x y x x ∑=--101))((i i iy y x x=568,所以b =142568=4,a =y -b x =108-4×7=80,故yˆ=4x +80. i yˆ=84,92,96,96,104,112,120,120,124,132. (3)比较可知,用最小二乘法求出的∑=-1012)ˆ(i i iyy较小,用最小二乘估计的算法优越一些. 10.一机器可以按各种不同速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下列即为其试验结果: 速度 每小时生产有问题物件数 8 5 12 8 14 9 16 11(1)求出机器速度影响每小时生产有问题物件数的回归直线方程;(2)若实际生产中所允许的每小时最大问题物件数为10,那么,机器的速度不得超过多少转/秒?思路分析:把题中的量用回归分析的专用术语改写后再顺着回归分析的一般步骤解题. 解:(1)用x 来表示机器速度,y 表示每小时生产的有问题的物件数,那么有: (x 1,y 1)=(8,5),(x 2,y 2)=(12,8),(x 3,y 3)=(14,9),(x 4,y 4)=(16,11), 则x =12.5,y =8.25. 回归直线的斜率为b =∑∑==--ni ini iixn xyx n yx 1221=0.728 6.截距a =x b y -=-0.857 1.所以所求的回归方程为y =0.728 6x -0.857 1.(2)根据公式y =0.728 6x -0.857 1,要使y ≤10,即0.728 6x -0.857 1≤10, ∴x ≤14.901 3,即机器的速度不能超过14.901 3转/秒.11.一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间有如下一组数据. x 1.08 1.12 1.19 1.28 1.36 1.48 y 2.25 2.37 2.40 2.55 2.64 2.75x 1.59 1.68 1.80 1.87 1.98 2.07 y 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求月成本y 与月产量x 之间的回归直线方程.思路分析:从散点图中我们看出该月产量与总成本符合方程y =1.277 0x +0.853 7,很好地反映了它们之间的关系,我们可以根据要达到的产量来确定需要的总成本.解:(1)(2)利用计算器计算得∑====1212,5822.2,7541.1125.18i i x y x =29.808,∑=1212i i y =97.768 1,∑=121i i i y x =53.86.利用公式求得b ≈1.277 0,a =y -bx ≈0.853 7. 因此所求回归直线方程为y =1.277 0x +0.853 7.此文档是由网络收集并进行重新排版整理.word 可编辑版本!。
高中数学第一章统计1.8最小二乘估计同步训练北师大版必修3【含答案】
§8 最小二乘估计1.工人工资(元)依劳动生产率(千元)变化的线性回归方程为y =50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率每提高1 000元,则工资平均提高80元C .劳动生产率每提高1 000元,则工资平均提高130元D .当月工资为210元时,劳动生产率提高2 000元 2.下列说法中不正确的是( )A .回归方程中,变量x 和y 都是普通变量B .变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定C .回归系数可能是正的也可能是负的D .如果回归系数是负的,y 的值随x 的增大而减小 3.关于最小二乘法的叙述,不正确的是( ) A .它是使总离差的平方和最小的一种计算方法B .用最小二乘法求出的系数可以使回归直线更贴近实际情况C .由观察值使用最小二乘法求出的系数a 、b 叫回归系数D .根据最小二乘法求出回归系数,从而可以表示出线性回归方程,这个方程可以代表每个数据的准确值4.对于线性回归方程y =4.75x +257,当x =28时,y 的估计值是( ) A .360 B .390 C .420 D .4505.为了表示n 个点与相应直线在整体上的接近程度,我们表示它常用(∑i =1nxi 为求和符号,表示为 ∑i =1nxi =x1+x2+…+xn)( )A.∑i =1n[yi -(a +bxi)] B.∑i =1n[(a +bxi)-yi] C.∑i =1n[yi -(a +bxi)]2 D.∑i =1n(yi -y )2 答案:1.B 由线性回归方程的意义,当x 每提高1(千元)时,y 平均约提高80元,∴应选B.2.A 变量x 、y 可以都是随机变量,也可以一个是普通变量,一个是随机变量,故A 不正确. 3.D 最小二乘法是求回归直线方程系数的一种方法,它求出的系数使总离差的平方和最小,也就是使表示出的回归直线更贴近实际,但是回归直线只能是估计数据的情况,不能准确表示数据的具体情况.4.B 将x 的值28代入回归直线方程得到的函数值即为y 的估计值,∴估计值是4.75×28+257=390.故选B.5.C 由最小二乘法的定义知,C 正确.1.下列有关线性回归方程的说法,不正确的是( )A .线性回归方程的两个变量对应的点大都分布在某一直线附近B .线性回归方程中两个变量的实际值,不一定是线性回归方程的解C .线性回归方程最能代表观测值x 、y 之间的关系D .任何一组观测值都能得到具有代表意义的回归直线方程2.设有一个线性回归方程为y =2-1.5x ,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位3.(2009山东烟台模拟,6)由一组样本数据(x1,y1),(x2,y2),…,(xn ,yn)得到的线性回归方程为y =bx +a ,那么下列说法不正确的是( ) A .直线y =bx +a 必经过点(x ,y )B .直线y =bx +a 至少经过点(x1,y1),(x2,y2),…,(xn ,yn)中的一个点C .直线y =bx +a 的斜率为∑i =1nxiyi -n xy∑i =1nx2i -n x 2D .直线y =bx +a 和各点(x1,y1),(x2,y2),…,(xn ,yn)的偏差∑i =1n[yi -(bxi +a)]2是该坐标平面上所有直线与这些点的总离差中最小的直线4.某炼钢厂废品率x(%)与成本y(元/t)的线性回归方程为y =105.492+42.569x ,当成本控制在176.5元/t 时,可以预计生产1 000 t 钢中,约有 t 钢是废品.5.某种产品的广告费支出x 与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图; (2)求线性回归方程;(3)若该产品的广告费为900万元,则其销售额约是多少?答案:1.D 两个变量如果是线性相关的,我们就可以用一条直线来近似找到两个变量间的数量关系,但这样的直线不止一条.如果一条直线与散点图上的所有的点的距离最小,我们就把这条直线称为回归直线,相应的方程称为线性回归方程,由此概念可知D 项不对. 2.C b =-1.5<0,∴x 增加一个单位时,y 平均减少1.5个单位,故选C.3.B 由回归方程的求法知:a =y -b x ,即y =a +bx =y -b x +bx ,y -y =b(x -x ),所以(x ,y )在直线上,即A 正确;回归直线不一定经过散点图中的点,只要求直线到各点的距离的离差的平方和最小,即C 、D 两项正确.4.16.68 ∵176.5=105.492+42.569x ,∴x≈1.668,即成本控制在176.5元/t 时,废品率为1.668%,所以,生产1 000 t 钢中,约有1 000×1.668%=16.68(t)钢是废品. 5.解:(1)散点图如下图(2)列出下表,并用科学计算器进行有关计算.于是可得,b =∑i =15xiyi -5xy∑i =15x2i -5x 2=1 380-5×5×50145-5×52=6.5,a =y -b x =50-6.5×5=17.5,于是所求的回归直线方程是y =6.5x +17.5.(3)由(2)知,销售额y 对广告费x 的线性回归方程为:y =6.5x +17.5, ∴当x =9(百万)时,y =6.5×9+17.5=76(百万), ∴当广告费为900万元时,销售额约是7 600万元.1.变量y 与x 之间的线性回归方程( ) A .表示y 与x 之间的函数关系 B .表示y 与x 之间的不确定性关系 C .反映y 与x 之间的真实关系形式D .反映y 与x 之间的真实关系达到最大限度的吻合 答案:D2.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的.他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y 与父亲的身高x 的回归方程y =a +bx 中,b 的取值范围是( )A .(-1,0)B .(-1,1)C .(0,1)D .[1,+∞) 答案:C 由遗传规律知,父母高者,其子女也较高, ∴b>0,又由子代平均身高向中心回归,∴b<1,故选C.3.某化工厂为预测某产品的回收率y ,要研究它和原料有效成分含量x 之间的相关关系,现取了8对观察值,计算得: ∑i =18xi =52,∑i =18yi =228,∑i =18x2i =478,∑i =18xiyi =1 849,则y 对x 的回归方程是( )A .y =11.47+2.62xB .y =-11.47+2.62xC .y =2.62+11.47xD .y =11.47-2.62x答案:A ∵x =18(x1+x2+…+x8)=18×52=6.5,y =18(y1+y2+…+y8)=18×228=28.5,∴由公式得b =1 849-8×6.5×28.5478-8×6.52≈2.62,∴a=y -b x =28.5-2.62×6.5=11.47,∴线性回归方程为:y =11.47+2.62x.4.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y 与x 具有相关关系,线性回归方程为y =0.66x +1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ) A .72% B .83% C .66% D .67%答案:B 由已知y =7.675,代入线性回归方程y =0.66x +1.562,得x≈9.262 1, ∴所求百分比为7.6759.262 1≈83%.∴选B.5.(2009宁夏银川模拟,7)某调研人员从调查中获知某公司近年来科研费用支出(xi)万元与公司所获得利润(yi)万元的统计资料如下表:则利润(yi)对科研费用支出(xi)的线性回归方程为( ) A .y =2x +20 B .y =20x +2 C .y =2x +40 D .y =-2x +40答案: A 由最小二乘法求出线性回归方程的系数分别为2和20,所以线性回归方程是y =2x +20,故选A.6.对于一条线性回归直线y =a +bx ,如果x =3时,对应的y 的估计值是17,当x =8时,对应的y 的估计值是22,那么可以估计出回归直线方程是________,由此判断当x =________时,y 的估计值为38.答案:y =x +14 24 首先把两组值代入线性回归方程,得⎩⎪⎨⎪⎧3b +a =178b +a =22⇒⎩⎪⎨⎪⎧b =1a =14,所以回归直线方程是y =x +14;令y =38,求得x =24.7.(易错题)下列五个命题,正确命题的序号为. ①任何两个变量都具有相关关系.②圆的周长与该圆的半径具有相关关系.③某商品的需求量与该商品的价格是一种非确定性关系. ④根据散点图求得的线性回归方程可能是没有意义的.⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究. 答案:③④⑤ 变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归方程是描述这种关系的有效的方法.如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程是没有意义的. 点评:(1)两个变量之间可能具有“确定性关系(即函数关系)”,也可能具有“相关关系”,还可能“没有任何关系”,判断两个变量之间的关系要注意弄清“函数关系”与“相关关系”的不同点,否则会出错.(2)通过散点图可判断两变量的相关关系,只有两个变量具有相关关系时,求线性回归方程才有意义,否则求回归直线方程或由方程进行估计都会失去意义.基础知识把握不牢是本题错解的主要原因.8.要分析学生初中升学考试的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽取10名学生,分析他们入学的数学成绩(x)和高一年级期末数学考试成绩(y)(如下表):(1)画出散点图;(2)判断入学成绩(x)与高一期末考试成绩(y)是否有线性相关关系;(3)如果x 与y 具有线性相关关系,求出线性回归方程;(4)若某学生入学数学成绩为80分,试估计他高一期末数学考试成绩. 解:(1)入学成绩(x)与高一期末考试成绩(y)两组变量的散点图如下:(2)从散点图可以看出这两组变量具有线性相关关系.(3)设所求的线性回归方程为y =a +bx ,经计算可得:x =70,y =76.3,其他数据如下表. i 1 2 3 4 5 6 7 8 9 10 合计 xi 63 67 45 88 81 71 52 99 58 76 700 yi 65 78 52 85 92 89 73 98 56 75 763 xi23 9694 489 2 025 7 7446 561 5 041 2 704 9 801 3364 5 77651 474xiyi 4 095 5 226 2 340 7 480 7 452 6 319 3 796 9 702 3 248 5 700 55358 ∴b=55 358-10×70×76.351 474-10×702=1 9482 474≈0.7 874,a =y -b x =76.3-0.787 4×70≈21.18.因此所求的线性回归方程为y =21.18+0.787 4x.(4)把某学生入学数学成绩80分代入线性回归方程可得:y≈84分,即这个学生高一期末数学成绩预测值为84分.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关性与最小二乘估计
变量间的相关性是统计的重要内容,通过收集实际问题中两个有关联变量的数据作出散点图,由散点图直观认识变量间的相关性。
若线性相关,根据最小二乘法建立线性回归方程是这一节的重要内容。
在各类考试中,本节难度不大,是基础题,主要考查变量间相关性的判断、画散点图、求线性回归方程以及利用线性回归方程对总体进行估计等,下面举例剖析。
1用定义判断两个变量间的相关性
例1下列关系中,具有相关性的是( )
①人的身高与体重;②学生的身高与学生的学习成绩; ③教师的执教水平与学习成绩;④球的表面积与球的半径。
A ①② B ①③ C ②③ D ②④
解析:人的身高越高,一般来说体重越大,具有相关性;学生的身高与学习成绩不具有相关性;教师的执教水平越高,一般来说学生的学习成绩越好,具有相关性;球的半径确定,表面积也随之确定,所以球的表面积与球的半径之间是函数关系,不具有相关性,故选B. 点评:相关性是指两个变量间确实有关系,但又不具备函数关系所要求的确定性,两个变量间的关系具有随机性和不确定性,主意并不是任何两个变量间都有相关性。
2用散点图判断两个变量间的相关性
例2下面的4个三点图中,两个变量具有相关性的是( )
A ①②
B ①③
C ②④
D ③④
解析:由图可知①是一次函数关系,不是相关关系;②的所有点在一条直线附近波动,是线性相关的;③的散点不具任何关系,是不相关的;④的散点在某曲线附近波动是非线性相关的,即两个变量具有相性的是②④,故选C.
点评:散点图直观的描述了两个变量间有没有相关性。
由散点图判断相关关系有两种情况,若所有的点看上去都在一条直线波动,是线性相关的;若所有的点看上去都某条曲线附近波动,是非线性相关德。
这两种情况都说明两个变量间具有相关性。
3求回归方程及应用
例3某车间为了规定工时定额,
x
数据如下:
(1)在图1中画出表中数据的散点图,并判断两个 变量之间是否具线性相关?
(2)求加工时间y 与零件个数x 之间的回归直线方程, 并在图1中画出回归直线;
(3)试预测加工10个零件需要多少时间.
(注:x b y a
x
n x
y x n y
x b
n
i i
n
i i
i ˆˆ,ˆ1
2
21
-=--=∑∑==) 解析:(1)散点图如图2, y 与x 具有线性相关系. (2)由表中数据得5.3)5432(4
1
=+++=
x , 5.3)5.4435.2(4
1
=+++=
y , ,542516944
1
2=+++=∑=i i
x
,5.525.4544335.224
1
=⨯+⨯+⨯+⨯=∑=i i i y x
05.15.37.05.3ˆˆ,7.05
.34545.35.345.52ˆ2
=⨯-=-==⨯-⨯⨯-=∴x b y a b
, 故回归直线方程为05.17.0ˆ+=x y
. (3)当10=x 时,05.805.1107
.0ˆ=+⨯=y
(小时) 所以预测加工10个零件需要8.05小时.
点评:求线性回归方程的基本步骤:①画出两个变量的散点图,观察它们是否具有相关性; ②线性相关,用最小二乘法估计线性回归方程中的参数; ③写出回归直线方程.由于求回归方程时计算量太大,因此计算时要认真细致力求准确.
2
图。