2019版高考数学一轮复习第9章统计、统计案例第3讲变量相关关系与统计案例习题课件

合集下载

高考数学一轮复习第九章统计与统计案例第3节变量间的相关关系与统计案例课件

高考数学一轮复习第九章统计与统计案例第3节变量间的相关关系与统计案例课件
答案:5%
[典题体验] 4.(2020·日照一中检测)两个变量 y 与 x 的回归模型 中,分别选择了 4 个不同模型,它们的相关指数 R2 如下, 其中拟合效果最好的模型是( ) A.模型 1 的相关指数 R2 为 0.98 B.模型 2 的相关指数 R2 为 0.80 C.模型 3 的相关指数 R2 为 0.50 D.模型 4 的相关指数 R2 为 0.25 解析:在两个变量 y 与 x 的回归模型中,它们的相关 指数 R2 越近于 1,模拟效果越好,在四个选项中 A 的相 关指数最大,所以拟合效果最好的是模型 1. 答案:A
如果散点图中点的分布从整体上看大致在一条直线附近,就 称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
2.回归方程 (1)最小二乘法. 求回归直线,使得样本数据的点到它的距离的平方和最小的 方法叫做最小二乘法. (2)回归方程.
方程^y =^b x+^a 是两个具有线性相关关系的变量的一 组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中 ^a,^b是待定参数.
注:年份代码 1~7 分别表示对应年份 2012~2018 年.
(1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系, 请用相关系数 r(|r|>0.75 线性相关较强)加以说明;
(2)建立 y 与 t 的回归方程(系数精确到 0.01),预测 2020 年该地区生活垃圾无害化处理量.
附注:
解析:易求-x =9,-y =4,将样本点中心(9,4)代入
选项中验证,满足^y=0.7x-2.3,故选 C. 答案:C
3.(人 A 选修 2-3·习题改编)为了判断高中三年级学
生是否选修文科与性别的关系,现随机抽取 50 名学生,

变量间的相关关系与统计案例

变量间的相关关系与统计案例

变量间的相关关系与统计案例一、基础知识1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.体现的不一定是因果关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程为y ^=b ^x +a ^,其中(3)通过求Q =∑i =1n(y i -bx i -a )2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验 (1)2×2列联表设X ,Y 为两个变量,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)如下:(2)独立性检验利用随机变量K 2(也可表示为χ2)的观测值k=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c+d 为样本容量)来判断“两个变量有关系”的方法称为独立性检验.二、常用结论(1)求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ).(2)根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变量有关的把握越大.(3)根据回归方程计算的y ^值,仅是一个预报值,不是真实发生的值.考点一 回归分析考法(一) 求线性回归方程[典例] (2019·湘东五校联考)已知具有相关关系的两个变量x ,y 的几组数据如下表所示:(1)(2)请根据上表数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^,并估计当x =20时y 的值.参考公式:b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^=y -b ^x .[解] (1)散点图如图所示:(2)依题意,x =15×(2+4+6+8+10)=6,y =15×(3+6+7+10+12)=7.6,∑i =15x 2i =4+16+36+64+100=220,∑i =15x i y i =6+24+42+80+120=272,∴b ^=∑i =15x i y i -5 x y∑i =15x 2i -5 x2=272-5×6×7.6220-5×62=4440=1.1, ∴a ^=7.6-1.1×6=1,∴线性回归方程为y ^=1.1x +1,故当x =20时,y =23.考法(二) 相关系数及应用[典例] 如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明. 参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55, 7≈2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2∑i =1n (y i -y )2.[解] 由折线图中数据和参考数据及公式得t =4,∑i=17(t i -t )2=28,∑i =17(y i -y )2=0.55,∑i =17(t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.[解题技法]1.线性回归分析问题的类型及解题方法 (1)求线性回归方程:①利用公式,求出回归系数b ^,a ^.②待定系数法:利用回归直线过样本点中心求系数. (2)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数b ^. 2.模型拟合效果的判断(1)残差平方和越小,模型的拟合效果越好. (2)相关指数R 2越大,模型的拟合效果越好.(3)回归方程的拟合效果,可以利用相关系数判断,当|r |越趋近于1时,两变量的线性相关性越强.[题组训练]1.(2019·惠州调研)某商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程y =b x +a 中的b =-2,气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣销售量约为( )A .46件B .40件C .38件D .58件解析:选A 由题中数据,得x =10,y =38,回归直线y ^=b ^x +a ^过点(x ,y ),且b ^=-2,代入得a ^=58,则回归方程y ^=-2x +58,所以当x =6时,y =46,故选A.2.近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次,统计数据如下表:根据以上数据,绘制了散点图.参考数据:其中v i =lg y i ,v =17∑i =17v i .(1)根据散点图判断,在推广期内,y =a +bx 与y =c ·d x (c ,d 均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型(给出判断即可,不必说明理由)?(2)根据(1)的判断结果及上表中数据,建立y 关于x 的回归方程,并预测活动推出第8天使用扫码支付的人次.参考公式:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^μ的斜率和截距的最小二乘估计公式分别为β=∑i =1nu i v i -n u v ∑i =1nu 2i -n u2,α^=v -β^U .解:(1)根据散点图可以判断,y =c ·d x 适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型.(2)y =c ·d x 两边同时取常用对数,得lg y =lg(c ·d x )=lg c +x lg d , 设lg y =v ,则v =lg c +x lg d . ∵x =4,v =2.54,∑i =17x 2i =140,∴lg d =∑i =17x i v i -7 x v ∑i =17x 2i -7 x2≈78.12-7×4×2.54140-7×42=0.25,把(4,2.54)代入v =lg c +x lg d ,得lg c =1.54, ∴v ^=1.54+0.25x ,∴y ^=101.54+0.25x =101.54·(100.25)x .把x =8代入上式,得y ^=101.54+0.25×8=103.54=103×100.54=3 470,∴y 关于x 的回归方程为y ^=101.54·(100.25)x ,活动推出第8天使用扫码支付的人次为3 470.考点二 独立性检验[典例] (2018·全国卷Ⅲ节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(2)根据(1)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),[解] (1)由茎叶图知m =79+812=80.列联表如下:(2)因为K 2=40(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.[解题技法][题组训练]1.(2019·沧州模拟)某班主任对全班50名学生进行了作业量的调查,数据如表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025,P (K 2≥6.635)≈0.010.则________(填“有”或“没有”)97.5%的把握认为“学生的性别与认为作业量大 有关”.解析:因为K 2=50×(18×15-8×9)226×24×27×23≈5.059>5.024,所以有97.5%的把握认为“学生的性别与认为作业量大有关”. 答案:有2.为考察某种疫苗预防疾病的效果,进行动物试验,得到统计数据如下:现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为25.(1)求2×2列联表中的数据x ,y ,A ,B 的值.(2)绘制发病率的条形统计图,并判断疫苗是否影响到了发病率?(3)能否在犯错误的概率不超过0.001的前提下认为疫苗有效? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .临界值表:解:(1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物”为事件M , 由已知得P (M )=y +30100=25,所以y =10,则B =40,x =40,A =60. (2)未注射疫苗发病率为4060=23≈0.67,注射疫苗发病率为1040=14=0.25.发病率的条形统计图如图所示,由图可以看出疫苗影响到了发病率.(3)因为K 2=100×(20×10-40×30)260×40×50×50≈16.67>10.828.所以能在犯错误的概率不超过0.001的前提下认为疫苗有效.[课时跟踪检测]A 级1.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图如图①,对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图如图②.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x 与y 负相关,u 与v 正相关.2.(2019·长沙模拟)为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计表:根据上表可得回归方程y =b x +a ,其中b =0.59,a =y -b x ,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为( )A .1.795万元B .2.555万元C .1.915万元D .1.945万元解析:选A x =15×(2.09+2.15+2.50+2.84+2.92)=2.50(万元),y =15×(1.25+1.30+1.50+1.70+1.75)=1.50(万元),其中b ^=0.59,则a ^=y -b ^ x =0.025,y ^=0.59x +0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为y ^=0.59×3.00+0.025=1.795(万元).3.下面四个命题中,错误的是( )A .从匀速传递的产品生产流水线上,质检员每15分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样B .对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大C .两个随机变量相关性越强,则相关系数的绝对值越接近于0D .在回归直线方程y ^=0.4x +12中,当解释变量x 每增加一个单位时,预报变量平均增加0.4个单位解析:选C 两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,故C 错误.4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:选A 由列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k = n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.5.为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:有________以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”. 解析:由2×2列联表可知,K 2=100×(25×30-10×35)240×60×35×65≈2.93,因为2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.答案:90%6.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:则y 关于t 的回归方程是________________.解析:由表中数据得n =5,t =1n ∑i =1n t i =155=3,y =1n ∑i =1n y i =365=7.2.又∑i =1nt 2i -n t 2=55-5×32=10, ∑i =1nt i y i -n t y =120-5×3×7.2=12.从而b ^=∑i =1nt i y i -n t y ∑i =1nt 2i -n t2=1210=1.2, a ^=y -b ^t =7.2-1.2×3=3.6, 故所求回归方程为y ^=1.2t +3.6. 答案:y ^=1.2t +3.67.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x (万元)和销售量y (万台)的数据如下:(2)若用y =c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别约为0.75和0.88,请用R 2说明选择哪个回归模型更好;(3)已知利润z 与x ,y 的关系为z =200y -x .根据(2)的结果,求当广告费x =20时,销售量及利润的预报值.参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .参考数据:5≈2.24.解:(1)∵x =8,y =4.2,∑i =17x i y i =279.4,∑i =17x 2i =708,∴b ^=∑i =17x i y i -7x y∑i =17x 2i -7x2=279.4-7×8×4.2708-7×82=0.17,a ^=y -b ^x =4.2-0.17×8=2.84, ∴y 关于x 的线性回归方程为y ^=0.17x +2.84.(2)∵0.75<0.88且R 2越大,反映残差平方和越小,模型的拟合效果越好, ∴选用y ^=1.63+0.99x 更好.(3)由(2)知,当x =20时,销售量的预报值y ^=1.63+0.9920≈6.07(万台),利润的预报值z =200×(1.63+0.9920)-20≈1 193.04(万元).B 级1.(2018·江门一模)为探索课堂教学改革,江门某中学数学老师用“传统教学”和“导学案”两种教学方式分别在甲、乙两个平行班进行教学实验.为了解教学效果,期末考试后,分别从两个班级各随机抽取20名学生的成绩进行统计,得到如下茎叶图.记成绩不低于70分者为“成绩优良”.(1)请大致判断哪种教学方式的教学效果更佳,并说明理由;(2)构造一个教学方式与成绩优良的2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .临界值表:解:(1)“理由1:乙班样本数学成绩大多在70分以上,甲班样本数学成绩70分以下的明显更多. 理由2:甲班样本数学成绩的平均分为70.2;乙班样本数学成绩的平均分为79.05. 理由3:甲班样本数学成绩的中位数为68+722=70,乙班样本数学成绩的中位数为77+782=77.5. (2)2×2列联表如下:由上表数据可得K 2=40×(10×4-10×16)20×20×26×14≈3.956>3.841,所以能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.2.(2019·广州调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X (单位:小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y (千克)与使用某种液体肥料的质量x (千克)之间的对应数据为如图所示的折线图.(1)依据折线图计算相关系数r (精确到0.01),并据此判断是否可用线性回归模型拟合y 与x 的关系;(若|r |>0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X 限制,并有如下关系:元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元.若商家安装了3台光照控制仪,求商家在过去50周的周总利润的平均值.相关系数公式:r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,参考数据:0.3≈0.55,0.9≈0.95.解:(1)由已知数据可得x =2+4+5+6+85=5,y =3+4+4+4+55=4.因为∑i =15(x i -x )(y i -y )=(-3)×(-1)+0+0+0+3×1=6,∑i =15(x i -x )2=(-3)2+(-1)2+02+12+32=25,∑i =15(y i -y )2=(-1)2+02+02+02+12=2,所以相关系数r =∑i =15(x i -x )(y i -y )∑i =15(x i -x )2∑i =15(y i -y )2=625×2=0.9≈0.95. 因为|r |>0.75,所以可用线性回归模型拟合y 与x 的关系. (2)由条件可得在过去50周里,当X >70时,共有10周,此时只有1台光照控制仪运行, 每周的周总利润为1×3 000-2×1 000=1 000(元). 当50≤X ≤70时,共有35周,此时有2台光照控制仪运行, 每周的周总利润为2×3 000-1×1 000=5 000(元). 当30<X <50时,共有5周,此时3台光照控制仪都运行, 每周的周总利润为3×3 000=9 000(元). 所以过去50周的周总利润的平均值为 1 000×10+5 000×35+9 000×550=4 600(元),所以商家在过去50周的周总利润的平均值为4 600元.。

2019-2020年新人教A版高考数学大一轮复习第九章统计统计案例第三节变量间的相关关系与统计案例课件理

2019-2020年新人教A版高考数学大一轮复习第九章统计统计案例第三节变量间的相关关系与统计案例课件理

i=1
i=1
^b=



n
xi- x 2
n
xi2-n x 2

i=1
i=1
^a= y -^b x .
n
xi- x yi- y
i=1
^a= y -^b x ,^b=

n
xi- x 2
i=1
其中 x =n1i=n1xi, y =n1i=n1yi,( x , y )称为样本点的中心.
A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关 C.x 与 y 负相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关
解析:选 C.因为 y=-0.1x+1 的斜率小于 0,故 x 与 y 负相关.因 为 y 与 z 正相关,可设 z=^by+^a,^b>0,则 z=^by+^a=-0.1^bx+^b+^a, 故 x 与 z 负相关.
四基精演练 1.思考辨析(在括号内打“√”或“×”) (1)利用样本点的散点图可以直观判断两个变量的关系是否可以用 线性关系来表示.( √ ) (2)通过回归方程^y =^bx+^a 可以估计和观测变量的取值和变化趋 势.( √ ) (3)任何一组数据都对应着一个回归直线方程.( × ) (4)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的观测值 越大.( √ )
第三节 变量间的相关关系与统计案例
教材细梳理
知识点 1 变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相 关关系.与函数关系不同,相关关系是一种__非__确__定__性____关系.
(2)在散点图中,点散布在从左下角到右上角的区域内,两个变量的 这种相关关系称为___正__相__关_____,点散布在左上角到右下角的区域内, 两个变量的相关关系称为___负__相__关_____.

第九章 第三节 变量间的相关关系、统计案例

第九章  第三节  变量间的相关关系、统计案例

A.变量x与y正相关,u与v正相关 .变量 与 正相关 正相关, 与 正相关 B.变量x与y正相关,u与v负相关 .变量 与 正相关 正相关, 与 负相关 C.变量x与y负相关,u与v正相关 .变量 与 负相关 负相关, 与 正相关 D.变量x与y负相关,u与v负相关 .变量 与 负相关 负相关, 与 负相关
[究 疑 点] 究 1.相关关系与函数关系有何异同点? .相关关系与函数关系有何异同点? 提示:相同点:两者均是指两个变量的关系. 提示:相同点:两者均是指两个变量的关系. 不同点:(1)函数关系是一种确定关系,相关关系是一 函数关系是一种确定关系, 不同点: 函数关系是一种确定关系 种非确定的关系; 种非确定的关系; (2)函数关系是一种因果关系,而相关关系不一定是因 函数关系是一种因果关系, 函数关系是一种因果关系 果关系,也可能是伴随关系. 果关系,也可能是伴随关系.
2.根据独立性检验的基本思想,得出的两个分类变量有 .根据独立性检验的基本思想, 关系,这样的结论一定是正确的吗? 关系,这样的结论一定是正确的吗? 提示:在实际问题中, 提示:在实际问题中,独立性检验的结论仅仅是一种 数学关系,得出的结论也可能犯错误,比如: 数学关系,得出的结论也可能犯错误,比如:在推测 吸烟与肺癌是否有关时,通过收集、整理、分析数据, 吸烟与肺癌是否有关时,通过收集、整理、分析数据, 我们得到“吸烟与患肺癌有关”的结论, 我们得到“吸烟与患肺癌有关”的结论,并且有超过 99%的把握说明吸烟与患肺癌有关系,或者这个结论 的把握说明吸烟与患肺癌有关系, 的把握说明吸烟与患肺癌有关系 出错的概率为0.01以下.但实际上一个人吸烟也不一 以下. 出错的概率为 以下 定会患肺癌, 定会患肺癌,这是数学中的统计思维与确定性思维差 异的反映. 异的反映.

2019版高考数学(文)一轮狂刷练:第9章统计与统计案例9-1a含解析

2019版高考数学(文)一轮狂刷练:第9章统计与统计案例9-1a含解析

[基础送分提速狂刷练]一、选择题1.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案A解析5000名居民的阅读时间的全体是总体,每名居民的阅读时间是个体,200是样本容量,故选A.2.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,若第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()A.700B.669C.695D.676答案C解析由题意可知,第一组随机抽取的编号l=15,分段间隔k=Nn=100050=20,故抽取的第35个编号为15+(35-1)×20=695.故选C.3.某月月底,某商场想通过抽取发票存根的方法估计该月的销售总额.先将该月的全部销售发票的存根进行了编号,1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,3,…,10的前10张发票的存根中随机抽取1张,然后再按系统抽样的方法依编号顺序逐次产生第2张、第3张、第4张、……,则抽样中产生的第2张已编号的发票存根,其编号不可能是()A.13B.17C.19D.23答案D解析因为第一组的编号为1,2,3,…,10,所以根据系统抽样的定义可知第二组的编号为11,12,13,…,20,故第2张已编号的发票存根的编号不可能为23.故选D.4.从某500件产品中随机抽取50件进行质检,利用随机数表法抽取样本时,先将这500件产品按001,002,003,…,500进行编号.如果从随机数表的第7行第4列的数2开始,从左往右读数,则依次抽取的第4个个体的编号是()附:随机数表第6行至第8行各数如下:A .217B .245C .421D .206答案D 解析产品的编号为3位号码,故每次读数取3位,第一个三位数为217,依次取出符合条件的号码为157,245,206,故第4个个体编号为206.故选D.5.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为()A .7B .9C .10D .15答案C解析由系统抽样的特点,知抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.故选C.6.(2018·朝阳质检)某工厂有甲、乙、丙、丁四类产品共3000件,且它们的数量成等比数列,现用分层抽样的方法从中抽取150件进行质量检测,其中从乙、丁两类产品中抽取的总数为100件,则甲类产品有()。

高考数学一轮复习第9章统计与统计案例第3节变量间的相关关系、统计案例课件

高考数学一轮复习第9章统计与统计案例第3节变量间的相关关系、统计案例课件

附:
P(K2≥k0) 0.100 0.050 0.025 0.010 0.001
A.0.1%
k0 2.706 3.841 5.024 6.635 10.828 B.1%
C.99%
D.99.9%
C [因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1- 0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.]
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg 箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
K2的观测值k=20100×0×621×006×6-963×4×103482≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
() (4)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优 秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( ) [答案] (1)× (2)√ (3)√ (4)×
2.(教材改编)为调查中学生近视情况,测得某校男生150名中有80名近
视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,
关关系,故①正确;由散点图知用y=c1ec2x拟合比用 ^y = b^ x+ ^a 拟合效果要好,
则R
2 1
>R
2 2
,故②正确;x,y之间可以建立线性回归方程,但拟合效果不好,故③
错误.]
[规律方法] 判定两个变量正、负相关性的方法 1画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从 左上角到右下角,两个变量负相关. 2相关系数:r>0时,正相关;r<0时,负相关. 3线性回归方程中: 时,正相关; 时,负相关.

2019版高考数学一轮复习第9章统计与统计案例9.3变量间的相关关系与统计案例学案理

2019版高考数学一轮复习第9章统计与统计案例9.3变量间的相关关系与统计案例学案理

9.3 变量间的相关关系与统计案例[知识梳理]1.相关关系与回归方程(1)相关关系的分类①正相关:从散点图上看,点散布在从左下角到右上角的区域内,如图1;②负相关:从散点图上看,点散布在从左上角到右下角的区域内,如图2.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x)2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x .其中,b ^是回归方程的斜率,a ^是在y 轴上的截距,x -=1n ∑ni =1x i ,y -=1n ∑ni =1y i ,(x -,y -)称为样本点的中心.说明:回归直线y ^=b ^x +a ^必过样本点的中心(x -,y -),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.(4)样本相关系数r =∑i =1n(x i -x )(y i -y)∑i =1n(x i -x )2∑i =1n(y i -y)2,用它来衡量两个变量间的线性相关关系.①当r >0时,表明两个变量正相关; ②当r <0时,表明两个变量负相关;③r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. (2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.(3)独立性检验利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. [诊断自测] 1.概念思辨(1)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.( ) (2)通过回归方程y ^=b ^x +a ^可以估计和观测变量的取值和变化趋势.( ) (3)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( ) (4)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( )答案 (1)√ (2)√ (3)√ (4)× 2.教材衍化(1)(必修A3P 94A 组T 3)某种产品的广告费用支出x (单位:万元)与销售额y (单位:万元)之间有如下的对应数据:由最小二乘法得到线性回归直线方程y =b x +a ,则此直线一定经过点( ) A .(5,60) B .(5,50) C .(6,50) D .(8,70) 答案 B解析 回归直线样本点的中心为(x -,y -),而x -=15×(2+4+5+6+8)=5,y -=15×(30+40+60+50+70)=50,所以回归直线一定经过点(5,50).故选B.(2)(选修A1-2P 96T 2)通过随机询问72名不同性别的大学生在购买食物时是否看生产日期,得到如下列联表:答案 99.5%解析 由表中数据得k =72×(16×8-20×28)236×36×44×28≈8.416>7.879,所以可知有99.5%的把握认为性别与是否读生产日期有关.3.小题热身(1)设回归方程为y ^=3-5x ,则变量x 增加一个单位时 ( )。

2019届高考数学一轮复习 第九篇 统计与统计案例 第3节 变量的相关性与统计案例训练 理 新人教版

2019届高考数学一轮复习 第九篇 统计与统计案例 第3节 变量的相关性与统计案例训练 理 新人教版

第3节变量的相关性与统计案例【选题明细表】知识点、方法题号散点图1,14回归分析3,4,6,8,10,12独立性检验2,5,7,9,11综合应用13,14基础巩固(时间:30分钟)1.观察下列散点图,其中两个变量的相关关系判断正确的是( D )(A)a为正相关,b为负相关,c为不相关(B)a为负相关,b为不相关,c为正相关(C)a为负相关,b为正相关,c为不相关(D)a为正相关,b为不相关,c为负相关解析:根据散点图,由相关性可知:图a各点散布在从左下角到右上角的区域里,是正相关;图b中各点分布不成带状,相关性不明确,所以不相关;图c中各点分布在从左上方到右下方的区域里,是负相关.故选D.2.通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到统计量K2的观测值k≈4.892,参照附表,得到的正确结论是( C )P(K2≥k0) 0.10 0.05 0.025 k0 2.706 3.841 5.024(A)有97.5%以上的把握认为“爱好该项运动与性别有关”(B)有97.5%以上的把握认为“爱好该项运动与性别无关”(C)在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”(D)在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”解析:因为K2的观测值k≈4.892>3.841,所以有95%以上的把握认为“爱好该项运动与性别有关”.故选C.3.根据如下样本数据:x 3 4 5 6 7y 4.0 a-5.4 -0.5 0.5 b-0.6得到的回归方程为=bx+a.若样本点的中心为(5,0.9),则当x每增加1个单位时,y就( B ) (A)增加1.4个单位(B)减少1.4个单位(C)增加7.9个单位(D)减少7.9个单位解析:依题意得=0.9,故a+b=6.5, ①又样本点的中心为(5,0.9),故0.9=5b+a, ②联立①②,解得b=-1.4,a=7.9,则=-1.4x+7.9,可知当x每增加1个单位时,y就减少1.4个单位.故选B.4.(2017·山东济宁市一模)某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如表所示:x 16 17 18 19y 50 34 41 31由表可得回归直线方程=x+中的=-4,据此模型预测零售价为20元时,每天的销售量为( D )(A)26个 (B)27个(C)28个(D)29个解析: ==17.5,==39.将(,)代入回归方程得39=-4×17.5+,解得=109.所以回归方程为=-4x+109.当x=20时, =-4×20+109=29.故选D.5.(2017·湘西州一模)假设有两个分类变量X和Y的2×2列联表:Yy1y2总计Xx1 a 10 a+10x2 c 30 c+30总计60 40 100对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( A )(A)a=45,c=15 (B)a=40,c=20(C)a=35,c=25 (D)a=30,c=30解析:当与相差越大,X与Y有关系的可能性越大,即a,c相差越大,与相差越大.故选A.6.(2017·延边州仿真)某公司在2013~2017年的收入与支出情况如表所示:收入x(亿元) 2.2 2.6 4.0 5.3 5.9支出y(亿元) 0.2 1.5 2.0 2.5 3.8 根据表中数据可得回归直线方程为=0.8x+,依此估计如果2018年该公司收入为7亿元时的支出为( B )(A)4.5亿元(B)4.4亿元(C)4.3亿元(D)4.2亿元解析: =×(2.2+2.6+4.0+5.3+5.9)=4, =×(0.2+1.5+2.0+2.5+3.8)=2,所以=2-0.8×4=-1.2,所以回归直线方程为=0.8x-1.2,当x=7时, =0.8×7-1.2=4.4(亿元),即2018年该公司收入为7亿元时的支出为4.4亿元.故选B.7.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球总计男生20 5 25 女生10 15 25 总计30 20 50则在犯错误的概率不超过的前提下认为喜爱打篮球与性别有关(请用百分数表示).P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.706 3.841 5.024 6.635 7.879 10.828解析:K2==≈8.333>7.879.答案:0.5%8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.解析:儿子和父亲的身高可列表如下:父亲身高173 170 176儿子身高170 176 182设回归直线方程=+x,由表中的三组数据可求得=1,故=-=176-173=3,故回归直线方程为=3+x,将x=182代入得孙子的身高为185 cm.答案:185能力提升(时间:15分钟)9.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算K2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约P(K2≥k0) 0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 (A)0.1% (B)1% (C)99% (D)99.9%2P(K2≥k0) 0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 所以有99%的把握说喜欢乡村音乐与学生性别有关系.故选C.10.(2017·河南濮阳市一模)在利用最小二乘法求回归方程=0.67x+54.9时,用到了表中的5x 10 20 30 40 50 y 62 a 75 81 89解析:由题意可得= (10+20+30+40+50)=30,= (62+a+75+81+89),因为回归直线=0.67x+54.9过样本点的中心,所以 (a+307)=0.67×30+54.9,解得a=68.故选A.11.(2016·福建省高中毕业班质检)某公司为了增加其商品的销售利润,调查了该商品投入的广告费用x与销售利润y的统计数据如表:广告费用x(万元) 2 3 5 6销售利润y(万元) 5 7 9 11由表中数据,得线性回归方程=x+ (=,=-),则下列结论错误的是( D )(A) >0 (B) >0(C)直线过点(4,8) (D)直线过点(2,5)解析:变量x,y为正相关,故>0,结合散点图(图略)可知, >0,样本点的中心为(4,8),故直线过点(4,8),只能是选项D中的结论错误.12.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:理科文科总计男13 10 23女7 20 27总计20 30 50已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=≈4.844,则有的把握认为选修文科与性别有关.解析:由题意知,K2=≈4.844,因为5.024>4.844>3.841,所以有95%的把握认为选修文科与性别有关.答案:95%13.某城市随机抽取一年(365天)内100天的空气质量指数AQI的监测数据,结果统计如下:AQI [0,50] (50,100](100,150]150,200](200,250](250,300](300,+∞)空气质量优良轻微污染轻度污染中度污染中度重污染重度污染天数 4 13 18 30 9 11 15 (1)若某企业每天由空气污染造成的经济损失S(单位:元)与空气质量指数AQI(记为ω)的关系式为S=试估计在本年内随机抽取一天,该天经济损失S大于400元且不超过700元的概率;(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关?附:P(K2≥k0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828K2=非重度污染重度污染合计供暖季非供暖季合计100 解:(1)记“在本年内随机抽取一天,该天经济损失S大于400元且不超过700元”为事件A. 由400<S≤700,即400<3ω-200≤700,解得200<ω≤300,其满足条件天数为20.所以P(A)==.(2)根据题目数据得到如下列联表:非重度污染重度污染合计供暖季22 8 30非供暖季63 7 70合计85 15 100K2=≈4.575>3.841,所以有95%的把握认为该市本年空气重度污染与供暖有关.14. (2015·全国Ⅰ卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(x i-)2(w i-)2(x i-)(y i-) (w i-)(y i-) 46.6 563 6.8 289.8 1.6 1 469 108.8表中w i=,=w i,(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x,根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为=,=-.解:(1)由题目散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=,先建立y关于w的线性回归方程.由于===68,=-=563-68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68. (3)①由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值=0.2(100.6+68)-x=-x+13.6+20.12.所以当==6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

解析 由题意知,k=50×23×132×7×202-0×103×072≈4.844, 因为 5.024>4.844>3.841,所以有 95%的把握认为选修文科 与性别有关.
7.[2018·沧州七校联考]某单位为了制定节能减排的计 划,随机统计了某 4 天的用电量 y(单位:度)与当天气温 x(单 位:℃),并制作了对照表(如表所示).由表中数据,得线性 回归方程^y=-2x+a^,当某天的气温为-5 ℃时,预测当天 的用电量约为___7_0____度.
当 x=-5 时,^y=(-2)×(-5)+60=70,所以当某天 的气温为-5 ℃时,预测当天的用电量约为 70 度.
8.已知 x,y 之间的一组数据如下表: x23456 y34689
对于表中数据,现给出如下拟合直线:①y=x+1;②y =2x-1;③y=85x-25;④y=32x.则根据最小二乘法的思想求 得拟合程度最好的直线是___③_____(填序号).
解析 x =4+2+4 3+5=3.5,y =49+26+4 39+54=42. 因为回归直线过点( x ,y ),所以 42=9.4×3.5+a^,解得a^= 9.1.故回归方程为^y=9.4x+9.1.所以当 x=6 时,^y=6×9.4+ 9.1=65.5.
6.为了判断高中三年级学生选修文科是否与性别有关,
表,得到的正确结论是( )
P(K2≥k)
0.10 0.05 0.025
k
2.706 3.841 5.024
A.有 97.5%以上的把握认为“爱好该项运动与性别有 关”
B.有 97.5%以上的把握认为“爱好该项运动与性别无 关”
C.在犯错误的概率不超过 5%的前提下,认为“爱好 该项运动与性别有关”
解析
5
由题意知-x =4,-y =6,∴b^=∑ i=1
xi--x yi--y
5

xi--x 2
i=1
=85,∴a^=-y -b^-x =-25,∴^y=85x-25,∴填③.
9.由某种设备的使用年限 xi(年)与所支出的维修费 yi(万
5
5
5
元)的数据资料算得如下结果, x2i =90, xiyi=112, xi
5.某产品的广告费用 x(单位:万元)与销售额 y(单位:
万元)的统计数据如下表:
广告费用 x
4235
销售额 y
49 26 39 54
根据上表可得回归方程^y=b^x+a^中的b^为 9.4,据此模型
预报广告费用为 6 万元时销售额为( )
A.63.6 万元 B.65.5 万元
C.67.7 万元 D.72.0 万元
现随机抽取 50 名学生,得到如图所示 2×2 列联表:
理科
文科
总计

13
20
27
总计
20
30
50
已知 P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表
中数据,得到 K2的观测值 k=50×23×132×7×202-0×103×072≈4.844,
则有__9_5_%____的把握认为选修文科与性别有关.
x
=15i=51xi=4,
5
xiyi-5 x y y =15i=51yi=5,∴b^=i=15 x2i -5 x 2 =11920--55××44×2 5=1.2,
D.在犯错误的概率不超过 5%的前提下,认为“爱好 该项运动与性别无关”
解析 因为 K2 的观测值 k≈4.892>3.841,所以有 95% 以上的把握认为“爱好该项运动与性别有关”.
4.[2018·洛阳模拟]为研究语文成绩和英语成绩之间是 否具有线性相关关系,统计某班学生的两科成绩得到如图所 示的散点图(x 轴、y 轴的单位长度相同),用回归直线方程^y= bx+a 近似地刻画其相关关系,根据图形,以下结论最有可 能成立的是( )
解析 因为 y=-0.1x+1 的斜率小于 0,故 x 与 y 负相 关.因为 y 与 z 正相关,可设 z=b^y+a^,b^>0,则 z=b^y+a^= -0.1b^x+b^+a^,
故 x 与 z 负相关.
2.[2018·桂林模拟]根据如下样本数据:
x3 4 y 4.0 2.5
5 -0.5
67
i=1
i=1
i=1
5
=20, yi=25.
i=1
(1)求所支出的维修费 y 对使用年限 x 的线性回归方程^y =b^x+a^;
(2)①判断变量 x 与 y 之间是正相关还是负相关; ②当使用年限为 8 年时,试估计支出的维修费是多少.

5
5
(1)∵ xi=20, yi=25,∴
i=1
i=1
板块四 模拟演练·提能增分
[A 级 基础达标] 1.[2018·湖北模拟]已知变量 x 和 y 满足关系 y=-0.1x +1,变量 y 与 z 正相关.下列结论中正确的是( ) A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关 C.x 与 y 负相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关
A.线性相关关系较强,b 的值为 1.25 B.线性相关关系较强,b 的值为 0.83 C.线性相关关系较强,b 的值为-0.87 D.线性相关关系较弱,无研究价值 解析 由散点图可以看出两个变量所构成的点在一条 直线附近,所以线性相关关系较强,且应为正相关,所以 回归直线方程的斜率应为正数,且从散点图观察,回归直 线方程的斜率应该比 y=x 的斜率要小一些,综上可知应选 B.
8
0.5 -2.0 -3.0
得到的回归方程为^y=bx+a,则( )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
解析 由表中数据画出散点图,如图, 由散点图可知 b<0,a>0.
3.通过随机询问 200 名性别不同的大学生是否爱好踢
键子运动,计算得到统计量 K2 的观测值 k≈4.892,参照附
x 18 13 10 -1 y 24 34 38 64
解析 气温的平均值-x =14×(18+13+10-1)=10, 用电量的平均值-y =14×(24+34+38+64)=40,因为回归 直线必经过点(-x ,-y ),将其代入线性回归方程得 40=- 2×10+a^,解得a^=60,故回归方程为^y=-2x+60.
相关文档
最新文档