高中数学 第三章《统计案例》测试题A卷 新人教A版选修
【统计】高中数学第三章统计案例单元质量评估新人教A版选修23
【关键字】统计第三章统计案例单元质量评估(120分钟150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.观察两个相关变量的如下数据:则两个变量间的返回直线方程为()A.=0.5x-1B.=xC.=2x+0.3D.=x+1【解析】选B.返回直线经过样本点的中心(,),因为==0,所以返回直线过(0,0).2.“返回”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心返回.根据他的结论,在儿子的身高y与父亲的身高x的返回直线方程中,()A.在(-1,0)内B.等于C.在(0,1)内D.在[1,+∞)内【解析】选C.子代平均身高向中心返回, 应为正的真分数.3.(2017·中山高二检测)已知x,y的取值如表所示:若y与x线性相关,且=0.95x+a,则a=()B. C.2.8 D.2.6【解析】选D.返回直线一定过样本点的中心(,),由已知=2,=4.5,代入返回直线方程得a=2.6.4.如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比例约为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例约为60%【解析】选C.由图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.5.(2017·临沂高二检测)身高与体重的关系可以用什么来分析()A.残差分析B.返回分析C.等高条形图D.独立性检验【解析】选B.因为身高与体重是两个具有相关关系的变量,故要用返回分析来解决.6.如果在犯错误的概率不超过0.05的前提下认为事件Ⅰ与事件Ⅱ有关,那么具体计算出的数值应满足()A.k>3.841B.k<3.841C.k>2.706D.k<2.706【解析】选A.利用k与临界值比较.7.如果某地的财政收入x与支出y满足线性返回方程(单位:亿元),其中,=0.8,=2,|e|≤0.5.若今年该地区财政收入为10亿元,则年支出预计不会超过()A.9亿元B.10亿元【解析】选D.代入数据=10+e,因为|e|≤0.5,所以||≤10.5,故不会超过10.5亿元.8.(2017·榆林高二检测)某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:则可以在犯错误的概率为多少的前提下认为其亲属的饮食习惯与年龄有关() A.0.1【解析】选C.因为K2的观测值k==10>6.635,所以在犯错误的概率为0.01的前提下认为其亲属的饮食习惯与年龄有关.9.若返回直线方程为=2-3.5x,则变量x增加一个单位,变量y平均()A.减少3.5个单位B.增加2个单位C.增加3.5个单位D.减少2个单位【解析】选A.由线性返回方程可知=-3.5,则变量x增加一个单位, 减少3.5个单位,即变量y平均减少3.5个单位.10.下表给出5组数据(x,y),为选出4组数据使其线性相关程度最大,且保留第1组数据(-5,-3),则应去掉()i 1 2 3 4 5x i-5 -4 -3 -2 4y i-3 -2 4 -1 6A.第2组B.第3组C.第4组D.第5组【解析】选B.由表中数据作出散点图,由散点图可知点(-3,4)偏离其他点,故去掉第3组其线性相关性最大.11.已知返回直线方程中的的估计值为0.2,样本点的中心为(4,5),则返回直线方程为()A.=1.2x-0.2B.=1.2x+0.2C.=0.2x+1.2D.=0.2x-0.2【解析】选B.因为返回直线方程中的的估计值为0.2,样本点的中心为(4,5),所以5=4+0.2,所以=1.2,所以回归直线方程为=1.2x+0.2.12.在肥胖与患心脏病这两个分类变量的计算中,下列说法正确的是( )A.若K2的观测值为k=6.635,则在犯错误的概率不超过0.01的前提下认为肥胖与患心脏病有关系,那么在100个肥胖的人中必有99人患有心脏病B.从独立性检验可知在犯错误的概率不超过0.01的前提下认为肥胖与患心脏病有关系时,我们说某人肥胖,那么他有99%的可能患有心脏病C.若从统计量中求出在犯错误的概率不超过0.05的前提下认为肥胖与患心脏病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确【解析】选C.犯错误的概率不超过0.05是统计上的关系,是指相关程度的大小,是一个概率值.二、填空题(本题共4小题,每小题5分,共20分,请把正确答案填在题中的横线上)13.在研究身高与体重的关系时,求得R2≈________.可以叙述为“身高解释了64%的体重变化”,而随机误差贡献了剩余的36%,所以,身高对体重的效应比随机误差的效应大得多.【解析】用R2可以衡量两个变量之间的相关关系的强弱,因为身高解释了64%的体重变化,而随机误差贡献了剩余的36%,得R2≈0.64.答案:0.6414.某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为______cm.【解析】设父亲身高为xcm,儿子身高为ycm,则x 173 170 176y 170 176 182=173,=176,由公式计算得=1,=-=176-1×173=3,则=x+3,当x=182时, =185.答案:18515.若两个分类变量X与Y的2×2列联表为:y1y2总计x110 15 25x240 16 56总计50 31 81则“X与Y之间有关系”这个结论出错的概率为________.【解析】由列联表数据,可求得K2的观测值k=≈7.227>6.635,因为P(K2≥6.635)≈0.01,所以“X与Y之间有关系”出错的概率为0.01.答案:0.0116.一个车间为了规定工时定额需要确定加工零件所花费的时间,为此进行了10次试验,根据测得的样本得到加工时间y(min)与加工零件个数x(个)的回归方程=0.668x+54.96,由此可以预测加工125个零件所花费的时间约为________min.【解析】当x=125时,=138.46.答案:138.46三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤.)17.(10分)(2017·武汉高二检测)下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车辆数是否有线性相关关系.机动车辆95 110 112 120 129 135 150 180数x/千台交通事故6.27.5 7.78.5 8.79.8 10.2 13.0数y/千件【解析】由题意可得=128.875,=8.95.进而求得r=≈0.9927.因为r>0.75,所以可以得出交通事故数y和机动车辆数x有较强的线性相关程度.18.(12分)打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:患心脏病未患心脏病总计每晚都打鼾30 224 254不打鼾24 1 355 1 379总计54 1 579 1 633根据列联表的独立性检验,能否在犯错误的概率不超过0.001的前提下认为每晚都打鼾与患心脏病有关系? 【解析】由列联表中的数据,得K2的观测值为k=≈68.033>10.828.因此,在犯错误的概率不超过0.001的前提下,认为每晚都打鼾与患心脏病有关系.19.(12分)某地搜集到的新房屋的销售价格(单位:万元)和房屋面积(单位:m2)的数据如下表:房屋面积/m2115 110 80 135 105销售价格/万元24.8 21.6 18.4 29.2 22(1)画出数据对应的散点图.(2)求回归直线方程.(3)根据(2)的结果,估计当房屋面积为150m2时的销售价格.【解析】(1)设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.(2)由(1)知y与x具有线性相关关系,可设其回归方程为依据题中的数据,应用科学计算器,可得出=x i=109,(x i-)2=1570,=y i=23.2,(x i-)(y i-)=308,所以==≈0.1962,≈23.2-0.1962×109=1.8142.故所求的回归直线方程为=0.1962x+1.8142.(3)由(2)知当x=150时,销售价格的估计值为=0.1962×150+1.8142= 31.2442(万元).故当房屋面积为150m2时,估计销售价格是31.2442万元.20.(12分)随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n个人,其中男性占调查人数的.已知男性中有一半的人的休闲方式是运动,而女性中只有的人的休闲方式是运动.(1)完成下列2×2列联表:运动非运动总计男性女性总计n(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动?【解析】(1)补全2×2列联表如下:运动非运动总计男性n n n女性n n nn总计n n(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,则P(K2≥k0)=3.841.由于K2的观测值k==,故≥3.841,即n≥138.276,又由n∈Z,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.(3)根据(2)的结论,本次被调查的人中,至少有×140=56(人)的休闲方式是运动.21.(12分)(2017·汉中高二检测)在彩色显影中,由经验可知:形成染料光学密度y与析出银光的光学密度x由公式y=A(b<0)表示,现测得试验数据如下:x i0.05 0.06 0.25 0.31 0.07 0.10y i0.10 0.14 1.00 1.12 0.23 0.37x i0.38 0.43 0.14 0.20 0.47y i 1.19 1.25 0.59 0.79 1.29试求y对x的回归方程.【解析】作散点图如图.由散点图,可设回归方程为y=A(A>0,b<0),其中A和b为参数,对两边取对数,得lny=lnA+,作变量代换X=,Y=lny,并设a=lnA,得Y=a+bX,则由试验数据(x i,y i)(i=1,2,3,…,11),求出对应的数据(X i,Y i)(i=1,2,3,…,11)如表:X i20.000 16.667 14.286 10.000 7.143 5.000Y i-2.303 -1.966 -1.470 -0.994 -0.528 -0.236X i 4.000 3.226 2.632 2.326 2.128Y i0 0.113 0.174 0.223 0.255经过计算可得=7.946,=-0.612,(X i-)2≈406.614,(Y i-)2≈8.690,(X i-)(Y i-)≈-59.342,样本相关系数r≈≈-0.9983.显然|r|≈0.9983>0.75,所以认为Y与X之间的线性相关关系特别显著.再求与的估计值,=≈-0.146,≈-0.612-(-0.146)×7.946≈0.548.则Y与X的回归直线方程为Y=0.548-0.146X.换回原变量,得y=.所以y关于x的回归方程为y=.22.(12分)期中考试后,对某班60名学生的成绩优秀和不优秀与学生近视和不近视的情况做了调查,其中成绩优秀的36名学生中,有20人近视,另外24名成绩不优秀的学生中,有6人近视.(1)请列出列联表并画出等高条形图,并判断成绩优秀与患近视是否有关系.(2)能否在犯错误的概率不超过0.025的前提下认为成绩优秀与患近视之间有关系?【解析】(1)列联表如下:近视不近视总计成绩优秀20 16 36成绩不优秀 6 18 24总计26 34 60 等高条形图如图所示由图知成绩优秀与患近视有关.(2)由列联表中的数据得到K2的观测值k=≈5.475>5.024.因此,在犯错误的概率不超过0.025的前提下认为成绩优秀与患近视有关. 此文档是由网络收集并进行重新排版整理.word可编辑版本!。
2020版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3
§3.2 独立性检验的基本思想及其初步应用学习目标 1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K 2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法.知识点一 分类变量及2×2列联表思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育 文娱 合计 男生 210 230 440 女生 60 290 350 合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断. 梳理 (1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表①定义:列出的两个分类变量的频数表,称为列联表. ②2×2列联表一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表.y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d知识点二 等高条形图1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.2.如果通过直接计算或等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.知识点三 独立性检验1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.列联表中的数据是两个分类变量的频数.( √)2.事件A与B的独立性检验无关,即两个事件互不影响.( ×)3.K2的大小是判断事件A与B是否相关的统计量.( √)类型一等高条形图的应用例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?考点定性分析的两类方法题点利用图形定性分析解等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.反思与感悟在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.两个比例的值相差越大,X与Y有关系成立的可能性就越大.跟踪训练1 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?考点定性分析的两类方法题点利用图形定性分析解根据题目所给的数据得到如下2×2列联表:经常上网不经常上网总计不及格80120200及格120680800总计200800 1 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.类型二独立性检验例2 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.考点独立性检验及其基本思想题点独立性检验的方法解 将2×2列联表中的数据代入公式计算,得K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(60×10-20×10)270×30×80×20=10021≈4.762. 因为4.762>3.841,所以在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.反思与感悟 (1)独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad -bc ≈0,因此|ad -bc |越小,关系越弱;|ad -bc |越大,关系越强. (2)独立性检验的具体做法①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k 0.②利用公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算随机变量K 2的观测值k .③如果k ≥k 0,推断“X 与Y 有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够的证据支持结论“X 与Y 有关系”. 跟踪训练2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系. 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 (1)2×2列联表如下所示:(2)假设“对新课程教学模式的赞同情况与教师年龄无关”. 由公式得K 2=50×(10×6-24×10)234×16×20×30≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关. 类型三 独立性检验的综合应用例3 (2017·全国Ⅱ改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法附:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).考点独立性检验思想的应用题点分类变量与统计、概率的综合性问题解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”,由P (A )=P (BC )=P (B )P (C ),则旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62,新养殖法的箱产量不低于50 kg 的频率为(0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66,则事件A 的概率估计值为P (A )=P (B )P (C )=0.62×0.66=0.409 2, ∴A 发生的概率为0.409 2.(2)根据箱产量的频率分布直方图得到列联表:则K 2=200×(62×66-38×34)2100×100×96×104≈15.705,由15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. 反思与感悟 两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件X =x 1的个体中具有Y =y 1的个体所占的比例aa +b,也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占的比例cc +d.两个比例的值相差越大,X 与Y 有关系成立的可能性就越大.(2)观测值法:通过2×2列联表,先计算K 2的观测值k ,然后借助k 的含义判断“两个分类变量有关系”这一结论成立的可信程度.跟踪训练3 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为23.(1)请将上面的2×2列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X ,求X 的分布列与均值. 考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题 解 (1)列联表补充如下:喜爱打篮球不喜爱打篮球合计 男生 22 6 28 女生 10 10 20 合计321648(2)由K 2=48×(220-60)228×20×32×16≈4.286.因为4.286>3.841,所以,能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关. (3)喜爱打篮球的女生人数X 的可能取值为0,1,2. 其概率分别为 P (X =0)=C 210C 220=938,P (X =1)=C 110C 110C 220=1019,P (X =2)=C 210C 220=938,故X 的分布列为X 0 1 2 P9381019938X 的均值为E (X )=0+1019+919=1.1.某机构调查中学生的近视情况,了解到某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数 B .方差 C .回归分析 D .独立性检验 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 D2.对于分类变量X 与Y 的随机变量K 2的观测值k ,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大考点独立性检验及其基本思想题点独立性检验的思想答案 B解析k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小,“X与Y有关系”的可信程度越小.3.用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是( )考点定性分析的两类方法题点利用图形定性分析答案 D解析由等高条形图易知,D选项两个分类变量关系最强.4.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有考点独立性检验及其基本思想题点独立性检验的方法答案 D解析独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.5.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.总成绩好 总成绩不好 总计 数学成绩好 478 a490 数学成绩不好39924423 总计b c913(1)计算a ,b ,c 的值;(2)文科学生总成绩不好与数学成绩不好有关系吗? 考点 独立性检验及其基本思想 题点 独立性检验的方法解 (1)由478+a =490,得a =12. 由a +24=c ,得c =12+24=36. 由b +c =913,得b =913-36=877. (2)计算随机变量K 2的观测值k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,因为P (K 2≥5.024)≈0.025,所以在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系. 2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K 2的值,如果K 2的值很大,说明假设不合理.K 2越大,两个分类变量有关系的可能性越大.一、选择题1.下面是一个2×2列联表:y 1 y 2总计 x 1 a21 73 x 2825 33 总计b46106则表中a ,b 的值分别为( ) A .94,96 B .52,50 C .52,60D .54,52考点 分类变量与列联表 题点 求列联表中的数据 答案 C2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算得K 2=7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( ) A .0.1% B .1% C .99% D .99.9% 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C解析 易知K 2=7.01>6.635,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系.3.在独立性检验中,两个分类变量“X 与Y 有关系”的可信度为99%,则随机变量K 2的观测值k 的取值范围是( ) A .[3.841,5.024) B .[5.024,6.635) C .[6.635,7.879) D .[7.879,10.828)考点 分类变量与列联表 题点 求观测值 答案 C4.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:则随机变量K 2的观测值约为( ) A .0.600 B .0.828 C .2.712D .6.004考点 分类变量与列联表 题点 求观测值 答案 A解析 根据列联表中的数据,可得随机变量K 2的观测值k =90×(11×37-34×8)245×45×19×71≈0.600.故选A.5.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )A.a a +b 与c c +d B.a c +d 与c a +b C.aa +d 与cb +cD.ab +d 与ca +c考点 定性分析的两类方法 题点 利用图形定性分析 答案 A 解析 由题意,⎪⎪⎪⎪⎪⎪a a +b -c c +d =⎪⎪⎪⎪⎪⎪ac +ad -ac -bc (a +b )(c +d )=⎪⎪⎪⎪⎪⎪ad -bc (a +b )(c +d ),因为|ad -bc |的值越大,两个分类变量有关系的可能性就越大,故选A.6.有两个分类变量X ,Y ,其列联表如下所示,其中a,15-a 均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X ,Y 有关,则a 的值为( ) A .8 B .9 C .8或9D .6或8考点 分类变量与列联表 题点 求列联表中的数据 答案 C解析 根据公式,得K 2的观测值 k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5, a ∈Z ,求得当a =8或9时满足题意.7.某班主任对全班50名学生进行了作业量的调查,数据如下表:则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过( ) A .0.01 B .0.025 C .0.005 D .0.001 考点 独立性检验及其基本思想 题点 独立性检验的方法答案 B解析 由公式得K 2的观测值k =50×(18×15-8×9)226×24×27×23≈5.059>5.024.∵P (K 2≥5.024)=0.025,∴犯错误的概率不超过0.025. 二、填空题8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K 2的观测值k >6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________. 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 ③解析 K 2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确. 9.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为K 2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为__________.考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 5%解析 因为K 2>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.10.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A ,由已知得P (A )=q +35100=35,所以q =25,p =25,a =40,b =60.K 2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841.故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关. 三、解答题11.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断. 考点 定性分析的两类方法 题点 利用图形定性分析解 建立性别与态度的2×2列联表如下:根据列联表中所给的数据,可求出男生中作肯定态度的频率为110=0.2,女生中作肯定态度的频率为2260≈0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系.根据列联表中的数据得到K 2的观测值k =170×(22×38-22×88)2110×60×44×126≈5.622>5.024.因此,在犯错误的概率不超过0.025的前提下认为性别和态度有关系.12.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市民,得到数据如下表所示:喜欢 不喜欢 合计 大于40岁 20 5 25 20岁至40岁10 20 30 合计302555(1)判断是否有99.5%的把握认为喜欢“人文景观”景点与年龄有关?(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取6人作进一步调查,将这6名市民作为一个样本,从中任选2人,求恰有1位大于40岁的市民和1位20岁至40岁的市民的概率. 考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)由公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得,观测值k ≈11.978>7.879,所以有99.5%以上的把握认为喜欢“人文景观”景点与年龄有关.(2)由题意知抽取的6人中大于40岁的市民有4个,20岁至40岁的市民有2个,分别记为B 1,B 2,B 3,B 4,C 1,C 2,从中任选2人的基本事件有(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 1,C 1),(B 1,C 2),(B 2,B 3),(B 2,B 4),(B 2,C 1),(B 2,C 2),(B 3,B 4),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),(C 1,C 2),共15个,其中恰有1位大于40岁的市民和1位20岁至40岁的市民的事件有(B 1,C 1),(B 1,C 2),(B 2,C 1),(B 2,C 2),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),共8个,所以恰有1位大于40岁的市民和1位20岁至40岁的市民的概率为815.四、探究与拓展13.假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其中2×2列联表为:y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d对同一样本,以下数据能说明X 与Y 有关的可能性最大的一组是( ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =3,b =2,c =4,d =5考点 分类变量与列联表 题点 求列联表中的数据 答案 D解析 对于同一样本,|ad -bc |越小,说明x 与y 相关性越弱,而|ad -bc |越大,说明x 与y 相关性越强,通过计算知,对于A ,B ,C 都有|ad -bc |=|10-12|=2.对于选项D ,有|ad -bc |=|15-8|=7,显然7>2. 14.2017年世界第一届轮滑运动会(the first edtion of Roller Games)在南京举行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者.调查发现,男、女志愿者分别有10人和6人喜爱轮滑,其余不喜爱.得到2×2列联表如下.(1)根据2×2列联表,判断能否在犯错误的概率不超过0.10的前提下认为性别与喜爱轮滑有关? (2)从女志愿者中抽取2人参加接待工作,若其中喜爱轮滑的人数为ξ,求ξ的分布列和均值. 考点 独立性检验思想的应用题点 独立性检验与线性回归方程、均值的综合应用解 (1)假设:是否喜爱轮滑与性别无关.由已知数据可求得K 2的观测值为 k =30×(10×8-6×6)216×14×16×14≈1.157 5<2.706.因此不能在犯错误的概率不超过0.10的前提下认为喜爱轮滑与性别有关. (2)喜爱轮滑的人数ξ的可能取值为0,1,2, 则P (ξ=0)=C 06C 28C 214=2891=413,P (ξ=1)=C 16C 18C 214=4891,P (ξ=2)=C 26C 08C 214=1591.所以喜爱轮滑的人数ξ的分布列为4 13+1×4891+2×1591=67.所以喜爱轮滑的人数ξ的均值为E(ξ)=0×。
(常考题)人教版高中数学选修三第三单元《成对数据的统计分析》测试卷(有答案解析)
一、选择题1.某校对学生进行心理障碍测试,得到的数据如下表:根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( ) A .焦虑 B .说谎C .懒惰D .以上都不对2.以下说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个回归方程ˆ35yx =-,变量x 增加1个单位时,y 平均增加5个单位 ③线性回归方程ˆy bx a =+必过(),x y④设具有相关关系的两个变量,x y 的相关系数为r ,那么||r 越接近于0,,x y 之间的线性相关程度越高;⑤在一个22⨯列联表中,由计算得2K 的值,那么2K 的值越大,判断两个变量间有关联的把握就越大。
其中错误..的个数是( ) A .0 B .1 C .2D .33.给出如下列联表2(10.828)0.001P K ≥≈,2( 6.635)0.010P K ≥≈参照公式()()()()()2n ad bc k a b c d a c b d -=++++,得到的正确结论是( )A .有99%以上的把握认为“高血压与患心脏病无关”B .有99%以上的把握认为“高血压与患心脏病有关”C .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”D .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关” 4.下列说法正确的是( )A .在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B .线性回归方程对应的直线y b x a ∧∧∧=+至少经过其样本数据点中的()11,x y ,()22,x y ,()33,x y(),n n x y 一个点C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,相关指数2R 为0.98的模型比相关指数2R 为0.80的模型拟合的效果差 5.某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为1:0.68ˆl y x a=+,计算其相关系数为1r ,相关指数为21R .经过分析确定点F 为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为2:0.68ˆl y bx=+,相关系数为2r ,相关指数为22R .以下结论中,不正确...的是A .120,0r r >>B .2212R R >C .ˆ0.12a= D .68ˆ00.b<< 6.已知下列命题:①回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数r 就越接近于1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程20.5ˆyx =- 中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5;⑤在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;⑥对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说, k 越小,“X 与Y 有关系”的把握程度越大.⑦两个模型中残差平方和越小的模型拟合的效果越好. 则正确命题的个数是( )A .3B .4C .5D .67.下列有关线性回归分析的六个命题: ①线性回归直线必过样本数据的中心点(),x y ;②回归直线就是散点图中经过样本数据点最多的那条直线; ③当相关性系数0r >时,两个变量正相关;④如果两个变量的相关性越强,则相关性系数r 就越接近于1;⑤残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高; ⑥甲、乙两个模型的2R 分别约为0.88和0.80,则模型乙的拟合效果更好. 其中真命题的个数为( ) A .1个B .2个C .3个D .4个8.下列关于独立性检验的叙述:①常用等高条形图展示列联表数据的频率特征; ②独立性检验依据小概率原理;③样本不同,独立性检验的结论可能有差异;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,X 与Y 有关系的把握程度就越大.其中正确的个数为( ) A .1 B .2C .3D .49.某村庄对改村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( ) A .18a =B .19b =C .50c d +=D .2f e -=-10.已知,x y 的对应值表为:且,x y 线性相关,由于表格污损,y 的对应值看不到了,若6119.2ii y==∑,且线性回归直线方程为0.6y x a =+,则8x =时,y 的预报值为( ) A .6.1B .22.1C .12.6D .3.511.研究表明某地的山高()y km 与该山的年平均气温()xC 具有相关关系,根据所采集的数据得到线性回归方程ˆ260y x =-+,则下列说法错误..的是( ) A .年平均气温为0时该山高估计为60km B .该山高为72km 处的年平均气温估计为60CC .该地的山高y 与该山的年平均气温x 的正负相关性与回归直线的斜率的估计值有关D .该地的山高y 与该山的年平均气温x 成负相关关系 12.有下列说法:①若某商品的销售量y (件)关于销售价格x (元/件)的线性回归方程为5350y x =-+,当销售价格为10元时,销售量一定为300件;②线性回归直线y bx a =+一定过样本点中心(,)x y ;③若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;⑤在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好; 其中正确的结论有几个( ) A .1B .2C .3D .413.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱二、解答题14.近年来,“双11”网购的观念逐渐深入人心.某人统计了近5年某网站“双11”当天的交易额,,统计结果如下表: 年份 2015 2016 2017 2018 2019 年份代码x12345交易额y /百亿元9 12 17 21 26r y x 留三位小数.(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (1i n ≤≤),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果[]1,0.75r -∈-,那么负相关很强;如果[]0.751r ∈,,那么正相关很强;如果(]0.75,0.30r ∈--或[)0.30,0.75r ∈,那么相关性一般;如果[]0.25,0.25r ∈-,那么相关性较弱);(2)求出关于x 的线性y 回归方程,并预测2020年该网站“双11”当天的交易额.参考公式:121()()()ˆniii ni i x x y y bx x ==--=-∑∑,ˆˆay bx =-186043.1≈. 15.近年来,“双11”网购的观念逐渐深入人心.某人统计了近5年某网站“双11”当天的交易额,统计结果如下表: 年份 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 交易额y /百亿元912172126y x 留三位小数.(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (1i n ≤≤),则两个变量的相关系数的计算公式为:12211()()()()niii n niii i x x y y r x x y y ===--=--∑∑∑.统计学认为,对于变量,x y ,如果[]1,0.75r ∈--,那么负相关很强;如果[]0.751r ∈,,那么正相关很强;如果(]0.75,0.30r ∈--或[)0.30,0.75r ∈,那么相关性一般;如果[]0.25,0.25r ∈-,那么相关性较弱);(2)求出y 关于x 的线性回归方程,并预测2020年该网站“双11”当天的交易额.参考公式:121()()()ˆniii ni i x x y y bx x ==--=-∑∑,ˆˆay bx =-186043.1≈. 16.某学校共有1000名学生,其中男生400人,为了解该校学生在学校的月消费情况,采取分层抽样随机抽取了100名学生进行调查,月消费金额分布在450~950之间.根据调查的结果绘制的学生在校月消费金额的频率分布直方图如图所示:将月消费金额不低于750元的学生称为“高消费群”.(1)求a 的值,并估计该校学生月消费金额的平均数(同一组中的数据用该组区间的中点值作代表);(2)现采用分层抽样的方式从月消费金额落在[550,650),[750,850)内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高消费群”的学生人数为随机变量X ,求X 的分布列及数学期望;(3)若样本中属于“高消费群”的女生有10人,完成下列22⨯列联表,并判断是否有97.5%的把握认为该校学生属于“高消费群”与“性别”有关?属于“高消费群” 不属于“高消费群” 合计男 女 合计(参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中)n a b c d =+++2()P K k0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.82817.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y ,(单位:千元)的数据资料,算出101010102111180,20184,720ii i i i i i i i xy x y x ========∑∑∑∑,,附:线性回归方程1221ˆˆˆˆˆˆ,,ni ii nii x y nxyybx a b ay bx xnx ==-=+==--∑∑,其中,x y 为样本平均值. (1)求家庭的月储蓄y 对月收入x 的线性回归方程ˆˆˆybx a =+ ; (2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.18.西尼罗河病毒(WNV )是一种脑炎病毒,WNV 通常是由鸟类携带,经蚊子传播给人类.1999年8-10月,美国纽约首次爆发了WNV 脑炎流行.在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV 的复制,抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x (千克)和利巴韦林含片产量y (百盒)的统计数据如下:由相关系数可以反映两个变量相关性的强弱,,认为变量相关性很强;||[0.3,0.75]r ∈,认为变量相关性一般;||[0,0.25]r ∈,认为变量相关性较弱.(1)计算相关系数r ,并判断变量x 、y 相关性强弱;(2)根据上表中的数据,建立y 关于x 的线性回归方程ˆˆˆybx a =+;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林? 25.69≈.参考公式:相关系数()()niix x y y r --=∑ˆˆˆybx a =+中,()()()121niii ni i x x y y b x x ==--=-∑∑,ˆˆay bx =-. 19.某中学研究性学习小组为了考察高中学生的作文水平与爱看课外书的关系,在本校高三年级随机调查了50名学生.调查结果表明,在爱看课外书的24人中有18人作文水平好,另6人作文水平一般;在不爱看课外书的26人中有7人作文水平好,另19人作文水平一般.(1)试根据以上数据完成以下2×2列联表,并运用独立性检验思想,指出有多大把握认为中学生的作文水平与爱看课外书有关系? 高中学生的作文水平与爱看课外书的2×2列联表爱看课外书 不爱看课外书 总计作文水平好 作文水平一般 总计(2)将其中某4名爱看课外书且作文水平好的学生分别编号为1、2、3、4,某4名爱看课外书且作文水平一般的学生也分别编号为1、2、3、4,从这两组学生中各任选1人进行学习交流,求被选取的两名学生的编号之和为2的倍数或3的倍数的概率.参考公22()()()()()n ad bc K a b c d a c b d -=++++其中n a b c d =+++·参考数据:()20P k k ≥0.10 0.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.82820.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:(1)网箱产量不低于40kg 为“理想网箱”,填写下面列联表,并根据列联表判断是否有99.9%的把握认为“理想网箱”的数目与养殖方法有关:箱产量40kg <箱产量40kg ≥合计旧养殖法 新养殖法(2)已知旧养殖法100个网箱需要成本50000元,新养殖法100个网箱需要增加成本15750元,该水产品的市场价格为x 元/()15kg x ≥,根据箱产量的频率分布直方图(说明:同一组中的数据用该组区间的中间值作代表),采用哪种养殖法,请给养殖户一个较好的建议,并说明理由. 附参考公式及参考数据:()()()()()20n ad bc k a b c d a c b d -=++++21.调查某桑场采桑员和辅助工桑毛虫皮炎发病情况结果如下表:利用22⨯列联表的独立性检验估计,“患桑毛虫皮炎病与采桑”是否有关?认为两者有关系会犯错误的概率是多少?随机量变22()()()()()n ad bc K a b c d a c b d -=++++ (其中n a b c d =+++) 临界值表22.某种产品的广告费支出x 与销售额y (单位:万元)之间有对应数据:(1)求回归直线方程;(2)试预测广告费支出为10万元时,销售额多大?线性回归方程的系数公式为()()()1122211nni iiii i nniii i x y nx y x x y y b xnxx x ====---==--∑∑∑∑,a y bx =-.23.我市今年参加高考的考生是首次取消文理科后的新高考考生,新高考实行“321++”,成绩由语文、数学、外语统一高考成绩和自主选考的3门普通高中学业水平考试等级性考试科目成绩构成.为了解各年龄层对新高考的了解情况,随机调查50人(把年龄在[)15,45称为中青年,年龄在[)45,75称为中老年),并把调查结果制成下表:(1)请根据上表完成下面22⨯列联表,并判断是否有95%的把握认为对新高考的了解与年龄(中青年、中老年)有关?附:()()()()()22n ad bc K a b c d a c b d -=++++. (2)现采用分层抽样的方法从中老年人中抽取8人,再从这8人中随机抽取2人进行深入调查,求事件A :“恰有一人年龄在[)45,55”发生的概率.24.为了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为35.(1)请将上面的列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.下面的临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a cb d -=++++,其中n a bcd =+++)25.某食品店为了了解气温对销售量的影响,随机记录了该店1月份中5天的日销售量y (单位:千克)与该地当日最低气温x (单位:°C )的数据,如下表:(1)求出y 与x 的回归方程y =b x +a ;(2)判断y 与x 之间是正相关还是负相关;若该地1月份某天的最低气温为6°C ,请用所求回归方程预测该店当日的营业额.附:回归方程y =b x +a ;中,b =()1221()==--∑∑ni ii nii x y nxyxn x ,a =y ﹣bx26.某市实施二手房新政一年多以来,为了了解新政对居民的影响,房屋管理部门调查了2018年6月至2019年6月期间购买二手房情况,首先随机抽取了其中的400名购房者,并对其购房面积m (单位:平方米,60130m ≤≤)讲行了一次统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年6月至2019年6月期间当月在售二手房的均价y (单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年6月至2019年6月)(1)试估计该市市民的平均购房面积m (同一组中的数据用该组区间的中点值为代表);(2)从该市2018年6月至2019年6月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X ,求X 的分布列与数学期望;(3)根据散点图选择ˆˆya x =+ˆˆˆln y c d x =+两个模型讲行拟合,经过数据处理得到两个回归方程,分别为ˆ0.93690.0285yx =+ˆ0.95540.0306ln y x =+,并得到一些统计量的值,如表所示:ˆ0.93690.0285yx =+ ˆ0.95540.0306ln yx =+ ()()1niii x x y y =--∑0.0054590.005886()()2211nni i i i x x y y ==--∑∑ 0.006050请利用相关系数判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年8月份的二手房购房均价(精确到0.001).参考数据:ln 20.69≈,ln3 1.10≈,ln15 2.71≈3 1.73≈15 3.87≈,17 4.12≈参考公式:()()()()12211niii nni i i i x x y y r x x y y ===--=--∑∑∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】分别求出三种关系的观测值,比较后可得结论. 【详解】解:对于焦虑,说谎,懒惰三种心理障碍,设它们观测值分别为123,,K K K , 由表中数据可得:()2111056025200.86330802585K ⨯⨯-⨯=≈⨯⨯⨯,()2211010702010 6.36630802090K ⨯⨯-⨯=≈⨯⨯⨯,()2311015301550 1.41030806545K ⨯⨯-⨯=≈⨯⨯⨯,因为2K 的值最大,所以说谎与性别关系最大. 故选:B. 【点睛】本题考查独立性检验的应用,考查理解能力和计算能力.2.C解析:C 【分析】根据用样本估计总体、线性回归方程、独立性检验的基本概念和基本性质,逐项判断,即可得到本题答案. 【详解】方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故①正确;一个回归方程ˆ35yx =-,变量x 增加1个单位时,y 平均减少5个单位,故②不正确;线性回归方程ˆy bx a =+必过样本中心点,故③正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,||r 越接近于1,相关程度越大,故④不正确;对于观察值2K 来说,2K 越大,“x 与y 有关系”的可信程度越大,故⑤正确. 故选:C 【点睛】本题主要考查用样本估计总体、线性回归方程、独立性检验的基本思想.3.B解析:B 【分析】根据所给的列联表,利用公式求出这组数据的观测值,把观测值同临界值进行比较,即可得到结果. 【详解】由列联表中的数据可得2K 的观测值,()22110205010307.486 6.63530805060K ⨯-⨯==≥⨯⨯⨯,根据参考数据:2 6.6350.01p K ≥=,∴有10.0199%-=的把握认为高血压与患心脏病有关,即有99%的把握认为高血压与患心脏病有关,故选B. 【点睛】本题考查独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.C解析:C 【解析】分析:首先对每个选项一一进行分析,需要明确独立性检验是检验两个分类变量是否有关系的一种统计方法,回归直线可能不过任何一个样本数据点,残差图中,残差点分布的带状区域的宽度越狭窄,其模拟精度越高,相关指数越大,拟合效果越好的结论,就可以正确选出结果.详解:对于A ,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,所以A 错;对于B ,线性回归方程对应的直线y b x a ∧∧∧=+可能不过任何一个样本数据点,所以B 错误;对于C ,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C 正确;对于D ,回归分析中,相关指数2R 为0.98的模型比相关指数2R 为0.80的模型拟合的效果好,所以D 错误. 故选C.点睛:根据概率统计中变量间的相关关系,线性回归方程以及残差图与相关指数2R 的概念,对选项中的命题进行分析、判断正误即可.5.B解析:B 【分析】根据相关性的正负判断1r 和2r 的正负,根据两个模型中回归直线的拟合效果得出21R 和22R 的大小关系,将第一个模型中的样本数据中心点代入直线1l 的方程得出a 的值,由两回归直线的倾斜程度得出两回归直线的斜率大小关系. 【详解】由图可知两变量呈现正相关,故120,0r r >>,且12r r <,故2212R R <,故A 正确,B 不正确.又回归直线1:0.68ˆl y x a=+必经过样本中心点(3.5,2.5),所以2.50.68 3.5ˆ0.12a=-⨯=,C 正确. 回归直线2:0.68ˆl y bx=+必经过样本中心点(3,2),所以230.68ˆb =⨯+, 所以ˆ0.44b=,也可直接根据图象判断68ˆ00.b <<(比较两直线的倾斜程度),故D 正确.故选B . 【点睛】本题考查回归分析,考查回归直线的性质、相关系数、相关指数的特点,意在考查学生对这些知识点的理解,属于中等题.6.B解析:B 【分析】由回归直线恒过样本中心点,不一定经过每一个点,可判断①;由相关系数的绝对值趋近于1,相关性越强,可判断②;由方差的性质可判断③;由线性回归直线方程的特点可判断④;相关指数R 2的大小,可判断⑤;由的随机变量K 2的观测值k 的大小可判断⑥;残差平方和越小,模型的拟合效果越好,可判断⑦. 【详解】对于①,回归直线y b x a ∧∧∧=+恒过样本点的中心(x y ,),可以不过任一个样本点,故①错误;对于②,两个变量相关性越强,则相关系数r 的绝对值就越接近于1,故②错误; 对于③,将一组数据的每个数据都加一个相同的常数后,由方差的性质可得方差不变,故③正确;对于④,在回归直线方程y ∧=2﹣0.5x 中,当解释变量x 每增加一个单位时, 预报变量y ∧平均减少0.5个单位,故④正确;对于⑤,在线性回归模型中,相关指数R 2表示解释变量x 对于预报变量y 的贡献率,R2越接近于1,表示回归效果越好,故⑤正确;对于⑥,对分类变量X与Y,它们的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大,故⑥错误;对于⑦,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故⑦正确.其中正确个数为4.故选B.【点睛】本题考查命题的真假判断,主要是线性回归直线的特点和线性相关性的强弱、样本数据的特征值和模型的拟合度,考查判断能力,属于基础题.7.B解析:B【解析】分析:根据线性回归方程的几何体特征及残差,相关指数的概论,逐一分析四个选项的正误,可得结论.详解:①线性回归直线必过样本数据中心点(),x y,故①正确;②回归直线方程在散点图中可能不经过任意样本数据点,故②错误;r>时,则两个变量正相关,故③正确;③当相关性系数0④如果两个变量的相关性越强,则相关性系数r就越接近于1或1-,故④错误;⑤残差图中残差点所在的水平带状区域越窄,回归方程的预报精确度越高,故⑤错误;⑥甲、乙两个模型的2R分别约为0.88和0.80,则模型甲的拟合效果更好,故⑥错误,真命题的个数为2,故选B.点睛:本题以命题的真假判断为截体,考查了相关关系,回归分析、残差、相关指数等知识点,意在考查对基本概念掌握的熟练程度,难度不大,属于基础题.8.C解析:C【解析】分析:根据独立性检验的定义及思想,可得结论.详解:①常用等高条形图展示列联表数据的频率特征;正确;②独立性检验依据小概率原理;正确;③样本不同,独立性检验的结论可能有差异;正确;④对分类变量X与Y的随机变量2K的观测值k来说,k越大,X与Y有关系的把握程度就越大.故④错误.故选C.点睛:本题考查了独立性检验的原理,考查了推理能力,属于基础题.9.D解析:D【解析】分析:先根据列联表列方程组,解得a,b,c,d,e,f,再判断真假.详解:因为725,625,6,7,50,50a c b d a e b f c d e f +==+==+=+=+=+=, 所以18,19,50,24,26,2a b c d e f f e ==+===-= 选D.点睛:本题考查列联表有关概念,考查基本求解能力.10.A解析:A 【分析】求出,x y ,由线性回归方程必经过点(,x y )即得a ,代入8x =求解即可. 【详解】 由表格知,196x =, 6119.2ii y==∑3.2y ∴=,代入0.6y x a =+得:193.20.66a =⨯+, 1.3a ∴=,则回归方程为0.6 1.3y x =+, 当8x =时,0.68 1.3 6.1y =⨯+=, 故选:A . 【点睛】本题主要考查了线性回归方程,线性回归方程的性质、应用, 属于中档题.11.B解析:B 【分析】由已知线性回归直线方程ˆ260yx =-+,可估计平均气温为60C 时该地的山高,即可得到答案. 【详解】线性回归直线方程为ˆ260yx =-+,当0x = 时ˆ60y =即年平均气温为0时该山高估计为60km ,故A 正确;当ˆ72y=时解得6x =-即山高为72km 处的年平均气温估计为6C -,故B 错误;该地的山高y 与该山的年平均气温x 的正负相关性与回归直线的斜率的估计值有关,故C 正确;由20-<,该地的山高y 与该山的年平均气温x 成负相关关系,故D 正确.故选B 【点睛】本题考查线性回归直线方程的应用,考查相关的意义,判断能力,属于基础题.12.B解析:B【分析】由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关-,③错误;残差图中带状区域越窄,拟合度时,线性相关性越强,相关系数r越接近1越高,④错误;2R越接近1,模型拟合度越高,⑤正确;由此可得结果.【详解】①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;②由最小二乘法可知,回归直线必过(),x y,②正确;-,③错误;③若两个随机变量为负相关,若线性相关性越强,相关系数r越接近1④残差图中,带状区域越窄,模型拟合度越高,④错误;⑤相关指数2R越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确.可知正确的结论为:②⑤,共2个本题正确选项:B【点睛】本题考查统计案例部分命题的判断,涉及到回归直线、最小二乘法、相关系数、相关指数、残差图的相关知识.13.A解析:A【分析】D后,y与x的线性相关性加强,由相关系数r,相关指数2R 由散点图可知,去掉(3,10)及残差平方和与相关性的关系得出选项.【详解】∵从散点图可分析得出:只有D点偏离直线远,去掉D点,变量x与变量y的线性相关性变强,∴相关系数变大,相关指数变大,残差的平方和变小,故选A.【点睛】该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.二、解答题14.(1)0.998;变量y 与x 的线性相关程度很强;(2)ˆ 4.3 4.1yx =+;29.9百亿元. 【分析】(1)直接将数据代入公式计算,即可得答案;(2)利用最小二乘法求得y 关于x 的线性回归方程为ˆ 4.3 4.1yx =+ ,再将6x =代入,即可得答案; 【详解】(1)由题意,根据表格中的数据, 可得:1(12345)35x =++++=,1(912172126)175y =++++=, 则1()()(13)(917)(53)(2617)43niii x x y y =--=--++--=∑,43.1=≈,所以()()430.99843.1niix x y y r --==≈∑ 所以变量y 与x 的线性相关程度很强. (2)由(1)可得3x =,17y =,1()()43niii x x y y =--=∑,又由2221222(13)(23)(3(3)(43)(53)1)0nii x x ==-+-+-+-+-=-∑,所以121()()43 4.30)ˆ1(niii ni i x x y y bx x ==--===-∑∑,则ˆˆ17 4.33 4.1a y bx=-=-⨯=, 可得y 关于x 的线性回归方程为ˆ 4.3 4.1y x =+ 令6x =,可得ˆ 4.36 4.129.9y=⨯+=, 即2020年该网站“双11”当天的交易额29.9百亿元. 【点睛】利用最小二乘法求回归直线方程,再利用方程进行预报值,准确计算是求解的关键.15.(1)0.998;变量y 与x 的线性相关程度很强;(2)ˆ 4.3 4.1yx =+;29.9百亿元. 【分析】(1)根据表中数据可得x 、y ,再计算出1()()niii x x y y =--∑和1()()niii x x y y =--∑,代入()()niix x y y r --=∑,得到数据与所给r 比较可得答案;(2)由(1)可得x ,y ,1()()niii x x y y =--∑,计算出21()ni i x x =-∑,代入121()()()ˆniii ni i x x y y bx x ==--=-∑∑和ˆˆay bx =-可得答案. 【详解】(1)由题意,根据表格中的数据, 可得:1(12345)35x =++++=,1(912172126)175y =++++=, 则1()()(13)(917)(53)(2617)43niii x x y y =--=--++--=∑,43.1=≈,所以()()430.99843.1niix x y y r --==≈∑, 所以变量y 与x 的线性相关程度很强. (2)由(1)可得3x =,17y =,1()()43niii x x y y =--=∑,又由2221222(13)(23)(3(3)(43)(53)1)0nii x x ==-+-+-+-+-=-∑,所以121()()43 4.30)ˆ1(niii ni i x x y y bx x ==--===-∑∑,则ˆˆ17 4.33 4.1a y bx=-=-⨯=, 可得y 关于x 的线性回归方程为ˆ 4.3 4.1y x =+, 令6x =,可得ˆ 4.36 4.129.9y=⨯+=, 即2020年该网站“双11”当天的交易额29.9百亿元. 【点睛】本题考查了变量的相关性以及回归直线方程的求解,回归分析的目的是试图通过样本数据得到真实结构参数的估计值,并要求估计结果接近真实值,要求认真计算各个数值.。
新人教版高中数学选修三第三单元《成对数据的统计分析》测试题(有答案解析)(4)
一、选择题1.下列说法正确的是( )A .若残差平方和越小,则相关指数2R 越小B .将一组数据中每一个数据都加上或减去同一常数,方差不变C .若2K 的观测值越大,则判断两个分类变量有关系的把握程度越小D .若所有样本点均落在回归直线上,则相关系数1r =2.已知变量x ,y 之间具有较强的线性相关性,测得它们的四组数据如表所示:现已求得变量x ,y 之间的回归方程为2y ax =+,请根据给出的条件,预测9x =时,y 的值约为( )A .45-B .52-C .45 D .523.变量y 与x 的回归模型中,它们对应的相关系数r 的值如下,其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型44.某车间加工零件的数量x 与加工时间y 的统计数据如表:该车间的负责人作出散点图,发现x ,y 是线性相关的,并求出y 关于x 的线性回归方程23517=+y bx (其中b 是常数),据此回归模型可以预测,加工20个零件所需要的加工时间约为( ) A .45分钟 B .46分钟 C .47分钟 D .48分钟 5.已知x 、y 的取值如下表:从散点图可以看出y 与x 线性相关,且回归方程0.95y x a =+,则当5x =时,估计y 的值为( ) A .7.1 B .7.35C .7.95D .8.66.某工厂为了对新研发的一种产品进行合理定价,将该产品事先拟订的价格进行试销,得到如下数据.由表中数据求得线性回归方程ˆˆ4=-+y x a ,则15=x 元时预测销量为()A .45件B .46件C .49件D .50件7.下列说法中正确的是 ( )①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ;③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度; ④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好. A .①②B .③④C .①④D .②③8.已知回归方程21y x =-,则该方程在样本(3,4)处的残差为( ) A .-1B .1C .2D .59.下列命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.其中正确命题的个数是( ) A .1个B .2个C .3个D .4个10.由变量x 与y 相对应的一组数据()12,y 、()24,y 、()3 6,y 、()48,y 、()5 10,y 得到的线性回归方程为ˆ 1.212yx =+,则12345y y y y y ++++等于( ) A .88B .90C .92D .9611.已知呈线性相关的变量x 与y 的部分数据如表所示:若其回归直线方程是,则()A.5.5 B.6 C.6.5 D.712.为考察某种药物预防疾病的效果,进行动物试验,得到如下药物效果与动物试验列联表:由上述数据给出下列结论,其中正确结论的个数是()附:22()()()()()n ad bcKa b c d a c b d-=++++;①能在犯错误的概率不超过0.05的前提下认为药物有效②不能在犯错误的概率不超过0.025的前提下认为药物有效③能在犯错误的概率不超过0.010的前提下认为药物有效④不能在犯错误的概率不超过0.005的前提下认为药物有效A.1B.2C.3D.4第II卷(非选择题)请点击修改第II卷的文字说明参考答案13.设两个变量x和y之间具有线性相关关系,它们的相关系数为r,y关于x的回归直线方程为y kx b=+,则()A.k与r的符号相同B.b与r的符号相同C.k与r的符号相反D.b与r的符号相反二、解答题14.某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i 位学生的成绩为(i i x y ,) (i =1,2,3...20),其中i i x y ,分别为第i 位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):(1)根据统计学知识,当相关系数|r |≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:20202022111()()485.()678.()476iiii i i i x x y y x x y y ===--=-=-=∑∑∑参考公式:相关系数12211()().()()niii n niii i x x y y r x x x y ===--=--∑∑∑(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X 表示这2名学生两科赋分的和,求X 的分布列和数学期望.15.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y ,(单位:千元)的数据资料,算出101010102111180,20184,720ii i i i i i i i xy x y x ========∑∑∑∑,,附:线性回归方程1221ˆˆˆˆˆˆ,,ni ii nii x y nxyybx a b ay bx xnx ==-=+==--∑∑,其中,x y 为样本平均值. (1)求家庭的月储蓄y 对月收入x 的线性回归方程ˆˆˆybx a =+ ; (2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.16.某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2018级的1000名学生进行调查,收集到相关数据如下:(1)根据以上提供的信息,完成22⨯列联表,并完善等高条形图;选物理不选物理总计数学成绩优秀数学成绩不优秀260总计6001000(2)能否在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关?附:22()()()()()n ad bcKa b c d a c b d-=++++临界值表:()2P K k0.100.050.0100.0050.001 0k 2.706 3.841 6.6357.87910.82817.某大学生参加社会实践活动,对某公司1月份至6月份销售某种配件的销售量及销售单价进行了调查,销售单价x和销售量y之间的一组数据如下表所示:月份123456销售单价(元)99.51010.5118(1)根据1至5月份的数据,求出y 关于x 的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过0.5元,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想? (3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多少元才能获得最大利润?(注:利润=销售收入-成本).参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni i i n i i x y nxy b x nx==-=-∑∑,55211392,502.5,i ii i i x yx ====∑∑18.2022年北京冬奥会的申办成功与“3亿人上冰雪”口号的提出,将冰雪这个冷项目迅速炒“热”.北京某综合大学计划在一年级开设冰球课程,为了解学生对冰球运动的兴趣,随机从该校一年级学生中抽取了100人进行调查,其中女生中对冰球运动有兴趣的占23,而男生有10人表示对冰球运动没有兴趣额.(1)完成22⨯列联表,并回答能否有90%的把握认为“对冰球是否有兴趣与性别有关”?(2)已知在被调查的女生中有5名数学系的学生,其中3名对冰球有兴趣,现在从这5名学生中随机抽取3人,求至少有2人对冰球有兴趣的概率.附表:22()()()()()n ad bc K a b c d a c b d -=++++19.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时) 2.534 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程ˆˆˆy bx a=+,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:()()()1122211ˆn ni i i ii in ni ii ix x y y x y nxybx x x nx====---==--∑∑∑∑,ˆˆa y bx=-)20.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据x3456y 2.534 4.5(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ˆˆˆy bx a=+;(2)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据1求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(附:42186iix==∑,4166.5i iix y==∑,()()()1122211n ni i i ii in ni ii ix x y y x y nxybx x x nx====---==--∑∑∑∑,ˆˆa y bx=-,其中x,y为样本平均值)21.某手机企业为确定下一年度投入某种产品的研发费用,统计了近10年投入的年研发费用x千万元与年销售量y千万件的数据,得到散点图1,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关统计量的值如图2:(1)利用散点图判断y bx a =+和dy c x =⋅()0,0c d >>哪一个更适合作为年研发费用x 和年销售量y 的回归类型(不必说明理由),并根据数据,求出y 与x 的回归方程;(2)已知企业年利润z 千万元与,x y 的关系式为27z y x e=-(其中e 为自然对数的底数),根据(1)的结果,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?22.某市春节期间7家超市的广告费支出i x (万元)和销售额i y (万元)数据如下:超市 A B C D E F G 广告费支出i x 1 2 4 6 11 13 19 销售额i y19324044525354参数数据及公式:8x =,42y =,712794i i i x y ==∑,712708i i x ==∑,1221ˆni i nii i y n x y b nxx x ==-⋅=-∑∑,ˆˆay bx =-,ln 20.7≈. (1)若用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程;(2)用对数回归模型拟合y 与x 的关系,可得回归方程:ˆ12ln 22yx =+,经计算得出线性回归模型和对数模型的2R 分别约为0.75和0.97,请用2R 说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额.23.根据教育部高考改革指导意见,广东省从2021年正式实施“312++”新的高考考试方案.为尽快了解学生的选科需求,及时调整学校人力资源配备.某校从高一学生中抽样调查了100名同学,在模拟分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生14人)选择了历史.请完成以下22⨯列联表,并判断能否有99.9%的把握说选科与性别有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.2()p K k ≥0.15 0.10 0.05 0.025 0.010 0.005 0.001 k2.0722.7063.8415.0246.6357.87910.82824.某地区不同身高()x cm 的未成年男孩的体重平均值()y kg 如下表:已知ln y 与x 之间存在很强的线性相关性, (1)据此建立y 与x 之间的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高150cm 体重为45kg 的在校男生的体重是否正常? 参考数据:()51ln 940iii x y =⋅=∑,51ln 11.5ii y==∑, 3.740.5e ≈附:对于一组数据()11,v μ,()22,v μ,…,(),n n v μ,其回归直线v bx a =+中的斜率和截距的最小二乘估计分别为1221ˆni i i nii v n vbn μμμμ==-=-∑∑,ˆˆav b μ=-. 25.某地实施乡村振兴战略,对农副产品进行深加工以提高产品附加值,已知某农产品成本为每件3元,加工后的试营销期间,对该产品的价格与销售量统计得到如下数据:(1)求销量y (件)关于单价x (元)的线性回归方程ˆˆˆybx a =+; (2)根据销量y 关于单价x 的线性回归方程,要使加工后收益P 最大,应将单价定为多少元?(产品收益=销售收入-成本).参考公式:ˆb=()121()()ni i i ni i x x y y x x ==---∑∑=1221ni i i n i i x y nxy x nx ==--∑∑,ˆˆay bx =- 26.高一学年结束后,要对某班的50名学生进行文理分班,为了解数学对学生选择文理科是否有影响,有人对该班的分科情况做了如下的数据统计:(Ⅰ)根据数据关系,完成22⨯列联表;(Ⅱ)通过计算判断能否在犯错误的概率不超过2.5%的前提下认为数学对学生选择文理科有影响.附:22()()()()()n adbc K a b c d a c b d -=++++参考答案【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】由残差平方和越小,模型的拟合效果越好,可判断A ;由方差的性质可判断B ;由的随机变量2K 的观测值的大小可判断C ;由相关系数r 的绝对值趋近于1,相关性越强,可判断D .【详解】对于A ,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,相关指数2R 越大,故A 错误;对于B ,将一组数据的每一个数据都加上或减去同一常数后,由方差的性质可得方差不变,故B 正确;对于C ,对分类变量X 与Y ,它们的随机变量2K 的观测值越大,“X 与Y 有关系”的把握程度越大,故C 错误;对于D ,若所有样本点均落在回归直线上,则相关系数1r =,故D 错误. 故选:B. 【点睛】本题考查命题的真假判断,主要是线性回归直线的特点和线性相关性的强弱、样本数据的特征值和模型的拟合度,考查判断能力,属于基础题.2.B解析:B 【分析】由已知求得x ,y ,代入2y ax =+求得a 值,则线性回归方程可求,取9x =求得y 值即可. 【详解】12342.54x +++==,1892130.7545105104y ⎛⎫=+++== ⎪⎝⎭,0.7520.52.5a -∴==-,则线性回归方程为0.52y x =-+, 取9x =,得50.5922y =-⨯+=-. 故选:B . 【点睛】本题考查线性回归方程,明确线性回归方程恒过样本点的中心是关键,是基础题.3.C解析:C 【分析】根据相关系数的性质,r 的绝对值最大,则其拟合效果最好,进行判断即可. 【详解】线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小,∵模型3的相关系数r 最大,∴模拟效果最好, 故选C . 【点睛】本题主要考查线性回归系数的性质,在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.4.D解析:D 【分析】求出样本数据的中心坐标(,)x y ,代入回归直线方程,求出ˆb,得到回归直线方程,然后求解加工20个零件所需要的加工时间,得到答案. 【详解】由题意,根据表中的数据,可得1(911141516)135x =++++=, 1(3032364042)365y =++++=,即样本中心点为(13,36),将样本中心点为(13,36)代入回归方程,可得235361317b =⨯+,解得2917b =, 所以回归方程为292351717y x =+, 当20x时,292358152047.9848171717y =⨯+=≈≈(分钟). 故选:D. 【点睛】本题主要考查了线性回归方程的求法及应用,其中解答中熟记回归直线方程经过样本中心点是解答的关键,着重考查推理与运算能力.5.B解析:B 【分析】计算2x =, 4.5y =,代入回归方程计算得到 2.6a =,再计算得到答案. 【详解】013424x +++==, 2.2 4.3 4.8 6.7 4.54y +++==,故4.50.952a =⨯+,解得2.6a =.当5x =,0.955 2.67.35y =⨯+=. 故选:B 【点睛】本题考查了回归方程的应用,意在考查学生的计算能力.6.B解析:B 【分析】计算出,x y 代入回归直线方程,求得a ,再令15x =求得预测值. 【详解】依题意 6.5,80x y ==,代入ˆˆ4=-+yx a 得80 6.54106a =+⨯=,即ˆ4106y x =-+,当15x =时,6010646y =-+=,故选B. 【点睛】本小题主要考查回归直线方程过样本中心点(),x y ,考查利用回归直线方程进行预测,属于基础题.7.D解析:D 【分析】运用相关系数、回归直线方程等知识对各个选项逐一进行分析即可 【详解】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,相关性越强,故错误②回归直线y bx a =+一定经过样本点的中心()x y ,,故正确③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度,故正确 ④相关指数2R 用来刻画回归的效果,2R 越大,说明模型的拟合效果越好,故错误 综上,说法正确的是②③ 故选D 【点睛】本题主要考查的是命题真假的判断,运用相关知识来进行判断,属于基础题8.A解析:A 【解析】分析:利用回归方程,计算3x =时,ˆy 的值,进而可求方程在样本()3,4处的残差. 详解:当3x =时,235ˆ1y=⨯-=, ∴方程在样本()3,4处的残差是451,-=- 故选A.点睛:本题考查线性回归方程的运用,考查学生的计算能力,属于基础题.9.C解析:C 【解析】对于①,在回归分析模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,正确,因为相关指数2R 越大,则残差平方和越小,模型的拟合效果越好,①正确.对于②两个变量相关性越强,则相关系数的绝对值就越接近于1;对于③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;正确;对于④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.错误,因为在对分类变量X 与Y 进行独立性检验时,随机变量2K 的观测值k 越大,则“X 与Y 相关”可信程度越大,故④错误; 故选C10.D解析:D 【分析】求出x ,代入ˆ 1.212yx =+,可得y ,则12345y y y y y ++++可求解. 【详解】由题中所给的点,可以求得24681065x ++++==,代入ˆ 1.212yx =+,可得 1.261219.2y =⨯+=, 所以12345519.296y y y y y ++++=⨯=, 故选:D. 【点睛】该题考查的是有关回归直线方程的应用,涉及到的知识点有回归直线过样本中心点,属于简单题目.11.C解析:C 【分析】 先求出5x =,245m y +=,再根据回归方程过样本中心,可求出参数m 的值. 【详解】 由题意可得2456855x ++++==,3 4.57.592455m m y +++++==,则241.0550.855m +=⨯+,解得 6.5m =. 故选:C. 【点睛】本题考查根据回归方程过样本中心求原始数据,注意不能将5x =代入回归方程求m 的值 ,属于中档题.12.B解析:B 【分析】计算出2K 的值,由此判断出正确结论的个数. 【详解】依题意()2210510302045 6.10930755055K ⨯⨯-⨯=≈⨯⨯⨯,故能在犯错误的概率不超过0.05的前提下认为药物有效, 不能在犯错误的概率不超过0.005的前提下认为药物有效,即①④结论正确,本小题选B. 【点睛】本小题主要考查22⨯列联表独立性检验,考查运算求解能力,属于基础题.13.A解析:A 【分析】根据相关系数知相关系数的性质:r 1≤,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.r 为正,表示正相关,回归直线方程上升,选出正确结果. 【详解】相关系数r 为正,表示正相关,回归直线方程上升, r 为负,表示负相关,回归直线方程下降,k ∴与r 的符号相同. 故选A . 【点睛】本题考查用相关系数来衡量两个变量之间相关关系的方法,当相关系数为正时,表示两个变量正相关,当相关系数大于0.75时,表示两个变量有很强的线性相关关系.二、解答题14.(1)“数学学期综合成绩”与“物理学期综合成绩”高度相关;答案见解析;(2)分布列见解析,95. 【分析】(1)代入公式计算,解得0.8r >即可得解;(2)由超几何分布概率公式计算出(0)P X =、(1)P X =、(2)P X =、(3)P X =、(4)P X =,进而可得分布列,再由数学期望的公式即可得数学期望.【详解】(1)由题意,20()()ii xx y y r --==∑6260.87.515>==>=⨯=, 所以“数学学期综合成绩”与“物理学期综合成绩”高度相关; (2) 由题意得:X 的可能取值为0,1,2,3,4.,根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,所以9222036(0)190C P X C ===,49112203619(1)0C C P X C ===,2112204791609(29)C C C P X C +===,114722023810(9)C C P X C ===,27220(4)21190C P X C ===,所以X 的分布列为:所以190190190()012341901901905E X =⨯+⨯+⨯+⨯+⨯==. 【点睛】关键点点睛:解决本题的关键是对r 的值合理放缩及超几何分布的应用. 15.(1)0.30.4y x =-;(2)1.7 【分析】(1)根据数据,利用最小二乘法,即可求得y 对月收入x 的线性回归方程回归方程ˆˆyb =x ˆa +; (2)将x =7代入即可预测该家庭的月储蓄. 【详解】(1)由题意知,10101110,80,20ii i i n xy =====∑∑ ,80208,21010x y ∴==== ∴21082160,1064640n x y n x ⋅⋅=⨯⨯=⋅=⨯=1010211184,720i i ii i x y x ====∑∑ 由1221184160ˆ0.3720640ni ii nii x y nxybxnx ==--===--∑∑.ˆˆ20.380.4ay bx =-=-⨯=- 故所求回归方程为0.30.4y x =- (2)将7x =代入回归方程可以预测该家庭的月储蓄为0.370.4 1.7y =⨯-=(千元). 【点睛】本题考查线性回归方程的应用,考查最小二乘法求线性回归方程,考查转化思想,属于中档题.16.(1)填表见解析,作图见解析(2)能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关 【分析】(1)由题意计算出各组人数后即可完成列联表,进而可补全等高条形图; (2)代入公式计算出2K ,与3.841比较即可得出结论. 【详解】(1)根据题意填写列联表如下,选物理 不选物理 总计 数学成绩优秀 420 320 740 数学成绩不优秀 180 80 260 总计6004001000(2)计算222()1000(42080180320)()()()()600400740260n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯12.474 3.841≈>,所以能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关. 【点睛】本题考查了独立性检验的应用,考查了计算能力,属于中档题.17.(1)ˆ3240yx =-+.. (2) 可以认为所得到的回归直线方程是理想的.(3) 该产品的销售单价定为7.5元/件时,获得的利润最大. 【解析】分析:(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 详解:(1)因为()()11995101051110,1110865855x =++++==++++=.., 所以23925108325025510ˆb-⨯⨯==--⨯..,则()ˆ8321040a =--⨯=., 于是y 关于x 的回归直线方程为ˆ3240y x =-+.; (2)当8x =时, 32840144ˆy=-⨯+=..,则14414045ˆ0y y -=-=<..., 所以可以认为所得到的回归直线方程是理想的; (3)令销售利润为W ,则()()22532403248100(25125)W x x x x x =--+=-+-<<.....,因为()215321510032100802x x W x x -+⎛⎫=-+-≤⨯-= ⎪⎝⎭..,当且仅当15x x =-+,即75x =.时, W 取最大值. 所以该产品的销售单价定为7.5元/件时,获得的利润最大. 点睛:本题考查了线性回归方程的求法与应用问题,属中档题. 18.(1)有(2)710p = 【分析】(1)根据题中数据得到列联表,然后计算出2K ,与临界值表中的数据对照后可得结论.(2)由题意得概率为古典概型,根据古典概型概率公式计算可得所求. 【详解】(1)根据已知数据得到如下列联表有兴趣 没有兴趣 合计 男 45 10 55 女 30 15 45 合计7525100由列联表中的数据可得因为,所以有90%的把握认为“对冰球是否有兴趣与性别有关”.(2)记5人中对冰球有兴趣的3人为A 、B 、C ,对冰球没有兴趣的2人为m 、n , 则从这5人中随机抽取3人,所有可能的情况为:(A,m,n ),(B,m,n ),(C,m,n ),(A,B,m ),(A,B,n ),(B,C,m ),(B,C,n ),(A,C,m ),(A,C,n ),(A,B,C ),共10种情况, 其中3人都对冰球有兴趣的情况有(A,B,C ),共1种,2人对冰球有兴趣的情况有(A,B,m ),(A,B,n ),(B,C,m ),(B,C,n ),(A,C,m ),(A,C,n ),共6种,所以至少2人对冰球有兴趣的情况有7种, 因此,所求概率为710P =. 【点睛】由于独立性检验有其独特的作用,其原理不难理解和掌握,但解题时需要注意计算的准确性和判断的正确性,对独立性检验的考查多以解答题的形式出现,一般为容易题,多与概率、统计等内容综合命题.19.(1)作图见解析;(2)ˆ0.7 1.05yx =+;作图见解析;(3)8.05小时. 【分析】(1)利用描点法作图;(2)利用公式计算x ,y 及系数a ,b ,可得回归方程;(3)把10x =代入回归方程可得y 值,即为预测加工10个零件需要的时间. 【详解】解:(1)散点图如图(2)由表中数据得: 3.5x =, 3.5y =,4152.5i ii x y==∑,4215i xi ==∑,2252.54350.754435b -⨯⋅∴==-⨯⋅,3.50.7 3.5 1.05a ∴=-⨯=,ˆ0.7 1.05yx ∴=+.(3)将10x =代入回归直线方程,得ˆ0.710 1.058.05y =⨯+=, ∴预测加工10个零件需要8.05小时.【点睛】本题考查了回归分析,解答此类问题的关键是利用公式计算,计算要细心.20.(1)0.70.35y x =+;(2)19.65. 【分析】(1)由表中数据和参考公式即求线性回归方程; (2)根据(1)中的线性回归方程进行预测,即得答案. 【详解】(1)由表中数据可得3456 2.534 4.54.5, 3.544x y ++++++====. 1222441466.54 4.5 3.50.7864 4.5ˆ4i ii ii bx yxyx x ==--⨯⨯∴===-⨯-∑∑, ˆˆ 3.50.7 4.50.35ay bx =-=-⨯=. 所以线性回归方程为0.70.35y x =+.(2)由(1)知线性回归方程为0.70.35y x =+. 把100x =代入,得0.71000.3570.35y =⨯+=,所以生产100吨甲产品的生产能耗比技改前降低9070.3519.65-=吨标准煤. 【点睛】本题考查线性回归方程及其应用,属于中档题. 21.(1)d y c x =⋅更适合,13y e x =⋅;(2)2.7亿元 【分析】(1)根据散点图可直接判断回归类型d y c x =⋅更适合;对dy c x =⋅两边取对数得ln v c du =+,代入公式计算出d 、ln c 后即可得回归方程;(2)由题意1327z x x =-,求导后得出函数的单调性后即可得解. 【详解】(1)由散点图知,选择回归类型dy c x =⋅更适合,对dy c x =⋅两边取对数,得ln ln ln y c d x =+,即ln v c du =+,由表中数据得,122130.510 1.5 1.5146.510 1.5 1.53ni i i nii u v nuvd unu==--⨯⨯===-⨯⨯-∑∑,所以1ln 1.5 1.513c v du =-=-⨯=,所以c e =, 所以年研发费用x 和年销售量y 的回归方程为13y e x =⋅. (2)由(1)知1327z x x =-,求导得2391z x -'=-,令()23910z x x-'=-=,得27x =,函数1327z x x =-在()0,27上单调递增,在()27,+∞上单调递减, 所以当27x =时,年利润取最大值5.4亿元.故要使得年利润最大,预计下一年应投入2.7亿元研发费用. 【点睛】本题考查了非线性回归方程的求解和应用,考查了利用导数求函数的最值,属于中档题.22.(1) 1.7284ˆ.yx =+;(2)对数模型更合适;47.2万元. 【分析】(1)利用最小二乘法计算可得回归直线;(2)根据2R 的值,可确定对数模型更合适;将8x =代入模型求得y 即为所求结果. 【详解】(1)7121227727947842ˆ 1.7708787i i i i i y xyx x b x ==-⋅-⨯⨯===-⨯-∑∑,ˆˆ42 1.7828.4ay bx ∴=-=-⨯=, y ∴关于x 的线性回归方程为: 1.7284ˆ.y x =+.(2)0.970.75>,∴对数模型更合适.∴当广告费支出为8万元,即8x =时,销售额预测值12ln82236ln 222360.72247.2y =+=+≈⨯+=(万元).【点睛】本题考查最小二乘法求解回归直线、相关指数的意义和预测值的求解问题;考查学生的计算和求解能力.23.列联表见解析,有99.9%的把握说选科与性别有关. 【分析】选物理的男生38人,则女士12人,选历史的男生14人,则女士36人,即可完成22⨯列联表,做出假设0H :选科与性别没有关系,再由表中数据计算2K 的观测值,可得观测值大于10.828,所以在犯错误的概率不超过0.001的前提下认为选科与性别有关系,即有99.9%的把握有关系. 【详解】列出22⨯列联表如下:提出假设0:选科与性别没有关系.根据列联表中的数据计算2K的观测值2100(38361412)30023.0775248505013k ⨯⨯-⨯==≈⨯⨯⨯.因为10.828k ≥,所以有99.9%的把握说选科与性别有关. 【点睛】本题考查独立性检验的基本应用,属于中档题. 24.(1) 0.020.7x y e +=. (2) 正常的. 【分析】 (1)先求得x 及521ii x=∑,即可求得52215i i xx =-∑.代入线性回归方程中即可求得ˆb.再由ˆˆav b μ=-即可求得ˆa ,进而得回归方程. (2)根据回归方程及参考数据,即可求得该男生的体重,进而判断该体重是否位于平均值的1.2倍与0.8倍之间. 【详解】 (1)由已知可得80x =,()522221100671033000i i x ==⨯+++=∑∴5221533000320001000i i xx =-=-=∑又()51ln 940iii x y =⋅=∑,11.52.35v == ∴9405 2.380ˆ0.021000b-⨯⨯== ˆ 2.30.02800.7a=-⨯= 所以ln 0.020.7y x =+ ∴回归方程为:0.020.7x y e +=(2)当150x =时, 3.7ˆ40.5ye =≈, 而40.5 1.248.645⨯=>,40.50.832.445⨯=<,∴这一在校男生的体重是正常的. 【点睛】本题考查了非线性回归方程在实际问题中的应用,计算量较为复杂,需要耐心计算,属于中档题.25.(1)ˆ20200yx =-+;(2)6.5元. 【分析】(1)由题意计算平均数和回归系数,即可写出回归直线方程;(2)由题意写出收益函数P 的解析式,求出P 取最大值时对应的x 值即可. 【详解】解:(1)由题意得,x =16×(6+6.2+6.4+6.6+6.8+7)=6.5, y =16×(80+74+73+70+65+58)=70; 则()61()5 1.20.30 1.5614iii x x y y =--=------=-∑,621()0.250.090.010.010.090.250.7ii x x =-=+++++=∑;所以142007ˆ.b-==- ,() 7020 6.5200ˆˆa y bx =-=--⨯= 所以所求回归直线方程为20200ˆy x =-+. (2)由题意可得,()()()3202ˆ003P yx x x =-=-+-, 整理得P =-20(x -6.5)2+245, 当x =6.5时,P 取得最大值为245;所以要使收益达到最大,应将价格定位6.5元. 【点睛】本题考查了线性回归方程的求法与应用问题,也考查了计算与推理能力,是基础题. 26.(Ⅰ)见解析;(Ⅱ)见解析 【分析】(Ⅰ)根据题意,结合数据之间的关系,补全22⨯的列联表即可; (Ⅱ)计算观测值2K ,通过观测值表进行比较,即可得出结论. 【详解】(Ⅰ)根据数据关系,得22⨯的列联表如下:(Ⅱ)∵2250(2510510) 6.349 5.024********K ⨯-⨯=≈>⨯⨯⨯.故可以在犯错误的概率不超过2.5%的前提下认为数学对学生选择文理科有影响. 【点睛】该题考查的是有关独立性检验的问题,涉及到的知识点有补全列联表,判断能否在犯错误的概率不超过2.5%的前提下认为数学对学生选择文理科有影响,属于简单题目.。
新教材高中数学章末综合检测三成对数据的统计分析新人教A版选择性必修第三册
章末综合检测(三) 成对数据的统计分析A 卷——基本知能盘查卷一、单项选择题1.可用来分析身高与体重有关系的是( ) A .残差分析 B .线性回归模型 C .等高堆积条形图D .独立检验解析:选B 因为身高与体重是两个具有相关关系的变量,所以要用线性回归模型来解决.2.两个变量y 与x 的经验回归模型中,分别选择了四个不同模型来拟合y 与x 之间的关系,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1 C .模型3D .模型4解析:选A 两个变量y 与x 的经验回归模型中,它们的相关指数R 2越接近于1,这个模型的拟合效果越好,所给出的四个选项中0.98是相关指数最大的值,所以拟合效果最好的模型是模型1.3.已知一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )满足y i =a +bx i +e i (i =1,2,…,n ),若e i 恒为0,则R 2=( )A .0B .0.5C .0.9D .1选D4.如果有95%的把握说事件A 和B 有关系,那么具体计算出的数据为( ) A .χ2>3.841 B .χ2<3.841 C .χ2>6.635D .χ2<6.635解析:选A 由独立性判断的方法可知,如果有95%的把握,即小概率值α=0.05,则χ2>3.841.5.观察两个变量(存在线性相关关系)得如下数据:A.y ^=12x +1B.y ^=xC.y ^=2x +13D.y ^=x +1解析:选 B 根据表中数据得x -=18×(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,y -=18×(-9-7-5-3+4.01+4.99+7+8)=0,所以两变量x ,y 的经验回归方程过样本点的中心(0,0),可以排除A 、C 、D 选项,故选B.6.2020年初,新型冠状病毒(COVID 19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:周数(x ) 1 2 3 4 5 治愈人数(y )2173693142由表格可得y 关于x 的二次回归方程为y ^=6x 2+a ,则此回归模型第4周的残差(实际值与预报值之差)为( )A .5B .4C .1D .0解析:选A 设t =x 2,则t -=15(1+4+9+16+25)=11,y -=15(2+17+36+93+142)=58,a =58-6×11=-8,所以y ^=6x 2-8.令x =4,得e 4=y 4-y ^4=93-6×42+8=5.7.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:喜爱程度 性别合计 男(Y =0) 女(Y =1) 爱好(X =0) 10 40 50 不爱好(X =1)20 30 50 合计3070100参考数据及公式:P (χ2≥x α)0.10 0.05 0.01 x α2.7063.8416.635其中χ2=n ad -bc 2a +bc +d a +cb +d,n =a +b +c +d .则下列结论正确的是( )A .根据小概率值α=0.05的独立性检验,认为爱吃零食与性别有关B .根据小概率值α=0.05的独立性检验,认为爱吃零食与性别无关C .根据小概率值α=0.01的独立性检验,认为爱吃零食与性别有关D .根据小概率值α=0.1的独立性检验,认为爱吃零食与性别无关 解析:选A 零假设为H 0:是否爱吃零食与性别相互独立,即是否爱吃零食与性别无关.根据列联表中的数据,经计算得到 χ2=100×10×30-40×20250×50×30×70≈4.762>3.841=x 0.05,所以依据小概率值α=0.05的独立性检验,推断H 0不成立,即认为是否爱吃零食与性别有关.同理可得,根据小概率值α=0.01的独立性检验,认为爱吃零食与性别无关;根据小概率值α=0.1的独立性检验,认为爱吃零食与性别有关.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A 将y ^=7.675代入回归方程,可计算得x ≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83,即约为83%.二、多项选择题9.下列说法正确的是( )A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在线性经验回归模型中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的水平带状区域的宽度越狭窄,其模型拟合的精度越高D .在经验回归模型中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好解析:选ACD 由于线性相关系数|r |≤1,且当|r |越大,线性相关性越强,故r <0时,选项B 不正确,A 、C 、D 均正确.10.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,则下列结论正确的是( )A .y 与x 负相关且y ^=2.347x -6.423 B .y 与x 负相关且y ^=-3.476x +5.648 C .y 与x 正相关且y ^=5.437x +8.493 D .y 与x 正相关且y ^=-4.326x -4.578解析:选BC 正相关指的是y 随x 的增大而增大,负相关指的是y 随x 的增大而减小,故正确的为B 、C.11.以下关于线性经验回归的判断中,正确的选项为( )A .若散点图中所有点都在一条直线附近,则这条直线为经验回归直线B .散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 点C .已知线性经验回归方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69 D .线性经验回归方程的意义是它反映了样本整体的变化趋势解析:选BCD 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=b ^x +a ^才是回归直线,所以A 错误;B 正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69,所以C 正确;D 正确.12.有两个分类变量X 与Y ,其2×2列联表如下表所示:X Y 合计 Y =0 Y =1X =0 a20-a 20 X =115-a 30+a 45 合计155065其中a,15-a 均为大于5的整数,根据小概率值α=0.05的独立性检验,认为X 与Y 之间有关,则a 等于( )A .7B .8C .9D .6解析:选BC 根据小概率值α=0.05的独立性检验,认为X 与Y 之间有关,需要χ2的值大于或等于3.841,由χ2=65×[a 30+a -20-a15-a ]220×45×15×50=1313a -6025 400≥3.841,解得a ≥7.69或a ≤1.54.而a >5且15-a >5,a ∈Z , 所以a =8或a =9. 三、填空题13.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:吸烟量年龄合计不超过40岁 (Y =0)超过40岁 (Y =1) 不多于20支/天(X =0) 50 1565多于20支/天 (X =1) 10 25 35 合计6040100则χ2=________(保留到小数点后两位有效数字). 解析:由列联表知χ2=100×10×15-50×25260×40×65×35≈22.16.答案:22.1614.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,具体数据如下表:性别专业非统计专业 (Y =0)统计专业 (Y =1) 男(X =0) 13 10 女(X =1)720为了判断主修统计专业是否与性别有关系,根据表中数据,得到χ2=50×13×20-10×7223×27×20×30≈4.844>3.841,所以能根据小概率值α=________,我们断定主修统计专业与性别有关系.解析:因为P (χ2≥3.841)=0.05,所以小概率值α=0.05. 答案:0.0515.下表是降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性经验回归方程y ^=0.7x +0.35,那么表中m 的值为________.x3 4 5 6y2.5 m 4 4.5解析:根据所给的表格可以求出x -=3+4+5+64=4.5,y -=2.5+m +4+4.54=11+m 4,因为这组数据的样本点的中心在线性经验回归直线上, 所以11+m4=0.7×4.5+0.35,所以m =3.答案:3 四、解答题16.(12分)为做好2022年北京冬季奥运会的宣传工作,组委会计划从某大学选取若干名大学生志愿者,某记者在该大学随机调查了1 000名大学生,以了解他们是否愿意做志愿者工作,得到的数据如表所示:性别 是否愿意做志愿者 合计 愿意(Y =0)不愿意(Y =1)男(X =0)610 女(X =1)90 合计800(1)根据题意完成表格.(2)依据小概率值α=0.05的独立性检验,分析愿意做志愿者工作与性别是否有关? 参考公式及数据:χ2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .P (χ2≥x α)0.10 0.05 0.01 x α2.7063.8416.635解:(1)性别 是否愿意做志愿者 合计 愿意(Y =0)不愿意(Y =1)男(X =0) 500 110 610 女(X =1) 300 90 390 合计8002001 000(2)零假设为H 0:愿意做志愿者工作与性别是相互独立,即愿意做志愿者工作与性别是无关的.根据列联表中的数据,经计算得到 χ2=1 000×500×90-110×3002610×390×800×200=3 000793≈3.783<3.841=x 0.05, 所以依据小概率值α=0.05的独立性检验,没有充分证据推断H 0不成立,即愿意做志愿者工作与性别是无关的.17.(12分)自从高中生通过高校自主招生可获得加分进入高校的政策出台后,自主招生越来越受到高中生家长的重视.某机构为了调查A 城市和B 城市的高中家长对于自主招生的关注程度,在这两个城市中抽取了100名高中生家长进行了调查,得到下表:城市高中家长是否关注合计关注(Y =0)不关注(Y =1)A 城高中家长(X =0)2050B 城高中家长(X =1) 20 合计100(1)完成上面的列联表;(2)根据上面列联表的数据,能否根据小概率值α=0.05的独立性检验,判断家长对自主招生关注与否与所处城市有关系;(3)为了进一步研究家长对自主招生的看法,该机构从关注的学生家长里面,按照分层随机抽样方法抽取了5人,并再从这5人里面抽取2人进行采访,求所抽取的2人恰好A ,B 两城市各一人的概率.参考公式:χ2=n ad -bc 2a +bc +d a +cb +d(其中n =a +b +c +d ).附表:P (χ2≥x α)0.10 0.05 0.010 x α2.7063.8416.635解:(1)列联表如下: 城市高中家长是否关注合计关注(Y =0) 不关注(Y =1)A 城高中家长(X =0)203050B 城高中家长(X =1) 30 20 50 合计 5050100(2)零假设为H 0:家长对自主招生关注与否与所处城市相互独立,即家长对自主招生关注与否与所处城市无关.根据列联表中的数据,经计算得到 χ2=100×20×20-30×30250×50×50×50=4>3.841.所以根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即认为家长对自主招生的关注与否与所处城市是有关的.(3)关注的人共有50人,按照分层随机抽样的方法,A 城市2人,B 城市3人,从5人中抽取2人有C 25=10种不同的方法,A ,B 两城市各取一人有C 12C 13=2×3=6种不同的方法,故所抽取的2人恰好A ,B 两城市各一人的概率为C 13C 12C 25=610=0.6.B 卷——高考能力达标卷一、单项选择题1.下列属于相关关系的是( ) A .利息与利率 B .居民收入与储蓄存款 C .电视机产量与苹果产量 D .某种商品的销售额与销售价格解析:选B A 与D 是函数关系,C 中两变量没有关系,B 中居民收入与储蓄存款是相关的,但不具有函数关系.2.已知一个经验回归方程为y ^=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y -=( )A .58.5B .46.5C .60D .75解析:选A x -=1+7+5+13+195=9,因为经验回归直线必过样本点的中心(x -,y -), 所以y -=1.5×9+45=13.5+45=58.5.3.已知每一吨铸铁成本y (元)与铸件废品率x %建立的经验回归方程y ^=56+8x ,则下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据经验回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.4.某商品销售量y (件)与销售价格x (元/件)负相关,则其经验回归方程可能是( ) A .y =-10x +200 B .y =10x +200 C .y =-10x -200D .y =10x -200解析:选A 由于销售量y 与销售价格x 成负相关,故排除B 、D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意.5.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的经验回归方程为y ^=0.85x -85.71,则下列说法错误的是( )A .y 与x 具有正的线性相关关系B .经验回归直线过样本点的中心C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 选项中,若该大学某女生身高为170 cm ,则可断定其体重约为0.85×170-85.71=58.79(kg).故D 选项错误.6.如图所示的是调查某地区男、女中学生喜欢理科的等高堆积条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的比例约为80%C .男生比女生喜欢理科的可能性大些D .男生中不喜欢理科的比例约为60%解析:选C 由题图可知女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.7.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.8.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:物理成绩数学成绩合计85~100分 (Y =0)85分以下 (Y =1) 85~100分(X =0) 37 85 122 85分以下(X =1)35 143 178 合计72228300 根据表中数据,分析数学成绩与物理成绩有关联的出错率不超过( ) A .0.5% B .1% C .0.1%D .5%解析:选D 由表中数据代入公式得 χ2=300×37×143-85×352122×178×72×228≈4.514>3.841=x 0.05,所以判断的出错率不超过5%. 二、多项选择题9.给出下列实际问题,其中用独立性检验可以解决的问题有( ) A .一种药物对某种病的治愈率 B .两种药物治疗同一种病是否有区别 C .吸烟得肺病的概率 D .吸烟与性别是否有关系答案:BD10.对于经验回归方程y ^=b ^x +a ^,下列说法正确的是( ) A .直线必经过点(x -,y -)B .x 增加1个单位时,y 平均增加b ^个单位 C .样本数据中x =0时,可能有y =a ^D .样本数据中x =0时,一定有y =a ^解析:选ABC 经验回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.11.下列说法中正确的有( ) A .若r >0,则x 增大时,y 也相应增大 B .若r <0,则x 增大时,y 也相应增大C .若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上D .|r |越接近1,相关关系越强解析:选ACD 若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故A 正确.r <0,表示两个变量负相关,x 增大时,y 相应减小,故B 错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故C 正确,D 正确.12.根据如下样本数据:得到的经验回归方程为y =b x +a ,则( ) A.a ^>0 B.a ^<0 C.b ^>0D.b ^<0解析:选AD 根据题意,画出散点图(图略).根据散点图,知两个变量为负相关,且经验回归直线与y 轴的交点在y 轴正半轴,所以a ^>0,b ^<0.三、填空题13.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若两名同学的总成绩相差50分,则他们的数学成绩大约相差________分.解析:令两人的总成绩分别为x 1,x 2.则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20. 答案:2014.为了判断高三年级学生选修文科是否与性别有关,现随机抽取70名学生,得到如图所示2×2列联表:已知P (≈4.667,则在犯错误的概率不大于________的前提下认为选修文科与性别有关.解析:由题意知, χ2≈4.667,因为6.635>4.667>3.841,所以在犯错误的概率不大于0.05的前提下认为选修文科与性别有关.答案:0.0515.已知x ,y 之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是______________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎪⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎪⎫4-1032+⎝⎛⎭⎪⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎪⎫3-722+(4-4)2+⎝⎛⎭⎪⎫5-922=12. 因为S 2<S 1,故用直线l 2:y =12x +12拟合程度更好.答案:y =12x +12四、解答题16.(12分)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上.若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,则使用微信的人中75%是青年人.如果规定每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中,中年人有40人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,请完成下面的2×2列联表;使用微信 年龄合计青年人(Y =0)中年人(Y =1)经常使用微信 (X =0)不经常使用微信(X =1) 合 计(2)根据列联表中的数据,依据小概率值α=0.001的独立性检验分析该公司经常使用微信的员工与年龄的关系.解:(1)由已知可得,该公司员工中使用微信的有200×90%=180(人). 经常使用微信的有180-60=120(人), 使用微信的人中青年人有180×75%=135(人), 故2×2列联表如下:使用微信 年龄合计青年人(Y =0)中年人(Y =1)经常使用微信 (X =0) 8040120不经常使用微信(X =1) 55 5 60 合 计 13545180(2)零假设为H 0:该公司经常使用微信的员工与年龄相互独立,即该公司经常使用微信的员工与年龄无关.将列联表中的数据代入公式可得, χ2=180×80×5-40×552135×45×120×60≈13.333>10.828=x 0.001,所以根据小概率值α=0.001的独立性检验,我们推断H 0不成立,即认为该公司经常使用微信的员工与年龄有关.17.(12分)淘宝网卖家在某商品的所有买家中,随机选择男女买家各50位进行调查,他们的评分等级如下:评分等级 [0,1] (1,2] (2,3] (3,4] (4,5] 女/人 2 7 9 20 12 男/人 3918128(1)从评分等级为(4,5]的人中随机选取2人,求恰有1人是男性的概率;(2)规定:评分等级在[0,3]为不满意该商品,在(3,5]为满意该商品.完成下面列联表,并根据小概率值α=0.05的独立性检验,分析性别与对商品满意度是否有关.性别评分等级合计满意该商品 (Y =0)不满意该商品(Y =1)女(X =0) 男(X =1) 合计解:(1)因为从评分等级(4,5]的20人中随机选取2人,共有C 220=190种选法,其中恰有1人为男性的共有C 112C 18=96种选法,所以所求概率P =96190=4895.(2)列联表如下:性别评分等级合计满意该商品 (Y =0)不满意该商品(Y =1) 女(X =0) 32 18 50 男(X =1) 20 30 50 合计5248100 零假设为H 0:性别与对商品满意度相互独立,即性别与对商品满意度无关.由公式得χ2=100×32×30-20×18250×50×52×48≈5.769>3.841=x 0.05,所以根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即可以认为性别与对商品满意度有关.。
人教版高中数学选修1-2《统计案例:复习参考题》【可编辑全文】
(2)建立销售总额为解释变量,利润为预报变量的回归 模型. (3)计算R2,你认为这个模型能较好地刻画销售总额和 利润之间的关系吗?请说明理由.
利润y
销售总额x与利润y的散点图
5000
4500
4000
3500
3000
2500 y = 0.0256x + 1334.5
2000
1500
R²= 0.4572
知识回顾 回归分析的思想及初步应用
1.函数关系与相关关系的区别?
函数关系是一种确定性关系,而相关关系是 一种非确定性关系.
2. 若y与x呈线性相关关系,则 回归直线方程
为
,满足
知识回顾 回归分析的思想及初步应用
3.回归分析的步骤:
解释变量
确定研究对象
预报变量
散点图
观察数据点的分布
两个变量 非线性相关
不吸烟 a
b a+b
吸烟
c
d c+d
总计 a+c b+d n (2)假设两变量无关;
(3)利用公式计算Κ2的观察值k;
,其中
(4)看下表,k与临界值k0比较; 两者无关的概率
P(K2≥k0) 0.10 0.05 0.025 0.010 0.001
k0 2.706 3.841 5.024 6.635 10.828 两者有关 90% 95% 97.5% 99% 99.9% 的概率 (5)下结论:两种角度,如
1000
500
0
0 20000 40000 60000 80000 100000 120000 140000
销售总额x
这个模型的销售总额x 对于利润y变化的 贡献率为45.72%
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
新教材人教版高中数学必修第二册 9-3 统计案例 公司员工的肥胖情况调查分析(基础练习题)解析版
第九章 统计9.3 统计案例 公司员工的肥胖情况调查分析(基础练)一、单选题(共5小题,满分25分,每小题5分)1.甲、乙两名射击运动员分别进行了5次射击训练,成绩(单位:环)如下: 甲:7,8,8,8,9 乙:6,6,7,7,10;若甲、乙两名运动员的平均成绩分别用21,x x 表示,方差分别为 2221,s s 表示,则( )A.21x x >, 2221s s > B.21x x >, 2221s s < C.21x x <, 2221s s < D.21x x <, 2221s s >【答案】 B【解析】85988871=++++=x , 2.751077661=++++=x ,故 21x x > .s 21;s22, 故s s 2221< , 故选:B.2.已知数据x 1,x 2,x 3,…,x n 是上海普通职工n(n ≥3,n ∈N *)个人的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入x n +1,则在这n +1个数据中,下列说法不正确的是( ) A .年收入平均数大大增大 B .中位数可能不变 C .方差变大 D .方差可能不变【答案】D【解析】插入大的极端值,平均数增加,中位数可能不变,方差也因为加入此数据更加分散而变大.故选:D3.一组数据的方差为2s ,平均数为x ,将这组数据中的每一个数都乘以2,所得的一组新数据的方差和平均数分别为( ) A .212s ,12x B .22s ,2x C .24s ,2x D .2s ,x【答案】C【解析】设该组数据为123,,,,n x x x x ,将这组数据中的每一个数都乘以2,则有1232,22,,2,n x x x x ⋯,平均数为2x .又()()()2222121n s x x x x x x n ⎡⎤=⨯-+-++-⎢⎥⎣⎦,则新数据的方差为()()()22221212222224n x x x x x x s n ⎡⎤⨯-+-++-=⎣⎦, 故选:C.4.如图是某公司2020年1月到10月的销售额(单位:万元)的折线图,销售额在35万元以下为亏损,超过35万元为盈利,则下列说法错误的是( )A .这10个月中销售额最低的是1月份B .从1月到6月销售额逐渐增加C .这10个月中有3个月是亏损的D .这10个月销售额的中位数是43万元 【答案】B【解析】根据折线图知,这10个月中销售额最低的是1月份,为30万元,所以A 正确; 从1月到6月销售额是先增加后减少,再增加,所以B 错误;1月,3月和4月的销售额低于35万元,其它月份都高于35万元,所以C 正确; 这10个月的销售额从小到大排列为30,32,34,40,41,45,48,60,78,80万元, 其中位数是()14145432⨯+=万元,所以D 正确. 故选:B 5.某校从参加高一年级期末考试的学生中抽取60名学生的成绩(均为整数),其成绩的频率分布直方图如图所示,由此估计此次考试成绩的中位数,众数和平均数分别是( )A.73.3,75,72 B.73.3,80,73C.70,70,76 D.70,75,75【答案】A【解析】由频率分布直方图知,小于70的有24人,大于80的有18人,则在[70,80]之间18人,所以中位数为70103+≈73.3;众数就是分布图里最高的小矩形底边的中点,即[70,80]的中点横坐标,是75;平均数为45×0.05+55×0.15+65×0.20+75×0.30+85×0.25+95×0.05=72.故选: A.二、多选题(共3小题,满分15分,每小题5分,少选得3分,多选不得分)6.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是()A.甲的化学成绩领先年级平均分最多.B.甲有2个科目的成绩低于年级平均分.C.甲的成绩最好的前两个科目是化学和地理.D .对甲而言,物理、化学、地理是比较理想的一种选科结果. 【答案】A【解析】根据雷达图,可知物理成绩领先年级平均分最多,即A 错误; 甲的政治、历史两个科目的成绩低于年级平均分,即B 正确; 甲的成绩最好的前两个科目是化学和地理,即C 正确;对甲而言,物理成绩比年级平均分高,历史成绩比年级平均分低,而化学、生物、地理、政治中优势最明显的两科为化学和地理,故物理、化学、地理的成绩是比较理想的一种选科结果,即D 正确. 故选:A.7.某地区城乡居民储蓄存款年底余额(单位:亿元)变化情况如图所示,下列判断一定正确的是( )A .该地区城乡居民储蓄存款年底余额总数逐年上升B .到2019年农村居民存款年底总余额已超过了城镇居民存款年底总余额C .城镇居民存款年底余额逐年下降D .2017年城乡居民存款年底余额增长率大约为225% 【答案】AD【解析】由条形图可知,余额总数逐年上升,故A 项正确;由城乡储蓄构成百分比可知,2019年农村居民存款年底总余额占36.1%,城镇居民存款年底总余额占63.9%,没有超过,故B 项错误;城镇居民存款年底余额所占的比重逐年下降,但城镇居民存款年底余额2014年,2017年,2019年分别为6.8198(亿元),155.085(亿元),973.197(亿元),总体不是逐年下降的,故C 项错误,2017年城乡居民存款年底余额增长率大约为21165225%65-≈,故D 项正确.故选:AD. 8.如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年总销售量为4870台D .2018年月销售量最大的是6月份 【答案】ABC【解析】由题图可知选项A 正确; 2018年月销售任务的平均值为10020033003400500700800100045060012++⨯+⨯++++=<,故选项B 正确;2018年总销售量为1000.82001300(0.5 1.50.6)400(1.20.90.9)500 1.17000.8⨯+⨯+⨯+++⨯+++⨯+⨯800110000.74870+⨯+⨯=,故选项C 正确;2018年月销售量最大的是5月份,为800台,故选项D 不正确. 故选:ABC 三、填空题(共3小题,满分15分,每小题5分,一题两空,第一空2分)9.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为_________ 【答案】0.7【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7. 故答案为:0.710.为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互相不相同,则样本数据中的最大值为 . 【答案】10【解析】设样本数据为:12345,,,,x x x x x ()1234557x x x x x ∴++++÷=()()222157754s x x ⎡⎤=-++-÷=⎣⎦()()22151********,35x x x x x x x ∴-++-=++++=若样本数据中的最大值为11,不妨设511x =,由于样本数据互不相同,与()()22157720x x -++-=这是不可能成立的,若样本数据为4,6,7,8,10,代入验证知两式均成立,此时样本数据中的最大值为 10, 故答案为:1011.为实现国民经济新“三步走”的发展战略目标,国家加大了扶贫攻坚的力度.某地区在2015 年以前的年均脱贫率(脱离贫困的户数占当年贫困户总数的比)为.2015年开始,全面实施“精准扶贫”政策后,扶贫效果明显提高,其中2019年度实施的扶贫项目,各项目参加户数占比(参加该项目户数占 2019 年贫困户总数的比)及该项目的脱贫率见下表:实施项目 种植业 养殖业 工厂就业 服务业 参加用户比脱贫率那么2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的______倍 【答案】 【解析】设贫困户总数为a,脱贫率,所以 .故 2019年的年脱贫率是实施“精准扶贫”政策前的年均脱贫率的 倍. 故答案为:四、解答题:(本题共3小题,共45分。
人教A版高中数学选修2-3全册同步练习及单元检测含答案
⼈教A版⾼中数学选修2-3全册同步练习及单元检测含答案⼈教版⾼中数学选修2~3 全册章节同步检测试题⽬录第1章《计数原理》同步练习 1.1测试1第1章《计数原理》同步练习 1.1测试2第1章《计数原理》同步练习 1.1测试3第1章《计数原理》同步练习 1.2排列与组合第1章《计数原理》同步练习 1.3⼆项式定理第1章《计数原理》测试(1)第1章《计数原理》测试(2)第2章同步练习 2.1离散型随机变量及其分布列第2章同步练习 2.2⼆项分布及其应⽤第2章测试(1)第2章测试(2)第2章测试(3)第3章练习 3.1回归分析的基本思想及其初步应⽤第3章练习 3.2独⽴性检验的基本思想及其初步应⽤第3章《统计案例》测试(1)第3章《统计案例》测试(2)第3章《统计案例》测试(3)1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题1.⼀件⼯作可以⽤2种⽅法完成,有3⼈会⽤第1种⽅法完成,另外5⼈会⽤第2种⽅法完成,从中选出1⼈来完成这件⼯作,不同选法的种数是()A.8 B.15C.16 D.30答案:A2.从甲地去⼄地有3班⽕车,从⼄地去丙地有2班轮船,则从甲地去丙地可选择的旅⾏⽅式有()A.5种B.6种C.7种D.8种答案:B3.如图所⽰为⼀电路图,从A 到B 共有()条不同的线路可通电()A.1 B.2 C.3 D.4答案:D4.由数字0,1,2,3,4可组成⽆重复数字的两位数的个数是()A.25 B.20 C.16 D.12答案:C5.李芳有4件不同颜⾊的衬⾐,3件不同花样的裙⼦,另有两套不同样式的连⾐裙.“五⼀”节需选择⼀套服装参加歌舞演出,则李芳有()种不同的选择⽅式()A.24 B.14 C.10 D.9答案:B 6.设A ,B 是两个⾮空集合,定义{}()A B a b a A b B *=∈∈,,|,若{}{}0121234P Q ==,,,,,,,则P *Q 中元素的个数是()A.4 B.7 C.12 D.16答案:C⼆、填空题7.商店⾥有15种上⾐,18种裤⼦,某⼈要买⼀件上⾐或⼀条裤⼦,共有种不同的选法;要买上⾐,裤⼦各⼀件,共有种不同的选法.答案:33,2708.⼗字路⼝来往的车辆,如果不允许回头,共有种⾏车路线.答案:129.已知{}{}0341278a b ∈∈,,,,,,,则⽅程22()()25x a y b -+-=表⽰不同的圆的个数是.答案:1210.多项式123124534()()()()a a a b b a a b b ++++++··展开后共有项.答案:1011.如图,从A →C ,有种不同⾛法.答案:612.将三封信投⼊4个邮箱,不同的投法有种.答案:34三、解答题 13.⼀个⼝袋内装有5个⼩球,另⼀个⼝袋内装有4个⼩球,所有这些⼩球的颜⾊互不相同.(1)从两个⼝袋内任取⼀个⼩球,有多少种不同的取法?(2)从两个⼝袋内各取⼀个⼩球,有多少种不同的取法?解:(1)549N =+=种;(2)5420N =?=种.14.某校学⽣会由⾼⼀年级5⼈,⾼⼆年级6⼈,⾼三年级4⼈组成.(1)选其中1⼈为学⽣会主席,有多少种不同的选法?(2)若每年级选1⼈为校学⽣会常委,有多少种不同的选法?(3)若要选出不同年级的两⼈参加市⾥组织的活动,有多少种不同的选法?解:(1)56415N =++=种;(2)564120N =??=种;(3)56644574N =?+?+?=种15.已知集合{}321012()M P a b =---,,,,,,,是平⾯上的点,a b M ∈,.(1)()P a b ,可表⽰平⾯上多少个不同的点?(2)()P a b ,可表⽰多少个坐标轴上的点?解:(1)完成这件事分为两个步骤:a 的取法有6种,b 的取法也有6种,∴P 点个数为N =6×6=36(个);(2)根据分类加法计数原理,分为三类:①x 轴上(不含原点)有5个点;②y 轴上(不含原点)有5个点;③既在x 轴,⼜在y 轴上的点,即原点也适合,∴共有N =5+5+1=11(个).1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题 1.从集合{ 0,1,2,3,4,5,6}中任取两个互不相等的数a ,b 组成复数a bi +,其中虚数有() A .30个 B .42个 C .36个 D .35个答案:C2.把10个苹果分成三堆,要求每堆⾄少1个,⾄多5个,则不同的分法共有() A .4种 B .5种 C .6种 D .7种答案:A3.如图,⽤4种不同的颜⾊涂⼊图中的矩形A ,B ,C ,D 中,要求相邻的矩形涂⾊不同,则不同的涂法有() A .72种 B .48种 C .24种 D .12种答案:A4.教学⼤楼共有五层,每层均有两个楼梯,由⼀层到五层的⾛法有() A .10种 B .52种C.25种D.42种答案:D5.已知集合{}{}023A B x x ab a b A ===∈,,,,,|,则B 的⼦集的个数是()A.4 B.8 C.16 D.15答案:C6.三边长均为正整数,且最⼤边长为11的三⾓形的个数为()A.25 B.26 C.36 D.37答案:C⼆、填空题7.平⾯内有7个点,其中有5个点在⼀条直线上,此外⽆三点共线,经过这7个点可连成不同直线的条数是.答案:128.圆周上有2n 个等分点(1n >),以其中三个点为顶点的直⾓三⾓形的个数为.答案:2(1)n n -9.电⼦计算机的输⼊纸带每排有8个穿孔位置,每个穿孔位置可穿孔或不穿孔,则每排可产⽣种不同的信息.答案:25610.椭圆221x y m n+=的焦点在y 轴上,且{}{}123451234567m n ∈∈,,,,,,,,,,,,则这样的椭圆的个数为.答案:20 11.已知集合{}123A ,,ü,且A 中⾄少有⼀个奇数,则满⾜条件的集合A 分别是.答案:{}{}{}{}{}13122313,,,,,,,12.整数630的正约数(包括1和630)共有个.答案:24三、解答题 13.⽤0,1,2,3,4,5六个数字组成⽆重复数字的四位数,⽐3410⼤的四位数有多少个?解:本题可以从⾼位到低位进⾏分类.(1)千位数字⽐3⼤.(2)千位数字为3:①百位数字⽐4⼤;②百位数字为4: 1°⼗位数字⽐1⼤;2°⼗位数字为1→个位数字⽐0⼤.所以⽐3410⼤的四位数共有2×5×4×3+4×3+2×3+2=140(个).14.有红、黄、蓝三种颜⾊旗⼦各(3)n n >⾯,任取其中三⾯,升上旗杆组成纵列信号,可以有多少种不同的信号?若所升旗⼦中不允许有三⾯相同颜⾊的旗⼦,可以有多少种不同的信号?若所升旗⼦颜⾊各不相同,有多少种不同的信号?解: 1N =3×3×3=27种; 227324N =-=种; 33216N =??= 种.15.某出版社的7名⼯⼈中,有3⼈只会排版,2⼈只会印刷,还有2⼈既会排版⼜会印刷,现从7⼈中安排2⼈排版,2⼈印刷,有⼏种不同的安排⽅法.解:⾸先分类的标准要正确,可以选择“只会排版”、“只会印刷”、“既会排版⼜会印刷”中的⼀个作为分类的标准.下⾯选择“既会排版⼜会印刷”作为分类的标准,按照被选出的⼈数,可将问题分为三类:第⼀类:2⼈全不被选出,即从只会排版的3⼈中选2⼈,有3种选法;只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有3×1=3种选法.第⼆类:2⼈中被选出⼀⼈,有2种选法.若此⼈去排版,则再从会排版的3⼈中选1⼈,有3种选法,只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有2×3×1=6种选法;若此⼈去印刷,则再从会印刷的2⼈中选1⼈,有2种选法,从会排版的3⼈中选2⼈,有3种选法,由分步计数原理知共有2×3×2=12种选法;再由分类计数原理知共有6+12=18种选法.第三类:2⼈全被选出,同理共有16种选法.所以共有3+18+16=37种选法.1. 1 分类加法计数原理与分步乘法计数原理综合卷⼀.选择题:1.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种2.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出语⽂、数学、英语各⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种3.某商业⼤厦有东南西3个⼤门,楼内东西两侧各有2个楼梯,从楼外到⼆楼的不同⾛法种数是()(A ) 5 (B )7 (C )10 (D )124.⽤1、2、3、4四个数字可以排成不含重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个5.⽤1、2、3、4四个数字可排成必须含有重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个6.3科⽼师都布置了作业,在同⼀时刻4名学⽣都做作业的可能情况有()(A )43种(B )34种(C )4×3×2种(D ) 1×2×3种7.把4张同样的参观券分给5个代表,每⼈最多分⼀张,参观券全部分完,则不同的分法共有()(A )120种(B )1024种(C )625种(D )5种8.已知集合M={l ,-2,3},N={-4,5,6,7},从两个集合中各取⼀个元素作为点的坐标,则这样的坐标在直⾓坐标系中可表⽰第⼀、⼆象限内不同的点的个数是()(A )18 (B )17 (C )16 (D )109.三边长均为整数,且最⼤边为11的三⾓形的个数为()(A )25 (B )36 (C )26 (D )3710.如图,某城市中,M 、N 两地有整齐的道路⽹,若规定只能向东或向北两个⽅向沿途中路线前进,则从M 到N 不同的⾛法共有()(A )25 (B )15 (C)13 (D )10 ⼆.填空题:11.某书店有不同年级的语⽂、数学、英语练习册各10本,买其中⼀种有种⽅法;买其中两种有种⽅法.12.⼤⼩不等的两个正⽅形玩具,分别在各⾯上标有数字1,2,3,4,5,6,则向上的⾯标着的两个数字之积不少于20的情形有种.13.从1,2,3,4,7,9中任取不相同的两个数,分别作为对数的底数和真数,可得到个不同的对数值.14.在连结正⼋边形的三个顶点组成的三⾓形中,与正⼋边形有公共边的有个.15.某班宣传⼩组要出⼀期向英雄学习的专刊,现有红、黄、⽩、绿、蓝五种颜⾊的粉笔供选⽤,要求在⿊板中A 、B 、C 、D 每⼀部分只写⼀种颜⾊,如图所⽰,相邻两块颜⾊不同,则不同颜⾊的书写⽅法共有种.三.解答题:16.现由某校⾼⼀年级四个班学⽣34⼈,其中⼀、⼆、三、四班分别为7⼈、8⼈、9⼈、10⼈,他们⾃愿组成数学课外⼩组.(1)选其中⼀⼈为负责⼈,有多少种不同的选法?(2)每班选⼀名组长,有多少种不同的选法?(3)推选⼆⼈做中⼼发⾔,这⼆⼈需来⾃不同的班级,有多少种不同的选法?17.4名同学分别报名参加⾜球队,蓝球队、乒乓球队,每⼈限报其中⼀个运动队,不同的报名⽅法有⼏种?[探究与提⾼]1.甲、⼄两个正整数的最⼤公约数为60,求甲、⼄两数的公约数共有多个?2.从{-3,-2,-1,0,l,2,3}中,任取3个不同的数作为抛物线⽅程y=ax2+bx+c(a≠0)的系数,如果抛物线过原点,且顶点在第⼀象限,这样的抛物线共有多少条?3.电视台在“欢乐今宵”节⽬中拿出两个信箱,其中存放着先后两次竞猜中成绩优秀的群众来信,甲信箱中有30封,⼄信箱中有20封.现由主持⼈抽奖确定幸运观众,若先确定⼀名幸运之星,再从两信箱中各确定⼀名幸运伙伴,有多少种不同的结果?综合卷1.A 2.B 3.D 4.D 5.B 6.B 7.D 8.B 9.B 10.B11.30;300 12.513.17 14.40 15.1801. 2排列与组合1、排列综合卷1.90×9l ×92×……×100=()(A )10100A (B )11100A (C )12100A (D )11101A 2.下列各式中与排列数mn A 相等的是()(A )!(1)!-+n n m (B )n(n -1)(n -2)……(n -m) (C )11m n nA n m --+ (D )111m n n A A --3.若 n ∈N 且 n<20,则(27-n )(28-n)……(34-n)等于()(A )827n A - (B )2734nn A -- (C )734n A - (D )834n A -4.若S=123100123100A A A A ++++,则S 的个位数字是()(A )0 (B )3 (C )5 (D )85.⽤1,2,3,4,5这五个数字组成没有重复数字的三位数,其中偶数共有()(A )24个(B )30个(C )40个(D )60个6.从0,l ,3,5,7,9中任取两个数做除法,可得到不同的商共有()(A )20个(B )19个(C )25个(D )30个7.甲、⼄、丙、丁四种不同的种⼦,在三块不同⼟地上试种,其中种⼦甲必须试种,那么不同的试种⽅法共有()(A )12种(B )18种(C )24种(D )96种8.某天上午要排语⽂、数学、体育、计算机四节课,其中体育不排在第⼀节,那么这天上午课程表的不同排法共有()(A )6种(B )9种(C )18种(D )24种9.有四位司机、四个售票员组成四个⼩组,每组有⼀位司机和⼀位售票员,则不同的分组⽅案共有()(A )88A 种(B )48A 种(C )44A ·44A 种(D )44A 种10.有4位学⽣和3位⽼师站在⼀排拍照,任何两位⽼师不站在⼀起的不同排法共有()(A )(4!)2种(B )4!·3!种(C )34A ·4!种(D )3 5A ·4!种11.把5件不同的商品在货架上排成⼀排,其中a ,b 两种必须排在⼀起,⽽c ,d 两种不能排在⼀起,则不同排法共有()(A )12种(B )20种(C )24种(D )48种⼆.填空题::12.6个⼈站⼀排,甲不在排头,共有种不同排法.13.6个⼈站⼀排,甲不在排头,⼄不在排尾,共有种不同排法.14.五男⼆⼥排成⼀排,若男⽣甲必须排在排头或排尾,⼆⼥必须排在⼀起,不同的排法共有种.15.将红、黄、蓝、⽩、⿊5种颜⾊的⼩球,分别放⼊红、黄、蓝、⽩、⿊5种颜⾊的⼝袋中,但红⼝袋不能装⼊红球,则有种不同的放法.16.(1)有5本不同的书,从中选3本送给3名同学,每⼈各⼀本,共有种不同的送法;(2)有5种不同的书,要买3本送给3名同学,每⼈各⼀本,共有种不同的送法.三、解答题:17.⼀场晚会有5个唱歌节⽬和3个舞蹈节⽬,要求排出⼀个节⽬单(1)前4个节⽬中要有舞蹈,有多少种排法?(2)3个舞蹈节⽬要排在⼀起,有多少种排法?(3)3个舞蹈节⽬彼此要隔开,有多少种排法?18.三个⼥⽣和五个男⽣排成⼀排.(1)如果⼥⽣必须全排在⼀起,有多少种不同的排法?(2)如果⼥⽣必须全分开,有多少种不同的排法?(3)如果两端都不能排⼥⽣,有多少种不同的排法?(4)如果两端不能都排⼥⽣,有多少种不同的排法?(5)如果三个⼥⽣站在前排,五个男⽣站在后排,有多少种不同的排法?综合卷1.B 2.D 3.D 4.C 5.A 6.B 7.B 8.C 9.D 10.D 11.C12.600 13.504 14.480 15.9616.(1) 60;(2) 12517.(1) 37440;(2) 4320;(3) 1440018.(1) 4320;(2) 14400;(3) 14400;(4) 36000;(5) 7202、组合综合卷⼀、选择题:1.下列等式不正确的是()(A )!!()!mn n C m n m =- (B )11mm n n m C C n m++=- (C )1111m m n n m C C n +++=+ (D )11m m n n C C ++= 2.下列等式不正确的是()(A )m n m n n C C -= (B )11m m mm m m C C C -++=(C )123455555552C C C C C ++++= (D )11 111m m m m n n n n C C C C --+--=++3.⽅程2551616x x x C C --=的解共有()(A )1个(B )2个(C )3个(D )4个4.若372345n n n C A ---=,则n 的值是()(A )11 (B )12 (C )13 (D )145.已知7781n n n C C C +-=,那么n 的值是()(A )12 (B )13 (C )14 (D )15 6.从5名男⽣中挑选3⼈,4名⼥⽣中挑选2⼈,组成⼀个⼩组,不同的挑选⽅法共有()(A )3254C C 种(B ) 3254C C 55A 种(C ) 3254A A 种(D ) 3254A A 55A 种7.从4个男⽣,3个⼥⽣中挑选4⼈参加智⼒竞赛,要求⾄少有⼀个⼥⽣参加的选法共有()(A )12种(B )34种(C )35种(D )340种8.平⾯上有7个点,除某三点在⼀直线上外,再⽆其它三点共线,若过其中两点作⼀直线,则可作成不同的直线()(A )18条(B )19条(C )20条(D )21条9.在9件产品中,有⼀级品4件,⼆级品3件,三级品2件,现抽取4个检查,⾄少有两件⼀级品的抽法共有()(A )60种(B )81种(C )100种(D )126种10.某电⼦元件电路有⼀个由三节电阻串联组成的回路,共有6个焊点,若其中某⼀焊点脱落,电路就不通.现今回路不通,焊点脱落情况的可能有()(A )5种(B )6种(C )63种(D )64种⼆.填空题:11.若11m m n n C xC --=,则x= .12.三名教师教六个班的课,每⼈教两个班,分配⽅案共有种。
数学教案 人教a版选修2_3 同步练习-第3章统计案例跟踪训练含解析
回归分析的基本思想及其初步应用[A 组 学业达标]1.下列两个变量之间的关系不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积 C .正n 边形的边数和内角度数和 D .人的年龄和身高解析:函数关系就是一种变量之间的确定性的关系.A ,B ,C 三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ,g(a)=a 2,h(n)=nπ-2π.D 选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高.故选D.答案:D2.设一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A.y ^平均增加1.5个单位 B.y ^平均增加2个单位 C.y ^平均减少1.5个单位 D.y ^平均减少2个单位解析:由线性回归方程y ^=2-1.5x 中x 的系数为-1.5,知C 项正确. 答案:C 3.有下列数据:x 1 2 3 y35.9912.01A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好. 答案:A4.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=-2.756x +7.325.②y 与x 负相关且y ^=3.476x +5.648 ③y 与x 正相关且y ^=-1.226x -6.578 ④y 与x 正相关且y ^=8.967x +8.163 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:根据题意,依次分析4个结论:对于①,y 与x 负相关且y ^=-2.756x +7.325,此结论正确,线性回归方程符合负相关的特征; 对于②,y 与x 负相关且y ^=3.476x +5.648,此结论错误,由线性回归方程知,此两变量的关系是正相关;对于③,y 与x 正相关且y ^=-1.226x -6.578,此结论错误,由线性回归方程知,此两变量的关系是负相关;对于④,y 与x 正相关且y ^=8.967x +8.163,此结论正确,线性回归方程符合正相关的特征;故②③一定错误.答案:B5.对具有线性相关关系的变量x ,y ,测得一组数据如下表:x 2 4 5 6 8 y2040607080根据上表,利用最小二乘法得它们的回归直线方程为y ^=10.5x +a ^,据此模型来预测当x =20时,y 的估计值为________.解析:由已知得x -=5,y -=54,则(5,54)满足回归直线方程y ^=10.5x +a ^,解得a ^=1.5,因此y ^=10.5x +1.5,当x =20时y ^=10.5×20+1.5=211.5.答案:211.56.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.答案:D(3,10)7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z =ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为____________________.解析:由z =ln y ,z ^=0.25x -2.58, 得ln y ^=0.25x -2.58,∴y ^=e 0.25x -2.58. 故该模型的回归方程为y ^=e 0.25x -2.58. 答案:y ^=e 0.25x -2.588.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,求社区一户年收入为15万元的家庭的年支出.解析:由题意可得x -=15×(8.2+8.6+10.0+11.3+11.9)=10,y -=15×(6.2+7.5+8.0+8.5+9.8)=8,可得a ^=8-0.76×10=0.4. ∴回归直线方程为y ^=0.76x +0.4.把x =15代入可得y ^=0.76×15+0.4=11.8.故社区一户年收入为15万元的家庭的年支出为11.8万元.9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x -=8+8.2+8.4+8.6+8.8+96=8.5,y -=16(90+84+83+80+75+68)=80,∵b ^=-20,a ^=y --b ^ x -, ∴a ^=80+20×8.5=250, ∴线性回归方程y ^=-20x +250;(2)设工厂获得的利润为L 元,则L =x(-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为8.25元,工厂获得的利润最大.[B 组 能力提升]10.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是a 1,a 2,R 2的值分别为b 1,b 2,下列说法正确的是( )A .若a 1<a 2,则b 1<b 2,A 的拟合效果更好B .若a 1<a 2,则b 1<b 2,B 的拟合效果更好C .若a 1<a 2,则b 1>b 2,A 的拟合效果更好D .若a 1<a 2,则b 1>b 2,B 的拟合效果更好解析:由残差平方和以及R 2的定义式可得若a 1<a 2,则b 1>b 2,A 的拟合效果更好. 答案:C11.近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下:A.y ^=2.799 1x -27.248 552 B.y ^=2.799 1x -23.548 452 C.y ^=2.699 2x -23.749 352 D.y ^=2.899 2x -23.749 452解析:x -=41.72,y -=93.23,代入验证可知B 选项正确. 答案:B12.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:将x =160代入y ^=0.85x -82.71,得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.答案:-0.2913.已知一个线性回归方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y -=________. 解析:∵x -=1+5+7+13+195=9,且y ^=1.5x +45, ∴y -=1.5×9+45=58.5. 答案:58.514.假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如表统计资料:x 2 3 4 5 6 y2.23.85.56.57.0已知∑i =15x 2i=90,∑i =15x i y i =112.3.b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b ^ x -. (1)求x -,y -.(2)x 与y 具有线性相关关系,求出线性回归方程. (3)估计使用年限为10年时,维修费用约是多少? 解析:(1)x -=4,y -=5.(2)b ^=∑i =15x i y i -5x - y-∑i =15x 2i -5x -2=1.23,a ^=y --b ^ x -=5-1.23×4=0.08.所以线性回归方程为y ^=1.23x +0.08.(3)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用年限为10年时,维修费用约为12.38万元.15.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x1 2 3 4 5y 58 54 39 29 10(1)令w =x 2,利用给出的参考数据求出y 关于w 的回归方程y ^=b ^w +a ^.(a ^,b ^精确到0.1)参考数据:∑i =15w i =55,∑i =15(w i -w -)(y i -y -)=-751,∑i =15(w i -w -)2=374,其中w i =x 2i ,w -=15∑i =15w i .(2)对于某种残留在蔬菜上的农药,当它的残留量不高于20微克时对人体无害,为了放心食用该蔬菜,请估计至少需要用多少千克的清水清洗1千克蔬菜?(精确到0.1,参考数据5≈2.24)附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -u-v i -v-∑i =1nu i -u-2,α^=v --β^ u -.解析:(1)由题意得,w -=11,y -=38.b ^=∑i =15w i -w-y i -y-∑i =15w i -w-2=-751374≈-2.0,a ^=y --b ^w =60.0,所以y ^=-2.0w +60.0. (2)由(1)得,y ^=-2.0w +60.0, 所以y ^=-2.0x 2+60.0,当y ^≤20时,即-2.0x 2+60.0≤20,解得x≥25≈4.5,所以为了放心食用该蔬菜,估计需要用4.5千克的清水清洗1千克蔬菜.独立性检验的基本思想及其初步应用[A组学业达标]1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )A.频率分布直方图B.回归分析C.独立性检验D.用样本估计总体解析:根据题意,结合题目中的数据,列出2×2列联表,求出K2观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.答案:C2.观察下列各图,其中两个分类变量x,y之间关系最强的是( )解析:观察等高条形图发现x1x1+y1和x2x2+y2相差越大,就判断两个分类变量之间关系越强.答案:D3.如表是一个2×2列联表:则表中a,b的值分别为( )y1y2总计x1 a 21 73x222 25 47总计 b 46 120A.94,72C.52,74 D.74,52解析:a=73-21=52,b=a+22=74,故选C.答案:C4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果K2的观测值k>5.024,那么在犯错误的概率不超过________的前提下认为“X与Y有关系”()P(K2≥k 0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.828A.0.25 B .0.05 C .0.1D .0.025解析:因为K 2的观测值k >5.024,而在临界值表中对应于5.024的是0.025,所以可以在犯错误的概率不超过0.025的前提下认为“X 和Y 有关系”.答案:D5.分类变量X 和Y 的列表如下,则下列说法判断正确的是( )y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +dA.ad -bc 越小,说明X 与Y 的关系越弱 B .ad -bc 越大,说明X 与Y 的关系越强 C .(ad -bc)2越大,说明X 与Y 的关系越强 D .(ad -bc)2越接近于0,说明X 与Y 的关系越强解析:列联表可以较为准确地判断两个变量之间的相关关系程度, 由K 2=a +b +c +dad -bc2a +b a +cb +dc +d,当(ad -bc)2越大,K 2越大,表明X 与Y 的关系越强.(ad -bc)2越接近0,说明两个分类变量X 和Y 无关的可能性越大. 即所给说法判断正确的是C. 答案:C6.某部门通过随机调查89名工作人员的休闲方式,了解读书和健身的人数,得到的数据如表:读书 健身 总计 女 24 31 55 男 8 26 34 总计325789在犯错误的概率不超过________的前提下认为性别与休闲方式有关系. 解析:由列联表中的数据,得K 2的观测值为k =89×24×26-31×8255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.答案:0.107.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:死亡 存活 总计 第一种剂量 14 11 25 第二种剂量 6 19 25 总计203050进行统计分析的统计假设是________,K 2=________,说明两种电离辐射剂量对小白鼠的致死作用________.(填“相同”或“不相同”)参考公式:K 2=n ad -bc2a +bc +d a +cb +d解析:统计假设是“小白鼠的死亡与使用的电离辐射剂量无关”,由列联表中数据得K 2=5.33>3.841,所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关.所以两种电离辐射剂量对小白鼠的致死作用不相同.答案:小白鼠的死亡与使用的电离辐射剂量无关 5.33 不相同 8.下表是关于男婴与女婴出生时间调查的列联表:晚上 白天 总计 男婴 45 A B 女婴 E 35 C 总计98D180那么,A =________,B =E =________. 解析:由列联表知识得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.答案:47 92 88 82 539.网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?解析:根据题目所给的数据得到如下2×2列联表:经常上网 不经常上网总计 不及格80120200及格 120 680 800 总计2008001 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.10.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动.(1)完成下列2×2列联表:运动 非运动总计 男性 女性 总计n(2)数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 解析:(1)补全2×2列联表如下:运动 非运动 总计 男性 15n 15n 25n 女性 15n 25n 35n 总计25n 35n n(2)则P(K 2≥k 0)=3.841. 由于K 2的观测值k =n ⎝ ⎛⎭⎪⎫n 5·2n 5-n 5·n 522n 5·3n 5·2n 5·3n 5=n 36,故n36≥3.841,即n≥138.276. 又由15n ∈Z ,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.(3)根据(2)的结论,本次被调查的人中,至少有25×140=56(人)的休闲方式是运动.[B 组 能力提升]11.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,故在犯错误的概率不超过________的前提下认为糖尿病患者与遗传有关系.( )A .0.001B .0.005C .0.01D .0.025解析:可以先作出如下列联表(单位:人): 糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计 阳性家族史 16 93 109 阴性家族史17 240 257 总计33333366根据列联表中的数据,得到K 2的观测值为 k =366×16×240-17×932109×257×33×333≈6.067>5.024.故在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关系. 答案:D12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________(填序号). ①若K 2的观测值k =6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.解析:K 2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.答案:③13.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k≈________(保留3位小数). 解析:k =300×37×143-85×352122×178×72×228≈4.514.答案:4.51414.某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科 理科 总计 优秀 非优秀 总计5050100(2)某高校派出2140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.解析:(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.010+0.004+0.002)×10×50=8,故非优秀人数为50-8=42.该校理科学生中数学成绩优秀的人数为(0.020+0.014+0.006)×10×50=20,故非优秀人数为50-20=30.则2×2列联表如下:文科 理科 总计 优秀 8 20 28 非优秀 42 30 72 总计5050100∴K 2的观测值k =100×8×30-42×20250×50×28×72≈7.143>6.635,故有99%的把握认为该校文理科数学成绩有差异.(2)由(1)知,该校随机抽取的学生成绩中一练数学成绩在140分以上的学生为4人,ξ的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为⎝⎛⎭⎪⎫C 34+C 24C 22A 22A 22=14,则P(ξ=1)=C 1414=27,P(ξ=2)=C 2414=37,P(ξ=3)=C 3414=27.∴ξ的分布列为:ξ 1 2 3 P273727∴E(ξ)=1×27+2×37+3×27=2.15.某校为了了解学生对消防知识的了解情况,从高一年级和高二年级各选取100名同学进行消防知识竞赛.图(1)和图(2)分别是对高一年级和高二年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.(1)请计算高一年级和高二年级成绩小于60分的人数.(2)完成2×2列联表,并回答:在犯错误的概率不超过多少的前提下认为“学生所在的年级与消防常识的了解存在相关性”?成绩小于60分人数成绩不小于60分人数总计高一 高二 总计附:临界值表及参考公式: K 2=n ad -bc 2a +bc +d a +cb +d ,n =a +b +c +d. P(K 2≥k 0)0.15 0.100.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828解析:(1)高一年级成绩低于60分的人数为:(0.03+0.04)×10×100=70; 高二年级成绩低于60分的人数为: (0.035+0.015)×10×100=50. (2)2×2列联表如下:成绩小于60分人数成绩不小于60分人数总计 高一 70 30 100 高二 50 50 100 总计12080200由于K 2的观测值k =200×50×70-50×302100×100×120×80≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为“学生所在的年级与消防知识的了解存在相关性”.。
高中数学 第三章 统计案例 3.1 第2课时 残差分析及回归模型的选择学案 新人教A版选修23
3.1 第二课时 残差分析及回归模型的选择一、课前准备 1.课时目标(1) 了解残差分析回归效果; (2) 了解相关指数2R 分析回归效果;(3) 了解常见的非线性回归转化为线性回归的方法. 2.基础预探1.在线性回归模型y bx a e =++中,a b 和为模型的未知参数,e y 是与y bx a =+之间的误差,通常e为随机变量,称为_______.它的均值E(e)=0,方差2()0D e σ=>.线性回归模型的完整表达形式为2()0,()y bx a eE e D e σ=++⎧⎨==⎩.在此模型中,随机误差r的方差2σ越小,通过回归直线y bx a =+预报真实值y的精度越高. 2.对于样本点1122(,),(,),,(,)n n x y x y x y 而言,相应于它们的随机误差为(1,2,,)i i i i e y y y bx a i n =-=--=,其估计值为(1,2,,)i i i i i e y y y bx a i n =-=--=,i e 称为相应于点(,)i i x y 的______.类比样本方差估计总体方差的思想,可以用21(,)2Q a b n σ=-(n>2)作为2σ的估计量,其中a b 和由公式给出,()Q a b ,称为残差平方和.可以用2σ衡量回归直线方程的预报精度.通常2σ越小,预报精度越高.3.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差12,,n e e e 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为_______.4.用相关指数2R 来刻画回归的效果,其计算公式是:22121()1()nii nii y y R y y ==-=--∑∑.显然2R 取值越大,意味着残差平方和_______,也就是说模型的拟合效果________. 二、学习引领1. 进行回归分析的步骤是什么?(1)确定研究对象,明确是哪两个变量之间的相关关系.(2)画出散点图,观察它们之间的关系是否存在线性关系,也可计算变量间的线性相关系数的值来精确判断它们之间是否存在相关关系.如果不存在线性相关关系,判断散点图是否存在非线性相关关系.(3)若存在相关关系,则由经验确定回归方程的类型:如观察到数据呈线性关系,则选用线性回归方程ˆy=bx+a ;否则可选择指数模型、对数模型或二次函数模型等. (4)利用残差图或者相关指数2R 对回归效果进行判断2.随机误差e的产生及估计的方法(1)在实际中,随机变量y除了受随机变量x的影响之外,还受其它变量的影响;(2)由于前面相关关系公式中的a b 和为截距和斜率的估计值,它们与真实值a b 和之间也存在误差.(3)因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机变量的均值为0,因此可以用方差2来衡量随机误差的大小. 3.如何利用2R 判断回归效果在线性回归模型中,2R 表示解释变量对于预报变量变化的贡献率. 2R 越接近于1,表示回归的效果越好(因为2R 越接近于1,表示解释变量和预报变量的相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析.也可以通过比较几个2R ,选择其值大的模型.4.常见的可线性化的回归模型(1)幂函数曲线y=ax b(如图所示), 作变换u=lny ,v=lnx,c=lna,得线性函数u=c+bv.(2)指数函数y=ae bx(如图所示) 作变换u=lny, c= lna,得线性函数u=c+bx.(3)倒指数曲线y=a b xe (如图所示).(4)对数曲线y=a+blnx(如图所示)三、典例导析题型一相关系数的应用例1 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车r,由此判断交通事故数y与机动车辆数x是否线性相关.解析:将数据列成下表由此可知x=128.875 y=8.95,进而求得0.9927≈.因为|r|接近1 ,所以可得交通事故数y和机动车辆数x有较强的线性相关关系.规律总结:进行回归分析时,通常先进行相关性检验,若能确定两个变量具有线性相关关系,再去求其线性回归方程,否则所求的方程无意义.两个变量正(负)相关时,它们就有相同(反)的变化趋势,即当由小变大时,相应的有由小(大)变大(小)的趋势.变式训练:某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系?从这个工完成下列要求:(1)计算x 与y 的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验。
2019_2020学年高中数学第三章统计案例单元质量测评课件新人教A版选修2_3
答案 D
^
解析 用线性回归方程预测的不是精确值,而是估计值.当 x=10 时,y
=145.83,只能说身高在 145.83 cm 左右.
答案
解析
10.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟
10.828
C.2.5% D.97.5%
答案 D
答案
解析 k=5.024 对应的 0.025 是“X 和 Y 有关系”不合理的程度,因此两 个分类变量有关系的可信程度约为 97.5%.
解析
^
4.工人月工资(元)依劳动生产率(千元)变化的回归方程为y=50+80x,
下列判断正确的是( )
①劳动生产率为 1000 元时,则工资为 130 元;②劳动生产率提高 1000
定的价格进行试销,得到如下数据:
单价/元 4 5 6 7 8 9
销量/件 90 84 83 80 75 68
^
^
由表中数据,求得线性回归方程为y=-4x+a ,若在这些样本点中任取
一点,则它在回归直线左下方的概率为( )
1112 A.3 B.2 C.6 D.3
答案 A
答案
解析 由表中数据得-x =6.5,-y =80.由点(6.5,80)在直线y^=-4x+a^ 上,
答案 A
答案
解析 因为残差点比较均匀地落在水平的带状区域中,说明选用的模型 比较合适.故选 A.
解析
^
7.已知方程y=0.85x-85.7 是根据女大学生的身高预报体重的回归方
^
程,其中 x,y的单位分别是 cm,kg,则该方程在样本(165,57)处的残差是( )
2021学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用习题新人教A版选修2_3
第三章 3.1 回归分析的根本思想及其初步应用A 级 根底稳固一、选择题1.(2021·深圳一模)其食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一局部不同年份的该酒品,并测定了其芳香度(如表).年份x 0 1 4 5 6 8 芳香度y由最小二乘法得到回归方程y ^x +1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为( A )[解析] 由表中数据:x =16(0+1+4+5+6+8)=4,回归方程y ^x +1.13,∴y ^=1.03×4+1.13=5.26,∴y =16(1.3+1.8+5.6+?+7.4+9.3)=5.26,解得:?=6.1. 应选A .2.由变量x 与y 相对应的一组数据(1,y 1)、(5,y 2)、(7,y 3)、(13,y 4)、(19,y 5)得到的线性回归方程为y ^=2x +45,那么y -=( D )A .135B .90C .67D .63[解析] ∵x -=15(1+5+7+13+19)=9,y -=2x -+45,∴y -=2×9+45=63,应选D . 3.观测两个相关变量,得到如下数据:x -1 -2 -3 -4 -5 5 4 3 2 1 y-25A .y ^x -1 B .y ^=x C .y ^=2x +0.3 D .y ^=x +1[解析] 因为x -=0, y -=,10)=0,根据回归直线方程必经过样本中心点(x -,y -)可知,回归直线方程过点(0,0),所以选B .4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y ^x +73.93,用这个模型预测这个孩子10岁时的身高,那么正确的表达是( C )A .身高一定是B .身高在以上C .身高在左右D .身高在以下[解析] 将x 的值代入回归方程y ^x +73.93时,得到的y ^值是年龄为x 时,身高的估计值,应选C .5.(2021·西宁模拟)为了规定工时定额,需要确定加工零件所花费的时间,为此进展了5次试验,得到5组数据(x 1,y 1),(x 2,y 2),(x 3,y 3),(x 4,y 4)(x 5,y 5).根据收集到的数据可知x =20,由最小二乘法求得回归直线方程为y ^x +48,那么5i =1y i =( D )A .60B .120C .150D .300[解析] 由题意,x =20,回归直线方程为y ^x +48,∴y ^=0.6×20+48=60.那么 i =15y i =60×5=300.应选D .6.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^x -85.71,那么以下结论中不正确的选项是.......( D ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x -,y -)C .假设该大学某女生身高增加1cm ,那么其体重约增加gD .假设该大学某女生身高为170cm ,那么可断定其体重必为 [解析] 此题考察线性回归方程.D 项中身高为170cm 时,体重“约为〞58.79,而不是“确定〞,回归方程只能作出“估计〞,而非确定“线性〞关系.二、填空题7.以下五个命题,正确命题的序号为__③④⑤__. ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进展研究.[解析] 变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.8.(2021·兰州模拟)变量 x ,y 具有线性相关关系,它们之间的一组数据如下表所示,假设y 关于 x 的线性回归方程为y ^x -1,那么m =____.x 1 2 3 4 ym4[解析] 由题意,x =2.5,代入线性回归方程为y ^x -1,可得y =2.25, ∴0.1+1.8+m +4=4×2.25, ∴m =3.1. 故答案为3.1.9.以下是某地区的降雨量与年平均气温的一组数据: 年平均气温(℃)年降雨量(mm) 542507813574701432464根据这组数据可以推断,该地区的降雨量与年平均气温__不具有__相关关系.(填“具有〞或“不具有〞)[解析] 画出散点图,观察可知,降雨量与年平均气温没有相关关系.三、解答题10.为了迎接2021年俄罗斯世界杯,某协会组织了一次“迎2021世界杯,手工制作助威旗〞活动,将俄罗斯世界杯的标志以手工刺绣的方式刺绣到红色的三角形的旗子上面,来为世界杯加油.在10次制作中测得的数据如下: 助威旗数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间Y (小时)626875818995102108115122试问:(1)x 与Y 是否具有线性相关关系?(2)如果x 与Y 具有线性相关关系,求出Y 对x 的回归直线方程,并根据回归直线方程,预测加工2021个助威旗需多少天(准确到1)?注:每天工作8小时.(参考数据:x =55,y =91.7,∑i =110x 2i =38500,∑i =110y 2i =87 777,∑i =110x i y i =55950,38500-10×552-8250,38500-10×552≈91,错误!≈61)[解析] (1)作散点图如下图从图中可以看出,各点都散布在一条直线附近,即它们线性相关. (2)由所给数据求得b =∑i =110x i y i -10xy∑i =110x 2i -10x 2=,38500-10×552)∴a =y -b x =91.7-0.668×55∴Y 对x 的回归直线方程为 y ^x当x =2021时,y ^=54.96+0.668×2021=1397.64(小时)又1397.64÷8=174.705(天)∴加工2021个助威旗所需时间约为175天.B 级 素养提升1.(2021·保定一模)具有线性相关的变量x ,y ,设其样本点为A i (x i ,y i )(i =1,2,…,8),回归直线方程为y ^=12x +a ,假设OA 1→+OA 2→+…+OA 8→=(6,2),(O 为原点),那么a =( B )A .18B .-18C .14D .-14[解析] 计算x =18×(x 1+x 2+…+x 8)=68=34,y =18×(y 1+y 2+…+y 8)=28=14;回归直线方程为y ^=12x +a ,∴14=12×34+a , 解得a =-18.应选B .2.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,那么( C )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 1[解析] ∵变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),∴X =10+11.3+11.8+12.5+135=11.72,Y =1+2+3+4+55=3,i =15(x i -x)(y i -y )=(10-11.72)×(1-3)+(11.3-11.72)×(2-3)+(11.8-11.72)×(3-3)+(12.5-11.72)×(4-3)+(13-11.72)×(5-3)=7.2,∑i =15 x i -x2∑i =15 y i -y2=19.172,∴这组数据的相关系数是r 1=,19.172)=0.3755,变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),U =15(10+11.3+11.8+12.5+13)=11.72, V =5+4+3+2+15=3,∑i =15(U i -U)(V i -V )=(10-11.72)×(5-3)+(11.3-11.72)×(4-3)+(11.8-11.72)×(3-3)+(12.5-11.72)×(2-3)+(13-11.72)×(1-3)=-7.2,∑i =15U i -U2·∑i =15V i -V2=19.172.∴这组数据的相关系数是r 2=-0.3755,∴第一组数据的相关系数大于零,第二组数据的相关系数小于零,应选C . 二、填空题3.(2021·张店区校级模拟)在一组样本数据(x 1,y 1),(x 2,y 2),…(x 6,y 6)的散点图中,假设所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-1附近波动.经计算∑i =16x i =11,∑i =16y i =13,∑i =16x 2i =21,那么实数b 的值为__1921__.[解析] 根据题意,把对应点的坐标代入曲线y =bx 2-1,y 1=bx 11-1,y 2=bx 22-1,…y 6=bx 26-1,∴y 1+y 2+…+y 6=b (x 21+x 22+…+x 26)-6, ∴13=b ×21-6,∴b =1921,故答案为1921.4.某品牌服装专卖店为了解保暖衬衣的销售量y (件)与平均气温x (℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:时间 二月上旬二月中旬二月下旬 三月上旬 旬平均气温x (℃)381217旬销售量y (件) 55 m 33 24由表中数据算出线性回归方程y ^=bx +a 中的b =-2,样本中心点为(10,38). (1)表中数据m =__40__;(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__14件__.[解析] (1)由y =38,得m =40. (2)由a =y -b x 得a =58, 故y ^=-2x +58, 当x =22时,y ^=14,故三月中旬的销售量约为14件. 三、解答题5.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积(m 2) 115 110 80 135 105 销售价格(万元)22(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 2时的销售价格. [解析] (1)数据对应的散点图如以下图所示:(2)x =15∑5 i =1x i =109,l xx =∑5i =1 (x i -x )2=1570, y =23.2,l xy =∑5i =1 (x i -x )(y i -y )=308.设所求回归直线方程为y ^=b ^x +a ^,那么b ^=l xy l xx =3081570≈0.1962,a ^=y -b ^x =1.8166.故所求回归直线方程为y ^x +1.8166.(3)据(2),当x =150m 2时,销售价格的估计值为y ^=0.1962×150+1.8166=31.2466(万元).6.(2021·全国卷Ⅱ理,18)以下图是某地区2000年至2021年环境根底设施投资额y (单位:亿元)的折线图.为了预测该地区2021年的环境根底设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2021年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^t ;根据2021年至2021年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^t .(1)分别利用这两个模型,求该地区2021年的环境根底设施投资额的预测值. (2)你认为用哪个模型得到的预测值更可靠?并说明理由.[解析] (1)利用模型①,可得该地区2021年的环境根底设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2021年的环境根底设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(i)从折线图可以看出,2000年至2021年的数据对应的点没有随机散布在直线yt 上下,这说明利用2000年至2021年的数据建立的线性模型①不能很好地描述环境根底设施投资额的变化趋势.2021年相对2021年的环境根底设施投资额有明显增加,2021年至2021年的数据对应的点位于一条直线的附近,这说明从2021年开场环境根底设施投资额的变化规律呈线性增长趋势,利用2021年至2021年的数据建立的线性模型y ^t 可以较好地描述2021年以后的环境根底设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2021年的环境根底设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比拟合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分)C 级 能力拔高炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x 与冶炼时间y (从炉料熔化完毕到出钢的时间)的一组数据,如下表所示:x /0.01% 104 180 190 177 147 134 150 191 204 121 y /min100200210185155135170205235125(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗? (2)求回归直线方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?[解析] (1)x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图.从图中可以看出,各点分布在一条直线附近,所以它们线性相关. (2)列出下表,并用科学计算器进展计算:i 1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i10 40036 00039 90032 74522 78518 09025 50039 15547 94015 125x =159.8,y =172,∑i =110x 2i=265 448,∑i =110y 2i=312 350,∑i =110x i y i =287 640设所求的回归直线方程为=x +,=∑i =110x i y i -10x·y∑i =110x 2i -10x 2≈1.267,=y -x ≈-30.47,即所求的回归直线方程为=1.267x -30.47.(3)当x =160时,=1.267×160-30.47≈172(min ),即大约冶炼172 min .。
太原市2015-2016学年高中数学 第三章 统计案例章末过关检测卷 新人教A版选修2-3
【金版学案】2015-2016学年高中数学 第三章 统计案例章末过关检测卷 新人教A 版选修2-3一、选择题(本大题共12小题,每小题5分,共60分;在每小题给出的四个选项中,只有一项是符合题目要求的)1.在画两个变量的散点图时,下面叙述正确的是(B )A .预报变量在x 轴上,解释变量在y 轴上B .解释变量在x 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在x 轴上D .可以选择两个变量中任意一个变量在y 轴上2.(2015·新课标Ⅱ卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是(D )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:由图知,2006年以来我国二氧化硫年排放量与年份负相关,故选D. 3.下列说法正确的是(B )①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,这样的抽样是分层抽样 ②某地气象局预报:5月9日本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学 ③吸烟与健康具有相关关系 ④在回归直线方程y ^=0.1x +10中,当解释变量x 每增加一个单位时,预报变量y 增加0.1个单位.A .①②B .③④C .①③D .②④解析:①从匀速传递的产品生产流水线上,质检员每10分钟从某处抽取一件产品进行某项指标检测,由于间隔相同,这样的抽样是系统抽样,故①不正确;②降水概率为90%的含义是指降水的可能性为90%,但不一定降水,故②不正确;③吸烟与健康具有相关关系,正确;④在回归直线方程y ^=0.1x +10中,回归系数为0.1,当解释变量x 每增加一个单位时,预报变量y ^增加0.1个单位,故④正确.故选B.4.(2014·湖北卷)已知如下样本数据:x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y ^=b ^x +a ^,则(B)A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0D.a ^<0,b ^<0解析:作出散点图可知(图略)回归直线y ^=bx +a 的斜率b <0,截距a >0.故a >0,b <0.故选B.5.(2015·湖北省稳派教育一轮复习质量检测)某研究机构对儿童记忆能力x 和识图能力y 进行统计分析,得到如下数据:记忆能力x 4 6 8 10 识图能力y3568由表中数据,求得线性回归方程为,若某儿童的记忆能力为时,则他的识图能力为(B ) A .9.2 B .9.5 C .9.8 D .10解析:由表中数据得=7,=5.5,由(,)在直线y ^=45x +a ^,得a ^=-110,即线性回归方程为y ^=45x -110.∴当=12时,y ^=45×12-110=9.5,即他的识图能力为9.5.故选B.6. 根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析x 与y 之间是否存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为 (B)A .54.55B .2.45C .3.45D .111.55解析:把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=140.25-85.7=54.55,由57-54.55=2.45,故选B.7.统计中有一个非常有用的统计量k 2,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A 老师教, 乙班B 老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的2×2列联表.不及格 及格 总计 甲班(A 教) 4 36 40 乙班(B 教) 16 24 40 总计206080根据k 2的值,你认为不及格人数的多少与不同老师执教有关系的把握大约为(A) A .99.5% B .99.9% C .95% D .无充分依据解析:k 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=80(4×24-16×36)220×60×40×40=9.6>7.879.∴不及格人数的多少与不同老师执教有关系的把握大约为99.5%.故选A.8.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验(D) A .男性喜欢参加体育活动 B .女性不喜欢参加体育活动 C .喜欢参加体育活动与性别有关 D .喜欢参加体育活动与性别无关 解析:依据反证法原理可知D 正确.9.变量x 、y 具有线性相关关系,当x 的取值为8,12,14和16时,通过观测知y 的值分别为5,8,9,11,若在实际问题中,y 的预报值最大是10,则x 的最大取值不能超过(B)A .16B .15C .17D .12解析:因为x =16时,y =11;当x =14时,y =9,所以当y 的最大值为10时,x 的最大值应介于区间(14,16)内,所以选B.10.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9,现发现表中有一个数据模糊看不清,请你推断出该数据的值为(B )零件数x (个) 10 203040 50 加工时间y (min)62758189A.67 B .68 C .69 D .70解析:零件个数的平均值x -=30,设零件为20个的对应加工时间为t min ,加工时间的平均值y -=307+t 5,因为回归直线必经过点(x -,y -),代入回归方程y ^=0.67x +54.9,计算得t =68.11.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀 非优秀 总计 甲班 10b 乙班c 30 总计105已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是 (C )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.12.(2013·福建卷)已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y ′=b ′x +a ′,则以下结论正确的是(C )A.b ^>b ′,a ^>a ′B.b ^ >b ′,a ^<a ′C.b ^< b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:过(1,0)和(2,2)的直线方程为y =2x -2,画出六点的散点图,回归直线的大概位置如图所示,显然b ^<b ′,a ^>a ′. 故选C.二、填空题(本大题共4小题,每小题5分,共20分;将正确答案填在题中的横线上) 13.对有关数据的分析可知,每一立方米混凝土的水泥用量x (单位:kg)与28天后混凝土的抗压度y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y ^=0.30x +9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm 2,每立方米混凝土的水泥用量最少应为________kg(精确到0.1 kg).解析:由题意得89.7=0.30x +9.99,解之得x =265.7. 答案:265.714.有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表:优秀 不优秀 总计 甲班 10 35 45 乙班 7 38 45 总计177390利用列联表的独立性检验估计,则成绩与班级________.(填有关或无关)解析:成绩与班级有无关系,就是看随机变量的值与临界值2.706的大小关系. 由公式得K 2=90×(10×38-7×35)217×73×45×45=0.653<2.706,∴成绩与班级无关系.答案:无关15. 某炼钢厂废品率x (%)与成本y (元/t )的线性回归方程为y ^=105.492+42.569x .当成本控制在176.5元/t 时,可以预计生产的1 000 t 钢中,约有__________t 钢是废品.解析:因为176.5=105.492+42.569x ,所以x =1.668,即成本控制在176.5元/t 时,废品率为1.668%. 所以生产的1 000 t 钢台,约有1 000×1.668%=16.68(t )钢是废品.答案:16.6816.(2013·揭阳一模)一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x 与身高y 进行测量,得到数据(单位:cm)如下表,作出散点图后,发现散点在一条直线附近,经计算得到数据:(x i -x -)2=82.5;所以回归方程的斜率b ==577.582.5=7,又x -=24.5,y -=171.5,所以截距a =y --b x -=0,即回归方程为y ^=7x ,当x =26.5时,y ^=7×26.5=185.5,则估计案发嫌疑人的身高为 185.5 cm.答案:185.5三、解答题(本大题共6小题,共70分;解答时应写出必要的文字说明、证明过程及演算步骤)17.(本小题满分11分)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.杂质高 杂质低 旧设备 37 121 新设备22202根据以上数据试判断含杂质的高低与设备改造有无关系. 解析:由已知数据得到如下2×2列联表:杂质高 杂质低 合计 旧设备 37 121 158 新设备 22 202 224 合计59323382由公式K 2=382×(37×202-121×22)2158×224×59×323≈13.11,由于13.11>6.635,故有99%的把握认为含杂质的高低与设备改造是有关的.18.(本小题满分11分)某医院用光电比色计检验尿汞时,得尿汞含量x (mg/L)与消光系数y 的结果如下:(1)求回归方程;(2)求相关指数R 2.尿汞含量x 2 4 6 8 10 消光系数y64138205285360解析:(1)列出散点图,如下图所示.由图可知y 与x 的散点图大体分布在一条直线周围,因此可以用线性回归的方程来拟合它.设y ^=b ^x +a ^.由b ^==36.95,a ^=y -b ^x =-11.3,故所求的回归方程为y ^=36.95x -11.3.(2)把相应数值代入R 2=1-,得R 2≈0.999.19.(本小题满分12分)打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病 未患心脏病合计 每一晚都打鼾 30 224 254 不打鼾 24 1355 1379 合计5415791633解析:假设每一晚都打鼾与患心脏病无关系,则有a =30,b =224,c =24,d =1355, a +b =254,c +d =1379,a +c =54,b +d =1579,n =1633.∴K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=1633×(30×1355-224×24)2254×1379×54×1579=68.033.∵68.033>10.828.∴有99%的把握说每一晚都打鼾与患心脏病有关. 20.(本小题满分12分)已知x ,y 之间的一组数据如下表:x 1 3 6 7 8 y12345(1)从x ,y 中各取一个数,求x +y ≥10的概率;(2)对于表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +12,试判断哪条直线拟合程度更好.解析:(1)从x ,y 中各取一个数组成数对(x ,y ),共有5×5=25(对),其中满足x +y ≥10的数对有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5)共9对.故所求的概率为925.(2)用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为:S 1=⎝ ⎛⎭⎪⎫43-12+(2-2)2+(3-3)2+⎝ ⎛⎭⎪⎫103-42+⎝ ⎛⎭⎪⎫113-52=73;用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝ ⎛⎭⎪⎫72-32+(4-4)2+⎝ ⎛⎭⎪⎫92-52=12.∵S 1>S 2,∴用y =12x +12作为拟合直线时,拟合程度更好.21.(本小题满分12分)研究“刹车距离” 对于安全行车及分析交通事故责任都有一定的作用,所谓“刹车距离” 就是指行驶中的汽车,从刹车开始到停止,由于惯性的作用而又继续向前滑行的一段距离.为了测定某种型号汽车的刹车性能(车速不超过140 km/h),对这种汽车进行测试,测得的数据如表:刹车时的车速(km/h)0 10 20 30 40 50 60 刹车距离(m)0.31.02.13.65.57.8(1) 以车速为x 轴,以刹车距离为y 轴,在给定坐标系中画出这些数据的散点图.(2)观察散点图,估计函数的类型,并确定一个满足这些数据的函数表达式.(3)该型号汽车在国道上发生了一次交通事故,现场测得刹车距离为46.5 m ,请推测刹车时的速度为多少?请问在事故发生时,汽车是超速行驶还是正常行驶?解析:(1)散点图如图所示:(2)由图象,设函数的表达式为y =ax 2+bx +c (a ≠0),将(0,0),(10,0.3)(20,1.0)代入,得⎩⎪⎨⎪⎧c =0,100a +10b +c =0.3,400a +20b +c =1.0,解得a =0.002,b =0.01,c =0.所以,函数的表达式为y =0.002x 2+0.01x (0≤x ≤140). 经检验,表中其他各值也符合此表达式.(3)当y =46.5时,即0.002x 2+0.01x =46.5,所以,x 2+5x -23 250=0. 解得x 1=150,x 2=-155(舍去). 故可推测刹车时的速度为150 km/h ,而150>140,因此发生事故时,汽车属于超速行驶. 22.(2014·新课标全国卷Ⅱ)(本小题满分12分)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9(1)求y 关于t 的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=,a ^=-b ^t .解析:(1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,(t i -t )(y i -y )=(-3)× (-1.4)+(-2)× (-1)+(-1)× (-0.7)+0× 0.1+1× 0.5+2× 0.9+3×1.6=14,b ^==0.5,a ^=y -b ^t =4.3-0.5×4=2.3,所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9,代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.一、选择题(本大题共12小题,每小题5分,共60分;在每小题给出的四个选项中,只有一项是符合题目要求的)1. 变量x ,y 的散点图如图所示,那么x ,y 之间的样本相关系数最接近的值是(C )A .1B .-0.5C .0D .0.5解析:因为r 的绝对值越接近于1,表明两个变量的线性相关性越大;r 的绝对值越接近于0,表明两个变量的线性相关性越小.由图知x 、y 之间没有相关关系,所以r 的绝对值最接近于0.故选C.2.从集合{1,2,3,… ,10}中任意选出三个不同的数,使这三个数成等比数列,这样的等比数列的个数为(D )A .3个B .4个C .6个D .8个解析:按从小到大顺序有 124,139,248,469共4个, 同理按从大到小顺序也有 4个,故这样的等比数列的个数为 8个.3.从10种不同的作物种子中选出6种放入6个不同的瓶子中展出,如果甲、乙两种种子不能放入第1号瓶内,那么不同的放法种数为(C )A .C 210A 48B .C 19A 59 C .C 18A 59D .C 18A 58解析:先排第1号瓶,从甲、乙以外的8种不同作物种子中选出1种有C 18种方法,再排其余各瓶,有A 59种方法,故不同的放法共C 18A 59有种.故选C.4.(2015·山东卷)已知某批零件的长度误差(单位:毫米)服从正态分布N (0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为(B)(附:若随机变量ζ服从正态分布N (μ,σ2),则P (μ-σ<ζ<μ+σ)=68.26%,P (μ-2σ<ζ<μ+2σ)=95.44%.)A .4.56%B .13.59%C .27.18%D .31.74%解析:P (3<ζ<6)=12(95.44%-68.26%)=13.59%,故选B.5.甲、乙两人进行围棋比赛,比赛采取五局三胜制,无论哪一方先胜三局则比赛结束,假定甲每局比赛获胜的概率均为23,则甲以3∶ 1的比分获胜的概率为(A )A.827 B.6481 C.49 D.89解析:设甲胜为事件A ,则P (A )=23,P (A )=13,∵甲以3∶ 1的比分获胜,∴甲前三局比赛中胜2局,第四局胜,故所求概率为P =C 23·⎝ ⎛⎭⎪⎫232·13·23=827.6.(2015·陕西卷)二项式(x +1)n (n ∈N +)的展开式中x 2的系数为15,则n =(C ) A .4 B .5 C .6 D .7解析:二项式(x +1)n 的展开式的通项是T r +1=C r n x r ,令r =2得x 2的系数是C 2n ,因为x2的系数为15,所以C 2n =15,即n 2-n -30=0,解得:n =6或n =-5,因为n ∈N +,所以n =6,故选C.7.(2013·陕西卷)设函数f (x )=⎩⎨⎧⎝ ⎛⎭⎪⎫x -1x 6,x <0,-x ,x ≥0,则当x >0时,f [f (x )]表达式的展开式中常数项为(A )A .-20B .20C .-15D .15解析:当x >0时,f [f (x )]=⎝ ⎛⎭⎪⎫-x +1x 6=⎝ ⎛⎭⎪⎫1x -x 6的展开式中,常数项为C 36⎝ ⎛⎭⎪⎫1x 3(-x )3=-20.故选A.8.(2014·辽宁卷)6把椅子摆成一排,3人随机就座,任何两人不相邻的坐法种数为(D )A .144种B .120种C .72种D .24种解析:这是一个元素不相邻问题,采用插空法,有A 33C 34=24.9.(2015·山东青岛下学期自主练习)将1,2,3,4四个数字随机填入右边2×2的方格中﹐每个方格中恰填一个数字﹐且数字可重复使用. 则事件“A 方格的数字大于B 方格的数字,且C 方格的数字大于D 方格的数字”的概率为(C)A.9256 B.116 C.964 D.2564解析:根据题意,四个方格中填入数字共有44=256种,如果对于A 、B 两个方格可在1、2、3、4中的任选2个,且较大的放入A 方格,较小的放入B 方格,共有C 24=6种情况;对于另外两个方格,每个方格有4种情况,则有4×4=16种,则A 方格的数字大于B 方格的数字共有6×16=96种,所以A 方格的数字大于B 方格的数字的概率为96256=38.同理C 方格的数字大于D 方格的数字的概率亦为38,所以则事件“A 方格的数字大于B 方格的数字,且C 方格的数字大于D 方格的数字”的概率为38×38=964,故选C.10.(2014·安徽卷)从正方体六个面的对角线中任取两条作为一对,其中所成的角为60°的共有(C )A .24对B .30对C .48对D .60对解析:间接法.正方体的面对角线共有12条,从中任取2条有C 212种取法,其中相互平行的有6对,相互垂直的有12对,∴共有C 212-6-12=48对.11.若随机变量ξ~N (-2,4),则ξ在区间(-4,-2]上取值的概率等于ξ在下列哪个区间上取值的概率(C )A .(2,4]B .(0,2]C .[-2,0)D .(-4,4]解析:此正态曲线关于直线x =-2对称,∴ξ在区间(-4,-2]上取值的概率等于ξ在[-2,0)上取值的概率.12.(2014·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是(D )表1A.成绩 B .视力 C .智商 D .阅读量解析:A 中,K 2=52×(6×22-10×14)220×32×16×36=131440;B 中,K 2=52×(4×20-12×16)220×32×16×36=637360; C 中,K 2=52×(8×24-8×12)220×32×16×36=1310;D 中,K 2=52×(14×30-2×6)220×32×16×36=3757160.因此阅读量与性别相关的可能性最大,所以选D.二、填空题(本大题共4小题,每小题5分,共20分;把答案填在题中横线上)13. (2013·江门二模)(1+2x )n 的展开式中x 3的系数等于x 2的系数的4倍,则n =____________.解析:设(1+2x )n 的展开式的通项公式为T r +1,则T r +1=C r n (2x )r =2r ·C r n ·x r,令r =3,得展开式中x 3的系数为:8C 3n ,令r =2得展开式中x 2的系数为4C 2n .依题意,8C 3n =4×4C 2n ,即n (n -1)(n -2)3×2×1=2×n (n -1)2,解得n =8.答案:814.随机变量X 的分布列如下表,且E (X )=1.1,则D (X )=________.X 0 1 xP15p310解析:p =1-⎝ ⎛⎭⎪⎫15+310=12,E (X )=1.1=0×15+1×12+310x ,解得x =2,所以D (X )=15×(0-1.1)2+12×(1-1.1)2+310×(2-1.1)2=0.49.答案:0.4915.将红、黄、蓝、白、黑5个小球分别放入红、黄、蓝、白、黑5个盒子里,每个盒子里放且只放1个小球,则红球不在红盒内且黄球不在黄盒内的概率是0.65.16.8名世界网球顶级选手在上海大师赛上分成两组,每组4人,分别进行单循环赛,每组决定前两名,再由每一组的第一名与另一组的第二名进行淘汰赛,获胜者角逐冠、亚军,败者角逐第三、四名,大师赛共有________场比赛.解析:分四类:第一类,进行单循环赛需要2C 24=2×4×32=12场;第二类,进行淘汰赛,需要2场;第三类,角逐冠、亚军,需要比赛1场;第四类,角逐第三、四名,需要比赛1场.所以大师赛共有2C 24+2+1+1=16场比赛.答案:16三、解答题(本大题共6小题,共70分;解答应写出文字说明、证明过程或演算步骤)17.(本小题满分11分)已知⎝⎛⎭⎪⎫x -12x n的展开式中,前三项系数的绝对值依次成等差数列.(1)求展开式中的常数项; (2)求展开式中所有整式项.解析:(1)T r +1=C r n·()x n -r ·⎝ ⎛⎭⎪⎫12x r ·(-1)r ,∴前三项系数的绝对值分别为C 0n ,12C 1n ,14C 2n ,由题意知C 1n =C 0n +14C 2n ,∴n =1+18n (n -1),n ∈N *,解得n =8或n =1(舍去),∴T k +1=C k8·(x )8-k·⎝ ⎛⎭⎪⎫-12x k =C k 8·⎝ ⎛⎭⎪⎫-12k ·x 4-k,0≤k ≤8,令4-k =0得k =4,∴展开式中的常数项为T 5=C 48⎝ ⎛⎭⎪⎫-124=358.(2)要使T k +1为整式项,需4-k 为非负数,且0≤k ≤8,∴k =0,1,2,3,4.∴展开式中的整式项为:x 4,-4x 3,7x 2,-7x ,358.18.(本小题满分11分)为了对新产品进行合理定价,对该产品进行了试销试验,以观察需求量y (单位:千件)对于价格x (单位:千元)的反应,得数据如下:x 50 70 80 40 30 90 95 97 y 100 80 60 120 135 555048(1)若y 与x 之间具有线性相关关系,求线性回归方程. (2)若成本x =y +500,试求:①在盈亏平衡条件下(利润为零)的价格; ②在利润为最大的条件下的定价.解析:(1)b ^=≈-1.286 6,a ^=y -b ^x ≈169.772 4,∴线性回归方程为y ^=-1.286 6x +169.772 4.(2)①在盈亏平衡条件下,y ^x =y ^+500,即-1.286 6x 2+169.772 4x =-1.286 6x +169.772 4+500,1.286 6x 2-171.059x +669.772 4=0,解得x 1=128.916 2,x 2=4.038 1(舍去),∴此时新产品的价格为128.916 2千元. ②在利润最大的条件下,Q =y ^x -x=-1.286 6x 2+169.772 4x +1.286 6x -169.772 4-500=-1.286 6x 2+171.059x -669.772 4.要使Q 取得最大值,x =66.477 1,即此时新产品应定价为66.477 1千元. 19.(2014·天津卷)(本小题满分12分)某大学志愿者协会有6名男同学,4名女同学.在这10名同学中,3名同学来自数学学院,其余7名同学来自物理、化学等其他互不相同的七个学院.现从这10名同学中随机选取3名同学,到希望小学进行支教活动(每位同学被选到的可能性相同).(1)求选出的3名同学是来自互不相同学院的概率;(2)设X 为选出的3名同学中女同学的人数,求随机变量X 的分布列和数学期望.解析:(1)设“选出的3名同学是来自互不相同的学院”为事件A ,则P (A )=C 13·C 27+C 03·C 37C 310=4960,所以选出的3名同学是来自互不相同学院的概率为4960. (2)随机变量X 的所有可能值为0,1,2,3. P (X =k )=C k4·C 3-k6C 310(k =0,1,2,3), 所以随机变量X 的分布列为:X 0 1 2 3 P1612310130随机变量X 的数学期望E (X )=0×16+1×12+2×310+3×130=65.20.(本小题满分12分)为备战2016年奥运会,甲、乙两位射击选手进行了强化训练.现分别从他们的强化训练期间的若干次平均成绩中随机抽取8次,记录如下:甲:8.3,9.0,7.9,7.8,9.4,8.9,8.4,8.3 乙:9.2,9.5,8.0,7.5,8.2,8.1,9.0,8.5(1)现要从中选派一人参加奥运会封闭集训,从统计学角度,你认为派哪位选手参加合理?简单说明理由.(2)若将频率视为概率,对选手乙在今后的三次比赛成绩进行预测,记这三次成绩中不低于8.5分的次数为ξ,求ξ的分布列及均值E (ξ).解析:(1)因为x -甲=x -乙=8.5,又s 2甲=0.27,s 2乙=0.405,得s 2甲<s 2乙,相对来讲,甲的成绩更加稳定,所以选派甲合适.(2)依题意得,乙不低于8.5分的频率为12,ξ的可能取值为0,1,2,3,则ξ~B ⎝ ⎛⎭⎪⎫3,12. 所以,P (ξ=k )=C k3⎝ ⎛⎭⎪⎫123-k⎝ ⎛⎭⎪⎫1-12k =C k 3 ⎝ ⎛⎭⎪⎫123,k =0,1,2,3. 所以ξ的分布列为:ξ0 1 2 3 P18383818所以E (ξ)=0×18+1×38+2×38+3×18=32.21.(本小题满分12分)某项选拔共有四轮考核,每轮设有一个问题,能正确回答者进入下一轮考核,否则即被淘汰.已知某选手能正确回答第一、二、三、四轮的问题的概率分别为0.6,0.4,0.5,0.2 . 已知各轮问题能否正确回答互不影响.(1)求该选手被淘汰的概率;(2)求该选手在选拔中至少回答了2个问题被淘汰的概率.解析:(1)记“该选手能正确回答第i 轮的问题”为事件A i (i =1,2,3,4),则P (A 1)=0.6,P (A 2)=0.4,P (A 3)=0.5,P (A 4)=0.2. 法一 该选手被淘汰的概率:P =P (A 1+A 1A 2+A 1 A 2A 3 +A 1 A 2 A 3A 4 )=P (A 1)+P (A 1)P (A 2)+P (A 1)P (A 2)·P (A 3 )+P (A 1)P (A 2)P (A 3)P (A 4 ) =0.4+0.6×0.6+0.6×0.4×0.5+0.6×0.4×0.5×0.8=0.976.法二 P =1-P (A 1 A 2 A 3A 4 )=1-P (A 1)P (A 2) P (A 3)P (A 4 )=1-0.6×0.4×0.5×0.2=1-0.024=0.976.(2)法一 P =P (A 1A 2+A 1 A 2A 3 +A 1 A 2 A 3A 4 )=P (A 1)P (A 2)+P (A 1)P (A 2)P (A 3 )+P (A 1)·P (A 2)P (A 3)P (A 4 ) =0.6×0.6+0.6×0.4×0.5+0.6×0.4×0.5×0.8=0.576.法二 P =1-P (A 1)-P (A 1 A 2 A 3A 4 )=1-(1-0.6)-0.6×0.4×0.5×0.2=0.576. 22.(2014·山东卷)(本小题满分12分)乒乓球台面被网分隔成甲、乙两部分,如图所示,甲上有两个不相交的区域A ,B ,乙被划分为两个不相交的区域C ,D .某次测试要求队员接到落点在甲上的来球后向乙回球.规定:回球一次,落点在C 上记3分,在D 上记1分,其他情况记0分.对落点在A 上的来球,队员小明回球的落点在C 上的概率为12,在D 上的概率为13;对落点在B 上的来球,小明回球的落点在C 上的概率为15,在D 上的概率为35.假设共有两次来球且落在A ,B 上各一次,小明的两次回球互不影响.求: (1)小明两次回球的落点中恰有一次的落点在乙上的概率; (2)两次回球结束后,小明得分之和ξ的分布列与数学期望.解析:(1)记A i 为事件“小明对落点在A 上的来球回球的得分为i 分”(i =0,1,3),则P (A 3)=12,P (A 1)=13,P (A 0)=1-12-13=16;记B i 为事件“小明对落点在B 上的来球回球的得分为i 分” (i =0,1,3),则P (B 3)=15,P (B 1)=35,P (B 0)=1-15-35=15. 记D 为事件“小明两次回球的落点中恰有1次的落点在乙上”. 由题意,D =A 3B 0+A 1B 0+A 0B 1+A 0B 3, 由事件的独立性和互斥性, P (D )=P (A 3B 0+A 1B 0+A 0B 1+A 0B 3)=P (A 3B 0)+P (A 1B 0)+P (A 0B 1)+P (A 0B 3)=P (A 3)P (B 0)+P (A 1)P (B 0)+P (A 0)·P (B 1)+P (A 0)P (B 3) =12×15+13×15+16×35+16×15=310, 所以小明两次回球的落点中恰有1次的落点在乙上的概率为310.(2)由题意,随机变量ξ可能的取值为0,1,2,3,4,6. 由事件的独立性和互斥性,得P (ξ=0)=P (A 0B 0)=16×15=130,P (ξ=1)=P (A 1B 0+A 0B 1)=P (A 1B 0)+P (A 0B 1)=13×15+16×35=16,P (ξ=2)=P (A 1B 1)=13×35=15,P (ξ=3)=P (A 3B 0+A 0B 3)=P (A 3B 0)+P (A 0B 3)=12×15+16×15=215, P (ξ=4)=P (A 3B 1+A 1B 3)=P (A 3B 1)+P (A 1B 3)=12×35+13×15=1130, P (ξ=6)=P (A 3B 3)=12×15=110.可得随机变量ξ的分布列为:ξ0 1 2 3 4 6 P13016152151130110所以数学期望E (ξ)=0×130+1×16+2×15+3×215+4×1130+6×110=.。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)
一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)
一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
新人教版高中数学选修三第三单元《成对数据的统计分析》测试(含答案解析)(2)
一、选择题1.某车间加工零件的数量x 与加工时间y 的统计数据如表:该车间的负责人作出散点图,发现x ,y 是线性相关的,并求出y 关于x 的线性回归方程23517=+y bx (其中b 是常数),据此回归模型可以预测,加工20个零件所需要的加工时间约为( ) A .45分钟 B .46分钟 C .47分钟 D .48分钟2.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62kg ,他的曾祖父、祖父、父亲、儿子的体重分别为58kg 、64kg 、58kg 、60kg .如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x 与预报变量y 的回归方程为y bx a =+,其中0.5b =,据此模型预测他的孙子的体重约为( )A .58kgB .61kgC .65kgD .68kg3.已知()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢数学文化的人数占男生人数的16,女生喜欢数学文化的人数占女生人数23,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有( ) A .24人 B .22人C .20人D .18人4.某公司在2014~2018年的收入与支出情况如下表所示:支出y (亿元)0.2 1.5 2.0 2.5 3.8根据表中数据可得回归直线方程为0.7y x a =+,依此估计如果2019年该公司收入为8亿元时的支出为( ) A .4.502亿元 B .4.404亿元 C .4.358亿元D .4.856亿元5.下列命题不正确的是( )A .研究两个变量相关关系时,相关系数r 为负数,说明两个变量线性负相关B .研究两个变量相关关系时,相关指数R 2越大,说明回归方程拟合效果越好.C .命题“∀x ∈R ,cos x ≤1”的否定命题为“∃x 0∈R ,cos x 0>1”D .实数a ,b ,a >b 成立的一个充分不必要条件是a 3>b 3 6.已知具有线性相关的两个变量,x y 之间的一组数据如下表所示:x0 1 2 3 4 y 2.24.34.54.86.7若,x y 满足回归方程 1.5ˆˆyx a =+,则以下为真命题的是( ) A .x 每增加1个单位长度,则y 一定增加1.5个单位长度 B .x 每增加1个单位长度,y 就减少1.5个单位长度 C .所有样本点的中心为(1,4.5) D .当8x =时,y 的预测值为13.57.为预测某种产品的回收率y ,需要研究它和原料有效成分的含量x 之间的相关关系,现取了8组观察值.计算得8152ii x==∑,81228i i y ==∑,821478ii x ==∑,811849i i i x y ==∑,则y对x 的回归方程是( ) A .y =11.47+2.62x B .y =-11.47+2.62x C .y =2.62+11.47x D .y =11.47-2.62x8.一个车间为了规定工时定额,需要确定加工零件所花费的时间,由此进行了5次实验,收集数据如下: 零件数:个 10 20 30 40 50 加工时间:分钟5971758189由以上数据的线性回归方程估计加工100个零件所花费的时间为( ) 附:回归直线的斜率和截距的最小二乘估计公式分别为1122211()(),()nniii ii i nni ii i x x y y x y nxyb a y bx x x xnx ====---===---∑∑∑∑A .124分钟B .150分钟C .162分钟D .178分钟9.下列有关统计知识的四个命题正确的是( )A .衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切B .在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差C .线性回归方程对应的直线ˆˆˆy bx a =+至少经过其样本数据点中的一个点D .线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位 10.已知,x y 的对应值表为:且,x y 线性相关,由于表格污损,y 的对应值看不到了,若6119.2ii y==∑,且线性回归直线方程为0.6y x a =+,则8x =时,y 的预报值为( ) A .6.1B .22.1C .12.6D .3.511.陕西关中的秦腔表演朴实,粗犷,细腻,深刻,再有电子布景的独有特效,深得观众喜爱.戏曲相关部门特意进行了“喜爱看秦腔”调查,发现年龄段与爱看秦腔的人数比存在较好的线性相关关系,年龄在[]40,44,[]45,49,[]50,54,[]55,59的爱看人数比分别是0.10,0.18,0.20,0.30.现用各年龄段的中间值代表年龄段,如42代表[]40,44.由此求得爱看人数比y 关于年龄段x 的线性回归方程为0.4188y kx =-.那么,年龄在[]60,64的爱看人数比为( ) A .0.42B .0.39C .0.37D .0.3512.在某次试验中,实数x ,y 的取值如下表:若x 与y 之间具有较好的线性相关关系,且求得线性回归方程为1y x =+,则实数m 的值为()A .1.6B .1.7C .1.8D .1.913.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱二、解答题14.某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2018级的1000名学生进行调查,收集到相关数据如下: (1)根据以上提供的信息,完成22⨯列联表,并完善等高条形图;选物理 不选物理 总计数学成绩优秀数学成绩不优秀260 总计6001000(2)能否在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关?附:22()()()()()n ad bc K a b c d a c b d -=++++临界值表:()20P K k0.10 0.05 0.010 0.005 0.00115.“每天锻炼一小时,健康工作五十年,幸福生活一辈子.”一科研单位为了解员工爱好运动是否与性别有关,从单位随机抽取30名员工进行了问卷调查,得到了如下列联表:已知在这30人中随机抽取1人抽到爱好运动的员工的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有把握认为爱好运动与性别有关? (2)若从这30人中的女性员工中随机抽取2人参加一活动,记爱好运动的人数为X ,求X 的分布列、数学期望.16.某电脑公司有5名产品推销员,其工作年限与年推销金额的数据如表:(1)求年推销金额y 关于工作年限x 的线性回归方程; (2)判断变量x 与y 之间是正相关还是负相关;(3)若第6名推销员的工作年限是11年,试估计他的年推销金额.参考公式:线性回归方程y bx a =+中,a y bx =-,其中,x y 为样本平均数,1221ni ii nii x ynx y b xnx==-=-∑∑)17.调查某桑场采桑员和辅助工桑毛虫皮炎发病情况结果如下表:利用22⨯列联表的独立性检验估计,“患桑毛虫皮炎病与采桑”是否有关?认为两者有关系会犯错误的概率是多少?随机量变22()()()()()n ad bcKa b c d a c b d-=++++(其中n a b c d=+++)临界值表18.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿帮助的老年人的比例?说明理由.19.某车间为了规定工时额定,需要确定加工零件所花费的时间,为此作了6次试验,得到数据如下:(1)试对上述变量x 与y 的关系进行相关性检验,如果x 与y 具有线性相关关系,求出y 对x 的回归直线方程;(2)根据(1)的结论,你认为每小时加工零件的数量额定为多少(四舍五入为整数)比较合理?附:相关性检验的临界值表()()nniii ix x y y x y nx yr---==∑∑()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,y a bx =+42.0≈27.5≈20.一只药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该种药用昆虫的6组观测数据如下表:经计算得:61()()557iii x x y y =--=∑,621()84ii x x =-=∑,621()3930i i y y =-=∑线性回归模型的残差平方和621()236.64iii y y =-=∑,8.06053167e ≈,其中,i i x y 分别为观测数据中的温度和产卵数,1,2,3,4,5,6i =(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程为0.2303ˆ0.06x ye =,且相关指数20.9522R =.①试与1中的回归模型相比,用2R 说明哪种模型的拟合效果更好.②用拟合效果好的模型预测温度为35℃时该用哪种药用昆虫的产卵数(结果取整数) 附:一组数据1122(,),(,)(,)n n x y x y x y 其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计为121()()ˆ()ni i i nii x x y y bx x ==--=-∑∑,ˆˆay bx =-;相关指数22121ˆ()1()niii nii y yR y y ==-=--∑∑.21.根据教育部高考改革指导意见,广东省从2021年正式实施“312++”新的高考考试方案.为尽快了解学生的选科需求,及时调整学校人力资源配备.某校从高一学生中抽样调查了100名同学,在模拟分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生14人)选择了历史.请完成以下22⨯列联表,并判断能否有99.9%的把握说选科与性别有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.22.某种产品的广告费支出x (百万元)与销售额y (百万元)之间有如下对应数据:(1)画出散点图;(2)求出线性回归方程,并预测广告费支出为1千万时销售额为多少万.(参考公式):1122211()()()nni i ii i i nni ii i x y nxy xx y y x nx xx a y b====⎧---⎪⎪⎪⎨--⎪⎪=-⎪⎩∑∑∑∑23.假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料:若由资料知y 对x 呈线性相关关系. (1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程ˆybx a =+的回归系数a ,b ; (3)估计使用年限为10年时,维修费用是多少?24.某地区不同身高()x cm 的未成年男孩的体重平均值()y kg 如下表:已知ln y 与x 之间存在很强的线性相关性, (1)据此建立y 与x 之间的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高150cm 体重为45kg 的在校男生的体重是否正常? 参考数据:()51ln 940iii x y =⋅=∑,51ln 11.5ii y==∑, 3.740.5e ≈附:对于一组数据()11,v μ,()22,v μ,…,(),n n v μ,其回归直线v bx a =+中的斜率和截距的最小二乘估计分别为1221ˆni i i nii v n vbn μμμμ==-=-∑∑,ˆˆav b μ=-. 25.随着人们经济收入的不断增加,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司做了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y (万元)有如表的数据资料:(1)求线性回归方程ˆˆˆybx a =+; (2)估计使用年限为12年时,使用该款车的总费用是多少万元?线性回归方程ˆˆˆya bx =+中斜率和截距用最小二乘法估计计算公式如下:()()()1122211ˆn niii ii i nni ii i x x y y x y nxybx x xnx ====---==--∑∑∑∑,ˆa y bx=- 26.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】求出样本数据的中心坐标(,)x y ,代入回归直线方程,求出ˆb,得到回归直线方程,然后求解加工20个零件所需要的加工时间,得到答案. 【详解】由题意,根据表中的数据,可得1(911141516)135x =++++=, 1(3032364042)365y =++++=,即样本中心点为(13,36),将样本中心点为(13,36)代入回归方程,可得235361317b =⨯+,解得2917b =, 所以回归方程为292351717y x =+, 当20x时,292358152047.9848171717y =⨯+=≈≈(分钟). 故选:D. 【点睛】本题主要考查了线性回归方程的求法及应用,其中解答中熟记回归直线方程经过样本中心点是解答的关键,着重考查推理与运算能力.2.B解析:B 【分析】由已知得出数据,()58,58,()64,62,()58,60,根据回归直线过样本中心点,可求得(),x y ,计算求得a ,代入62x =,即可得出结果.【详解】由已知,体重是隔代遗传,且呈线性相关,得出数据,()58,58,()64,62,()58,60, 所以()(),=60,60x y ,代入y bx a =+,其中0.5b =,求得=30a , 即0.530y x =+.62x =时, 0.56230y =⨯+=61.故选:B 【点睛】本题主要考查线性回归方程的相关计算,考查学生分析问题的能力,属于中档题.3.D解析:D 【分析】设男生至少有x 人,根据条件,列出22⨯联表,计算出2K ,令2K 6.635,即可求出.【详解】设男生至少有x 人,根据题意,可列出如下22⨯联表:则23111532663611822x x x x x K x x x x x , 若有99%的把握认为是否喜欢数学文化和性别有关, 则2 6.635K >,即36.6358x , 解得17.693x ,由于表中人数都为整数,所以18x =, 即男生至少有18人. 故选:D. 【点睛】本题考查独立性检验,属于基础题.4.D解析:D 【分析】先求 3.92x =,2y =,根据0.7a y x =-,求解0.744a =-,将8x =代入回归直线方程为0.7y x a =+,求解即可. 【详解】 2.2 2.4 3.8 5.2 6.03.925x ++++==,0.2 1.5 2.0 2.5 3.825y ++++==0.720.7 3.920.744a y x =-=-⨯=-即0.70.744y x =-令8x =,则0.780.744 4.856y =⨯-= 故选:D 【点睛】本题考查回归分析,样本中心点(),x y 满足回归直线方程,是解决本题的关键.属于中档题.5.D解析:D 【分析】根据相关系数、相关指数的知识、全称命题的否定的知识,充分、必要条件的知识对四个选项逐一分析,由此得出命题不正确的选项. 【详解】相关系数r 为负数,说明两个变量线性负相关,A 选项正确. 相关指数2R 越大,回归方程拟合效果越好,B 选项正确.根据全称命题的否定是特称命题的知识可知C 选项正确.对于D 选项,由于33a b a b >⇔>,所以33a b >是a b >的充分必要条件,故D 选项错误.所以选D. 【点睛】本小题主要考查相关系数、相关指数的知识,考查全称命题的否定是特称命题,考查充要条件的判断,属于基础题.6.D解析:D 【分析】利用回归直线过样本点中心可求回归方程,根据该方程可得正确的选项. 【详解】由 1.5y x a =+,得x 每增一个单位长度,y 不一定增加1.5,而是大约增加1.5个单位长度,故选项,A B 错误; 由已知表格中的数据,可知0123425x ++++==,2.2 4.3 4.5 4.8 6.74.55y ++++==,回归直线必过样本的中心点()2,4.5,故C 错误; 又4.5 1.52 1.5ˆˆaa =⨯+⇒=,∴回归方程为 1.5 1.5y x =+, 当8x =时,y 的预测值为1.58 1.513.5⨯+=,故D 正确, 故选:D. 【点睛】本题考查线性回归方程的性质及应用,注意回归直线过(),x y ,本题属于基础题.7.A解析:A【解析】分析:根据公式计算ˆb ≈2.62,ˆa ≈11.47,即得结果. 详解:由1221,()ˆˆˆni ii nii x y nxyba y bx xn x ==-==--∑∑,直接计算得ˆb ≈2.62,ˆa ≈11.47,所以ˆy=2.62x +11.47.选A.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .8.A解析:A 【解析】分析:先求出,x y ,再求出ˆˆ,ba 得到回归直线方程,再令x=100得到加工100个零件所花费的时间.详解:由题得30,75,x y ==121()()(20)(16)(10)(4)70074001000100400100010()niii ni i x x y y b x x ==---⨯-+-⨯-====++++-∑∑,所以775ˆ3054,10ay bx =-=-⨯= 所以754,10y x =+当x=100时,y=124.故答案为A 点睛:本题主要考查回归分析和回归方程的求法,意在考查学生对这些基础知识的掌握水平和基本的计算能力,考查学生解决实际问题的能力.9.A解析:A 【解析】分析:利用“卡方”的意义、相关指数的意义及回归分析的适用范围,逐一分析四个答案的真假,可得答案.详解:A. 衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切,正确;B. 在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差,错误对分类变量X 与Y 的随机变量的2x 观测值来说, 2x 越大,“X 与Y 有关系”可信程度越大; 故B 错误;C. 线性回归方程对应的直线y bx a =+至少经过其样本数据点中的一个点,错误,回归直线y bx a =+可能不经过其样本数据点中的任何一个点;D. 线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位,错误,由回归方程可知变量x 每增加一个单位时,变量y 平均增加0.5个单位. 故选A.点睛:本题考查回归分析的意义以及注意的问题.是对回归分析的思想、方法小结.要结合实例进行掌握.10.A解析:A 【分析】求出,x y ,由线性回归方程必经过点(,x y )即得a ,代入8x =求解即可. 【详解】 由表格知,196x =, 6119.2ii y==∑3.2y ∴=,代入0.6y x a =+得:193.20.66a =⨯+, 1.3a ∴=,则回归方程为0.6 1.3y x =+, 当8x =时,0.68 1.3 6.1y =⨯+=, 故选:A . 【点睛】本题主要考查了线性回归方程,线性回归方程的性质、应用, 属于中档题.11.D解析:D 【分析】根据题意,可列出y 关于x 的表格,求出,x y ,代入0.4188y kx =-,求出k ,即可求解 【详解】由题,对数据进行处理,得出如下表格: 求得49.5x =,0.195y =,因样本中心(,x y 过线性回归方程,将(,x y 代入0.4188y kx =-,得0.0124k =,即0.01240.4188y x =-,年龄在[]60,64对应的x 为62,将62x =代入0.01240.4188y x =-得:0.0124620.41880.35y =⨯-=,对应的爱看人数比为:0.35 故选:D 【点睛】本题考查线性回归方程的应用,样本中心(),x y 过线性回归方程是一个重要特征,属于中档题12.D解析:D 【分析】根据线性回归方程必过点(),x y ,可求出m 的值. 【详解】 因为14.333,5mx y +== 所以14.333145m+=+=,解得 1.9m = 故选D. 【点睛】本题主要考查了线性回归方程,样本中心点,属于容易题.13.A解析:A 【分析】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选A. 【点睛】该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.二、解答题14.(1)填表见解析,作图见解析(2)能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关【分析】(1)由题意计算出各组人数后即可完成列联表,进而可补全等高条形图;(2)代入公式计算出2K,与3.841比较即可得出结论.【详解】(1)根据题意填写列联表如下,选物理不选物理总计数学成绩优秀420320740数学成绩不优秀18080260总计6004001000(2)计算22 2()1000(42080180320) ()()()()600400740260n ad bcKa b c d a c b d-⨯⨯-⨯==++++⨯⨯⨯12.474 3.841≈>,所以能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关.【点睛】本题考查了独立性检验的应用,考查了计算能力,属于中档题.15.(1)没有把握认为爱好运动与性别有关;(2)6 7 .【分析】(1)由30人中随机抽取1人抽到爱好运动的员工的概率是815,故爱好运动的员工共有16人,即可补充完整,再根据独立性检验的临界值表,即可判断;(2)利用排列组合求出X 各个取值的概率,求出分布列,代入期望公式,即可得解. 【详解】(1)由30人中随机抽取1人抽到爱好运动的员工的概率是815, 故爱好运动的员工共有16人,由表中男爱好运动的员工为10人, 可得女爱好运动的员工有6人, 故列联表补充如下:230(10866) 1.158 3.84116141614k ⨯⨯-⨯=≈<⨯⨯⨯,所以没有把握认为爱好运动与性别有关; (2)X 的可能取值为0,1,2.282144(0)13C P X C ===,118621448(1)91C C P X C ===,2621415(2)=91C P X C ==,所以X 的分布列为: 448156()0121391917E X =⨯+⨯+⨯=. 【点睛】本题考查了独立性检验和超几何分布,考查了离散型随机变量概率和期望的计算,有一定的计算量,是常规题,属于中档题.16.(1)0.50.4y x =+;(2)正相关;(3)5.9万元. 【分析】(1)首先求出x ,y 的平均数,利用最小二乘法做出b 的值,再利用样本中心点满足线性回归方程和前面做出的横标和纵标的平均值,求出a 的值,写出线性回归方程. (2)根据0.50b =>,即可得出结论;(3)第6名推销员的工作年限为11年,即当11x =时,把自变量的值代入线性回归方程,得到y 的预报值,即估计出第6名推销员的年推销金额为5.9万元. 【详解】(1)由题意知:6x =, 3.4y =于是:211256 3.40.520056b -⨯⨯==-⨯, 3.40.560.4a =-⨯=,故:所求回归方程为0.50.4y x =+;(2)由于变量y 的值随着x 的值增加而增加(0.50)b =>,故变量x 与y 之间是正相关 (3)将11x =带入回归方程可以估计他的年推销金额为0.5110.4 5.9y =⨯+=万元. 【点睛】本题考查回归分析的初步应用,考查利用最小二乘法求线性回归方程,是一个综合题目. 17.有99%的把握认为“患桑毛虫皮炎病与采桑”有关系.认为两者有关系会犯错误的概率是1%. 【分析】本题先求合计的4个值,再根据公式计算随机变量,接着比较数值大小,判断即可. 【详解】1112212218,12,5,78n n n n ====,所以121230,83,23,90,113n n n n n ++++=====. 所以()21122122121212n n n n n n n n n χ++++-=2113(1878512)39.6 6.63530832390⨯⨯-⨯=≈>⨯⨯⨯.所以有99%的把握认为“患桑毛虫皮炎病与采桑”有关系.认为两者有关系会犯错误的概率是1%. 【点睛】本题考查独立性检验,是基础题18.(1)14%;(2)有;(3)能,理由见解析 【分析】(1) 由500位老年人中有40+30=70位需要志愿者提供帮助,即可求出需要志愿者提供帮助的老年人的比例;(2)通过列联表计算29.967K =,即可得出结论;(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,应该采用分层抽样的方法. 【详解】解:(1)∵调查的500位老年人中有40+30=70位需要志愿者提供帮助, ∴该地区老年人中需要帮助的老年人的比例的估算值为14%=.(2)根据列联表所给的数据,代入随机变量的观测值公式,29.967K =.∵9.967 6.635>,∴有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好. 【点睛】本题主要考查列联表,考查独立性检验的应用,同时考查了运算求解的能力,分析问题和解决问题的能力,难度一般. 19.(1)答案见解析.(2)96 【分析】(1)根据表中所给数据,计算出||r ,即可求得答案.(2)每小时加工零件的数量,即60x =,将60x =代入ˆ0.65757yx =+,即可求得答案. 【详解】(1)由表中数据得:6117950i ii x y==∑,6219100i i x ==∑,62139158i i y ==∑,35,80x y ==∴0.05||0.997r r ==>从而有95%的把握认为x 与y 之间具有线性相关关系,∴此求回归直线方程是有意义的.计算得:ˆˆ0.657,57ba== ∴ˆ0.65757yx =+ (2)每小时加工零件的数量,即60x =将60x =代入ˆ0.65757y x =+ ˆ96.42y= 故每小时加工零件的数量额定为96比较合理 【点睛】本题考查回归直线方程以及应用,考查基本分析与求解能力,属基本题.20.(1)ˆ 6.6138.6yx =- (2)①用非线性回归模型拟合效果更好;②190个 【分析】(1)求出x 、y 后代入公式直接计算得ˆb、ˆa ,即可得解; (2)求出线性回归模型的相关指数,与0.9522比较即可得解;(3)直接把35x =代入0.2303ˆ0.06x ye =,计算即可得解. 【详解】(1)由题意6n =,则611266i i x x ===∑,611336i i y x ===∑,61621()()557ˆ 6.684()iii ii x x y y bx x ==--==≈-∑∑,ˆ33 6.626138.6a =-⨯=-, y 关于x 的线性回归方程为ˆ 6.6138.6yx =-. (2)①对于线性回归模型,621()3930ii y y =-=∑,621()236.64i i i y y =-=∑,相关指数为621621()1()iii ii y y y y ==---∑∑236.6413930=-10.06020.9398≈-= 因为0.93980.9522<,所以用非线性回归模型拟合效果更好.②当35x =,时0.230335ˆ0.06ye ⨯=8.06050.06e =⨯0.063167190.02190=⨯=≈(个) 所以温度为35C ︒时,该种药用昆虫的产卵数估计为190个. 【点睛】本题考查了线性回归方程的求解、相关指数的应用以及非线性回归方程的应用,考查了计算能力,属于中档题.21.列联表见解析,有99.9%的把握说选科与性别有关. 【分析】选物理的男生38人,则女士12人,选历史的男生14人,则女士36人,即可完成22⨯列联表,做出假设0H :选科与性别没有关系,再由表中数据计算2K 的观测值,可得观测值大于10.828,所以在犯错误的概率不超过0.001的前提下认为选科与性别有关系,即有99.9%的把握有关系. 【详解】列出22⨯列联表如下:提出假设0:选科与性别没有关系. 根据列联表中的数据计算2K的观测值2100(38361412)30023.0775248505013k ⨯⨯-⨯==≈⨯⨯⨯.因为10.828k ≥,所以有99.9%的把握说选科与性别有关. 【点睛】本题考查独立性检验的基本应用,属于中档题.22.(1)作图见解析(2)线性回归方程为:^6.517.5y x =+,预测当广告费支出为1千万时销售额为8250万 【分析】(1)根据表格中的数据,描点作图即可;(2)根据求线性回归方程的公式,得到回归方程为 6.517.5y x =+,再根据数据预测即可. 【详解】 (1)散点图如下:(2)1(24568)55x =++++=,1(3040605070)505y =++++=, 512304405606508701380i ii x y==⨯+⨯+⨯+⨯+⨯=∑,521416253664145ii x==++++=∑,138055506.5145525b -⨯⨯==-⨯所以505 6.517.5a y bx =-=-⨯=, 故线性回归方程为: 6.517.5y x =+,当10x =时,82.5y =.故当广告费支出为1千万时销售额为8250万. 【点睛】本题考查了线性回归方程的求解及预测问题,考查了学生实际应用,数学运算的能力,属于中档题.23.(1)散点图见解析(2)1.23,0.08(3)12.38 【分析】(1)根据统计表,在平面直角坐标系中以x 为横坐标,以y 为纵坐标,作出点()()()()()2,2.2,3,3.8,4,5.5,5,6.5,6,7 可得散点图.(2)由表中数据先出x ,y ,51i ii x y =∑,521ii x =∑,然后根据公式求出b ,a .(3)由(2)知回归直线方程是 1.2308ˆ.0yx =+,再将10x =代入回归方程求解. 【详解】(1)根据统计表,在平面直角坐标系中以x 为横坐标,以y 为纵坐标,作出点()()()()()2,2.2,3,3.8,4,5.5,5,6.5,6,7 得散点图如下:(2)由上表知:2345645x ++++==,2.23.8 5.5 6.5755y ++++==512 2.23 3.83 5.54 6.567112.3i i ix y ==⨯+⨯+⨯+⨯+⨯=∑ 522222212345690i ix ==++++=∑51522215112.35451.2390545()i i i i ix y xyb x x ==--⨯⨯∴===-⨯-∑∑0.08a y bx ∴=-=(3)由(2)得 1.2308ˆ.0yx =+ 所以 1.23100.0812.3ˆ8y=⨯+= 所以估计使用年限为10年时,维修费用是12.38万元. 【点睛】本题主要考查散点图的画法和线性回归方程,还考查了数据处理的能力,属于难题. 24.(1) 0.020.7x y e +=. (2) 正常的. 【分析】 (1)先求得x 及521ii x=∑,即可求得52215i i xx =-∑.代入线性回归方程中即可求得ˆb.再由ˆˆav b μ=-即可求得ˆa ,进而得回归方程. (2)根据回归方程及参考数据,即可求得该男生的体重,进而判断该体重是否位于平均值的1.2倍与0.8倍之间. 【详解】 (1)由已知可得80x =,()522221100671033000i i x ==⨯+++=∑∴5221533000320001000i i xx =-=-=∑又()51ln 940iii x y =⋅=∑,11.52.35v == ∴9405 2.380ˆ0.021000b-⨯⨯== ˆ 2.30.02800.7a=-⨯= 所以ln 0.020.7y x =+ ∴回归方程为:0.020.7x y e +=(2)当150x =时, 3.7ˆ40.5ye =≈, 而40.5 1.248.645⨯=>,40.50.832.445⨯=<,∴这一在校男生的体重是正常的. 【点睛】本题考查了非线性回归方程在实际问题中的应用,计算量较为复杂,需要耐心计算,属于中档题.25.(1) 1.2308ˆ.0yx =+ (2) 14.84万元 【分析】(1)由已知表格中的数据求得,x y 进而求得b 与a 的值,则线性回归方程可求; (2)在(1)中求得的线性回归方程中,取x =12求得y 值即可. 【详解】 (1)由表可得1(23456)45x =++++=,1(2.2 3.8 5.5 6.57.0)55y =++++= 51112.3i i i x y ==∑,52190i i x ==∑,5152215112.3545ˆ 1.23905165i ii ii x yx ybxx =-=-⋅-⨯⨯===-⨯-∑∑ˆˆ5 1.2340.08ay bx =-=-⨯=,所求线性回归方程为 1.2308ˆ.0y x =+ (2)当12x =时,ˆ 1.23120.0814.84y=⨯+=,即使用12年的车的总费用大概为14.84万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题.26.(1)43 ,55;(2)能有95%的把握认为男、女顾客对该商场服务的评价有差异.【分析】(1)从题中所给的22⨯列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;(2)利用公式求得观测值与临界值比较,得到能有95%的把握认为男、女顾客对该商场服务的评价有差异.【详解】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为1404 505P==, 50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为2303 505P==,(2)由列联表可知22100(40203010)1004.762 3.8417030505021K⨯-⨯==≈>⨯⨯⨯,所以能有95%的把握认为男、女顾客对该商场服务的评价有差异.【点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算2K的值,独立性检验,属于简单题目.。
人教版高中数学选修三第三单元《成对数据的统计分析》测试题(含答案解析)
一、选择题1.下列说法正确的是( )A .若残差平方和越小,则相关指数2R 越小B .将一组数据中每一个数据都加上或减去同一常数,方差不变C .若2K 的观测值越大,则判断两个分类变量有关系的把握程度越小D .若所有样本点均落在回归直线上,则相关系数1r = 2.由一组样本数据()()()1122,,,,,,n n x y x y x y 得到的回归直线方程为ˆybx a =+,那么下面说法不正确是( )A .直线ˆybx a =+必经过点(,)x y B .直线ˆybx a =+至少经过点()()()1122,,,,,,n n x y x y x y 中的一个C .直线ˆybx a =+的斜率为2121ni i i i n i y nxy xx x n ==--∑∑D .直线ˆybx a =+和各点()()()1122,,,,,,n n x y x y x y 的总偏差()21ni i i y bx a =-+⎡⎤⎣⎦∑是该坐标平面上所有直线与这些点的偏差中最小的直线 3.根据最小二乘法由一组样本点(),i i x y (其中1,2,,300i =),求得的回归方程是ˆˆˆybx a =+,则下列说法正确的是( ) A .至少有一个样本点落在回归直线ˆˆˆy bx a =+上B .若所有样本点都在回归直线ˆˆˆy bx a =+上,则变量同的相关系数为1C .对所有的解释变量i x (1,2,,300i =),ˆˆibx a +的值一定与i y 有误差 D .若回归直线ˆˆˆy bx a =+的斜率ˆ0b>,则变量x 与y 正相关 4.已知变量,x y 之间满足线性相关关系ˆ 1.31yx =-,且,x y 之间的相关数据如下表所示:则实数m =( ) A .0.8B .0.6C .1.6D .1.85.下列说法中正确的是( )A .“a b >”是“22a b >”成立的充分不必要条件B .命题:,20x p x R ∀∈>,则00:,20xp x R ⌝∃∈<C .为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为40D .已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为^ 1.230.08y x =+.6.变量y 与x 的回归模型中,它们对应的相关系数r 的值如下,其中拟合效果最好的模型是( ) 模型1 2 3 4 r0.480.150.960.30A .模型1B .模型2C .模型3D .模型47.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62kg ,他的曾祖父、祖父、父亲、儿子的体重分别为58kg 、64kg 、58kg 、60kg .如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x 与预报变量y 的回归方程为y bx a =+,其中0.5b =,据此模型预测他的孙子的体重约为( )A .58kgB .61kgC .65kgD .68kg8.下列说法:①2χ越小,X 与Y 有关联的可信度越小;②若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;③“若x ∈R ,则111x x <⇒-<<类比推出,“若z C ∈,则111z z <⇒-<<;④命题“有些有理数是无限循环小数,整数是有理数,所以整数是无限循环小数”是假命题,推理错误的原因是使用了“三段论”,推理形式错误.其中说法正确的有( )个 A .0B .1C .2D .39.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),甲图为选取的15名志愿者身高与臂展的折线图,乙图为身高与臂展所对应的散点图,并求得其回归方程为 1.160.5ˆ37yx =-,以下结论中不正确的为( )A .15名志愿者身高的极差小于臂展的极差B .15名志愿者身高和臂展成正相关关系,C .身高相差10厘米的两人臂展都相差11.6厘米,D .可估计身高为190厘米的人臂展大约为189.65厘米10.已知具有线性相关的五个样本点()10,0A ,()22,2A ,()33,2A ,()44,2A ,()56,4A ,用最小二乘法得到回归直线方程1l :y bx a =+,过点1A ,2A 的直线方程2l :y mx n =+,那么下列4个命题中,①m b >,a n >;②直线1l 过点3A ;③()()552211iiiii i y bx a y mx n ==--≥--∑∑;④5511iiiii i y bx a y mx n ==--≥--∑∑,正确命题的个数有( ) A .1个B .2个C .3个D .4个11.在某次试验中,实数x ,y 的取值如下表:x0 1 3 5 6 y 1.3m2m5.67.4若x 与y 之间具有较好的线性相关关系,且求得线性回归方程为1y x =+,则实数m 的值为() A .1.6B .1.7C .1.8D .1.912.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:根据图中的信息,下列结论中不正确的是( ) A .样本中的男生数量多于女生数量 B .样本中喜欢手机支付的数量多于现金支付的数量C .样本中多数男生喜欢手机支付D .样本中多数女生喜欢现金支付13.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱二、解答题14.新冠肺炎疫情期间,各地均响应“停课不停学,停课不停教”的号召开展网课学习.为检验网课学习效果,某机构对2000名学生进行了网上调查,发现有些学生上网课时有家长在旁督促,而有些没有网课结束后进行考试,根据考试结果将这2000名学生分成“成绩上升”和“成绩没有上 升”两类,对应的人数如下表所示:成绩上升 成绩没有上升 合计有家长督促的学生500800没有家长督促的学生 500没有家长督促的学生2000(1)完成以上列联表,并通过计算(结果精确到0.001)说明,是否有90%的把握认为家长督促学生上网课与学生的成绩上升有关联(2)从有家长督促的800名学生中按成绩是否上升,采用分层抽样的方法抽出8人,再从8人中 随机抽取 3人做进一步调查,记抽到3名成绩上升的学生得1分,抽到1名成绩没有上升的学生得1-分,抽到3名生的总得分用X 表示,求X 的分布列和数学期望.附:()()()()()22,n ad bc K n a b c d a b c d a c b d -==+++++++ ()20P K k ≥ 0.100 0.050 0.010 0.0010k2.7063.841 6.835 10.82815.疫苗能够使人体获得对病毒的免疫力,是保护健康人群最有效的手段.新冠肺炎疫情发生以来,军事医学科学院陈薇院土领衔的团队开展应急科研攻关,研制的重组新型冠状病毒疫苗(腺病毒载体),于4月12日开始招募志愿者,进入二期临床试验.根据普遍规律,志愿者接种疫苗后体内会产生抗体,人体中检测到抗体,说明有抵御病毒的能力.科研人员要定期从接种疫苗的志愿者身上采集血液样本,检测人体中抗体含量水平(单位:miu/mL ,百万国际单位/毫升).(1)IgM 作为人体中首先快速产生的抗体,是人体抗感染免疫的“先头部队”.经采样分折,志愿者身体中IgM 含量水平()miu/mL y 与接种天数x (接种后每满24小时为一天,*x N ∈)近似满足函数关系:100.1,10,10xx x y e x -≤⎧=⎨>⎩,经研究表明,IgM 含量水平不低于0.2miu/mL 时是免疫的有效时段,试估计接种一次后IgM 含量水平有效时段可经历的时间(向下取整).(参考数据: 2.718e ≈)(2)IgG 虽然是接种后产生比较慢的抗体,却是血清和体液中含量最高的抗体,也是亲和力最强、人体内分布最广泛、具有免疫效应的抗感染“主力军”.科研人员每间隔3天检测一次(检测次数依次记为i t ,1,2,3,4,5,6,7i =)某志愿者人体中IgG 的含量水平,记作()()miu/mL 1,2,3,4,5,6,7i z i =,得到相关数据如下表:①请画出散点图,并根据散点图判断线性拟合模型与指数拟合模型·t z c d =哪种更适合拟合z 与t 的关系(不必说明理由);②研究人员发现,上述数据中存在一组异常数据应当予以剔除.试根据余下的六组数据,利用①中选择的拟合模型计算回归方程,并估计原异常数据对应的i z 值.附:回归系数与估计值均保留两位小数,由七组数据计算出的参考数据见下表,其中ln u z =.参考公式:线性回归直线ˆˆya bx =+的斜率和截距的最小二乘估计分别为:2()()ˆ()ii ix x y y bx x --=-∑∑,a y bx =-16.某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i 位学生的成绩为(i i x y ,) (i =1,2,3...20),其中i i x y ,分别为第i 位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):物理总评成绩y 96 90 8987 92 81 86 88 83 84 序号11 12 13 14 15 16 17 18 19 20 数学总评成绩x 83 82 81 80 80 79 78 77 75 74 物理总评成绩8180 8285807879818078(1)根据统计学知识,当相关系数|r |≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:20202022111()()485.()678.()476iiii i i i x x y y x x y y ===--=-=-=∑∑∑参考公式:相关系数12211()().()()niii n niii i x x y y r x x x y ===--=--∑∑∑(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X 表示这2名学生两科赋分的和,求X 的分布列和数学期望.17.某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x (单位:千万元)对年销售量y (单位:千万件)的影响,统计了近10年投入的年研发费用i x 与年销售量()1210i y i =⋯,,的数据,得到散点图如图所示.(1)利用散点图判断y a bx =+和·d y c x =(其中c d ,均为大于0的常数)哪一个更适合作为年销售量y 和年研发费用x 的回归方程类型(只要给出判断即可,不必说明理由) (2)对数据作出如下处理,令,i i i i u lnx v lny ==,得到相关统计量的值如下表:根据第(1)问的判断结果及表中数据,求y 关于x 的回归方程;101i i v =∑101ii u=∑()()101iii u u v v =--∑()1021i i u u =-∑151528.2556.5(3)已知企业年利润z(单位:千万元)与x y,的关系为349182z e y x=--(其中271828e≈.),根据第(2)问的结果判断,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?附:对于一组数据()()()1122,,,n nu v u v u v⋯,,,,其回归直线ˆˆˆv uαβ=+的斜率和截距的最小二乘估计分别为()()()121ni iiniiu u v vu uβ==--=-∑∑,ˆa v uβ=-18.某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).(1)根据以上数据完成下列22⨯列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.参考公式和数据:22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k0.150.100.050.0250.0100.0050.001 0k 2.072 2.706 3.841 5.024 6.6357.87910.82819.忽如一夜春风来,翘首以盼的5G 时代,已然在全球“多点开花”,一个万物互联的新时代,即将呈现在我们的面前.为更好的满足消费者对流量的需求,中国电信在某地区推出六款不同价位的流量套餐,每款套餐的月资费x (单位:元)与购买人数y (单位:万人)的数据如表:对数据作初步的处理,相关统计量的值如表:其中ln i i v x =,ln i i y ω=,且绘图发现,散点(),i i v ω(6l i ≤≤)集中在一条直线附近. (1)根据所给数据,求y 关于x 的回归方程;(2)按照某项指标测定,当购买人数y 与月资费x 的比在区间,97e e ⎛⎫⎪⎝⎭内,该流量套餐受大众的欢迎程度更高,被指定为“主打套餐”,现有一家三口从这六款套餐中,购买不同的三款各自使用.记三人中使用“主打套餐”的人数为X ,求随机变量X 的分布列和期望. 附:对于一组数据()11,v ω,()22,v ω,…,()33,v ω,其回归直线bv a ω=+的斜率和截距的最小二乘估计值分别为1221ni ii nii v nv b vnvωω==-=-∑∑,a bv ω=-.20.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿帮助的老年人的比例?说明理由.21. 2.5PM 的值表示空气中某种颗粒物的浓度,通常用来代表空气的污染情况,这个值越高,空气污染越严重,下表是某城市开展“绿色出行,健康生活”活动,居民每天采用“绿色出行”的人数与 2.5PM 值的一组数据:(1)已知“绿色出行”的人数x 和 2.5PM 值y 有线性相关性,求y 关于x 的线性回归方程;(计算结果保留两位小数)(2)若某日“绿色出行”的人数为10万人,请预测该市 2.5PM 的值.(计算结果保留一位小数) 参考公式:1221ˆˆ,ni ii nii x y nx yba y bxxnx ==-⋅==--∑∑22.某中学为研究学生的身体素质与体育锻炼时间的关系,对该校100名高三学生平均每天体育锻炼时间进行调查,其中女生为55人,如表:(平均每天锻炼的时间单位:分钟)将学生日均体育锻炼时间在[40,60]的学生评价为“锻炼达标”.(1)若女生锻炼达标人数为10人,通过计算判断,是否能在犯错误的概率不超过0.025的前提下认为“锻炼达标”与性别有关?(2)在(1)的条件下“锻炼达标”的学生中,按男女用分层抽样方法抽出15人,进行体育锻炼体会交流,求这15人中,男生、女生各有多少人?参考公式:22()()()()()()a b c d ad bc K a b c d a c b d +++-=++++临界值表:20()P K k ≥0.05 0.025 0.010 0k3.8415.0246.63523.某品牌汽车4S 店为对厂家研发的一种辅助产品进行合理定价,对该产品进行试销售,如图1.在试销售期间对100名顾客进行回访,由客户对该产品性能作出“满意”或“不满意”评价,如图2.(1)判断能否有99%的把握认为“客户购买产品对产品性能满意之间有关”? (2)请结合数据:()()6634580iii x x y y =--=∑,()()66175.5iii x x zz =--=-∑,()()663465.2i i i y y z z =--=∑,()626776840i i y y=-=∑,求y 与x 的回归方程(精确到0.1)24.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,计算得10180i i x ==∑,10120i i y ==∑,101184i i i x y ==∑,1021720ii x==∑.(1)求家庭的月储蓄y 关于月收入x 的线性回归方程y bx a =+,并判断变量x 与y 之间是正相关还是负相关;(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.(注:线性回归方程y bx a =+中,1221ni ii nii x y nx yb xnx==-⋅=-∑∑,其中x ,y 为样本平均值.)25.某品牌新款夏装即将上市,为了对新款夏装进行合理定价,在该地区的三家连锁店各进行了两天试销售,得到如下数据:(1)分别以三家连锁店的平均售价与平均销量为散点,如A 店对应的散点为(83,83),求出售价与销量的回归直线方程y bx a =+;(2)在大量投入市场后,销量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该新夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)附:121()()()niii ni i xx y y b x x ==--=-∑∑,a y bx =-.26.为了解某班学生喜爱打篮球是否与性别有关,对本班45人进行了问卷调查得到了如下的列联表:已知在全部45人中随机抽取1人,是男同学的概率为59(1)请将上面的列联表补充完整;(2)是否有99.9%的把握认为喜爱打篮球与性别有关,请说明理由.附参考公式:22()()()()()n ad bc K n a b c d a b c d a c b d -==+++++++,【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】由残差平方和越小,模型的拟合效果越好,可判断A;由方差的性质可判断B;由的随机K的观测值的大小可判断C;由相关系数r的绝对值趋近于1,相关性越强,可判断变量2D.【详解】对于A,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,相关指数2R越大,故A错误;对于B,将一组数据的每一个数据都加上或减去同一常数后,由方差的性质可得方差不变,故B正确;K的观测值越大,“X与Y有关系”的把握对于C,对分类变量X与Y,它们的随机变量2程度越大,故C错误;r=,故D错误.对于D,若所有样本点均落在回归直线上,则相关系数1故选:B.【点睛】本题考查命题的真假判断,主要是线性回归直线的特点和线性相关性的强弱、样本数据的特征值和模型的拟合度,考查判断能力,属于基础题.2.B解析:B【分析】根据最小二乘法和回归直线的意义可依次判断各个选项得到结果.【详解】对于A ,回归直线必过样本中心点,即ˆybx a =+必过(),x y ,A 正确; 对于B ,回归直线描述样本点的变化趋势和相关关系,未必经过样本点,B 错误;对于C ,由最小二乘法知:1221ˆni i i i ni y nx x n b y xx ===--∑∑,C 正确;对于D ,回归直线是所有直线中与样本点离散度最低的,由此可知回归直线的总偏差()21n i i i y bx a =-+⎡⎤⎣⎦∑是该坐标平面上所有直线与这些点的偏差中最小的,D 正确.故选:B . 【点睛】本题考查回归直线部分相关命题的辨析,关键是充分理解回归直线的意义,掌握最小二乘法求解回归直线的方法.3.D解析:D 【分析】对每一个选项逐一分析判断得解. 【详解】回归直线必过样本数据中心点,但样本点可能全部不在回归直线上﹐故A 错误;所有样本点都在回归直线ˆˆˆybx a =+上,则变量间的相关系数为1±,故B 错误; 若所有的样本点都在回归直线ˆˆˆy bx a =+上,则ˆˆbx a +的值与y i 相等,故C 错误; 相关系数r 与ˆb符号相同,若回归直线ˆˆˆy bx a =+的斜率ˆ0b >,则0r >,样本点分布应从左到右是上升的,则变量x 与y 正相关,故D 正确. 故选D . 【点睛】本题主要考查线性回归方程的性质,意在考查学生对该知识的理解掌握水平和分析推理能力.4.D解析:D 【解析】分析:由题意结合线性回归方程的性质整理计算即可求得最终结果. 详解:由题意可得:12345 2.542x +++===,0.1 3.14 1.844m m y +++==+, 线性回归方程过样本中心点,则:1.8 1.3 2.514m+=⨯-, 解得: 1.8m =. 本题选择D 选项.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.5.D解析:D 【解析】对于A ,取1a =-,2b =时,不能推出22a b >,故错误;对于B ,命题:,20x p x R ∀∈>的否定为00,20xx R ∃∈≤,故错误;对于C ,为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为8004020÷=,故错误;对于D ,因为回归直线的斜率的估计值为1.23,所以回归直线方程可写成 1.23y x a =+,根据回归直线方程过样本点的中心()4,5,则0.08a =,所以回归直线方程为 1.2308ˆ.0yx =+,故正确. 故选D.6.C解析:C 【分析】根据相关系数的性质,r 的绝对值最大,则其拟合效果最好,进行判断即可. 【详解】线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小,∵模型3的相关系数r 最大,∴模拟效果最好, 故选C . 【点睛】本题主要考查线性回归系数的性质,在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.7.B解析:B 【分析】由已知得出数据,()58,58,()64,62,()58,60,根据回归直线过样本中心点,可求得(),x y ,计算求得a ,代入62x =,即可得出结果.【详解】由已知,体重是隔代遗传,且呈线性相关,得出数据,()58,58,()64,62,()58,60, 所以()(),=60,60x y ,代入y bx a =+,其中0.5b =,求得=30a , 即0.530y x =+.62x =时, 0.56230y =⨯+=61.故选:B 【点睛】本题主要考查线性回归方程的相关计算,考查学生分析问题的能力,属于中档题.8.C解析:C 【分析】因为2χ越大,X 与Y 有关联的可信度越大,可判断①;两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,可判断②;虚数不能比较大小可判断③;大前提“有些有理数是无限循环小数”不是全称命题,故可判断④. 【详解】①中因为2χ越大,X 与Y 有关联的可信度越大,所以2χ越小,X 与Y 有关联的可信度越小,正确;②中因为若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故错误; ③中因为虚数不能比较大小,可知111z z <⇒-<<错误;④中因为大前提的形式:“有些有理数是无限循环小数”,不是全称命题,故推理形式错误判断正确. 故选:C 【点睛】本题主要考查了独立性检验,线性回归,类比推理,三段论推理,属于中档题.9.C解析:C 【分析】对于A ,身高极差大约是25,臂展极差大于等于30,故A 正确; 对于B ,很明显根据散点图以及回归方程得到,故B 正确;对于C ,身高相差10厘米的两人展臂的估计值相差11.6厘米,但不是准确值,故C 错误;对于D ,身高为190厘米,代入回归方程可得展臂等于189.65厘米,但不是准确值,故D 正确.【详解】对于A ,身高极差大约是25,臂展极差大于等于30,故A 正确;对于B ,很明显根据散点图以及回归方程得到,身高矮展臂就会短一些,身高高一些, 展臂就会长一些,故B 正确;对于C ,身高相差10厘米的两人展臂的估计值相差11.6厘米,但不是准确值,回归方程上的点并不都是准确的样本点,故C 错误;对于D ,身高为190厘米,代入回归方程可得展臂等于189.65厘米,但不是准确值,故D 正确.故选:C . 【点睛】本题主要考查相关关系,考查回归方程及其应用,意在考查学生对这些知识的理解掌握水平.10.B解析:B 【分析】先求出1l 为0.60.2y x =+,直线2l 的方程为y x =,再逐一分析判断每一个命题真假得解. 【详解】 由题意可得:0234635x ++++==,0222425y ++++==,则()()()1210.6niii nii x x y y b x x ==--==-∑∑,0.2a y bx =-=,所以线性回归方程1l 为0.60.2y x =+, 直线2l 的方程为:y x =,故0.6b =,0.2a =,1m =,0n =,说法①正确;30.60.22⨯+=,则直线1l 过3A ,说法②正确;()5210.8iii y bx a =--=∑,()5219i i n y mx n =--=∑,说法③错误;511.6iii y bx a =--=∑,515iii y mx n =--=∑,说法④错误;综上可得正确命题的个数有2个. 故选:B. 【点睛】本题主要考查最小二乘法求线性回归方程,考查和式的计算,意在考查学生对这些知识的理解掌握水平.11.D解析:D 【分析】根据线性回归方程必过点(),x y ,可求出m 的值. 【详解】 因为14.333,5m x y +== 所以14.333145m+=+=,解得 1.9m = 故选D. 【点睛】本题主要考查了线性回归方程,样本中心点,属于容易题.12.D解析:D 【详解】由右边条形图知,男生女生喜欢手机支付的比例都高于现金支付的比例,所以男生女生都喜欢手机支付,故C 对,D 错,由左边条形图知,男生女生手机支付都比现金支付比例相同,B 对,结合两个条形图可知,样本中的男生数量多于女生数量,A 对,故选D.13.A解析:A 【分析】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选A. 【点睛】该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.二、解答题14.(1)列联表见解析,有90%的把握认为家长督促学生上网课与学生的成绩上升有关联;(2)分布列见解析,数学期望为34. 【分析】(1)根据已知数据计算2K 的值,看是否大于190%10%-=的临界值,即可做出判定结论;(2)利用超几何分布公式求出分布列,并利用期望的定义计算期望值. 【详解】 (1)成绩上升 成绩没有上升 合计()22000500500300700125 3.472 2.7068001200120080036K ⨯-⨯==≈>⨯⨯⨯∴有90%的把握认为家长督促学生上网课与学生的成绩上升有关联.(2)从有家长督促的800名学生中按成绩是否上升,采用分层抽样的方法抽出8人,其中成绩上升的有5人,成绩没有上升的有3人,再从8人中随机抽取3人,随机变量X 所有可能的取值为3,1,1,3--()0353381356C C P X C ⋅=-==()12533815156C C P X C ⋅=-==()21533815128C C P X C ⋅=== ()3053385328C C P X C ⋅=== X ∴的分布列如下: ()3113565656564E X =-⨯-⨯+⨯+⨯= 【点睛】方法点睛:本题考查了独立性检验,考查了超几何分布,考查了离散型随机变量分布列和数学期望的计算,求解离散型随机变量分布列的步骤是: 首先确定随机变量X 的所有可能取值;计算X 取得每一个值的概率,可通过所有概率和为1来检验是否正确; 进行列表,画出分布列的表格;最后扣题,根据题意求数学期望或者其它.15.(1)11天;(2)①见解析,指数拟合模型·t z c d =适合拟合z 与t 的关系;②1.55 【分析】(1)由函数的单调性可知10x ≤时,0.1y x =单调递增,10x >时,10-=xy e 单调递减,得到10x =时,y 达到峰值,再由100.2-<x e 求解不等式得答案; (2)①画出散点图,根据图像可得答案;②求出对于的ˆb 与ˆa 的值,可得z 关于t 的回归方程,通过回归方程估计异常数据.【详解】 解:(1)10x ≤时,0.1y x =单调递增,10x >时,10-=x y e 单调递减,得到10x =时,y 达到峰值,由100.2-<x e 得110ln 0.2lnln 55x -<==-, 10ln5x ∴>+,因为1ln52<<, 11x ∴>,所以估计接种一次后IgM 含量水平有效时段可经历的时间为11天; (2)①散点图如下:根据散点图判断指数拟合模型·t z c d =更适合拟合z 与t 的关系; ②根据散点图可得第4组数据异常,应当予以剔除 由·t z c d =得()ln ln ln ln tu z cdc td ===+6611662222222222110.67 1.58()()39.874 4.85646ˆ0.3512356764()ii i i i i iii i tt u u t unt ubtt tnt ====⨯----⋅-⨯-⨯⨯∴===≈+++++-⨯--∑∑∑∑,0.67 1.580.3540.966a u bt ⨯-=-=-⨯=-, 故ln 0.960.35u z t ==-+, 0.960.35t z e -+∴=当4t =时,0.960.3540.444 1.55z ee -+⨯===估计原异常数据对应的4z 值为1.55. 【点睛】方法点睛:(1)正确理解计算ˆb与ˆa 的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程ˆˆˆy a bx=+必过样本点中心(),x y . 16.(1)“数学学期综合成绩”与“物理学期综合成绩”高度相关;答案见解析;(2)分布列见解析,95. 【分析】(1)代入公式计算,解得0.8r >即可得解;(2)由超几何分布概率公式计算出(0)P X =、(1)P X =、(2)P X =、(3)P X =、(4)P X =,进而可得分布列,再由数学期望的公式即可得数学期望.【详解】(1)由题意,20()()ii xx y y r --==∑6260.87.515>==>=⨯=, 所以“数学学期综合成绩”与“物理学期综合成绩”高度相关; (2) 由题意得:X 的可能取值为0,1,2,3,4.,根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,所以9222036(0)190C P X C ===,49112203619(1)0C C P X C ===,2112204791609(29)C C C P X C +===,114722023810(9)C C P X C ===,27220(4)21190C P X C ===,所以X 的分布列为:所以190190190()012341901901905E X =⨯+⨯+⨯+⨯+⨯==. 【点睛】关键点点睛:解决本题的关键是对r 的值合理放缩及超几何分布的应用. 17.(1) 选择dy c x =⋅更合适;(2) y =. (3) 要使年利润取最大值,预计下一年应投入4千万元的研发费用 【分析】(1)根据散点图分布,可知更符合指数型模型,可得结果;(2)对d y c x =⋅两边取倒数,得到ln v c du =+,采用最小二乘法可求得d 和ln c ,从而得到结果;(3)由(2)可得()92z x x =,利用导数可判断出()z x 单调性,可知当4x =时,()z x 取最大值,从而得到结果. 【详解】(1)由散点图知,选择dy c x =⋅更合适(2)对d y c x =⋅两边取对数,得ln ln ln y c d x =+,即:ln v c du =+ 由表中数据得32u v ==28.25156.52d ∴== 令ln c m =,则31332224m v du =-=-⨯=,即34c e = ∴年销售y 和年研发费用x 的回归方程为:y =(3)由(2)知,()92z x x =,则()92z x =' 令()0z x '=,得4x =当()0,4x ∈时,()0z x '>;当()4,x ∈+∞时,()0z x '<()z x ∴在()0,4上单调递增;在()4,+∞上单调递减∴当4x =千万元时,年利润z 取得最大值,且最大值为:()418z =千万元 1.8=亿元 ∴要使年利润取最大值,预计下一年应投入4千万元的研发费用【点睛】本题考查统计中的数据的相关性的问题,涉及到非线性回归模型方程的求解、利用导数求解函数的最值的问题;解题关键是能够将非线性回归模型转化为线性回归模型,从而利用最小二乘法求得回归模型.18.(1)列联表见解析;(2)有,详见解析 【分析】(1)根据表格所给数据填写22⨯列联表.(2)计算210 6.635K =>,由此判断有99%的把握认为其亲属的饮食习惯与年龄有关. 【详解】(1)22⨯列联表如下:。
高中数学选修2-3 第三章 统计案例 章末检测题
高中数学选修2-3第三章 统计案例 章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( ) A .残差分析 B .回归分析 C .等高条形图D .独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为栏目优秀B .有99%的人认为栏目是否优秀与改革有关系C .有99%的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系【解析】由于K 2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.【答案】D3.已知一个线性回归方程为y ∧=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .58.5 B .46.5 C .60 D .75【解析】x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5【答案】A4.设有一个回归方程为y ∧=3-5x ,当变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位D .y 平均减少3个单位【解析】-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 【答案】B5.若由一个2×2列联表中的数据计算得K 2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )A .0.025B .0.01C .0.005D .0.001【解析】∵P (K 2>5.024)=0.025.又K 2=6.630>5.024,∴犯错误的最大概率为0.025. 【答案】A6.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变小C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强【解析】由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.【答案】B7.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:以下数据中,对于同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .A =5,b =4,c =3,d =2 B .A =5,b =3,c =4,d =2 C .A =2,b =3,c =4,d =5 D .A =2,b =3,c =5,d =4【解析】可计算|ad -bc|的值,值越大说明X 与Y 有关的可能性越大. 【答案】D8.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( )A .14B .15C .16D .17【解析】根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ∧≈-0.857,b ∧≈0.729,所以线性回归方程为y ∧=0.729x -0.857.当y ∧=10时,得x ≈15.【答案】B9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的【解析】由列联表可得:博士:男性占2735≈77%,女性占835≈23%,相差很大,所以性别与获取学位的类别有关,故选A.【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.30B .模型2的R 2为0.50C .模型3的R 2为0.75D .模型4的R 2为0.98 【解析】R 2越大,拟合效果越好. 【答案】D11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】将表中的五组数据分别代入选项验证,可知y =88+12x 最适合.【答案】C12.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么()1021i i y y=-∑的值为( )A .241.06B .2 410.6C .253.08D .2 530.8【解析】R 2=1-∑i =110(y i -y ∧i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110 (y i -y )2,得()1021i i y y=-∑=120.531-0.95=2 410.6.【答案】B二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)13.在两个变量的回归分析中,R 2=________,R 2的值越________________________________________________________________________,说明残差平方和越________,也就是说模型的拟合效果越________.【答案】1-∑i =1n(y i -y ∧i )2∑i =1n(y i -y )2大 小 好14.已知样本数为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ∧=0.3x +a ∧,则x ≈________,a ∧≈________.(精确到0.01)【解析】由题意,x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ∧,所以21411=0.3×51011+a ∧,可求得a ∧≈5.55. 【答案】46.36 5.5515.某单位为了了解用电量y (度)与气温x (°C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4°C 时,用电量的度数约为________.【解析】x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68. 【答案】6816.若两个分类变量X 与Y 的列联表为:则“X 与Y 【解析】由列联表数据,可求得随机变量K 2的观测值k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P(K 2≥6.635)≈0.01.所以“x 与y 之间有关系”出错的概率仅为0.01.【答案】0.01三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.【解析】根据题中数据得如下列联表:由列联表中的数据得k =900×(290×350-100×160)2450×450×390×510≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:(1)(2)求出机床运转的速度x 与每小时生产二级品数量y 的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?【解析】(1)散点图如下图所示:(2)易求得x =12.5,y =8.25,∴b ∧=∑i =14x i y i -4x y∑i =14x 2i -4x2≈0.728 6,a ∧=y -b ∧x =-0.857 5, 即所求回归直线的方程为:y ∧=0.728 6x -0.857 5.(3)根据公式,要使y ∧≤10, 只要0.728 6x -0.857 5≤10, 解得x ≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.19.(本小题满分12分)有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:其中,a ,15-a 均为大于50.10的前提下认为“X 与Y 之间有关系”?【解析】要使在犯错误的概率不超过0.10的前提下认为“X 与Y 之间有关系”,需要随机变量K 2的观测值大于2.706.∵a +(20-a )=20, (15-a )+(30+a )=45,a +(15-a )=15,(20-a )+(30+a )=50, a +(20-a )+(15-a )+(30+a )=65,则 K 2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)25 400>2.706,解之可得,a >7.19或a <2.04,而由原题知a >5且15-a >5,a ∈Z ,即a =6,7,8,9.故当a =8或9时,可在犯错误的概率不超过0.10的前提下认为X 和Y 之间有关系. 20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (2)请求出R 2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】(1)∑i =14x i y i =66.5,∑i =14x 2i =32+42+52+62=86,x =4.5,y =3.5b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7a ∧=y -b ∧x =3.5-0.7×4.5=0.35所求的线性回归方程为y ∧=0.7x +0.35 (2)计算得残差及偏差的数据如下表:从而得∑i =14(y i -y ∧i )2=0.05,∑i =14(y i -y )2=2.5所以R 2=1-∑i =14(y i -y ∧i )2∑i =14(y i -y )2=1-0.052.5=0.98.所以残差变量对预报变量的贡献率约为2%.21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人? 【解析】设男生人数为x ,依题意可得列联表如下:(1)则K 2>3.841, 由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关, 则K 2≤2.706,由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x2·x 2·x =38x ≤2.706,解得x ≤7.216, ∵x 2,x6为整数, ∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t =x 2,得到下表:再做出y 和t 的散点图(如图2),发现这些点分布在一条直线的附近,所以y 与t 线性相关,由公式可计算求得:b ∧=∑t i y i -7t y ∑t 2i -7t2≈0.37,a ∧=y -b ∧t =-204.90,于是y ∧=0.37t -204.90,故y 与x 之间的回归方程是y ∧=0.37x 2-204.90,当x =50时,代入可得y ∧=720.1,故由此可以估计温度在50°C 时的产卵数量大约为720个.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学选修2-3第三章《统计案例》测试题A卷考试时间:100分钟,满分:150分一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的,请把正确答案的代号填在题后的括号内(每小题5分,共50分)1.下列关于残差的叙述正确的是( )A.残差就是随机误差 B.残差就是方差 C.残差都是正数 D.残差可用来判断模型拟合的效果2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( ).A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这人有99%的概率患有肺癌C.在100个吸烟者中可能一个患肺癌的人也没有D.在100个吸烟者中一定有患肺癌的人3.如果有95%的把握说事件A和B有关系,那么具体计算出的数据( ) A.K2>3.841 B.K2<3.841 C.K2>6.635 D.K2<6.635 4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( )A.b与r的符号相同 B.a与r的符号相同 C.b与r的符号相反 D.a 与r的符号相反5.已知x与y之间的一组数据:x 012 3y m 3 5.57已求得关于y与x的线性回归方程y=2.1x+0.85,则m的值为( )A.1 B.0.85 C.0.7 D.0.56.下面关于K2说法正确的是( )A.K2在任何相互独立的问题中都可以用于检验有关还是无关B.K2的值越大,两个事件的相关性就越大C.K2是用来判断两个分类变量是否相关的随机变量,当K2的值很小时可以推断两类变量不相关D.K2的观测值的计算公式是K2=()()()()()n ad bca b c d a c b d-++++7.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)423 5销售额y(万元)49263954根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元8.下表是关于出生男婴与女婴调查的列联表:晚上 白天男婴 45A女婴 E35总计98D那么A =________,B =________,C =________,D =________,E =________.( )A .47 92 88 82 55B .47 92 84 82 53C .47 92 88 82 53D .45 92 88 82 539.在建立两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合得最好的模型为( )A .模型1的相关指数R 2为0.75 B .模型2的相关指数R 2为0.90 C .模型3的相关指数R 2为0.25 D .模型4的相关指数R 2为0.55 10.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归方程为y ^=b ^x +a ^必过样本点的中心(x -,y -) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.9362,则变量y 和x 之间具有线性相关关系 二、填空题(每小题6分, 共24分) 11. 已知x 、y 的取值如下表:x 0 1 3 4 y2.24.34.86.7从所得的散点图分析,y 与x 线性相关,且y ^=0.95x +a ^,则a ^=________. 12.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于________;解释变量和预报变量之间的相关系数等于________.13.对具有线性相关关系的变量x 和y ,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.14.有同学在用电子邮件时发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍与邮箱名称是否含有数字有关,于是我们共收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.那么认为“国籍和邮箱名称里是否含有数字有关”的把握性为________.(用百分数表示)K 2=2()()()()()n ad bc a b c d a c b d -++++三、解答题(共计76分).15.(本题满分12分)已知变量x 与变量y 有下列对应数据:且y 对x 呈线性相关关系,求16.(本题满分12分)以下是某地区不同身高的未成年男性的体重平均值表(1) 给出两个回归方程:(1)318.254294.0-=x y ,(2)xey 0197.0004.2=通过计算,得到它们的相关指数分别是:9311.021=R,998.022=R 。
试问哪个回归方程拟合效果最好?(2)若体重超过相同身高男性平均值的1.2倍为偏胖,低于0.8为偏瘦,那么该地区某中学一男生身高为175cm,78kg ,他的体重是否正常?17. (本题满分12分)在综合素质评价的某个维度的测评中,依据评分细则,学生之间相互打分,最终将所有的数据合成一个分数.满分100分,按照大于等于80分为优秀,小于80分为合格.为了解学生在该维度的测评结果,从毕业班中随机抽出一个班的数据.该班共有60名学生,得到如下的列联表.总计 60已知在该班随机抽取1人测评结果为优秀的概率为13.(1)请完成上面的列联表;(2)能否在犯错误的概率不超过0.10的前提下认为性别与测评结果有关系?18(本题满分12分)某个体服装店经营某种服装,一周内获纯利y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:x 3 4 5 6 7 8 9 y66697381899091已知:∑7i =1x 2i =280,∑i =1y 2i =45 309,∑i =1x i y i =3 487. (1)求x ,y ;(2)判断纯利润y 与每天销售件数x 之间是否线性相关,如果线性相关,求出线性回归方程.19.(本题满分14分)为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩.数学 88 83 117 92 108 100 112 物理949110896104101106(1)(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议。
(其中,数据(x i ,y i )(i =1,2,…,n )的线性回归方程为y ^=b ^x +a ^,b ^=121()()()ni i i nii x x y y xx ==---∑∑,a ^=y --b ^x -)20.(本题满分14分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别 是否需要志愿者男女需要 40 30 不需要160270(1)(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.高中数学选修2-3第三章《统计案例》测试题A 卷答案一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的,请把正确答案的代号填在题后的括号内(每小题5分,共50分) 1.【答案】D【解析】由残差的相关知识可知选D . 2. 【答案】C【解析】统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生. 3.【答案】A【解析】比较K 2的值和临界值的大小,有95%的把握则K 2>3.841,K 2>6.635约有99%的把握. 4. 【答案】A【解析】因为b >0时,两变量正相关,此时,r >0;b <0时,两变量负相关,此时r <0. 5. 【答案】D【解析】回归直线必过样本中心点(1.5,y ),故y =4,m +3+5.5+7=16,得m =0.5. 6.【答案】B【解析】.K 2只适用于2×2型列联表问题,且K 2只能推断两个分类变量相关,但不能推断两个变量不相关.选项D 中K 2公式错误,分子上少了平方. 7.【答案】 B 【解析】 ∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^=b ^x +a ^必过(x ,y ), ∴42=72×9.4+a ^,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1,∴当x =6时,y ^=9.4×6+9.1=65.5(万元). 8. 【答案】C【解析】由列联表可得E =98-45=53,D =180-98=82,A =D -35=47,B =45+A =92,C =E +35=88.9.【答案】 B【解析】相关指数R 2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B. 10.【答案】 C【解析】R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 二、填空题(每小题6分, 共24分) 11.【答案】2.6【解析】因为回归直线必过样本点的中心(x ,y ),又x =2,y =4.5,代入y ^=0.95x+a ^,得a ^=2.6. 12.【答案】0,1【解析】由定义知散点图中所有的样本点都在一条直线上,则残差平方和等于0,解释变量和预报变量之间的相关系数等于1. 13.【答案】y ^=-10+6.5x【解析】由题意知x =2,y =3,b ^=6.5,所以a ^=y -b ^x =3-6.5×2=-10,即回归直线的方程为y ^=-10+6.5x . 14.【答案】97.5% 【解析】列联表如下:中国人 外国人 总计 有数字 43 27 70 无数字 21 33 54 总计6460124由表中数据,得K 2=124(43332721)70546460⨯⨯-⨯⨯⨯⨯≈6.201,∵K 2≥5.024,∴有97.5%的把握认为“国籍和邮箱名称里是否含有数字有关”.三、解答题(共计76分).15. 【解析】 x =1+2+3+44=52,y =12+32+2+34=74,∑ni =1x 2i=12+22+32+42=30,∑ni =1x i y i =1×12+2×32+3×2+4×3=432,L L 6分 ˆb ∴=∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2=432-4×52×7430-4×254=0.8,ˆa =y -x =74-0.8×52=-0.25,∴ˆy=0.8x -0.25. L L 12分16. 【解析】(1).2122R R >Θ,∴选择第二个方程拟合效果最好。