人教版 高中数学 (选修2-3 ) 第三章 统计案例单元测试题

合集下载

【统计】高中数学第三章统计案例单元质量评估新人教A版选修23

【统计】高中数学第三章统计案例单元质量评估新人教A版选修23

【关键字】统计第三章统计案例单元质量评估(120分钟150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.观察两个相关变量的如下数据:则两个变量间的返回直线方程为()A.=0.5x-1B.=xC.=2x+0.3D.=x+1【解析】选B.返回直线经过样本点的中心(,),因为==0,所以返回直线过(0,0).2.“返回”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心返回.根据他的结论,在儿子的身高y与父亲的身高x的返回直线方程中,()A.在(-1,0)内B.等于C.在(0,1)内D.在[1,+∞)内【解析】选C.子代平均身高向中心返回, 应为正的真分数.3.(2017·中山高二检测)已知x,y的取值如表所示:若y与x线性相关,且=0.95x+a,则a=()B. C.2.8 D.2.6【解析】选D.返回直线一定过样本点的中心(,),由已知=2,=4.5,代入返回直线方程得a=2.6.4.如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比例约为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例约为60%【解析】选C.由图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.5.(2017·临沂高二检测)身高与体重的关系可以用什么来分析()A.残差分析B.返回分析C.等高条形图D.独立性检验【解析】选B.因为身高与体重是两个具有相关关系的变量,故要用返回分析来解决.6.如果在犯错误的概率不超过0.05的前提下认为事件Ⅰ与事件Ⅱ有关,那么具体计算出的数值应满足()A.k>3.841B.k<3.841C.k>2.706D.k<2.706【解析】选A.利用k与临界值比较.7.如果某地的财政收入x与支出y满足线性返回方程(单位:亿元),其中,=0.8,=2,|e|≤0.5.若今年该地区财政收入为10亿元,则年支出预计不会超过()A.9亿元B.10亿元【解析】选D.代入数据=10+e,因为|e|≤0.5,所以||≤10.5,故不会超过10.5亿元.8.(2017·榆林高二检测)某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:则可以在犯错误的概率为多少的前提下认为其亲属的饮食习惯与年龄有关() A.0.1【解析】选C.因为K2的观测值k==10>6.635,所以在犯错误的概率为0.01的前提下认为其亲属的饮食习惯与年龄有关.9.若返回直线方程为=2-3.5x,则变量x增加一个单位,变量y平均()A.减少3.5个单位B.增加2个单位C.增加3.5个单位D.减少2个单位【解析】选A.由线性返回方程可知=-3.5,则变量x增加一个单位, 减少3.5个单位,即变量y平均减少3.5个单位.10.下表给出5组数据(x,y),为选出4组数据使其线性相关程度最大,且保留第1组数据(-5,-3),则应去掉()i 1 2 3 4 5x i-5 -4 -3 -2 4y i-3 -2 4 -1 6A.第2组B.第3组C.第4组D.第5组【解析】选B.由表中数据作出散点图,由散点图可知点(-3,4)偏离其他点,故去掉第3组其线性相关性最大.11.已知返回直线方程中的的估计值为0.2,样本点的中心为(4,5),则返回直线方程为()A.=1.2x-0.2B.=1.2x+0.2C.=0.2x+1.2D.=0.2x-0.2【解析】选B.因为返回直线方程中的的估计值为0.2,样本点的中心为(4,5),所以5=4+0.2,所以=1.2,所以回归直线方程为=1.2x+0.2.12.在肥胖与患心脏病这两个分类变量的计算中,下列说法正确的是( )A.若K2的观测值为k=6.635,则在犯错误的概率不超过0.01的前提下认为肥胖与患心脏病有关系,那么在100个肥胖的人中必有99人患有心脏病B.从独立性检验可知在犯错误的概率不超过0.01的前提下认为肥胖与患心脏病有关系时,我们说某人肥胖,那么他有99%的可能患有心脏病C.若从统计量中求出在犯错误的概率不超过0.05的前提下认为肥胖与患心脏病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确【解析】选C.犯错误的概率不超过0.05是统计上的关系,是指相关程度的大小,是一个概率值.二、填空题(本题共4小题,每小题5分,共20分,请把正确答案填在题中的横线上)13.在研究身高与体重的关系时,求得R2≈________.可以叙述为“身高解释了64%的体重变化”,而随机误差贡献了剩余的36%,所以,身高对体重的效应比随机误差的效应大得多.【解析】用R2可以衡量两个变量之间的相关关系的强弱,因为身高解释了64%的体重变化,而随机误差贡献了剩余的36%,得R2≈0.64.答案:0.6414.某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为______cm.【解析】设父亲身高为xcm,儿子身高为ycm,则x 173 170 176y 170 176 182=173,=176,由公式计算得=1,=-=176-1×173=3,则=x+3,当x=182时, =185.答案:18515.若两个分类变量X与Y的2×2列联表为:y1y2总计x110 15 25x240 16 56总计50 31 81则“X与Y之间有关系”这个结论出错的概率为________.【解析】由列联表数据,可求得K2的观测值k=≈7.227>6.635,因为P(K2≥6.635)≈0.01,所以“X与Y之间有关系”出错的概率为0.01.答案:0.0116.一个车间为了规定工时定额需要确定加工零件所花费的时间,为此进行了10次试验,根据测得的样本得到加工时间y(min)与加工零件个数x(个)的回归方程=0.668x+54.96,由此可以预测加工125个零件所花费的时间约为________min.【解析】当x=125时,=138.46.答案:138.46三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤.)17.(10分)(2017·武汉高二检测)下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车辆数是否有线性相关关系.机动车辆95 110 112 120 129 135 150 180数x/千台交通事故6.27.5 7.78.5 8.79.8 10.2 13.0数y/千件【解析】由题意可得=128.875,=8.95.进而求得r=≈0.9927.因为r>0.75,所以可以得出交通事故数y和机动车辆数x有较强的线性相关程度.18.(12分)打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:患心脏病未患心脏病总计每晚都打鼾30 224 254不打鼾24 1 355 1 379总计54 1 579 1 633根据列联表的独立性检验,能否在犯错误的概率不超过0.001的前提下认为每晚都打鼾与患心脏病有关系? 【解析】由列联表中的数据,得K2的观测值为k=≈68.033>10.828.因此,在犯错误的概率不超过0.001的前提下,认为每晚都打鼾与患心脏病有关系.19.(12分)某地搜集到的新房屋的销售价格(单位:万元)和房屋面积(单位:m2)的数据如下表:房屋面积/m2115 110 80 135 105销售价格/万元24.8 21.6 18.4 29.2 22(1)画出数据对应的散点图.(2)求回归直线方程.(3)根据(2)的结果,估计当房屋面积为150m2时的销售价格.【解析】(1)设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.(2)由(1)知y与x具有线性相关关系,可设其回归方程为依据题中的数据,应用科学计算器,可得出=x i=109,(x i-)2=1570,=y i=23.2,(x i-)(y i-)=308,所以==≈0.1962,≈23.2-0.1962×109=1.8142.故所求的回归直线方程为=0.1962x+1.8142.(3)由(2)知当x=150时,销售价格的估计值为=0.1962×150+1.8142= 31.2442(万元).故当房屋面积为150m2时,估计销售价格是31.2442万元.20.(12分)随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n个人,其中男性占调查人数的.已知男性中有一半的人的休闲方式是运动,而女性中只有的人的休闲方式是运动.(1)完成下列2×2列联表:运动非运动总计男性女性总计n(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动?【解析】(1)补全2×2列联表如下:运动非运动总计男性n n n女性n n nn总计n n(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,则P(K2≥k0)=3.841.由于K2的观测值k==,故≥3.841,即n≥138.276,又由n∈Z,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.(3)根据(2)的结论,本次被调查的人中,至少有×140=56(人)的休闲方式是运动.21.(12分)(2017·汉中高二检测)在彩色显影中,由经验可知:形成染料光学密度y与析出银光的光学密度x由公式y=A(b<0)表示,现测得试验数据如下:x i0.05 0.06 0.25 0.31 0.07 0.10y i0.10 0.14 1.00 1.12 0.23 0.37x i0.38 0.43 0.14 0.20 0.47y i 1.19 1.25 0.59 0.79 1.29试求y对x的回归方程.【解析】作散点图如图.由散点图,可设回归方程为y=A(A>0,b<0),其中A和b为参数,对两边取对数,得lny=lnA+,作变量代换X=,Y=lny,并设a=lnA,得Y=a+bX,则由试验数据(x i,y i)(i=1,2,3,…,11),求出对应的数据(X i,Y i)(i=1,2,3,…,11)如表:X i20.000 16.667 14.286 10.000 7.143 5.000Y i-2.303 -1.966 -1.470 -0.994 -0.528 -0.236X i 4.000 3.226 2.632 2.326 2.128Y i0 0.113 0.174 0.223 0.255经过计算可得=7.946,=-0.612,(X i-)2≈406.614,(Y i-)2≈8.690,(X i-)(Y i-)≈-59.342,样本相关系数r≈≈-0.9983.显然|r|≈0.9983>0.75,所以认为Y与X之间的线性相关关系特别显著.再求与的估计值,=≈-0.146,≈-0.612-(-0.146)×7.946≈0.548.则Y与X的回归直线方程为Y=0.548-0.146X.换回原变量,得y=.所以y关于x的回归方程为y=.22.(12分)期中考试后,对某班60名学生的成绩优秀和不优秀与学生近视和不近视的情况做了调查,其中成绩优秀的36名学生中,有20人近视,另外24名成绩不优秀的学生中,有6人近视.(1)请列出列联表并画出等高条形图,并判断成绩优秀与患近视是否有关系.(2)能否在犯错误的概率不超过0.025的前提下认为成绩优秀与患近视之间有关系?【解析】(1)列联表如下:近视不近视总计成绩优秀20 16 36成绩不优秀 6 18 24总计26 34 60 等高条形图如图所示由图知成绩优秀与患近视有关.(2)由列联表中的数据得到K2的观测值k=≈5.475>5.024.因此,在犯错误的概率不超过0.025的前提下认为成绩优秀与患近视有关. 此文档是由网络收集并进行重新排版整理.word可编辑版本!。

高中数学 第三章 统计案例练习 理 新人教A版选修2-3(2021年最新整理)

高中数学 第三章 统计案例练习 理 新人教A版选修2-3(2021年最新整理)

2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学第三章统计案例练习理新人教A版选修2-3的全部内容。

第三章 统计案例微测试1 3.1回归分析的基本思想及其初步应用(测试时间:20分钟)一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的. 1.给出下列四个命题,其中正确的一个是A .在线性回归模型中,相关指数20.80R =,说明预报变量对解释变量的贡献率是80%B .相关系数0.852r =,接近1,表明两个变量的线性相关性很差C .相关指数2R 用来刻画回归效果,2R 越小,则残差平方和越大,模型的拟合效果越好D .相关指数2R 用来刻画回归效果,2R 越大,则残差平方和越小,模型的拟合效果越好 2.下表是x 和y 之间的一组数据,则y 关于x 的回归直线方程必过A .点(2,3)B .点(3,5)C .点(2.5,4)D .点(2.5,5)3.下表是某厂14~月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0ˆ.7yx =-+ a ,则a 等于A .10.5B .5.15C .5.2D .5.254.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且ˆ 2.347 6.423yx =-; ②y 与x 负相关且ˆ 3.476 5.648y x =-+; ③y 与x 正相关且ˆ 5.4378.493yx =+; ④y 与x 正相关且ˆ 4.326 4.578y x =--。

(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。

人教A版高中数学选修2-3全册同步练习及单元检测含答案

人教A版高中数学选修2-3全册同步练习及单元检测含答案

⼈教A版⾼中数学选修2-3全册同步练习及单元检测含答案⼈教版⾼中数学选修2~3 全册章节同步检测试题⽬录第1章《计数原理》同步练习 1.1测试1第1章《计数原理》同步练习 1.1测试2第1章《计数原理》同步练习 1.1测试3第1章《计数原理》同步练习 1.2排列与组合第1章《计数原理》同步练习 1.3⼆项式定理第1章《计数原理》测试(1)第1章《计数原理》测试(2)第2章同步练习 2.1离散型随机变量及其分布列第2章同步练习 2.2⼆项分布及其应⽤第2章测试(1)第2章测试(2)第2章测试(3)第3章练习 3.1回归分析的基本思想及其初步应⽤第3章练习 3.2独⽴性检验的基本思想及其初步应⽤第3章《统计案例》测试(1)第3章《统计案例》测试(2)第3章《统计案例》测试(3)1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题1.⼀件⼯作可以⽤2种⽅法完成,有3⼈会⽤第1种⽅法完成,另外5⼈会⽤第2种⽅法完成,从中选出1⼈来完成这件⼯作,不同选法的种数是()A.8 B.15C.16 D.30答案:A2.从甲地去⼄地有3班⽕车,从⼄地去丙地有2班轮船,则从甲地去丙地可选择的旅⾏⽅式有()A.5种B.6种C.7种D.8种答案:B3.如图所⽰为⼀电路图,从A 到B 共有()条不同的线路可通电()A.1 B.2 C.3 D.4答案:D4.由数字0,1,2,3,4可组成⽆重复数字的两位数的个数是()A.25 B.20 C.16 D.12答案:C5.李芳有4件不同颜⾊的衬⾐,3件不同花样的裙⼦,另有两套不同样式的连⾐裙.“五⼀”节需选择⼀套服装参加歌舞演出,则李芳有()种不同的选择⽅式()A.24 B.14 C.10 D.9答案:B 6.设A ,B 是两个⾮空集合,定义{}()A B a b a A b B *=∈∈,,|,若{}{}0121234P Q ==,,,,,,,则P *Q 中元素的个数是()A.4 B.7 C.12 D.16答案:C⼆、填空题7.商店⾥有15种上⾐,18种裤⼦,某⼈要买⼀件上⾐或⼀条裤⼦,共有种不同的选法;要买上⾐,裤⼦各⼀件,共有种不同的选法.答案:33,2708.⼗字路⼝来往的车辆,如果不允许回头,共有种⾏车路线.答案:129.已知{}{}0341278a b ∈∈,,,,,,,则⽅程22()()25x a y b -+-=表⽰不同的圆的个数是.答案:1210.多项式123124534()()()()a a a b b a a b b ++++++··展开后共有项.答案:1011.如图,从A →C ,有种不同⾛法.答案:612.将三封信投⼊4个邮箱,不同的投法有种.答案:34三、解答题 13.⼀个⼝袋内装有5个⼩球,另⼀个⼝袋内装有4个⼩球,所有这些⼩球的颜⾊互不相同.(1)从两个⼝袋内任取⼀个⼩球,有多少种不同的取法?(2)从两个⼝袋内各取⼀个⼩球,有多少种不同的取法?解:(1)549N =+=种;(2)5420N =?=种.14.某校学⽣会由⾼⼀年级5⼈,⾼⼆年级6⼈,⾼三年级4⼈组成.(1)选其中1⼈为学⽣会主席,有多少种不同的选法?(2)若每年级选1⼈为校学⽣会常委,有多少种不同的选法?(3)若要选出不同年级的两⼈参加市⾥组织的活动,有多少种不同的选法?解:(1)56415N =++=种;(2)564120N =??=种;(3)56644574N =?+?+?=种15.已知集合{}321012()M P a b =---,,,,,,,是平⾯上的点,a b M ∈,.(1)()P a b ,可表⽰平⾯上多少个不同的点?(2)()P a b ,可表⽰多少个坐标轴上的点?解:(1)完成这件事分为两个步骤:a 的取法有6种,b 的取法也有6种,∴P 点个数为N =6×6=36(个);(2)根据分类加法计数原理,分为三类:①x 轴上(不含原点)有5个点;②y 轴上(不含原点)有5个点;③既在x 轴,⼜在y 轴上的点,即原点也适合,∴共有N =5+5+1=11(个).1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题 1.从集合{ 0,1,2,3,4,5,6}中任取两个互不相等的数a ,b 组成复数a bi +,其中虚数有() A .30个 B .42个 C .36个 D .35个答案:C2.把10个苹果分成三堆,要求每堆⾄少1个,⾄多5个,则不同的分法共有() A .4种 B .5种 C .6种 D .7种答案:A3.如图,⽤4种不同的颜⾊涂⼊图中的矩形A ,B ,C ,D 中,要求相邻的矩形涂⾊不同,则不同的涂法有() A .72种 B .48种 C .24种 D .12种答案:A4.教学⼤楼共有五层,每层均有两个楼梯,由⼀层到五层的⾛法有() A .10种 B .52种C.25种D.42种答案:D5.已知集合{}{}023A B x x ab a b A ===∈,,,,,|,则B 的⼦集的个数是()A.4 B.8 C.16 D.15答案:C6.三边长均为正整数,且最⼤边长为11的三⾓形的个数为()A.25 B.26 C.36 D.37答案:C⼆、填空题7.平⾯内有7个点,其中有5个点在⼀条直线上,此外⽆三点共线,经过这7个点可连成不同直线的条数是.答案:128.圆周上有2n 个等分点(1n >),以其中三个点为顶点的直⾓三⾓形的个数为.答案:2(1)n n -9.电⼦计算机的输⼊纸带每排有8个穿孔位置,每个穿孔位置可穿孔或不穿孔,则每排可产⽣种不同的信息.答案:25610.椭圆221x y m n+=的焦点在y 轴上,且{}{}123451234567m n ∈∈,,,,,,,,,,,,则这样的椭圆的个数为.答案:20 11.已知集合{}123A ,,ü,且A 中⾄少有⼀个奇数,则满⾜条件的集合A 分别是.答案:{}{}{}{}{}13122313,,,,,,,12.整数630的正约数(包括1和630)共有个.答案:24三、解答题 13.⽤0,1,2,3,4,5六个数字组成⽆重复数字的四位数,⽐3410⼤的四位数有多少个?解:本题可以从⾼位到低位进⾏分类.(1)千位数字⽐3⼤.(2)千位数字为3:①百位数字⽐4⼤;②百位数字为4: 1°⼗位数字⽐1⼤;2°⼗位数字为1→个位数字⽐0⼤.所以⽐3410⼤的四位数共有2×5×4×3+4×3+2×3+2=140(个).14.有红、黄、蓝三种颜⾊旗⼦各(3)n n >⾯,任取其中三⾯,升上旗杆组成纵列信号,可以有多少种不同的信号?若所升旗⼦中不允许有三⾯相同颜⾊的旗⼦,可以有多少种不同的信号?若所升旗⼦颜⾊各不相同,有多少种不同的信号?解: 1N =3×3×3=27种; 227324N =-=种; 33216N =??= 种.15.某出版社的7名⼯⼈中,有3⼈只会排版,2⼈只会印刷,还有2⼈既会排版⼜会印刷,现从7⼈中安排2⼈排版,2⼈印刷,有⼏种不同的安排⽅法.解:⾸先分类的标准要正确,可以选择“只会排版”、“只会印刷”、“既会排版⼜会印刷”中的⼀个作为分类的标准.下⾯选择“既会排版⼜会印刷”作为分类的标准,按照被选出的⼈数,可将问题分为三类:第⼀类:2⼈全不被选出,即从只会排版的3⼈中选2⼈,有3种选法;只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有3×1=3种选法.第⼆类:2⼈中被选出⼀⼈,有2种选法.若此⼈去排版,则再从会排版的3⼈中选1⼈,有3种选法,只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有2×3×1=6种选法;若此⼈去印刷,则再从会印刷的2⼈中选1⼈,有2种选法,从会排版的3⼈中选2⼈,有3种选法,由分步计数原理知共有2×3×2=12种选法;再由分类计数原理知共有6+12=18种选法.第三类:2⼈全被选出,同理共有16种选法.所以共有3+18+16=37种选法.1. 1 分类加法计数原理与分步乘法计数原理综合卷⼀.选择题:1.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种2.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出语⽂、数学、英语各⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种3.某商业⼤厦有东南西3个⼤门,楼内东西两侧各有2个楼梯,从楼外到⼆楼的不同⾛法种数是()(A ) 5 (B )7 (C )10 (D )124.⽤1、2、3、4四个数字可以排成不含重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个5.⽤1、2、3、4四个数字可排成必须含有重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个6.3科⽼师都布置了作业,在同⼀时刻4名学⽣都做作业的可能情况有()(A )43种(B )34种(C )4×3×2种(D ) 1×2×3种7.把4张同样的参观券分给5个代表,每⼈最多分⼀张,参观券全部分完,则不同的分法共有()(A )120种(B )1024种(C )625种(D )5种8.已知集合M={l ,-2,3},N={-4,5,6,7},从两个集合中各取⼀个元素作为点的坐标,则这样的坐标在直⾓坐标系中可表⽰第⼀、⼆象限内不同的点的个数是()(A )18 (B )17 (C )16 (D )109.三边长均为整数,且最⼤边为11的三⾓形的个数为()(A )25 (B )36 (C )26 (D )3710.如图,某城市中,M 、N 两地有整齐的道路⽹,若规定只能向东或向北两个⽅向沿途中路线前进,则从M 到N 不同的⾛法共有()(A )25 (B )15 (C)13 (D )10 ⼆.填空题:11.某书店有不同年级的语⽂、数学、英语练习册各10本,买其中⼀种有种⽅法;买其中两种有种⽅法.12.⼤⼩不等的两个正⽅形玩具,分别在各⾯上标有数字1,2,3,4,5,6,则向上的⾯标着的两个数字之积不少于20的情形有种.13.从1,2,3,4,7,9中任取不相同的两个数,分别作为对数的底数和真数,可得到个不同的对数值.14.在连结正⼋边形的三个顶点组成的三⾓形中,与正⼋边形有公共边的有个.15.某班宣传⼩组要出⼀期向英雄学习的专刊,现有红、黄、⽩、绿、蓝五种颜⾊的粉笔供选⽤,要求在⿊板中A 、B 、C 、D 每⼀部分只写⼀种颜⾊,如图所⽰,相邻两块颜⾊不同,则不同颜⾊的书写⽅法共有种.三.解答题:16.现由某校⾼⼀年级四个班学⽣34⼈,其中⼀、⼆、三、四班分别为7⼈、8⼈、9⼈、10⼈,他们⾃愿组成数学课外⼩组.(1)选其中⼀⼈为负责⼈,有多少种不同的选法?(2)每班选⼀名组长,有多少种不同的选法?(3)推选⼆⼈做中⼼发⾔,这⼆⼈需来⾃不同的班级,有多少种不同的选法?17.4名同学分别报名参加⾜球队,蓝球队、乒乓球队,每⼈限报其中⼀个运动队,不同的报名⽅法有⼏种?[探究与提⾼]1.甲、⼄两个正整数的最⼤公约数为60,求甲、⼄两数的公约数共有多个?2.从{-3,-2,-1,0,l,2,3}中,任取3个不同的数作为抛物线⽅程y=ax2+bx+c(a≠0)的系数,如果抛物线过原点,且顶点在第⼀象限,这样的抛物线共有多少条?3.电视台在“欢乐今宵”节⽬中拿出两个信箱,其中存放着先后两次竞猜中成绩优秀的群众来信,甲信箱中有30封,⼄信箱中有20封.现由主持⼈抽奖确定幸运观众,若先确定⼀名幸运之星,再从两信箱中各确定⼀名幸运伙伴,有多少种不同的结果?综合卷1.A 2.B 3.D 4.D 5.B 6.B 7.D 8.B 9.B 10.B11.30;300 12.513.17 14.40 15.1801. 2排列与组合1、排列综合卷1.90×9l ×92×……×100=()(A )10100A (B )11100A (C )12100A (D )11101A 2.下列各式中与排列数mn A 相等的是()(A )!(1)!-+n n m (B )n(n -1)(n -2)……(n -m) (C )11m n nA n m --+ (D )111m n n A A --3.若 n ∈N 且 n<20,则(27-n )(28-n)……(34-n)等于()(A )827n A - (B )2734nn A -- (C )734n A - (D )834n A -4.若S=123100123100A A A A ++++,则S 的个位数字是()(A )0 (B )3 (C )5 (D )85.⽤1,2,3,4,5这五个数字组成没有重复数字的三位数,其中偶数共有()(A )24个(B )30个(C )40个(D )60个6.从0,l ,3,5,7,9中任取两个数做除法,可得到不同的商共有()(A )20个(B )19个(C )25个(D )30个7.甲、⼄、丙、丁四种不同的种⼦,在三块不同⼟地上试种,其中种⼦甲必须试种,那么不同的试种⽅法共有()(A )12种(B )18种(C )24种(D )96种8.某天上午要排语⽂、数学、体育、计算机四节课,其中体育不排在第⼀节,那么这天上午课程表的不同排法共有()(A )6种(B )9种(C )18种(D )24种9.有四位司机、四个售票员组成四个⼩组,每组有⼀位司机和⼀位售票员,则不同的分组⽅案共有()(A )88A 种(B )48A 种(C )44A ·44A 种(D )44A 种10.有4位学⽣和3位⽼师站在⼀排拍照,任何两位⽼师不站在⼀起的不同排法共有()(A )(4!)2种(B )4!·3!种(C )34A ·4!种(D )3 5A ·4!种11.把5件不同的商品在货架上排成⼀排,其中a ,b 两种必须排在⼀起,⽽c ,d 两种不能排在⼀起,则不同排法共有()(A )12种(B )20种(C )24种(D )48种⼆.填空题::12.6个⼈站⼀排,甲不在排头,共有种不同排法.13.6个⼈站⼀排,甲不在排头,⼄不在排尾,共有种不同排法.14.五男⼆⼥排成⼀排,若男⽣甲必须排在排头或排尾,⼆⼥必须排在⼀起,不同的排法共有种.15.将红、黄、蓝、⽩、⿊5种颜⾊的⼩球,分别放⼊红、黄、蓝、⽩、⿊5种颜⾊的⼝袋中,但红⼝袋不能装⼊红球,则有种不同的放法.16.(1)有5本不同的书,从中选3本送给3名同学,每⼈各⼀本,共有种不同的送法;(2)有5种不同的书,要买3本送给3名同学,每⼈各⼀本,共有种不同的送法.三、解答题:17.⼀场晚会有5个唱歌节⽬和3个舞蹈节⽬,要求排出⼀个节⽬单(1)前4个节⽬中要有舞蹈,有多少种排法?(2)3个舞蹈节⽬要排在⼀起,有多少种排法?(3)3个舞蹈节⽬彼此要隔开,有多少种排法?18.三个⼥⽣和五个男⽣排成⼀排.(1)如果⼥⽣必须全排在⼀起,有多少种不同的排法?(2)如果⼥⽣必须全分开,有多少种不同的排法?(3)如果两端都不能排⼥⽣,有多少种不同的排法?(4)如果两端不能都排⼥⽣,有多少种不同的排法?(5)如果三个⼥⽣站在前排,五个男⽣站在后排,有多少种不同的排法?综合卷1.B 2.D 3.D 4.C 5.A 6.B 7.B 8.C 9.D 10.D 11.C12.600 13.504 14.480 15.9616.(1) 60;(2) 12517.(1) 37440;(2) 4320;(3) 1440018.(1) 4320;(2) 14400;(3) 14400;(4) 36000;(5) 7202、组合综合卷⼀、选择题:1.下列等式不正确的是()(A )!!()!mn n C m n m =- (B )11mm n n m C C n m++=- (C )1111m m n n m C C n +++=+ (D )11m m n n C C ++= 2.下列等式不正确的是()(A )m n m n n C C -= (B )11m m mm m m C C C -++=(C )123455555552C C C C C ++++= (D )11 111m m m m n n n n C C C C --+--=++3.⽅程2551616x x x C C --=的解共有()(A )1个(B )2个(C )3个(D )4个4.若372345n n n C A ---=,则n 的值是()(A )11 (B )12 (C )13 (D )145.已知7781n n n C C C +-=,那么n 的值是()(A )12 (B )13 (C )14 (D )15 6.从5名男⽣中挑选3⼈,4名⼥⽣中挑选2⼈,组成⼀个⼩组,不同的挑选⽅法共有()(A )3254C C 种(B ) 3254C C 55A 种(C ) 3254A A 种(D ) 3254A A 55A 种7.从4个男⽣,3个⼥⽣中挑选4⼈参加智⼒竞赛,要求⾄少有⼀个⼥⽣参加的选法共有()(A )12种(B )34种(C )35种(D )340种8.平⾯上有7个点,除某三点在⼀直线上外,再⽆其它三点共线,若过其中两点作⼀直线,则可作成不同的直线()(A )18条(B )19条(C )20条(D )21条9.在9件产品中,有⼀级品4件,⼆级品3件,三级品2件,现抽取4个检查,⾄少有两件⼀级品的抽法共有()(A )60种(B )81种(C )100种(D )126种10.某电⼦元件电路有⼀个由三节电阻串联组成的回路,共有6个焊点,若其中某⼀焊点脱落,电路就不通.现今回路不通,焊点脱落情况的可能有()(A )5种(B )6种(C )63种(D )64种⼆.填空题:11.若11m m n n C xC --=,则x= .12.三名教师教六个班的课,每⼈教两个班,分配⽅案共有种。

数学教案 人教a版选修2_3 同步练习-第3章统计案例跟踪训练含解析

数学教案 人教a版选修2_3 同步练习-第3章统计案例跟踪训练含解析

回归分析的基本思想及其初步应用[A 组 学业达标]1.下列两个变量之间的关系不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积 C .正n 边形的边数和内角度数和 D .人的年龄和身高解析:函数关系就是一种变量之间的确定性的关系.A ,B ,C 三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ,g(a)=a 2,h(n)=nπ-2π.D 选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高.故选D.答案:D2.设一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A.y ^平均增加1.5个单位 B.y ^平均增加2个单位 C.y ^平均减少1.5个单位 D.y ^平均减少2个单位解析:由线性回归方程y ^=2-1.5x 中x 的系数为-1.5,知C 项正确. 答案:C 3.有下列数据:x 1 2 3 y35.9912.01A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好. 答案:A4.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=-2.756x +7.325.②y 与x 负相关且y ^=3.476x +5.648 ③y 与x 正相关且y ^=-1.226x -6.578 ④y 与x 正相关且y ^=8.967x +8.163 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④解析:根据题意,依次分析4个结论:对于①,y 与x 负相关且y ^=-2.756x +7.325,此结论正确,线性回归方程符合负相关的特征; 对于②,y 与x 负相关且y ^=3.476x +5.648,此结论错误,由线性回归方程知,此两变量的关系是正相关;对于③,y 与x 正相关且y ^=-1.226x -6.578,此结论错误,由线性回归方程知,此两变量的关系是负相关;对于④,y 与x 正相关且y ^=8.967x +8.163,此结论正确,线性回归方程符合正相关的特征;故②③一定错误.答案:B5.对具有线性相关关系的变量x ,y ,测得一组数据如下表:x 2 4 5 6 8 y2040607080根据上表,利用最小二乘法得它们的回归直线方程为y ^=10.5x +a ^,据此模型来预测当x =20时,y 的估计值为________.解析:由已知得x -=5,y -=54,则(5,54)满足回归直线方程y ^=10.5x +a ^,解得a ^=1.5,因此y ^=10.5x +1.5,当x =20时y ^=10.5×20+1.5=211.5.答案:211.56.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.解析:去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.答案:D(3,10)7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围,令z =ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为____________________.解析:由z =ln y ,z ^=0.25x -2.58, 得ln y ^=0.25x -2.58,∴y ^=e 0.25x -2.58. 故该模型的回归方程为y ^=e 0.25x -2.58. 答案:y ^=e 0.25x -2.588.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,求社区一户年收入为15万元的家庭的年支出.解析:由题意可得x -=15×(8.2+8.6+10.0+11.3+11.9)=10,y -=15×(6.2+7.5+8.0+8.5+9.8)=8,可得a ^=8-0.76×10=0.4. ∴回归直线方程为y ^=0.76x +0.4.把x =15代入可得y ^=0.76×15+0.4=11.8.故社区一户年收入为15万元的家庭的年支出为11.8万元.9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x -=8+8.2+8.4+8.6+8.8+96=8.5,y -=16(90+84+83+80+75+68)=80,∵b ^=-20,a ^=y --b ^ x -, ∴a ^=80+20×8.5=250, ∴线性回归方程y ^=-20x +250;(2)设工厂获得的利润为L 元,则L =x(-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为8.25元,工厂获得的利润最大.[B 组 能力提升]10.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是a 1,a 2,R 2的值分别为b 1,b 2,下列说法正确的是( )A .若a 1<a 2,则b 1<b 2,A 的拟合效果更好B .若a 1<a 2,则b 1<b 2,B 的拟合效果更好C .若a 1<a 2,则b 1>b 2,A 的拟合效果更好D .若a 1<a 2,则b 1>b 2,B 的拟合效果更好解析:由残差平方和以及R 2的定义式可得若a 1<a 2,则b 1>b 2,A 的拟合效果更好. 答案:C11.近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下:A.y ^=2.799 1x -27.248 552 B.y ^=2.799 1x -23.548 452 C.y ^=2.699 2x -23.749 352 D.y ^=2.899 2x -23.749 452解析:x -=41.72,y -=93.23,代入验证可知B 选项正确. 答案:B12.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.解析:将x =160代入y ^=0.85x -82.71,得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.答案:-0.2913.已知一个线性回归方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y -=________. 解析:∵x -=1+5+7+13+195=9,且y ^=1.5x +45, ∴y -=1.5×9+45=58.5. 答案:58.514.假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如表统计资料:x 2 3 4 5 6 y2.23.85.56.57.0已知∑i =15x 2i=90,∑i =15x i y i =112.3.b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b ^ x -. (1)求x -,y -.(2)x 与y 具有线性相关关系,求出线性回归方程. (3)估计使用年限为10年时,维修费用约是多少? 解析:(1)x -=4,y -=5.(2)b ^=∑i =15x i y i -5x - y-∑i =15x 2i -5x -2=1.23,a ^=y --b ^ x -=5-1.23×4=0.08.所以线性回归方程为y ^=1.23x +0.08.(3)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用年限为10年时,维修费用约为12.38万元.15.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x1 2 3 4 5y 58 54 39 29 10(1)令w =x 2,利用给出的参考数据求出y 关于w 的回归方程y ^=b ^w +a ^.(a ^,b ^精确到0.1)参考数据:∑i =15w i =55,∑i =15(w i -w -)(y i -y -)=-751,∑i =15(w i -w -)2=374,其中w i =x 2i ,w -=15∑i =15w i .(2)对于某种残留在蔬菜上的农药,当它的残留量不高于20微克时对人体无害,为了放心食用该蔬菜,请估计至少需要用多少千克的清水清洗1千克蔬菜?(精确到0.1,参考数据5≈2.24)附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -u-v i -v-∑i =1nu i -u-2,α^=v --β^ u -.解析:(1)由题意得,w -=11,y -=38.b ^=∑i =15w i -w-y i -y-∑i =15w i -w-2=-751374≈-2.0,a ^=y --b ^w =60.0,所以y ^=-2.0w +60.0. (2)由(1)得,y ^=-2.0w +60.0, 所以y ^=-2.0x 2+60.0,当y ^≤20时,即-2.0x 2+60.0≤20,解得x≥25≈4.5,所以为了放心食用该蔬菜,估计需要用4.5千克的清水清洗1千克蔬菜.独立性检验的基本思想及其初步应用[A组学业达标]1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( )A.频率分布直方图B.回归分析C.独立性检验D.用样本估计总体解析:根据题意,结合题目中的数据,列出2×2列联表,求出K2观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.答案:C2.观察下列各图,其中两个分类变量x,y之间关系最强的是( )解析:观察等高条形图发现x1x1+y1和x2x2+y2相差越大,就判断两个分类变量之间关系越强.答案:D3.如表是一个2×2列联表:则表中a,b的值分别为( )y1y2总计x1 a 21 73x222 25 47总计 b 46 120A.94,72C.52,74 D.74,52解析:a=73-21=52,b=a+22=74,故选C.答案:C4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果K2的观测值k>5.024,那么在犯错误的概率不超过________的前提下认为“X与Y有关系”()P(K2≥k 0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.828A.0.25 B .0.05 C .0.1D .0.025解析:因为K 2的观测值k >5.024,而在临界值表中对应于5.024的是0.025,所以可以在犯错误的概率不超过0.025的前提下认为“X 和Y 有关系”.答案:D5.分类变量X 和Y 的列表如下,则下列说法判断正确的是( )y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +dA.ad -bc 越小,说明X 与Y 的关系越弱 B .ad -bc 越大,说明X 与Y 的关系越强 C .(ad -bc)2越大,说明X 与Y 的关系越强 D .(ad -bc)2越接近于0,说明X 与Y 的关系越强解析:列联表可以较为准确地判断两个变量之间的相关关系程度, 由K 2=a +b +c +dad -bc2a +b a +cb +dc +d,当(ad -bc)2越大,K 2越大,表明X 与Y 的关系越强.(ad -bc)2越接近0,说明两个分类变量X 和Y 无关的可能性越大. 即所给说法判断正确的是C. 答案:C6.某部门通过随机调查89名工作人员的休闲方式,了解读书和健身的人数,得到的数据如表:读书 健身 总计 女 24 31 55 男 8 26 34 总计325789在犯错误的概率不超过________的前提下认为性别与休闲方式有关系. 解析:由列联表中的数据,得K 2的观测值为k =89×24×26-31×8255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.答案:0.107.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:死亡 存活 总计 第一种剂量 14 11 25 第二种剂量 6 19 25 总计203050进行统计分析的统计假设是________,K 2=________,说明两种电离辐射剂量对小白鼠的致死作用________.(填“相同”或“不相同”)参考公式:K 2=n ad -bc2a +bc +d a +cb +d解析:统计假设是“小白鼠的死亡与使用的电离辐射剂量无关”,由列联表中数据得K 2=5.33>3.841,所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关.所以两种电离辐射剂量对小白鼠的致死作用不相同.答案:小白鼠的死亡与使用的电离辐射剂量无关 5.33 不相同 8.下表是关于男婴与女婴出生时间调查的列联表:晚上 白天 总计 男婴 45 A B 女婴 E 35 C 总计98D180那么,A =________,B =E =________. 解析:由列联表知识得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.答案:47 92 88 82 539.网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?解析:根据题目所给的数据得到如下2×2列联表:经常上网 不经常上网总计 不及格80120200及格 120 680 800 总计2008001 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.10.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动.(1)完成下列2×2列联表:运动 非运动总计 男性 女性 总计n(2)数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 解析:(1)补全2×2列联表如下:运动 非运动 总计 男性 15n 15n 25n 女性 15n 25n 35n 总计25n 35n n(2)则P(K 2≥k 0)=3.841. 由于K 2的观测值k =n ⎝ ⎛⎭⎪⎫n 5·2n 5-n 5·n 522n 5·3n 5·2n 5·3n 5=n 36,故n36≥3.841,即n≥138.276. 又由15n ∈Z ,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.(3)根据(2)的结论,本次被调查的人中,至少有25×140=56(人)的休闲方式是运动.[B 组 能力提升]11.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,故在犯错误的概率不超过________的前提下认为糖尿病患者与遗传有关系.( )A .0.001B .0.005C .0.01D .0.025解析:可以先作出如下列联表(单位:人): 糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计 阳性家族史 16 93 109 阴性家族史17 240 257 总计33333366根据列联表中的数据,得到K 2的观测值为 k =366×16×240-17×932109×257×33×333≈6.067>5.024.故在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关系. 答案:D12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________(填序号). ①若K 2的观测值k =6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.解析:K 2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.答案:③13.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k≈________(保留3位小数). 解析:k =300×37×143-85×352122×178×72×228≈4.514.答案:4.51414.某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科 理科 总计 优秀 非优秀 总计5050100(2)某高校派出2140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.解析:(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.010+0.004+0.002)×10×50=8,故非优秀人数为50-8=42.该校理科学生中数学成绩优秀的人数为(0.020+0.014+0.006)×10×50=20,故非优秀人数为50-20=30.则2×2列联表如下:文科 理科 总计 优秀 8 20 28 非优秀 42 30 72 总计5050100∴K 2的观测值k =100×8×30-42×20250×50×28×72≈7.143>6.635,故有99%的把握认为该校文理科数学成绩有差异.(2)由(1)知,该校随机抽取的学生成绩中一练数学成绩在140分以上的学生为4人,ξ的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为⎝⎛⎭⎪⎫C 34+C 24C 22A 22A 22=14,则P(ξ=1)=C 1414=27,P(ξ=2)=C 2414=37,P(ξ=3)=C 3414=27.∴ξ的分布列为:ξ 1 2 3 P273727∴E(ξ)=1×27+2×37+3×27=2.15.某校为了了解学生对消防知识的了解情况,从高一年级和高二年级各选取100名同学进行消防知识竞赛.图(1)和图(2)分别是对高一年级和高二年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.(1)请计算高一年级和高二年级成绩小于60分的人数.(2)完成2×2列联表,并回答:在犯错误的概率不超过多少的前提下认为“学生所在的年级与消防常识的了解存在相关性”?成绩小于60分人数成绩不小于60分人数总计高一 高二 总计附:临界值表及参考公式: K 2=n ad -bc 2a +bc +d a +cb +d ,n =a +b +c +d. P(K 2≥k 0)0.15 0.100.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828解析:(1)高一年级成绩低于60分的人数为:(0.03+0.04)×10×100=70; 高二年级成绩低于60分的人数为: (0.035+0.015)×10×100=50. (2)2×2列联表如下:成绩小于60分人数成绩不小于60分人数总计 高一 70 30 100 高二 50 50 100 总计12080200由于K 2的观测值k =200×50×70-50×302100×100×120×80≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为“学生所在的年级与消防知识的了解存在相关性”.。

2021学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用习题新人教A版选修2_3

2021学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用习题新人教A版选修2_3

第三章 3.1 回归分析的根本思想及其初步应用A 级 根底稳固一、选择题1.(2021·深圳一模)其食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一局部不同年份的该酒品,并测定了其芳香度(如表).年份x 0 1 4 5 6 8 芳香度y由最小二乘法得到回归方程y ^x +1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为( A )[解析] 由表中数据:x =16(0+1+4+5+6+8)=4,回归方程y ^x +1.13,∴y ^=1.03×4+1.13=5.26,∴y =16(1.3+1.8+5.6+?+7.4+9.3)=5.26,解得:?=6.1. 应选A .2.由变量x 与y 相对应的一组数据(1,y 1)、(5,y 2)、(7,y 3)、(13,y 4)、(19,y 5)得到的线性回归方程为y ^=2x +45,那么y -=( D )A .135B .90C .67D .63[解析] ∵x -=15(1+5+7+13+19)=9,y -=2x -+45,∴y -=2×9+45=63,应选D . 3.观测两个相关变量,得到如下数据:x -1 -2 -3 -4 -5 5 4 3 2 1 y-25A .y ^x -1 B .y ^=x C .y ^=2x +0.3 D .y ^=x +1[解析] 因为x -=0, y -=,10)=0,根据回归直线方程必经过样本中心点(x -,y -)可知,回归直线方程过点(0,0),所以选B .4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y ^x +73.93,用这个模型预测这个孩子10岁时的身高,那么正确的表达是( C )A .身高一定是B .身高在以上C .身高在左右D .身高在以下[解析] 将x 的值代入回归方程y ^x +73.93时,得到的y ^值是年龄为x 时,身高的估计值,应选C .5.(2021·西宁模拟)为了规定工时定额,需要确定加工零件所花费的时间,为此进展了5次试验,得到5组数据(x 1,y 1),(x 2,y 2),(x 3,y 3),(x 4,y 4)(x 5,y 5).根据收集到的数据可知x =20,由最小二乘法求得回归直线方程为y ^x +48,那么5i =1y i =( D )A .60B .120C .150D .300[解析] 由题意,x =20,回归直线方程为y ^x +48,∴y ^=0.6×20+48=60.那么 i =15y i =60×5=300.应选D .6.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^x -85.71,那么以下结论中不正确的选项是.......( D ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x -,y -)C .假设该大学某女生身高增加1cm ,那么其体重约增加gD .假设该大学某女生身高为170cm ,那么可断定其体重必为 [解析] 此题考察线性回归方程.D 项中身高为170cm 时,体重“约为〞58.79,而不是“确定〞,回归方程只能作出“估计〞,而非确定“线性〞关系.二、填空题7.以下五个命题,正确命题的序号为__③④⑤__. ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进展研究.[解析] 变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.8.(2021·兰州模拟)变量 x ,y 具有线性相关关系,它们之间的一组数据如下表所示,假设y 关于 x 的线性回归方程为y ^x -1,那么m =____.x 1 2 3 4 ym4[解析] 由题意,x =2.5,代入线性回归方程为y ^x -1,可得y =2.25, ∴0.1+1.8+m +4=4×2.25, ∴m =3.1. 故答案为3.1.9.以下是某地区的降雨量与年平均气温的一组数据: 年平均气温(℃)年降雨量(mm) 542507813574701432464根据这组数据可以推断,该地区的降雨量与年平均气温__不具有__相关关系.(填“具有〞或“不具有〞)[解析] 画出散点图,观察可知,降雨量与年平均气温没有相关关系.三、解答题10.为了迎接2021年俄罗斯世界杯,某协会组织了一次“迎2021世界杯,手工制作助威旗〞活动,将俄罗斯世界杯的标志以手工刺绣的方式刺绣到红色的三角形的旗子上面,来为世界杯加油.在10次制作中测得的数据如下: 助威旗数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间Y (小时)626875818995102108115122试问:(1)x 与Y 是否具有线性相关关系?(2)如果x 与Y 具有线性相关关系,求出Y 对x 的回归直线方程,并根据回归直线方程,预测加工2021个助威旗需多少天(准确到1)?注:每天工作8小时.(参考数据:x =55,y =91.7,∑i =110x 2i =38500,∑i =110y 2i =87 777,∑i =110x i y i =55950,38500-10×552-8250,38500-10×552≈91,错误!≈61)[解析] (1)作散点图如下图从图中可以看出,各点都散布在一条直线附近,即它们线性相关. (2)由所给数据求得b =∑i =110x i y i -10xy∑i =110x 2i -10x 2=,38500-10×552)∴a =y -b x =91.7-0.668×55∴Y 对x 的回归直线方程为 y ^x当x =2021时,y ^=54.96+0.668×2021=1397.64(小时)又1397.64÷8=174.705(天)∴加工2021个助威旗所需时间约为175天.B 级 素养提升1.(2021·保定一模)具有线性相关的变量x ,y ,设其样本点为A i (x i ,y i )(i =1,2,…,8),回归直线方程为y ^=12x +a ,假设OA 1→+OA 2→+…+OA 8→=(6,2),(O 为原点),那么a =( B )A .18B .-18C .14D .-14[解析] 计算x =18×(x 1+x 2+…+x 8)=68=34,y =18×(y 1+y 2+…+y 8)=28=14;回归直线方程为y ^=12x +a ,∴14=12×34+a , 解得a =-18.应选B .2.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,那么( C )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 1[解析] ∵变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),∴X =10+11.3+11.8+12.5+135=11.72,Y =1+2+3+4+55=3,i =15(x i -x)(y i -y )=(10-11.72)×(1-3)+(11.3-11.72)×(2-3)+(11.8-11.72)×(3-3)+(12.5-11.72)×(4-3)+(13-11.72)×(5-3)=7.2,∑i =15 x i -x2∑i =15 y i -y2=19.172,∴这组数据的相关系数是r 1=,19.172)=0.3755,变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),U =15(10+11.3+11.8+12.5+13)=11.72, V =5+4+3+2+15=3,∑i =15(U i -U)(V i -V )=(10-11.72)×(5-3)+(11.3-11.72)×(4-3)+(11.8-11.72)×(3-3)+(12.5-11.72)×(2-3)+(13-11.72)×(1-3)=-7.2,∑i =15U i -U2·∑i =15V i -V2=19.172.∴这组数据的相关系数是r 2=-0.3755,∴第一组数据的相关系数大于零,第二组数据的相关系数小于零,应选C . 二、填空题3.(2021·张店区校级模拟)在一组样本数据(x 1,y 1),(x 2,y 2),…(x 6,y 6)的散点图中,假设所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-1附近波动.经计算∑i =16x i =11,∑i =16y i =13,∑i =16x 2i =21,那么实数b 的值为__1921__.[解析] 根据题意,把对应点的坐标代入曲线y =bx 2-1,y 1=bx 11-1,y 2=bx 22-1,…y 6=bx 26-1,∴y 1+y 2+…+y 6=b (x 21+x 22+…+x 26)-6, ∴13=b ×21-6,∴b =1921,故答案为1921.4.某品牌服装专卖店为了解保暖衬衣的销售量y (件)与平均气温x (℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:时间 二月上旬二月中旬二月下旬 三月上旬 旬平均气温x (℃)381217旬销售量y (件) 55 m 33 24由表中数据算出线性回归方程y ^=bx +a 中的b =-2,样本中心点为(10,38). (1)表中数据m =__40__;(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__14件__.[解析] (1)由y =38,得m =40. (2)由a =y -b x 得a =58, 故y ^=-2x +58, 当x =22时,y ^=14,故三月中旬的销售量约为14件. 三、解答题5.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积(m 2) 115 110 80 135 105 销售价格(万元)22(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 2时的销售价格. [解析] (1)数据对应的散点图如以下图所示:(2)x =15∑5 i =1x i =109,l xx =∑5i =1 (x i -x )2=1570, y =23.2,l xy =∑5i =1 (x i -x )(y i -y )=308.设所求回归直线方程为y ^=b ^x +a ^,那么b ^=l xy l xx =3081570≈0.1962,a ^=y -b ^x =1.8166.故所求回归直线方程为y ^x +1.8166.(3)据(2),当x =150m 2时,销售价格的估计值为y ^=0.1962×150+1.8166=31.2466(万元).6.(2021·全国卷Ⅱ理,18)以下图是某地区2000年至2021年环境根底设施投资额y (单位:亿元)的折线图.为了预测该地区2021年的环境根底设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2021年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^t ;根据2021年至2021年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^t .(1)分别利用这两个模型,求该地区2021年的环境根底设施投资额的预测值. (2)你认为用哪个模型得到的预测值更可靠?并说明理由.[解析] (1)利用模型①,可得该地区2021年的环境根底设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2021年的环境根底设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(i)从折线图可以看出,2000年至2021年的数据对应的点没有随机散布在直线yt 上下,这说明利用2000年至2021年的数据建立的线性模型①不能很好地描述环境根底设施投资额的变化趋势.2021年相对2021年的环境根底设施投资额有明显增加,2021年至2021年的数据对应的点位于一条直线的附近,这说明从2021年开场环境根底设施投资额的变化规律呈线性增长趋势,利用2021年至2021年的数据建立的线性模型y ^t 可以较好地描述2021年以后的环境根底设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2021年的环境根底设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比拟合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分)C 级 能力拔高炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x 与冶炼时间y (从炉料熔化完毕到出钢的时间)的一组数据,如下表所示:x /0.01% 104 180 190 177 147 134 150 191 204 121 y /min100200210185155135170205235125(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗? (2)求回归直线方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?[解析] (1)x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图.从图中可以看出,各点分布在一条直线附近,所以它们线性相关. (2)列出下表,并用科学计算器进展计算:i 1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i10 40036 00039 90032 74522 78518 09025 50039 15547 94015 125x =159.8,y =172,∑i =110x 2i=265 448,∑i =110y 2i=312 350,∑i =110x i y i =287 640设所求的回归直线方程为=x +,=∑i =110x i y i -10x·y∑i =110x 2i -10x 2≈1.267,=y -x ≈-30.47,即所求的回归直线方程为=1.267x -30.47.(3)当x =160时,=1.267×160-30.47≈172(min ),即大约冶炼172 min .。

人教版数学高二A版选修2-3单元检测第三章统计案例(附答案)

人教版数学高二A版选修2-3单元检测第三章统计案例(附答案)

数学人教版A2-3第三章 统计案例单元检测(时间:45分钟,满分:100分)一、选择题(每小题6分,共48分)1( ).A .一次函数模型B .二次函数模型C .指数函数模型D .对数函数模型2.工人月工资y (元)随劳动生产率x (千元)变化的回归方程为ˆy=50+80x .下列判断错误的是( ).A .劳动生产率为1 000元时,工资约为130元B .劳动生产率提高1 000元时,工资提高130元C .劳动生产率提高1 000元时,工资提高80元D .当月工资约为210元时,劳动生产率为2 000元3.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为ˆy=0.66x +1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( ).A .83%B .72%C .67%D .66%4.若两个变量的残差平方和是325,21()nii x y =-∑=923,则随机误差对预报变量的贡献率约为( ). A .64.8% B .60% C .35.2% D .40% 5.下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②用相关指数可以刻画回归的效果,值越小说明模型的拟合效果越好; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型拟合效果越好.其中说法正确的是( ). A .①② B .②③ C .①③ D .①②③6.(创新题)独立检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (K 2≥6.635)=0.010表示的意义是( ). A .变量X 与变量Y 有关系的概率为1%B .变量X 与变量Y 没有关系的概率为99.9%C .变量X 与变量Y 没有关系的概率为99%D .变量X 与变量Y 有关系的概率为99%7( ).A.K2=9.564 B.K2=3.564 C.K2<2.706 D.K2>3.841 8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是().A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关二、填空题(每小题6分,共18分)9.(创新题)已知回归直线ˆy=bx+a斜率的估计值是52,且样本点的中心为(4,5).则当x=-2时,ˆy的值为______.10.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),若e i恒为0,则R2为________.11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的试根据上述数据计算K2=______,比较这两种手术对病人又发作心脏病的影响有没有差别______.三、解答题(共34分)12.(10分)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,求该老师用线性回归分析的方法预测他孙子的身高为多少.13.(12分)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与14.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你能残差分析这个模型能较好地刻画零件数和加工时间的关系吗?参考答案1答案:A解析:画出散点图可观察得点都在一条直线上,故A正确.2答案:B解析:当x=1(千元)时,ˆy=130元,A正确;当ˆy=210元时,x=2105080-=2千元,D正确;当x增加一个单位时,ˆy增加80,C正确.3答案:A解析:因为当ˆy=7.675时,x=7.675 1.5620.66-≈9.262,所以7.6759.262≈0.829≈83%.4答案:C解析:由题意可知随机误差对预报变量的贡献率约为325923=0.352.5答案:C解析:相关指数R2越大,说明模型拟合效果越好,故②错误.6答案:D解析:由题意知变量X与Y没有关系的概率为0.01,即认为变量X与Y有关系的概率为99%.7答案:D解析:由K2=2()()()()()n ad bca b c d a c b d-++++,得K2的观测值k=285(4012528)68174540⨯⨯⨯⨯⨯⨯-≈4.722>3.841.8答案:D解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9答案:-10解析:由已知b=52且4b+a=5,∴a=-5,5ˆ2y x=-5.∴x=-2时,y=-10.10答案:1解析:e i恒为0,说明随机误差总为0,于是y i=ˆy,故R2=1.11答案:1.78不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K2的观测值k=2392(3916729157)68324196196⨯⨯⨯⨯⨯⨯-≈1.78.当H 0成立时,K 2≈1.78,而K 2<2.072的概率为0.85.所以,不能否定假设H 0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.12解:由题意父亲身高x cm 与儿子身高y cm 对应关系如下表:则1731701763x ++==173,1701761823y ++==176, 31()()iii x x y y =--∑=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,321()ii x x =-∑=(173-173)2+(170-173)2+(176-173)2=18.∴18ˆ18b==1. ∴ˆˆay bx =-=176-173=3. ∴线性回归直线方程ˆˆˆybx a =+=x +3. ∴可估计孙子身高为182+3=185(cm).由列联表中的数据,得K 2的观测值为k =2200(70653530)10010010595⨯⨯⨯⨯⨯⨯-≈24.561>10.828.因此,有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.14解:(1)根据表中数据作出散点图,如图所示.间对零件数的线性回归方程为ˆy=0.668x+54.93.(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示.由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图也可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.。

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)

一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)

一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。

高中数学人教A版选修2-3 第三章 统计案例 3.2学业分层测评 Word版含答案

高中数学人教A版选修2-3 第三章 统计案例 3.2学业分层测评 Word版含答案

学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.通过对K2的统计量的研究得到了若干个临界值,当K2≤2.706时,我们认为()A.在犯错误的概率不超过0.05的前提下认为X与Y有关系B.在犯错误的概率不超过0.01的前提下认为X与Y有关系C.没有充分理由认为X与Y有关系D.不能确定【解析】∵K2≤2.706,∴没有充分理由认为X与Y有关系.【答案】 C2.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.【答案】 C3.分类变量X和Y的列联表如下:A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越弱C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强【解析】对于同一样本,|ad-bc|越小,说明X与Y之间关系越弱;|ad-bc|越大,说明X与Y之间的关系越强.【答案】 C4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是()A.k≥6.635B.k<6.635C.k≥7.879 D.k<7.879【解析】有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.【答案】 C5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下表的列联表:由K2=n(ad(a+b)(c+d)(a+c)(b+d)算得,k=110×(40×30-20×20)260×50×60×50≈7.8.附表:A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【解析】由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.【答案】 C二、填空题6.在对某小学的学生进行吃零食的调查中,得到如下表数据:【导学号:97270063】【解析】由公式可计算得k=102×(27×29-34×12)239×63×61×41≈2.334.【答案】 2.3347.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射14天内的结果如表所示:【解析】根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与电离辐射的剂量无关”.【答案】小白鼠的死亡与电离辐射的剂量无关8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)【解析】 K 2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.【答案】 ③ 三、解答题9.用两种检验方法对某食品做沙门氏菌检验,结果如下表.附:(1)(2)能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?【解】 (1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.(2)通过计算可知K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )≈113.184 6.而查表可知,因为P (K 2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.10.有人发现一个有趣的现象,中国人的邮箱里含有数字比较多,而外国人邮箱名称里含有数字比较少,为了研究国籍和邮箱名称里含有数字的关系,他收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立2×2列联表;(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?【解】(1)2×2的列联表:(2)假设“由表中数据得k=124×(43×33-27×21)270×54×64×60≈6.201.因为k>5.024,所以有理由认为假设“国籍和邮箱名称里与是否含有数字无关”是不合理的,即在犯错误的概率不超过0.025的前提下认为“国籍和邮箱名称里与是否含有数字有关”.[能力提升]1.对两个分类变量A,B,下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据.A.1B.2C.3D.0【解析】①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.【答案】 A2.(2016·晋江市季延中学期中)某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列叙述中正确的是()A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,那么他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%【解析】K2≈3.918>3.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,故选A.【答案】 A3.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:设H k≈________(小数点后保留一位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【解析】由公式计算得K2的观测值k≈4.9.∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.【答案】 4.95%4.(2016·潍坊高二检测)为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10 000株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:(1)6株玉米,再从这6株玉米中随机选出2株,求这2株之中既有高茎玉米又有矮茎玉米的概率;(2)根据对玉米生长情况作出的统计,是否有95%的把握认为玉米的圆粒与玉米的高茎有关?【解】(1)依题意,取出的6株圆粒玉米中含高茎2株,记为a,b;矮茎4株,记为A,B,C,D,从中随机选取2株的情况有如下15种:aA,aB,aC,aD,bA,bB,bC,bD,ab,AB,AC,AD,BC,BD,CD.其中满足题意的共有aA,aB,aC,aD,bA,bB,bC,bD,共8种,则所求概率为P=8 15.(2)根据已知列联表,得k=50×(11×7-13×19)230×20×24×26≈3.860>3.841,即有95%的把握认为玉米的圆粒与玉米的高茎有关.。

高中数学统计案例综合检测试题及答案-word文档

高中数学统计案例综合检测试题及答案-word文档

高中数学统计案例综合检测试题及答案选修2-3第三章统计案例综合检测时间120分钟,满分150分。

一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.(2019宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4用水量y 4.5 4 3 2.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于() A.10.5 B.5.15C.5.2 D.5.25[答案] D[解析] x=2.5,y=3.5,∵回归直线方程过定点(x,y),3.5=-0.72.5+a,a=5.25.故选D.2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反[答案] A[解析] 因为b0时,两变量正相关,此时,r0;b0时,两变量负相关,此时r0.3.有下列说法:①随机误差是引起预报值与真实值之间的误差的原因之一;②残差平方和越小,预报精度越高;③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.其中真命题的个数是()A.0 B.1C.2 D.3[答案] D4.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下:甲X 110 120 125 130 135P 0.1 0.2 0.4 0.1 0.2乙X 100 115 125 130 145P 0.1 0.2 0.4 0.1 0.2现要比较两种钢材哪一种抗拉强度较好,应考察哪项指标() A.期望与方差 B.正态分布C.卡方K2 D.概率[答案] A5.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.期望与方差 B.排列与组合C.独立性检验 D.概率[答案] C6.(2009海南宁夏理,3)对变量x,y观测数据(x1,y1)(i =1,2,…,10),得散点图1;对变量u,v有观测数据(u1,v1)(i=1,2,…,10),得散点图2.由这两个散点图可以判断.()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[答案] C[解析] 本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力.用散点图可以判断变量x与y负相关,u与v正相关.7.某地2019年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:行业名称计算机机械营销物流贸易应聘人数 215830 201950 154676 74570 65280行业名称计算机营销机械建筑化工招聘人数 124620 102935 89115 76516 70436若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中数据,就业形势一定是() A.计算机行业好于化工行业B.建筑行业好于物流行业C.机械行业最紧张D.营销行业比贸易行业紧张[答案] B[解析] 建筑行业的比值小于6528076516,物流行业的比值大于7457070436,故建筑好于物流.8.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的回归方程为y^=650+80x,下列说法中正确的个数是()①劳动生产率为1000元时,工资约为730元;②劳动生产率提高1000元时,则工资约提高80元;③劳动生产率提高1000元时,则工资约提高730元;④当月工资为810元时,劳动生产率约为2019元.A.1 B.2C.3 D.4[答案] C[解析] 代入方程计算可判断①②④正确.9.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是()A.由样本数据得到的回归方程为y^=b^x+a^必过样本点的中心(x-,y-)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数r=-0.9362,则变量y和x之间具有线性相关关系[答案] C[解析] R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.10.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是()A.三维柱形图 B.二维条形图C.等高条形图 D.独立性检验[答案] D[解析] 前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.11.在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合得最好的模型为()A.模型1的相关指数R2为0.75B.模型2的相关指数R2为0.90C.模型3的相关指数R2为0.25D.模型4的相关指数R2为0.55[答案] B[解析] 相关指数R2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.12.下面是某市场农产品的调查表.市场供应量表:单价(元/千克) 2 2.4 2.8 3.2 3.6 4供应量(1000千克) 50 60 70 75 80 90市场需求量表:单价(元/千克) 4 3.4 2.9 2.6 2.3 2供应量(1000千克) 50 60 70 75 80 90根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间()A.(2.3,2.6) B.(2.4,2.6)C.(2.6,2.8) D.(2.8,2.9)[答案] C[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上)13.当且仅当r满足________时,数据点(xi,yi)(i=1,2,…,n)在一条直线上.[答案] |r|=1[解析] 当数据点(xi,yi)在一条直线上时,y只受x的影响,即数据点完全线性相关,此时|r|=1.14.已知一个回归直线方程为y^=1.5x+45,x{1,7,5,13,19},则y=__________.[答案] 58.5[解析] 因为x=15(1+7+5+13+19)=9,且y=1.5x+45,所以y=1.59+45=58.5.本题易错之处是根据x的值及y^=1.5x+45求出y的值再求y,由y^=1.5x+45求得的y值不是原始数据,故错误.15.对具有线性相关关系的变量x和y,测得一组数据如下表.若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为________.x 2 4 5 6 8y 30 40 60 50 70[答案] y^=17.5+6.5x[解析] 由数据表得x=5,y=50,所以a^=y-6.5x=17.5,即回归直线方程为y^=17.5+6.5x.16.(2019广东文,12)某市居民2019~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份 2019 2019 2019 2019 2009收入x 11.5 12.1 13 13.3 15支出Y 6.8 8.8 9.8 10 12根据统计资料,居民家庭平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本题满分10分)为了调查胃病是否与生活规律有关,调查某地540名40岁以上的人得结果如下:患胃病未患胃病合计生活不规律 60 260 320生活有规律 20 200 220合计 80 460 540根据以上数据回答40岁以上的人患胃病与生活规律有关吗?[解析] k=540(60200-26020)232022080460=24969602590729.638∵9.638>6.63540岁以上的人患胃病与生活是否有规律有关,有99%的把握认为生活不规律的人易患胃病.18.(本题满分12分)一台机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下面表格中的数据是几次试验的结果.速度(转/秒) 每小时生产有问题物件数8 512 814 916 11(1)求出机器速度影响每小时生产有问题物件数的回归直线方程;(2)若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?[解析] (1)用x表示机器速度,y表示每小时生产有问题物件数,那么4个样本数据为:(8,5)、(12,8)、(14,9)、(16,11),则x-=12.5,y-=8.25.于是回归直线的斜率为b^=xiyi -4x-y-x2i-4x-2=25.5350.7286,a^=y--b^x-=-0.8575,所以所求的回归直线方程为y=0.7286x-0.8575.(2)根据公式y^=0.7286x-0.8575,要使y10,则就需要0.7286x-0.857510,x14.9019,即机器的旋转速度不能超过14.9019转/秒.19.(本题满分12分)在从烟台大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上晕船的情况如下表所示:晕船不晕船合计男人 32 51 73女人 8 24 32合计 40 75 115根据此资料你是否认为在恶劣气候航行中,男人比女人更容易晕船?[解析] 男人晕船所占比例为3283100%=0.386,女人晕船所占比例为832100%=0.25,虽然0.386远大于0.25,但我们不能用此判断在恶劣气候中航行,男人比女人更容易晕船,而应根据独立性检验进行分析.由公式得:K2=115(3224-518)2833240751.870.因为1.8702.706,所以我们没有充分的证据说晕船跟男女性别有关.20.(本题满分12分)有两个分类变量X与Y,其一组观测的22列联表如下表.其中a,15-a均为大于5的整数,则a取何值时有90%以上的把握认为“X与Y之间有关系”?y1 y2x1 a 20-ax2 15-a 30+a[解析] 查表可知,要使有90%以上的把握认为X与Y之间有关系,则K22.706,而其观测值k=65[a(30+a)-(20-a)(15-a)]220451550 =13(65a-300)2604550=13(13a-60)26090,解k2.706得a7.19或a2.04.又因为a5且15-a5,aZ,所以a=8,9,故当a取8或9时有90%以上的把握认为“X与Y之间有关系”.[点拨] 首先计算K2值,由题意K22.706,求得a的范围,再结合a5且15-a5,aZ,即可求得a的值.21.(本题满分12分)某超市为了了解热茶销售与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:气温x(℃) 26 18 13 10 4 -1杯数y 20 24 34 38 50 64画出散点图并计算相关系数r,判断热茶销售量与气温之间是否具有线性相关关系.[解析] 由表中数据画出散点图如图所示.由表中数据得x=16(26+18+13+10+4-1)11.67,y=16(20+24+34+38+50+64)38.33,i=16xiyi=2620+1824+1334+1038+450-164=1910,i =16x2i=262+182+132+102+42+(-1)2=1286,i=16y2i=202+242+342+382+502+642=10172,所以r-0.97,因为|r|0.970.75,所以热茶销售量与气温之间具有很强的线性相关关系.22.(本题满分14分)在一个文娱网络中,点击观看某个节目的累积人次和播放天数如下表:播放天数 1 2 3 4 5点击观看的累积人次 51 134 213 235 262播放天数 6 7 8 9 10点击观看的累积人次 294 330 378 457 533(1)画出散点图;(2)判断两变量之间是否具有线性相关关系,求回归直线方程是否有意义?[解析] (1)散点图如图所示.(2)由散点图知两变量线性相关,故求回归直线方程有意义.或借助科学计算器,完成下表中的有关计算.i 1 2 3 4 5 6 7 8 9 10xi 1 2 3 4 5 6 7 8 9 10yi 51 134 213 235 262 294 330 378 457 533xiyi 51 268 639 940 1310 1764 2310 3024 4113 5330x=5.5,y=288.7,i=110x2i=385,i=110y2i=1020953,i=110xiyi=19749 利用上表的结果,计算累积人次与播放天数之间的相关系数r=19749-105.5288.7(385-105.52)(1020953-10288.72)0.9840.75.这说明累积人次与播放天数之间存在着线性相关关系,自然求回归直线方程有意义.。

高中数学人教A版选修2-3第三章统计案例本章复习与测试(1)

高中数学人教A版选修2-3第三章统计案例本章复习与测试(1)

高中数学人教A 版选修2-3第三章统计案例本章复习与测试(1)学校:___________姓名:___________班级:___________考号:___________一、单选题1.已知x ,y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且0.95y x a =+,则a 等于( ) A .1.30B .1.45C .1.65D .1.802.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程为0.70.35y x =+,则下列结论错误的是( )A .产品的生产能耗与产量呈正相关B .回归直线一定过4.5,3.5() C .A 产品每多生产1吨,则相应的生产能耗约增加0.7吨 D .t 的值是3.15 3.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试.统计得到成绩与专业的2×2列联表:附:参考公式及数据:(1)统计量:K2=(n=a+b+c+d).(2)独立性检验的临界值表:则下列说法正确的是( )A.有99%的把握认为环保知识测试成绩与专业有关B.有99%的把握认为环保知识测试成绩与专业无关C.有95%的把握认为环保知识测试成绩与专业有关D.有95%的把握认为环保知识测试成绩与专业无关4.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x+ˆa.若在这些样本点中任取一点,则它在回归直线左下方的概率为()A.16B.13C.12D.23二、填空题5.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2≈4.844,则认为选修文理科与性别有关系出错的可能性约为________.6.高三某班学生每周用于物理学习的时间x(单位:小时)与物理成绩y(单位:分)之间有如下关系:根据上表可得回归方程的斜率为3.53,则回归直线在y轴上的截距为________.(精确到0.1)三、解答题7.(2017·深圳二模)在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在S市的A区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记x表示在各区开设分店的个数,y表示这x个分店的年收入之和.(1)该公司已经过初步判断,可用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;(2)假设该公司在A区获得的总年利润z(单位:百万元)与x,y之间的关系为z=y-0.05x2-1.4,请结合(1)中的线性回归方程,估算该公司应在A区开设多少个分店时,才能使A区平均每个分店的年利润最大?参考公式:8.某人事部门对参加某次专业技术考试的100人的成绩进行了统计,绘制的频率分布直方图如图所示.规定80分以上者晋级成功,否则晋级失败(满分为100分).(1)求图中a的值;(2)估计该次考试的平均分x (同一组中的数据用该组的区间中点值代表);(3)根据已知条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关.参考公式:22()()()()()n ad bcka b c d a c b d-=++++,其中n a b c d=+++参考答案1.B【分析】计算平均数,可得样本中心点,代入线性回归方程,即可求得a的值.【详解】依题意,得16x=⨯(0+1+4+5+6+8)=4,16y=⨯(1.3+1.8+5.6+6.1++7.4+9.3)=5.25.又直线y=0.95x+a必过中心点(,x y),即点(4,5.25),于是5.25=0.95×4+a,解得a=1.45. 故选B.【点睛】本题考查线性回归方程,利用线性回归方程恒过样本中心点是关键.2.D【解析】由题意,x=34564+++=4.5,∵ˆy=0.7x+0.35,∴y=0.7×4.5+0.35=3.5,∴t=4×3.5﹣2.5﹣4﹣4.5=3,故选D.3.C【解析】试题分析:由列联表中数据,代入公式,求出X2的值,进而与3.841进行比较,即可得出能否有95%的把握认为环保知识测试成绩与专业有关.解:由两个班同学的统计得到成绩与专业的列联表:根据列联表中的数据可得X2=40(14×13﹣6×7)2÷(21×19×20×20)≈4.912>3.841∴有95%的把握认为环保知识测试成绩与专业有关.故选C .点评:本题考查独立性检验的应用,考查数据处理能力、运算求解能力和应用意识,本题解题的关键是正确运算出观测值,理解临界值对应的概率的意义,要想知道两个变量之间的有关或无关的精确的可信程度,只有利用独立性检验的有关计算,才能做出判断,本题是一个基础题. 4.B 【解析】试题分析:样本中心点坐标为13,802⎛⎫⎪⎝⎭,所以1380410ˆ62a =+⨯=,所以回归直线方程为4106y x ∧=-+,经验证可知有2个点位于回归直线左下方,其概率为2163=,故选B. 考点:回归直线方程. 5.5% 【解析】∵4.844>3.841,且P (K 2≥3.841)≈0.05.∴可认为选修文科与性别有关系出错的可能性为5%. 答案:5% 6.13.5 【解析】 由已知可得1(24152319161120161713)17.4)10x =+++++++++=, 1(92799789644783687159)74.910y =+++++++++=,所以样本中心点为(17.4,74.9.由题意设回归直线方程为 3.5ˆ3ˆyx a =+ 因为回归直线方程过样本中心点,所以74.9 3.5317.ˆ4a =⨯+, 解得ˆ13.5a≈. 即回归直线在y 轴上的截距为13.5. 答案:13.57.(1)y=0.85x+0.6.(2)开设4个分店【解析】试题分析:(1)由题中所给数据及公式可得线性回归方程为0.850.6y x=+.(2)设该区每个分店的平均利润为t,由(1)可得t的预测值t与x之间的关系为0.80.05.5ˆ8ˆ0zt xx x==--+,由基本不等式可得x=4时t有最大值,故可估算开设4个分店才能使A区的每个分店的平均年利润最大.试题解析:(1)法一:由表中数据和参考数据得,=4,=4, (x i-)2=10, (x i-)(y i-)=5,∴b===0.85,∴a=-=4-4×0.85=0.6,∴线性回归方程y=0.85x+0.6.法二:由表中数据和参考数据得,=4,=4,x i y i=88.5,x=90,∴b===0.85,∴a=-=4-4×0.85=0.6,∴线性回归方程y=0.85x+0.6.(2)由题意,可知总年利润z的预测值z与x之间的关系为z=-0.05x2+0.85x-0.8,设该区每个分店的平均利润为t,则ˆztx =,∴t的预测值t与x之间的关系为t=-0.05x-+0.85=-0.01+0.85≥-0.01×2+0.85=0.45,当且仅当5x=,即x=4时,t取到最大值,∴该公司在A区开设4个分店时,才能使A区的每个分店的平均年利润最大.点睛:(1)求线性回归方程时,可根据定义求出相应的系数即可得到方程.求线性回归方程的最大难点是系数计算较为繁琐,计算时要仔细认真,随时做好检查,防止错误数据给后续步骤带来连锁反应.为避免出错,以及出错后便于检查,可将公式分解分别求值.(2)在得到回归方程后,可将待预测的值代入回归方程中便可得预测结果.a=;(Ⅱ)74分;(Ⅲ)见解析.8.(Ⅰ)0.005【分析】(1)由频率和为1,列方程求出a的值;(2)利用直方图中各小组中点乘以对应的频率,求和得平均分;(3)根据题意填写,计算观测值K2,对照临界值得出结论.【详解】(1)由频率分布直方图各小长方形面积总和为1,可知()20.0200.0300.040101a+++⨯=,故0.005a=.50,60,60,70,70,80,80,90,90,100,(2) 由频率分布直方图知各小组依次是[)[)[)[)[]其中点分别为55,65,75,85,95,对应的频率分别为0.05,0.30,0.40,0.20,0.05,故可估计平均分x=⨯+⨯+⨯+⨯+⨯=(分)550.05650.3750.4850.2950.0574+=,(3)由频率分布直方图知,晋级成功的频率为0.200.050.25⨯=(人),故填表如下故晋级成功的人数为1000.2525假设“晋级成功”与性别无关,根据上表数据代入公式可得()2210016413492.613 2.07225755050K⨯⨯-⨯=≈>⨯⨯⨯,所以有超过85%的把握认为“晋级成功”与性别有关.【点睛】本题考查了频率分布直方图与独立性检验的应用问题,是基础题;条形分布直方图的面积表示的是概率值,中位数是位于最中间的数,故直接找概率为0.5的即可;平均数是每个长方条的中点乘以间距再乘以长方条的高,将每一个数值相加得到.。

上海陆行中学北校高中数学选修2-3第三章《统计案例》测试(有答案解析)

上海陆行中学北校高中数学选修2-3第三章《统计案例》测试(有答案解析)

一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( ) 性别 说谎 不说谎 总计 男 6 7 13 女 8 9 17 总计141630A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关 2.下列关于回归分析与独立性检验的说法正确的是() A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;3.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k ,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响4.给出下列说法:①用()()221211ˆn i i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个5.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:( )优秀 非优秀 总计 A 班14 6 20 B 班7 13 20 总计211940附:参考公式及数据:(1)统计量:()()()()()22n ad bc K a b c d a c b d -=++++,(n a b c d =+++).(2)独立性检验的临界值表:()20P K k ≥0.050 0.010 0k 3.8416.635则下列说法正确的是A .有95%的把握认为环保知识测试成绩与专业有关B .有95%的把握认为环保知识测试成绩与专业无关C .有99%的把握认为环保知识测试成绩与专业有关D .有99%的把握认为环保知识测试成绩与专业无关6.如图所示,茎叶图记录了甲、乙两组各4名学生完成某道数学题的得分情况,该题满分为12分.已知甲、乙两组学生的平均成绩相同,乙组某个数据的个位数字模糊,记为x .则下列命题正确的是( )A.甲组学生的成绩比乙组稳定B.乙组学生的成绩比甲组稳定C.两组学生的成绩有相同的稳定性D.无法判断甲、乙两组学生的成绩的稳定性7.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A.有95%的把握认为两者无关B.约有95%的打鼾者患心脏病C.有99%的把握认为两者有关D.约有99%的打鼾者患心脏病8.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()A.90% B.95% C.97.5% D.99.5%9.某班主任对全班50名学生进行了作业量的调查,数据如下表:()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.0510.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1;③若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .4 11.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1B .2C .3D .4 12.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位二、填空题13.给出以下四个命题:①设,,a b c 是空间中的三条直线,若a b ⊥,b c ⊥,则//a c .②在面积为S 的ABC 的边AB 上任取一点P ,则PBC 的面积大于S4的概率为34.③已知一个回归直线方程为 1.545y x =+{}()1,5,7,13,19,1,2,...,5i x i ∈=,则58.5=y . ④数列{}n a 为等差数列的充要条件是其通项公式为n 的一次函数. 其中正确命题的序号为________.(把所有正确命题的序号都填上) 14.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系)15.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________. 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.给出下列四个结论:(1)如图Rt ABC ∆中,2,90,30.AC B C =∠=︒∠=︒是斜边上的点,.以为起点任作一条射线交于点,则点落在线段上的概率3(2)设某大学的女生体重与身高具有线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则若该大学某女生身高增加,则其体重约增加;(3)若()f x 是定义在上的奇函数,且满足,则函数()f x 的图像关于对称;(4)已知随机变量ξ服从正态分布()()21,,40.79,N P σξ≤=则.其中正确结论的序号为________________18.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:感染 未感染 总计服用 10 40 50 未服用 2030 50总计30 70100参考公式: ()()()()()22n ad bc K a b c d a c b d -=++++()2P K k >0.15 0.100.050.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.828参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”. 19.以下说法正确的是_____________ . ①类比推理属于演绎推理.②设有一个回归方程ˆ23yx =- ,当变量每增加1个单位,y 平均增加3个单位. ③样本相关系数r 满足以下性质:1r ≤,并且r 越接近1,线性相关程度越强;r 越接近0,线性相关程度越弱.④对复数12,z z 和自然数n 有()1212nn n z z z z ⋅=⋅.20.有如下四个命题:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.②相关系数0.83r =-,表明两个变量的相关性较弱.③若由一个2⨯2列联表中的数据计算得2K 的观测值 4.103k ≈,那么有95%的把握认为两个变量有关.④用最小二乘法求出一组数据(,),(1,,)i i x y i n =的回归直线方程ˆˆˆy bx a =+后要进行残差分析,相应于数据(,),(1,,)i i x y i n =的残差是指()ˆˆˆi i ie y bx a =-+. 以上命题“错误”的序号是_________________三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.“直播带货”是指通过一些互联网平台,使用直播技术进行商品线上展示、咨询答疑、导购销售的新型服务方式.某高校学生会调查了该校100名学生2020年在直播平台购物的情况,这100名学生中有男生60名,女生40名.男生中在直播平台购物的人数占男生总数的23,女生中在直播平台购物的人数占女生总数的78. (1)填写22⨯列联表,并判断能否有99%的把握认为校学生的性别与2020年在直播平台购物有关?2020年在直播平台购物的概率,从全校所有学生中随机抽取4人,记这4人中2020年在直播平台购物的人数与未在直播平台购物的人数之差为X ,求X 的分布列与期望.附:n a b c d =+++,22()()()()()n ad bc K a b c d a c b d -=++++. 23.某土特产超市为预估2021年元旦期间游客购买土特产的情况,对2020年元旦期间的购买情况进行随机抽样并统计,得到如下数据:(1)估计游客平均购买金额(同一组中的每个数据可用该组区间的中点值代替); (2)根据以上数据完成22⨯列联表,并判断是否有90%的把握认为购买金额是否少于60元与性别有关.附:参考公式和数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++. 附表:)2k24.2020年3月,因为新冠肺炎疫情的影响,我市全体学生只能在网上在线学习,为了研究学生在线学习情况,市教研院数学学科随机从市区各高中学校抽取120名学生对线上教学情况进行调查(其中,男生与女生的人数之比为3:1),结果发现:男生中有40名对于线上教学满意,女生中有10名表示对于线上教学不满意.(1)请完成如表2×2列联表,并回答能否有95%的把握认为对“线上教学是否满意与性别有关”;(2)采用分层抽样的方法,从被调查的对线上教学满意的学生中,抽取6名学生,再从这6名学生中抽取2名学生,作线上学习的经验介绍,求所选取的2名学生性别不同的概率.附:参考公式及临界值表()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++25.根据教育部《中小学生艺术素质测评办法》,为提高学生审美素养,提升学生的综合素质,江苏省中考将增加艺术素质测评的评价制度,将初中学生的艺术素养列入学业水平测试范围.为初步了解学生家长对艺术素质测评的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下:了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X,求X 的概率分布列和数学期望.附:()()()()2n ad bc a b c d a c b d χ-=++++,()n a b c d =+++.临界值表:26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下: (1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.D解析:D 【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案. 【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A 、B 、C 均错误,故答案选D . 【点睛】本题主要考查了回归分析与独立性检验的定义的区别.3.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.4.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.5.A解析:A 【解析】分析:首先计算观测值k 0的值,然后给出结论即可. 详解:由列联表计算观测值:()2401413672804.912 3.8412119202057k ⨯⨯-⨯==≈>⨯⨯⨯, 则有95%的把握认为环保知识测试成绩与专业有关. 本题选择A 选项.点睛:本题主要考查独立性检验及其应用等知识,意在考查学生的转化能力和计算求解能力.6.A解析:A 【解析】()x 甲=14×(9+9+11+11)=10,x 乙=14×(8+9+10+x +12)=10,解得x =1.又2s 甲=14×[(9-10)2+(9-10)2+(11-10)2+(11-10)2]=1,2s 乙=14×[(8-10)2+(9-10)2+(11-10)2+(12-10)2]=52,∴2s 甲<2s 乙,∴甲组学生的成绩比乙组稳定. 故答案为A.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.C解析:C【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.9.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B10.B解析:B【解析】由题意得,若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为4,所以③不正确;对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.11.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.12.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.二、填空题13.②③【分析】对①举出反例即可对②根据几何概型的方法确定的面积大于的概率即可对③利用回归直线方程经过样本中心点求解即可对④举出反例即可【详解】对①长方体中相交于同一顶点的三条棱互相垂直满足但故①错误对解析:②③ 【分析】对①,举出反例即可.对②,根据几何概型的方法确定PBC 的面积大于S4的概率即可. 对③,利用回归直线方程经过样本中心点求解即可. 对④,举出反例即可. 【详解】对①,长方体中相交于同一顶点的三条棱互相垂直,满足a b ⊥,b c ⊥,但a c ⊥.故①错误. 对②,当PBC 的面积大于S4时,14AB PB AB ≤≤,故②正确. 对③,易得()1157131995x =++++=,又 1.545 1.594558.5y x =+=⨯+=,故③正确. 对④,0n a =也为等差数列,但通项公式不为n 的一次函数.故④错误. 故②③正确. 故答案为:②③ 【点睛】本题主要考查了命题真假的判定,包括空间中的线面位置关系判定、几何概型、回归方程与等差数列等,需要根据各章节的知识点进行证明或者举出反例,属于中档题.14.【解析】分析:由题意首先将非线性问题转化为线性问题然后结合线性回归方程的公式整理计算即可求得最终结果详解:对回归方程:两侧作对数运算可得:即与之间具有线性相关关系结合题中的图片可知两者之间的回归方程解析:0.2720 3.8492ˆx ye -= 【解析】分析:由题意首先将非线性问题转化为线性问题,然后结合线性回归方程的公式整理计算即可求得最终结果.详解:对回归方程:y 21c xc e =两侧作对数运算可得:21l ˆln n yc x c =+, 即ln ˆy与x 之间具有线性相关关系, 结合题中的图片可知两者之间的回归方程系数为:1ln 3.84917ˆc a==-,20.27206ˆ2c b ==, 即:ln 0.272026 3.8417ˆ9yx =-,据此可得,红铃虫的产卵数y 对温度x 的回归方程为0.2720 3.8492ˆx ye -=. 点睛:本题主要考查非线性回归方程的计算,等价转化的数学思想等知识,意在考查学生的转化能力和计算求解能力.15.【解析】∵P(K2≥3841)≈005∴判断性别与是否爱好运动有关出错的可能性不超过5点睛:根据卡方公式计算再与参考数据比较就可确定可能性 解析:5%【解析】∵P (K 2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%. 点睛:根据卡方公式计算2K ,再与参考数据比较,就可确定可能性.16.②④⑤【解析】试题分析:线性相关系数越大两个变量的线性相关性越强;反之线性相关性越弱故①错;回归直线方程一定经过样本中心点所以②正确;③的抽样方式为系统抽样故③错;由在含有一个解释变量的线性模型中R解析:②④⑤ 【解析】试题分析:线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱,故①错;回归直线方程一定经过样本中心点(),x y P ,所以②正确;③的抽样方式为系统抽样,故③错;由在含有一个解释变量的线性模型中,R 2恰好等于相关系数r 的平方.显然,R 2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好,故④正确;由回归直线方程可知,当解释变量x 每增加一个单位时,预报变量ˆy增加0.1个单位的解释是正确的,故⑤正确;所以正确的序号为②④⑤. 考点:回归分析的基本思想及其应用初步.17.②③④【解析】试题分析:由题可知•所以则点落在线段上的概率为故 不正确;‚根据线性回归方程为知回归系数为085即身高增加则其体重约增加故 正确;ƒ由于是定义在上的奇函数则于是即函数的图像关于对称故解析:②③④ 【解析】试题分析:由题可知,•,,所以,则点落在线段上的概率为,故 不正确;‚根据线性回归方程为,知回归系数为0.85,即身高增加,则其体重约增加,故 正确;ƒ由于()f x 是定义在上的奇函数,则,于是,即函数()f x 的图像关于对称,故ƒ正确;④随机变量ξ服从正态分布,图像关于对称,由于,故,故④正确;综上所述,正确的为②③④;考点:•两个变量的线性相关 正态曲线分布的特点及曲线所表示的意义18.【详解】由题意可得参照附表可得:在犯错误的概率不超过的前提下认为小动物是否被感染与有没有服用疫苗有关故答案为【方法点睛】本题主要考查独立性检验的应用属于中档题独立性检验的一般步骤:(1)根据样本数据 解析:5%【详解】 由题意可得,()2210010302040 4.762 3.84150503070K ⨯⨯-⨯=≈>⨯⨯⨯,参照附表,可得:在犯错误的概率不超过005的前提下,认为“小动物是否被感染与有没有服用疫苗有关”,故答案为005. 【方法点睛】本题主要考查独立性检验的应用,属于中档题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)19.③④【解析】分析:①根据类比推理与演绎推理的定义即可判断;②根据回归方程的表达式即可判断;③利用线性相关指数的意义即可判断;④根据复数的乘法运算律即可判断详解:对于①类比推理是合情推理的重要形式则不解析:③④ 【解析】分析:①根据类比推理与演绎推理的定义即可判断;②根据回归方程的表达式,即可判断;③利用线性相关指数r 的意义即可判断;④根据复数的乘法运算律即可判断. 详解:对于①,类比推理是合情推理的重要形式,则不属于演绎推理,故①错误;对于②,根据回归方程为ˆ23yx =-,可得当变量每增加1个单位,y 平均减少3个单位,故②错误;对于③,在回归分析中,r 具有以下性质:1r ≤,并且r 越接近1,线性相关程度越强;r 越接近0,线性相关程度越弱,故③正确;对于④,根据复数的乘法运算律,对复数12,z z 和自然数n 有()1212nn nz z z z ⋅=⋅,故④正确.故答案为③④.点睛:本题考查了命题的真假判断与应用,考查相关关系及复数的运算,是一个考查的知识点比较多的题目,解题本题的关键是理解概念及掌握运算公式,如在回归分析中,r 具有的性质,复数遵循的运算律等.20.②【分析】利用中位数相关系数的观测值残差分析的相关知识逐个分析即可【详解】①由甲的数据可知它的中位数为45乙的中位数为故正确;②相关系数时两个变量有很强的相关性故②错误;③由于的观测值满足故有95的解析:② 【分析】利用中位数、相关系数、2K 的观测值、残差分析的相关知识逐个分析即可. 【详解】①由甲的数据可知它的中位数为45,乙的中位数为4246442+=,故正确; ②相关系数0.75r ≥时,两个变量有很强的相关性,故②错误;③由于2K 的观测值 4.103k ≈,满足3.841 5.024k <<,故有95%的把握认为两个变量有关,所以③正确;④用最小二乘法求出一组数据()(),,1,,i i x y i n =的回归直线方程ˆˆˆy bx a =+后要进行残差分析,相应于数据()(),,1,,i i x y i n =的残差是指()ˆˆˆi i ie y bx a =-+,是正确的. 故答案为②. 【点睛】本题考查了中位数、相关系数、2K 的观测值、残差分析,属于基础题.三、解答题21.(1)表格见解析,没有;(2)分布列见解析,67. 【分析】(1)根据表中数据和题中的信息可完善列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2,计算出随机变量X 在不同取值下的概率,可得分布列,进而求得数学期望. 【详解】解:(1)列联表补充如下:由30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815,故喜欢抖音上课的学生共有16人. 由已知数据可求得:230(10866) 1.158 3.84116141614k ⨯⨯-⨯=≈<⨯⨯⨯,所以没有95%的把握认为喜欢抖音上课与性别有关. (2)X 的可能取值为0,1,2.2112886622214141444815(0),(1),(2)139191C C C C P X P X P X C C C =========,所以X 的分布列为:X 的数学期望为:448156()0121391917E X =⨯+⨯+⨯=. 【点晴】求解随机变量分布列的基本步骤如下:(1)明确随机变量可能取值,并确定随机变量服从何种分布; (2)求出每一个随机变量取值的概率.22.(1)列联表答案见解析,没有99%的把握认为该校学生的性别与220年在直播平台购物有关;(2)分布列答案见解析,数学期望:2. 【分析】(1)分析题意完成2×2列联表,直接套公式求出2K ,对照参数下结论;(2)分析出随机变量3~4,4Y B ⎛⎫ ⎪⎝⎭,而(4)24X Y Y Y =--=-,易求出X 的分布列与期望.. 【详解】解:(1)列22⨯列联表:2100(4053520) 5.556 6.63575256040K ⨯-⨯=≈<⨯⨯⨯.故没有99%的把握认为该校学生的性别与220年在直播平台购物有关 (2)设这4人中2020年在直播平台购物的人数为Y ,。

高中数学选修2-3 第三章 统计案例 章末检测题

高中数学选修2-3 第三章 统计案例 章末检测题

高中数学选修2-3第三章 统计案例 章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( ) A .残差分析 B .回归分析 C .等高条形图D .独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为栏目优秀B .有99%的人认为栏目是否优秀与改革有关系C .有99%的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系【解析】由于K 2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.【答案】D3.已知一个线性回归方程为y ∧=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .58.5 B .46.5 C .60 D .75【解析】x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5【答案】A4.设有一个回归方程为y ∧=3-5x ,当变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位D .y 平均减少3个单位【解析】-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 【答案】B5.若由一个2×2列联表中的数据计算得K 2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )A .0.025B .0.01C .0.005D .0.001【解析】∵P (K 2>5.024)=0.025.又K 2=6.630>5.024,∴犯错误的最大概率为0.025. 【答案】A6.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变小C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强【解析】由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.【答案】B7.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:以下数据中,对于同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .A =5,b =4,c =3,d =2 B .A =5,b =3,c =4,d =2 C .A =2,b =3,c =4,d =5 D .A =2,b =3,c =5,d =4【解析】可计算|ad -bc|的值,值越大说明X 与Y 有关的可能性越大. 【答案】D8.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( )A .14B .15C .16D .17【解析】根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ∧≈-0.857,b ∧≈0.729,所以线性回归方程为y ∧=0.729x -0.857.当y ∧=10时,得x ≈15.【答案】B9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的【解析】由列联表可得:博士:男性占2735≈77%,女性占835≈23%,相差很大,所以性别与获取学位的类别有关,故选A.【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.30B .模型2的R 2为0.50C .模型3的R 2为0.75D .模型4的R 2为0.98 【解析】R 2越大,拟合效果越好. 【答案】D11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】将表中的五组数据分别代入选项验证,可知y =88+12x 最适合.【答案】C12.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么()1021i i y y=-∑的值为( )A .241.06B .2 410.6C .253.08D .2 530.8【解析】R 2=1-∑i =110(y i -y ∧i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110 (y i -y )2,得()1021i i y y=-∑=120.531-0.95=2 410.6.【答案】B二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)13.在两个变量的回归分析中,R 2=________,R 2的值越________________________________________________________________________,说明残差平方和越________,也就是说模型的拟合效果越________.【答案】1-∑i =1n(y i -y ∧i )2∑i =1n(y i -y )2大 小 好14.已知样本数为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ∧=0.3x +a ∧,则x ≈________,a ∧≈________.(精确到0.01)【解析】由题意,x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ∧,所以21411=0.3×51011+a ∧,可求得a ∧≈5.55. 【答案】46.36 5.5515.某单位为了了解用电量y (度)与气温x (°C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4°C 时,用电量的度数约为________.【解析】x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68. 【答案】6816.若两个分类变量X 与Y 的列联表为:则“X 与Y 【解析】由列联表数据,可求得随机变量K 2的观测值k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P(K 2≥6.635)≈0.01.所以“x 与y 之间有关系”出错的概率仅为0.01.【答案】0.01三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.【解析】根据题中数据得如下列联表:由列联表中的数据得k =900×(290×350-100×160)2450×450×390×510≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:(1)(2)求出机床运转的速度x 与每小时生产二级品数量y 的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?【解析】(1)散点图如下图所示:(2)易求得x =12.5,y =8.25,∴b ∧=∑i =14x i y i -4x y∑i =14x 2i -4x2≈0.728 6,a ∧=y -b ∧x =-0.857 5, 即所求回归直线的方程为:y ∧=0.728 6x -0.857 5.(3)根据公式,要使y ∧≤10, 只要0.728 6x -0.857 5≤10, 解得x ≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.19.(本小题满分12分)有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:其中,a ,15-a 均为大于50.10的前提下认为“X 与Y 之间有关系”?【解析】要使在犯错误的概率不超过0.10的前提下认为“X 与Y 之间有关系”,需要随机变量K 2的观测值大于2.706.∵a +(20-a )=20, (15-a )+(30+a )=45,a +(15-a )=15,(20-a )+(30+a )=50, a +(20-a )+(15-a )+(30+a )=65,则 K 2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)25 400>2.706,解之可得,a >7.19或a <2.04,而由原题知a >5且15-a >5,a ∈Z ,即a =6,7,8,9.故当a =8或9时,可在犯错误的概率不超过0.10的前提下认为X 和Y 之间有关系. 20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (2)请求出R 2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】(1)∑i =14x i y i =66.5,∑i =14x 2i =32+42+52+62=86,x =4.5,y =3.5b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7a ∧=y -b ∧x =3.5-0.7×4.5=0.35所求的线性回归方程为y ∧=0.7x +0.35 (2)计算得残差及偏差的数据如下表:从而得∑i =14(y i -y ∧i )2=0.05,∑i =14(y i -y )2=2.5所以R 2=1-∑i =14(y i -y ∧i )2∑i =14(y i -y )2=1-0.052.5=0.98.所以残差变量对预报变量的贡献率约为2%.21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人? 【解析】设男生人数为x ,依题意可得列联表如下:(1)则K 2>3.841, 由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关, 则K 2≤2.706,由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x2·x 2·x =38x ≤2.706,解得x ≤7.216, ∵x 2,x6为整数, ∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t =x 2,得到下表:再做出y 和t 的散点图(如图2),发现这些点分布在一条直线的附近,所以y 与t 线性相关,由公式可计算求得:b ∧=∑t i y i -7t y ∑t 2i -7t2≈0.37,a ∧=y -b ∧t =-204.90,于是y ∧=0.37t -204.90,故y 与x 之间的回归方程是y ∧=0.37x 2-204.90,当x =50时,代入可得y ∧=720.1,故由此可以估计温度在50°C 时的产卵数量大约为720个.。

上海清流中学高中数学选修2-3第三章《统计案例》测试题(包含答案解析)

上海清流中学高中数学选修2-3第三章《统计案例》测试题(包含答案解析)

一、选择题1.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是( ) A .①②④B .②③④C .①③④D .②④2.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >3.某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:临界值参考:(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别无关”C .有99.99%以上的把握认为“喜欢“应用统计”课程与性别有关”D .有99.99%以上的把握认为“喜欢“应用统计”课程与性别无关”4.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表:由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0B .1.4C .2D .2.15.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 6.通过随机询问250名不同性别的高中生在购买食物时是否看营养说明书,得到如下列联表:从调查的结果分析,认为性别和读营养说明书的关系为( ) 附:()()()()()22n ad bc K a b c d a c b d -=++++ . A .95%以上认为无关 B .90%~95%认为有关 C .95%~99.9%认为有关D .99.9%以上认为有关7.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%8.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1C .2D .39.如表为某公司员工工作年限x (年)与平均月薪y (千元)对照表.已知y 关于x 的线性回归方程为0.70.35y x =+,则下列结论错误的是( ) x 3 4 5 6 y2.5t44.5A .回归直线一定过点(4.5,3.5)B .工作年限与平均月薪呈正相关C .t 的取值是3.5D .工作年限每增加1年,工资平均提高700元10.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( )A .增加1.4个单位B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计人数后,得到2×2列联表,则随机变量2K 的观测值为A .0.600B .0.828C .2.712D .6.004二、填空题13.以下四个命题中:①在回归分析中,可用相关系数r 的值判断模型的拟合效果,|r |越大,模拟的拟合效果越好;②在一组样本数据()()()112212,,,,...,,(2,,,...,n n n x y x y x y n x x x ≥不全相等)的散点图中,若所有样本点()()11,1,2,...x y i n =都在直线112y x =-+上,则这组样本数据的线性相关系数为12-;③对分类变量x 与y 的随机变量2k 来说,2k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为__________. 14.对相关系数r ,①r 越大,线性相关程度越大; ②r 越小,线性相关程度越大;③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大; ④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小 以上说法中,正确说法的序号是__________. 15.某单位为了了解用电量度与气温之间的关系,随机统计了某天的用电量与当天气温.由表中数据得回归直线方程中,据此预测当气温为5℃时,用电量的度数约为____.16.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程中的b≈﹣2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量的件数约为_____.17.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案. 方案类别基本费用超时费用甲包月制70元乙有限包月制(限60小时)50元0.05元/分钟(无上限)丙有限包月制(限30小时)30元0.05元/分钟(无上限)若某用户每月上网时间为66小时,应选择__________方案最合算. 18.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.19.已知x 、y 之间的一组数据如下: x 0 1 2 3 y8264则线性回归方程ˆya bx =+所表示的直线必经过点________. 20.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.三、解答题21.某共享单车经营企业欲向甲巿投放单车,为制定适宜的经营策略﹐该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷﹑整理分析及开座谈会三个阶段.在随机问卷阶段,A ,B 两个调查小组分赴全市不同区域发放问卷并及时收回﹔在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15岁至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:样本,再用分层抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.①求这60人中“年龄达到35岁且偶尔使用单车”的人数﹔②为听取对发展共享单车的建议,调查组专门组织所抽取的"年龄达到35岁且偶尔使用单车的人员召开座谈会,会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A 组,求A 组这4人中得到礼品的人数X 的分布列和数学期望;(2)从统计数据可直观得出“是否经常使用共享单车与年龄有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,当年龄设定为25岁时,根据已有数据,完成下列2×2列联表(单位:人),并判断是否在犯错误的概率不超过1%的前提下有把握认为“经常使用共享单车与年龄有关”?合计22.为调研高中生的作文水平,在某市普通高中的某次联考中,参考的文科生与理科生人数之比为1∶4,且成绩分布在[]0,60的范围内,规定分数在50以上(含50)的作文获奖,按文理科用分层抽样的方法抽取400人的成绩作为样本,得到成绩的频率分布直方图如图所示,其中a,b,c构成以2为公比的等比数列.(1)求a,b,c的值;(2)填写下面22⨯列联表,能否在犯错误的概率不超过0.01的情况下认为“获奖”与“学生的文理科”有关?文科生理科生合计获奖6不获奖合计400.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.()2P K k≥0.150.100.050.0250.0100.0050.001k 2.072 2.706 3.841 5.024 6.6357.87910.82823.某高校在A省自主招生,对初审通过的1000人进行复试(20道客观题,每题10分,满分200分),按分数从高到低录取100人认定复试通过,不低于140分的各分数对应人数如下表:分数x140150160170180人数y2915952(Ⅰ)已知y 关于t 的回归方程为814.311.6y t =-,求y 关于x 的回归方程y bx a =+; (Ⅱ)已知y 关于x 的相关系数为0.95-,试求出y 关于t 的相关系数r (小数点后保留两位小数),通过比较,判断哪个回归方程拟合效果更好;(注:r 越大,拟合性越好) (Ⅲ)根据(Ⅱ)中拟合性更好的回归方程,预报得分为130的考生能否全部通过复试? 相关公式和数据:()()()1122211nniii ii i nniii i x x y y xy nx yb x x xnx====---==--∑∑∑∑,a y bx =-,()()nniii ix x y y x y nx yr ---==∑∑,518960i iix y==∑,521129000i i x ==∑,512.31ii i t y =≈∑,5210.0049i i t =≈∑,0.029t =,20.000841t =,160x =,12y =,31.6≈0.027≈21.4≈.24.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关? (2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X ,若用样本的频率作为概率,求随机变量X 的分布列和期望.附:K 2=2()()()()()n ad bc a b c d a c b d -++++,其中n =a +b +c +d .25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若将共享单车用户按照年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有56是“年轻人”.(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,补全下列22⨯列联表,并根据列联表的独立性检验,判断是否有85%的把握认为经常使用共享单车与年龄有关?年轻人 非年轻人 合计 经常使用单车用户 120 不常使用单车用户80 合计16040200使用共享单车情况与年龄列联表(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人数为随机变量X ,求X 的分布列与期望. 参考数据:独立性检验界值表()20P K k ≥ 0.150.10 0.050 0.025 0.0100k 2.072 2.706 3.841 5.024 6.635其中,22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的. 【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的. 故选:B. 【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.2.D解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.3.A解析:A 【分析】计算212.010.828K ≈>,对比临界值表得到答案. 【详解】()222552020105()53912.010.828()()()()3025302545n ad bc K a b c d a c b d ⨯-⨯-===≈>++++⨯⨯⨯,故在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别有关”. 故选:A. 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.4.B解析:B【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=. 故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.5.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平6.D解析:D 【解析】分析:由列联表中的数据,利用公式()()()()()22n ad bc K a b c d a c b d -=++++求得2K ,与邻界值比较,即可得到结论. 详解:()222509070603021.6310.828120130150100K ⨯⨯-⨯=≈>⨯⨯⨯,∴有0099.9的把握认为性别和读营养说明书的有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.A解析:A 【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)8.B解析:B 【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归方程y 35x =-,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y = b x +a 必过点(),x y ,③正确;因为213.079 6.635K =>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B.9.C解析:C 【解析】由已知中的数据可得:3456 4.54x +++== , 2.54 4.51144t ty ++++==,∵数据中心点(),x y 一定在回归直线上,∴110.7 4.50.354t+=⨯+解得3t =,故C 错误;故11 3.54t+=, 回归直线一定过点(4.53.5,),ABD 正确;故选C . 10.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.A解析:A 【解析】本题主要考查独立性检验.由题所给统计表可知a=11,b=34,a+b=45,c=8,d=37,c+d=45,a+c=19,b+d=71,n=90,所以,()()()()()220.600n ad bc k a b c d a c b d -=≈++++ .本题选择A 选项.二、填空题13.1【分析】根据相关系数的概念以及两变量把握程度的概念进行判断【详解】①在回归分析中可用相关系数r 的值判断模型的拟合效果|r|越大模拟的拟合效果越好①正确;②相关系数反映的是两变量之间线性相关程度的强解析:1 【分析】根据相关系数的概念以及两变量把握程度的概念进行判断. 【详解】①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|越大,模拟的拟合效果越好,①正确;②相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样本数据的线性相关系数为-1,②错误;③对分类变量x与y的随机变量2k来说,2k越大,判断“x与y有关系”的把握程度越大.③错误.故正确命题个数为1.故答案为1.【点睛】本题考查回归分析中相关系数的概念,考查两变量的把握程度的判断,属于基础题.14.④【解析】两个变量之间的相关系数r的绝对值越接近于1表示两个变量的线性相关性越强r的绝对值非常接近于0时表示两个变量之间几乎不存在线性相关故答案为④解析:④【解析】两个变量之间的相关系数,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值非常接近于0时,表示两个变量之间几乎不存在线性相关.故答案为④.15.40【解析】试题分析:∵∴∴当时考点:线性回归方程解析:40【解析】试题分析:∵,,∴,∴当时,考点:线性回归方程16.【解析】试题分析:由数表得又将点代入得所以故当时考点:线性回归方程解析:【解析】试题分析:由数表,得,,又,将点代入,得,所以,故当时,.考点:线性回归方程.17.乙【解析】试题分析:选用方案甲时为70元当选用议案乙时用户消费为元;当用方案丙时用户消费为元所以用方案乙最合算考点:实际应用问题比较大小解析:乙【解析】试题分析:选用方案甲时为70元,当选用议案乙时,用户消费为506600.0568+⨯⨯=元;当用方案丙时,用户消费为3036600.05138+⨯⨯=元,所以用方案乙最合算.考点:实际应用问题,比较大小.18.②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③【详解】①为系统抽样①不正确;④分类变量与它们的随机变量的观测值为当越小与有关系的把握程度越解析:②③【分析】利用系统抽样的定义判断①利用独立性检验判断④;利用相关系数的性质判断②;由回归方程的性质判断③.【详解】①为系统抽样, ①不正确;④分类变量X与Y,它们的随机变量2K的观测值为k,当k 越小,“X与Y有关系”的把握程度越小,④不正确;根据相关系数的性质可知②正确;由回归方程的性质可知③正确.故答案为②③.【点睛】本题通过对多个命题真假的判断,综合考查系统抽样、相关系数、回归方程、独立性检验,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.19.(155)【解析】由题意可得:线性回归方程过样本中心点即线性回归方程所表示的直线必经过点(155)点睛:(1)正确理解计算的公式和准确的计算是求线性回归方程的关键(2)回归直线方程必过样本点中心解析:(1.5,5)【解析】由题意可得:01231.54x+++==,826454y+++==,线性回归方程过样本中心点,即线性回归方程ˆy a bx=+所表示的直线必经过点(1.5,5)点睛:(1)正确理解计算,b a的公式和准确的计算是求线性回归方程的关键.(2)回归直线方程y bx a=+必过样本点中心(),x y.20.3个【分析】直接利用线性回归直线的相关理论知识的应用求出结果【详解】(1)已知变量x和y满足关系y=-2x+3则x与y正相关;应该是:x与y 负相关故错误(2)线性回归直线必过点线性回归直线必过中心点解析:3个【分析】直接利用线性回归直线的相关理论知识的应用求出结果.【详解】(1)已知变量x 和y 满足关系y=-2x+3,则x 与y 正相关;应该是:x 与y 负相关.故错误. (2)线性回归直线必过点(),x y ,线性回归直线必过中心点.故正确.(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大. 根据课本上有原句,故正确.(4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数R 2的值越大,说明拟合的效果越好.故正确,根据课本上有原句. 故填3个. 【点睛】本题主要考查了线性回归直线的应用,学生对知识的记忆能力,主要考查学生的运算能力和转换能力,属于中档题.三、解答题21.(1)① 9人;②分布列答案见解析,数学期望:43;(2)列联表答案见解析,在犯错误的概率不超过1%的前提下没有把握认为“经常使用共享单车与年龄有关”. 【分析】(1)利用分层抽样,按比例计算这60人中“年龄达到35岁且偶尔使用单车”的人数﹔直接分析X 服从超几何分布,求概率,写出分布列,求出数学期望;(2)根据题意,25m =填写2×2列联表,套公式计算 3.063K ≈,对应参考值下结论. 【详解】解:(1)①从300人中抽取60人,其中“年龄达到35岁”的有1006020300⨯=人, 再将这20人用分层抽样法按"是否经常使用单车"进行名额划分,其中“年龄达到35岁且偶尔使用单车”的人数为45209100⨯=. ②A 组这4人中得到礼品的人数X 的可能取值为0,1,2,3,相应概率为:()35395042C P X C ===,()12453910121C C P X C ===, ()214539C C 52C 14P X ===,()3439C 13C 21P X ===.故其分布列为∴数学期望()0123422114213E X =⨯+⨯+⨯+⨯=(2)25m =时,按“年龄是否达到25岁”对数据进行整理,得到如下列联表()2300678711333300210049 3.06320010018012020010018012016K ⨯⨯-⨯⨯===≈⨯⨯⨯⨯⨯⨯ ∴3.063 6.635<所以在犯错误的概率不超过1%的前提下没有把握认为“经常使用共享单车与年龄有关”. 【点睛】(1) 求离散型随机变量的分布列时,要特别注意. 随机变量是否服从二项分布、超几何分布等特殊的分布;(2)独立性检验的题目直接根据题意完成完成2×2列联表,直接套公式求出K ,对照参数下结论,一般较易.22.(1)0.005a =,0.01b =,0.02c =;(2)列联表答案见解析,在犯错误的概率不超过0.01的情况下,不能认为“获奖”与“学生的文理科”有关;(3)99190. 【分析】(1)利用频率分布直方图中,频率和为1列出关于a ,b ,c 的方程,然后再根据a ,b ,c 成公比为2的等比数列,得到关于a ,b ,c 的方程组,求解a ,b ,c 即可;(2)先根据频率分布直方图计算出获奖的人数,根据样本中文科生与理科生的比例为1:4得出文理科的人数,补全22⨯列联表,计算2K 的值,然后判断能否在犯错误的概率不超过0.01的情况下认为“获奖”与“学生的文理科”有关;(3)计算出从获奖的学生中任选2人的基本事件总数,再计算至少有一个文科生所包含的基本事件数,利用古典概率模型概率的计算公式求解即可. 【详解】(1)由频率分布直方图可知,()()101100.0180.0220.0250.35a b c ⨯++=-⨯++=, 因为a ,b ,c 构成以2为公比的等比数列,所以240.035a a a ++=,解得0.005a =, 所以20.01b a ==,40.02c a ==.故0.005a =,0.01b =,0.02c =.(2)获奖的人数为0.0051040020⨯⨯=人,因为参考的文科生与理科生人数之比为1∶4,所以400人中文科生的数量为1400805⨯=,理科生的数量为40080320-=. 由表可知,获奖的文科生有6人,所以获奖的理科生有20614-=人,不获奖的文科生有80674-=人.于是可以得到22⨯列联表如下:。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人教版高中数学精品资料第三章 综合测试题一、选择题(本大题共12小题,每小题5分,共60分.每小题中只有一项符合题目要求) 1.在对两个变量x, y 进行线性回归分析时有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(x i ,y i ),i =1,2,…,n ;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.若根据可靠性要求能够作出变量x ,y 具有线性相关结论,则下列操作顺序正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③①答案 D解析 由对两个变量进行回归分析的步骤,知选D.2.为了考查两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( )A .l 1和l 2有交点(s ,t )B .l 1与l 2相交,但交点不一定是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合 答案 A解析 由回归直线定义知选A.3.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A.y ∧=x +1B.y ∧=x +2C.y ∧=2x +1 D.y ∧=x -1答案 A解析 求出样本中心(x ,y )代入选项检验知选A. 4.今有一组实验数据如下:( )A .v =log2tB .v =log 12 tC .v =t 2-12D .v =2t -2答案 C解析 先画出散点图,利用散点图直观认识变量间的关系,可选出较合适的模型为C ,或将数据代入所给选项进行验证.5.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程中的截距为( )A .a =y -bxB .a =y -b ∧xC.a ∧=y -bx D.a ∧=y -b ∧x答案 D解析 本题考查回归方程中的截距公式a ∧=y -b ∧x .故选D. 6.下面是一个2×2列联表其中a 、b A .52 54 B .54 52 C .94 146 D .146 94答案 A解析 由a +21=73,得a =52,a +2=b ,得b =54.故选A.7.设有一个回归方程为y ∧=3-5x ,则变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位 D .y 平均减少3个单位 答案 B解析 ∵-5是斜率的估计值,说明x 每增加一个单位时,y 平均减少5个单位.故选B. 8.在一个2×2列联表中,由其数据计算得K 2=13.097,则其两个变量间有关系的可能性为( )C .90%D .无关系答案 A解析 ∵如果K 2的估计值k >10.828时,就有99.9%的把握认为“x 与y 有关系”.故选A.9.两个相关变量满足如下关系:A.y ∧=0.56x +997.4B.y ∧=0.63x -231.2B.y ∧=50.2x +501.4 D.y ∧=60.4x +400.7答案 A解析 利用公式b ∧=∑i =1nx i y i -n x y∑i =1nx 2i -n x2=0.56,a ∧=y -b ∧x =997.4.∴回归直线方程为y ∧=0.56x +997.4.故选A.10.线性回归方程y ∧=b ∧x +a ∧必过( ) A .(0,0) B .(x ,0) C .(0,y ) D .(x ,y )答案 D解析 回归直线方程一定过样本点的中心(x ,y ).故选D.11.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A .总偏差平方和 B .残差平方和 C .回归平方和 D .相关指数R 2答案 B解析 y i -y ∧=e ∧i ,∑i =1ne ∧2i 为残差平方和.故选B.12.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( )A .2.5%B .0.5%答案 D解析 ∵P (K 2≥3.841)≈0.05,故“判断性别与运动有关”出错的可能性为5%. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算得K 2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).答案 有关解析 K 2>10.828就有99.9%的理由认为两个量是有关的.14.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:答案 0.880 9解析 把表中的数据代入公式b ∧=∑i =1nx i y i -n x y∑i =1nx 2i -n x2≈0.880 9.15.用身高(cm)预报体重(kg)满足y ∧=0.849x -85.712,若要找到41.638 kg 的人,________是在150 cm 的人群中.(填“一定”、“不一定”)答案 不一定解析 因为统计的方法是可能犯错误的,利用线性回归方程预报变量的值不是精确值,但一般认为实际测量值应在预报值左右.16.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表答案 有三、解答题(本大题共7小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(10分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.53.04.04.5(1)在给定的坐标系(如下图)中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?⎝ ⎛⎭⎪⎪⎫注:b ∧=∑i =1nx i y i-n x y∑i =1nx 2i-n x 2,a ∧=y -b ∧x -解析 (1)散点图如下图:(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y =3.5,i =14x 2i =54,∴b ∧=0.7,a ∧=1.05,∴y ∧=0.7x +1.05.回归直线如图中所示.(3)将x =10代入回归直线方程,得y ∧=0.7×10+1.05=8.05(小时). ∴预测加工10个零件需要8.05小时.18.(12分)某企业的某种产品产量与单位成本数据如下:月份 1 2 3 4 5 6 产量(千件) 2 3 4 3 4 5 单位成本(元)737271736968(1)试确定回归直线;(2)指出产量每增加1 000件时,单位成本下降多少?(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少件? 解析 (1)设x 表示每月产量(单位:千件),y 表示单位成本(单位:元)作散点图.由图知y 与x 间呈线性相关关系,设线性回归方程为y ∧=b ∧x +a ∧,由公式可求得b ∧=-1.818,a ∧=77.363.∴线性回归方程为y ∧=-1.818x +77.363.(2)由线性回归方程知,每增加1 000件产量,单位成本下降1.818元. (3)当x =6 000时,y =-1.818×6+77.363=66.455(元),当y =70时,70=-1.818x +77.363,得x =4.05(千件).19.(2011·安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份 2002 2004 2006 2008 2010 需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程y ∧=bx +a ; (2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解析 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程.为此对数据预处理如下:年份-2006-4-224需求量-257 -21 -11 0 19 29对预处理后的数据,容易算得x =0,y =3.2.b =-4×-21+-2×-11+2×19+4×2942+22+22+42=26040=6.5, a =y -b x =3.2.由上述计算结果,知所求回归直线方程为y ∧-257=b (x -2 006)+a =6.5(x -2 006)+3.2,即y ∧=6.5(x -2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).20.(12分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作 不太主动参加班级工作 合计 学习积极性高 18 7 25 学习积极性一般 6 19 25 合计242650抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.解析 (1)积极参加班级工作的学生有24名,总人数为50名,概率为2450=1225.不太主动参加班级工作且学习积极性一般的学生有19名,概率为1950.(2)K 2=50×18×19-6×7225×25×24×26≈11.5.∵K 2>10.828,∴有99.9%的把握认为学习积极性与对待班级工作的态度有关系. 21.(12分)某运动队研制了一种有助于运动员在大运动量的训练后快速恢复体力的口服制剂,为了实验新药的效果而抽取若干名运动员来实验,所得资料如下:有效(恢复得好),60,120,45,180 无效(恢复得差),45,45,60,255总计,105,165,105,435区分该种药剂对男、女运动员产生的效果的强弱. 解析 对男运动员K 2=270×60×45-45×1202105×165×180×90≈7.013>6.635,有99%的把握认定药剂对男运动员有效. 对女运动员K 2=540×45×255-60×1802105×435×225×315≈0.076≤2.706,没有充足的证据显示药剂与女运动员体力恢复有关系. 因此该药对男运动员药效较好.22.(12分)第17届亚运会于2014年9月19日至10月4日在韩国仁川进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.(1)根据以上数据完成以下2×2列联表:喜爱运动 不喜爱运动 总计 男 10 16 女 614 总计30(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关?(3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么抽出的志愿者中至少有1人能胜任翻译工作的概率是多少?参考公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.参考数据:P(K2≥k0)0.400.250.100.010k00.708 1.323 2.706 6.635 解析(1)喜爱运动不喜爱运动总计男10616女6814总计161430 (2)假设:是否喜爱运动与性别无关,由已知数据可求得K2=30×10×8-6×6210+66+810+66+8≈1.1 575<2.706.因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.(3)喜欢运动的女志愿者有6人,设喜欢运动的女志愿者分别为A、B、C、D、E、F,其中A、B、C、D会外语,则从这6人中任取2人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种取法,其中两人都不会外语的只有EF这1种取法.故抽出的志愿者中至少有1人能胜任翻译工作的概率是P=1-115=14 15.。

相关文档
最新文档