高中数学苏教版选修2-3:第3章 统计案例 单元测试
高中数学 阶段质量检测(五)统计案例 苏教版选修2-3-苏教版高二选修2-3数学试题
阶段质量检测(五)统计案例(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.已知回归方程y ^=b ^x +a ^,其中a ^=3,且样本点的中心为(1,2),则回归直线方程为( )A.y ^=x +3B.y ^=-2x +3 C.y ^=-x +3 D.y ^=x -3解析:选C 因为回归方程一定经过样本点的中心,所以只需将样本点的中心坐标代入方程,用待定系数法求出即可.2.每一吨铸铁成本y (元)与铸件废品率x %建立的回归方程y ^=56+8x ,下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.3.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^等于( )A .10.5B .5.15C .5.2D .5.25解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^=5.25. 4.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )x 4 5 6 7 8 9 10 y14181920232528AC .指数函数模型D .对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.5.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A.y ^=x +1B. y ^=x +2 C.y ^=2x +1 D.y ^=x -1解析:选A 由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^=x +1为回归直线方程. 6.下列说法中,错误说法的个数是( )①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②回归方程y ^=3-5x ,变量x 增加1个单位时,y ^平均增加5个单位; ③线性回归方程y ^=b ^x +a ^必过样本点的中心(x ,y );④在一个2×2列联表中,若χ2的观测值k =13.079,则有99.9%以上的把握认为这两个变量之间有关系.A .0B .1C .2D .3解析:选B 数据的方差与加了什么样的常数无关,故①正确;对于回归方程y ^=3-5x ,变量x 增加1个单位时,y ^平均减少5个单位,故②错误;易知③正确;若k =13.079>10.828,则有99.9%以上的把握认为这两个变量之间有关系,故④正确.7.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55解析:选B 把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,故残差为57-54.55=2.45.8.某高校《统计》课程的教师随机给出了选修该课程的一些情况,具体数据如下:χ2>3.841,所以可以判断选修该课程与性别有关.那么这种判断出错的可能性不超过( )A .5%B .95%C .1%D .99%解析:选A 若χ2>3.841,说明在犯错误的概率不超过0.05的前提下认为选修该课程与性别有关,也就是选修该课程与性别有关出错的可能性不超过5%.9.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:A .0.5%B .1%C .2%D .5%解析:选D 由表中数据代入公式得χ2的观测值 χ2=300×(37×143-85×35)2122×178×72×228≈4.514>3.841,所以有95%以上的把握认为数学成绩与物理成绩有关,因此,判断的出错率不超过5%. 10.已知x 与y 之间的几组数据如下表所示.假设根据上表数据所得回归方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′解析:选C 由题意可得,b ′=2,a ′=-2,x =72,y =136.由公式b ^=∑i =16(x i -x )(y i -y)∑i =16(x i -x)2求得b ^=57,a ^=y -b ^x =136-57×72=-13,∴b ^<b ′,a ^>a ′.11.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表如下:( ) A .a =9,b =8,c =7,d =6 B .a =9,b =7,c =6,d =8 C .a =8,b =6,c =9,d =7 D .a =6,b =7,c =8,d =9解析:选B 对于同一样本,|ad -bc |越大,说明X 与Y 之间的关系越强,故检验知选B.12.两个分类变量X 和Y, 值域分别为{x 1,x 2}和{y 1,y 2}, 其样本频数分别是a =10, b =21, c +d =35. 若X 与Y 有关系的可信程度不小于97.5%, 则c 等于( )A .3B .4C .5D .6解析:选A 列2×2列联表如下:故K 2的观测值k =31×35×(10+c )(56-c )≥5.024. 把选项A, B, C, D 代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上) 13.已知高三某学生的高考成绩y (分)与高三期间有效复习时间x (天)正相关,且回归方程是y ^=3x +50,若期望他高考达到500分,则他的有效复习时间应不低于________天.解析:本题主要考查运用线性回归方程来预测变量的取值.当y ^=500时,易得x =500-503=150. 答案:15014.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则r 2为________.解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故r 2=1. 答案:115.欲知作者的性别是否与读者的性别有关,某出版公司派工作人员到各书店随机调查了500位买书的顾客,结果如下表所示.________.(填“有关”或“无关”)解析:由公式得χ2=500×(142×133-122×103)2264×236×245×255≈5.131>5.024,所以在犯错误的概率不超过0.025的前提下作者的性别与读者的性别有关.答案:有关16.已知x ,y 之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是______________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎪⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎪⎫4-1032+⎝⎛⎭⎪⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎪⎫3-722+(4-4)2+⎝⎛⎭⎪⎫5-922=12. 因为S 2<S 1,故用直线l 2:y =12x +12,拟合程度更好.答案:y =12x +12三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)解:对于上述三种心理障碍分别构造三个随机变量χ21,χ22,χ23, 由表中数据可得χ21=110×(5×60-25×20)230×80×25×85≈0.863,χ22=110×(10×70-20×10)230×80×20×90≈6.366,χ23=110×(15×30-15×50)230×80×65×45≈1.410.因为χ22的值最大,所以说谎与性别关系最大.18.(本小题满分12分)某房地产公司有6名产品推销员,其中5名推销员的工作年限与年推销金额的数据如表:(1)求这5 (2)若第6名推销员的工作年限为11年,试估计他的推销金额.解:(1)设所求的线性回归方程为y ^=b ^x +a ^,由题表数据得x =6,y =3.4,则b ^=∑i =15(x i -x )(y i -y)∑i =15(x i -x)2=1020=0.5,a ^=y -b ^x =0.4. 所以这5名推销员的年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4. (2)当x =11时,y ^=0.5×11+0.4=5.9.所以估计第6名推销员的年推销金额为5.9百万元.19.(本小题满分12分)淘宝网卖家在某商品的所有买家中,随机选择男女买家各50位进行调查,他们的评分等级如下:(2)规定:评分等级在[0,3]为不满意该商品,在(3,5]为满意该商品.完成下列2×2列联表,并帮助卖家判断能否95%的把握的认为是否满意该商品与性别有关系.解:(1)20种选法,其中恰有1人为男性的共有C 112C 18=96种选法,所以所求概率P =96190=4895.(2)2×2列联表如下:假设H 0由公式得χ2=100×(32×30-20×18)250×50×52×48≈5.769>3.841,所以能95%的把握认为是否满意该商品与性别有关.20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?甲工艺乙工艺总计一等品非一等品总计附:P(χ2≥k0)0.100.050.01k0 2.706 3.841 6.635χ2=n(ad2(a+b)(c+d)(a+c)(b+d)(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下:甲工艺乙工艺总计一等品5060110非一等品504090总计100100200K2=200×(110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X的分布列为X的数学期望为E(X)24,X的方差为V(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y的分布列为Y的数学期望为E(Y),Y的方差为V(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出V(X)<V(Y),即甲工艺波动小,虽然E(X)<E(Y),但相差不大,所以以后应选择甲工艺.21.(本小题满分12分)某区卫生部门成立了调查小组,调查常吃零食与患龋齿的关系,对该区六年级的800名学生进行检查,按患龋齿和不患龋齿分类,得汇总数据:不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名.(1)完成下列2×2列联表,并分析能否在犯错概率不超过0.001的前提下,认为该区的学生常吃零食与患龋齿有关系?(2)4负责数据处理.求工作人员甲分到负责收集数据组,工作人员乙分到负责数据处理组的概率.解:(1)由题意可得列联表如下所示.因为K2的观测值k=≈16.667>10.828,160×640×200×600所以能在犯错概率不超过0.001的前提下,认为该区的学生常吃零食与患龋齿有关系.(2)设其他工作人员为丙和丁,4人分组的所有情况有:收集数据组:甲乙;甲丙;甲丁;乙丙;乙丁;丙丁;相应的处理数据组:丙丁;乙丁;乙丙;甲丁;甲丙;甲乙.共有6种情况. 记事件A 为“工作人员甲分到负责收集数据组,工作人员乙分到负责数据处理组”, 则满足条件的情况有:甲丙收集数据,乙丁处理数据或 甲丁收集数据,乙丙处理数据,共2种情况. 所以P (A )=26=13.22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表: 等级得分 (0,1] (1,2] (2,3] (3,4] (4,5] (5,6] 人数 3173030173(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:①据此,计算这100名学生数理学习能力等级分数的期望μ及标准差σ(精确到0.1); ②若总体服从正态分布,以样本估计总体,估计该市这10 000名学生中数理学习能力等级在(1.9,4.1)X 围内的人数.(3)从这10 000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:x (数学学习能力) 2 3 4 5 6 y (物理学习能力)1.534.556①请画出上表数据的散点图;②请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^(附参考数据:129≈11.4).解:(1)样本中学生为良好的人数为20人.故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为C 120×C 180C 2100=3299.word 11 / 11 (2)①总体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+4.5×0.17+5.5×0.03=3.0,标准差σ=[(0.5-3)2×0.03+(1.5-3)2×0.17+(2.5-3)2×0.3+(3.5-3)2×0.3+(4.5-3)2×0.17+(5.5-3)2×0.03]12= 1.29≈1.1, ②由于μ=3,σ=1.1当x ∈(1.9,4.1)时,即x ∈(μ-σ,μ+σ),故数理学习能力等级分数在(1.9,4.1)X 围中的概率约为0.682 7.数理习能力等级分数在(1.9,4.1)X 围中的学生的人数约为10 000×0.682 7=6 827人.(3)①数据的散点图如图:②设线性回归方程为y ^=b ^x +a ^,则x =4,y =4.b ^=∑i =15(x i -x )(y i -y)∑i =15(x i -x)2=1.1,a ^=y -b ^x =-0.4. 故回归直线方程为y ^=1.1x -0.4.。
高中数学苏教版选修2-3:第3章统计案例单元测试
用电量 y( 度)
24 34 38 64
气温 x(℃ )
18 13 10 - 1
10.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响
学生的健康成长.下表给出性别与吃零食的
2× 2 列联表:
男
女 总计
喜欢吃零食
5
12
17
不喜欢吃零食
40
28
68
合计
45
40
85
试回答吃零食与性别有关系吗? (“有计求出的线性回归方程的斜率为
0.003 585,则线性回归方程为
________________________________________________________________________ .
解析: 线性回归直线 y ∧ =b ∧ x+ a ∧ 过样本中心点 (-x , -y ),故将 -x ,-y 求出代入即
阶段质量检测 ( 三 ) 统 计 案 例 (考试时间: 120 分钟 试卷总分: 160 分 )
一、填空题 (本大题共 14 小题,每小题 5 分,共 70 分 )
1.下列有关线性回归的说法 ①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关
系;
②在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形
5.一家保险公司调查其总公司营业部的加班情况,收集了 y(小时 ) 与签发保险单数目 x 的数据如下表所示:
10 周中每周加班工作时间
x 825 215 1 070 550 480 920 1 350 325 670 1 215
y 3.5 1.0
4.0
2.0 1.0 3.0
4.5
2015-2016学年苏教版选修2-3 第3章 统计案例 单元测试
2015-2016学年苏教版选修2-3 第3章 统计案例 单元测试一、填空题(本大题共16小题,每小题5分,共80分.将答案填写在题中的横线上) 1.对于散点图,下列说法中正确的是 . ①通过散点图一定可以看出变量之间的变化规律; ②通过散点图一定不可以看出变量之间的变化规律; ③通过散点图可以看出正相关与负相关有明显 区别;④通过散点图看不出正相关与负相关有什么区别. 2.若回归直线方程为=2-3.5x ,则变量x 增加一个单位,变量y 平均减少 个单位. 3.观察图中各图形:① ②③ ④其中两个变量x ,y 具有相关关系的图是 . 4.下表是关于出生男婴与女婴调查的列联表:那么,,,,,.5.下列关系中,是相关关系的为 . ①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 6.某单位为了了解用电量y 千瓦时与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程=x +中b ,预测当气温为 ℃时,用电量约为 千瓦时.7.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2的列联表中,由计算得2χ=13.079,则其两个变量间有关系的可能性是90%. 其中错误的是 .8.若两个分类变量x 和y 的列联表为:则x 与之间有关系的可能性为 . 9.已知回归直线斜率的估计值为,样本点的中心为点(3,5),则回归直线的方程为 .10.下表是对于喜欢足球与否的统计列联表,依据表中的数据,得到2χ(结果保留三位小数).11.由一组样本数据得到的回归直线方程为a bx y +=∧,那么下面说法正确的是 . ①直线a bx y +=∧必过点),(--y x ; ②直线a bx y +=∧必经过,,中的一点;③直线a bx y +=∧经过,,,中某两个特殊点;④直线a bx y +=∧必不过点),(--y x .12.根据下面的列联表得到如下四个判断:①有009.99的把握认为患肝病与嗜酒有关;②有0099的把握认为患肝病与嗜酒有关;③认为患肝病与嗜酒有关的出错的可能为;④认为患肝病与嗜酒有关的出错的可能为.其中正确的命题为 .13.面对竞争日益激烈的消费市场,众多商家不断扩大自已的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x (千箱)与单位成本y (元)的资料进行线性回归分析,结果如下:x =72,y =71,∑i =16x 2i=79,∑i =16x i y i =1 481, b ^=1 481-6×72×7179-6×⎝⎛⎭⎫722≈-1.818 2,a ^=71-(-1.818 2)×72≈77.36,则销量每增加 1000箱,单位成本约下降________元.14.以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这种抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程yˆ=中,当变量x 每增加1个单位时,变量yˆ平均增加0.2个单位; ④对分类变量X 与Y ,它们的随机变量2χ的值越小,得出“X 与Y 有关系”犯错误的概率越小. 其中正确的命题是 .15.如下表中给出的五组数据),(y x ,从中选出四组使其线性相关最大,且保留第一组)3,5(--,那么,应去掉第 组.16.某学校对课程《人与自然》的选修情况进行了统计,得到如下数据:那么,选修《人与自然》与性别有关的把握是 .二、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)17.(10分)为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表:18.(12分)有甲、乙两个班,进行数学考试,按学生考试及格与不及格统计成绩后,得到如下的列联表根据表中数据,你有多大把握认为成绩及格与班级有关?19.(12分)一机器可以按不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产有缺点物件的个数,现观测得到),(y x 的四组观测值为)11,16(),9,14(),8,12(),5,8(.若实际生产中所允许的每小时有缺点物件数不超过10,则机器的速度每秒不得超过多少转?20.(12分)在大街上,随机调查339名成人,有关吸烟、不吸烟、患肺炎、不患肺炎的数据如下表:(1)判断:吸烟与患肺炎是否有关?(2)用假设检验的思想予以证明. [来源:Z+xx+]21.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请画出上表数据的散点图.(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)中求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)22.(12分)在综合素质评价的某个维度的测评中,依据评分细则,学生之间相互打分,最终将所有的数据合成一个分数.满分100分,按照大于等于80分为优秀,小于80分为合格.为了解学生在该维度的测评结果,从毕业班中随机抽出一个班的数据.该班共有60名学生,得到如下的列联表.已知在该班随机抽取1人,测评结果为优秀的概率为.(1)请完成上面的列联表;(2)能否有90%的把握认为性别与测评结果有关系?(3)现在如果想了解全校学生在该维度的表现情况,采取简单随机抽样的方式在全校学生中抽取少数一部分人来分析,请你选择一个合适的抽样方法,并解释理由.[来源:学§科§网]2015-2016学年苏教版选修2-3 第3章统计案例单元测试答题纸得分:一、填空题1. 2. 3. 4. 5. 6.7. 8. 9. 10. 11. 12.13. 14. 15. 16.二、解答题17.18.19.20.21.22.2015-2016学年苏教版选修2-3 第3章 统计案例 单元测试参考答案一、填空题 1.③2.3.5 解析:由回归直线方程可得b ^=-3.5,则变量x 增加一个单位,变量y 平均减少3.5个单位.3.③④ 解析:由相关关系的定义,当散点图中的点集中在一条直线或曲线附近时就称两变量具有相关关系.4.47 92 88 82 535.①② 解析:学生的学习成绩与学生的学习态度和教师的执教水平是相关的,与学生的身高和家庭经济条件不相关.6.68 解析:=40,回归直线过点,∴错误!未定义书签。
苏教版高中数学选修2-3章末综合测评(三) 统计案例.docx
章末综合测评(三) 统计案例(时间120分钟,满分160分)一、选择题(本大题共14小题,每小题5分,共70分.将答案填在题中的横线上)1.在直线回归方程y ^=a ^+b ^x 中,b ^表示________(填序号).①当x 增加一个单位时,y 增加a^的数量; ②当y 增加一个单位时,x 增加b ^的数量; ③当x 增加一个单位时,y 的平均增加量; ④当y 增加一个单位时,x 的平均增加量. 【答案】 ③2.线性回归方程y ^=b ^x +a ^所表示的直线必经过点________.【答案】 (x -,y -)3.经调查某地若干户家庭的年收入x (万元)和年饮食支出y (万元)具有线性相关关系,并得到y 关于x 的线性回归直线方程:y ^=0.254x +0.321,由线性回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 ∵y 关于x 的线性回归直线方程: y ^=0.254x +0.321,①∴年收入增加1万元时,年饮食支出 y ^=0.254(x +1)+0.321,②②-①可得:年饮食支出平均增加0.254万元.【答案】0.2544.对于线性回归方程y^=b^x+a^,下列说法中不正确的序号是________.①x增加一个单位时,y平均增加b^个单位;②样本数据中x=0时,可能y=a^;③样本数据中x=0时,一定有y=a^.【解析】线性回归方程y^=b^x+a^中,x增加一个单位时,y平均增加b^个单位,故①正确;线性回归方程y^=b^x+a^中,样本数据中x=0时,可能有y=a^,也可能有y≠a^,故②正确,③不正确.【答案】③5.已知x,y的取值如下表,如果y与x呈线性相关,且线性回归方程为y^=b^x+132,则b^=________.x 23 4y 64 5【解析】∵线性回归方程为y^=b^x+132,又∵线性回归方程过样本中心点,且x-=2+3+43=3,y-=6+4+53=5,∴回归方程过点(3,5),∴5=3b^+132,∴b^=-12.【答案】-126.若线性回归直线方程中的回归系数b^=0,则相关系数等于________.【导学号:29440071】【解析】由于在回归系数b^的计算公式中,与相关系数的计算公式中,它们的分子相同,所以r=0.【答案】 07.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.(填序号)①-1;②0;③12;④1【解析】 当所有样本点都在一条直线上时,相关系数为1.故填④. 【答案】 ④8.观察图1中各图形:图1其中两个变量x ,y 具有相关关系的图是________. 【解析】 由散点图知③④具有相关关系. 【答案】 ③④9.已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)满足线性回归方程y ^=b ^x +a ^,则“(x 0,y 0)满足线性回归方程y ^=b ^x +a ^”是“x 0=x 1+x 2+…+x 1010,y 0=y 1+y 2+…+y 1010的”________.①充分不必要条件;②必要不充分条件; ③充要条件;④既不充分也不必要条件.【解析】 当x 0,y 0为这10组数据的平均值,即当x 0=x -,y 0= y -时,因为线性回归方程y ^=b ^x +a ^必过样本点的中心点(x -,y -),因此(x 0,y 0)一定满足线性回归方程,但满足线性回归方程的点除(x -,y -)外,可能还有其他点.【答案】 ②10.下列说法中错误的是________.^=3-5x,变量x增加一个单位时,y平均增加5个单①设有一个回归方程y位;^=b^x+a^必过(x-,y-);②线性回归方程y^=b^x+a^,其中a^,b^都为整数.③y^=【解析】线性回归方程中x的系数具备直线斜率的功能,对于回归方程y3-5x,当x增加一个单位时,y平均减少5个单位,①错误;由线性回归方程的^=b^x+a^必过点(x-,y-),②正确;在线性回归方程中a,定义知,线性回归方程yb的值不一定是整数,③错误.【答案】①③11.在调查某班级数学成绩与物理成绩的相关关系时,对数据进行统计得到^=b^x+a^近似刻画其关系,根据图形,b的数值最散点图(如图2所示),用直线y有可能是________.(填序号)图2①0;②2.55;③0.85;④-0.24.【解析】从散点图来看某班级数学成绩与物理成绩的相关关系是正相关,所以回归直线的斜率不能是负值,所以④不正确,因为回归直线不和横轴平行,所以斜率不能是0,所以①不正确,从散点图观察,直线应该比y=x的斜率要小一些,一定不会达到2.55,所以②不正确,只有0.85符合题意.【答案】③12.考古学家通过研究始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为y^=1.197x-3.660,由此估计,当股骨长度为50 cm时,肱骨长度为________cm. 【导学号:29440072】【解析】根据线性回归方程y^=1.197x-3.660,将x=50代入得y^=56.19,则估计肱骨长度为56.19 cm.【答案】56.1913.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 123 4用水量y/百吨 4.543 2.5由散点图可知(图略),用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y^=-0.7x+a^,则a^=________.【解析】回归直线过样本点的中心点(2.5,3.5),代入线性回归方程得:3.5=-0.7×2.5+a^,解得a^=5.25.【答案】 5.2514.某高校教《统计初步》课程的教师随机调查了选修该课的一些学生的情况,具体数据如下表:非统计专业统计专业合计男131023女72027合计203050为了判断选修统计专业是否与性别有关系,根据表中的数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844,因为χ2>3.841,所以认为主修统计专业与性别有关系,则这种判断出错的可能性为________.【解析】因为χ2>3.841,查临界值表,可知判断出错的可能性为5%.【答案】5%二、解答题(本大题共6小题,共90分.解答时应写出文字说明、证明过程或演算步骤)15.(本小题满分14分)随着生活水平的提高,越来越多的人参与了潜水这项活动.某潜水中心调查了100名男性和100名女性下潜至距离水面5米时是否会耳鸣,得到下面的2×2列联表.有耳鸣 无耳鸣 合计 男 30 70 100 女 50 50 100 合计80120200利用独立性检验的方法判断耳鸣与性别是否有关系?若有关系,所得结论的把握有多大?【解】 提出假设H 0:耳鸣与性别没有关系.∵χ2=200×(30×50-70×50)2100×100×80×120≈8.33>7.897.∴可以判断耳鸣与性别是有关系的. ∵P (χ2>7.879)≈0.005.∴我们有99.5%的把握认为耳鸣与性别有关.16.(本小题满分14分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (t)与相应的能耗y (t)的几组对照数据.x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^.【解】 (1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得∑4i =1x 2i=86,x -=3+4+5+64=4.5, y -=2.5+3+4+4.54=3.5,∑4i =1x i y i=66.5,b ^=∑4i =1x i y i -4 x - y -∑4i =1x 2i-4(x -)2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y --b ^x -=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.17.(本小题满分14分)某大型企业人力资源部为了研究企业员工工作积极性与对待企业改革的态度的关系,随机抽取了189名员工进行调查.其中积极支持企业改革的被调查者中,工作积极的有54人,工作一般的有32人;而不太赞成企业改革的被调查者中,工作积极的有40人,工作一般的有63人.试判断员工对待企业改革的态度是否与其工作积极性有关.【解】 提出假设H 0:员工对待企业改革的态度与其工作积极性无关. 由题意得,如下2×2列联表:积极支持 企业改革 不太赞成 企业改革 合计 工作积极 54 40 94 工作一般 32 63 95 合计86103189根据列联表中的数据,可得χ2=189×(54×63-40×32)294×95×86×103≈10.759.因为χ2≈10.759>7.879,所以有99.5%的把握认为,员工对待企业改革的态度与其工作积极性有关. 18.(本小题满分16分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期 12月 1日 12月 2日 12月 3日 12月 4日 12月 5日 温差x101113128(℃) 发芽数 y (颗)2325302616该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?【解】 (1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4. ∴P (A )=410=25, ∴P (A )=1-P (A )=35.(2)x =12,y =27,∑3i =1x i y i =977,∑3i =1x 2i=434, ∴b ^=∑3i =1x i y i -3x y ∑3i =1x 2i -3(x )2=977-3×12×27434-3×122=2.5, a^=y -b ^x =27-2.5×12=-3, ∴y ^=2.5x -3.(3)由(2)知,当x =10时,y ^=22,误差不超过2颗; 当x =8时,y ^=17,误差不超过2颗. 故所求得的线性回归方程是可靠的.19.(本小题满分16分)假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下表的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0若由资料知y 与x 呈线性相关关系.(1)试求线性回归方程y ^=b ^x +a 的回归系数b ^与常数项a ^; (2)估计使用年限为10年,则维修费用是多少万元? 【解】 (1)由已知条件制成下表:序号 1 2 3 4 5 合计 x i 2 3 4 5 6 20 y i 2.2 3.8 5.5 6.5 7.0 25 x i y i 4.4 11.4 22.0 32.5 42.0 112.3 x 2i4916253690x -=4,y -=5,∑i =15x 2i =90,∑i =15x i y i =112.3 于是b =112.3-5×4×590-5×42=12.310=1.23,a =y --b x -=5-1.23×4=0.08.(2)由(1)知线性回归方程是y =1.23x +0.08,当x =10时,y =1.23×10+0.08=12.38(万元).即估计使用10年时维修费用是12.38万元.20.(本小题满分16分)以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积x (m 2) 115 110 80 135 105 销售价格y (万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格. 【解】 (1)散点图如图所示:(2)x -=15∑i =15x i =109,∑i =15(x i -x -)2=1 570, y -=23.2,∑i =15(x i -x -)(y i -y -)=308.设所求线性回归方程为y =bx +a , 则b^=3081 570≈0.196 2, a ^=y --b ^x -=23.2-3081 570×109≈1.816 6. 故所求线性回归方程为y =0.196 2x +1.816 6. (3)据(2)可知,当x =150 m 2时,销售价格的估计值为 y =0.196 2×150+1.816 6=31.246 6(万元).。
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)
一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)
一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
苏州市高中数学选修2-3第三章《统计案例》测试(有答案解析)
一、选择题1.以下四个命题:①从匀速传递的产品生产流水线上,每30分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,那么该市身高高于180cm 的高中男生人数大约为3000;③随机交量X 服从二项分布(100,0.4)B ,若随机变量21Y X =+,则Y 的数学期望为()81E Y =,方差为()48D Y =;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系的把握程度越大其中正确的个数是( ) A .1B .2C .3D .42.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4A .成绩B .视力C .智商D .阅读量3.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则 下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01kkkP k C ξ-==4.对四对变量Y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知: ①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0,则变量Y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④D .③和④5.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%6.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归直线y bx a =+必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079.则其两个变量间有关系的可能性是90%. 其中错误的个数是( ) A .1 B .2 C .3 D .47.通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表请问性别和读营养说明之间在多大程度上有关系 ( ) A .99%的可能性 B .99.75%的可能性 C .99.5%的可能性 D .97.5%的可能性8.以下四个命题中:①某地市高三理科学生有15000名,在一次调研测试中,数学成绩ξ服从正态分布()2100,N σ,已知()801000.40P ξ<≤=,若按成绩分层抽样的方式抽取100分试卷进行分析,则应从120分以上(包括120分)的试卷中抽取15分; ②已知命题:p x ∀∈R ,sin 1x ≤,则:p x ⌝∃∈R ,sin 1x >;③在[]4,3-上随机取一个数m ,能使函数()22f x x =++在R 上有零点的概率为37; ④在某次飞行航程中遭遇恶劣气候,用分层抽样的20名男乘客中有5名晕机,12名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用独立性检验,有97%以上的把握认为与性别有关.其中真命题的序号为( ) A .①②③B .②③④C .①②④D .①③④9.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58 10.已知样本789x y 、、、、的平均数是8,标准差是2,则xy 值为 A .8B .32C .60D .8011.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 12.为了增强环保意识,某校从男生中随机抽取60人,从女生中随机抽取50人,参加环保知识测试,统计数据如下表所示: (参考数据:()21122122121212n n n n n n n n n χ++++-=)则认为环保知识测试成绩是否优秀与性别有关的把握为 A .90%B .95%C .99%D .99.9%二、填空题13.在吸烟与患肺病是否相关的判断中,有下面的说法:(1)从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.(2)从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;(3)若2 6.635K >,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; 其中说法正确的是________.14.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到K2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.PM是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是15. 2.5PM监测点统计的数据(单位:毫克/每立方据某地某日早7点至晚8点甲、乙两个2.5米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.16.已知的取值如表所示:若与呈线性相关,且回归方程为,则等于.23454617.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:感染未感染总计服用104050未服用203050总计3070100参考公式: ()()()()()22n ad bc K a b c d a c b d -=++++参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”.18.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________. 19.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________. 20.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表:(1)若把年龄在[)2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.100.050.01 0.001 0k 2.7063.8416.63510.828(2)若从年龄小于40岁的网购男性中用分层抽样的方法抽取5人,再从中抽取两人,求两人年龄都小于20岁的概率.22.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()2n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.050.0250.0100.0050.001175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)25.为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100km/h的有40人;在45名女性驾驶员中,平均车速不超过100km/h的有25人.(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100km/h的人与性别有关.平均车速超过100km/h人数平均车速不超过100km/h人数合计男性驾驶员人数女性驾驶员人数合计(2)以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100km/h 的车辆数为X ,若每次抽取的结果是相互独立的,求X 的分布列和数学期望.参考公式与数据:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:y()()51=--∑iii t t y y()521ii y y =-∑17.14 74 555.792①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211nii i n ii yy R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】根据抽样方式的特征,可判断①;根据正态分布的性质,可判断②;根据二项分布的期望与方差特点,可判断③;根据独立性检验的方法和步骤,可判断④. 【详解】解:①根据抽样是间隔相同,且样本间无明显差异,故①应是系统抽样,即①为假命题;②某市进行了一次全市高中男生身高统计调查,数据显示某市30000高中男生的身高ξ(单位:cm )服从正态分布()2172,N σ,且(172180)0.4P ξ<≤=,所以()1(180)1721800.12P P ξξ>=-<≤=,所以该市身高高于180cm 的高中男生人数大约为300000.13000⨯=人,故②为真命题;③随机交量X 服从二项分布(100,0.4)B ,则()1000.440E X =⨯=,()()1000.410.424D X =⨯⨯-=,若随机变量21Y X =+,则Y 的数学期望为()()2181E Y E X =+=,方差为()()2296D Y D X ==;故③为假命题;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越小,故④为假命题. 故选:A . 【点睛】本题以命题的真假判断为载体考查了抽样方法,正态分布,二项分布及独立性检验等知识点,属于中档题.2.D解析:D 【分析】计算得到22322214χχχχ>>>,得到答案. 【详解】计算得到:22 2152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;222 252(4201612)52112 1636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;故22322214χχχχ>>>.故选:D.【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.3.A解析:A【解析】【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果.【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B.∴100.010.1Eξ=⨯=故选A.【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.4.B解析:B【解析】分析:先查相关系数检验的临界值表,再判断变量Y和x具有线性相关关系的选项.详解: 查相关系数检验的临界值表①r0.05=0.754,r>r0.05;②r0.05=0.514,r<r0.05;③r0.05=0.482,r>r0.05;④r0.05=0.997,r0.05>r.∴y和x具有线性相关关系的是①③.故答案为B.点睛:本题主要考查相关系数,意在考查学生对这些知识的掌握水平.5.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)6.C解析:C 【解析】对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;对于②,一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减小5个单位,故不正确;对于③,线性回归直线ˆˆˆy bx a =+必过样本中心点(),x y ,故正确;对于④,曲线上的点与该点的坐标之间具有一一对应关系,故不正确;对于⑤,有一个2×2列联表中,由计算得213.079K =,则其两个变量间有关系的可能性是99.9%,故不正确. 故选C.7.C解析:C 【详解】由题意可知16,28,20,8a b c d ====,44,28,36,36a b c d a c c d +=+=+=+=,72n a b c d =+++=,代入公式()()()()()22n ad bc K a b c d a c b d -=++++得()227216828208.4244283636K ⨯⨯-⨯=≈⨯⨯⨯,由于28.427.879K ≈>,我们就有0099.5的把握认为性别和读营养说明之间有关系,即性别和读营养说明之间有0099.5的可能是有关系的,故选C .8.B解析:B 【解析】对于①,在一次调研测试中,数学成绩ξ服从正态分布N (100,σ2),∴数学成绩ξ关于ξ=100对称,∵P (80<ξ≤100)=0.40,∴P (ξ>120)=P (ξ<80)=0.5-0.40=0.1,则该班数学成绩在120分以上的人数为0.1×100=10,故①错误;对于②,已知命题p :∀x ∈R ,sinx≤1,则¬p :∃x ∈R ,sinx >1,故②正确;对于③,由)2−8≥0,解得m≤-2或m≥2,∴在[-4,3]上随机取一个数m ,能使函数()22f x x =+在R 上有零点的概率为37,故③正确;对于④,填写2×2列联表如下:则k 2的观测值k =()23215854 5.398 5.02420121319⨯⨯-⨯≈>⨯⨯⨯有97%以上的把握认为晕机与性别有关.故④对 故选B9.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.10.C解析:C 【解析】由78982x y ++++⎧=⎪⎪=得=60xy ,故选C. 11.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 12.C解析:C 【解析】 由题意得:()221104030202060505060χ⨯-⨯=≈⨯⨯⨯7.8>6.635,所以认为环保知识测试成绩是否优秀与性别有关的把握为99%. 本题选择C 选项.二、填空题13.(1)【分析】根据题意利用独立性检验的定义与基本思想对题目中的命题进行逐个分析判断即可求解出答案【详解】根据独立性检验的基本思想在犯错误的概率不超过005的前提下认为吸烟与患肺病有关系的意思为有的把解析:(1) 【分析】根据题意,利用独立性检验的定义与基本思想,对题目中的命题进行逐个分析、判断,即可求解出答案. 【详解】根据独立性检验的基本思想,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系的意思为有95%的把握认为这个推理是正确的,所以(1)正确.从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系的意思为有99%的把握认为这个推理是正确的,而不是说某个人吸烟就有99%的可能患有肺病,所以(2)错误.同(2)中的推论,所以也不能在100个吸烟的人中必有99人患有肺病,故(3)错误.故答案为(1). 【点睛】本题主要考查了独立性检验的基本思想,2K 是检验两个事件相关程度的量,是相关关系,是反映有关和无关的概率.14.不能【解析】查表知若要在犯错误的概率不超过001的前提下认为喜欢玩电脑游戏与认为作业多有关则临界值k0=6635本题中k≈5059<6635所以不能在犯错误的概率不超过001的前提下认为喜欢玩电脑游解析:不能 【解析】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 考点:独立性检验.15.甲【解析】根据茎叶图中的数据可知甲地的数据都集中在006和007之间数据分布比较稳定而乙地的数据分布比较分散不如甲地数据集中故甲地的方差小故答案为甲解析:甲 【解析】根据茎叶图中的数据可知,甲地的数据都集中在0.06和0.07之间,数据分布比较稳定,而乙地的数据分布比较分散,不如甲地数据集中,故甲地的方差小,故答案为甲.16.5【解析】试题分析:考点:回归方程【方法点睛】求回归直线中的参数ba 需要先求得b 再求a 因为所以要根据列表中的数据求得公式中相关的量将这些数据代入公式中即可求得参数b 对于参数a 需要将b 代入回归直线求得解析:5【解析】试题分析:3125344646i ii x y==⨯+⨯+⨯=∑, 32222123429i i x ==++=∑,3x =, 5y =, ∴ 31322130.53ˆi i i i i x y xyb x x==-==-∑∑. 考点:回归方程.【方法点睛】求回归直线中的参数b ,a ,需要先求得b ,再求a ,因为,所以要根据列表中的数据求得公式中相关的量,将这些数据代入公式中,即可求得参数b .对于参数a ,需要将b ,代入回归直线求得.17.【详解】由题意可得参照附表可得:在犯错误的概率不超过的前提下认为小动物是否被感染与有没有服用疫苗有关故答案为【方法点睛】本题主要考查独立性检验的应用属于中档题独立性检验的一般步骤:(1)根据样本数据 解析:5%【详解】 由题意可得,()2210010302040 4.762 3.84150503070K ⨯⨯-⨯=≈>⨯⨯⨯,参照附表,可得:在犯错误的概率不超过005的前提下,认为“小动物是否被感染与有没有服用疫苗有关”,故答案为005. 【方法点睛】本题主要考查独立性检验的应用,属于中档题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)18.6【解析】n 为18+12+6=36的正约数因为18:12:6=3:2:1所以n 为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6 【解析】n 为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n 为6的倍数,因此6,12,18,24,30,36n =因为当样本容量为1n +时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n =19.①④【解析】对于①从匀速传递的产品生产流水线上质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测这样的抽样方法是系统抽样故①正确;对于②两个变量的线性相关程度越强则相关系数的绝对值越接近于1解析:①④ 【解析】对于①,从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,故①正确;对于②,两个变量的线性相关程度越强,则相关系数的绝对值越接近于1,故②错误; 对于③,两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越小,故③错误;对于④,∵随机变量X ∼N (0,1),设P (|X |<1)=p ,则1(1)(1)2pP X P X ->=<-=, ∴11(1)1(1)122p pP X P X -+<=->=-=, ∴2(1)1P X p <-=,即(1)2(1)1P X P X <=<-,故④正确。
高中数学(苏教版选修2-3)双基达标训练:3章 统计案例 本章测试
章末质量评估(三)(时间:120分钟 满分:160分)一、填空题(本大题共14小题,每小题5分,共70分)1.为了调查色弱与性别是否有必然联系,我们对一批人进行了检测,结果发现表中数据(人数):统计量χ2的计算公式为χ2=(a +b +c +d )(ad -bc )2(a +b )(c +d )(a +c )(b +d ),χ2的值越大,表明判定色弱与性别有关的可靠性越________(填“大”或“小”).答案 大2.若线性回归方程中的回归系数b ^=0,则相关系数r =________.解析 b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2.若b ^=0,则r =0. 答案 03.某考察团对全国10大城市进行职工人均平均工资x 与居民人均消费y 进行统计调查,y 与x 具有相关关系,线性回归方程y ^=0.66x +1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比约为________.解析 ∵y ^=7.675,∴7.675=0.66x +1.562, ∴x =9.262,由题意7.6759.262×100%≈83%. 答案 83%4.变量x 与y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 的预报值最大是10,则x 的最大取值不能超过________.解析 由题中数据可求得线性回归方程为y ^=0.729x -0.857,当y ^=10时,x ≈14.89≈15, ∵0.729>0,∴当y 的预报最大取值为10时,x 的最大取值不能超过15. 答案 155.已知x ,Y 之间的数据如下表所示,则Y 与x 之间的线性回归直线一定过点________.解析 回归直线一定过样本中心点(x ,y ),由已知数据得,x =1.167 5,y =2.392 5.答案 (1.167 5,2.392 5)6.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示:根据以上数据,则有解析 由已知数据得2×2列联表,得公式χ2=382×(37×202-121×22)2158×224×59×323≈13.11由于13.11>6.635,所以有99%的把握认为含有杂质的高低与设备改造有关. 答案 含有杂质的高低与设备改造有关7.设有一个回归方程为y ^=3-5x ,变量x 增加一个单位时________.解析 -5是斜率的估计值,说明x 每增加一个单位时,y 平均减少5个单位. 答案 y 平均减少5个单位8.某工厂为了调查工人文化程度与月收入关系,随机抽取了部分工人,得到如由上表中数据计算得χ2=55×50×30×75≈6.109,估计有________把握认为“文化程度与月收入有关系”. 答案 97.5%9.计算下面事件A 与事件B 的2×2列联表的χ2统计量值,得χ2≈________,从而得出结论________.解析 χ2=392×(39×167-157×29)196×196×68×324≈1.779.∵1.779<2.076,∴没有充分的证据显示两者有关系. 答案 1.779 没有充分的证据显示两者有关系10.某单位为了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性回归方程y =b x +a 中b =-2,据此预测当气温为5 ℃时,用电量的度数约为________.解析 回归方程过点(x ,y )=(10,30), 则回归方程为y =-2x +50.11.分类变量X 和Y 的列联表如下:①ad -bc 越小,说明X 与Y 关系越弱; ②ad -bc 越大,说明X 与Y 关系越强; ③(ad -bc )2越大,说明X 与Y 关系越强; ④(ad -bc )2越接近于0,说明X 与Y 关系越强.解析 因为χ2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d ),当(ad -bc )2越大时,χ2越大,说明X 与Y 关系越强. 答案 ③12.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:解析 x =30,y =66.7+76.0+85.0+112.3+128.05=93.6,∑i =15x i y i =0×66.7+10×76.0+20×85.0+50×112.3+70×128.0=17 035,∑i =15x 2i =02+102+202+502+702=7 900.b ^=∑i =15x i y i -5x y ∑i =15x 2i -5x 2≈0.880 9.a ^=y -b ^x =93.6-0.880 9×30=67.173. ∴线性回归方程为y ^=0.880 9x +67.173. 答案 y ^=0.880 9x +67.17313.对有关数据的分析可知,每一立方米混凝土的水泥用量x (单位:k g)与28天后混凝土的抗压度y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y ^=0.30x +9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm 2,每立方米混凝土的水泥用量最少应为________kg.(精确到0.1 kg) 解析 由0.30x +9.99≥89.7,得x ≥265.7. 答案 265.714.如果某地的财政收入x 与支出y 满足线性回归方程y =a +bx +ε(单位:亿元),其中b =0.8,a =2,|ε|≤0.5.若今年该地区的财政收入为10亿元,则年支出预计不会超出________亿元.解析 当x =10时,y ^=2+0.8×10+ε=10+ε. ∵|ε|≤0.5.∴y ^<10.5 答案 10.5二、解答题(本大题共6小题,共90分)15.(本小题满分14分)在调查男女同学是否喜爱篮球的情况中,已知男同学喜爱篮球的为28人,不喜爱篮球的也是28人,而女同学喜爱篮球的为28人,不喜爱篮球的为56人,(1)根据以上数据建立一个2×2的列联表; (2)试判断是否喜爱篮球与性别有关? 解 (1)2×2列联表如下:(2)计算χ2=140×(28×56-28×28)256×84×56×84=359≈3.889.因为χ2>3.841,故我们有95%的把握认为是否喜爱篮球与性别有关. 16.(本小题满分14分)已知某地每单位面积菜地年平均使用氮肥量x (k g)与每单位面积蔬菜年平均产量y (t )之间的关系有如下数据:(2)若线性相关,求蔬菜产量y 与使用氮肥量x 之间的回归直线方程,并估计每单位面积施肥150 k g 时,每单位面积蔬菜的年平均产量. (已知数据:x =101,y ≈10.113 3,∑i =115x 2i =161 125,∑i =115y 2i =1 628.55,∑i =115x i y i=16 076.8)解 由已知数据,故每单位面积蔬菜产量与使用氮肥量的相关系数r =∑i =115x i y i -15x y(∑i =115x 2i -15x 2)(∑i =115y 2i -15y 2)=16 076.8-15×101×10.113 3(161 125-15×1012)×(1 628.55-15×10.113 32)≈0.863 2>0.75.这说明每单位面积蔬菜产量与使用氮肥量之间存在着很强的线性相关关系. (2)设所求的回归直线方程为y ^=b ^x +a ^,则b ^=∑i =115x i y i -15x y∑i =115x 2i -15x 2≈0.093 1,a ^=y -b ^x =0.710 2, 则y ^=0.093 1x +0.710 2.当每单位面积菜地施肥150 k g 时, y ^=0.093 1×150+0.710 2=14.675 2(t).17.(本小题满分16分)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?附:解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%. (2)χ2=1 000×(360×180-320×140)500×500×680×320≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.18.(本小题满分16分)在电阻碳含量对于电阻的效应研究中,得到如下表所示的数据:(1)(2)求出电阻y 关于含碳量x 之间的回归直线方程. 解 (1)x ≈0.543,y ≈20.771,∑i =17x 2i =2.595,∑i =17y 2i =3 104.2,∑i =17x i y i =85.61.代入公式,得r =∑i =17x i y i -7x y(∑i =17x 2i -7x 2)(∑i =17y 2i -7y 2)=85.61-7×0.543×20.771(2.595-7×0.5432)(3 104.2-7×20.7712)≈0.996>r 0.05.故y 与x 之间有很强的线性相关关系.(2)b ^=∑i =17x i y i -7x y∑i =17x 2i -7x 2=85.61-7×0.543×20.7712.595-7×(0.543)2≈12.540,a ^=y -b ^x =20.771-12.540×0.543≈13.961, ∴电阻y 关于含碳量x 之间的回归直线方程是 y ^=12.540x +13.961.19.(本小题满分16分)某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x (x 取整数)元与日销售量y 台之间有如下关系:(1) (2)求日销售量y 对销售单价x 的线性回归方程;(3)设经营此商品的日销售利润为P 元,根据(1)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.(2)∵x =14×(35+40+45+50)=42.5. y =14×(56+41+28+11)=34.∑i =14x i y i =35×56+40×41+45×28+50×11=5 410.∑i =14x 2i =352+402+452+502=7 350.∴b ^=∑i =14x i y i -4 x y ∑i =14x 2i -4 x 2=5 410-4×42.5×347 350-4×42.52=-370125≈-3.∴a ^=y -b ^x =34-(-3)×42.5=161.5. ∴y ^=-3x +161.5. (3)依题意有P =(-3x +161.5)(x -30)=-3x 2+251.5x -4 845 =-3(x -251.56)2+251.5212-4 845.∴当x =251.56≈42时,P 有最大值,约为426. 即预测销售单价为42元时,能获得最大日销售利润.方法点评:该题属于线性回归问题,解答本类题目的关键首先应先通过散点图(或相关性检验求相关系数r )来分析两变量间的关系是否相关,然后再利用求回归方程的公式求解回归方程,在此基础上,借助回归方程对实际问题进行分析.20.(本小题满分16分)想象一下一个人从出生到死亡,在每个生日都测量身高,并作出这些数据的散点图,这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析,下表是一位母亲给儿子做的成长记录:(2)如果年龄相差5岁,则身高有多大差异(3~16岁之间)? (3)如果身高相差20 cm ,其年龄相差多少(3~16岁之间)?(4)计算残差,说明该函数模型是否能够较好地反映年龄与身高的关系,说明理由.解 (1)设年龄x 与身高y 之间的回归直线方程为y ^=b ^x +a ^,由公式b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2得b ^≈6.286,a ^=y -b ^x ≈72,所以y ^=6.286x +72.(2)如果年龄相差5岁,则预报变量变化6.286×5=31.425,即身高相差约31.4 cm.(3)如果身高相差20 cm ,年龄相差Δx =206.286=3.182≈3(岁). (4)由表得R2=1-∑i=1n(y i-y^)2∑i=1n(y i-y)2≈0.999 7.由R2=0.999 7,表明年龄解释了99.97%的身高的变化,拟合效果较好.。
高中数学选修2-3 第三章 统计案例 章末检测题
高中数学选修2-3第三章 统计案例 章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( ) A .残差分析 B .回归分析 C .等高条形图D .独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为栏目优秀B .有99%的人认为栏目是否优秀与改革有关系C .有99%的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系【解析】由于K 2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.【答案】D3.已知一个线性回归方程为y ∧=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .58.5 B .46.5 C .60 D .75【解析】x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5【答案】A4.设有一个回归方程为y ∧=3-5x ,当变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位D .y 平均减少3个单位【解析】-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 【答案】B5.若由一个2×2列联表中的数据计算得K 2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )A .0.025B .0.01C .0.005D .0.001【解析】∵P (K 2>5.024)=0.025.又K 2=6.630>5.024,∴犯错误的最大概率为0.025. 【答案】A6.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变小C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强【解析】由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.【答案】B7.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:以下数据中,对于同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .A =5,b =4,c =3,d =2 B .A =5,b =3,c =4,d =2 C .A =2,b =3,c =4,d =5 D .A =2,b =3,c =5,d =4【解析】可计算|ad -bc|的值,值越大说明X 与Y 有关的可能性越大. 【答案】D8.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( )A .14B .15C .16D .17【解析】根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ∧≈-0.857,b ∧≈0.729,所以线性回归方程为y ∧=0.729x -0.857.当y ∧=10时,得x ≈15.【答案】B9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的【解析】由列联表可得:博士:男性占2735≈77%,女性占835≈23%,相差很大,所以性别与获取学位的类别有关,故选A.【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.30B .模型2的R 2为0.50C .模型3的R 2为0.75D .模型4的R 2为0.98 【解析】R 2越大,拟合效果越好. 【答案】D11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】将表中的五组数据分别代入选项验证,可知y =88+12x 最适合.【答案】C12.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么()1021i i y y=-∑的值为( )A .241.06B .2 410.6C .253.08D .2 530.8【解析】R 2=1-∑i =110(y i -y ∧i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110 (y i -y )2,得()1021i i y y=-∑=120.531-0.95=2 410.6.【答案】B二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)13.在两个变量的回归分析中,R 2=________,R 2的值越________________________________________________________________________,说明残差平方和越________,也就是说模型的拟合效果越________.【答案】1-∑i =1n(y i -y ∧i )2∑i =1n(y i -y )2大 小 好14.已知样本数为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ∧=0.3x +a ∧,则x ≈________,a ∧≈________.(精确到0.01)【解析】由题意,x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ∧,所以21411=0.3×51011+a ∧,可求得a ∧≈5.55. 【答案】46.36 5.5515.某单位为了了解用电量y (度)与气温x (°C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4°C 时,用电量的度数约为________.【解析】x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68. 【答案】6816.若两个分类变量X 与Y 的列联表为:则“X 与Y 【解析】由列联表数据,可求得随机变量K 2的观测值k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P(K 2≥6.635)≈0.01.所以“x 与y 之间有关系”出错的概率仅为0.01.【答案】0.01三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.【解析】根据题中数据得如下列联表:由列联表中的数据得k =900×(290×350-100×160)2450×450×390×510≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:(1)(2)求出机床运转的速度x 与每小时生产二级品数量y 的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?【解析】(1)散点图如下图所示:(2)易求得x =12.5,y =8.25,∴b ∧=∑i =14x i y i -4x y∑i =14x 2i -4x2≈0.728 6,a ∧=y -b ∧x =-0.857 5, 即所求回归直线的方程为:y ∧=0.728 6x -0.857 5.(3)根据公式,要使y ∧≤10, 只要0.728 6x -0.857 5≤10, 解得x ≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.19.(本小题满分12分)有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:其中,a ,15-a 均为大于50.10的前提下认为“X 与Y 之间有关系”?【解析】要使在犯错误的概率不超过0.10的前提下认为“X 与Y 之间有关系”,需要随机变量K 2的观测值大于2.706.∵a +(20-a )=20, (15-a )+(30+a )=45,a +(15-a )=15,(20-a )+(30+a )=50, a +(20-a )+(15-a )+(30+a )=65,则 K 2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)25 400>2.706,解之可得,a >7.19或a <2.04,而由原题知a >5且15-a >5,a ∈Z ,即a =6,7,8,9.故当a =8或9时,可在犯错误的概率不超过0.10的前提下认为X 和Y 之间有关系. 20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (2)请求出R 2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】(1)∑i =14x i y i =66.5,∑i =14x 2i =32+42+52+62=86,x =4.5,y =3.5b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7a ∧=y -b ∧x =3.5-0.7×4.5=0.35所求的线性回归方程为y ∧=0.7x +0.35 (2)计算得残差及偏差的数据如下表:从而得∑i =14(y i -y ∧i )2=0.05,∑i =14(y i -y )2=2.5所以R 2=1-∑i =14(y i -y ∧i )2∑i =14(y i -y )2=1-0.052.5=0.98.所以残差变量对预报变量的贡献率约为2%.21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人? 【解析】设男生人数为x ,依题意可得列联表如下:(1)则K 2>3.841, 由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关, 则K 2≤2.706,由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x2·x 2·x =38x ≤2.706,解得x ≤7.216, ∵x 2,x6为整数, ∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t =x 2,得到下表:再做出y 和t 的散点图(如图2),发现这些点分布在一条直线的附近,所以y 与t 线性相关,由公式可计算求得:b ∧=∑t i y i -7t y ∑t 2i -7t2≈0.37,a ∧=y -b ∧t =-204.90,于是y ∧=0.37t -204.90,故y 与x 之间的回归方程是y ∧=0.37x 2-204.90,当x =50时,代入可得y ∧=720.1,故由此可以估计温度在50°C 时的产卵数量大约为720个.。
苏州市高中数学选修2-3第三章《统计案例》检测(有答案解析)
一、选择题1.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系2.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .43.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=;D .am bm >是a b >的充分不必要条件;4.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bc K a c b d a b c d -=++++,其中n a b c d =+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关5.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系:y与x的线性回归方程为 6.5175ˆ.=+,当广告支出5万元时,随机误差的效应(残y x差)为()A.40 B.20C.30 D.106.某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:计算得K2=10,则下列选项正确的是()A.有99.5%的把握认为使用智能手机对学习有影响B.有99.5%的把握认为使用智能手机对学习无影响C.在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D.在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响7.下列说法中,不正确的是A.两个变量的任何一组观测值都能得到线性回归方程B.在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C.线性回归方程反映了两个变量所具备的线性相关关系D.线性相关关系可分为正相关和负相关8.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()A.90% B.95% C.97.5% D.99.5% 9.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计男生18927女生81523合计262450若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++P(K2>k0)0.150.100.050.0250.010.001k0 2.072 2.706 3.841 5.024 6.63510.828A.0.01 B.0.025 C.0.10 D.0.0510.有下列数据:x123y3 5.9912.01下列四个函数中,模拟效果最好的为()A.B.C.D.11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表数学85~100分85分以下合计物理85~100分378512285分以下35143178合计72228300 2P K k≥0.0500.0100.001()k 3.841 6.63510.828附:K≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过经计算2 4.514A.0.5% B.1% C.2% D.5%二、填空题13.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如表根据列联表数据,求得K2≈__________.14.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员女公务员生二胎8040不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”.附:K2=.P (K2≥k0)0.100.050.0250.0100.0050.001k0 2.706 3.841 5.024 6.6357.87910.82815.已知方程是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是________.16.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业非统计专业统计专业性别男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K2的观测值为.因为k>3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.17.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下22列联表喜爱打篮球不喜爱打篮球合计男生20525女生101525合计302050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 18.给出下列5种说法:①标准差越小,样本数据的波动也越小; ②回归分析研究的是两个相关事件的独立性;③在回归分析中,预报变量是由解释变量和随机误差共同确定的; ④相关指数是用来刻画回归效果的,的值越大,说明回归模型的拟合效果越好.⑤对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越小.其中说法正确的是________(请将正确说法的序号写在横线上).19.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”. 20.下列说法正确的个数有_________(1)已知变量x 和y 满足关系23y x =-+,则x 与y 正相关;(2)线性回归直线必过点(),x y ;(3)对于分类变量A 与B 的随机变量2k ,2k 越大说明“A 与B 有关系”的可信度越大 (4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数2R 的值越大,说明拟合的效果越好.三、解答题21.奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下: 是否愿意提供志愿者服务 性别愿意不愿意男生2010女生1020(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?(2)你能否在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:()2P kχ≥0.150.100.050.0250.0100.0050.001 k 2.072 2.706 3.841 5.024 6.6357.87910.828独立性检验统计量()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.22.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)23.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?不合格合格男生1416女生1020(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.1000.0500.0100.001k2.7033.8416.63510.82824.中央电视台“国家品牌计划”栏目组为了做好新能源汽车的品牌推介,利用网络平台对年龄(单位:岁)在[20,60]内的人群进行了调查,并从参与调查者中随机选出600人,把这600人分为对新能源汽车比较关注和不太关注两类,并制成如下表格:年龄/岁[20,30)[30,40)[40,50)[50,60]性别男女男女男女男女人数4010120701601008020比较关注所占的比例20%50%60%70%70%80%60%80%(1)填写列联表,并根据列联表判断能否在犯错误的概率不超过0.01的前提下认为性别与对新能源汽车关注度有关;这600人中选出6人进行访谈,最后从这6人中随机选出3人参与电视直播节目,记3人中女性的人数为X ,求X 的分布列与期望. 附:0)k 22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 25.新冠状病毒严重威胁着人们的身体健康,我国某医疗机构为了调查新冠状病毒对我国公民的感染程度,选了某小区的100位居民调查结果统计如下:(1)根据已知数据,把表格数据填写完整;(2)能否在犯错误的概率不超过5%的前提下认为感染新冠状病与不同年龄有关? (3)已知在被调查的年龄大于50岁的感染者中有5名女性,其中2位是女教师,现从这5名女性中随机抽取3人,求至多有1位教师的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.26.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取100名观众进行调查,将日均收看体育节目时间不低于40分钟的观众称为“体育迷”,数据统计如下表:(1)是否有99%的把握认为“体育迷”与性别有关?(2)该体育类节目为了提升收视率,规定“体育迷”每天奖励积分2分,“非体育迷”每天奖励积分1分,积分累计一定数量可以用积分换购自己喜爱的物品.用表中的样本频率作为概率的估计值.某日3名观众来领取积分,记此3人当日的积分总和为随机变量ξ,求ξ的分布列和数学期望.附:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P(K2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A与B有关系.【详解】依据下表:2 6.635K > ,2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.2.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .3.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.4.C解析:C 【解析】由题易得22⨯列联表如下:则2K 的观测值为()22023510 4.432 3.841128713k ⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C .【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.5.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .6.A解析:A 【解析】因为7.879<K 2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响. 故选A.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.C解析:C 【详解】∵2 6.023 5.024K =>∴可断言市民收入增减与旅游欲望有关的把握为97.5%. 故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.9.B解析:B 【解析】K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B10.A解析:A 【解析】当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好.故选A.考点:非线性回归方程的选择.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.D解析:D 【解析】23.841 4.514 6.635k <=<,则0.010.05P <<,出错概率不超过5%选D.二、填空题13.469【解析】由计算公式K2=得K2≈7469解析:469 【解析】 由计算公式K 2=,得K 2≈7.469.14.没有【解析】由于K2=<6635故没有99以上的把握认为生二胎与性别有关解析:没有 【解析】由于K 2=2200(80404040)5012080120809⨯-⨯=⨯⨯⨯<6.635,故没有99%以上的把握认为“生二胎与性别有关”.15.【解析】将x =160代入得所以残差考点:线性回归方程残差 解析:【解析】 将x =160代入,得,所以残差考点:线性回归方程,残差.16.5【解析】因为随机变量K2的观测值k >3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.17.【解析】则至少有的把握认为喜爱打篮球与性别有关 解析:99.5%【解析】2250(30050)8.33325253020k -==⨯⨯⨯()200.0050.001p k k >≥>则至少有99.5%的把握认为喜爱打篮球与性别有关18.①③④⑤【解析】试题分析:由题;①标准差越小样本数据的波动也越小由方差定义正确;②回归分析研究的是两个相关事件的独立性;错误因为相关性;③④⑤回到定义都正确考点:统计中的特征量及回归分析与独立性检验解析:①③④⑤ 【解析】试题分析:由题;①标准差越小,样本数据的波动也越小,由方差定义,正确; ②回归分析研究的是两个相关事件的独立性;错误,因为相关性; ③,④,⑤回到定义都正确.考点:统计中的特征量及回归分析与独立性检验.19.%【解析】试题分析:根据表中数据计算得所以有%以上的把握认为喜欢足球与性别有关考点:1列联表;2独立性假设检验解析:99.5% 【解析】试题分析:根据表中数据计算得,2250(1520105)8.3337.87925252030k ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.5%以上的把握认为“喜欢足球与性别有关”.考点:1.列联表;2.独立性假设检验.20.3个【分析】直接利用线性回归直线的相关理论知识的应用求出结果【详解】(1)已知变量x 和y 满足关系y=-2x+3则x 与y 正相关;应该是:x 与y负相关故错误(2)线性回归直线必过点线性回归直线必过中心点解析:3个【分析】直接利用线性回归直线的相关理论知识的应用求出结果.【详解】(1)已知变量x和y满足关系y=-2x+3,则x与y正相关;应该是:x与y负相关.故错误.(2)线性回归直线必过点(),x y,线性回归直线必过中心点.故正确.(3)对于分类变量A与B的随机变量2k,2k越大说明“A与B有关系”的可信度越大.根据课本上有原句,故正确.(4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数R2的值越大,说明拟合的效果越好.故正确,根据课本上有原句.故填3个.【点睛】本题主要考查了线性回归直线的应用,学生对知识的记忆能力,主要考查学生的运算能力和转换能力,属于中档题.三、解答题21.(1)4人;(2)是否愿意提供志愿者服务与性别有关.【分析】(1)根据题意,确定愿意提供志愿者服务的男女生人数,进而可求出抽取的男生人数;(2)根据题中数据,由()()()()()22n ad bca b c d a c b dχ-=++++求出2χ,结合临界值表,即可得出结果.【详解】(1)由题意,可知男生抽取20642010⨯=+(人).(2)2260(20201010)6.66730303030χ⨯⨯-⨯=≈⨯⨯⨯,由于6.667 6.635>,所以能在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关.【点睛】本题主要考查分层抽样,考查独立性检验的思想,属于常考题型.22.(1)直方图见解析,3360元;(2)列联表见解析,没有95%的把握认为网购金额与网购人年龄有关.【分析】(1)由频数分布表计算出各组数据的纵坐标(频率除以组距),再做出频率分布直方图, 由频率分布直方图估计平均值的定义可得本市居民此期间网络购物的消费平均值;(2) 根据频数分布表中的数据可知网购金额不超过4000元的有700人,超过4000元的有300人,根据分层抽样可得网购金额不超过4000元需要抽取140人,超过4000元的需要抽取60人,再根据列联表的性质即可完成表格,再根据列联表的数据计算出2K 并与给定的参考表对照得到结论. 【详解】(1)由题可知随机对1000人做问卷调查,消费数据的组距为2000, 可求得频率分布直方图纵轴上每组的数据(频率除以组距), 即3000.0001510002000=⨯,4000.000210002000=⨯,1800.0000910002000=⨯,600.0000310002000=⨯,则[]0,2000,(]2000,4000,(]4000,6000,(]6000,8000,(]8000,10000, 对应的的数据(频率除以组距)分别是0.00015,0.0002,0.00009,0.00003,0.00003, 从而得出频率分布直方图,由频率分布直方图估计平均值的定义,可得10000.330000.450000.1870000.0690000.0630012009004205403360x =⨯+⨯+⨯+⨯+⨯=++++=(元),故本市居民此期间网络购物的消费平均值为3360元; (2)由数据可知以网购金额不超过4000元的有2007001401000⨯=(人), 超过4000元的有200300601000⨯=(人), 可得列联表.网购不超过4000元 网购超过4000元 总计 40岁以上 75 25 100 40岁以下(含40岁)6535100由()()()()220075356525502.3813.8411406010010021n ad bc K a b c d a c b d -⨯⨯-⨯===≈<++++⨯⨯⨯. 故在此期间没有95%的把握认为网购金额与网购人年龄有关. 【点睛】本题第一问考查了平均数的计算、画出频率分布直方图,其中主要是计算出纵坐标的值(频率除以组距)属于常见题型,第二问主要考查完善列联表,2K 的计算,属于中档题目,解题中对计算能力要求较高.23.(1)没有90%的把握认为“性别”与“问卷的结果”有关;(2)分布列见解析,20()9E X =【分析】(1)根据独立性检验的思想即可判断.(2)依题意,成绩合格的男生抽取4人,成绩合格的女生抽取5人,X 的可能取值为01234,,,,,求出各随机变量的概率,列出分布列即可求出期望.【详解】(1)完善列联表如下所示:222()60(14201016) 1.111 2.706()()()()30302436n ad bc K a b c d a c b d -⨯⨯-⨯∴==≈<++++⨯⨯⨯,故没有90%的把握认为“性别”与“问卷的结果”有关.(2)依题意,成绩合格的男生抽取4人,成绩合格的女生抽取5人,故X 的可能取值为01234,,,,,55591(0)126C P X C ===,41545920(1)126C C P X C ===,32545960(2)126C C P X C ===, 23545940(3)126C C P X C ===,5944155(4)126C C P X C ===, 故X 的分布列为:所以1206040520()012341261261261261269E X =⨯+⨯+⨯+⨯+⨯=. 【点睛】本题考查了独立性检验以及数学期望,解题的关键是列出列联表和分布列,属于基础题. 24.(1)列联表见解析,有99%的把握认为性别与对新能源汽车关注度有关;(2)分布列见解析,数学期望为1. 【分析】(1)根据题意,列出表格求出2K ,判断即可;(2)根据(1),男女比例为2:1,6人中女性的人数为2人,男性为4人,记3人中女性的人数为X ,X 0=,1,2,求出分布列,求出数学期望即可. 【详解】解:(1)根据题意,填充二维联表如下:由213.19 6.635()()()()400200390210K a b c d a c b d ==≈>++++⨯⨯⨯, 故有99%的把握认为性别与对新能源汽车关注度有关;(2)根据(1),男女比例为2:1,6人中女性的人数为2人,男性为4人, 记3人中女性的人数为X ,X 0=,1,2,34361(0)0.25C P X C ====;1224363(1)0.65C C P X C ====;2124361(2)0.25C C P X C ====; X 的分布列如下:【点睛】本题考查了独立性检验,还考查了离散型随机变量求分布列和数学期望,考查运算能力,属于中档题.25.(1)见解析;(2)能在犯错误的概率不超过5%的前提下认为感染新冠状病与不同年龄有关;(3)7 10.【分析】(1)根据所选居民总人数为100可完善22⨯列联表;(2)计算出2K的观测值,结合临界值表可得出结论;(3)计算出所有的基本事件数,并求出事件“所抽取的3人中至多有1名教师”所包含的基本事件数,利用古典概型的概率公式可求得所求事件的概率.【详解】(1)由于所选居民总人数为100,22⨯列联表如下表所示:(2)()()()()()()21002006004.762 3.84180203070n ad bcKa b c d a c b d-⨯-==≈> ++++⨯⨯⨯,所以能在犯错误的概率不超过5%的前提下认为感染新冠状病与不同年龄有关;(3)从5人任意抽3人的所有等可能事件共3510C=个,其中至多1位教师有3123237C C C+=个基本事件,所以所求概率是7 10.【点睛】本题考查独立性检验基本思想的应用,同时也考查了古典概型概率的计算,考查组合计数原理的应用,考查计算能力,属于中等题.26.(1)有99%的把握认为“体育迷”与性别有关;(2)分布列见解析,数学期望为3.9【分析】(1)由表中数据可得出列联表,进而求出2χ,结合临界值表可得出结论;(2)求出体育迷的概率为310P=,随机变量ξ可取的值为3,4,5,6,分别求出对应概率,进而可得出分布列及数学期望.【详解】(1)由表中数据可得列联表如下图:则()210020451025169008.129 6.635307045552079χ⨯-⨯==≈>⨯⨯⨯, 所以有99%的把握认为“体育迷”与性别有关. (2)由题意,从观众中随机抽取一名,体育迷的概率为30310010P ==, 随机变量ξ可取的值为3,4,5,6,()0303333431101010003P C ξ⎛⎫⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭=, ()1213334411101010004P C ξ⎛⎫⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭=, ()2123331891101010005P C ξ⎛⎫⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭=, ()303333271101016000P C ξ⎛⎫⎛⎫=-= ⎪ =⎪⎝⎭⎝⎭, 分布列为:数学期望()3456 3.91000100010001000E ξ=⨯+⨯+⨯+⨯=. 【点睛】 本题考查独立性检验,考查分布列与数学期望的求法,考查学生的计算求解能力,属于中档题.。
苏教版高中数学 第3章 统计案例综合检测 选修2-3精选资料
TB: 小初高题库
高中数学精选学习内容
________的.(填“有关”或“无关”) 【解析】 ∵χ2≈27.63>10.828,∴有理由认为眼睛近视与青少年的性别是有关的. 【答案】 有关 ^ 10.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为y=60+90x,下列判
断中正确的是 _______.
①在 100 个吸烟的人中约有 95 个人患肺病 ②若某人吸烟,那么他有 95%的可能性患肺病 ③有 95%的把握认为“患肺病与吸烟有关” ④认为“患肺病与吸烟有关”,错误的可能性是 5% 【解析】 H0:患肺病与吸烟无关.P(χ2≥3.841)≈0.05,是 H0 成立的概率,故③④ 正确. 【答案】 ③④ 9.在一项眼睛近视与青少年的性别是否有关的调查中,共调查中学生 1 671 人,经过 计算得出 χ2≈27.63,根据这一数据分析,我们有理由认为眼睛近视与青少年的性别是
【解析】 ①当 n=7 时,可知 n-2=5,查表得 r0.05=0.754,∴r>r0.05;
TB: 小初高题库
高中数学精选学习内容
②当 n=15 时,查表得 r0.05=0.514,∴r<r0.05; ③当 n=17 时,查表得 r0.05=0.482,∴r>r0.05; ④当 n=3 时,查表得 r0.05=0.997,∴r<r0.05; ∴具有线性相关关系的是①③. 【答案】 ①③ 7.为预测某种产品的回收率 y,需要研究它和原料有效成分含量 x 之间的相关关系, 现取了 8 组观察值.计算知:
【答案】 ③
11.某产品的广告费用 x 与销售额 y 的统计数据如下表:
广告费用 x(万元) 4 2 3 5
销售额 y(万元)
苏州新区二中高中数学选修2-3第三章《统计案例》测试(含答案解析)
一、选择题1.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关 2.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >3.下列关于回归分析与独立性检验的说法正确的是()A .回归分析和独立性检验没有什么区别;B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;C .独立性检验可以100%确定两个变量之间是否具有某种关系.D .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;4.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值5.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c xy c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23; ④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .48.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,男 女文科2 5理科 10 3参考公式和数据:22()()()()()n ad bc K a c b d a b c d -=++++,其中n a b c d =+++.20()P K k ≥0.25 0.15 0.10 0.05 0.025 0.010 0.0050k 1.323 2.072 2.706 3.841 5.024 6.635 7.879则以下判断正确的是A .至少有97.5%的把握认为学生选报文理科与性别有关B .至多有97.5%的把握认为学生选报文理科与性别有关C .至少有95%的把握认为学生选报文理科与性别有关D .至多有95%的把握认为学生选报文理科与性别有关 9.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过( )附:()()()()()22n ad bc K a b c d a c b d -=++++A .0.01B .0.025C .0.10D .0.0510.为了检验设备M 与设备N 的生产效率,研究人员作出统计,得到如下表所示的结果,则( )设备M 设备N 生产出的合格产品 48 43 生产出的不合格产品27附:()2P K k >0.15 0.100.050.025 0.010 0.005 0.001 k 2.0722.7063.8415.0246.6357.87910.828参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .有90%的把握认为生产的产品质量与设备的选择具有相关性B .没有90%的把握认为生产的产品质量与设备的选择具有相关性C .可以在犯错误的概率不超过0.01的前提下认为生产的产品质量与设备的选择具有相关性D .不能在犯错误的概率不超过0.1的前提下认为生产的产品质量与设备的选择具有相关性 11.下列说法中正确的是①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度;④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好.( ) A .①②B .③④C .①④D .②③12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )2()P K k ≥ … 0.25 0.15 0.10 0.025 0.010 0.005 … k …1.3232.0722.7065.0246.6357.879…A .90%B .95%C .97.5%D .99.5%二、填空题13.以下四个命题中:①在回归分析中,可用相关系数r 的值判断模型的拟合效果,|r |越大,模拟的拟合效果越好;②在一组样本数据()()()112212,,,,...,,(2,,,...,n n n x y x y x y n x x x ≥不全相等)的散点图中,若所有样本点()()11,1,2,...x y i n =都在直线112y x =-+上,则这组样本数据的线性相关系数为12-;③对分类变量x 与y 的随机变量2k 来说,2k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为__________.14.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)男 女 正常 73 117 色弱73你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.给出下列5种说法:①标准差越小,样本数据的波动也越小; ②回归分析研究的是两个相关事件的独立性;③在回归分析中,预报变量是由解释变量和随机误差共同确定的; ④相关指数是用来刻画回归效果的,的值越大,说明回归模型的拟合效果越好.⑤对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越小.其中说法正确的是________(请将正确说法的序号写在横线上).17.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 18.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)19.关于变量,x y 的一组样本数据11()a b ,,22()a b ,,……,(),n n a b (2n ≥,12,,,n a a a ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i a b (1,2,,i n =⋅⋅⋅)恰好都在直线21y x =-+上,则根据这组样本数据推断的变量,x y 的相关系数为_____________. 20.给出下列四个结论:(1)相关系数r 的取值范围是1r <;(2)用相关系数r 来刻画回归效果,r 的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,且(),,0,1a b c ∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________. 三、解答题21.2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6~11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhone XR 一款位列第三.(1)从上表中15个机型中任取3个,求这3个机型恰好有2个是“华为”或“荣耀”的概率; (2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意 不满意城市 270 30 农村17030根据上表数据,问是否有的把握认为消费者是否满意与城市用户还是农村用户有关? (附:()()()()()22n ad bc a b c d a c b d χ-=++++,当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的)22.2020年江西省旅游产业发展大会于6月12日至6月13日在赣州顺利召开.为让广学生子解赣州旅游文化,赣州市旅游局在赣州市各中小学校开展“赣州市旅游知识网络竞赛”活动.为了更好地分析中学生和小学生对赣州市旅游知识掌握情况,将中学组和小学组的所有参赛选手按成绩分为优秀、良好、一般三个等级,随机从中抽取了100名选手进行调查,下面是根据调查结果绘制的选手等级人数的条形图.(1)若将一般和良好等级合称为合格等级,根据已知条件完成下面的22⨯列联表,并据此资料你是否有95%的把握认为选手成绩“优秀”与文化程度有关?优秀 合格 合计中学组 小学组 合计(2)若某县参赛选手共80人,用频率估计概率,试估计该县参赛选手中优秀等级的人数;(3)如果在优秀等级的选手中取3名,在良好等级的选手中取2名,再从这5人中任选3人组成一个比赛团队,求所选团队中恰有2名选手的等级为优秀的概率.注:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.P (20K k ≥)0.10 0.05 0.005 0k 2.7063.8417.87923.某土特产超市为预估2021年元旦期间游客购买土特产的情况,对2020年元旦期间的购买情况进行随机抽样并统计,得到如下数据: 购买金额(元) [0,15)[15,30)[30,45)[45,60)[60,75)[75,90]人数101520252010(1)估计游客平均购买金额(同一组中的每个数据可用该组区间的中点值代替); (2)根据以上数据完成22⨯列联表,并判断是否有90%的把握认为购买金额是否少于60元与性别有关.附:参考公式和数据:22(),()()()()n ad bcK n a b c da b c d a c b d-==+++ ++++.附表:24.某大学读书协会为了解本校大学生网上阅读与传统纸质阅读的情况,调查了该大学1000名大学生(男、女各占一半),就偏向网上阅读和偏向传统纸质阅读的情况做了调查记录.记录显示,偏向网上阅读的男大学生比偏向传统纸质阅读的男大学生多300人,这1000名大学生中,偏向传统纸质阅读的大学生共有400人.(1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99.9%的把握认为该大学的大学生的阅读方式与性别有关,说明你的理由.附:22(-)()()()()n ad bcKa b c d a c b d=++++(n=a+b+c+d).25.中央电视台“国家品牌计划”栏目组为了做好新能源汽车的品牌推介,利用网络平台对年龄(单位:岁)在[20,60]内的人群进行了调查,并从参与调查者中随机选出600人,把这600人分为对新能源汽车比较关注和不太关注两类,并制成如下表格:(1)填写列联表,并根据列联表判断能否在犯错误的概率不超过0.01的前提下认为性别与对新能源汽车关注度有关;这600人中选出6人进行访谈,最后从这6人中随机选出3人参与电视直播节目,记3人中女性的人数为X ,求X 的分布列与期望. 附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.26.云南是世界茶树的原产地之一,也是中国四大茶产区之一,独特的立体气候为茶叶的种质资源多样性创造了良好的自然条件,茶叶产业是云南高原特色农业的闪亮名片.某大型茶叶种植基地为了比较A 、B 两品种茶叶的产量,某季采摘时,随机选取种植A 、B 两品种茶叶的茶园各30亩,得到亩产量(单位:kg/亩)的茎叶图如下(整数位为茎,小数位为叶,如55.4的茎为55,叶为4):亩产不低于60kg的茶园称为“高产茶园”,其它称为“非高产茶园”.(1)请根据已知条件完成以下22⨯列联表,并判断是否有95%的把握认为“高产茶园”与茶叶品种有关?A品种茶叶(亩数)B品种茶叶(亩数)合计高产茶园非高产茶园合计(2)用样本估计总体,将频率视为概率,现从该种植基地A品种的所有茶园中随机抽取4亩,且每次抽取的结果相互独立,设被抽取的4亩茶园中“高产茶园”的亩数为X,求X 的分布列和数学期望()E X.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++ ()2P K k≥0.0500.0100.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【解析】根据上表数据可求得20.027 1.323k≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D2.D解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55i i x x =-=-+-++=∑ , ()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215i i x x=-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D .本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.3.D解析:D【分析】根据题意可知,利用回归分析和独立性检验的定义,排除错误选项,即可求解出答案.【详解】回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法.独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.根据以上定义,可知A、B、C均错误,故答案选D.【点睛】本题主要考查了回归分析与独立性检验的定义的区别.4.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.5.B解析:B【分析】根据独立性检验中卡方的概念知,选B.【详解】K 时,有99%的把握说事件A与B有关选B.根据独立性检验中卡方的概念知,2 6.635【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.6.B解析:B【解析】【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】分析:根据独立性检验的性质可判断①;根据回归分析的基本原理可判断②;根据几何概型概率公式可判断③; 根据不等式的性质可判断④.详解:①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越小,①错误;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好,②正确;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为1123103-=-,正确; ④“0,0a b >>”可得到“2b a a b +≥”, “2b aa b+≥”时“0,0a b >>”不一定成立,所以“0,0a b >>”是“2b aa b+≥”的充分不必要条件,正确,即正确命题的个数是3,故选C. 点睛:本题主要通过对多个命题真假的判断,主要综合独立性检验、回归分析、几何概型概率公式、不等式的性质,属于中档题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.8.C解析:C 【解析】由题易得22⨯列联表如下:则2K 的观测值为()22023510 4.432 3.841128713k ⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C .【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.9.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.10.A解析:A 【解析】将表中的数据代入公式,计算得22100(487243) 3.0535050919K ⨯⨯-⨯=≈⨯⨯⨯,∵3.053 2.706>,∴有90%的把握认为生产的产品质量与设备的选择具有相关性,故选A .11.D解析:D 【解析】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,则相关性越强,所以错误;②回归直线y bx a =+一定经过样本点的中心(),x y ,正确; ③随机误差e 的方差()D e 的大小是用来衡量预报的精确度,正确;④相关指数2R 用来刻画回归的效果,2R 越小,说明模型的拟合效果越不好,所以错误. 所以正确的有②③.故选D .12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
数学高二-选修2-3单元测试 第三章统计案例
本章测评(时间:90分钟满分:100分)一、选择题(本大题共10小题,每小题4分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1下面变量之间的关系是函数关系的是()A.已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食亩产量2设有一个回归方程为y=3-5x,变量x增加一个单位时,则()A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位3若线性回归方程中的回归系数b=0时,则相关系数为()A.r=1B.r=-1C.r=0 D.无法确定4在一个2×2列联表中,由其数据计算得χ2=13.097,则其两个变量间有关系的可能性为()A.99% B.95%C.90% D.无关系5(2010山东烟台专项训练)考查四个班的学生数学、物理成绩,得到列联表如下:随机变量χ2的值为()A.34 B.20 C.37 D.246已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则线性回归方程是() A.y=1.23x+4 B.y=1.23x+5C.y=1.23x+0.08 D.y=0.08x+1.237已知x与y之间的一组数据:则y与x的线性回归方程y=bx+a必过点()A.(2,2) B.(1.5,0)C.(1,2) D.(1.5,4)8下列结论正确的是()①函数关系是一种确定性关系②相关关系是一种非确定性关系③回归分析是对具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①②B.①②③C.①②④D.①②③④9下列现象的相关程度最高的是()A.某商店的职工人数与商品销售额之间的相关系数为0.87B.流通费用率与商业利润率之间的相关系数为-0.94C.商品销售额与商业利润率之间的相关系数为0.51D.商品销售额与流通费用率之间的相关系数为-0.8110某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设:“这种血清不能起到预防感冒的作用”,利用列联表计算,得χ2≈3.918,而已知P(χ2≥3.841)≈0.05.则下列结论正确的是()A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D .这种血清预防感冒的有效率为5%二、填空题(本大题共5小题,每小题4分,共20分.把答案填在题中的横线上) 11某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量之间的相关关系.现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则y 对x的线性回归方程是________.12若施化肥量x kg 与水稻产量y kg 之间的线性回归方程为y =5x +250,则当施化肥量为80 kg 时,预计水稻产量为________ kg.13(2010江苏高邮中学高三模拟考试)甲、乙两同学各自独立地考察两个变量X 、Y 的线性相关关系时,发现两人对X 的观察数据的平均值相等,都是s ,对Y 的观察数据的平均值也相等,都是t ,各自求出的回归直线分别是l 1、l 2,则直经l 1与l 2必经过同一点__________.14为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025. 根据表中数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性小于__________.15(2010山东泰安高三模拟)某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:则利润y对科研费用支出x的线性回归方程为__________.三、解答题(本大题共4小题,共40分.解答时应写出文字说明、证明过程或演算步骤)16(9分)部分国家13岁学生数学测验平均分数如下表:试作出该数据的散点图并由图判断是否存在回归直线,若存在,求出直线方程.17(10分)两所学校的计算机算法语言学习小组统一测验成绩如下:甲校:16,12,20,15,23,8,16,19.乙校:22,17,26,24,8,7,25,28.(1)求共同的中位数.(2)统计中位数上下的频数.(3)两所学校的计算机算法语言学习小组的成绩有无差异?18(10分)在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)判断性别与休闲方式是否有关系.19(11分)为了研究某种细菌随时间x变化繁殖的个数,收集数据如下:天数x/天 1 2 3 4 5 6 繁殖个数y/个612254995190(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图; (2)描述解释变量与预报变量之间的关系.参考答案1解析:B 、C 、D 是相关关系,A 是确定性关系,即函数关系. 答案:A2解析:斜率b =-5的意义是:变量x 增加1个单位时,y 平均增加-5个单位,即y 平均减少5个单位.答案:B3解析:当b =0时,即∑i =1nx i y i -n x y∑i =1nx 2i -n x2=0∑i =1nx i y i -n x y =0,∴r =∑i =1nx i y i -n x yi =1n x i 2-nx2i =1n y i 2-ny2=0.答案:C4解析:当χ2>6.635时,有99%的把握认为两个变量之间有关系. 答案:A5答案:D6解析:由题知b =1.23,直线经过中心(4,5),则a =0.08,∴线性回归方程为y =1.23x +0.08.答案:C7解析:线性回归方程y =bx +a 必过点(x ,y ). 答案:D 8答案:C9解析:|r|越接近1,相关程度越高. 答案:B10解析:由题意,知x 2≈3.918,且P(x 2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.答案:A11解析:b =∑i =1nx i y i -n x y∑i =1nx 2i -n x2≈2.621 4,a =y -b x ≈11.46,∴线性回归方程为y =11.46+2.62x. 答案:y =11.46+2.62x12解析:将x =80代入线性回归方程,得y =650(kg). 答案:650 13答案:(s ,t)14解析:∵χ2=4.844>3.841,∴至少有95%的把握认为是否选修文科与性别有关,故这种判断出错的可能性小于5%. 答案:5%15解析:设回归直线方程为y =a +bx , 由表中数据,得b =1 000-6×5×30200-6×52=2,∴a =y -b x =30-2×5=20.∴回归直线方程为y =2x +20. 答案:y =2x +20 16解:散点图如图所示.∵x =203,∑i =1nx 2i =416 824,y=64.5,∑i =1nx i y i =132 418,∴b =132 418-10×203×64.5416 824-10×2032≈0.313 3,a =64.5-0.313 3×203=0.900 1.∴线性回归方程是y =0.313 3x +0.900 1.17解:(1)将两组数据合在一起,从小到大的排列,寻找共同的中位数,由于n 1+n 2=8+8=16,则第8与第9个位置上的数据之平均数即为共同的中位数,共同中位数为18.(2)校别 中位数以上中位数以下合 计 甲 3 5 8 乙 5 3 8 合计8816(3)χ2=16(3×3-5×5)28×8×8×8=1≤2.706,∴两所学校的计算机算法语言成绩无显著差异.18解:(1)2×2的列联表如下:(2)假设“休闲方式与性别无关”. 计算χ2=124×(43×33-27×21)270×54×64×60≈6.201.因为χ2>3.841,所以有理由认为假设“休闲方式与性别无关”是不合理的, 即有95%的把握认为“休闲方式与性别有关”. 19解:(1)散点图如图所示.(2)由散点图看出样本点分布在一条指数函数y =C 1eC 2x 的周围,于是令Z =lny ,则由计算器算得Z =0.69x +1.112,则有y =e 0.69x+1.112.。
苏教版数学高二-数学苏教版选修2-3章末检测 第3章 统计案例(B)
第3章 统计案例(B)(时间:120分钟 满分:160分)一、填空题(本大题共14小题,每小题5分,共70分) 1.对于回归分析,下列说法错误的是________.(填序号)①在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定; ②线性相关系数可以是正的,也可以是负的;③回归分析中,如果r 2=1,说明x 与y 之间完全相关; ④样本相关系数r ∈(-1,1).2.现在一个由身高预测体重的回归方程: 体重预测值=4(磅/英寸)×身高-130(磅)其中体重与身高分别以磅和英寸为单位.如果换算成公制(1英寸≈2.5 cm,1磅≈0.45 kg),则回归方程应该是__________________________.3y 与x 的线性回归方程为y =6.5x +17.5,当广告费支出5万元时,随机误差为________. 4.一位母亲记录了儿子3~9岁的身高的数据,她根据这些数据建立的身高y (cm)与年龄x 的回归模型为y ^=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则叙述正确的是______(填序号).①身高一定是145.83 cm ; ②身高在145.83 cm 左右; ③身高在145.83 cm 以上; ④身高在145.83 cm 以下. 5.某考察团对全国10大城市进行职工人均平均工资x 与居民人均消费y 进行统计调查,y 与x 具有相关关系,回归方程y ^=0.66x +1.562(单位:千元),若某城市居民消费水平为7.765,估计该城市消费额占人均工资收入的百分比为________.6.已知两个变量x 和y 之间有线性相关性,5次试验的观测数据如下表,那么变量y 关于x7.若由一个2×2列联表中的数据计算得χ2=4.013,那么在犯错误的概率不超过________的前提下认为两个事件有关系.8.许多因素都会影响贫穷,教育也许是其中的一个.在研究这两个因素的关系时,收集了某国50个地区的成年人至多受过9年教育的百分比(x )和收入低于官方规定的贫困线的人数占本地区人数的百分比(y )的数据,建立的线性回归方程是y ^=4.6+0.8x .这里,斜率的估计等于0.8说明____________________________________________________________________________________________________________________________________________________________________________________________________________________. 9.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关,根据表中数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844.因为χ2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性约为________.10.某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有______线性相关关系.11.若两个分类变量X 和Y则X 与Y 之间有关系的概率约为________.12据表中数据我们可得出的统计分析推断是__________________. 13.由上表中数据计算得χ2=105×(10×30-20×45)55×50×30×75≈6.109,估计有______把握认为“文化程度与月收入有关系”.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②线性回归方程y ^ =b ^ x +a ^必过点(x ,y );③曲线上的点与该点的坐标之间具有相关关系; ④在一个2×2列联表中,由计算得K 2=13.079,则其两个变量间有关系的可能性是90%. 其中错误的是________.(填序号)二、解答题(本大题共6小题,共90分)15.(14分)2×2列联表所示:其中a,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系?16.(14分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每(1)作出散点图;(2)写出回归直线方程.17.(14分)某聋哑研究机构,对聋与哑是否有关系进行抽样调查,在耳聋的657人中有416人哑,而在另外不聋的680人中有249人哑,你能运用这组数据,得到相应结论吗?请运用独立性检验进行判断.求y与x的线性回归方程,并刻画回归的效果.19.(16分)问:辐照保鲜措施对水果保鲜是否有效?20(1)画出散点图; (2)求回归方程;(3)若某名健康儿童的血硒含量为94(1 000 ppm),预测他的发硒含量.第3章 统计案例(B)答案1.④解析 相关系数r 的范围是[-1,1]. 2.体重预测值=0.72×身高-58.5解析 4磅/英寸=4×(0.45 kg/2.5 cm)=0.72(kg/cm), 130磅=130×0.45 kg =58.5 kg. 3.10 4.② 5.83%6.y ^=0.575x -14.9 7.0.05解析 χ2=4.013>3.841.8.一个地区受过9年或更少的教育的百分比每增加1%,则收入低于官方规定的贫困线的人数占本地区人数的百分比将增加0.8%左右9.0.05 10.13 正解析 把2005~2009年家庭年平均收入按从小到大顺序排列为11.5,12.1,13,13.3,15,因此中位数为13(万元),由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.11.0.999解析 χ2=(5+15+40+10)(5×10-40×15)2(5+15)(40+10)(5+40)(15+10)≈18.8>10.828,查表知P (χ2>10.828)≈0.001,∴x 与y 之间有关系的概率约为1-0.001=0.999, 因此有99.9%的把握认为X 与Y 有关系. 12.传染病与饮用不干净水是有关系的 解析 通过独立性检验可知. 13.97.5% 14.③④解析 ①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确. 15.解 查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系, 则k ≥2.706,而k =65×[a (30+a )-(20-a )(15-a )]220×45×15×50=65×(65a -300)220×45×15×50=13×(13a -60)260×90. 由k ≥2.706得a ≥7.19或a ≤2.04. 又a >5且15-a >5,a ∈Z ,即a =8,9.故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系. 16.解 (1)散点图如图所示.(2)y ^=0.728 6x +0.857 5.17.解 哑 不哑 总计 聋 416 241 657 不聋 249 431 680 总计6656721 337根据列联表中数据得到K 2的观测值k =1 337×(416×431-241×249)2657×680×665×672≈95.291>10.828.因此在犯错误的概率不超过0.001的前提下认为聋与哑有关系. 18.解 序号 x i y i x 2i y 2i x i y i 1 0.10 15 0.01 225 1.5 2 0.30 18 0.09 324 5.4 30.40190.163617.64 0.55 21 0.302 5 441 11.55 5 0.70 22.6 0.49 510.76 15.82 6 0.80 23.8 0.64 566.44 19.047 0.95260.902 567624.7合计3.8 145.4 2.595 3 104.2 85.61由上表中数据,得x =3.87≈0.543,y =17×145.4≈20.77,∑i =1x 2i =2.595, 所以b ^=85.61-7×0.543×20.772.595-7×0.5432≈12.55.a ^=20.77-12. 55×0.543≈13.96. 所以线性回归方程为y ^=13.96+12.55x .将数据代入相关指数的计算公式得R 2≈0.997 4(小范围内波动亦可).由此可看出用线性回归模型拟合数据效果很好.19.解 根据题中数据,利用公式, 得χ2=1 000×(251×297-249×203)2454×546×500×500≈9.295,因为9.295>7.879,因此有99.5%的把握认为辐照保鲜措施对水果保鲜有效. 20.解 (1)散点图如下图所示:(2)根据回归方程的截距和斜率的最小二乘估计公式分别求得: b ^ =∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2=8 464-10×75.4×10.858 212-10×75.42≈0.236, a ^=y -b ^x =10.8-0.236×75.4≈-6.99. 故所求回归方程为y ^=0.236x -6.99. (3)当x =94时,y ^ =0.236×94-6.99≈15.2.因此,当地儿童的血硒含量为94(1 000 ppm)时,该儿童的发硒含量约为15.2(1 000 ppm).。
(北师大版)苏州市高中数学选修2-3第三章《统计案例》测试(含答案解析)
一、选择题1.下列命题中正确的个数( )①“0x ∀>,2sin x x >”的否定是“00x ∃≤,002sin x x ≤”;②用相关系数r 可以刻画回归的拟合效果,2r 值越小说明模型的拟合效果越好;③命题“若0a b >>,则330a b >>”的逆命题为真命题;④若()22130mx m x m -+++≥的解集为R ,则m 1≥.A .0B .1C .2D .32.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表: 售价x (元/千克) 18 20 22 26 28 30月销售量y (千克)180 168 166 160 150 136由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0 B .1.4C .2D .2.13.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由 列联表算得7.8k ≈参照附表,得到的正确结论是( ).A .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”4.给出下列说法:①用()()221211ˆn i i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个5.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归直线y bx a =+必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079.则其两个变量间有关系的可能性是90%. 其中错误的个数是( ) A .1 B .2 C .3D .46.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0017.某班主任对全班50名学生进行了作业量的调查,数据如下表:( )附:()()()()()22n ad bcKa b c d a c b d-=++++P(K2>k0)0.150.100.050.0250.010.001k0 2.072 2.706 3.841 5.024 6.63510.828A.0.01 B.0.025 C.0.10 D.0.058.若在区间[-5,5]内任取一个实数a,则使直线x+y+a=0与圆(x-1)2+(y+2)2=2有公共点的概率为()A.25B.25C.35D.32109.已知样本789x y、、、、的平均数是8,标准差是2,则xy值为A.8 B.32 C.60 D.8010.为了增强环保意识,某校从男生中随机抽取60人,从女生中随机抽取50人,参加环保知识测试,统计数据如下表所示:(参考数据:()211221221 21212n n n n nn n n nχ++++-=)则认为环保知识测试成绩是否优秀与性别有关的把握为A.90% B.95% C.99% D.99.9%11.已知变量x,y的一组观测数据如表所示:x34567y 4.0 2.5-0.50.5-2.0据此得到的回归方程为y bx a=+,若a =7.9,则x每增加1个单位,y的预测值就()A.增加1.4个单位B.减少1.2个单位C.增加1.2个单位D.减少1.4个单位12.下列说法:①分类变量A与B的随机变量2K越大,说明“A与B有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.14.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如表根据列联表数据,求得K 2≈__________.15.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆy bx a =+,若ˆ2b=-,则ˆa =________. 16.某单位为了了解用电量度与气温之间的关系,随机统计了某天的用电量与当天气温.由表中数据得回归直线方程中,据此预测当气温为5℃时,用电量的度数约为____.17.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.18.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程x b a yˆˆ+=中2ˆ-=b ,据此预测当气温为5℃时,用电量的度数约为 .19.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:参考公式: ()()()()()22n ad bc K a b c d a c b d -=++++参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”. 20.下列命题中:①已知点(3,0),(3,0)A B -,动点P 满足||2||PA PB =,则点P 的轨迹是一个圆; ②已知(2,0),(2,0),||||3M N PM PN --=,则动点P 的轨迹是双曲线; ③两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1;④在平面直角坐标系内,到点(1,1)和直线23x y +=的距离相等的点的轨迹是抛物线; 正确的命题是_________.三、解答题21.为了解某企业生产的某产品的年利润与年广告投入的关系,该企业对最近一些相关数据进行了调查统计,得出相关数据见下表:根据以上数据,研究人员分别借助甲、乙两种不同的回归模型,得到两个回归方程:方程甲,2(1)(1) 2.75yb x =-+^^;方程乙,(2)1.6yc x =-^^.(1)求b ^(结果精确到0.01)与c ^的值.(2)为了评价两种模型的拟合效果,完成以下任务.①完成下表(备注:i i ie y y =-^^,i e ^称为相应于点(x i ,y i )的残差);②分别计算模型甲与模型乙的残差平方和Q 1及Q 2,并通过比较Q 1,Q 2的大小,判断哪个模型拟合效果更好.22.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.1000.0500.0100.001k2.7033.8416.63510.82823.为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100km/h的有40人;在45名女性驾驶员中,平均车速不超过100km/h的有25人.(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100km/h的人与性别有关.平均车速超过100km/h人数平均车速不超过100km/h人数合计男性驾驶员人数女性驾驶员人数合计(2)以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100km/h的车辆数为X,若每次抽取的结果是相互独立的,求X的分布列和数学期望.参考公式与数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++24.受新冠肺炎疫情影响,本学期同学们在家上网课时间达三个多月,电脑屏幕代替了黑板,对同学们的视力造成了很大的损伤.某学校为了了解同学们现阶段的视力情况,对全校高三1000名学生的视力情况进行了调查,从中随机抽取了100名学生的体检表,绘制了频率分布直方图如图:(1)求a的值,并估计这1000名学生视力的中位数(精确到0.01);(2)为了进一步了解视力与学生成绩是否有关,对本年级名次在前50名与后50名的学生进行了调查,得到如下数据:前50名后50名近视4232不近视818根据表中数据,能否有95%把握认为视力与学习成绩有关?(3)若报考某高校某专业的资格为:视力不低于5.0,以该样本数据来估计全市高三学生的视力,现从全市视力在4.8以上的同学中随机抽取4名同学,这4名同学中有资格报该校该专业的人数为X,求X的分布列及数学期望.()2≥0.100.050.0250.0100.005P K kk 2.706 3.841 5.024 6.6357.87925.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A的研发费用x(百万元)和销量y(万盒)的统计数据如下:研发费用x(百万236101314元)销量y(万盒)112 2.54 4.5(1)根据上表中的数据,建立y关于x的线性回归方程y bx a=+(用分数表示);(2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211n niii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.26.为迎接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]得到如图所示的频率分布直方图.(Ⅰ)求a 的值;(Ⅱ)记A 表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A 的概率;(Ⅲ)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”.请在答题卡上将22⨯列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【分析】写出全称命题的否定判断①;由相关指数的大小与拟合效果的关系判断②;由不等式的性质判断③;由22(1)30mx m x m -+++的解集为R 求得m 的范围判断④. 【详解】解:对于①,“0x ∀>,2sin x x >”的否定是“00x ∃>,002sin x x ”,故①错误;对于②,用相关指数r 可以刻画回归的拟合效果,2r 值越大说明模型的拟合效果越好,故②错误;对于③,命题“若0a b >>0>>”的逆命题为“0>,则0a b >>”,是真命题,故③正确;对于④,当0m =时,22(1)30mx m x m -+++化为230x -+,解得32x,不合题意; 当0m ≠时,要使22(1)30mx m x m -+++的解集为R ,则24(1)4(3)0m m m m >⎧⎨+-+⎩,解得1m .∴若22(1)30mx m x m -+++的解集为R ,则1m .故④为真命题. ∴正确命题的个数是2个.故选:C . 【点睛】本题考查命题的真假判断与应用,考查命题的真假判断与命题的否定,训练了一元二次不等式的解法,属于中档题.2.B解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=. 故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.3.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.4.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.5.C解析:C 【解析】对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;对于②,一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减小5个单位,故不正确;对于③,线性回归直线ˆˆˆy bx a =+必过样本中心点(),x y ,故正确;对于④,曲线上的点与该点的坐标之间具有一一对应关系,故不正确;对于⑤,有一个2×2列联表中,由计算得213.079K =,则其两个变量间有关系的可能性是99.9%,故不正确. 故选C.6.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B8.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴1222a-+≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.9.C解析:C 【解析】由22222789821[(78)(88)(98)(8)(8)]25x yx y ++++⎧=⎪⎨⎪-+-+-+-+-=⎪⎩得=60xy ,故选C.10.C解析:C 【解析】由题意得:()221104030202060505060χ⨯-⨯=≈⨯⨯⨯7.8>6.635,所以认为环保知识测试成绩是否优秀与性别有关的把握为99%. 本题选择C 选项.11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
苏教版高中数学选修2-3第3章 统计案例.docx
高中数学学习材料马鸣风萧萧*整理制作第3章 统计案例3.1 独立性检验双基达标 (限时15分钟)1.为了检验两个事件A ,B 是否相关,经过计算得χ2=8.283,则说明事件A 和事件B ________(填“相关”或“无关”). 答案 相关2.考查某班学生数学、外语成绩得到2×2列联表如:数优 数差 总计 外优 34 17 51 外差 15 19 34 总计493685那么,随机变量χ2等于________. 解析 χ2=85×(34×19-17×15)249×36×34×51≈4.25.答案 4.253.如果χ2的值为8.654,可以认为“X 与Y 无关”的可信度是________. 解析 ∵8.654>6.635,∴有99%的把握认为X 与Y 有关. 答案 1%4.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的是________.①100个吸烟者中至少有99人患肺癌②1个人吸烟,那么这个人有99%的概率患肺癌 ③在100个吸烟者中一定有患肺癌的人④在100个吸烟者中可能一个患肺癌的人也没有 解析 99%的把握是指判断的可信度. 答案 ④5.统计推断中,当________时,有99%的把握说事件A 与B 有关,当________时,认为有95%的把握说事件A 与B 有关. 答案 χ2>6.635 χ2>3.8416.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下所示:又发作过心脏病未发作过心脏病合计 心脏搭桥手术 39 157 196 血管清障手术29 167 196 合计68324392比较这两种手术对病人又发作心脏病的影响有没有差别.解 提出假设H 0:两种手术对病人又发作心脏病的影响没有差别. 根据列联表中的数据,可以求得χ2=392×(39×167-29×157)268×324×196×196≈1.78.当H 0成立时χ2≈1.78,而χ2<2.072的概率为0.85.所以,不能否定假设H 0,也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.综合提高 (限时30分钟)7.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈99.9,根据这一数据分析,下列说法正确的是________(填序号).①有99.9%的人认为该栏目优秀;②有99.9%的人认为栏目是否优秀与改革有关系; ③有99.9%的把握认为电视栏目是否优秀与改革有关系.答案 ③8.某班班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示.从表中数据分析,学生学习积极性与对待班级工作的态度之间有关系的把握有________.积极参加班级工作 不太主动参加班级工作合计 学习积极性高 18 7 25 学习积极性一般6 19 25 合计242650解析 由于χ2=50×(18×19-6×7)224×26×25×25≈11.5>10.828.答案 99.9%9.在一个2×2列联表中,由其数据计算得χ2≈13.097,则认为两个变量间有关系的犯错概率不超过________.解析 χ2≈13.097>10.828,即在犯错误的概率不超过0.001的前提下认为两变量有关. 答案 0.00110.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查对临界值表知P (χ2≥3.841)≈0.05.p :有95%的把握认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________(把你认为正确的命题序号都填上).①p ∧綈q ;②綈p ∧q ;③(綈p ∧綈q )∧(r ∨s );④(p ∨綈r )∧(綈q ∨s ).解析 p 正确而q 、r 、s 都错,所以正确的是①④. 答案 ①④11.有甲、乙两个工厂生产同一种产品,产品分为一等品和二等品.为了考察这两个工厂的产品质量的水平是否一致,从甲、乙两个工厂中分别随机地抽出产品109件,191件,其中甲工厂一等品58件,二等品51件,乙工厂一等品70件,二等品121件.(1)根据以上数据,建立2×2列联表;(2)试分析甲、乙两个工厂的产品质量有无显著差别(可靠性不低于99%). 解 (1)甲工厂 乙工厂 合计 一等品 58 70 128 二等品 51 121 172 合计109191300(2)提出假设H 0:甲、乙两个工厂的产品质量无显著差别. 根据列联表中的数据可以求得χ2=300×(58×121-70×51)2109×191×128×172≈7.781 4>6.635.因为当H 0成立时,P (χ2>6.635)≈0.01,所以我们有99%以上的把握认为甲、乙两个工厂的产品质量有显著差别.12.从发生汽车碰撞事故的司机中抽取2 000名司机.根据他们的血液中是否含有酒精以及他们是否对事故负有责任.将数据整理如下:有责任 无责任 合计 有酒精 650 150 800 无酒精 700 500 1 200 合计1 3506502 000那么,司机对事故负有责任与血液中含有酒精是否有关系? 解 依据公式得χ2=2 000×(650×500-150×700)2800×1 200×1 350×650≈114.738>6.635.∴有99%的把握认为“对事故负有责任与血液中含有酒精之间有关系”.13.(创新拓展)下表是对某市8所中学学生是否吸烟进行调查所得的结果:吸烟学生不吸烟学生父母中至少有一人吸烟816 3 203父母均不吸烟188 1 168(1)在父母至少有一人吸烟的学生中,估计吸烟学生所占的百分比是多少?(2)在父母均不吸烟的学生中,估计吸烟学生所占的百分比是多少?(3)学生的吸烟习惯和父母是否吸烟有关吗?请简要说明理由.(4)有多大的把握认为学生的吸烟习惯和父母是否吸烟有关?解(1)816816+3 203×100%≈20.3%.(2)188188+1 168×100%≈13.86%.(3)有关,因为父母吸烟与不吸烟,其子女吸烟的比例有较大的差异.(4)提出假设H0:学生的吸烟习惯和父母是否吸烟无关.根据列联表中的数据可以求得χ2≈27.677>10.828.因为当H0成立时,P(χ2>10.828)≈0.001,所以我们有99.9%以上的把握认为学生的吸烟习惯和父母是否吸烟有关.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
阶段质量检测(三) 统 计 案 例(考试时间:120分钟 试卷总分:160分)一、填空题(本大题共14小题,每小题5分,共70分) 1.下列有关线性回归的说法①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归直线得到具有代表意义的线性回归方程;④任何一组观测值都能得到具有代表意义的线性回归方程.其中错误的是________. 解析:任何一组观测值并不都能得到具有代表意义的线性回归方程. 答案:④2.下表是x 与y ________.解析:∵x =0+1+2+34=1.5,y =1+3+5+74=4,∴样本点的中心为(1.5,4),而回归直线必过样本点的中心,故必过(1.5,4).答案:(1.5,4)3.对两个变量y 和x 进行线性相关性检验,已知n 是观察值组数,r 是相关系数,且已知:①n =7,r =0.953 3;②n =15,r =0.301 2;③n =17,r =0.999 1;④n =3,r =0.995 0,则变量y 和x 具有线性相关关系的是________.(填序号)解析:判断变量y 与x 是否具有线性相关关系时,观察值组数n 不能太小.若y 与x 具有线性相关性,则相关系数|r |≥0.75,故②④错.答案:①③4.由线性回归直线方程y ∧=4.75x +157,当x =28时,y ∧为________. 解析:将x 的值代入回归直线方程得估计值y ∧=4.75×28+157=290. 答案:2905.一家保险公司调查其总公司营业部的加班情况,收集了10周中每周加班工作时间y (小时)与签发保险单数目x 的数据如下表所示:已知用最小二乘法估计求出的线性回归方程的斜率为0.003 585,则线性回归方程为________________________________________________________________________.解析:线性回归直线y ∧=b ∧x +a ∧过样本中心点(x -,y -),故将x -,y -求出代入即可.答案:y ∧=0.118 2+0.003 585x6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表,则喜不喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为________.7.下列关于回归分析与独立性检验的说法正确的是________.(填序号)①回归分析和独立性检验没有什么区别;②回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;③回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;④独立性检验可以100%确定两个变量之间是否具有某种关系.8. 如图,有5组数据对(x,y),去掉哪组数据后剩下的4组数据的线性相关程度最大________.9.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y∧=b∧x+a∧,其中b∧=-2.现预测当气温为-4 ℃时,用电量的度数约为________.10.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的2×2列联表:试回答吃零食与性别有关系吗?(“有”或“没有”)________.11.变量x,y具有线性相关关系,当x的取值分别为8,12,14和16时,通过观测知y的值分别为5,8,9和11,若在实际问题中,y的预报值最大是10,则x的最大取值不能超过________.12.下表是某厂1~4月份用水量(单位:百吨)的一组数据,由某散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y ∧=-0.7x+a∧,则该厂6月份的用水量约为________.13.为研究变量x和y的线性相关关系,甲、乙两人分别作了研究,利用线性回归方程得到回归直线l1和l2,两人计算知x相同,y也相同,则l1与l2的位置关系是________.14.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则________.(填序号)①r2<r1<0;②0<r2<r1;③r2<0<r1;④r2=r1.二、解答题(本大题共6小题,共90分,解答应写出必要的文字说明、证明过程或演算步骤)15.(本小题满分14分)某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.16.(本小题满分14分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:其中a,15-a均为大于5的整数,则a取何值时,有90%的把握认为x与y之间有关系?17.(本小题满分14分)某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目进行分析,根据上述数据能得出什么结论?18.(本小题满分16分)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高约为多少?19.(本小题满分16分)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:现规定平均成绩在80分以上(不含80分)的为优秀.(1)试分别估计两个班级的优秀率;(2)由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.20.(本小题满分16分)某运动员训练次数与运动成绩之间数据关系如下:(1)作出散点图; (2)求出回归方程;(3)计算相关系数,并利用其检验两变量的相关关系的显著性; (4)试预测该运动员训练47次和55次的成绩.答案1.解析:任何一组观测值并不都能得到具有代表意义的线性回归方程. 答案:④2.解析:∵x =0+1+2+34=1.5,y =1+3+5+74=4,∴样本点的中心为(1.5,4),而回归直线必过样本点的中心,故必过(1.5,4).答案:(1.5,4)3.解析:判断变量y 与x 是否具有线性相关关系时,观察值组数n 不能太小.若y 与x 具有线性相关性,则相关系数|r |≥0.75,故②④错.答案:①③4.解析:将x 的值代入回归直线方程得估计值y ∧=4.75×28+157=290. 答案:2905.解析:线性回归直线y ∧=b ∧x +a ∧过样本中心点(x -,y -),故将x -,y -求出代入即可.答案:y ∧=0.118 2+0.003 585x6.解析:假设H 0:喜欢玩电脑游戏与认为作业量的多少没有关系,根据列联表中的数据,可以求得χ2=50×(18×15-9×8)227×23×26×24≈5.06,对照临界值表,当假设成立时,χ2≥5.024的概率约为0.025,所以我们有97.5%的把握认为喜欢玩电脑游戏与认为作业量的多少有关系.答案:97.5%7.解析:由回归分析、独立性检验的意义知,回归分析与独立性检验都是研究两个变量之间的相关性,但方法与手段有所不同,研究角度不同.由其意义知,③正确.答案:③8.解析:由散点图可知,除D 之外的其余各点近似地在某条直线附近,而D 点则偏离这一直线.故应去掉D .答案:D9.解析:由题意可知x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68.答案:6810.解析:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=85(140-480)217×68×45×40≈4.722>3.841.故约有95%的把握认为“吃零食与性别”有关. 答案:有11.解析:因为x =16时,y =11;当x =14时,y =9,所以当y 的最大值为10时,x 的最大值属于区间(14,16).答案:1512.解析:∵x =2.5,y =3.5,b ∧=-0.7,∴a ∧=3.5+0.7×2.5=5.25. ∴当x =6时,y ∧=-0.7×6+5.25=1.05. 答案:1.05百吨13.解析:每条回归直线都过样本的中心(x ,y ). 答案:l 1与l 2有公共点(x ,y )14.解析:对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关,即r 1>0;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,即r 2<0,所以有r 2<0<r 1.答案:③ 15.解:由表中数据画出散点图,如图所示.由散点图可知热茶销售量与气温之间具有较强的线性相关关系.16.解:查表可知,要有90%的把握认为x 与y 之间有关系,则χ2≥2.706,而χ2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=65×(65a -300)220×45×15×50=13×(13a -60)260×90.由χ2≥2.706,得a ≥7.19或a ≤2.04.又a >5,且15-a >5,a ∈Z ,即a =8,9. 故a 为8或9时,有90%的把握认为x 与y 之间有关系.17.解:根据列联表中的数据,得到χ2=189×(54×63-40×32)294×95×86×103=10.76.因为10.76>7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.18.解:由题意父亲身高则x -=173+170+1763=173,y -=170+176+1823=176,∑3i =1(x i -x )(y i -y )=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)(182-176)=18,∑3i =1(x i -x )2=(173-173)2+(170-173)2+(176-173)2=18. 所以b ∧=1818=1.所以a ∧=y -b ∧x =176-173=3.所以线性回归方程y ∧=b ∧x +a ∧=x +3.所以可估计孙子身高为182+3=185(cm).19.解:(1)由题意知,甲、乙两班均有学生50人,甲班优秀人数为30人,优秀率为3050=60%,乙班优秀人数为25人,优秀率为2550=50%,所以甲、乙两班的优秀率分别为60%和50%.(2)列联表如下:因为χ2=100×(30×25-20×25)250×50×55×45=10099≈1.010,所以由参考数据知,没有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.20.解:(1)作出该运动员训练次数(x )与成绩(y )之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)计算得x =39.25,y =40.875,b ∧≈1.0415,a ∧≈-0.004,所求回归方程为y ∧=1.0415 x -0.004.(3)计算得∑8i =1x 2i =12 656,∑8i =1y 2i =13 731, r =∑8i =1x i y i -8x -y -∑8i =1x 2i -8x 2∑8i =1y 2i -8y 2=345.2512 656-8×39.252×13 731-8×40 8752≈345.25347.79≈0.993,查表得r 0.05=0.707,r >r 0.05,由此可得出,训练次数与运动成绩有较强的线性相关关系. (4)由上述分析可知,我们可用回归方程y =1.041 5x -0.004作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y ≈49和y ≈57. 故预测该运动员训练47次和55次的成绩分别为49和57.。