必修三统计练习题和解答

合集下载

高中数学必修3统计测试题及其答案

高中数学必修3统计测试题及其答案

高中数学必修 3 第二章(统计)检测题班级姓名得分一、选择题:(此题共 10 小题,每题 3 分,共 30 分,在每题给出的四个选项中,只有一项为哪一项切合题目要求的)1.某单位有老年人28 人,中年人 54 人,青年人 81 人.为了检查他们的身体状况,需从他们中抽取一个容量为36 的样本,最适合抽取样本的方法是( D ).A .简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,而后分层抽样2.10 名工人某天生产同一部件,生产的件数是15,17,14, 10,15, 17,17,16,14,12.设其均匀数为a,中位数为 b,众数为 c,则有 ( D).A .a>b>c B. b>c>a C. c>a>b D.c>b>a3.以下说法错误的选项是 ( B ).A.在统计里,把所需观察对象的全体叫作整体B.一组数据的均匀数必定大于这组数据中的每个数据C.均匀数、众数与中位数从不一样的角度描绘了一组数据的集中趋向D.一组数据的方差越大,说明这组数据的颠簸越大4.以下说法中,正确的选项是 ( C ).A .数据 5,4,4,3,5,2 的众数是 4B.一组数据的标准差是这组数据的方差的平方C.数据 2,3,4,5 的标准差是数据 4,6,8,10 的标准差的一半D.频次散布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别随意抽出10 名学生进行英语口语测试,其测试成绩的方差分别2 2 .,则.为 S1 , 2A )= 13.2 S =26 26(A .甲班 10 名学生的成绩比乙班10 名学生的成绩齐整B.乙班 10 名学生的成绩比甲班10 名学生的成绩齐整C.甲、乙两班 10 名学生的成绩同样齐整D.不可以比较甲、乙两班10 名学生成绩的齐整程度6.以下说法正确的选项是 ( C ).A.依据样本预计整体,其偏差与所选择的样本容量没关B.方差和标准差拥有同样的单位2 2 2 2 是错的D.假如容量同样的两个样本的方差知足12 ,那么推得整体也知足S1 2S <S <S 7.某同学使用计算器求 30 个数据的均匀数时,错将此中一个数据 105 输人为 15,那么由此求出的均匀数与实质均匀数的差是( B ).A.3.5 B.-3 C. 3 D. -0.58.在一次数学测试中,某小组14 名学生疏别与全班的均匀分85 分的差是: 2,3,-3,-5, 12,12,8,2,-1,4,-10,-2, 5, 5,那么这个小组的均匀分是(B)分.A .97.2 B. 87.29 C. 92.32 D.82.869.某题的得分状况以下:此中众数是 ( C ).得分 /分0 1 2 3 4百分率 /(%) 37.0 8.6 6.0 28.2 20.2A .37.0%B. 20.2%C.0 分D.4 分10.假如一组数中每个数减去同一个非零常数,则这一组数的( 10 ).A .均匀数不变,方差不变B.均匀数改变,方差改变C.均匀数不变,方差改变D.均匀数改变,方差不变11.为检查参加运动会的 1 000 名运动员的年纪状况,从中抽查了 100 名运动员的年纪,就这个问题来说,以下说法正确的选项是A . 1 000 名运动员是整体C.抽取的 100 名运动员是样本( A)B.每个运动员是个体D.样本容量是 10012.为了检查某产品的销售状况,销售部门从部下的92 家销售连锁店中抽取30 家认识情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为( A )A.3,2B.2,3C.2,30D.30,213.某城区有农民、工人、知识分子家庭合计 2 000 家,此中农民家庭 1 800 户,工人家庭100 户.现要从中抽取容量为40 的样本,检查家庭收入状况,则在整个抽样过程中,能够用到以下抽样方法(D)①简单随机抽样;②系统抽样;③分层抽样.A .②③ B.①③ C.③ D.①②③ 14.以下说法不正确的选项是 ( A )A.频次散布直方图中每个小矩形的高就是该组的频次B.频次散布直方图中各个小矩形的面积之和等于 1C.频次散布直方图中各个小矩形的宽同样大D.频次散布直方图能直观地表示样本数据的散布状况15.容量为 20 的样本数据,分组后的频数以下表:分组[10,20) [20,30) [30,40) [40,50) [50,60) [60,70)频数 2 3 4 5 4 2则样本数据落在区间 [10,40)的频次为 ( B )A . 0.35 B.0.45 C.0.55 D.0.6516.已知 10 名工人生产同一部件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为 a,中位数为 b,众数为 c,则有 ( D )A . a>b>c B.a>c>b C.c>a>b D.c>b>a17. 已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为(B )A . 1 B. 2 C. 3 D.218.如图是 2012 年某校举行的元旦诗歌朗读竞赛中,七位评委为某位选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的均匀数和方差分别为(C)A . 84,4.84B .84,1.6C.85,1.6D.85,0.419.某中学有高中生 3500 人,初中生 1500 人.为认识学生的学习状况,用分层抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则 n 为( A) A.100B .150C .200D .25020.样本容量为100 的频次散布直方图以下图.依据样本的频次散布直方图预计样本数据落在 [6, 10)内的频数为 a,样本数据落在 [2,10)内的频次为 b,则 a, b 分别是 ( A )A .32,0.4 B.8,0.1C. 32,0.1 D.8,0.4二、填空题:(此题共 4 小题,每题 3 分,共 12 分)21.一个企业共有 240 名职工,下设一些部门,要采纳分层抽样方法从全体职工中抽取一个容量为20的样本.已知某部门有 60名职工,那么从这一部门抽取的职工人数是5。

高中数学必修三--统计-含答案解析--zhy365

高中数学必修三--统计-含答案解析--zhy365

高中数学必修三--统计卷I(选择题)一、选择题(本题共计 12 小题,每题 5 分,共计60分,)1. 下列调查中,适合用全面调查方式的是()A.了解某班学生“50米跑”的成绩B.了解一批灯泡的使用寿命C.了解一批炮弹的杀伤半径D.了解一批袋装食品是否含有防腐剂2. 某单位200名职工中,年龄在50岁以上占20%,40∼50岁占30%,40岁以下占50%;现要从中抽取40名职工作样本.若用系统抽样法,将全体职工随机按1∼200编号,并按编号顺序平均分为40组(1∼5号,6∼10号,…,196∼200号).若第5组抽出的号码为22,则第8组抽出的号码应是①;若用分层抽样方法,则40岁以下年龄段应抽取②人.①②两处应填写的数据分别为()A.82,20B.37,20C.37,4D.37,503. 某学校有教师160人,其中有高级职称的32人,中级职称的56人,初级职称的72人.现抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数应为()A.4B.6C.7D.94. 2013年中国政府提出共建丝绸之路经济带,受到了世界各国的高度重视和积极响应,并提出打造海上丝绸之路的总体规划,被简称为“一带一路”.经调查,沿线某地区自2013年到2019年经过6年的经济新建设,经济收入增加了3倍.为更好地了解该地区经济收入变化情况,统计了该地区建设前后经济收入构成比例,得到如下表格:则2019年与2013年经济收入相比较,下面结论中正确的是( )A.石油出口收入减少B.其他收入增加了三倍以上C.百姓购物收入增加了三倍D.百姓购物收入与教育文化收入的总和超过了经济收入的一半的样本,若采用系统抽样,则分段的间隔k为()A.50B.60C.30D.406. 如图是某社区工会对当地企业工人月收入情况进行一次抽样调查后画出的频率分布直方图,其中第二组月收入在[1.5, 2)千元的频数为300,则此次抽样的样本容量为()A.1000B.2000C.3000D.40007. 一样本的所有数据分组及频数如下:[−0.5, 0.5),C50;[0.5, 1.5),C51;[1.5, 2.5),C52;[2.5, 3.5),C53;[3.5, 4.5),C54;[4.5, 5.5),C55.则在[1.5, 4.5)的频率为()A.5 8B.12C.2532D.15168. 2019年,全国各地区坚持稳重求进工作总基调,经济运行总体平稳,发展水平迈上新台阶,发展质量稳步上升,人民生活福祉持续增进,全年最终消费支出对国内生产总值增长的贡献率为57.8%.下图为2019年居民消费价格月度涨跌幅度:(同比=本期数−去年同期数去年同期数×100%,环比=本期数−上期数上期数×100%),下列结论中不正确的是()A.2019年第三季度的居民消费价格一直都在增长B.2018年7月份的居民消费价格比同年8月份要低一些C.2019年全年居民消费价格比2018年涨了2.5%以上D.2019年3月份的居民消费价格全年最低A.数据4、4、6、7、9、6的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数10. 某中学就到校的方式问题对初三年级的所有学生进行了一次调查,并将调查结果制作了扇形统计图,已知步行的人数为60,则初三学生乘公交车的人数为( )A.60B.78C.132D.911. 绘制1000人的寿命直方图时,若组距均为20,60∼80岁范围的纵轴高为0.03,则60∼80岁的人数为()A.300B.500C.600D.80012. 以下两个图表是2019年初的4个月我国四大城市的居民消费价格指数(上一年同月=100)变化图表,给出下列结论:其中正确的是()(注:图表一每个城市的条形图从左到右依次是1、2、3、4月份;图表二每个月份的条形图从左到右四个城市依次是北京、天津,上海、重庆)①3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为平均;②4月份仅有三个城市居民消费价格指数超过102;③仅有天津市从年初开始居民消费价格指数的增长呈上升趋势;④四个月的数据显示北京市的居民消费价格指数增长幅度波动较大.A.①②B.②④C.①②④D.①③④卷II(非选择题)二、填空题(本题共计 6 小题,每题 5 分,共计30分,)13. 某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据,绘制了下面的折线图.已知该市的各月最低气温与最高气温具有较好的线性关系,则根据该折线图,下列结论错误的是_______.①最低气温与最高气温为正相关;②10月的最高气温不低于5月的最高气温;③月温差(最高气温减最低气温)的最大值出现在1月;④最低气温低于0∘C的月份有4个.14. 为了估计鱼塘中鱼的尾数,先从鱼塘中捕出2000尾鱼,并给每条尾鱼做上标记(不影响存活),然后放回鱼塘,经过适当的时机,再从鱼塘中捕出600尾鱼,其中有标记的鱼为40尾,根据上述数据估计该鱼塘中鱼的尾数为________.15. 已知数据:x,y,10,11,9,这组数据的平均值10,方差为2,则|x−y|=________.16. 抽样统计甲,乙两个城市连续5天的空气质量指数(AQI),数据如下:17. 某校从参加高一年级期末考试的学生中抽出60名学生,并统计了他们的数学成绩(成绩均为整数且满分为100分),把其中不低于50分的分成五段[50, 60),[60, 70),[70, 80),[80, 90),[90, 100]然后画出如下图的部分频率分布直方图.观察图形的信息,可知数学成绩低于50分的学生有________人;估计这次考试数学学科的及格率(60分及以上为及格)为________;18. 为了调查某野生动物保护区内某种野生动物的数量,调查人员逮到这种动物1200只作过标记后放回,一星期后,调查人员再次逮到该种动物1000只,其中作过标记的有100只,估算保护区有这种动物________只.三、解答题(本题共计 5 小题,每题 12 分,共计60分,)19. 已知甲、乙、丙三个车间一天内生产的产品分别是150件、130件、120件,为了掌握各车间产品质量情况,从中取出一个容量为40的样本,该用什么抽样方法?简述抽样过程.20. 某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(1)设消费者的年龄为x ,对该款智能家电的评分为y .若根据统计数据,用最小二乘法得到y 关于x 的线性回归方程为y ̂=1.2x +40,且年龄x 的方差为s x 2=14.4,评分y 的方差为s y 2=22.5.求y 与x 的相关系数r ,并据此判断对该款智能家电的评分与年龄的相关性强弱.(2)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“ 好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.附:线性回归直线y ̂=b ̂x +a ̂的斜率b̂=∑(x i −x ¯)n i=1(y i −y ¯)∑(x i −x ¯)2n i=1相关系数r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1.独立性检验中的K 2=n(ad−bc)2(a+b)(a+c)(b+d)(c+d), 其中n =a +b +c +d .临界值表:21. 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,⋯,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑x i 20i=1=60 ,∑y i 20i=1=1200, ∑(x i −x ¯)220i=1=80, ∑(y i −y ¯)220i=1=9000,∑(x i −x ¯)20i=1(y i −y ¯)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,⋯,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物短盖面积差异很大,为提高样本的代表性以获得附:相关系数: r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1√2≈1.414.22. 某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:i i−1i i−1x i 7i−1y i =3487. (1)求x ¯,y ¯;参考公式:b ̂=∑=n ∑(ni−1x i −x ¯)2∑n ∑x i 2n i−1−nx−2,a ̂=y ¯−b ̂x ¯(2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.23. 某网站欲调查网民对当前网页的满意程度,在登录的所有网民中,收回有效帖子共50000份,其中持各种态度的份数如下表所示:为了了解网民的具体想法和意见,以便决定如何更改才能使网页更完美,打算从中抽选500份,为使样本更具代表性,每类中各应抽选出多少份?并且写出具体操作过程.参考答案与试题解析高中数学必修三--统计一、选择题(本题共计 12 小题,每题 5 分,共计60分)1.【解答】A、了解某班学生“50米跑”的成绩,是精确度要求高的调查,适于全面调查;B、C、D了解一批灯泡的使用寿命,了解一批炮弹的杀伤半径,了解一批袋装食品是否含有防腐剂,都是具有破坏性的调查,无法进行普查,故不适于全面调查.2.【解答】解:若用系统抽样,则样本间隔为5,若第5组抽出的号码为22,则第8组抽出的号码应22+15=37,若用分层抽样方法,则40岁以下年龄段应抽取40×50%=20,故选:B.3.【解答】解:∵中级职称的56人,∴抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数为56160=n20,解得n=7,即抽取的中级职称的教师人数应为7人.故选C.4.【解答】解:假设建设前经济收入为a,则建设后经济收入为4a,所以石油出口收入在建设前为0.49a,建设后为4a×0.33=1.32a,石油出口收入较之前增加;其他收入在建设前为0.06a,建设后为0.24a,即其他收入增加了三倍;百姓购物收入建设前为0.3a,建设后为0.38×4a=1.52a,即百姓购物收入增加了四倍以上;教育文化收入建设前为0.1a,建设后为0.15×4a=0.6a,百姓购物收入与教育文化收入的总和为1.52a+0.6a=2.12a>2a,超过了经济收入的一半.故选D.5.【解答】解:由题意知本题是一个系统抽样问题,总体中个体数是3000,样本容量是100,根据系统抽样的步骤,得到分段的间隔k=3000100=30,解:由频率的意义可知,从左到右各个小组的频率之和是1,同时每小组的频率=小组的频数样本容量.∴[1.5, 2)长方形的面积为0.3.第二组月收入在[1.5, 2)千元的频数为300,所以此次统计的样本容量是300÷0.3=1000.故选A.7.【解答】解:由题意知本题共有C50+C51+C52+C53+C54+C55=25个数据,在[1.5, 4.5)的频数是C52+C53+C54∴在[1.5, 4.5)的频率为:C52+C53+C5425=2532,故选C.8.【解答】解:A,从环比看,2019年第三季度的居民消费价格一直都在增长,故A正确;B,从同比看,2018年7月份的居民消费价格比同年8月份要低一些,故B正确;C,从同比看,1.7+1.5+2.3+2.5+2.7+2.7+2.8+2.8+3.0+3.8+4.5+4.512=2.9,所以2019年全年居民消费价格比2018年涨了2.5%以上,故C正确;D,从环比看,2019年1月份的居民消费价格最低,故D错误.故选D.9.【解答】解:数据4、4、6、7、9、6的众数是4和6,故A错误;一组数据的标准差是这组数据的方差的算术平方根,故B错误;∵3,5,7,9的平均数=14(3+5+7+9)=6,∴3,5,7,9的标准差=√14[(3−6)2+(5−6)2+(7−6)2+(9−6)2]=√5.∵6、10、14、18的平均数=14(6+10+14+18)=12,∴6、10、14、18的标准差√14[(6−12)2+(10−12)2+(14−12)2+(18−12)2]= 2√5,∴数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半,故C正确;频率分布直方图中各小长方形的面积等于相应各组的频率,故D错误.故选:C.10.【解答】解:调查的学生总数是:60÷20%=300(人),则乘公交车的人数为:300×(1−20%−33%−3%)=300×44%=132(人).解:因为:组距均为20,60∼80岁范围的纵轴高为0.03,所以;频率为:0.03×20=0.6.∴60∼80岁的人数为:0.6×1000=600.故选:C.12.【解答】解:根据题目所给信息,①,3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为大,不平均,①错误;②,4月份仅有三个城市居民消费价格指数超过102;③,天津市和上海从年初开始居民消费价格指数的增长呈上升趋势,③错误;④,四个月的数据显示北京市的居民消费价格指数增长幅度波动较大,④正确.故正确的有②④.故选B.二、填空题(本题共计 6 小题,每题 5 分,共计30分)13.【解答】解:由该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据的折线图,得:在①中,最低气温与最高气温为正相关,故①正确;在②中,10月的最高气温不低于5月的最高气温,故②正确;在③中,月温差(最高气温减最低气温)的最大值出现在1月,故③正确;在④中,最低气温低于0∘C的月份有3个,故④错误.故答案为:④.14.【解答】解:根据题意,设该鱼塘中鱼的尾数为x,则;x 2000=60040,解得x=30000;∴估计该鱼塘中鱼的尾数为30000.故答案为:30000.15.【解答】解:由平均值10得,x+y+10+11+9=50,则x+y=20,①由方差为2得,2=15[(x−10)2+(y−10)2+0+1+1],即(x−10)2+(y−10)2=8,②设x=10+t,y=10−t,代入②2t2=8,解得t=±2,∴|x−y|=2|t|=4,故答案为:4.16.甲城市连续5天的空气质量指数是109,111,132,118,110;它的极差是132−109=23,且数据的波动性较大些;乙城市连续5天的空气质量指数是110,111,115,132,112;它的极差是132−110=22,且数据的波动性较小些;由此得出,空气质量指数较为稳定(方差较小)的城市是乙.故答案为:乙.17.【解答】解:由图可知,成绩在[50, 60)的频率为0,015×10=0.15,成绩在[60, 70)的频率为0.015×10=0.15,成绩在[70, 80)的频率为0.030×10=0.3,成绩在[80, 90)的频率为0.025×10=0.25,成绩在[90, 100]的频率为0.005×10=0.05,∴成绩不低于50分的频率为0.15+0.15+0.3+0.25+0.05=0.9,成绩不低于60分的频率为0.15+0.3+0.25+0.05=0.75∴成绩低于50分的频率为为1−0.9=0.1∵共有60名学生,∴成绩低于50分的学生数为60×0.1=6,这次考试数学学科的及格率为75%.故答案为6;75%18.【解答】解:设保护区有这种动物有x只,则由题意可得1200x =1001000,求得x=12000,故答案为12000.三、解答题(本题共计 5 小题,每题 12 分,共计60分)19.【解答】解:由于三个车间的产品有差别,故应采用分层抽样的方法,先计算抽样比:k=40150+130+120=110,再计算各车间内抽取样本的件数:甲车间:150×110=15,乙车间:130×110=13,丙车间:120×110=12,再分析使用简单随机抽样的办法在各个车间中抽取样本,最后终成一个样本.20.【解答】解:(1)相关系数r=∑(x−x¯)50(y−y¯)√∑(xi−x)250i=1∑(y i−y)250i=1;=∑(x i−x¯)50i=1(y i−y¯)∑(x i−x¯)250i=1√∑(xi−x¯)250i=1√∑(yi−y)250i=1=b̂⋅√50s x2√50s y =1.2×1215=0.96.故对该款智能家电的评分与年龄的相关性较强.(2)由列联表可得K 2=50×(8×6−20×16)224×26×28×22≈9.624>6.635.故有99%的把握认为对该智能家电的评价与年龄有关.21.【解答】解:(1)由题意可知,1个样区这种野生动物数量的平均数=120020=60,故这种野生动物数量的估计值=60×200=12000;(2)由参考公式得 ,r =∑(x i −x ¯)n i=1(y i −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1=80×9000=62≈0.94 ;(3)由题意可知,各地块间植物短盖面积差异很大,因此在调查时,先确定该地区各地块间植物短盖面积大小并且由小到大排序, 每十个分为一组,采用系统抽样的方法抽取20个地块作为样区进行样本统计. 22.【解答】解:(1)x ¯=17(3+4+5+6+7+8+9)=6, y ¯=17(66+69+73+81+89+90+91)=5597≈79.86;(2)把所给的7对数据写成对应的点的坐标,在坐标系中描出来,得到散点图.(3)∵ 3×66+4×69+5×73+6×81+7×89+8×90+9×91=3487,32+42+52+62+72+82+92=280,∴ b =3487−7×6×5597280−7×36=4.75,a =5597−6×4.75≈51.36,故线性回归方程为y =4.75x +51.36.23.【解答】解:每个个体被抽到的频率是 50050000=1100,10800×1100=108,12400×1100=124,15600×1100=156,11200×1100=112,每类中各应抽选出有效帖子的份数:很满意的108份,满意的124份,一般的156份,不满意的112份.在很满意的有效帖子中采用简单随机抽样的方法随机抽取108份,在满意的有效帖子中采用简单随机抽样的方法随机抽取124份,在一般的有效帖子中采用简单随机抽样的方法随机抽取156份,在不满意的有效帖子中采用简单随机抽样的方法随机抽取112份.。

必修三数学统计综合训练题及答案

必修三数学统计综合训练题及答案

8.在抽查某产品的尺寸过程中,将其尺寸数据分成假设干组,[a,b]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,那么|a-b|=( )A.h·m B.hm C.mh D.与m,h无关9.以下抽样中不是系统抽样的是〔〕B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止10.图2­2­8是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,假设80分以上为优秀,根据图形信息可知:这次考试的优秀率为( )图2­2­8A.25%B.30%C.35%D.40%11二、填空题12.以下四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④1314.超速行驶已成为马路上最大杀手之一,某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,否那么视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图2­7,那么违规的汽车大约为________辆.图2­715.某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,假设该校取一个容量为n的样本,那么n= 。

三、解答题16(1)样本中的作品落在[6,10)内的频数是多少?(2)估计众数、中位数和平均数各是多少?17.对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:甲2738303735312450乙3329383428364345分别求出甲、乙两名自行车赛手最大速度(单位:m/s)的数据的平均数、中位数、标准差,并判断选谁参加比赛更适宜(可用计算器).18.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午 8:00~12:00间各自的车流量(单位:百辆),得如图2­8所示的统计图,根据统计图:(1)甲、乙两个交通站的车流量的极差分别是多少?(2)甲交通站的车流量在[10,40]间的频率是多少?(3)甲、乙两个交通站哪个更繁忙?并说明理由.第二章自主检测1一.1.D 2.D 3.C 4.C 5.B 6.C 7.A 8.C 9.B 10.B 11.25二.12.①③ 13.0795 14.280 15.y^=1.23x+0.08三.16.解:(1)作品落在[6,10)内的频率为1-0.08-0.36-0.12-0.12=0.32,∴频数为200×0.32=64.(2)众数估计值为:10+142=12,中位数的估计值为:从左到右小矩形面积依次为0.08,0.32,0.36,0.12,0.12,由于中位数左、右两边的小矩形面积相等,假设设为x,那么(x-10)×0.09=0.1,∴x≈11.平均数的估计值为0.08×4+0.32×8+0.36×12+0.12×16+0.12×20≈12.17.解:(1)茎叶图如图D31,中间数为数据的十位数.图D31从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比拟稳定,总体得分情况比甲好.(2)利用科学计算器,得x甲=34,x乙=35.75;s甲≈7.55,s乙≈5.70;甲的中位数是33,乙的中位数是35. 综合比拟,选乙参加比赛更适宜.18.解:(1)甲交通站的车流量的极差为73-8=65;乙交通站的车流量的极差为71-5=66.(2)甲交通站的车流量在[10,40]间的频率为414=27.(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方.从数据的分布情况来看,甲交通站更繁忙.。

(好题)高中数学必修三第一章《统计》测试题(含答案解析)(1)

(好题)高中数学必修三第一章《统计》测试题(含答案解析)(1)

一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,152.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A.30 B.60C.70 D.803.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A.40 B.50 C.80 D.100a a>得到一组新4.一组数据的平均数为x,方差为2s,将这组数据的每个数都乘以()0数据,则下列说法正确的是()A.这组新数据的平均数为x B.这组新数据的平均数为a x+C .这组新数据的方差为2asD .这组新数据的标准差为2a s5.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .66.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.77.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .298.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081510.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A .消耗1升汽油,乙车最多可行驶5千米B .以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C .甲车以80千米/小时的速度行驶1小时,消耗10升汽油D .某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油 11.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.给出下列命题:①函数()π4cos 23f x x ⎛⎫=+ ⎪⎝⎭的一个对称中心为5π,012⎛⎫- ⎪⎝⎭;②若,αβ为第一象限角,且αβ>,则tan tan αβ>;③设一组样本数据12,,,n x x x ⋅⋅⋅的平均数是2,则数据1221,21,,21n x x x --⋅⋅⋅-的平均数为3;④函数sin 2y x =的图象向左平移π4个单位长度,得到πsin 24y x ⎛⎫=+ ⎪⎝⎭的图象.其中正确命题的序号是_____________(把你认为正确的序号都填上).14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).17.某种活性细胞的存活率y (%)与存放温度x (℃)之间具有线性相关关系,样本数据如下表所示 存放温度x (℃) 10 4 -2 -8 存活率y (%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.18.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 19.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.20.已知下列命题:①在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好; ②两个变量相关性越强,则相关系数r 就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④两个模型中残差平方和越小的模型拟合的效果越好.⑤回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;⑥若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;⑦从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 其中正确命题的序号是__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:第一天 第二天 第三天 第四天 第五天 就餐人数x (百人) 13 9 8 10 12 原材料y (袋)3223182428(1)根据所给的5组数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)24.某学校进行体验,现得到所有男生的身高数据,从中随机抽取50人进行统计(已知这50个身高介于155cm 到195cm 之间),现将抽取结果按如下方式分成八组:第一组[155,160),第二组[160,165),...,第八组[190,195],并按此分组绘制如图所示的频率分布直方图,其中第六组[180,185)和第七组[185,190)还没有绘制完成,已知第一组与第八组人数相同,第六组和第七组人数的比为5:2.(1)补全频率分布直方图;(2)根据频率分布直方图估计这50位男生身高的中位数;(3)用分层抽样的方法在身高为[170,180]内抽取一个容量为5的样本,从样本中任意抽取2位男生,求这两位男生身高都在[175,180]内的概率.25.某科研课题组通过一款手机APP软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:周跑量(/km周)[)10,15[)15,20[)20,25[)25,30[)30,35[)35,40[)40,45[)45,50[)50,55人数100120130180220150603010(1)在答题卡上补全该市1000名跑步爱好者周跑量的频率分布直方图:注意:请用2B铅笔在答题卡上作图,并将所作条形图涂黑.(2)根据以上图表数据,试求样本的中位数(保留一位小数).(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如下表:周跑量 小于20公里 20公里到40公里 不小于40公里 类别休闲跑者 核心跑者 精英跑者 装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?26.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数: 温度(单位:C ︒)21 23 24 27 29 32死亡数y (单位:株)6 11 20 27 57 77经计算:611266i i x x ===∑,611336i i y y ===∑,()()61557i i i x x y y =--=∑,()62184i i x x =-=∑,()6213930i i y y =-=∑,()621ˆ236.64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(结果精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程0.2303ˆ0.06x ye =,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.D解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s ,则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x xxxxxxxx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axaxaxaxaxaxaxax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.5.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.6.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.7.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.8.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.10.D解析:D【详解】解:对于A,由图象可知当速度大于40km/h时,乙车的燃油效率大于5km/L,∴当速度大于40km/h时,消耗1升汽油,乙车的行驶距离大于5km,故A错误;对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B错误;对于C,由图象可知当速度为80km/h时,甲车的燃油效率为10km/L,即甲车行驶10km时,耗油1升,故行驶1小时,路程为80km,燃油为8升,故C错误;对于D,由图象可知当速度小于80km/h时,丙车的燃油效率大于乙车的燃油效率,∴用丙车比用乙车更省油,故D正确故选D.考点:1、数学建模能力;2、阅读能力及化归思想.11.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】乙选手分数的平均数分别为7885848192767780949384,84, 55++++++++====因此s1<s2,选C.【点睛】本题考查标准差,考查基本求解能力.12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.①③【分析】求解的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④【详解】解:对于①函数的一个对称中心为故①正确;对于②取为第一象限角且但故②错误;对于③一组样本数据的平均数解析:①③ 【分析】 求解5()12f π-的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④. 【详解】 解:对于①,55()4cos()4cos()012632f ππππ-=-+=-=, ∴函数()4cos(2)3f x x π=+的一个对称中心为5(,0)12π-,故①正确;对于②,取94πα,3πβ=,α,β为第一象限角,且αβ>,但tan tan αβ<,故②错误;对于③,一组样本数据1x ,2x ,⋯,n x 的平均数是2,则数据121x -,221x -,⋯,21n x -的平均数为22132⨯-=,故③正确; 对于④,函数sin 2y x =的图象向左平移4π个单位长度,得到sin 2()sin(2)cos242y x x x ππ=+=+=的图象,故④错误.∴正确命题的序号是①③.故答案为:①③. 【点睛】本题考查命题的真假判断与应用,考查三角函数的图象与性质,训练了平均数的求法,属于中档题.14.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题15.【分析】首先求出xy 的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a 的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直 解析:214【分析】首先求出x ,y 的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a 的一元一次方程,解方程即可. 【详解】:14x =(1+2+3+4)=2.5,14y =(4.5+4+3+2.5)=3.5, 将(2.5,3.5)代入线性回归直线方程是ˆy=-0.7x +a ,可得3.5=﹣1.75+a , 故a =214. 故答案为214【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.34【解析】分析:根据表格中数据求出代入公式求得的值从而得到回归直线方程将代入回归方程即可得到结果详解:设回归直线方程由表中数据可得代入归直线方程可得所以回归方程为当时可得故答案为点睛:求回归直线方解析:34 【解析】分析:根据表格中数据求出,x y ,代入公式求得a 的值,从而得到回归直线方程,将6x =代入回归方程即可得到结果.详解:设回归直线方程3,ˆ2yx a =-+, 由表中数据可得1,50x y ==, 代入归直线方程可得53.2a =,所以回归方程为3,253.ˆ2yx =-+ 当6x =时,可得 3.2653.4ˆ23y=-⨯+=,故答案为34. 点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+;回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.18.2【解析】分析:直接利用回归方程将代入即可求得的估计值详解:∵回归方程为∴当时的估计值为故答案为82点睛:本题考查回归方程的运用考查学生的计算能力属于基础题解析:2 【解析】分析:直接利用回归方程,将25x =代入,即可求得y 的估计值. 详解:∵回归方程为0.4 1.8y x =-,∴当25x =时,y 的估计值为 0.425 1.88.2y =⨯-=.故答案为8.2.点睛:本题考查回归方程的运用,考查学生的计算能力,属于基础题.19.【解析】分析:先由茎叶图得数据再根据平均数公式求平均数详解:由茎叶图可知5位裁判打出的分数分别为故平均数为点睛:的平均数为解析:【解析】分析:先由茎叶图得数据,再根据平均数公式求平均数.详解:由茎叶图可知,5位裁判打出的分数分别为8989909191,,,,,故平均数为89+89+90+91+91905=.点睛:12,,,n x x x 的平均数为12nx x x n+++.20.①③④⑦【分析】根据线性回归分析的概念进行分析即可【详解】在线性回归模型中相关指数越接近于1表示回归效果越好①正确;两个变量相关性越强则相关系数r 的绝对值就越接近于1②错误;③正确;两个模型中残差平解析:①③④⑦ 【分析】根据线性回归分析的概念进行分析即可. 【详解】在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好,①正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,②错误;③正确;两个模型中残差平方和越小的模型拟合的效果越好,④正确;回归直线ˆˆˆybx a =+恒过样本点的中心(),x y ,不一定过样本点,⑤错误;若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,并不能说在100个吸烟的人中必有99人患有肺病,⑥错误;从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误,⑦正确.故答案为①③④⑦. 【点睛】本题考查线性回归分析的有关概念,掌握相关概念是解题基础,属于基础题.三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.94.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.22.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii ii x y x yb xx==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题. 23.(1)0.36 6.24y x =+;(2)8.76万吨. 【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量. 【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()616216.30.3617.5ˆiii i i t t y y bt t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨. 【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 24.(1)见解析;(2)174.5cm ;(3)0.3. 【详解】试题分析:(1)先分别算出第六组和第七组的人数,进而算出其频率与组距的比,补全直方图;(2)利用中位数两边频率相等,求出中位数的值;(3)先借助分层抽样的特征求出第四、第五组的人数,再运用列举法列举出所有可能数及满足题设的条件的数,运用古典概型的计算公式求解:解:(1)第六组与第七组频率的和为:∵第六组和第七组人数的比为5:2.∴第六组的频率为0.1,纵坐标为0.02;第七组频率为0.04,纵坐标为0.008.(2)设身高的中位数为,则∴估计这50位男生身高的中位数为174.5(3)由于第4,5组频率之比为2:3,按照分层抽样,故第4组中应抽取2人记为1,2,第5组应抽取3人记为3,4,5则所有可能的情况有:{1,2},{1,3},{1,4},{1,5},{2,3},{2,4},{2,5},{3,4},{3,5},{4,5}共10种满足两位男生身高都在[175,180]内的情况有{3,4},{3,5},{4,5}共3种,因此所求事件的概率为.25.(1)作图见解析;(2)中位数是29.2;(3)平均需要3720元.【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图.(2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱.【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=, 解得29.2x ≈.即样本中位数是29.2.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人, 核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人, 精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元.即该市每位跑步爱好者购买装备,平均需要3720元. 【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题.26.(1)ˆy=6.6x −139.4;(2)(i )回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好;(ii )190. 【分析】(1)根据公式,结合已知数据,分别求得ˆˆ,ba ,则问题得解; (2)根据相关指数的计算公式,结合已知数据,求得2R ,再进行比较即可; (3)将35x =代入回归方程,即可求得结果.【详解】(Ⅰ)由题意得,()()()121557ˆ 6.6384n i i i n i i x x y y b xx ==--==≈-∑∑ ∴ˆa =33−6.6326=−139.4,∴y 关于x 的线性回归方程为:ˆy=6.6x −139.4. (Ⅱ) (i )线性回归方程ˆy=6.6x −138.6对应的相关指数为: ()()6221621ˆ236.641110.06020.93983930i i i i i i y y R yy ==-=-=-≈-=-∑∑, 因为0.9398<0.9522,所以回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好. (ii )由(i )知,当温度35C x ︒=时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35C 时该批紫甘薯死亡株数为190.【点睛】本题考查线性回归直线方程的求解、相关指数的求解,以及用回归直线方程进行估算,属综合中档题.。

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)

一、选择题1.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为192.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差3.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙4.小明同学在做市场调查时得到如下样本数据x1 3 6 10 y 8a42他由此得到回归直线的方程为ˆ 2.115.5yx =-+,则下列说法正确的是( ) ①变量x 与y 线性负相关 ②当2x =时可以估计11.3y = ③6a = ④变量x 与y 之间是函数关系 A .①B .①②C .①②③D .①②③④5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和677.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④8.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .3二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小;④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 15.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.16.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________. 17.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称;②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________. 18.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.19.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.20.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.三、解答题21.2020年1月末,新冠疫情爆发,经过全国人民的努力,2月中旬,疫情得到了初步的控制,湖北省以外地区的每日新增确诊人数开始减少,某同学针对这个问题,选取他在统计学中学到的一元线性回归模型,作了数学探究:他于2月17日统计了2月7日至16日这十天湖北省以外地区的每日新增确诊人数,表格如下: 日期 2.7 2.8 2.9 2.10 2.11 2.12 2.132.14 2.15 2.16 代号x 123 45 678910新增确诊人数y558 509444381 377 312 267221166 115y x y x 计算出: 5.5,335x y ==,()()1013955iii x x y y =--=-∑,()210182.5ii x x =-=∑(1)请你帮这位同学计算出y 与x 的线性回归方程(精确到0.1),然后根据这个方程估计湖北省以外地区新增确诊人数为零时的大概日期;附:回归方程y bx a =+中斜率和截距的最小二乘法估计公式分别为:()()()1012101iii ii x x y y b x x ==--=-∑∑,a y bx =-(2)实际上2月17日至2月22日的新增确诊人数如下: 日期 2.17 2.18 2.19 2.20 2.21 2.22新增确诊人数7933 45 2583418出评价.22.已知某校6个学生的数学和物理成绩如下表:(1)若在本次考试中,规定数学在80分以上(包括80分)且物理在75分以上(包括75分)的学生为理科小能手.从这6个学生中抽出2个学生,设X 表示理科小能手的人数,求X 的分布列和数学期望;(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程.参考数据和公式:ˆˆˆybx a =+,其中1122211()()ˆ()nniii ii i nniii i x x y yx y nx yb x x xnx====---⋅==--∑∑∑∑,ˆˆay bx =-. 23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表:(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.在社会实践活动中,“求知”小组为了研究某种商品的价格x (元)和需求量y (件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料: 日期 11月1日 11月2日 11月3日 11月4日 11月5日 x (元) 14 16 18 20 22 y (件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义2.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 3.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.4.C解析:C 【解析】 【分析】根据数据和回归方程对每一个选项逐一判断得到答案. 【详解】① 2.1b =-⇒变量x 与y 线性负相关,正确 ②将2x =代入回归方程,得到11.3y =,正确 ③将(,)x y 代入回归方程,解得6a =,正确 ④变量x 与y 之间是相关关系,不是函数关系,错误 答案为C 【点睛】本题考查了回归方程的相关知识,其中中心点(,)x y 一定在回归方程上是同学容易遗忘的知识点.5.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.6.B解析:B 【解析】 【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解. 【详解】设更正前甲,乙,…的成绩依次为a 1,a 2,…,a 50, 则a 1+a 2+…+a 50=50×70,即60+90+a 3+…+a 50=50×70, (a 1﹣70)2+(a 2﹣70)2+…+(a 50﹣70)2=50×75, 即102+202+(a 3﹣70)2+…+(a 50﹣70)2=50×75. 更正后平均分为x =150×(80+70+a 3+…+a 50)=70; 方差为s 2=150×[(80﹣70)2+(70﹣70)2+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+50×75﹣102﹣202]=67. 故选B .本题考查平均数与方差的概念与应用问题,是基础题.7.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FP时,直线OP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FP时,直线OP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪(8,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.8.B【详解】试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a , ∴ˆa =9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程9.D解析:D 【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差10.C解析:C 【分析】先求均值,再根据标准差公式求标准差,最后比较大小. 【详解】乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==22222(7884)(8584)(8484)(8184)(9284)22,5-+-+-+-+-=22222(7684)(7784)(8084)(9484)(9384)62,5-+-+-+-+-=因此s 1<s 2,选C. 【点睛】本题考查标准差,考查基本求解能力.11.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n =++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.12.C解析:C 【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的. 故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③ 【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可. 【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确; 空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误, 故答案为:①②③. 【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.15.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论16.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】试题分析:由平均数及方差的定义可得10685675x ++++==;222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==.考点:样本数据的数字特征:平均值与方差.17.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.19.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.20.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.三、解答题21.(1)47.9598.7y x =-+,2月19日时新增确诊人数为零;(2)该数学探究估计的数据与实际的数据不吻合. 【分析】(1)根据数据套公式求出b a 、,写出回归方程,并估计新增确诊人数为零时的大概日期; (2)在(1)中求出的回归方程为线性的,再分析2月17日至2月22日的新增确诊人数不是线性的,所以选择模型不够理想. 【详解】解:()1设回归方程为y bx a =+, ∵ 5.5,335x y ==,()()1013955i ii x x y y =--=-∑,()210182.5ii x x =-=∑则()()()1012101395547.93982.5iii ii x x y y b x x ==---==≈--∑∑ 所以598.7a y bx =-≈所以回归方程为47.9598.7y x =-+估计在13x =即2月19日时新增确诊人数为零.()2该数学探究估计的数据与实际的数据不吻合.该同学首先通过线性相关系数进行线性相关判断,得到y 与x 有99%的把握线性相关,这只是说明选取的数据是线性的,但从整体看,不是线性的;出现这个结果的原因可能是传染病初发时的突发因素过多、湖北省外的人口众多、以及传染病机制复杂等因素决定的,说明对于传染病病例的变化趋势,选择线性模型可能不够理想. 【点睛】(1)求线性回归方程的步骤:①求出,x y ;②套公式求出b a 、;③写出回归方程y bx a =+;④利用回归方程y bx a =+进行预报;(2)可以建立多个函数模型时,要对每个模型进行分析比较,选择最优化模型. 22.(1)见解析;(2)129155y x =+ 【分析】(1)由题意得1号学生、2号学生为理科小能手,从而得到X 的可能取值为0,1,2,分别求出相应的概率,由此能求出X 的分布列和数学期望;(2)利用最小二乘法分别求出ˆb,ˆa ,由此能求出y 与x 的回归直线方程. 【详解】(1)由题意得1号学生、2号学生为理科小能手.X 的可能取值为:0,1,2。

必修3统计试题及答案

必修3统计试题及答案

必修3统计试题及答案一、选择题(每题3分,共30分)1. 下列哪项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 一组数据的众数是:A. 数据中出现次数最多的数值B. 数据中最小的数值C. 数据中最大的数值D. 数据中各数值的平均值答案:A3. 标准差是衡量数据:A. 中心趋势的量B. 离散程度的量C. 偏态分布的量D. 正态分布的量答案:B4. 相关系数的取值范围是:A. -1到1之间B. 0到1之间C. -1到0之间D. 1到无穷大答案:A5. 以下哪项不是统计图?A. 条形图B. 折线图C. 饼图D. 表格答案:D6. 回归分析的目的是:A. 预测未来数据B. 描述数据分布C. 计算数据的均值D. 确定数据的方差答案:A7. 假设检验的目的是:A. 验证假设是否成立B. 计算数据的均值C. 确定数据的方差D. 预测未来数据答案:A8. 置信区间是用来:A. 估计总体参数的区间B. 描述数据分布C. 计算数据的均值D. 确定数据的方差答案:A9. 以下哪项不是概率分布?A. 二项分布B. 正态分布C. 泊松分布D. 离散分布答案:D10. 以下哪项是统计学中常用的数据收集方法?A. 实验B. 观察C. 调查D. 所有以上答案:D二、填空题(每题4分,共20分)1. 一组数据的方差是衡量数据______程度的量。

答案:离散2. 正态分布曲线的特点是______对称的。

答案:左右3. 相关系数为-1表示两个变量之间存在______关系。

答案:完全负相关4. 回归分析中,回归系数表示自变量每变化一个单位,因变量平均变化______个单位。

答案:多少5. 置信水平为95%意味着置信区间包含总体参数的概率是______。

答案:95%三、简答题(每题10分,共50分)1. 请简述统计学中“样本”和“总体”的概念。

答案:总体是指研究对象的全体,样本是从总体中抽取的一部分个体,用于代表总体进行研究。

(压轴题)高中数学必修三第一章《统计》测试(有答案解析)

(压轴题)高中数学必修三第一章《统计》测试(有答案解析)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .23.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④7.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,88.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为A .y = x-1B .y = x+1C .y =88+12x D .y = 1769.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.19.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。

必修三数学统计综合训练题及答案

必修三数学统计综合训练题及答案

第二章 统计章末综合检测1一、选择题1.某学校有男、女学生各500名,为了解男、女学生在学习爱好与业余爱好方面是不是存在显著不同,拟从全部学生中抽取100名学生进行调查,那么宜采纳的抽样方式是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,那么有( )A .a>b>cB .b>c>aC .c>a>bD .c>b>a3.2021年某大学自主招生面试环节中,七位评委为一考生打出分数的茎叶图如图2­1,去掉一个最高分和一个最低分,所剩数据的平均数和方不同离为( )图2­1 A .84,4.84 B .84,1.6C .85,1.6D .85,44甲 乙 丙 丁平均环数x 8.6 8.9 8.9 8.2方差s 2 3.5 3.5 2.1 5.6A .甲B .乙C .丙D .丁5.某校数学教研组为了解学生学习数学的情形,采纳分层抽样的方式从高一600人、高二780人、高三n 人中,抽取35人进行问卷调查,已知高二被抽取的人数为13人,那么n =( )A .660B .720C .780D .8006气温/℃ 18 13 10 4 -1杯数/杯 24 34 39 51 63假设热茶杯数y 与气温( )A .y =x +6B .y =x +42C .y =-2x +60D .y =-3x +787.x 是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,那么以下各式正确的选项是( )A.x =40a +60b 100B.x =60a +40b 100C.x =a +bD.x =a +b 28.在抽查某产品的尺寸进程中,将其尺寸数据分成假设干组,[a ,b ]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,那么|a-b|=( )A.h·m B.hmC.mhD.与m,h无关9.图2­5是某县参加2021年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,…,A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2­6是统计图中身高在必然范围内学生人数的一个算法流程图.现要统计身高在160~180 cm(含160 cm,不含180 cm)的学生人数,那么在流程图中的判定框内应填写的条件是( )图2­5图2­6A.i<9? B.i<8? C. i<7? D.i<6?10.图2­2­8是依照某班学生在一次数学考试中的成绩画出的频率散布直方图,假设80分以上为优秀,依照图形信息可知:这次考试的优秀率为( )图2­2­8A.25%B.30%C.35%D.40%11.一个社会调查机构就某地居民的月收入调查了10 000人,并依照所得数据得出样本频率散布直方图(如图2­2­9).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人顶用分层抽样方式抽出100人做进一步伐查,那么在[2500,3000)(单位:元)月收入段中应抽出________人.图2­2­9二、填空题12.以下四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④频率散布直方图中各小长方形的面积等于相应各组的频数.其中正确的有__________(填序号).13.将参加数学竞赛的1000名学生编号如下:0001,0002,003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方式把编号分成50个部份,若是第一部份编号为0001,0002,0003,…,0020,第一部份随机抽取一个号码为0015,那么抽取的第40个号码为________.14.超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,不然视为违规.某天,有1000辆汽车通过了该路段,通过雷达测速取得这些汽车运行时速的频率散布直方图如图2­7,那么违规的汽车大约为________辆.图2­715.已知回归直线斜率估量值为1.23,样本点中心为(4,5),那么回归方程是____________.三、解答题16.某校文学社开展“红五月”征文活动,作品上交时刻为5月2号~5月22号,评委从收到的作品中抽出200,经统计,其频率散布直方图如图2­2­16.(1)样本中的作品落在[6,10)内的频数是多少?(2)估量众数、中位数和平均数各是多少?17.对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:甲2738303735312450乙3329383428364345(1)画出茎叶图。

必修3统计试题及答案

必修3统计试题及答案

必修3统计试题及答案一、选择题(每题5分,共20分)1. 以下哪个选项是统计学中描述数据集中趋势的度量?A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 在统计学中,用于衡量数据离散程度的度量是:A. 均值B. 众数C. 极差D. 标准差答案:D3. 以下哪个选项是描述数据分布形态的统计图?A. 条形图B. 折线图C. 散点图D. 饼图答案:C4. 假设检验中,如果原假设被拒绝,则:A. 一定是错误的B. 可能是错误的C. 一定正确的D. 可能正确的答案:B二、填空题(每题5分,共20分)1. 在统计学中,一组数据的________是指数据中出现次数最多的数值。

答案:众数2. 标准差是衡量数据________程度的统计量。

答案:离散3. 统计学中的________图用于展示两个变量之间的相关性。

答案:散点4. 回归分析中,________系数用来衡量自变量对因变量的影响程度。

答案:相关三、简答题(每题10分,共20分)1. 简述统计学中相关系数的意义。

答案:相关系数是衡量两个变量之间线性关系强度和方向的统计指标,其值介于-1和1之间,值越接近1或-1表示线性关系越强,值接近0则表示线性关系越弱。

2. 描述统计学中样本和总体的区别。

答案:总体是指研究对象的全体,包含了所有可能的观测值;样本则是从总体中随机抽取的一部分观测值,用于代表总体进行分析和推断。

四、计算题(每题20分,共40分)1. 已知一组数据:2, 3, 5, 7, 11。

请计算这组数据的平均数和标准差。

答案:平均数 = (2+3+5+7+11)/5 = 5标准差= √[(2-5)^2 + (3-5)^2 + (5-5)^2 + (7-5)^2 + (11-5)^2] / 5 = √[9+4+0+4+36] / 5 = √53 / 52. 假设进行了一项实验,得到以下数据:x = 10, y = 20, r = 0.8。

请计算x和y之间的相关系数。

(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(1)

(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(1)

一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e4.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .726.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08158.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s9.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,810.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.14.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.15.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人. 16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.18.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.19.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:月份i 7 8 9 10 11 12 销售单价i x (元) 9 9.5 10 10.5 11 8.5 销售量i y (元)111086514y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 22.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.参考数据:7772111y9.24,t39.75,0.53,7 2.646i i ii i iiy=====⋅≈≈∑∑∑(y-y).参考公式:相关系数()()()()()()11112211,ni i n n nii i i i in ni i ii ii it t y yr t t y y t y t yt t y y======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,ni iiniit t y yb a y btt t==⋅--==-⋅-∑∑.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x(分钟)时刻的细菌个数为y个,统计结果如下:x12345y23445(Ⅰ)在给出的坐标系中画出x,y的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y关于x的回归直线方程ˆˆˆy bx a=+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni iiniix y nx yx naxb y bx====---∑∑)25.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:温度(单位:C︒)212324272932死亡数y(单位:株)61120275777经计算:611266iix x===∑,611336iiy y===∑,()()61557i iix x y y=--=∑,()62184iix x=-=∑,()6213930iiy y=-=∑,()621ˆ236.64iiy y=-=∑,8.0653167e≈,其中ix,iy分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i=.(1)若用线性回归模型,求y关于x的回归方程ˆˆˆy bx a=+(结果精确到0.1);(2)若用非线性回归模型求得y关于x的回归方程0.2303ˆ0.06xy e=,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.26.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.3.D解析:D由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kx y ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+, 令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.5.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=,【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.8.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,1s ==,2s == 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.9.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3 【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数. 【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.14.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.15.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.16.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.17.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.18.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果.详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.19.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】 (1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .22.(1)散点图见解析,y 与t 的线性相关性相当高,理由见解析;(2)0.920.1011 2.02y =+⨯=,2.02万户.【分析】(1)根据表格中对应的t 与y 的关系,描绘散点图,并根据参考数据求r ,说明相关性;(2)根据参考数据求ˆb和ˆa ,求回归直线方程,并令11t =,求y 的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得()()7722114,0.53iii i t t t y y ===⋅-=⋅-≈∑∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===⋅--=-=-⨯=∑∑∑,2.790.990.532 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.24 1.327y ==及(1)得()()()717212.79ˆ0.1028iii i i t t y y b t t==⋅--==≈⋅-∑∑, ˆˆ 1.320.1040.92ay bt =-≈-⨯=,所以,y 关于t 的回归方程为:0.920.10y t =+. 将11t=代入回归方程得:0.920.1011 2.02y =+⨯=,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求ˆb和ˆa ,一般计算量较大,需计算严谨,准确. 23.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数; (4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑。

(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(4)

(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(4)

一、选择题1.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( )A .58件B .40件C .38件D .46件2.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e3.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( )A .3B .3.15C .3.5D .4.54.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18555.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为29,则抽到的32人中,编号落入区间[]200,480的人数为 A .7B .9C .10D .126.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元7.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙8.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸9.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,410.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081511.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元12.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .15二、填空题13.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.14.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.15.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人.16.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示:上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B 级及以上,平均分是64分,这个班级选考物理学业水平等级考的人数至少为______人.17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________. 18.已知下列命题:①在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好; ②两个变量相关性越强,则相关系数r 就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④两个模型中残差平方和越小的模型拟合的效果越好.⑤回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;⑥若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;⑦从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 其中正确命题的序号是__________.19.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.20.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88,若B 样本数据恰好是A 样本数据每个都加2后所得数据,则,A B 两样本的数字特征(众数、中位数、平均数、方差)对应相同的是__________.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+(2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iii ni ni x x y y bay bx x x ==--==--∑∑ 22.某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.23.探索浩瀚宇宙是全人类的共同梦想,我国广大科技工作者、航天工作者为推动世界航天事业发展付出了艰辛的努力,为人类和平利用太空、推动构建人类命运共同体贡献了中国智慧、中国方案、中国力量.(1)某公司试生产一种航空零件,在生产过程中,当每小时次品数超过90件时,产品的次品率会大幅度增加,为检测公司的试生产能力,同时尽可能控制不合格品总量,抽取几组一小时生产的产品数据进行次品情况检查分析,已知在x (单位:百件)件产品中,得到次品数量y (单位:件)的情况汇总如下表所示,且y (单位:件)与x (单位:百件)线性相关:x (百件)5 20 35 4050 y (件) 2 14243540根据公司规定,在一小时内不允许次品数超过90件,请通过计算分析,按照公司的现有生产技术设备情况,判断可否安排一小时试生产10000件的任务?(2)“战神”太空空间站工作人员需走出太空站外完成某项试验任务,每次只派一个人出去,且每个人只派出一次,工作时间不超过10分钟,如果有人10分钟内不能完成任务则撤回,再派下一个人.现在一共有n 个人可派,工作人员123,,,,n a a a a 各自在10分钟内能完成任务的概率分别依次为123,,,,n p p p p ,且1230.5n p p p p =====,*N n ∈,各人能否完成任务相互独立,派出工作人员顺序随机,记派出工作人员的人数为X ,X的数学期望为()E X ,证明:()2E X <.(参考公式:用最小二乘法求线性回归方程ˆˆybx a =+的系数公式 1122211()()=ˆ()n ni iiii i nnii i i x y nx y x x y y bxnx x x ====-⋅--=--∑∑∑∑;ˆa y bx=-.) (参考数据:515220143524403550404530i ii x y==⨯+⨯+⨯+⨯+⨯=∑,522222215203540505750ii x==++++=∑.)24.党的十八大以来,我国精准扶贫已经实施了六年,我国贫困人口从2012年的9899万人,减少到2018年的1660万人,2019年将努力实现减少贫困人口1000万人以上的目标,力争2020年在现行标准下,农村贫困人口全部脱贫,贫困县全部脱贫摘帽.某市为深入分析该市当前扶贫领域存在的突出问题,市扶贫办近三年来,每半年对贫困户(用y 表示,单位:万户)进行取样,统计结果如图所示,从2016年6月底到2019年6月底的共进行了七次统计,统计时间用序号t 表示,例如:2016年12月底(时间序号为2)贫困户为5.2万户.(1)求y 关于t 的线性回归方程y bx a =+,并预测到2020年12月底,该市能否实现贫困户全部脱贫;(2)为尽快打赢脱贫攻坚战,该市扶贫办在2019年6月底时,对全市贫困户随机抽取了100户贫困户,对每个家庭最主要经济收入来源进行抽样调查,统计结果如图.并决定据此选派一批农业技术人员对全市所有贫困户中,家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶,每一名农业技术人员对口帮扶贫困户90户,则该市应分别安排多少农业技术人员对家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶? 附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-25.从某小区抽取100个家庭进行月用电量调查,发现其月用电量都在50度至350度之间,频率分布直方图如图所示.(1)根据直方图求x 的值,并估计该小区100个家庭的月均用电量(同一组中的数据用该组区间的中点值作代表);(2)从该小区已抽取的100个家庭中, 随机抽取月用电量超过300度的2个家庭,参加电视台举办的环保互动活动,求家庭甲(月用电量超过300度)被选中的概率. 26.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.D解析:D 【分析】由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.5.C解析:C根据系统抽样的定义,可知抽到的号码数可组成一个以301=-n a n 为通项公式的等差数列,令*200301480,≤-≤∈n n N ,解不等式可得结果. 【详解】每组人数=9603230÷=人,即抽到号码数的间隔为30,因为第一组抽到的号码为29,根据系统抽样的定义,抽到的号码数可组成一个等差数列,且*2930(1)301,=+-=-∈n n n n N a ,令200301480≤-≤n ,得2014813030≤≤n ,可得n 的取值可以从7取到16,共10个,故选C . 【点睛】本题主要考查系统抽样的定义及应用,转化为等差数列是解决本题的关键.6.B解析:B 【解析】 【分析】 先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.7.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.8.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.9.C解析:C 【解析】分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.10.A解析:A【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.11.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.12.C解析:C 【详解】 抽取比例为150130000200=, 1400020200∴⨯=, 抽取数量为20,故选C.二、填空题13.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4 【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=. 若13x =时,则()()()()2222234577774x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0, 此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9, 此时12345,,,,x x x x x 为4,6,7,8,10,符合题意. 故答案为:4 【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题.14.【分析】依题意可得解之即得解【详解】依题意可得解得故答案为1320【点睛】本题主要考查分层抽样意在考查学生对这些知识的理解掌握水平和分析推理能力 解析:1320【分析】 依题意可得6512111110n⎛⎫-⨯= ⎪⎝⎭,解之即得解. 【详解】 依题意可得6512111110n⎛⎫-⨯=⎪⎝⎭,解得1320n =. 故答案为1320 【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.15.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果.【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.16.15【解析】【分析】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人由题意可得:解得:结合xy 可求的最【详解】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人则即又xy 即当且仅当时取得最小值15取得解析:15 【解析】 【分析】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,由题意可得:()70567x 64y 61z 645x y z ⨯+++=⨯+++,解得:z x 10-=,结合x ,y ,z N ∈,可求5x y z +++的最. 【详解】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人, 则()70567x 64y 61z 645x y z ⨯+++=⨯+++, 即z x 10-=, 又x ,y ,z N ∈,即当且仅当x 0=,y 0=,z 10=时,5x y z +++取得最小值15, 取得A 成绩的0人,取得B +成绩的0人,取得B 成绩的10人, 这个班级选考物理学业水平等级考的人数至少为15人, 故答案为15 【点睛】本题考查了实际问题通过数学问题解决,考查了阅读理解及数学建模的能力,属中档题.17.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.18.①③④⑦【分析】根据线性回归分析的概念进行分析即可【详解】在线性回归模型中相关指数越接近于1表示回归效果越好①正确;两个变量相关性越强则相关系数r 的绝对值就越接近于1②错误;③正确;两个模型中残差平解析:①③④⑦ 【分析】根据线性回归分析的概念进行分析即可. 【详解】在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好,①正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,②错误;③正确;两个模型中残差平方和越小的模型拟合的效果越好,④正确;回归直线ˆˆˆybx a =+恒过样本点的中心(),x y ,不一定过样本点,⑤错误;若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,并不能说在100个吸烟的人中必有99人患有肺病,⑥错误;从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误,⑦正确.故答案为①③④⑦. 【点睛】本题考查线性回归分析的有关概念,掌握相关概念是解题基础,属于基础题.19.8【解析】由题意得从名学生中采用系统抽样的方法抽取名学生需要把名学生平均分成组每组人设第一组抽取的号码为则第组抽取的号码为解得点睛:本题考查了抽样方法中的系统抽样问题对于系统抽样的抽法是先对总体编号解析:8 【解析】由题意得,从800名学生中采用系统抽样的方法抽取25名学生,需要把800名学生平均分成25组,每组8003225=人, 设第一组抽取的号码为x ,则第5组抽取的号码为432136x +⨯=,解得8x =.点睛:本题考查了抽样方法中的系统抽样问题,对于系统抽样的抽法是先对总体编号,根据样本平均分组,确定组距,再在第一组中抽取一个编号,依次等距抽取,其中把握系统抽样的原则是解答此类问题的关键.20.方差【解析】根据样本数字特征样本数据都加上2后新数据的众数中位数和平均数都增加2只有方差计算公式为结果不变故答案为方差解析:方差 【解析】根据样本数字特征,样本数据都加上2后新数据的众数、中位数和平均数都增加2,只有方差计算公式为2211()n i i S x x n ==-∑,结果不变,故答案为方差.三、解答题21.(1)171277y =⨯;(2)该小组所得线性回归方程是理想的. 【分析】(1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论. 【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=,故有()()520(1)2513(3)(7)34iii x x y y =--=⨯-+⨯+⨯+-⨯-=∑,()5222222021(3)14i i x x =-=+++-=∑,34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=, 1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的.【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论. 22.(Ⅰ)0.02;(Ⅱ)10800元. 【分析】(Ⅰ)由频率分布直方图中小矩形面积和为1能求出a .(Ⅱ)根据频率分布直方图,日销售量不低于25件的天数为(0.040.02)5309+⨯⨯=,一个月可获得的奖励为900元,由此可以估计一年内获得的礼金数. 【详解】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为:()0.040.025309+⨯⨯=(天),一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.23.(1)可以安排一小时试生产10000件的任务;(2)证明见解析. 【分析】(1)根据表中数据,分别求得:,x y ,利用公式求得ˆˆ,ab ,写出回归直线方程,然后将 100x =代入求值与90比较即可.(2)根据题意,随机变量的可能取值为1,2,3,,X n =,且1111()(1)222k k P X k -==-⨯=,1,2,3,,1k n =-;1111()(1)22n n P X n --==-=,由期望公式得到2321123221() (22222)n n n n E X ----=+++++,然后利用数列的错位相减法求解即可. 【详解】(1)由已知可得:520354050305x ++++==; 214243540235y ++++==;又因为522222215203540505750ii x==++++=∑;515220143524403550404530i ii x y==⨯+⨯+⨯+⨯+⨯=∑;由回归直线的系数公式知:51522222222154530530231080ˆ0.864(520354050)53012505i ii ii x y x ybxx ==-⋅-⨯⨯====++++-⨯-∑∑ˆ230.86430 2.92a y bx=-=-⨯=- 所以ˆˆ0.864 2.92ybx a x =+=- 当100x =(百件)时,864100 2.92083.4890.y ⨯-=<=,符合有关要求 所以按照公司的现有生产技术设备情况,可以安排一小时试生产10000件的任务. (2)由题意知:1,2,3,,X n =,1111()(1)222k k P X k -==-⨯=,1,2,3,,1k n =-;1111()(1)22n n P X n --==-=所以2321123221() (22222)n n n n E X ----=+++++ 2341()123221 (222222)n n E X n n ---=+++++ 两式相减得:2321()1111121 (2222222)n n n E X n n --+-=+++++- 211111...2222n n -=++++ 112n =- 故11()222n E X -=-<【点睛】本题主要考查回归直线方程的求法,离散型随机变量的期望的求法以及独立重复实验的应用数列的错位相减法求和的方法,还考查了运算求解的能力,属于中档题. 24.(1)0.5 6.3y t =-+,不能;(2)58人和116人. 【分析】(1)由题意求得t 、y 后,代入公式即可得b 、a ,即可得线性回归方程;代入10t =求得 1.3y =即可得解;(2)由统计图计算可得家庭最主要经济收入来源为养殖收入和种植收入的贫困户户数,即可得解. 【详解】(1)∵123456747t ++++++==,5.9 5.2 4.8 4.4 3.6 3.3 2.9 4.37y ++++++==,()()()()()()3 1.620.910.5010.7213 1.40.59410149b -⨯+-⨯+-⨯++⨯-+⨯-+⨯-==-++++++,()4.30.54 6.3a y bt =-=--⨯=,y 关于t 的线性回归方程0.5 6.3y t =-+.2020年12月底时,10t =,代入知 1.30y =>,不能实现贫困户全部脱贫.(2)2019年6月底时,贫困户共2.9万户,由图知,家庭最主要经济收入来源为养殖收入和种植收入分别占18%和36%,290000.189058⨯÷=,290000.3690116⨯÷=,对家庭最主要经济收入来源为养殖收入和种植收入的贫困户分别安排58人和116人. 【点睛】本题考查了统计的应用,考查了线性回归方程的求解和应用,属于中档题. 25.(1)x=0.0044, 月均用电量约为186度;(2).【详解】 (1)由题意得,.设该小区100个家庭的月均用电量为S 则9+22.5+52.5+49.5+33+19.5=186.(2),所以用电量超过300度的家庭共有6个.分别令为甲、A 、B 、C 、D 、E ,则从中任取两个,有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )、(A,B )、(A,C )、(A,D )、(A,E )、(B,C )、(B,D )、(B,E )、(C,D )、(C,E )、(D,E )15种等可能的基本事件,其中甲被选中的基本事件有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )5种. 家庭甲被选中的概率.26.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题。

(典型题)高中数学必修三第一章《统计》检测(答案解析)

(典型题)高中数学必修三第一章《统计》检测(答案解析)

一、选择题1.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是()A.5 B.4 C.3 D.22.某产品的广告费用与销售额的统计数据如下表:()广告费用(万元)销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为()A.万元B.万元C.万元D.万元3.从两个班级各随机抽取5名学生测量身高(单位:cm),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平,x乙及方差2s甲,2s乙的关系为( )均身高x甲A.x甲>x乙,2s甲>2s乙 B.x甲>x乙,2s甲<2s乙 C.x甲<x乙,2s甲<2s乙 D.x甲<x乙,2s甲>2s乙4.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是()A.2018年3月的销售任务是400台B.2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份5.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和676.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .297.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >8.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s9.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④10.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,811.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .712.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.14.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.15.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.16.某种活性细胞的存活率y(%)与存放温度x(℃)之间具有线性相关关系,样本数据如下表所示存放温度x(℃)104-2-8存活率y(%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.17.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a,中位数为b,众数为c,则a、b、c从小到大的关系依次是________18.已知某市A社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b的最小值为__________.三、解答题21.假设关于某设备的使用年限x(年)和所支出的维修费用y(万元),有如下的统计资料:x(年)12345y(万元)567810由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑22.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下: 分组 频数 频率 [50,60) 18 0.30 [60,70) 24 0.40 [70,80) 9 0.15 [80,90) 6 0.10 [90,100]30.05(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.23.2020年新冠肺炎疫情肆虐全球,各地医疗部门迅速进行防控意识宣传和流行病学调查.某疫区随机抽取100人调查其外出时佩戴口罩的情况,结果如下表. 分类佩戴口罩人数/人不佩戴口罩人数/人(1)是否有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)该疫区某新冠肺炎定点治疗医院统计了确诊患者中年龄x (单位:岁)的重症患者比例(单位:%),得到下表:若y 与x 之间具有线性相关关系,请用最小二乘法求出y 关于x 的线性回归方程y bx a =+,并预测该医院76岁确诊患者中的重症比例.参考公式和数据:用最小二乘法求线性回归方程系数公式:1221ni ii nii x y nx yb xn x=-=-=-∑∑,a y bx =-.817010.5657.5637.553 5.552 4.545 3.540 1.5320.52454i ii x y==⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=∑.82222222217065635345403223256i i x==++++++=∑.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.24.零部件生产水平是评判一个国家高端装备制造能力的重要标准之一,其中切割加工技术是一项重要技术某精密仪器制造商研发了一种切割设备,用来生产高精度的机械零件,经过长期生产检验,可以认为该设备生产的零件尺寸服从正态分布N (μ,σ2).某机械加工厂购买了该切割设备,在正式投入生产前进行了试生产,从试生产的零件中任意抽取10件作为样本,下面是样本的尺寸x i(i=1,2,3,…,10,单位:mm):用样本的平均数x作为μ的估计值,用样本的标准差s作为σ的估计值.(1)按照技术标准的要求,若样本尺寸均在(μ﹣3σ,μ+3σ)范围内,则认定该设备质量合格,根据数据判断该切割设备的质量是否合格.(2)该机械加工厂将该切割设备投入生产,对生产的零件制定了两种销售方案(假设每种方案对销售量没有影响):方案1:每个零件均按70元定价销售;方案2:若零件的实际尺寸在(99.7,100.3)范围内,则该零件为A级零件,每个零件定价100元,否则为B级零件,每个零件定价60元.哪种销售方案的利润更大?请根据数据计算说明.附:1021iix=∑≈100601.8,样本方差()22221111n ni ii is x x x nxn n==⎛⎫=-=-⎪⎝⎭∑∑.若X~N(μ,σ2),则P(μ﹣σ<X<μ+σ)=0.6827,P(μ﹣2σ<X<μ+2σ)=0.9545 25. 2.5PM是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM浓度的数据如下表:(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标;(2)用最小二乘法求出y关于x的线性回归方程y bx a=+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM的浓度是多少?(参考公式:()()()121ni iiniix x y ybx x==--=-∑∑,a y bx=-)26.在社会实践活动中,“求知”小组为了研究某种商品的价格x(元)和需求量y(件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料:日期11月1日11月2日11月3日11月4日11月5日x(元)1416182022y(件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y关于x的线性回归方程y bx a=+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y bx=-.【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x+++++++÷=,635=917=6372x x,∴+⨯∴=,故选D. 2.B解析:B【解析】【分析】先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.3.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.4.D解析:D 【分析】根据图形中给出的数据,对每个选项分别进行分析判断后可得错误的结论. 【详解】对于选项A ,由图可得3月份的销售任务是400台,所以A 正确. 对于选项B ,由图形得2018年月销售任务的平均值为1(3245810743413)10045012⨯+++++++++++⨯=,所以B 正确. 对于选项C ,由图形得第一季度的总销售量为13002001400 1.28302⨯+⨯+⨯=台,所以C 正确.对于选项D ,由图形得销售量最大的月份是5月份,为800台,所以D 不正确. 故选D . 【点睛】本题考查统计中的识图、用图和计算,解题的关键是从图中得到相关数据,然后再根据要求进行求解,属于基础题.5.B解析:B 【解析】 【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解. 【详解】设更正前甲,乙,…的成绩依次为a 1,a 2,…,a 50, 则a 1+a 2+…+a 50=50×70,即60+90+a 3+…+a 50=50×70, (a 1﹣70)2+(a 2﹣70)2+…+(a 50﹣70)2=50×75, 即102+202+(a 3﹣70)2+…+(a 50﹣70)2=50×75. 更正后平均分为x =150×(80+70+a 3+…+a 50)=70; 方差为s 2=150×[(80﹣70)2+(70﹣70)2+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+50×75﹣102﹣202]=67. 故选B . 【点睛】本题考查平均数与方差的概念与应用问题,是基础题.6.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.7.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=,3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础8.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,1s ==,2s == 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.9.C解析:C 【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可. 【详解】①设某大学的女生体重y (kg )与身高x (cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y ∧=0.85x ﹣85.71,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ,正确;②关于x 的方程x 2﹣mx +1=0(m >2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C 的方程为(x ﹣a )2+(x ﹣b )2=r 2,其上定点A (x 0,y 0),设B (a +r cosθ,b +r sinθ),P (x ,y ),由12OP =(OA OB +)得0022x a rcos x y b rsin y θθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x ﹣x 0﹣a )2+(2y﹣y 0﹣b )2=r 2,即动点P 的轨迹为圆, ∴故③不正确;④由22143x y +=,得a 2=4,b 2=3,∴1c ==.则F (﹣1,0),如图:过F 作垂直于x 轴的直线,交椭圆于A (x 轴上方),则x A =﹣1,代入椭圆方程可得32A y =. 当P 为椭圆上顶点时,P (0FP k =32OA k =-, ∴当直线FP时,直线OP 的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,. 当P 为椭圆下顶点时,P (0,∴当直线FP时,直线OP,32), 综上,直线OP (O 为原点)的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,∪(8,32). 故选C 【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.10.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图11.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127;128,128,129,129,129; 131,131,131,132,132;132,133,134,134,135; 137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.12.A解析:A 【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数. 详解:∵8名女生,4名男生中选出3名学生组成课外小组, ∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112. 故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.14.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平 解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20.【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.15.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.16.34【解析】分析:根据表格中数据求出代入公式求得的值从而得到回归直线方程将代入回归方程即可得到结果详解:设回归直线方程由表中数据可得代入归直线方程可得所以回归方程为当时可得故答案为点睛:求回归直线方解析:34 【解析】分析:根据表格中数据求出,x y ,代入公式求得a 的值,从而得到回归直线方程,将6x =代入回归方程即可得到结果.详解:设回归直线方程3,ˆ2yx a =-+, 由表中数据可得1,50x y ==, 代入归直线方程可得53.2a =,所以回归方程为3,253.ˆ2yx =-+ 当6x =时,可得 3.2653.4ˆ23y=-⨯+=,故答案为34. 点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+;回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.17.【详解】分析:将数据由小到大排列好根据众数中位数平均数的概念得到相应的数据即可详解:根据提干得到中位数为b=15众数为c=17平均数为=a 故故答案为点睛:这个题目考查了中位数众数平均数的概念和计算较解析:a b c <<. 【详解】分析:将数据由小到大排列好,根据众数,中位数,平均数的概念得到相应的数据即可. 详解:根据提干得到中位数为b=15,众数为c=17,平均数为10+12+28+30+16+51=14.710=a.故 a b c <<. 故答案为a b c <<.点睛:这个题目考查了中位数,众数,平均数的概念和计算,较为基础,众数即出现次数最多的数据,中位数即最中间的数据,平均数即将所有数据加到一起,除以数据个数.18.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140 解析:140【解析】根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程;(2)将15x =代入回归直线方程即可求得结果. 【详解】 (1)1234535x ++++==,5678107.25++++==y51120i ii x y==∑,522222211234555i i x ==++++=∑25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题. 22.(1)直方图见解析;(2)67分,65分. 【分析】(1)由统计表算出各频率,作出频率分布直方图;(2)取各组数据中间值乘以频率再相加可得总平均值,求出频率0.5对应的成绩(此成绩在[60,70)之间]. 【详解】(1)根据统计表,作出这些数据的频率分布直方图如图:(2)由表中数据可知,这60名参赛学生成绩的平均数550.3650.4750. 15850.1950.0567x =⨯+⨯+⨯+⨯+⨯=分.因为这60名参赛学生成绩在[50,60)的频率为0.30.5<,成绩在[50,70)的频率为0.70.5>,所以这60名.参赛学生成绩的中位数在[60,70)之间.设这60名参赛学生成绩的中位数为x ,则()0.04600.2x ⨯-=,解得65x =, 故这60名参赛学生成绩的中位数为65分. 【点睛】本题考查频率分布直方图,考查由频率分布直方图求均值和中位数.考查了学生的数据处理能力,运算求解能力,属于中档题. 23.(1)有把握;(2)1ˆ84yx =-,11%. 【分析】(1)根据列联表,利用公式计算2K ,对照附表得出结论;(2)计算x 、y ,求出回归系数,写出线性回归方程,利用方程计算76x =时ˆy的值. 【详解】(1)根据题意,计算22100(45201025)8.1297.89770305545K ⨯⨯-⨯=≈>⨯⨯⨯; 所以有99.5%的把握认为“是否佩戴口罩与年龄有关”; (2)计算1105(7065635352454032)82x =⨯+++++++=,141(10.57.57.5 5.5 4.5 3.5 1.50.5)88y =⨯+++++++=; 所以122211054124548128ˆ1054232568()2ni ii nii x ynxy bxnx ==--⨯⨯===-⨯-∑∑; 411105ˆˆ8842ay bx =-=-⨯=-; 所以y 关于x 的线性回归方程是1ˆ84yx =-, 计算76x =时,1ˆ768114y =⨯-=, 可以预测该医院76岁确诊患者中的重症比例为11%. 【点睛】本题考查了列联表与独立性检验的应用问题,也考查了线性回归方程的应用问题,是中档题.24.(1)合格,理由见解析;(2)方案2,理由见详解. 【分析】(1)求得10个数据的平均数和标准差,根据题意,即可判断;(2)设出方案2中零件价格的随机变量,结合正态分布求得零件价格的分布列和数学期望,即可比较大小,则问题得解. 【详解】(1)由表格中数据可得:x 1011100.310i i x ===∑,()101022221111(10)0.091010i i i i s x x x x ===-=-=∑∑.故可得:100.3μ=,0.3σ=.因为所有样本都在区间()99.4,101.2, 故该切割设备质量合格.(2)对方案2,设零件价格的随机变量为X ,故X 可取60,100, 根据(1)中所求,可得()()()10099.7100.320.47725P X P x P x μσμ==<<=-<<=;()()6011000.52275P X P X ==-==.故()600.522751000.47725600.51000.477770E X =⨯+⨯>⨯+⨯=>. 又方案1中,每个零件售价均为70, 故可得方案2的利润更大. 【点睛】本题考查平均数和方差标准差的计算,涉及正态分布,随即变量数学期望的求解,属综合中档题.25.(1)()54,42(2)0.72 3.12y x =+(3)75.12微克/立方米 【分析】(1)求出,x y 从而得到样本点的中心; (2)利用参考公式求出()52150ii x x =-=∑,()()136ni ii x xy y =--=∑,从而得到b ,再将样本中心坐标代入求得a ,从而得到回归方程; (3)将100x =代入回方程,求出y 的值,即可得到答案. 【详解】 (1)5051545758394042444554,4255x y ++++++++====,所以样本中心坐标为()54,42. (2)因为()52116991650ii x x =-=+++=∑,()()1(4)(3)(3)(2)324336niii x x y y =--=-⋅-+-⋅-+⋅+⋅=∑,所以360.7250b ==, 3.12a =, 线性回归方程为0.72 3.12y x =+.(3)0.72100 3.1275.12y =⨯+=(微克/立方米) 此时 2.5PM 的浓度是75.12微克/立方米. 【点睛】本题考查回归直线方程的最小二乘法求解及回归方程的应用,考查数据处理能力,求解时注意运算的准确性.26.(1) 1.534y x =-+;(2)详见解析. 【分析】(1)利用表中数据,分别求得:,x y ,再利用公式求得,b a ,然后写出回归直线方程即可. (2)根据(1)中的回归直线方程,令14x =, 22x =求得相应的y 值,再与实际值结合误差要求比较即可. 【详解】 由表中数据得: ()()1116182018,10747,33x y =++==++= 311610187204366i ii x y==⨯+⨯+⨯=∑,322221161820980ii x==++=∑,3132221336631871.59803183i ii i i x y x yb x x==--⨯⨯===--⨯-∑∑, ()7 1.51834a y bx =-=--⨯=,所以y 关于x 的线性回归方程是 1.534y x =-+.(2)当14x =时, 1.5143413y =-⨯+=,131212-=<, 当22x =时, 1.522341y =-⨯+=,1322-=≤, 所以(1)中所得到的线性回归方程是可靠的. 【点睛】本题主要考查回归直线方程的求法以及应用,还考查了运算求解的能力,属于中档题.。

(好题)高中数学必修三第一章《统计》测试题(答案解析)

(好题)高中数学必修三第一章《统计》测试题(答案解析)

一、选择题1.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量2.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>3.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A .40B .50C .80D .1004.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生5.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y 的值是( )A .12B .14C .16D .186.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读D.抽样表明,该校有50名学生为阅读霸7.如果在一次试验中,测得(x,y)的四组数值分别是A(1,3),B(2,3.8),C(3,5.2),D(4,6),则y与x之间的回归直线方程是 ()A.y=x+1.9 B.y=1.04x+1.9C.y=1.9x+1.04 D.y=1.05x-0.98.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,总体方差大于0 C.丙地:中位数为2,众数为3 D.丁地:总体均值为2,总体方差为3 9.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755的人数为()A.10 B.11C.12 D.1310.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为()A.112种B.100种C.90种D.80种11.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.3712.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费i x和年销售量()y i=数据作了初步处理,得到下面的散点图及一些统计量的值.1,2, (8)i有下列5个曲线类型:①ˆˆy bxa =+;②y d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___14.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||x a -=________.16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________.17.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________18.目前北方空气污染越来越严重,某大学组织学生参加环保知识竞赛,从参加学生中抽取40名,将其成绩(均为整数)整理后画出的频率分布直方图如图,若从成绩是80分以上(包括80分)的学生中选两人,则他们在同一分数段的概率为_______.19.一个容量为40的样本,分成若干组,在它的频率分布直方图中,某一组相应的小长方形的面积为0.4,则该组的频数是__________.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+的斜率和截距的最小二乘估计分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.22.某科研课题组通过一款手机APP 软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表: 周跑量(/km 周) [)10,15 [)15,20 [)20,25 [)25,30 [)30,35 [)35,40 [)40,45 [)45,50 [)50,55人数100120130180220150603010(1)在答题卡上补全该市1000名跑步爱好者周跑量的频率分布直方图:注意:请用2B铅笔在答题卡上作图,并将所作条形图涂黑.(2)根据以上图表数据,试求样本的中位数(保留一位小数).(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如下表:周跑量小于20公里20公里到40公里不小于40公里类别休闲跑者核心跑者精英跑者装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?23.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次[0,200](200,400](400,600]空气质量等级1(优)216252(良)510123(轻度污染)6784(中度污染)720(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,并根据列联表,判断是否有多少的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400≤ 人次400>空气质量好 空气质量不好附:22()()()()()n ad bc K a b c d a c b d -=++++. 24.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)25.在社会实践活动中,“求知”小组为了研究某种商品的价格x (元)和需求量y (件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料:该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.2.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.5.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.6.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.7.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.解析:D【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差9.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.10.A解析:A【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数.详解:∵8名女生,4名男生中选出3名学生组成课外小组,∴每个个体被抽到的概率是14,根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生,∴有C82•C41=112.故答案为:A.点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.12.B解析:B【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择.详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y=d或y=p+q ln x较适宜,故选B.点睛:本题考查散点图以及函数图像,考查识别能力.二、填空题13.【分析】首先求出xy的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直解析:21 4【分析】首先求出x,y的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a的一元一次方程,解方程即可.【详解】:14x=(1+2+3+4)=2.5,14y=(4.5+4+3+2.5)=3.5,将(2.5,3.5)代入线性回归直线方程是ˆy=-0.7x+a,可得3.5=﹣1.75+a,故a=214.故答案为21 4【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题14.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基解析:3【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为3s =. 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题.15.1【分析】先根据数列为等差数列求出再根据方差公式可得【详解】因为数列为等差数列且所以所以该组数据的方差为故填01【点睛】考查方差的计算基础题解析:1 【分析】先根据数列2{()}i x a -为等差数列求出()521i i x a =-∑,再根据方差公式可得.【详解】因为数列2{()}i x a -为等差数列,且3x a -=()()52231550.1=ii x a x a =-=-=⨯∑ 0.5,所以该组数据的方差为()52110.15i i x a =-=∑.故填0.1. 【点睛】考查方差的计算,基础题.16.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.17.【详解】分析:将数据由小到大排列好根据众数中位数平均数的概念得到相应的数据即可详解:根据提干得到中位数为b=15众数为c=17平均数为=a 故故答案为点睛:这个题目考查了中位数众数平均数的概念和计算较解析:a b c <<. 【详解】分析:将数据由小到大排列好,根据众数,中位数,平均数的概念得到相应的数据即可. 详解:根据提干得到中位数为b=15,众数为c=17,平均数为10+12+28+30+16+51=14.710=a.故 a b c <<. 故答案为a b c <<.点睛:这个题目考查了中位数,众数,平均数的概念和计算,较为基础,众数即出现次数最多的数据,中位数即最中间的数据,平均数即将所有数据加到一起,除以数据个数.18.【解析】设第二组及第五组数据对应矩形的高为a 则10×(a+0015+0025+0035+a+0005)=1解得a=0010故各组的频率依次为:010015025035010005∵前三组的累积频率为解析:715【解析】设第二组及第五组数据对应矩形的高为a , 则10×(a+0.015+0.025+0.035+a+0.005)=1, 解得a=0.010,故各组的频率依次为:0.10,0.15,0.25,0.35,0.10,0.05, ∵前三组的累积频率为:0.10+0.15+0.25=0.50, 故这次环保知识竞赛成绩的中位数为70; 成绩在[80,90)段的人数有10×0.010×40=4人, 成绩在[90,100]段的人数有10×0.005×40=2人,从成绩是80分以上(包括80分)的学生中任选两人共有15种不同的基本事件, 其中他们在同一分数段的基本事件有:7, 故他们在同一分数段的概率为7.15故答案为:7 15.19.16【解析】根据频率直方图的含义每组小矩形的面积就是该组数据在总体中出现的频率所以该组频数为故填16解析:16 【解析】根据频率直方图的含义,每组小矩形的面积就是该组数据在总体中出现的频率,所以该组频数为400.4=16⨯,故填16.20.【解析】因为平均数为所以方差为解析:45【解析】因为平均数为8,所以9,x = 方差为222214[10111]55++++=三、解答题21.(1) 1.60.2y x =+;(2)B 项目的收益更好. 【分析】(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出b 的值,最后将样本中心点的坐标代入回归方程求得a 的值即可;(2)分别利用所给关系式以及所求回归方程,求出A ,B 两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好. 【详解】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8, 所以1234535x ++++==,2357855y ++++==,22222212233547585351.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元; 因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元. 因为9.89.7>,所以可预测B 项目的收益更好. 【点睛】方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a=+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.22.(1)作图见解析;(2)中位数是29.2;(3)平均需要3720元. 【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图. (2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱. 【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=, 解得29.2x ≈.即样本中位数是29.2.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人, 核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人, 精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元.即该市每位跑步爱好者购买装备,平均需要3720元. 【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题. 23.(1)概率分别为:43100,27100,21100,9100;(2)350;(3)填表见解析;有95%的把握认为锻炼的人次与该市的空气质量有关.【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1,2,3,4的概率; (2)利用频率分布直方图估计样本平均值的方法可得得答案; (3)完善列联表,由公式计算卡方的值,从而查表即可,【详解】解:(1)该市一天的空气质量等级为1的概率为:2162543100100++=;该市一天的空气质量等级为2的概率为:5101227100100++=;该市一天的空气质量等级为3的概率为:67821100100++=; 该市一天的空气质量等级为4的概率为:7209100100++=; (2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:1000.203000.355000.45350x =⨯+⨯+⨯=;(3)根据所给数据,可得下面的22⨯列联表,由表中数据可得:2()100(3383722) 5.820 3.841()()()()70305545n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯, 所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 【点睛】本题考查了独立性检验与频率估计概率,估计平均值的求法,属于中档题.24.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为3)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯= (2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题. 25.(1) 1.534y x =-+;(2)详见解析. 【分析】(1)利用表中数据,分别求得:,x y ,再利用公式求得,b a ,然后写出回归直线方程即可. (2)根据(1)中的回归直线方程,令14x =, 22x =求得相应的y 值,再与实际值结合误差要求比较即可. 【详解】 由表中数据得: ()()1116182018,10747,33x y =++==++= 311610187204366i ii x y==⨯+⨯+⨯=∑,322221161820980ii x==++=∑,。

(完整word版)必修三统计练习题及解答

(完整word版)必修三统计练习题及解答

、选择题1某校有40个班,每班有50人,每班选派3人参加"学代会”,在这个问题中样本容量是 (). 2 .要从已编号(1 — 50)的50枚最新研制的某型号导弹中随机抽取 每部分选取的号码间隔一样的系统抽样方法确定所选取的 5枚导弹的编号可能是(). C. 1 , 2, 3, 4, 5 D. 2, 4, 8, 16, 323•某单位有老年人 27人,中年人54人,青年人81人,为了调查他们身体状况的某项指 标,需从他们中抽取一个容量为 36的样本,适合抽取样本的方法是().A.抽签法B.系统抽样C.随机数表法 D .分层抽样4•为了解某年级女生的身高情况,从中抽出20名进行测量,结果如下:(单位:cm ) 149 159 142 160 156 163 145 150148 151156144 148149 153143 168168 152 155 在列样本频率分布表的过程中,如果设组距为 4 cm ,那么组数为(). A. 4B. 5C. 6D. 75 •右图是由容量为100的样本得到的频率分布直方图. 其中前4组的频率成等比数列,后6组的频数成等差数列,设最行业名称计算机 机械 营销 物流 贸易 应聘人数215 830200 250154 67674 57065 280行业名称计算机 营销 机械 建筑 化工招聘人数124 620 102 935 89 115 76 51670 436若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况, 则根据表中的数据,就业形势一定是(). A.计算机行业好于化工行业 B.建筑行业好于物流行业 C.机械行业最紧张D.营销行业比贸易行业紧张&从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是 1.5 ,第二章统计A. 40B. 50C. 120D. 150 5枚来进行发射试验,用 A. 5, 10, 15, 20, 25 B. 3, 13, 23, 33, 43 10 [(x1 — 20)2 + (x2 — 20)2+…+ (x10 — 20)2]中,数字10和20分别表示(). A.数据的个数和方差 B.平均数和数据的个数 C.数据的个数和平均数D.数据组的方差和平均数7•某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:I. 6 , 1.4 , 1.6 , 1.3 , 1.4 , 1.2 , 1.7 , 1.8(单位:千克).依此估计这240尾鱼的总质量大约是().A. 300克B. 360千克C. 36千克D. 30千克9. 为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为11,12,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是().A. 直线11和12 一定有公共点(s,t)B. 直线l1和l2相交,但交点不-C. 必有直线l1 // l2D. 直线l1和l2必定重合10. 工人工资(元)依相应产值(千元)变化的回归方程为? = 50 + 80x,下列判断正确的是().A. 产值为1 000元时,工资为130元B. 产值提高1 000元时,工资提高80元C. 产值提高1 000元时,工资提高130元D. 当工资为250元时,产值为2 000元二、填空题:II. 某工厂生产A , B, C 三种不同型号的产品,产品数量之比依次为 2 : 3 : 5 .现用分层抽样方法抽出一个容量为n的样本,样本中A种型号的产品有16件,那么此样本的容量n 12. 若总体中含有1 650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除___________ 个个体,编号后应均分为___________ 段,每段有______ 个个体.13. 管理人员从一池塘内捞出30条鱼,做上标记后放回池塘.10天后,又从池塘内捞出50条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内共有______________ 条鱼.14. 已知x, y之间的一组数据:y与x之间的线性回归方程? = bx+ a必过定点 ____________ .15.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一数学分数(x)和初二16. 一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是17•某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?18•某单位有118名员工,为了完成本月的生产任务,现要从中随机抽取16人加班•请用系统抽样法选出加班的人员.19. 写出下列各题的抽样过程:(1 )请从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本.(2 )某车间有189名职工,现在要按1 : 21的比例选派质量检查员,采用系统抽样的方法进行.(3) —个电视台在因特网上就观众对某一节目喜爱的程度进行调查,被调查的总人数为12 000人,其中持各种态度的人数如下:很喜爱喜爱一般不喜爱2435 4 567 3 926 1 072打算从中抽取60人进行详细调查,如何抽取?20. 有一种鱼的身体吸收水银,水银的含量超过1.00 ppm(即百万分之一)时就会对人体产生危害.在30条鱼的样本中发现的水银含量是:0.07 0.24 0.95 0.98 1.02 0.98 1.37 1.40 0.39 1.021.44 1.58 0.54 1.08 0.61 0.72 1.20 1.14 1.62 1.681.85 1.20 0.81 0.82 0.84 1.29 1.262.10 0.91 1.31(1) 用前两位数作为茎,做出样本数据的茎叶图;(2) 描述一下水银含量的分布特点;(3) 从实际情况看,许多鱼的水银含量超标在于有些鱼在出售之前没有被检查过•那么,这种鱼的水银含量的平均水平都比 1.00 ppm大吗?(4) 求出上述样本数据的均值和标准差;(5) 有多少条鱼的水银含量在均值减加两倍标准差的范围内?第二章统计参考答案一、选择题1. C解析:样本容量等于40X 3 = 1 20.2. B解析:根据系统抽样的规则,1到10 一段,11到20 一段,如此类推,每段10个号码,那么每一段上都应该有号码.3. D解析:总体是由差异明显的几部分组成的.4. D解析:由于组距为4 cm,故可分组为142〜146,146〜150, 150- 154,154〜158, 158〜162 , 162〜166, 166〜170.5. A解析:由题意共有100个人.前4组频率成等比数列,由图知:第一组频率为0.01 ;第二组频率为0.03 ;所以a= 0.27 .前 3 组有100X (0.01 + 0.03 + 0.09) = 13 人,后 6 组共87 人,6组人数成等差数列,所以首项为27, s6 = 87,得d =- 5, s4 = 78,即b= 78.6. C1 n々(x- x)2解析:对照公式s2= n y 即可知道.7. B解析:从表中可以看出,计算机行业应聘人数与招聘人数都比较多,但录用率约占58%.化工行业招聘名额70 436虽少,但应聘它的人数少于应聘贸易行业的人数(65 280),录用率大于58%故A不正确.对于建筑行业,应聘人数少于招聘人数,显然好于物流行业.机械行业录用率约46%但物流、贸易招聘人数未知,无法比较得出机械行业最紧张.营销行业招聘人数与应聘人数的比约为 1 : 1.5,但贸易行业招聘数不详,无法比较.& B解析:从草鱼240尾,中任选9尾,这9尾鱼具有代表性,由此可由样本估计总体的情况. 9尾鱼中每尾鱼的平均质量为x= 9(1.5 + 1.6 + 1.4 + 1.6 + 1.3 + 1.4 + 1.2 + 1.7 + 1.8) = 1.5(千克),240 X 1.5 = 360(千克).9. A解析:线性回归直线方程为? = a+ bx,而a= y _bx,即a = t —bs, t = a+ bs .•••(s , t)在回归直线上,即直线l1和l2必有公共点(s , t).10. B解析:回归直线斜率为80,所以x每增加1, ?增加80,即劳动生产率提高1千元时,工资提咼80兀.二、填空题:11. 答案:80.16解析:n= 2 x (2 + 3+ 5)= 80.12. 答案:5; 35; 47.解析:1 650除以35商47余5,•••剔除5个个体.分为35段,每段47个个体.13 .答案:750 .50解析:30 X 2 = 750 (条).14. 答案:(1.167 5 , 2.392 5).解析:必过四组数据的平均数,即(1.167 5 , 2.392 5).15. 答案: y= 1.218x - 14.191 .解析:代入求a, b值的公式,解得? = 1.218x - 14.191 .16. 答案: * = 0.118 1 + 0.003 585x .“ 10 10_ 1 _ 2X =—无x =762,瓦(X i -X) =1 297 860解析:10 i 1 i 1,10y =2.85,二(X i -X)(y i「y) =4 653i 1三、解答题:17. [解析]简单随机抽样一般采用两种方法:抽签法和随机数表法.解法1:(抽签法)将100件轴编号为1, 2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00, 01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个随机数为68, 34, 30, 13, 70, 55, 74, 77, 40, 44,这10个号即所要抽取的样本号.18. 解析:(1)对这118名员工进行编号;118⑵计算间隔k = 16 = 7.375 ,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样.例如我们随机剔除了3, 46, 59, 57 , 112, 93这6名员工,然后再对剩余的112位员工进行编号,计算间隔k = 7;(3)在1〜7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12 ,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.19. 解析:(1)①将总体的500个分数从001开始编号,一直到500号;②从随机数表第1页第1行第2至第4列的347号开始使用该表;③抄录入样号码如下:347 437 386 469 011 410 145 073 245 276 329 050 176 099 061030 227 482 378 096 164 001 068 047 025 212 016 105 443 212④按以上编号从总体中将相应的分数提取出来组成样本,抽样完毕.(2)采取系统抽样.189-21= 9,所以将189人分成9组,每组21人,在每一组中随机抽取1人,这9人组成样本. (3)采取分层抽样.总人数为12 000 人,12 000 - 60 = 200,2 435 4 567200 = 12 …35(人),200 = 22 …167(人),3 926 1 072200 = 19…126(人),200 = 5…72(人).所以从很喜爱的人中剔除35人,再抽取12人;从喜爱的人中剔除167人,再抽取22人;从一般喜爱的人中剔除126人,再抽取19人;从不喜爱的人中剔除72人,再抽取5人. 20. 解析:(1)茎叶图为:⑵汞含量分布偏向于大于 1.00 ppm的方向,即多数鱼的汞含量分布在大于 1.00 ppm的区域.⑶不一定.因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同•即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于 1.00 ppm .⑷样本平均数X疋1.08,样本标准差s~ 0.45 .(5)有28条鱼的汞含量在平均数与两倍标准差的和(差)的范围内.。

(典型题)高中数学必修三第一章《统计》测试(答案解析)

(典型题)高中数学必修三第一章《统计》测试(答案解析)

一、选择题1.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A.2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B.2019年1~4月的业务量同比增长率超过50%,在3月最高C.从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长2.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A.30 B.60C.70 D.803.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.已知x ,y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.137.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .508.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A .消耗1升汽油,乙车最多可行驶5千米B .以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C .甲车以80千米/小时的速度行驶1小时,消耗10升汽油D .某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油 9.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元10.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤ 12.根据如下样本数据 x 3 4 5 6 7 8 y﹣4.0﹣2.50.5﹣0.52.03.0得到的回归方程为y bx a =+,则( ) A .a >0,b <0B .a >0,b >0C .a <0,b <0D .a <0,b >0二、填空题13.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 14.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人.15.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.16.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.17.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 18.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 19.一组样本数据按从小到大的顺序排列为:1-,0,4,x ,y ,14,已知这组数据的平均数与中位数均为5,则其方差为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:(1)根据所给的5组数据,求出关于的线性回归方程ˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推)(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i i x ==∑.24.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格.(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下:用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700i i i x xy y =--=∑,6214126i i x ==∑,61240i i y ==∑,()6218816i i y y=-=∑,8.4≈786≈.25.零部件生产水平是评判一个国家高端装备制造能力的重要标准之一,其中切割加工技术是一项重要技术某精密仪器制造商研发了一种切割设备,用来生产高精度的机械零件,经过长期生产检验,可以认为该设备生产的零件尺寸服从正态分布N (μ,σ2).某机械加工厂购买了该切割设备,在正式投入生产前进行了试生产,从试生产的零件中任意抽取10件作为样本,下面是样本的尺寸x i (i =1,2,3,…,10,单位:mm ):用样本的平均数x 作为μ的估计值,用样本的标准差s 作为σ的估计值.(1)按照技术标准的要求,若样本尺寸均在(μ﹣3σ,μ+3σ)范围内,则认定该设备质量合格,根据数据判断该切割设备的质量是否合格.(2)该机械加工厂将该切割设备投入生产,对生产的零件制定了两种销售方案(假设每种方案对销售量没有影响):方案1:每个零件均按70元定价销售;方案2:若零件的实际尺寸在(99.7,100.3)范围内,则该零件为A 级零件,每个零件定价100元,否则为B 级零件,每个零件定价60元. 哪种销售方案的利润更大?请根据数据计算说明.附:1021ii x =∑≈100601.8,样本方差()22221111n n i i i i s x x x nx n n ==⎛⎫=-=- ⎪⎝⎭∑∑.若X ~N (μ,σ2),则P (μ﹣σ<X <μ+σ)=0.6827,P (μ﹣2σ<X <μ+2σ)=0.9545 26.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniii ii i nni i i i x x y y x y nxybay bx x x x nx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意结合所给的统计图确定选项中的说法是否正确即可. 【详解】对于选项A : 2018年1~4月的业务量,3月最高,2月最低, 差值为439724111986-=,接近2000万件,所以A 是正确的;对于选项B : 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B 是正确的;对于选项C :2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C 是正确的;对于选项D ,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D 错误. 本题选择D 选项. 【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 4.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.5.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.6.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.7.B解析:B分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .8.D解析:D 【详解】解:对于A ,由图象可知当速度大于40km /h 时,乙车的燃油效率大于5km /L , ∴当速度大于40km /h 时,消耗1升汽油,乙车的行驶距离大于5km ,故A 错误; 对于B ,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B 错误; 对于C ,由图象可知当速度为80km /h 时,甲车的燃油效率为10km /L ,即甲车行驶10km 时,耗油1升,故行驶1小时,路程为80km ,燃油为8升,故C 错误; 对于D ,由图象可知当速度小于80km /h 时,丙车的燃油效率大于乙车的燃油效率, ∴用丙车比用乙车更省油,故D 正确 故选D .考点:1、数学建模能力;2、阅读能力及化归思想.9.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1ay bx =-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=,【点睛】本题考查了线性回归方程的求法与应用,属于基础题.10.B解析:B 【解析】 【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】 根据题意可得,,由线性回归方程一定过样本中心点,.故选:B . 【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.11.B解析:B 【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择. 详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y =x d 或y =p +q ln x 较适宜,故选B . 点睛:本题考查散点图以及函数图像,考查识别能力.12.D解析:D 【解析】分析:利用公式求出ˆb,ˆa ,即可得出结论. 详解:样本平均数x =5.5,y =﹣0.25, ∴()()61i i i x x y y =--∑=23,621()i i x x =-∑=17.5,∴ˆb=2317.5=4635>0, ∴ˆa=﹣0.25﹣4635•5.5<0, 故选:D .点睛:求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.14.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.15.【解析】【分析】先求出这个数据的平均数为此时这个数据的方差为由此求出结果【详解】某个数据的平均数为方差为现又加入一个新数据则这个数据的平均数为此时这个数据的方差为故答案为【点睛】本题主要考查了平均数解析:83【解析】 【分析】先求出这9个数据的平均数为5,此时这9个数据的方差为()22183559S ⎡⎤=⨯+-⎣⎦,由此求出结果 【详解】某8个数据的平均数为5,方差为3,现又加入一个新数据5, 则这9个数据的平均数为85559⨯+= ∴此时这9个数据的方差为()2218835593S ⎡⎤=⨯+-=⎣⎦故答案为83【点睛】本题主要考查了平均数和方差的计算公式,属于基础题。

(必考题)高中数学必修三第一章《统计》检测题(含答案解析)

(必考题)高中数学必修三第一章《统计》检测题(含答案解析)

一、选择题1.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变2.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④3.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .984.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .5.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08156.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .157.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元8.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为39.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1310.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三 周四 周五 车流量x (万辆)100102108114116浓度y (微克)78 80 8488 90根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7615.已知一组数据为2,3,4,5,6,则这组数据的方差为______.16.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表: X 10 11.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.17.抽样统计甲、乙两位同学5次数学成绩绘制成如下图所示的茎叶图,则成绩较稳定的那位同学成绩的方差为__________.18.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.19.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.20.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:x1 2 3 4 5 y 7.06.5m3.82.2已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.三、解答题21.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x ty e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10ii v y i ==⋅⋅⋅,经计算得如下数据:xy()1021ii x x =-∑()1021ii yy =-∑uv2621565 26805.36()1021ii uu =-∑()()101iii u u y y =--∑()1021ii v v =-∑()()101iii x x v v =--∑11250130 2.612(2)(ⅰ)根据(1)的选择及表中数据,建立y关于x的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额y为250亿元,请预测2021年的研发资金投入额x为多少亿元?(结果精确到0.01)附:①相关系数12211()()()()ni iinni ii ix x y yrx x y y===--=--∑∑∑,回归直线ˆˆˆy a bx=+中:121()()ˆ()ni iiniix x y ybx x==--=-∑∑,ˆˆa y bx=-②参考数据:ln20.693≈,ln5 1.609≈.22.某企业投资两个新型项目,投资新型项目A的投资额m(单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m=-,投资新型项目B的投资额x(单位:十万元)与纯利润y(单位:万元)的散点图如图所示.(1)求y关于x的线性回归方程;(2)根据(1)中的回归方程,若A,B两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a=+的斜率和截距的最小二乘估计分别为1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x的频率分布表如下:-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80) x的分组[0.20,0)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例;(2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表:x℃272930323335气温()数量y121520272836(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 26.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式。

(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)

(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)

一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.54.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .815. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39 B .42C .45D .507.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64 B .96C .144D .1609.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 14.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________15.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.16.已知一组数据为2,3,4,5,6,则这组数据的方差为______.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:X 1011.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下: 年份 2014 2015 20162017 2018 2019 编号x 1 2 3 4 5 6 数量y (辆)4196116190218275(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位. 参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.23.2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起;与此同时,移动阅读方兴未艾,从侧面反应了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书APP 抽样调查了非一线城市M 和一线城市N 各100名用户的日使用时长(单位:分钟),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.(1)请填写以下22⨯列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?活跃用户 不活跃用户 合计城市M 城市N 合计(2)以频率估计概率,从城市M 中任选2名用户,从城市N 中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望.(3)该读书APP 还统计了2018年4个季度的用户使用时长y (单位:百万小时),发现y 与季度(x )线性相关,得到回归直线为ˆ4ˆyx a =+,已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2019年第一季度(5x =)该读书APP 用户使用时长约为多少百万小时. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.025 0.010 0.005 0.001 0k5.0246.6357.87910.82824.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:s =(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b cd =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.A解析:A 【解析】利用茎叶图、平均数的性质直接求解. 【详解】由一组数据的茎叶图得: 该组数据的平均数为:1(7581858995)855++++=. 故选:A . 【点睛】本题考查平均数的求法,考查茎叶图、平均数的性质等基础知识,考查运算求解能力,是基础题.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x=5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75 【解析】 【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求. 【详解】 ∵4115i i x ==∑,∴154x =, ∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75. 【点睛】本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.14.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.15.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.16.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2 【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1 【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果. 详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.56.15=,5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.76.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1.点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n =-+-++-,标准差s =18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为解析:280 【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑,ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =, 可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位. 【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 23.(1)见解析;(2)见解析;(3) 22.3百万小时 【分析】(1)根据频率分布直方图求数据填入对应表格,再根据卡方公式求2K ,最后对照数据作判断,(2)先确定随机变量取法,再判断从M 城市中任选的2名用户中活跃用户数服从二项分布,从N 城市中任选的1名用户中活跃用户数服从两点分布,进而求得对应概率,列表得分布列,最后根据数学期望公式得期望,(3)先求均值,解得ˆa,再估计5x =对应函数值. 【详解】(1)由已知可得以下22⨯列联表:计算()2220060208040200K 9.5247.8791001001406021⨯⨯-⨯==≈>⨯⨯⨯ , 所以有99.5%的把握认为用户是否活跃与所在城市有关. (2)由统计数据可知,城市M 中活跃用户占35,城市N 中活跃用户占45, 设从M 城市中任选的2名用户中活跃用户数为X ,则3~2,5X B ⎛⎫ ⎪⎝⎭设从N 城市中任选的1名用户中活跃用户数为Y ,则Y 服从两点分布,其中()415P Y ==. 故0,1,2,3ξ=,()()()20221400055125P P X P Y C ξ⎛⎫===⋅==⋅=⎪⎝⎭; ()()()()()2012224321*********555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅+⋅⋅⋅=⎪⎝⎭;()()()()()2122223431572112055555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅⋅+⋅⋅=⎪⎝⎭;()()()222343632155125P P X P Y C ξ⎛⎫===⋅==⋅= ⎪⎝⎭. 故所求ξ的分布列为()428573601232125125125125E ξ=⨯+⨯+⨯+⨯=. (3)由已知可得 2.5x =,又12.3y =,可得12.34ˆ2.5a=⨯+,所以ˆ 2.3a =,所以4 2.3ˆy x =+. 以5x =代入可得ˆ22.3y=(百万小时), 即2019年第一季度该读书APP 用户使用时长约为22.3百万小时. 【点睛】本题考查频率分布直方图、回归直线方程以及分布列和数学期望,考查基本分析求解能力,属中档题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为53)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。

(典型题)高中数学必修三第一章《统计》测试卷(含答案解析)

(典型题)高中数学必修三第一章《统计》测试卷(含答案解析)

一、选择题1.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是()A.5 B.4 C.3 D.22.工人月工资y(元)与劳动生产率x(千元)变化的回归直线方程为=50+80x,下列判断不正确的是()A.劳动生产率为1000元时,工资约为130元B.工人月工资与劳动者生产率具有正相关关系C.劳动生产率提高1000元时,则工资约提高130元D.当月工资为210元时,劳动生产率约为2000元3.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是()A.B.C.D.4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是()A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是( )A .24B .48C .56D .646.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生7.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差8. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A.这10天中有3天空气质量为一级B.从6日到9日 2.5PM日均值逐渐降低C.这10天中 2.5PM日均值的中位数是55D.这10天中 2.5PM日均值最高的是12月6日9.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ˆˆˆy bx a=+,其中ˆˆˆ0.76,b a y bx==-,据此估计,该社区一户收入为15万元家庭年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元10.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92 11.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:时间周一周二周三周四周五车流量x(万辆)100102108114116浓度y (微克)78 8084 88 90根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带 租户业主已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示: 等级A + AB + BB -C + CC -D + DE 分数 7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B 级及以上,平均分是64分,这个班级选考物理学业水平等级考的人数至少为______人.16.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.17.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.18.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________19.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.某食品厂为了检测某批袋装食品的质量,从该批食品中抽取了一个容量为100的样本,测量它们的质量(单位:克).根据数据分为[)92,94,[)94,96,[)96,98,[)99,100,[)100,102,[)102,104,[]104,106七组,其频率分布直方图如图所示.(1)根据频率分布直方图,估计这批袋装食品质量的中位数.(保留一位小数) (2)记产品质量在[)98,102内为优等品,每袋可获利5元;产品质量在[)92,94内为不合格品,每袋亏损2元;其余的为合格品,每袋可获利3元.若该批食品共有10000袋,以样本的频率代替总体在各组的频率,求该批袋装食品的总利润.22.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格. 平均温度C i x ︒ 21 23 25 27 29 31 平均产卵数i y 个711212264115(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下: 每次虫害减产损失(元/公顷)10001400频数46用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本)参考公式和数据:()()()()12211ni iin ni ii ix x y yrx x y y===--=--∑∑∑,()()()121ni iiniix x y ybx x==--=-∑∑,a y bx=-()()61700i iix x y y=--=∑,6214126iix==∑,61240iiy==∑,()6218816iiy y=-=∑,708.4≈,617180786≈.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.高二理科班有60名同学参加某次考试,从中随机抽选出5名同学,他们的数学成绩x 与物理成绩y如下表:(Ⅰ)求y 关于x 的线性回归方程,并估计该班某同学的数学成绩为90分时该同学的物理成绩;(Ⅱ)本次考试中,规定数学成绩达到125分为数学优秀,物理成绩达到100分为物理优秀.若该班数学优秀率与物理优秀率分别为50%和60%,且所有同学中数学优秀但物理不优秀的同学共有6人,请你在答卷页上填写下面22⨯列联表,并判断能否在犯错误的概率不超过0.01的前提下认为数学优秀与物理优秀有关?参考公式及数据:回归直线的系数()()()1122211ˆniiiii i nniii i x y nxy x x y y bxnxx x ====---==--∑∑∑∑,ˆˆay bx =-,154900ni ii x y==∑,()5211000i i x x=-=∑,()()()()()22n ad bc K a b c d a c b d -=++++.()2 6.6350.01P K ≥=, ()210.8280.001P K ≥=. 25.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x 与销售单价y 之间的关系,经统计得到如下数据:(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.26.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在A ,B 试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a 的值,并求综合评分的平均数;(2)若优质花苗数中甲乙两种培育法的比列为1:3,填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:下面的临界值表仅供参考.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.0722.706 3.841 5.024 6.635 7.87910.828(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x +++++++÷=,635=917=6372x x ,∴+⨯∴=,故选D. 2.C解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.3.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个,[10,15)频数为20×0.04×5=4个,[15,20)频数为20×0.02×5=2个,[20,25)频数为20×0.04×5=4个,[25,30)频数为20×0.03×5=3个,[30,35)频数为20×0.03×5=3个,[35,40]频数为20×0.02×5=2个,则对应的茎叶图为A,本题选择A选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.4.D解析:D【分析】根据茎叶图和折线图依次判断每个选项得到答案.【详解】A. 甲得分的极差是28919-=,A错误;B. 乙得分的中位数是161716.52+=,B错误;C. 甲运动员得分在区间[]20,30上有3个,C错误;D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D正确.故选:D.【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.B解析:B【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解.【详解】由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=,又前3个小组的频率之比为1:2:3,所以第二组的频率为20.750.25 6⨯=,所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.6.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.7.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.8.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.9.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.10.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.511.B解析:B 【解析】【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72,a=84﹣0.72×108=6.24,∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.12.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127;128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139; 140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题 解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数. 【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户. 【点睛】 本小题主要考查用样本估计总体,考查频率的计算,属于基础题.14.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000 【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数. 【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人,故答案是:5000. 【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目.15.15【解析】【分析】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人由题意可得:解得:结合xy 可求的最【详解】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人则即又xy 即当且仅当时取得最小值15取得解析:15 【解析】 【分析】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,由题意可得:()70567x 64y 61z 645x y z ⨯+++=⨯+++,解得:z x 10-=,结合x ,y ,z N ∈,可求5x y z +++的最. 【详解】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人, 则()70567x 64y 61z 645x y z ⨯+++=⨯+++, 即z x 10-=, 又x ,y ,z N ∈,即当且仅当x 0=,y 0=,z 10=时,5x y z +++取得最小值15, 取得A 成绩的0人,取得B +成绩的0人,取得B 成绩的10人, 这个班级选考物理学业水平等级考的人数至少为15人, 故答案为15 【点睛】本题考查了实际问题通过数学问题解决,考查了阅读理解及数学建模的能力,属中档题.16.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=, 222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.17.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归解析:16-【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值 【详解】 由已知,()12101210330x x x y y y +++=+++=()12101310x x x x ∴=⨯+++= ()12101110y y y y =⨯+++=代入回归直线方程可得:3132b =+ 解得16b =-故答案为16- 【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果18.【详解】分析:将数据由小到大排列好根据众数中位数平均数的概念得到相应的数据即可详解:根据提干得到中位数为b=15众数为c=17平均数为=a 故故答案为点睛:这个题目考查了中位数众数平均数的概念和计算较解析:a b c <<. 【详解】分析:将数据由小到大排列好,根据众数,中位数,平均数的概念得到相应的数据即可. 详解:根据提干得到中位数为b=15,众数为c=17,平均数为10+12+28+30+16+51=14.710=a.故 a b c <<. 故答案为a b c <<.点睛:这个题目考查了中位数,众数,平均数的概念和计算,较为基础,众数即出现次数最多的数据,中位数即最中间的数据,平均数即将所有数据加到一起,除以数据个数.19.240【解析】该校2000名男生中体重在的人数为解析:240 【解析】该校2000名男生中体重在()7078kg ~的人数为2000(0.020.01)4240⨯+⨯=.20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15【解析】依次选取两个数字为23,75,93,21,15,04,…… 所以选出来的第3个个体的编号为15.三、解答题21.(1)99.6;(2)35600元. 【分析】(1)根据频率分布直方图中的中位数在长方形面积为0.5的地方取得得解. (2)求出批食品中优等品、不合格品、合格品的袋数得总利润. 【详解】(1)因为(0.020.040.12)20.360.5,0.360.0920.540.5++⨯=<+⨯=>, 所以样本质量的中位数在[98,100)内.设样本质量的中位数为m ,则980.0920.360.52m -⨯⨯+=, 解得99.6m ≈,故这批袋装食品质量的中位数为99.6.(2)由题意可得,这批食品中优等品有10000(0.090.10)23800⨯+⨯=袋, 这批食品中不合格品有100000.022400⨯⨯=袋, 这批食品中合格品有1000038004005800--=袋.故该批袋装食品的总利润为3800558003400235600⨯+⨯-⨯=元. 【点睛】频率分布直方图中的中位数求法在长方形面积为0.5的地方取得是解题关键,属于基础题. 22.(Ⅰ)具有较强的线性相关关系,10220y x =-;(Ⅱ)330元 【分析】(Ⅰ)代入公式计算r ,再做判断,根据公式求,b a ,即得结果;(Ⅱ)先确定温度达到28C ︒以上时概率,再确定随机变量取法,分别求出对应概率,最后根据数学期望公式求结果. 【详解】 (Ⅰ)21232527293171121226411526,4066x y ++++++++++=======()()7000.75786niix x y y r --==>=>∑所以潜叶蝇的平均产卵数y 与平均温度x 具有较强的线性相关关系,()()()1217001070nii i ni i xx y y b x x==--===-∑∑,401026220a y bx =-=-⨯=- 10220y bx a x ∴=+=-;(Ⅱ)()12528,2P ξ<≤=()C ξ︒近似地服从正太分布()226.5,N σ,()()12528128,24P P ξξ-<≤∴>==0,1200,1600Y =13141163(0)1,(1200),(1600)444101041020P Y P Y P Y ==-===⨯===⨯= 313()01200140033041020E Y =⨯+⨯+⨯=(元)【点睛】本题考查线性回归方程、数学期望公式、正态分布,考查综合分析求解能力,属中档题. 23.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数; (4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户).(4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.24.(Ⅰ)ˆ0.918yx =-,估计该班某同学的数学成绩为90分时该同学的物理成绩为63分;(Ⅱ)能在犯错误的概率不超过0.01的前提下认为数学优秀与物理优秀有关. 【分析】(Ⅰ)由已知求得ˆb与ˆa 的值,可得y 关于x 的线性回归方程,取90x =求得y 值即可; (Ⅱ)由题意填写22⨯列联表,求得2K 的值,结合临界值表得结论. 【详解】解:(Ⅰ)1(140130*********)1205x =++++=,1(110901008070)905y =++++=. 515222221()()2020100010(10)(10)(20)(20)900ˆ0.92010(10)(20)1000()iii ii x x yy bx x ==--⨯+⨯+⨯+-⨯-+-⨯-====++-+--∑∑,ˆˆ900.912018ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ0.918y x =-,取90x =,得ˆ0.9901863y=⨯-=. ∴估计该班某同学的数学成绩为90分时该同学的物理成绩为63分;(Ⅱ)由题意填写22⨯列联表:260(2418612)10 6.63536243030K ⨯-⨯==>⨯⨯⨯,∴能在犯错误的概率不超过0.01的前提下认为数学优秀与物理优秀有关.【点睛】本题考查线性回归方程的求法,考查独立性检验,考查计算能力,属于中档题. 25.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元.【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程; (2)将88x =代入(1)中的回归方程,求出y ,然后用25.8y和1比较即可判断; (3)将85x =代入回归方程估计出单价,即可计算出收入.【详解】(1)由题意,得3848586878585x ++++==, 16.818.820.822.82420.645y ++++==, 则515222156169.655820.641840.1841782055810005i i i i i x y x y b xx ==-⋅-⨯⨯====-⨯-∑∑, 20.640.184589.968a y bx =-=-⨯=,故所求回归方程为0.1849.968y x =+;(2)当88x =时,0.184889.96826.16y =⨯+=,所以26.1625.80.361-=<,所以所求回归直线方程是有效可靠的;(3)当85x =,0.184859.96825.608y =⨯+=,所以25.60898025095.84⨯=(元),所以该果园预计收入25095.84元.【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题.26.(1)0.04,81;(2)列联表见解析,有99%的把握认为优质花苗与培育方法有关【分析】(1)利用频率和为1列方程求出a 的值,再利用直方图平均值公式计算平均值;(2)由(1)结合直方图求出有关数据,可填写列联表,计算观测值,对照临界值得出结论.【详解】(1)因为(0.0050.0100.0250.020)101a ++++⨯=,解得0.040a =,综合评分的平均数为,(0.005550.010650.025750.040850.02095)1081⨯+⨯+⨯+⨯+⨯⨯=。

(易错题)高中数学必修三第一章《统计》测试题(包含答案解析)

(易错题)高中数学必修三第一章《统计》测试题(包含答案解析)

一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,15a a>得到一组新3.一组数据的平均数为x,方差为2s,将这组数据的每个数都乘以()0数据,则下列说法正确的是()A.这组新数据的平均数为x B.这组新数据的平均数为a x+C.这组新数据的方差为2as D.这组新数据的标准差为2a s4.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为29,则抽到的32人中,编号200,480的人数为落入区间[]A.7 B.9 C.10 D.125.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是()A.抽样表明,该校有一半学生为阅读霸B .该校只有50名学生不喜欢阅读C .该校只有50名学生喜欢阅读D .抽样表明,该校有50名学生为阅读霸6.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,47.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .508.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10 B .11C .12D .139.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.已知x ,y 的取值如表: x 2 6 7 8y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.为了考察两个变量x和y之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是()A.直线l1和l2有交点(s,t)B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.18二、填空题13.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.14.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为__________.15.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是____________.16.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.17.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.18.已知一组数据为2,3,4,5,6,则这组数据的方差为______.19.一组样本数据按从小到大的顺序排列为:1 ,0,4,x,y,14,已知这组数据的平均数与中位数均为5,则其方差为__________.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iii ni ni x x y y bay bx x x ==--==--∑∑ 22.某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得到数据如下表: 企业abcdefghij满意度x (%) 21 33 24 20 25 21 24 23 25 12 投资额y (万元)79868978767265625944y x (2)约定:投资额y 关于满意度x 的相关系数r 的绝对值在0.7以上(含0.7)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那一所企业,求关闭此企业后投资额y 关于满意度x 的线性回归方程(精确到0.1).参考数据:22.8x =,71y =,1022110248i i x x =-≈∑,643.7,10110406i i i x y x y =-=∑,222851984=,2287116188⨯=.附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆni ii nii x ynx y bxnx==-=-∑∑,ˆˆay bx =-.线性相关系数ni ix y nx yr -=∑.23.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:(1)根据所给的5组数据,求出关于的线性回归方程ˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑24.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑25.某土特产销售总公司为了解其经营状况,调查了其下属各分公司月销售额和利润,得到数据如下表:在统计中发现月销售额x 和月利润额y 具有线性相关关系.(Ⅰ)根据如下的参考公式与参考数据,求月利润y 与月销售额x 之间的线性回归方程; (Ⅱ)若该总公司还有一个分公司“雅果”月销售额为10万元,试求估计它的月利润额是多少?(参考公式:1221ni i i n i i x y nx y b x nx==-⋅=-∑∑,a y b x =-,其中:1112niii x y ==∑,21200)nii x==∑.26.经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y (万元)、年份及其编号t ,有如下统计资料:y 9.5 12.2 14.6 17.4 19.6 m已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y 与年份编号t 呈线性相关关系.(1)求2019年该公司的经营费用;(2)y 关于t 的回归方程为 2.6y t a =+,求a ,并预测2020年所需要支出的经营费用; (3)该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润=销售利润-经营费用).【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58yx =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.C解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 3.D解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s , 则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x x x xx xx xx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axax axax axax axax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.4.C解析:C 【分析】根据系统抽样的定义,可知抽到的号码数可组成一个以301=-n a n 为通项公式的等差数列,令*200301480,≤-≤∈n n N ,解不等式可得结果. 【详解】每组人数=9603230÷=人,即抽到号码数的间隔为30,因为第一组抽到的号码为29,根据系统抽样的定义,抽到的号码数可组成一个等差数列,且*2930(1)301,=+-=-∈n n n n N a ,令200301480≤-≤n ,得2014813030≤≤n ,可得n 的取值可以从7取到16,共10个,故选C . 【点睛】本题主要考查系统抽样的定义及应用,转化为等差数列是解决本题的关键.5.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.6.C解析:C 【解析】分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.7.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果.详解:因为2523.52220.5330333639122,344442x y++++++====,所以1348022,3224ˆb-==-所以19(2)8042y=⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b,写出回归方程,回归直线方程恒过点(,)x y.8.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.A解析:A【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可.【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95,所以中位数为90+91=90.52,故选A.【点睛】本题主要考查了中位数,茎叶图,属于中档题. 10.B解析:B【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标.【详解】根据题意可得,,由线性回归方程一定过样本中心点,.故选:B.【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.11.A解析:A【分析】由题意知,两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,所以两组数据的样本中心点是(s,t),回归直线经过样本的中心点,得到直线l1和l2都过(s,t).【详解】∵两组数据变量x的观测值的平均值都是s,对变量y的观测值的平均值都是t,∴两组数据的样本中心点都是(s,t)∵数据的样本中心点一定在线性回归直线上,∴回归直线l1和l2都过点(s,t)∴两条直线有公共点(s,t)故选A.【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x与Y之间的关系,这条直线过样本中心点.12.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C. 【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.二、填空题13.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4 【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=. 若13x =时,则()()()()2222234577774x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0, 此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9, 此时12345,,,,x x x x x 为4,6,7,8,10,符合题意. 故答案为:4 【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题.14.8【分析】先设五个班的人数分别为样本平均数为5又因样本方差为4则代入大于且不相等的整数可得的值依次为24568即可得最大值【详解】解:设五个班的人数分别为则则所以的值依次为24568即有最大值为8故解析:8 【分析】先设五个班的人数分别为1a ,2a ,3a ,4a ,5a ,样本平均数为5,1234525a a a a a ++++=,又因样本方差为4,则()()()()()22222123455555520a a a a a -+-+-+-+-=,代入大于0且不相等的整数,可得1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8,即可得最大值. 【详解】解:设五个班的人数分别为1a ,2a ,3a ,4a ,5a , 则()12345155a a a a a ++++=, 15()()()()()2222212345555554a a a a a ⎡⎤-+-+-+-+-=⎣⎦, 则1234525a a a a a ++++=,()()()()()22222123455555520a a a a a -+-+-+-+-=,所以1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8, 即有最大值为8. 故答案为: 8 【点睛】本题考查利用平均数公式和方差公式求样本数据中的最大值,是基础题.合理应用公式是关键.15.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论16.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.17.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果. 详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.18.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.19.【解析】分析:根据中位数为求出是代入平均数公式可求出从而可得出平均数代入方差公式得到方差详解中位数为这组数据的平均数是可得这组数据的方差是故答案为点睛:本题主要考查平均数与方差属于中档题样本数据的算 解析:743【解析】分析:根据1,0,4,,,14x y -中位数为5,,求出x 是6 ,代入平均数公式,可求出7y =,从而可得出平均数,代入方差公式,得到方差. 详解1,0,4,,7,14x -中位数为45,52x+∴=,6x ∴=,∴这组数据的平均数是10461456y -+++++=,7y =可得这组数据的方差是()17436251148163+++++=,故答案为743. 点睛:本题主要考查平均数与方差,属于中档题.样本数据的算术平均数公式为12n 1(x +x +...+x )x n=.样本方差2222121[()()...()]n s x x x x x x n =-+-++-,标准差222121[()()...()]n s x x x x x x n=-+-++-. 20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(1)171277y =⨯;(2)该小组所得线性回归方程是理想的. 【分析】(1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论. 【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=,故有()()520(1)2513(3)(7)34iii x x y y =--=⨯-+⨯+⨯+-⨯-=∑,()5222222021(3)14ii x x =-=+++-=∑,34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=, 1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的. 【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论. 22.(1)0.63;(2)ˆ0.757.4yx =+. 【分析】(1)代入公式即可得出结果.(2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业.重新计算,代入公式即可求出结果. 【详解】(1)由题意,根据相关系数的公式,可得10104060.63643.7i ix yx yr -=≈≈∑ (2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业. 重新计算得22.810122162499x ⨯-'===,7110446667499y ⨯-'===, 922222192481022.812924118.4i i xx ='-≈+⨯--⨯=∑, 9194061022.87112449247482iii x yx y =''-≈+⨯⨯-⨯-⨯⨯=∑.所以919221982ˆ0.690.7118.49i ii ii x yx y bxx ==''-=≈≈≈'-∑∑, ˆˆ740.692457.4457.4ay bx ''=-≈-⨯=≈. 所以所求线性回归方程为ˆ0.757.4yx =+. 23.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii ii x y x yb xx==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩, 所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题. 24.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程; (2)将15x =代入回归直线方程即可求得结果. 【详解】 (1)1234535x ++++==,5678107.25++++==y51120i ii x y==∑,522222211234555i i x ==++++=∑25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题.25.(1)ˆ0.50.4yx =+(2)5.4万元 【解析】 试题分析:(1)首先由题意求得平均数6, 3.4x y ==,然后利用系数公式计算可得回归方程为0.5.4ˆ0yx =+ .(2)由题意结合(1)中的结论预测可得“雅果”分公司的月利润额是5.4万元. 试题(Ⅰ) 由已知数据计算得:5n =,6, 3.4x y ==1221511256 3.40.5,20056653.40.560.4ni i i n i i x y xy b x x a ==--⨯⨯===-⨯⨯-=-⨯=∑∑∴线性回归方程为0.5.4ˆ0yx =+ (Ⅱ)将x =10代入线性回归方程中得到0.5100.4ˆ 5.4y=⨯+=(万元) ∴估计“雅果”分公司的月利润额是5.4万元26.(1)22.7万元;(2)6.9;25.1万元;(3)254.9万元. 【分析】(1)根据均值定义列式计算;(2)求出t ,代入方程可得a ,令7t =代入可得估计值;(3)由频率分布直方图是三种产品的概率,得三种产品的件数,根据各产品赢利可计算出总赢利,注意减去(2)中估计的经营费用. 【详解】 (1)9.512.214.617.419.6166my +++++==.解得22.7m =,即2019年该公司的经营费用为22.7万元. (2) 3.5t =,16y =,所以 2.6 6.9a y t =-=,取7t =,代入得25.1y =,预测2020年所需要支出的经营费用为25.1万元. (3)由图可得生产优质品的概率是0.1,生产合格品的概率是0.79,生产次品的概率是0.11,则预测该公司2020年的总利润为1.50.15000.70.79500 1.30.1150025.1254.9⨯⨯+⨯⨯-⨯⨯-=(万元). 【点睛】本题考查线性回归方程及其应用,考查频率分布直方图及其期望,考查学生的数据处理能力,运算求解能力,属于中档题.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章 统计一、选择题1.某校有40个班,每班有50人,每班选派3人参加“学代会”,在这个问题中样本容量是( ).A .40B .50C .120D .1502.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ). A .5,10,15,20,25 B .3,13,23,33,43 C .1,2,3,4,5 D .2,4,8,16,323.某单位有老年人27人,中年人54人,青年人81人,为了调查他们身体状况的某项指标,需从他们中抽取一个容量为36的样本,适合抽取样本的方法是( ). A .抽签法 B .系统抽样 C .随机数表法 D .分层抽样 4.为了解某年级女生的身高情况,从中抽出20名进行测量,结果如下:(单位:cm) 149 159 142 160 156 163 145 150 148 151 156 144 148 149 153 143 168 168 152 155在列样本频率分布表的过程中,如果设组距为4 cm ,那么组数为( ). A .4 B .5 C .6 D .75.右图是由容量为100的样本得到的频率分布直方图.其中前4组的频率成等比数列,后6组的频数成等差数列,设最大频率为a ,在4.6到5.0之间的数据个数为b ,则a ,b 的值分别为( ). A .0.27,78 B .0.27,83 C .2.7,784 D .2.7,836.在方差计算公式s2=101[(x1-20)2+(x2-20)2+…+(x10-20)2]中,数字10和20分别表示( ).A .数据的个数和方差B .平均数和数据的个数C .数据的个数和平均数D .数据组的方差和平均数7.某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:行业名称 计算机 机械 营销 物流 贸易 应聘人数 215 830200 250154 67674 57065 280行业名称 计算机 营销 机械 建筑 化工 招聘人数124 620102 93589 11576 51670 436若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中的数据,就业形势一定是( ).A .计算机行业好于化工行业B .建筑行业好于物流行业C .机械行业最紧D .营销行业比贸易行业紧8.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A.300克B.360千克C.36千克D.30千克9.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说确的是( ). A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t)C.必有直线l1∥l2D.直线l1和l2必定重合10.工人工资(元)依相应产值(千元)变化的回归方程为yˆ=50+80x,下列判断正确的是( ).A.产值为1 000元时,工资为130元B.产值提高1 000元时,工资提高80元C.产值提高1 000元时,工资提高130元D.当工资为250元时,产值为2 000元二、填空题:11.某工厂生产 A,B,C 三种不同型号的产品,产品数量之比依次为 2∶3∶5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号的产品有16件,那么此样本的容量n =___________.12.若总体中含有1 650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除________个个体,编号后应均分为_________段,每段有______个个体.13.管理人员从一池塘捞出30条鱼,做上标记后放回池塘.10天后,又从池塘捞出50条鱼,其中有标记的有2条.根据以上数据可以估计该池塘共有_______条鱼.14x 1.08 1.12 1.19 1.28y 2.25 2.37 2.40 2.55y与x之间的线性回归方程yˆ=bx+a 必过定点_________.15.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一数学分数(x)和初二数学分数(y)如下:x 74 71 72 68 76 73 67 70 65 74 y 76 75 71 70 76 79 65 77 62 72初一和初二数学分数间的回归方程为___________.16.一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是___________.x 825 215 1 070 550 480 920 1 350 325 670 1 215y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0三、解答题:17.某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?18.某单位有118名员工,为了完成本月的生产任务,现要从中随机抽取16人加班.请用系统抽样法选出加班的人员.19.写出下列各题的抽样过程:(1)请从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本.(2)某车间有189名职工,现在要按1∶21的比例选派质量检查员,采用系统抽样的方法进行.(3)一个电视台在因特网上就观众对某一节目喜爱的程度进行调查,被调查的总人数为12 000人,其中持各种态度的人数如下:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 072打算从中抽取60人进行详细调查,如何抽取?20.有一种鱼的身体吸收水银,水银的含量超过 1.00 ppm(即百万分之一)时就会对人体产生危害.在30条鱼的样本中发现的水银含量是:0.07 0.24 0.95 0.98 1.02 0.98 1.37 1.40 0.39 1.021.44 1.58 0.54 1.08 0.61 0.72 1.20 1.14 1.62 1.681.85 1.20 0.81 0.82 0.84 1.29 1.262.10 0.91 1.31(1)用前两位数作为茎,做出样本数据的茎叶图;(2)描述一下水银含量的分布特点;(3)从实际情况看,许多鱼的水银含量超标在于有些鱼在出售之前没有被检查过.那么,这种鱼的水银含量的平均水平都比1.00 ppm大吗?(4)求出上述样本数据的均值和标准差;(5)有多少条鱼的水银含量在均值减加两倍标准差的围?第二章 统计 参考答案 一、选择题 1.C解析:样本容量等于40×3=120. 2.B解析:根据系统抽样的规则,1到10一段,11到20一段,如此类推,每段10个,那么每一段上都应该有. 3.D解析:总体是由差异明显的几部分组成的. 4.D解析:由于组距为4 cm ,故可分组为142~146,146~150,150~154,154~158,158~162,162~166,166~170. 5.A解析:由题意共有100个人.前4组频率成等比数列,由图知:第一组频率为0.01;第二组频率为0.03;所以a =0.27.前3组有100×(0.01+0.03+0.09)=13人,后6组共87人,6组人数成等差数列,所以首项为27,s6=87,得d =-5,s4=78,即b =78. 6.C解析:对照公式s2=∑=ni i x -x n121)(即可知道.7.B解析:从表中可以看出,计算机行业应聘人数与招聘人数都比较多,但录用率约占58%.化工行业招聘名额70 436虽少,但应聘它的人数少于应聘贸易行业的人数(65 280),录用率大于58%,故A 不正确.对于建筑行业,应聘人数少于招聘人数,显然好于物流行业.机械行业录用率约46%,但物流、贸易招聘人数未知,无法比较得出机械行业最紧.营销行业招聘人数与应聘人数的比约为1∶1.5,但贸易行业招聘数不详,无法比较. 8.B 解析:从草鱼240尾,中任选9尾,这9尾鱼具有代表性,由此可由样本估计总体的情况.9尾鱼中每尾鱼的平均质量为x =91(1.5+1.6+1.4+1.6+1.3+1.4+1.2+1.7+1.8)=1.5(千克), 240×1.5=360(千克). 9.A解析:线性回归直线方程为y ˆ=a +bx ,而a =x b y -,即a =t -bs ,t =a +bs .∴(s ,t)在回归直线上,即直线l1和l2必有公共点(s ,t). 10.B解析:回归直线斜率为80,所以x 每增加1,y ˆ增加80,即劳动生产率提高1千元时,工资提高80元. 二、填空题: 11.答案:80.解析:n =216×(2+3+5)=80. 12.答案:5;35;47.解析:1 650除以35商 47余5, ∴ 剔除5个个体.分为35段,每段47个个体. 13.答案:750.解析:30×250=750 (条). 14.答案:(1.167 5,2.392 5). 解析:必过四组数据的平均数, 即(1.167 5,2.392 5). 15.答案:y ˆ=1.218x -14.191.解析:代入求a ,b 值的公式,解得 y ˆ=1.218x -14.191. 16.答案:y ˆ=0.118 1+0.003 585x . 解析:∑∑===-==10121018602971)(762101i ii ix x ,xx ,6534))((85.2101=--=∑=i iiy y x x ,y .三、解答题:17.[解析] 简单随机抽样一般采用两种方法:抽签法和随机数表法.解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这10个号签对应的轴的直径. 解法2:(随机数表法)将100件轴编号为00,01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个随机数为68,34,30,13,70,55,74,77,40,44,这10个号即所要抽取的样本号. 18.解析:(1)对这118名员工进行编号;(2)计算间隔k =16118=7.375,由于k 不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样.例如我们随机剔除了3,46,59,57,112,93这6名员工,然后再对剩余的112位员工进行编号,计算间隔k =7;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.19.解析:(1)①将总体的500个分数从001开始编号,一直到500号; ②从随机数表第1页第1行第2至第4列的347号开始使用该表; ③抄录入样如下:347 437 386 469 011 410 145 073 245 276 329 050 176 099 061030 227 482 378 096 164 001 068 047 025 212 016 105 443 212 ④按以上编号从总体中将相应的分数提取出来组成样本,抽样完毕. (2)采取系统抽样.189÷21=9,所以将189人分成9组,每组21人,在每一组中随机抽取1人,这9人组成样本.(3)采取分层抽样.总人数为12 000人,12 000÷60=200, 2004352=12…35(人),2005674=22…167(人),2009263=19…126(人),2000721=5…72(人).所以从很喜爱的人中剔除35人,再抽取12人;从喜爱的人中剔除167人,再抽取22人;从一般喜爱的人中剔除126人,再抽取19人;从不喜爱的人中剔除72人,再抽取5人. 20.解析: (1)茎叶图为:茎 叶 0.0 7 0.2 4 0.3 9 0.5 4 0.6 1 0.7 2 0.8 124 0.9 1588 1.0 228 1.1 4 1.2 0069 1.3 17 1.4 04 1.5 8 1.6 28 1.8 5 2.1(2)汞含量分布偏向于大于1.00 ppm的方向,即多数鱼的汞含量分布在大于1.00 ppm的区域.(3)不一定.因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同.即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于1.00 ppm.(4)样本平均数x≈1.08,样本标准差s≈0.45.(5)有28条鱼的汞含量在平均数与两倍标准差的和(差)的围.。

相关文档
最新文档