(完整word)高一数学必修3统计测试题
(好题)高中数学必修三第一章《统计》测试卷(答案解析)(4)
一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,152.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量3.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277;②5,9,100,107,121,180,195,221,265,299;③11,41,71,101,131,161,191,221,251,281;④31,61,91,121,151,181,211,241,271,299.关于上述样本的下列结论中,正确的是()A.②④都不能为分层抽样B.①③都可能为分层抽样C .①④都可能为系统抽样D .②③都不能为系统抽样4.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格99.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.55.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .986.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .507.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08158.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >9.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5010.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元11.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .712.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=14.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.15.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中B 高中C 高中D 高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.16.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.17.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
高中数学必修3统计测试题及其答案
高中数学必修 3 第二章(统计)检测题班级姓名得分一、选择题:(此题共 10 小题,每题 3 分,共 30 分,在每题给出的四个选项中,只有一项为哪一项切合题目要求的)1.某单位有老年人28 人,中年人 54 人,青年人 81 人.为了检查他们的身体状况,需从他们中抽取一个容量为36 的样本,最适合抽取样本的方法是( D ).A .简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,而后分层抽样2.10 名工人某天生产同一部件,生产的件数是15,17,14, 10,15, 17,17,16,14,12.设其均匀数为a,中位数为 b,众数为 c,则有 ( D).A .a>b>c B. b>c>a C. c>a>b D.c>b>a3.以下说法错误的选项是 ( B ).A.在统计里,把所需观察对象的全体叫作整体B.一组数据的均匀数必定大于这组数据中的每个数据C.均匀数、众数与中位数从不一样的角度描绘了一组数据的集中趋向D.一组数据的方差越大,说明这组数据的颠簸越大4.以下说法中,正确的选项是 ( C ).A .数据 5,4,4,3,5,2 的众数是 4B.一组数据的标准差是这组数据的方差的平方C.数据 2,3,4,5 的标准差是数据 4,6,8,10 的标准差的一半D.频次散布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别随意抽出10 名学生进行英语口语测试,其测试成绩的方差分别2 2 .,则.为 S1 , 2A )= 13.2 S =26 26(A .甲班 10 名学生的成绩比乙班10 名学生的成绩齐整B.乙班 10 名学生的成绩比甲班10 名学生的成绩齐整C.甲、乙两班 10 名学生的成绩同样齐整D.不可以比较甲、乙两班10 名学生成绩的齐整程度6.以下说法正确的选项是 ( C ).A.依据样本预计整体,其偏差与所选择的样本容量没关B.方差和标准差拥有同样的单位2 2 2 2 是错的D.假如容量同样的两个样本的方差知足12 ,那么推得整体也知足S1 2S <S <S 7.某同学使用计算器求 30 个数据的均匀数时,错将此中一个数据 105 输人为 15,那么由此求出的均匀数与实质均匀数的差是( B ).A.3.5 B.-3 C. 3 D. -0.58.在一次数学测试中,某小组14 名学生疏别与全班的均匀分85 分的差是: 2,3,-3,-5, 12,12,8,2,-1,4,-10,-2, 5, 5,那么这个小组的均匀分是(B)分.A .97.2 B. 87.29 C. 92.32 D.82.869.某题的得分状况以下:此中众数是 ( C ).得分 /分0 1 2 3 4百分率 /(%) 37.0 8.6 6.0 28.2 20.2A .37.0%B. 20.2%C.0 分D.4 分10.假如一组数中每个数减去同一个非零常数,则这一组数的( 10 ).A .均匀数不变,方差不变B.均匀数改变,方差改变C.均匀数不变,方差改变D.均匀数改变,方差不变11.为检查参加运动会的 1 000 名运动员的年纪状况,从中抽查了 100 名运动员的年纪,就这个问题来说,以下说法正确的选项是A . 1 000 名运动员是整体C.抽取的 100 名运动员是样本( A)B.每个运动员是个体D.样本容量是 10012.为了检查某产品的销售状况,销售部门从部下的92 家销售连锁店中抽取30 家认识情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为( A )A.3,2B.2,3C.2,30D.30,213.某城区有农民、工人、知识分子家庭合计 2 000 家,此中农民家庭 1 800 户,工人家庭100 户.现要从中抽取容量为40 的样本,检查家庭收入状况,则在整个抽样过程中,能够用到以下抽样方法(D)①简单随机抽样;②系统抽样;③分层抽样.A .②③ B.①③ C.③ D.①②③ 14.以下说法不正确的选项是 ( A )A.频次散布直方图中每个小矩形的高就是该组的频次B.频次散布直方图中各个小矩形的面积之和等于 1C.频次散布直方图中各个小矩形的宽同样大D.频次散布直方图能直观地表示样本数据的散布状况15.容量为 20 的样本数据,分组后的频数以下表:分组[10,20) [20,30) [30,40) [40,50) [50,60) [60,70)频数 2 3 4 5 4 2则样本数据落在区间 [10,40)的频次为 ( B )A . 0.35 B.0.45 C.0.55 D.0.6516.已知 10 名工人生产同一部件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为 a,中位数为 b,众数为 c,则有 ( D )A . a>b>c B.a>c>b C.c>a>b D.c>b>a17. 已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为(B )A . 1 B. 2 C. 3 D.218.如图是 2012 年某校举行的元旦诗歌朗读竞赛中,七位评委为某位选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的均匀数和方差分别为(C)A . 84,4.84B .84,1.6C.85,1.6D.85,0.419.某中学有高中生 3500 人,初中生 1500 人.为认识学生的学习状况,用分层抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则 n 为( A) A.100B .150C .200D .25020.样本容量为100 的频次散布直方图以下图.依据样本的频次散布直方图预计样本数据落在 [6, 10)内的频数为 a,样本数据落在 [2,10)内的频次为 b,则 a, b 分别是 ( A )A .32,0.4 B.8,0.1C. 32,0.1 D.8,0.4二、填空题:(此题共 4 小题,每题 3 分,共 12 分)21.一个企业共有 240 名职工,下设一些部门,要采纳分层抽样方法从全体职工中抽取一个容量为20的样本.已知某部门有 60名职工,那么从这一部门抽取的职工人数是5。
高中数学必修三--统计-含答案解析--zhy365
高中数学必修三--统计卷I(选择题)一、选择题(本题共计 12 小题,每题 5 分,共计60分,)1. 下列调查中,适合用全面调查方式的是()A.了解某班学生“50米跑”的成绩B.了解一批灯泡的使用寿命C.了解一批炮弹的杀伤半径D.了解一批袋装食品是否含有防腐剂2. 某单位200名职工中,年龄在50岁以上占20%,40∼50岁占30%,40岁以下占50%;现要从中抽取40名职工作样本.若用系统抽样法,将全体职工随机按1∼200编号,并按编号顺序平均分为40组(1∼5号,6∼10号,…,196∼200号).若第5组抽出的号码为22,则第8组抽出的号码应是①;若用分层抽样方法,则40岁以下年龄段应抽取②人.①②两处应填写的数据分别为()A.82,20B.37,20C.37,4D.37,503. 某学校有教师160人,其中有高级职称的32人,中级职称的56人,初级职称的72人.现抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数应为()A.4B.6C.7D.94. 2013年中国政府提出共建丝绸之路经济带,受到了世界各国的高度重视和积极响应,并提出打造海上丝绸之路的总体规划,被简称为“一带一路”.经调查,沿线某地区自2013年到2019年经过6年的经济新建设,经济收入增加了3倍.为更好地了解该地区经济收入变化情况,统计了该地区建设前后经济收入构成比例,得到如下表格:则2019年与2013年经济收入相比较,下面结论中正确的是( )A.石油出口收入减少B.其他收入增加了三倍以上C.百姓购物收入增加了三倍D.百姓购物收入与教育文化收入的总和超过了经济收入的一半的样本,若采用系统抽样,则分段的间隔k为()A.50B.60C.30D.406. 如图是某社区工会对当地企业工人月收入情况进行一次抽样调查后画出的频率分布直方图,其中第二组月收入在[1.5, 2)千元的频数为300,则此次抽样的样本容量为()A.1000B.2000C.3000D.40007. 一样本的所有数据分组及频数如下:[−0.5, 0.5),C50;[0.5, 1.5),C51;[1.5, 2.5),C52;[2.5, 3.5),C53;[3.5, 4.5),C54;[4.5, 5.5),C55.则在[1.5, 4.5)的频率为()A.5 8B.12C.2532D.15168. 2019年,全国各地区坚持稳重求进工作总基调,经济运行总体平稳,发展水平迈上新台阶,发展质量稳步上升,人民生活福祉持续增进,全年最终消费支出对国内生产总值增长的贡献率为57.8%.下图为2019年居民消费价格月度涨跌幅度:(同比=本期数−去年同期数去年同期数×100%,环比=本期数−上期数上期数×100%),下列结论中不正确的是()A.2019年第三季度的居民消费价格一直都在增长B.2018年7月份的居民消费价格比同年8月份要低一些C.2019年全年居民消费价格比2018年涨了2.5%以上D.2019年3月份的居民消费价格全年最低A.数据4、4、6、7、9、6的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数10. 某中学就到校的方式问题对初三年级的所有学生进行了一次调查,并将调查结果制作了扇形统计图,已知步行的人数为60,则初三学生乘公交车的人数为( )A.60B.78C.132D.911. 绘制1000人的寿命直方图时,若组距均为20,60∼80岁范围的纵轴高为0.03,则60∼80岁的人数为()A.300B.500C.600D.80012. 以下两个图表是2019年初的4个月我国四大城市的居民消费价格指数(上一年同月=100)变化图表,给出下列结论:其中正确的是()(注:图表一每个城市的条形图从左到右依次是1、2、3、4月份;图表二每个月份的条形图从左到右四个城市依次是北京、天津,上海、重庆)①3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为平均;②4月份仅有三个城市居民消费价格指数超过102;③仅有天津市从年初开始居民消费价格指数的增长呈上升趋势;④四个月的数据显示北京市的居民消费价格指数增长幅度波动较大.A.①②B.②④C.①②④D.①③④卷II(非选择题)二、填空题(本题共计 6 小题,每题 5 分,共计30分,)13. 某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据,绘制了下面的折线图.已知该市的各月最低气温与最高气温具有较好的线性关系,则根据该折线图,下列结论错误的是_______.①最低气温与最高气温为正相关;②10月的最高气温不低于5月的最高气温;③月温差(最高气温减最低气温)的最大值出现在1月;④最低气温低于0∘C的月份有4个.14. 为了估计鱼塘中鱼的尾数,先从鱼塘中捕出2000尾鱼,并给每条尾鱼做上标记(不影响存活),然后放回鱼塘,经过适当的时机,再从鱼塘中捕出600尾鱼,其中有标记的鱼为40尾,根据上述数据估计该鱼塘中鱼的尾数为________.15. 已知数据:x,y,10,11,9,这组数据的平均值10,方差为2,则|x−y|=________.16. 抽样统计甲,乙两个城市连续5天的空气质量指数(AQI),数据如下:17. 某校从参加高一年级期末考试的学生中抽出60名学生,并统计了他们的数学成绩(成绩均为整数且满分为100分),把其中不低于50分的分成五段[50, 60),[60, 70),[70, 80),[80, 90),[90, 100]然后画出如下图的部分频率分布直方图.观察图形的信息,可知数学成绩低于50分的学生有________人;估计这次考试数学学科的及格率(60分及以上为及格)为________;18. 为了调查某野生动物保护区内某种野生动物的数量,调查人员逮到这种动物1200只作过标记后放回,一星期后,调查人员再次逮到该种动物1000只,其中作过标记的有100只,估算保护区有这种动物________只.三、解答题(本题共计 5 小题,每题 12 分,共计60分,)19. 已知甲、乙、丙三个车间一天内生产的产品分别是150件、130件、120件,为了掌握各车间产品质量情况,从中取出一个容量为40的样本,该用什么抽样方法?简述抽样过程.20. 某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(1)设消费者的年龄为x ,对该款智能家电的评分为y .若根据统计数据,用最小二乘法得到y 关于x 的线性回归方程为y ̂=1.2x +40,且年龄x 的方差为s x 2=14.4,评分y 的方差为s y 2=22.5.求y 与x 的相关系数r ,并据此判断对该款智能家电的评分与年龄的相关性强弱.(2)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“ 好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.附:线性回归直线y ̂=b ̂x +a ̂的斜率b̂=∑(x i −x ¯)n i=1(y i −y ¯)∑(x i −x ¯)2n i=1相关系数r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1.独立性检验中的K 2=n(ad−bc)2(a+b)(a+c)(b+d)(c+d), 其中n =a +b +c +d .临界值表:21. 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,⋯,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑x i 20i=1=60 ,∑y i 20i=1=1200, ∑(x i −x ¯)220i=1=80, ∑(y i −y ¯)220i=1=9000,∑(x i −x ¯)20i=1(y i −y ¯)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,⋯,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物短盖面积差异很大,为提高样本的代表性以获得附:相关系数: r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1√2≈1.414.22. 某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:i i−1i i−1x i 7i−1y i =3487. (1)求x ¯,y ¯;参考公式:b ̂=∑=n ∑(ni−1x i −x ¯)2∑n ∑x i 2n i−1−nx−2,a ̂=y ¯−b ̂x ¯(2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.23. 某网站欲调查网民对当前网页的满意程度,在登录的所有网民中,收回有效帖子共50000份,其中持各种态度的份数如下表所示:为了了解网民的具体想法和意见,以便决定如何更改才能使网页更完美,打算从中抽选500份,为使样本更具代表性,每类中各应抽选出多少份?并且写出具体操作过程.参考答案与试题解析高中数学必修三--统计一、选择题(本题共计 12 小题,每题 5 分,共计60分)1.【解答】A、了解某班学生“50米跑”的成绩,是精确度要求高的调查,适于全面调查;B、C、D了解一批灯泡的使用寿命,了解一批炮弹的杀伤半径,了解一批袋装食品是否含有防腐剂,都是具有破坏性的调查,无法进行普查,故不适于全面调查.2.【解答】解:若用系统抽样,则样本间隔为5,若第5组抽出的号码为22,则第8组抽出的号码应22+15=37,若用分层抽样方法,则40岁以下年龄段应抽取40×50%=20,故选:B.3.【解答】解:∵中级职称的56人,∴抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数为56160=n20,解得n=7,即抽取的中级职称的教师人数应为7人.故选C.4.【解答】解:假设建设前经济收入为a,则建设后经济收入为4a,所以石油出口收入在建设前为0.49a,建设后为4a×0.33=1.32a,石油出口收入较之前增加;其他收入在建设前为0.06a,建设后为0.24a,即其他收入增加了三倍;百姓购物收入建设前为0.3a,建设后为0.38×4a=1.52a,即百姓购物收入增加了四倍以上;教育文化收入建设前为0.1a,建设后为0.15×4a=0.6a,百姓购物收入与教育文化收入的总和为1.52a+0.6a=2.12a>2a,超过了经济收入的一半.故选D.5.【解答】解:由题意知本题是一个系统抽样问题,总体中个体数是3000,样本容量是100,根据系统抽样的步骤,得到分段的间隔k=3000100=30,解:由频率的意义可知,从左到右各个小组的频率之和是1,同时每小组的频率=小组的频数样本容量.∴[1.5, 2)长方形的面积为0.3.第二组月收入在[1.5, 2)千元的频数为300,所以此次统计的样本容量是300÷0.3=1000.故选A.7.【解答】解:由题意知本题共有C50+C51+C52+C53+C54+C55=25个数据,在[1.5, 4.5)的频数是C52+C53+C54∴在[1.5, 4.5)的频率为:C52+C53+C5425=2532,故选C.8.【解答】解:A,从环比看,2019年第三季度的居民消费价格一直都在增长,故A正确;B,从同比看,2018年7月份的居民消费价格比同年8月份要低一些,故B正确;C,从同比看,1.7+1.5+2.3+2.5+2.7+2.7+2.8+2.8+3.0+3.8+4.5+4.512=2.9,所以2019年全年居民消费价格比2018年涨了2.5%以上,故C正确;D,从环比看,2019年1月份的居民消费价格最低,故D错误.故选D.9.【解答】解:数据4、4、6、7、9、6的众数是4和6,故A错误;一组数据的标准差是这组数据的方差的算术平方根,故B错误;∵3,5,7,9的平均数=14(3+5+7+9)=6,∴3,5,7,9的标准差=√14[(3−6)2+(5−6)2+(7−6)2+(9−6)2]=√5.∵6、10、14、18的平均数=14(6+10+14+18)=12,∴6、10、14、18的标准差√14[(6−12)2+(10−12)2+(14−12)2+(18−12)2]= 2√5,∴数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半,故C正确;频率分布直方图中各小长方形的面积等于相应各组的频率,故D错误.故选:C.10.【解答】解:调查的学生总数是:60÷20%=300(人),则乘公交车的人数为:300×(1−20%−33%−3%)=300×44%=132(人).解:因为:组距均为20,60∼80岁范围的纵轴高为0.03,所以;频率为:0.03×20=0.6.∴60∼80岁的人数为:0.6×1000=600.故选:C.12.【解答】解:根据题目所给信息,①,3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为大,不平均,①错误;②,4月份仅有三个城市居民消费价格指数超过102;③,天津市和上海从年初开始居民消费价格指数的增长呈上升趋势,③错误;④,四个月的数据显示北京市的居民消费价格指数增长幅度波动较大,④正确.故正确的有②④.故选B.二、填空题(本题共计 6 小题,每题 5 分,共计30分)13.【解答】解:由该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据的折线图,得:在①中,最低气温与最高气温为正相关,故①正确;在②中,10月的最高气温不低于5月的最高气温,故②正确;在③中,月温差(最高气温减最低气温)的最大值出现在1月,故③正确;在④中,最低气温低于0∘C的月份有3个,故④错误.故答案为:④.14.【解答】解:根据题意,设该鱼塘中鱼的尾数为x,则;x 2000=60040,解得x=30000;∴估计该鱼塘中鱼的尾数为30000.故答案为:30000.15.【解答】解:由平均值10得,x+y+10+11+9=50,则x+y=20,①由方差为2得,2=15[(x−10)2+(y−10)2+0+1+1],即(x−10)2+(y−10)2=8,②设x=10+t,y=10−t,代入②2t2=8,解得t=±2,∴|x−y|=2|t|=4,故答案为:4.16.甲城市连续5天的空气质量指数是109,111,132,118,110;它的极差是132−109=23,且数据的波动性较大些;乙城市连续5天的空气质量指数是110,111,115,132,112;它的极差是132−110=22,且数据的波动性较小些;由此得出,空气质量指数较为稳定(方差较小)的城市是乙.故答案为:乙.17.【解答】解:由图可知,成绩在[50, 60)的频率为0,015×10=0.15,成绩在[60, 70)的频率为0.015×10=0.15,成绩在[70, 80)的频率为0.030×10=0.3,成绩在[80, 90)的频率为0.025×10=0.25,成绩在[90, 100]的频率为0.005×10=0.05,∴成绩不低于50分的频率为0.15+0.15+0.3+0.25+0.05=0.9,成绩不低于60分的频率为0.15+0.3+0.25+0.05=0.75∴成绩低于50分的频率为为1−0.9=0.1∵共有60名学生,∴成绩低于50分的学生数为60×0.1=6,这次考试数学学科的及格率为75%.故答案为6;75%18.【解答】解:设保护区有这种动物有x只,则由题意可得1200x =1001000,求得x=12000,故答案为12000.三、解答题(本题共计 5 小题,每题 12 分,共计60分)19.【解答】解:由于三个车间的产品有差别,故应采用分层抽样的方法,先计算抽样比:k=40150+130+120=110,再计算各车间内抽取样本的件数:甲车间:150×110=15,乙车间:130×110=13,丙车间:120×110=12,再分析使用简单随机抽样的办法在各个车间中抽取样本,最后终成一个样本.20.【解答】解:(1)相关系数r=∑(x−x¯)50(y−y¯)√∑(xi−x)250i=1∑(y i−y)250i=1;=∑(x i−x¯)50i=1(y i−y¯)∑(x i−x¯)250i=1√∑(xi−x¯)250i=1√∑(yi−y)250i=1=b̂⋅√50s x2√50s y =1.2×1215=0.96.故对该款智能家电的评分与年龄的相关性较强.(2)由列联表可得K 2=50×(8×6−20×16)224×26×28×22≈9.624>6.635.故有99%的把握认为对该智能家电的评价与年龄有关.21.【解答】解:(1)由题意可知,1个样区这种野生动物数量的平均数=120020=60,故这种野生动物数量的估计值=60×200=12000;(2)由参考公式得 ,r =∑(x i −x ¯)n i=1(y i −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1=80×9000=62≈0.94 ;(3)由题意可知,各地块间植物短盖面积差异很大,因此在调查时,先确定该地区各地块间植物短盖面积大小并且由小到大排序, 每十个分为一组,采用系统抽样的方法抽取20个地块作为样区进行样本统计. 22.【解答】解:(1)x ¯=17(3+4+5+6+7+8+9)=6, y ¯=17(66+69+73+81+89+90+91)=5597≈79.86;(2)把所给的7对数据写成对应的点的坐标,在坐标系中描出来,得到散点图.(3)∵ 3×66+4×69+5×73+6×81+7×89+8×90+9×91=3487,32+42+52+62+72+82+92=280,∴ b =3487−7×6×5597280−7×36=4.75,a =5597−6×4.75≈51.36,故线性回归方程为y =4.75x +51.36.23.【解答】解:每个个体被抽到的频率是 50050000=1100,10800×1100=108,12400×1100=124,15600×1100=156,11200×1100=112,每类中各应抽选出有效帖子的份数:很满意的108份,满意的124份,一般的156份,不满意的112份.在很满意的有效帖子中采用简单随机抽样的方法随机抽取108份,在满意的有效帖子中采用简单随机抽样的方法随机抽取124份,在一般的有效帖子中采用简单随机抽样的方法随机抽取156份,在不满意的有效帖子中采用简单随机抽样的方法随机抽取112份.。
高一数学必修3第二章统计测试题及答案(K12教育文档)
高一数学必修3第二章统计测试题及答案(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高一数学必修3第二章统计测试题及答案(word版可编辑修改))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高一数学必修3第二章统计测试题及答案(word版可编辑修改)的全部内容。
数学必修3 第二章 统计 测试题班级 姓名 学号 成绩第Ⅰ卷(选择题,共60分)一选择题:(本题共12小题,每小题5分,共60分)1。
对于随机抽样,个体被抽到的机会是 ( )A .相等B .不相等C .不确定D .与抽取的次数有关2。
用随机数表法从100名学生(男生25人)中抽取20人进行评教,某男生被抽取的机率是 ( )A .1001B .251C .51D .41 3.从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为 ( )A .n N B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4. 有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为 ( )A .5,10,15,20,25B .5,15,20,35,40C .5,11,17,23,29D .10,20,30,40,505.一个容量为20的样本数据,分组后组距与频数如下表:则样本在区间(-∞,50)上的频率为()A.0。
5 B.0.25 C.0。
6 D.0.76.用样本频率分布估计总体频率分布的过程中,下列说法正确的是 ( )A.总体容量越大,估计越精确 B.总体容量越小,估计越精确C.样本容量越大,估计越精确 D.样本容量越小,估计越精确7.对于两个变量之间的相关系数,下列说法中正确的是 ( )A.|r|越大,相关程度越大B.|r|()∈,0,|r|越大,相关程度越小,|r|越小,相关程度越大+∞C.|r|≤1且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小 D.以上说法都不对8.若样本x1+1,x2+1,…,x n+1的平均数为10,方差为2,则对于样本x1+2,x2+2,…,x n+2,下列结论正确的是( )A.平均数为10,方差为2 B.平均数为11,方差为3C.平均数为11,方差为2 D.平均数为14,方差为45发子弹,命中环数如下9.甲,乙两人在相同条件下练习射击,每人打则两人射击成绩的稳定程度是 ( )A .甲比乙稳定B .乙比甲稳定C .甲、乙的稳定程度相同D .无法进行比较10.已知一组数据为0,—1,x,15,4,6,且这组数据的中位数为5,则数据的众数为 ( )A .5B .6C .4D .5.511.在统计中,样本的方差可以近似地反映总体的( )A .平均状态B .分布规律C .波动大小D .最大值和最小值12.线性回归方程 a bx y += 必经过点 ( )A .(0,0)B .)0,(xC .),0(yD .),(y x二填空题:(本题共4小题,每小题5分,共20分)13.条形图用 来表示各取值的频率,直方图用 来表示频率.14.若数据x 1,x 2,x 3,…,x n 的平均数为x ,方差为S 2,则3x 1+5,3x 2+5,…,3x n +5的平均数和方差为 , 。
新北师大版高中数学必修三第一章《统计》测试卷(有答案解析)
一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A.中位数为83 B.众数为85 C.平均数为85 D.方差为193.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是()A.5 B.4 C.3 D.24.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是()A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277; ②5,9,100,107,121,180,195,221,265,299; ③11,41,71,101,131,161,191,221,251,281; ④31,61,91,121,151,181,211,241,271,299. 关于上述样本的下列结论中,正确的是( ) A .②④都不能为分层抽样 B .①③都可能为分层抽样 C .①④都可能为系统抽样D .②③都不能为系统抽样6. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日 7.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .298.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >9.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s10.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .1611.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .312.根据如下样本数据 x345678y ﹣4.0 ﹣2.5 0.5 ﹣0.5 2.0 3.0得到的回归方程为y bx a =+,则( ) A .a >0,b <0B .a >0,b >0C .a <0,b <0D .a <0,b >0二、填空题13.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.14.为调查某校学生每天用于课外阅读的时间,现从该校3000名学生中随机抽取100名学生进行问卷调查,所得数据均在区间[50,100]上,其频率分布直方图如图所示,则估计该校学生中每天用于阅读的时间在[70,80)(单位:分钟)内的学生人数为____.15.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________. 16.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.17.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.18.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.19.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.20.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,如果在第一组随机抽取的号码为6,那么在第7组中抽取的号码是_________.三、解答题21.某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x (单位:万元)和产量y (单位:吨)的数据,用两种模型①y bx a =+,②y b x a =分别进行拟合,得到相应的回归方程111.2 2.0y x =+,228.29.8y x =,进行残差分析得到如图所示的残差值及一些统计量的值: 月份 1 2 3 4 5 63.5x =41y =611049i ii x y==∑投入量x (万元) 1 2 3 4 5 6 产量y (吨) 13 22 4345 55 68 模型①的残差值-0.2-2.4-1.8-3-1.2模型②的残差值 -5.4 -8.0 4.0 -1.6 1.6 9.062191ii x==∑(1)求上表中空格内的值;(2)残差值的绝对值之和越小说明模型拟合效果越好,根据残差比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(3)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(2)中所选模型的回归方程.(参考公式:i i ie y bx a =--,1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-)22.脐橙营养丰富,含有人体所必需的各类营养成份,若规定单个脐橙重量(单位:千克)在[0.1,0.3)的脐橙是“普通果”,重量在[0.3,0.5)的磨橙是“精品果”,重量在[0.5,0.7]的脐橙是“特级果”,有一果农今年种植脐橙,大获丰收为了了解脐橙的品质,随机摘取100个脐橙进行检测,其重量分别在[0.1,0.2),[0.2,0.3),[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7]中,经统计得到如图所示频率分布直方图(1)将频率视为概率,用样本估计总体.现有一名消费者从脐橙果园中,随机摘取5个脐橙,求恰有3个是“精品果”的概率.(2)现从摘取的100个脐橙中,采用分层抽样的方式从重量为[0.4,0.5),[0.5,0.6)的脐橙中随机抽取10个,再从这10个抽取3个,记随机变量X 表示重量在[0.5,0.6)内的脐橙个数,求X 的分布列及数学期望.23.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x 与销售单价y 之间的关系,经统计得到如下数据:(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.24.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,并根据列联表,判断是否有多少的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400≤ 人次400>空气质量好 空气质量不好附:22()()()()()n ad bc K a b c d a c b d -=++++. 25.在社会实践活动中,“求知”小组为了研究某种商品的价格x (元)和需求量y (件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料: 日期 11月1日 11月2日 11月3日 11月4日 11月5日 x (元) 14 16 18 20 22 y (件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.26.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在A ,B 试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a 的值,并求综合评分的平均数;(2)若优质花苗数中甲乙两种培育法的比列为1:3,填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.附:下面的临界值表仅供参考.(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58yx =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.C解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义3.D解析:D【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x+++++++÷=,635=917=6372x x,∴+⨯∴=,故选D. 4.D解析:D【分析】根据茎叶图和折线图依次判断每个选项得到答案.【详解】A. 甲得分的极差是28919-=,A错误;B. 乙得分的中位数是161716.52+=,B错误;C. 甲运动员得分在区间[]20,30上有3个,C错误;D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D正确.故选:D.【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.B解析:B【分析】根据系统抽样和分层抽样的定义分别进行判断即可.【详解】若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个;若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.综上所述,B 选项正确. 故选:B. 【点睛】本题主要考查系统抽样和分层抽样,掌握系统抽样和分层抽样的定义是解题的关键,属于基础题.(1)系统抽样适用于总体容量较大的情况.将总体平均分成若干部分,按事先确定的规则在各部分中抽取,在起始部分抽样时采用简单随机抽样;(2)分层抽样适用于已知总体是由差异明显的几部分组成的.将总体分成互不交叉的层,然后分层进行抽取,各层抽样时采用简单随机抽样或系统抽样.6.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.7.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.8.A解析:A由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础9.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,1s ==,2s == 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.10.B解析:B 【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=故选B 【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错11.C解析:C 【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的. 故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.12.D解析:D 【解析】分析:利用公式求出ˆb,ˆa ,即可得出结论. 详解:样本平均数x =5.5,y =﹣0.25, ∴()()61i i i x x y y =--∑=23,621()i i x x =-∑=17.5,∴ˆb =2317.5=4635>0, ∴ˆa=﹣0.25﹣4635•5.5<0, 故选:D .点睛:求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,a b;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方解析:11 【分析】根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】根据题意,一组样本数据1210,,...,x x x ,且22212102020x x x ++⋯+=, 平均数9x =,则其方差()()()()22221210110S x x x x x x=-+-+⋯+-()2222121011012110x x x x =++⋯+-=,则其标准差11S ==, 故答案为:11. 【点睛】本题主要考查平均数、方差与标准差,属于基础题. 样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =14.【分析】利用频率分布直方图中频率和为1求a 值根据7080)的频率求出在此区间的人数即可【详解】由1﹣005﹣035﹣02﹣01=03故a =003故阅读的时间在7080)(单位:分钟)内的学生人数为: 解析:900【分析】利用频率分布直方图中频率和为1求a 值,根据[70,80)的频率求出在此区间的人数即可. 【详解】由1﹣0.05﹣0.35﹣0.2﹣0.1=0.3, 故a =0.03,故阅读的时间在[70,80)(单位:分钟)内的学生人数为:0.3×3000=900, 故答案为900. 【点睛】本题考查频率分布直方图中的有关性质的应用,考查直方图中频率和频数的求法.15.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a ∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.16.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.17.【解析】分析:根据方差与均值的关系求解即可详解:剔除最高分和最低分后的则原始平均分 原始原始方差即原始方差为88点睛:本题考查方差与均值的关系属基础题 解析:88分析:根据方差与均值的关系()()()22D x E x E x ⎡⎤=-⎣⎦ 求解即可. 详解:剔除最高分和最低分后的222()()()92168480,E x E x D x =+=+= 22()8480(152)110240,x E x n ∑=⨯=⨯-=则原始平均分()921?3? 96? 589015E x ;⨯++==原始 22229658()8188,15x E x ∑++==原始方差 222()?()?()81889088.D x E X E X =-=-=原始原始 即原始方差为 88 .点睛:本题考查方差与均值的关系,属基础题.18.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.19.240【解析】该校2000名男生中体重在的人数为解析:240 【解析】该校2000名男生中体重在()7078kg ~的人数为2000(0.020.01)4240⨯+⨯=.20.66【解析】因为系统抽样第一组抽取的号码为6所以第k 组抽取号码应该为故第7组抽取号码为66填66解析:66因为系统抽样第一组抽取的号码为6,所以第k 组抽取号码应该为6+10k-11,2,10k ⨯=(),,故第7组抽取号码为66,填66.三、解答题21.(1)7.4;(2)选模型①,理由见解析;(3)111y x =+. 【分析】(1)根据i i ie y bx a =--,结合表中所给数据,即可求得空格内的值;(2)分别计算出模型①和模型②的残差值绝对值之和,比较其大小,即可求得应选择哪一个模型;(3)根据所给数据计算出x ,y ,51i ii x y =∑,521ii x=∑,带入1221ni ii nii x y nx yb xnx==-=-∑∑,即可求得答案. 【详解】(1)根据i i ie y bx a =--∴空格处的值为()43311.2 2.07.4-⨯+=(2)应选择模型①模型①的残差值的绝对值之和为0.2 2.47.4 1.831.216+++++= 模型②的残差值的绝对值之和为5.48.0 4.0 1.6 1.69.029.6+++++=1629.6<∴模型①的拟合效果好,应该选模型①.(3)剔除异常数据,即剔除3月份的数据后, 得()1 3.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.211825 3.6 3.617.25i ii ii x y x yb xx==--⨯⨯====-⨯⨯-∑∑,40.611 3.61a y bx =-=-⨯=.所以y 关于x 的回归方程为111y x =+. 【点睛】本题解题关键是掌握残差的定义和回归直线方程的求解步骤,考查了分析能力和计算能力,属于中档题. 22.(1)516(2)见解析 【分析】(1)根据题意,先得到随机摘取一个脐橙,是“精品果”的概率为0.5,并且随机摘取5个脐橙,其中“精品果”的个数符合二项分布,再根据二项分布的概率公式,列出式子,得到答案.(2)先判断出X 可取的值为0,1,2,3,分别计算出其概率,然后列出概率分布列,再根据随机变量的数学期望公式,计算出其数学期望. 【详解】(1)从从脐橙果园中,随机摘取5个脐橙,其中“精品果”的个数记为Y , 由图可知,随机摘取一个脐橙,是“精品果”的概率为:0.2+0.3=0.5, ∴Y ~B (5,12), ∴随机摘取5个脐橙,恰有3个是“精品果”的概率为:P (Y =3)3325115()()2216C ==. (2)依题意,抽取10个脐橙,重量为[0.3,0.4),[0.4,0.5)的个数分别为6和4, X 的可能取值为0,1,2,3,P (X =0)3631016C C ==,P (X =1)216431012C C C ==, P (X =2)1264310310C C C ==,P (X =3)34310130C C ==, ∴X 的分布列为:E (X )01236210305=⨯+⨯+⨯+⨯=. 【点睛】本题考查满足二项分布的概率问题,以及随机变量的概率分布列和数学期望,属于中档题. 23.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元. 【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程; (2)将88x =代入(1)中的回归方程,求出y ,然后用25.8y 和1比较即可判断;(3)将85x =代入回归方程估计出单价,即可计算出收入.【详解】(1)由题意,得3848586878585x ++++==,16.818.820.822.82420.645y ++++==,则515222156169.655820.641840.1841782055810005i ii ii x y x yb xx ==-⋅-⨯⨯====-⨯-∑∑, 20.640.184589.968a y bx =-=-⨯=,故所求回归方程为0.1849.968y x =+;(2)当88x =时,0.184889.96826.16y =⨯+=,所以26.1625.80.361-=<,所以所求回归直线方程是有效可靠的; (3)当85x =,0.184859.96825.608y =⨯+=, 所以25.60898025095.84⨯=(元), 所以该果园预计收入25095.84元. 【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题. 24.(1)概率分别为:43100,27100,21100,9100;(2)350;(3)填表见解析;有95%的把握认为锻炼的人次与该市的空气质量有关.【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1,2,3,4的概率; (2)利用频率分布直方图估计样本平均值的方法可得得答案; (3)完善列联表,由公式计算卡方的值,从而查表即可, 【详解】解:(1)该市一天的空气质量等级为1的概率为:2162543100100++=;该市一天的空气质量等级为2的概率为:5101227100100++=;该市一天的空气质量等级为3的概率为:67821100100++=; 该市一天的空气质量等级为4的概率为:7209100100++=; (2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:1000.203000.355000.45350x =⨯+⨯+⨯=;(3)根据所给数据,可得下面的22⨯列联表,。
必修三数学统计综合训练题及答案
第二章 统计章末综合检测1一、选择题1.某学校有男、女学生各500名,为了解男、女学生在学习爱好与业余爱好方面是不是存在显著不同,拟从全部学生中抽取100名学生进行调查,那么宜采纳的抽样方式是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,那么有( )A .a>b>cB .b>c>aC .c>a>bD .c>b>a3.2021年某大学自主招生面试环节中,七位评委为一考生打出分数的茎叶图如图21,去掉一个最高分和一个最低分,所剩数据的平均数和方不同离为( )图21 A .84,4.84 B .84,1.6C .85,1.6D .85,44甲 乙 丙 丁平均环数x 8.6 8.9 8.9 8.2方差s 2 3.5 3.5 2.1 5.6A .甲B .乙C .丙D .丁5.某校数学教研组为了解学生学习数学的情形,采纳分层抽样的方式从高一600人、高二780人、高三n 人中,抽取35人进行问卷调查,已知高二被抽取的人数为13人,那么n =( )A .660B .720C .780D .8006气温/℃ 18 13 10 4 -1杯数/杯 24 34 39 51 63假设热茶杯数y 与气温( )A .y =x +6B .y =x +42C .y =-2x +60D .y =-3x +787.x 是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,那么以下各式正确的选项是( )A.x =40a +60b 100B.x =60a +40b 100C.x =a +bD.x =a +b 28.在抽查某产品的尺寸进程中,将其尺寸数据分成假设干组,[a ,b ]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,那么|a-b|=( )A.h·m B.hmC.mhD.与m,h无关9.图25是某县参加2021年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,…,A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图26是统计图中身高在必然范围内学生人数的一个算法流程图.现要统计身高在160~180 cm(含160 cm,不含180 cm)的学生人数,那么在流程图中的判定框内应填写的条件是( )图25图26A.i<9? B.i<8? C. i<7? D.i<6?10.图228是依照某班学生在一次数学考试中的成绩画出的频率散布直方图,假设80分以上为优秀,依照图形信息可知:这次考试的优秀率为( )图228A.25%B.30%C.35%D.40%11.一个社会调查机构就某地居民的月收入调查了10 000人,并依照所得数据得出样本频率散布直方图(如图229).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人顶用分层抽样方式抽出100人做进一步伐查,那么在[2500,3000)(单位:元)月收入段中应抽出________人.图229二、填空题12.以下四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④频率散布直方图中各小长方形的面积等于相应各组的频数.其中正确的有__________(填序号).13.将参加数学竞赛的1000名学生编号如下:0001,0002,003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方式把编号分成50个部份,若是第一部份编号为0001,0002,0003,…,0020,第一部份随机抽取一个号码为0015,那么抽取的第40个号码为________.14.超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,不然视为违规.某天,有1000辆汽车通过了该路段,通过雷达测速取得这些汽车运行时速的频率散布直方图如图27,那么违规的汽车大约为________辆.图2715.已知回归直线斜率估量值为1.23,样本点中心为(4,5),那么回归方程是____________.三、解答题16.某校文学社开展“红五月”征文活动,作品上交时刻为5月2号~5月22号,评委从收到的作品中抽出200,经统计,其频率散布直方图如图2216.(1)样本中的作品落在[6,10)内的频数是多少?(2)估量众数、中位数和平均数各是多少?17.对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:甲2738303735312450乙3329383428364345(1)画出茎叶图。
(完整版)高一数学必修3第二章统计复习题和答案
(完整版)高一数学必修3第二章统计复习题和答案高一数学必修 3 第二章统计复习题一、选择题1.某机构进行一项市场调查,规定在某商场门口随机抽一个人进行询问调查,直到调查到事先规定的调查人数为止,这种抽样方式是A .系统抽样 B.分层抽样 C.简单随机抽样D.非以上三种抽样方法一个年级有 12 个班,每个班的同学从 1 至 50 排学号,为了交流学习经验,要求每班学号为 14 的同学留下进行交流,这里运用的是A.分层抽样B.抽签抽样C.随机抽样D.系统抽样3. 某单位有职工750 人,其中青年职工350 人,中年职工250 人,老年职工150 人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本的青年职工为7 人,则样本容量为A .7B.15C. 25D. 354.为了解 120名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k 为A.40B.30C.20D.125.在某项体育比赛中,七位裁判为一选手打出的分数如下:90899095939493去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为A . 92,2B. 92, 2.8C. 93, 2D . 93, 2.8变量 y 与之间的回归方程A .表示 y 与之间的函数关系B .表示 y 和之间的不确定关系C.反映 y 与之间的真实关系达到最大限度的吻合 D .反映 y 和之间真实关系的形式7. 线性回归方程y b a 必过点A . (0,0)B. ( , 0)C. (0, y )D. ( , y )8.在下列各图中,每个图的两个变量具有相关关系的图是( 1)( 2)(3)(4)A .( 1)( 2)B.( 1)( 3)C.( 2)( 4)D.( 2)( 3)9.一个容量为 40 的样本数据分组后组数与频数如下:[25, 25.3), 6;[ 25.3, 25.6),4;[ 25.6,25.9), 10;[ 25.9, 26.2), 8;[ 26.2, 26.5), 8;[ 26.5,26.8), 4;则样本在[25,25.9)上的频率为31C. 1D. 1A .B .20102410.容量为 100的样本数据,按从小到大的顺序分为8 组,如下表:组号12345678第1页共6页频数1013141513129第三组的频数和频率分别是(A 14 和 0.14B0.14 和 14C1 和 0.14D1 和 114314已知数据 a1, a2 ,, an 的平均数为 a ,方差为 S2 ,则数据 2a1 ,2a2 ,, 2an 的平均数和方差为()A . a, S2 B. 2a, S2 C. 2a, 2S2 D . 2a, 4S212、在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中的一组,抽查出的个体在该组上的频率为 m ,该组上的直方图的高为h ,则 | a b |()A . m B. hm C. h D . h mh m二、填空题13.一个总体的60 个个体的编号为 0,1,2,,59,现要从中抽取一个容量为10 的样本,请根据编号按被 6 除余 3 的方法,取足样本,则抽取的样本号码是.甲、乙两人在 10 天中每天加工零件的个数用茎叶图表示(如下图),中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数.则这10 天甲、乙两人日加。
(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(3)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[]10,14,[]15,19,[]20,24,[]25,29,[]30,34的爱看比例分别为10%,18%,20%,30%,%t .现用这5个年龄段的中间值x 代表年龄段,如12代表[]10,14,17代表[]15,19,根据前四个数据求得x 关于爱看比例y 的线性回归方程为( 4.68)%y kx =-,由此可推测t 的值为( )A .33B .35C .37D .393.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15B .45,45,45C .45,60,30D .30,90,154.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>5.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变6.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元7.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.78.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .299.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .10.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >11.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( )A .y 平均增加1.5个单位B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位二、填空题13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.14.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______. 15.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.16.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.17.为调查某校学生每天用于课外阅读的时间,现从该校3000名学生中随机抽取100名学生进行问卷调查,所得数据均在区间[50,100]上,其频率分布直方图如图所示,则估计该校学生中每天用于阅读的时间在[70,80)(单位:分钟)内的学生人数为____.18.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:^y =0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.19.某种活性细胞的存活率(%)y 与存放温度()x C ︒之间具有线性相关关系,样本数据如下表所示: 存放温度()x C ︒ 10 4 -2 -8 存活率(%)y20445680经计算得回归直线的斜率为-3.2.若存放温度为6C ︒,则这种细胞存活率的预报值为__________%.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:7772111y9.24,t 7 2.646iiii i i i y=====⋅≈≈∑∑∑(y -y ).参考公式:相关系数()()()()()()11112211niinn ni i i i i i nni i i i i i i t t y y r t ty y t y t y t ty y ======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,nii i ni i tty y bay bt t t==⋅--==-⋅-∑∑. 22.某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量X (小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).(1)求月光照量X (小时)的平均数和中位数;(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的区间内各抽取多少个月份?(3)假设每年中最热的5,6,7,8,9,10月的月光照量X 是大于等于240小时,且6,7,8月的月光照量X 是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量X (小时)都不低于320的概率.23.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下: 分组 频数 频率 [50,60) 18 0.30 [60,70) 24 0.40 [70,80) 9 0.15 [80,90) 6 0.10 [90,100]30.05(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.24.某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.25.为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018年的数据进行调查,发现某地区发放粮食补贴额x (单位:亿元)与该地区粮食产量y (单位:万亿吨)之间存在着线性相关关系,统计数据如下表: 年份 2014 2015 2016 2017 2018 补贴额x /亿元 9 10 12 11 8 粮食产量y /万亿2526312721(1)请根据上表所给的数据,求出y 关于x 的线性回归直线方程ˆˆˆybx a =+; (2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.参考公式:()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-. 26.零部件生产水平是评判一个国家高端装备制造能力的重要标准之一,其中切割加工技术是一项重要技术某精密仪器制造商研发了一种切割设备,用来生产高精度的机械零件,经过长期生产检验,可以认为该设备生产的零件尺寸服从正态分布N (μ,σ2).某机械加工厂购买了该切割设备,在正式投入生产前进行了试生产,从试生产的零件中任意抽取10件作为样本,下面是样本的尺寸x i (i =1,2,3,…,10,单位:mm ): 100.03 100.4 99.92 100.52 99.98 100.3599.92100.44100.66100.78用样本的平均数x 作为μ的估计值,用样本的标准差s 作为σ的估计值.(1)按照技术标准的要求,若样本尺寸均在(μ﹣3σ,μ+3σ)范围内,则认定该设备质量合格,根据数据判断该切割设备的质量是否合格.(2)该机械加工厂将该切割设备投入生产,对生产的零件制定了两种销售方案(假设每种方案对销售量没有影响):方案1:每个零件均按70元定价销售;方案2:若零件的实际尺寸在(99.7,100.3)范围内,则该零件为A 级零件,每个零件定价100元,否则为B 级零件,每个零件定价60元. 哪种销售方案的利润更大?请根据数据计算说明.附:1021ii x =∑≈100601.8,样本方差()22221111n n i i i i s x x x nx n n ==⎛⎫=-=- ⎪⎝⎭∑∑.若X ~N (μ,σ2),则P (μ﹣σ<X <μ+σ)=0.6827,P (μ﹣2σ<X <μ+2σ)=0.9545【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.B解析:B 【解析】前4个数据对应的19.5x = ,0.195y = (把百分数转化为小数),而0( 4.68)0y kx ∧=-=0.0468bx -,0.19519.50.0468b ∧∴=⨯-,0.0124b ∧∴=,0(1.24 4.68)0y x ∧∴=- ,当3034322x +==, 1.2432 4.6835t =⨯-=.3.C解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 4.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.5.D解析:D 【分析】考查平均数和方差的性质,基础题. 【详解】设这一组数据为()1,n X a a =,由()()E X a E X a +=+,()()D X a D X +=,故选:D . 【点睛】本题主要考查方差的性质,考查了运算能力,属于容易题.6.B解析:B 【解析】 【分析】 先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.7.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.8.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.9.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.10.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础11.C解析:C 【分析】先求均值,再根据标准差公式求标准差,最后比较大小. 【详解】乙选手分数的平均数分别为7885848192767780949384,84,55++++++++====因此s 1<s 2,选C. 【点睛】本题考查标准差,考查基本求解能力.12.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.二、填空题13.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3 【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数.(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.14.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4 【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=. 若13x =时,则()()()()2222234577774x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0, 此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9, 此时12345,,,,x x x x x 为4,6,7,8,10,符合题意. 故答案为:4 【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题.15.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方解析:11根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】根据题意,一组样本数据1210,,...,x x x ,且22212102020x x x ++⋯+=,平均数9x =, 则其方差()()()()22221210110S x x x x x x =-+-+⋯+-()2222121011012110x x x x =++⋯+-=,则其标准差11S ==, 故答案为:11. 【点睛】本题主要考查平均数、方差与标准差,属于基础题. 样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =16.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平 解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20. 【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.17.【分析】利用频率分布直方图中频率和为1求a 值根据7080)的频率求出在此区间的人数即可【详解】由1﹣005﹣035﹣02﹣01=03故a =003故阅读的时间在7080)(单位:分钟)内的学生人数为:解析:900【分析】利用频率分布直方图中频率和为1求a 值,根据[70,80)的频率求出在此区间的人数即可. 【详解】由1﹣0.05﹣0.35﹣0.2﹣0.1=0.3, 故a =0.03,故阅读的时间在[70,80)(单位:分钟)内的学生人数为:0.3×3000=900, 故答案为900. 【点睛】本题考查频率分布直方图中的有关性质的应用,考查直方图中频率和频数的求法.18.245【解析】当变为时=0245(x+1)+0321=0245x+0321+0245而0245x+0321+0245-(0245x+0321)=0245因此家庭年收入每增加1万元年饮食支出平均增加0解析:245 【解析】当x 变为1x +时,y ∧=0.245(x+1)+0.321=0.245x+0.321+0.245,而0.245x+0.321+0.245-(0.245x+0.321)=0.245.因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元,本题填写0.245.19.34【解析】分析:由题意求出代入公式求值从而得到回归直线方程代入代入即可得到答案详解:由题意设回归方程由表中数据可得:;代入回归方程可得当时可得故答案为34点睛:该题考查的是有关回归直线的有关问题在解析:34 【解析】分析:由题意求出,x y ,代入公式求值^a ,从而得到回归直线方程,代入6x =代入即可得到答案.详解:由题意,设回归方程 3.2ˆ,ˆyx a =-+ 由表中数据可得:1,50x y ==;代入回归方程可得ˆ53.2a=. 当6x =时,可得3.2653.234y =-⨯+=,故答案为34.点睛:该题考查的是有关回归直线的有关问题,在解题的过程中,涉及到的知识点有回归直线过均值点,即样本中心点,利用题中所给的表格中的数据,计算得出相应的量,代入式子求得对应的结果.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)散点图见解析,y 与t 的线性相关性相当高,理由见解析;(2)0.920.1011 2.02y =+⨯=,2.02万户.【分析】(1)根据表格中对应的t 与y 的关系,描绘散点图,并根据参考数据求r ,说明相关性;(2)根据参考数据求ˆb和ˆa ,求回归直线方程,并令11t =,求y 的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得()()7722114,0.53i i i i t t ty y ===⋅-=⋅-≈∑∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===⋅--=-=-⨯=∑∑∑,2.790.990.532 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.24 1.327y ==及(1)得()()()717212.79ˆ0.1028iii i i t t y y b t t==⋅--==≈⋅-∑∑, ˆˆ 1.320.1040.92ay bt =-≈-⨯=,所以,y 关于t 的回归方程为:0.920.10y t =+. 将11t=代入回归方程得:0.920.1011 2.02y =+⨯=,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求ˆb和ˆa ,一般计算量较大,需计算严谨,准确. 22.(1)平均数为260(小时);中位数为240(小时)(2)2,1,1(3)15【分析】(1)利用各频率之和为1,计算出a ,然后根据频率分布直方图以及平均数,中位数的求法,可得结果.(2)根据月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,结合分层抽样的方法,可得结果. (3)采用列举法,将“6个月份之中随机抽取2个月份”所有情况列举出来,并计算“抽取到的2个月份的月光照量X (小时)都不低于320”的个数,结合古典概型可得结果. 【详解】(1)根据各频率之和为1, 则0.062580()801a a ⨯++⨯=, 解得0.003125a =.月光照量X (小时)的平均数为()802000.00625+2800.0031253600.003125X =⨯⨯+⨯所以260X =(小时)设月光照量X (小时)的中位数为0X , 则0[240,320]X ∈.根据中位数的定义, 其左右两边的频率相等,都为0.5,可得()00.00625802400.0031250.5X ⨯+-⨯=,解得0240X =.所以月光照量X (小时)的中位数为240(小时). (2)因为月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,所以若准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,那么,抽取的月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的月份数分别为11142,41,41244⨯=⨯=⨯=. (3)由题意,月光照量[240,320)X ∈的有5,9,10月, 月光照量[320,400]X ∈的有6,7,8月, 故从该村庄2018年的5,6,7,8,9,10月份 之中随机抽取2个月份的月光照量X (小时) 进行调查,所有的情况有:(5,9),(5,10),(5,6),(5,7),(5,8); (9,10),(9,6),(9,7),(9,8); (10,6),(10,7),(10,8); (6,7),(6,8);(7,8)共15种;其中,抽取到的2个月份的月光照量X (小时)都不低于320的情况有: (6,7),(6,8),(7,8)共3种;故所抽取到的2个月份的月光照量X (小时)都不低于320的概率31155P ==. 【点睛】本题考查频率分布直方图中平均数,中位数的计算,以及古典概型的应用,分清题意,熟悉公式,耐心计算,属中档题.23.(1)直方图见解析;(2)67分,65分. 【分析】(1)由统计表算出各频率,作出频率分布直方图;(2)取各组数据中间值乘以频率再相加可得总平均值,求出频率0.5对应的成绩(此成绩在[60,70)之间]. 【详解】(1)根据统计表,作出这些数据的频率分布直方图如图:(2)由表中数据可知,这60名参赛学生成绩的平均数550.3650.4750. 15850.1950.0567x =⨯+⨯+⨯+⨯+⨯=分.因为这60名参赛学生成绩在[50,60)的频率为0.30.5<,成绩在[50,70)的频率为0.70.5>,所以这60名.参赛学生成绩的中位数在[60,70)之间.设这60名参赛学生成绩的中位数为x ,则()0.04600.2x ⨯-=,解得65x =, 故这60名参赛学生成绩的中位数为65分. 【点睛】本题考查频率分布直方图,考查由频率分布直方图求均值和中位数.考查了学生的数据处理能力,运算求解能力,属于中档题. 24.(Ⅰ)0.02;(Ⅱ)10800元. 【分析】(Ⅰ)由频率分布直方图中小矩形面积和为1能求出a .(Ⅱ)根据频率分布直方图,日销售量不低于25件的天数为(0.040.02)5309+⨯⨯=,一个月可获得的奖励为900元,由此可以估计一年内获得的礼金数. 【详解】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为:()0.040.025309+⨯⨯=(天),一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.25.(1)ˆ 2.24yx =+;(2)19.4万亿吨. 【分析】(1)利用最小二乘法公式求回归直线的系()()()51521ˆiii ii x x y y bx x ==--=-∑∑,即可得答案;(2)将7x =代入回归方程ˆ 2.24yx =+,可得,ˆ19.4y =,即可得答案; 【详解】解:(1)由表中所给数据可得,91012118105x ++++==,2526312721265y ++++==,代入公式()()()51521ˆiii ii x x y y bx x ==--=-∑∑,解得ˆ 2.2b=,所以ˆˆ4a y bx =-=. 故所求的y 关于x 的线性回归直线方程为ˆ 2.24yx =+. (2)由题意,将7x =代入回归方程ˆ 2.24yx =+,可得,ˆ19.4y =. 所以预测2019年该地区的粮食产量大约为19.4万亿吨. 【点睛】本题考查利用最小二乘法求回归直线方程、回归方程进行预报,考查数据处理能力. 26.(1)合格,理由见解析;(2)方案2,理由见详解. 【分析】(1)求得10个数据的平均数和标准差,根据题意,即可判断;(2)设出方案2中零件价格的随机变量,结合正态分布求得零件价格的分布列和数学期望,即可比较大小,则问题得解. 【详解】(1)由表格中数据可得:x 1011100.310i i x ===∑,()101022221111(10)0.091010i i i i s x x x x ===-=-=∑∑.故可得:100.3μ=,0.3σ=. 因为所有样本都在区间()99.4,101.2, 故该切割设备质量合格.(2)对方案2,设零件价格的随机变量为X ,故X 可取60,100, 根据(1)中所求,可得()()()10099.7100.320.47725P X P x P x μσμ==<<=-<<=;()()6011000.52275P X P X ==-==.故()600.522751000.47725600.51000.477770E X =⨯+⨯>⨯+⨯=>. 又方案1中,每个零件售价均为70,故可得方案2的利润更大.【点睛】本题考查平均数和方差标准差的计算,涉及正态分布,随即变量数学期望的求解,属综合中档题.。
(2021年整理)高一数学必修三统计测试题
高一数学必修三统计测试题高一数学必修三统计测试题编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高一数学必修三统计测试题)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高一数学必修三统计测试题的全部内容。
高一数学必修三统计测试题1.某学校为了了解高一年级学生对教师教学的意见,打算从高一年级2007名学生中抽取50名进行抽查,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下2000人再按系统抽样的方法进行,则每人入选的机会()A. 不全相等B. 均不相等 C。
都相等D。
无法确定2.有20位同学,编号从1至20,现在从中抽取4人作问卷调查,用系统抽样方法确定所抽的编号为( )A。
5,10,15,20 B.2,6,10,14 C。
2,4,6,8 D。
5,8,11,143.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。
则完成(1)、(2)这两项调查宜采用的抽样方法依次是()A。
分层抽样法,系统抽样法 B。
分层抽样法,简单随机抽样C。
系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法4。
某单位有技工18人、技术员12人、工程师6人,需要从这些人中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果容量增加一个,则在采用系统抽样时,需要在总体中剔除1个个体,则样本容量n为()A。
(好题)高中数学必修三第一章《统计》测试卷(答案解析)
一、选择题1.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.52.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度3.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙4.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,47.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元9.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三 周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表:根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.14.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.15.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________16.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______. 17.对具有线性相关关系的变量x ,y ,有一组观察数据(,)(1,2,9)i i x y i =⋅⋅⋅,其回归直线方程是:2y x a =+,且919ii x==∑,9118i i y ==∑,则实数a 的值是__________.18.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.19.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.20.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:月份i 7 8 9 10 11 12 销售单价i x (元) 9 9.5 10 10.5 11 8.5 销售量i y (元)111086514y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 22.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)23.据统计某品牌服装专卖店一周内每天获取得纯利润y (百元)与每天销售这种服装件数x (百件)之间有如下一组数据.该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500). (1)利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2)求该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程.(精确到0.01) (3)估计每天销售1200件这种服装时获多少纯利润? 附表:(随机数表第7行至第9行)84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 2387933211 23429 78645 60782 52420 74438 15510 01342 99660 27954 参考数据:721280i i x==∑,72145309i i y ==∑,713487i i i x y ==∑.参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-24.某公司有400名员工,根据男女员工人数比例,用分层随机抽样的方法从中抽取了100人,调查他们的通勤时间(上下班途中花费的总时间,单位:分钟),将数据按照[)20,30,[)30,40,,[]80,90分成7组,并整理得到如下频率分布直方图:(I )从总体中随机抽取1人,估计其通勤时间小于40分钟的概率; (Ⅱ)求样本数据的中位数的估计值;(Ⅲ)已知样本中通勤时间大于或等于60分钟的人都是男员工,通勤时间小于60分钟的人中有一半是男员工,求该公司男员工的人数.25.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:做不到科学用眼 能做到科学用眼 合计 男 45 10 55 女 30 15 45 合计7525100(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:26.某企业广告费支出与销售额(单位:百万元)数据如表所示: (1)求销售额y 关于广告费x 的线性回归方程;(2)预测当销售额为76百万元时,广告费支出为多少百万元. 回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.2.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.3.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.4.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.C解析:C 【解析】分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1ay bx =-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.9.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题 10.C解析:C【分析】设该样本中高三年级的学生人数为x ,则1800601200x=,解之即可 【详解】设该样本中高三年级的学生人数为x , 则1800601200x=,解得40x =, 故选C .【点睛】 本题考查了分层抽样方法的应用问题,属基础题.11.B解析:B【解析】【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果.【详解】由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72, a=84﹣0.72×108=6.24, ∴y =0.72x+6.24,故选:B .【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.12.A解析:A【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy =-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确.故选A. 点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平 解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解.【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=, 所以2221220()()() 4.2a x a x a x -+-++-=, 所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20.【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.14.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差5【解析】 试题分析:由平均数及方差的定义可得10685675x ++++==; 222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==. 考点:样本数据的数字特征:平均值与方差.15.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考 解析:18【解析】【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得.【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =.【点睛】本题主要考查了系统抽样,属于中档题.16.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归 解析:16- 【解析】【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值【详解】由已知,()12101210330x x x y y y +++=+++= ()12101310x x x x ∴=⨯+++=()12101110y y y y =⨯+++= 代入回归直线方程可得:3132b =+6故答案为16-【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果17.0【解析】分析:根据回归直线方程过样本中心点计算平均数代入方程求出的值详解:根据回归直线方程过样本中心点即答案为0点睛:本题考查了线性回归方程过样本中心点的应用问题是基础题解析:0【解析】 分析:根据回归直线方程过样本中心点x y (,), 计算平均数代入方程求出a 的值. 详解:根据回归直线方程ˆ2y x a =+过样本中心点x y (,),191191,99i i x x ==∑=⨯= 191118299i i y y ==∑=⨯=, 22210a y x ∴=-=-⨯=;即答案为0.点睛:本题考查了线性回归方程过样本中心点的应用问题,是基础题.18.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12【解析】分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.19.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140解析:140【解析】 根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.20.30【解析】由题意可得:则成绩不低于分的人数为人解析:30【解析】由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大.【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想;(3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可.【详解】(1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时, ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的.(3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大.【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .22.(1)0.36 6.24y x =+;(2)8.76万吨.【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量.【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()61621 6.30.3617.5ˆi ii i i t t y y b t t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨.【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 23.(1)301,169,105,071,286;(2) 4.7551.36y x =+;(3)10836元.【分析】(1)按照规则直接读取随机数表即可得解;(2)由题中数据可得x 、y ,代入公式即可得b 、a ,即可得解;(3)将12x =代入线性回归方程中,即可得解.【详解】(1)由随机数表可得,最先检测的5件服装的编号为:301,169,105,071,286; (2)由题意345678967x ++++++==, 6669738189909155977y ++++++==, 所以717222155973487767 4.75280767i ii i i x y x y b x x==--⨯⨯===-⨯-∑∑,5596 4.7551.367a y bx -⨯≈=-=, 所以该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程为 4.7551.36y x =+; (3)当12x =时, 4.751251.36108.36y =⨯+=(百元),故可估计每天销售1200件这种服装时获纯利润10836元.【点睛】本题考查了随机数表的应用及线性回归方程的求解与应用,考查了运算求解能力,属于中档题.24.(Ⅰ)0.6;(Ⅱ)37.5;(Ⅲ)220.【分析】(Ⅰ)根据频率分布直方图求解即可;(Ⅱ)先根据频率分布直方图判断中位数落在哪一区间上,然后利用中位数将频率分布直方图的面积分为相等的两部分求解;(Ⅲ)先计算出样本中男员工的人数,计算出男员工所占的比例,然后估计总体中男员工的人数.【详解】解:(1)由频率分布直方图可知,样本中通勤时间小于40的概率()100.020.040.6p =⨯+=,故从总体中随机抽取1人,估计其通勤时间小于40分钟的概率也为0.6.(Ⅱ)由图可知,样本的中位数位于[)30,40之间,设中位数为x ,则()0.2300.040.5x +-⨯=,解得37.5x =,故中位数为37.5.(Ⅲ)样本中通勤时间大于或等于60分钟的人的概率为0.1,共10人,通勤时间小于60分钟的人的频率为0.9,其中男员工有11000.9452⨯⨯=人,所以样本中男员工共有55人,占样本容量的55%,故该公司男员工人数为40055%220⨯=人.【点睛】本题考查频率分布直方图的应用,考查用样本估计总体,难度一般.25.(1)分布列见解析,1;(2)0.10=P ,理由见解析.【分析】 (1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望;(2)按照公式计算2K 的值,然后由临界值表得出结果即可.【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人, 则随机变量X 0=,1,2,∴343641 (0)205 ====CPXC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.26.(1)17.5 6.5y x=+;(2)9百万元.【分析】(1)由已知求得ˆb与ˆa的值,可得销售额y关于广告费x的线性回归方程;(2)在(1)中求得的线性回归方程中,取76y=求得x值即可.【详解】(1)6482555x++++==,5040703060505y++++==.61621()()10(1)(10)320(3)(20)010130ˆ 6.51199020()i iiiix x y ybx x==--⨯+-⨯-+⨯+-⨯-+⨯====++++-∑∑,50 6.5517.5ˆˆa y bx=-=-⨯=.∴销售额y关于广告费x的线性回归方程为ˆ17.5 6.5y x=+;(2)当ˆ76y=时,代入回归方程ˆ17.5 6.5y x=+,求得9x=.故预测当销售额为76百万元时,广告费支出为9百万元.【点睛】本题考查线性回归方程的求法,考查回归方程的应用,考查了计算能力,是中档题.。
高一数学必修三统计习题
高一数学必修三统计习题高一数学必修三统计习题一选择题1.在统计中,样本的方差用来反映总体的()A.平均状态B.分布规律C.离散状态D.最大值和最小值2.已知一组数据1、2、y的平均数为4,那么()A.y=7B.y=8C.y=9D.y=103.甲、乙、丙、丁四人的数学测验成绩分别为90分、90分、_分、80分,若这组数据的众数与平均数恰好相等,则这组数据的中位数是()A.100分B.95分C.90分D.85分4.某校1000名学生中,O型血有400人,A型血有250人,B型血有250人,AB型血有100人,为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,按照分层抽样的方法抽取样本,则O型血、A型血、B型血、AB型血的人要分别抽的人数为()A.16、10、10、4B.14、10、10、6 C5.为了了解广州地区初三学生升学考试数学成绩的情况,从中抽取50本密封试卷,每本30份试卷,这个问题中的样本容量是()A.30B.50C.1500D.1506.某单位有技工18人、技术员12人、工程师6人,需要从这些人中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果容量增加一个,则在采用系统抽样时,需要在总体中剔除1个个体,则样本容量n为()A.4B.5C.6D.无法确定7.在频率分布直方图中,每个小长方形的面积表示()A.组数B.频数C.频率D.8.在某餐厅内抽取100人,其中有30人在15岁以下,35人在16至25岁,25人在26至45岁,10人在46岁以上,则数 0.35是16到25岁人员占总体分布的()A.概率B.频率C.累计频率D.频数9.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,适合的抽取样本的方法是()A.简单的随机抽样B.系统抽样C.先从老年人中排除一人,再用分层抽样D.分层抽样10.一个容量为20的样本数据,分组后组距与频数如下:[10,20]2个,[20,30]3个,[30,40]4个,[40,50]5个,[50,60]4个,[60,70]2个,则样本在区间(-∞,50)上的频率为()A.5B.25C.50D.70二填空题11.某校高一、高二、高三三个年级的学生数分别为1500人、120__人和1000人.现采用按年级分层抽样法了解学生的视力状况,已知在高一年级抽查了75人,则这次调查三个年级共抽查了人.12.有6个数4,_,-1,y,z,6,它们的平均数为5,则_,y,z三个数的平均数为.15.有一个简单的随机样本10,12,9,14,13,则样本平均数=,样本标准差s= .13.线性回归方程y=b_+a过定点.14.一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=_______.15.某种彩票编号为0000~9999,中奖规则规定末三位号码是123的为二等奖,则中二等奖的号码为____________________________________;若将中二等奖的号码看作一个样本,则这里采用的抽样方法是三解答题16.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如下图所示.分别求出两人得分的平均数与方差;根据图和上面算得的结果,对两人的训练成绩作出评价.。
高一数学必修三第一章统计练习题9套(含答案北师大版)
高一数学必修三第一章统计练习题9套(含答案北师大版)一、选择题1.为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行统计分析,在这个问题中5000名学生成绩的全体是()A.总体B.个体C.从总体中抽取的一个样本D.样本的容量【解析】依据抽样调查的要求可知选A.【答案】A2.抽样调查在抽取调查对象时()A.按一定的方法抽取B.随便抽取C.全部抽取D.根据个人的爱好抽取【解析】根据抽样调查的要求,可知选A.【答案】A3.下列调查方式合适的是()A.要了解一批电视机的使用寿命,采用普查方式B.要了解收看中央电视台的“法制报道”栏目的情况,采用普查方式C.要保证“神舟十号”载人飞船发射成功,对重要零件采取抽查方式D.要了解外国人对“上海世博会”的关注度,可采取抽样调查方式【解析】检测电视机的寿命,具有破坏性,不宜用普查方式,故A不正确;由于收视观众较多,分布广,所以B不正确;对于“神舟十号”重要零件,数量不大,且至关重要,所以适合普查,因此C不正确;故选D.【答案】D4.(2013•南昌检测)下列调查中属于抽样调查的是()①每隔5年进行一次人口普查;②某商品的质量优劣;③某报社对某个事件进行舆论调查;④高考考生的身体检查.A.②③B.①④C.③④D.①②【解析】①④为普查,②③为抽样调查.【答案】A5.下面问题可以用普查的方式进行调查的是()A.检验一批钢材的抗拉强度B.检验海水中微生物的含量C.检验10件产品的质量D.检验一批汽车的使用寿命【解析】A不能用普查的方式调查,因为这种试验具有破坏性;B用普查的方式无法完成;C可以用普查的方式进行调查;D该试验具有破坏性,且需要耗费大量的时间,在实际生产中无法应用.【答案】C二、填空题6.为了准确调查我国某一时期的人口总量、人口分布、民族人口、城乡人口、受教育的程度、迁徒流动、就业状况等多方面的情况,需要用________的方法进行调查.【解析】要获得系统、全面、准确的信息,在对总体没有破坏的前提下,普查无疑是一个非常好的方法,要求全面、准确调查人口的状况,应当用普查的方法进行调查.【答案】普查7.检验员为了检查牛奶中是否含有黄曲霉素MI,应采用________的方法检验.【解析】这是大批量的破坏性检验,不可能进行普查,应当采取抽样调查的方法检验.【答案】抽样调查8.为了了解某班学生的会考合格率,要从该班70人中选30人进行考察分析.在这个问题中,70人的会考成绩的全体是________,样本是________,样本容量是________.【解析】由总体、样本、样本容量的定义知:70人的会考成绩的全体是总体,样本是30人的会考成绩.样本容量是30.【答案】总体30人的会考成绩30三、解答题9.某市有7万名学生参加学业水平测试,要想了解这7万名学生的数学成绩,从中抽取了1000名学生的数学成绩.(1)在此项调查中总体是什么?(2)在此项调查中个体是什么?(3)在此项调查中样本是什么?(4)在此项调查中样本容量是什么?【解】(1)总体是7万名学生的数学成绩.(2)个体是7万名学生中每一名学生的数学成绩.(3)样本是从7万名学生的数学成绩中抽取1000名学生的数学成绩.(4)样本容量是1000.10.某县有在校高中生6400人,初中生30200人,小学生30300人.该县电教站为了了解本县对计算机的推广及学生掌握的熟练程度,该部门应如何抽取样本?【解】因为影响学生计算机知识的掌握及使用情况的因素是多方面的,不同的乡镇,不同的学校,办学条件也不同,因此在进行抽样时,宜将学生按城、乡及高中、初中、小学分别抽样.另外,三类学生人数相差较大.因此,为了提高样本的代表性,还应考虑他们在样本中所占的比例大小.11.你的班主任想全面了解你班学生的学习和思想状况.请你帮助班主任设计一个调查方案.【解】因为一个班的人数不是太多,为了帮助班主任全面了解班里学生的学习和思想状况,可以采取普查的方法进行调查.可以先设计一个问卷,包括同学们对学习的各种看法,同学们的爱好、心理和思想状况等,然后发放给每一个学生,并全部收回,然后进行统计,这样就可以全面了解每个学生的学习和思想状况了.。
(好题)高中数学必修三第一章《统计》测试(包含答案解析)(1)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格99.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.57.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差8.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >10.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5 B.5,5 C.5,8 D.8,811.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为()A.127 B.128 C.128.5 D.129二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.15.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______. 16.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___17.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.18.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.19.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.某家庭2015-2019年的年收入和年支出情况统计如下表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(精确到0.01); (2)假设受新冠肺炎疫情影响,该家庭2020年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2020年的年支出金额.(参考公式:回归方程ˆˆy bxa =+中斜率和截距的最小二乘估计分别为()()()1122211ˆn niii ii i nniii i x x y y x y n x ybx x xn x ====---⋅⋅==--⋅∑∑∑∑,ˆˆay bx =-) 22.2019年2月13日《西安市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数;(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i )你认为9个名额应该怎么分配?并说明理由;(ii )座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的22⨯列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?(精确到0.1)阅读时间不足8.5小时 阅读时间超过8.5小时附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x (吨)对价格y (万元/吨)和年利润z (万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y =.(1)求表格中c 的值;(2)求y 关于x 的线性回归方程y bx a =+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z 取得最大值?参考公式:1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x,已知这10个分数的平均数90x=,标准差6s=,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221niix nxsn=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某城市200户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,280,[)280,300分组的频率分布直方图如图:(1)求直方图中x 的值;(2)在月平均用电量为[)220,240,[)240,260,[)260,280的三组用户中,用分层抽样的方法抽取20户居民,则月平均用电量在[)220,240的用户中应抽取多少户? (3)求月平均用电量的中位数和平均数.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 4.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.6.A解析:A 【解析】 【分析】由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据, 可得,,又由回归直线的方程,则,即,又因为,解得,故选A. 【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.7.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确.②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++() 平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确. ④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.8.B解析:B 【解析】 分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.26 4.5,4y +++== ∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A【分析】 由题意计算出加入新数据后的平均数,然后比较方差【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定故22s <故选A【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础 10.C解析:C【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图 11.B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标.【详解】根据题意可得,,由线性回归方程一定过样本中心点,. 故选:B .【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题. 12.D解析:D【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数.详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129.故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应 解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等. 14.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族 解析:20【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果.【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==, 解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20.【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题. 15.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差.【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题. 16.【分析】首先求出xy 的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a 的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直 解析:214【分析】首先求出x ,y 的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a 的一元一次方程,解方程即可.【详解】 :14x =(1+2+3+4)=2.5,14y =(4.5+4+3+2.5)=3.5, 将(2.5,3.5)代入线性回归直线方程是ˆy =-0.7x +a ,可得3.5=﹣1.75+a , 故a =214. 故答案为214 【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题17.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归 解析:16- 【解析】【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值【详解】由已知,()12101210330x x x y y y +++=+++= ()12101310x x x x ∴=⨯+++=()12101110y y y y =⨯+++= 代入回归直线方程可得:3132b =+解得16b =- 故答案为16-【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果18.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140解析:140【解析】 根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.19.240【解析】该校2000名男生中体重在的人数为解析:240【解析】该校2000名男生中体重在()7078kg ~的人数为2000(0.020.01)4240⨯+⨯=. 20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15解析:15【解析】依次选取两个数字为23,75,93,21,15,04,……所以选出来的第3个个体的编号为15.三、解答题21.(1)0.780.24y x =+;(2)7.65万元.【分析】(1)利用回归直线方程计算公式,计算出回归直线方程.(2)将9.5x =代入回归直线方程,求得预测值.【详解】(1)由题可得()199.61010.411105x =⨯++++=, ()17.37.588.58.785y =⨯++++=, ()()()5222222110.400.41 2.32ii x x =-=-+-+++=∑, ()()()()()()5110.70.40.5000.40.510.7 1.8i ii x x y y =--=-⨯-+-⨯-+⨯+⨯+⨯=∑,()()()51521 1.845ˆ0.782.3258i ii i i x x y y b x x ==--===≈-∑∑, 45ˆˆ8100.2458x a y b =-⋅=-⨯≈, 则y 关于x 的线性回归方程为0.780.24y x =+.(2)当2020年的年收入为9.5x =万元时,0.789.50.247.65y =⨯+=.所以预测该家庭2020年的年支出金额为7.65万元.【点睛】本小题主要考查回归直线方程的计算,考查利用回归直线方程进行预测,属于中档题. 22.(1)9, (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由见解析, (ii )有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【分析】(1)取各区间中点值乘以频率再相加即得;(2)(i )两组差异明显,用分层抽样计算.(ii )求出两组的人数,填写列联表,计算2K 可得.【详解】(1)60.0370.180.290.35100.19110.09120.049⨯+⨯+⨯+⨯+⨯+⨯+⨯=(2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配(ii )22⨯列联表为:2K 200(40742660) 4.4 3.84166134100100⨯⨯-⨯=≈>⨯⨯⨯, 所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【点睛】本题考查频率分布直方图,分层抽样,考查独立性检验.属于基础题.23.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10(1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22( 1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 24.(1)2.5;(2) 1.49.7y x =-+;(3)年产量约为3.5吨时,年利润z 取得最大值.【分析】(1)由均值概念求得c ;(2)根据所给数据计算系数即得;(3)利用(2)中回归直线方程作出预估值进行计算利润后,再由二次函数性质得最大值.【详解】(1)8764 5.55c y ++++==,解得 2.5c =; (2)1234535x ++++==, 5118275 2.568.5ii i x y ==⨯+⨯++⨯=∑, 1222222168.553 5.5 1.4(125)53n i ii n i i x y nx y b x nx==--⨯⨯===-+++-⨯-∑∑,5.5(1.4)39.7a y bx =-=--⨯=,所以回归直线方程为 1.49.7y x =-+.(3)由(2)2(2)(1.49.7) 1.49.7z y xx x x x =-=-+=-+,所以9.7 3.52( 1.4)x =-≈⨯-(吨)利润最大. 【点睛】本题考查线性回归直线方程,考查回归方程的实际应用.考查学生的数据处理能力,运算求解能力.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为3)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费.【详解】 (1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=>所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为010********x x --==因为10个分数的标准差6s == 所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元;将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元.【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)0.0075;(2)10户;(3)224a =,225.6x =.【分析】(1)由频率和为1列出方程求解x ;(2)求出三组用户的月平均用电量的频率推出比例关系,用20乘以月平均用电量在[)220,240的用户所占比例即可得解;(3)根据中位数左边和右边的直方图面积相等列出等式估计中位数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.【详解】(1)由直方图的性质可得 ()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=,解得0.0075x =,所以直方图中x 的值是0.0075.(2)因为月平均用电量为[)220,240,[)240,260,[)260,280的三组用户的频率分别为0.25、0.15、0.1,所以这三组用户的月平均用电量比例为5:3:2,所以月平均用电量在[)220,240的用户中应抽取5201010⨯=(户). (3)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,则()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=,解得224a =.平均数 1700.041900.192100.222300.252500.152700.12900.05x =⨯+⨯+⨯+⨯+⨯+⨯+⨯ 225.6=,所以月平均用电量的中位数为224,平均数为225.6.【点睛】本题考查统计案例、分层抽样、根据频率分布直方图估计总体的数字特征,属于中档题.。
(好题)高中数学必修三第一章《统计》测试题(答案解析)
一、选择题1.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量2.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>3.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A .40B .50C .80D .1004.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生5.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y 的值是( )A .12B .14C .16D .186.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读D.抽样表明,该校有50名学生为阅读霸7.如果在一次试验中,测得(x,y)的四组数值分别是A(1,3),B(2,3.8),C(3,5.2),D(4,6),则y与x之间的回归直线方程是 ()A.y=x+1.9 B.y=1.04x+1.9C.y=1.9x+1.04 D.y=1.05x-0.98.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,总体方差大于0 C.丙地:中位数为2,众数为3 D.丁地:总体均值为2,总体方差为3 9.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755的人数为()A.10 B.11C.12 D.1310.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为()A.112种B.100种C.90种D.80种11.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.3712.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费i x和年销售量()y i=数据作了初步处理,得到下面的散点图及一些统计量的值.1,2, (8)i有下列5个曲线类型:①ˆˆy bxa =+;②y d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___14.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||x a -=________.16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________.17.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________18.目前北方空气污染越来越严重,某大学组织学生参加环保知识竞赛,从参加学生中抽取40名,将其成绩(均为整数)整理后画出的频率分布直方图如图,若从成绩是80分以上(包括80分)的学生中选两人,则他们在同一分数段的概率为_______.19.一个容量为40的样本,分成若干组,在它的频率分布直方图中,某一组相应的小长方形的面积为0.4,则该组的频数是__________.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+的斜率和截距的最小二乘估计分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.22.某科研课题组通过一款手机APP 软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表: 周跑量(/km 周) [)10,15 [)15,20 [)20,25 [)25,30 [)30,35 [)35,40 [)40,45 [)45,50 [)50,55人数100120130180220150603010(1)在答题卡上补全该市1000名跑步爱好者周跑量的频率分布直方图:注意:请用2B铅笔在答题卡上作图,并将所作条形图涂黑.(2)根据以上图表数据,试求样本的中位数(保留一位小数).(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如下表:周跑量小于20公里20公里到40公里不小于40公里类别休闲跑者核心跑者精英跑者装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?23.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次[0,200](200,400](400,600]空气质量等级1(优)216252(良)510123(轻度污染)6784(中度污染)720(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,并根据列联表,判断是否有多少的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400≤ 人次400>空气质量好 空气质量不好附:22()()()()()n ad bc K a b c d a c b d -=++++. 24.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)25.在社会实践活动中,“求知”小组为了研究某种商品的价格x (元)和需求量y (件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料:该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.2.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.5.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.6.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.7.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.解析:D【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差9.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.10.A解析:A【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数.详解:∵8名女生,4名男生中选出3名学生组成课外小组,∴每个个体被抽到的概率是14,根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生,∴有C82•C41=112.故答案为:A.点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.12.B解析:B【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择.详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y=d或y=p+q ln x较适宜,故选B.点睛:本题考查散点图以及函数图像,考查识别能力.二、填空题13.【分析】首先求出xy的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直解析:21 4【分析】首先求出x,y的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a的一元一次方程,解方程即可.【详解】:14x=(1+2+3+4)=2.5,14y=(4.5+4+3+2.5)=3.5,将(2.5,3.5)代入线性回归直线方程是ˆy=-0.7x+a,可得3.5=﹣1.75+a,故a=214.故答案为21 4【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题14.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基解析:3【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为3s =. 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题.15.1【分析】先根据数列为等差数列求出再根据方差公式可得【详解】因为数列为等差数列且所以所以该组数据的方差为故填01【点睛】考查方差的计算基础题解析:1 【分析】先根据数列2{()}i x a -为等差数列求出()521i i x a =-∑,再根据方差公式可得.【详解】因为数列2{()}i x a -为等差数列,且3x a -=()()52231550.1=ii x a x a =-=-=⨯∑ 0.5,所以该组数据的方差为()52110.15i i x a =-=∑.故填0.1. 【点睛】考查方差的计算,基础题.16.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.17.【详解】分析:将数据由小到大排列好根据众数中位数平均数的概念得到相应的数据即可详解:根据提干得到中位数为b=15众数为c=17平均数为=a 故故答案为点睛:这个题目考查了中位数众数平均数的概念和计算较解析:a b c <<. 【详解】分析:将数据由小到大排列好,根据众数,中位数,平均数的概念得到相应的数据即可. 详解:根据提干得到中位数为b=15,众数为c=17,平均数为10+12+28+30+16+51=14.710=a.故 a b c <<. 故答案为a b c <<.点睛:这个题目考查了中位数,众数,平均数的概念和计算,较为基础,众数即出现次数最多的数据,中位数即最中间的数据,平均数即将所有数据加到一起,除以数据个数.18.【解析】设第二组及第五组数据对应矩形的高为a 则10×(a+0015+0025+0035+a+0005)=1解得a=0010故各组的频率依次为:010015025035010005∵前三组的累积频率为解析:715【解析】设第二组及第五组数据对应矩形的高为a , 则10×(a+0.015+0.025+0.035+a+0.005)=1, 解得a=0.010,故各组的频率依次为:0.10,0.15,0.25,0.35,0.10,0.05, ∵前三组的累积频率为:0.10+0.15+0.25=0.50, 故这次环保知识竞赛成绩的中位数为70; 成绩在[80,90)段的人数有10×0.010×40=4人, 成绩在[90,100]段的人数有10×0.005×40=2人,从成绩是80分以上(包括80分)的学生中任选两人共有15种不同的基本事件, 其中他们在同一分数段的基本事件有:7, 故他们在同一分数段的概率为7.15故答案为:7 15.19.16【解析】根据频率直方图的含义每组小矩形的面积就是该组数据在总体中出现的频率所以该组频数为故填16解析:16 【解析】根据频率直方图的含义,每组小矩形的面积就是该组数据在总体中出现的频率,所以该组频数为400.4=16⨯,故填16.20.【解析】因为平均数为所以方差为解析:45【解析】因为平均数为8,所以9,x = 方差为222214[10111]55++++=三、解答题21.(1) 1.60.2y x =+;(2)B 项目的收益更好. 【分析】(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出b 的值,最后将样本中心点的坐标代入回归方程求得a 的值即可;(2)分别利用所给关系式以及所求回归方程,求出A ,B 两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好. 【详解】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8, 所以1234535x ++++==,2357855y ++++==,22222212233547585351.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元; 因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元. 因为9.89.7>,所以可预测B 项目的收益更好. 【点睛】方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a=+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.22.(1)作图见解析;(2)中位数是29.2;(3)平均需要3720元. 【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图. (2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱. 【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=, 解得29.2x ≈.即样本中位数是29.2.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人, 核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人, 精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元.即该市每位跑步爱好者购买装备,平均需要3720元. 【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题. 23.(1)概率分别为:43100,27100,21100,9100;(2)350;(3)填表见解析;有95%的把握认为锻炼的人次与该市的空气质量有关.【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1,2,3,4的概率; (2)利用频率分布直方图估计样本平均值的方法可得得答案; (3)完善列联表,由公式计算卡方的值,从而查表即可,【详解】解:(1)该市一天的空气质量等级为1的概率为:2162543100100++=;该市一天的空气质量等级为2的概率为:5101227100100++=;该市一天的空气质量等级为3的概率为:67821100100++=; 该市一天的空气质量等级为4的概率为:7209100100++=; (2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:1000.203000.355000.45350x =⨯+⨯+⨯=;(3)根据所给数据,可得下面的22⨯列联表,由表中数据可得:2()100(3383722) 5.820 3.841()()()()70305545n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯, 所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 【点睛】本题考查了独立性检验与频率估计概率,估计平均值的求法,属于中档题.24.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为3)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯= (2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题. 25.(1) 1.534y x =-+;(2)详见解析. 【分析】(1)利用表中数据,分别求得:,x y ,再利用公式求得,b a ,然后写出回归直线方程即可. (2)根据(1)中的回归直线方程,令14x =, 22x =求得相应的y 值,再与实际值结合误差要求比较即可. 【详解】 由表中数据得: ()()1116182018,10747,33x y =++==++= 311610187204366i ii x y==⨯+⨯+⨯=∑,322221161820980ii x==++=∑,。
(好题)高中数学必修三第一章《统计》测试题(有答案解析)(1)
一、选择题1.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A .2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B .2019年1~4月的业务量同比增长率超过50%,在3月最高C .从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D .从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长2.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277; ②5,9,100,107,121,180,195,221,265,299; ③11,41,71,101,131,161,191,221,251,281; ④31,61,91,121,151,181,211,241,271,299. 关于上述样本的下列结论中,正确的是( ) A .②④都不能为分层抽样 B .①③都可能为分层抽样 C .①④都可能为系统抽样D .②③都不能为系统抽样3.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1964.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④5.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .507.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元8.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .1609.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变10.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.已知数据1x ,2x ,…,10x 的方差为1,且()()()222123222x x x -+-+-()2102170x ++-=,则数据1x ,2x ,…,10x 的平均数是________.15.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=16.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 17.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.18.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.19.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.20.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.三、解答题21.某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行跟踪调查,张三提供了该县某山羊养殖场年养殖数量y (单位:万只)与相应年份x (序号)的数据表和散点图(如图所示),根据散点图,发现y 与x 有较强的线性相关关系,李四提供了该县山羊养殖场的个数z (单位:个)关于x 的回归方程ˆ230zx =-+.年份序号x 1 2 3 4 5 6 7 8 9 年养殖山羊y /万只1.21.51.61.61.82.52.52.62.7y x (2)试估计:①该县第一年养殖山羊多少万只? ②到第几年,该县养殖山羊的数量与第1年相比减少了? 参考统计量:()92160ii x x =⋅-=∑,()()9112i i i x x y y =⋅--=∑.附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 22.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x2 3 4 5 6若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)24.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniiiii i nni ii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)25.两台机床同时生产直径为10的零件,为了检验产品质量,质量质检员从两台机床的产品中各抽取4件进行测量,结果如下:如果你是质量检测员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求.26.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:()1求频率分布直方图中a的值;()2以频率作为概率,试求消费者月饼购买量在600g1400g~的概率;()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【分析】由题意结合所给的统计图确定选项中的说法是否正确即可.【详解】对于选项A: 2018年1~4月的业务量,3月最高,2月最低,-=,接近2000万件,所以A是正确的;差值为439724111986对于选项B: 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B是正确的;对于选项C:2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C是正确的;对于选项D,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D错误.本题选择D选项.【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.2.B解析:B 【分析】根据系统抽样和分层抽样的定义分别进行判断即可. 【详解】若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个; 若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.综上所述,B 选项正确. 故选:B. 【点睛】本题主要考查系统抽样和分层抽样,掌握系统抽样和分层抽样的定义是解题的关键,属于基础题.(1)系统抽样适用于总体容量较大的情况.将总体平均分成若干部分,按事先确定的规则在各部分中抽取,在起始部分抽样时采用简单随机抽样;(2)分层抽样适用于已知总体是由差异明显的几部分组成的.将总体分成互不交叉的层,然后分层进行抽取,各层抽样时采用简单随机抽样或系统抽样.3.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.4.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯, 故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误.所以说法正确的是①③. 故选B. 【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.8.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题 9.A解析:A【分析】可以通过n P 与0P 之间的大小关系进行判断.【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001n n P P k P =+<,呈下降趋势.【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断. 10.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】 乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==== 因此s 1<s 2,选C.【点睛】本题考查标准差,考查基本求解能力.11.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数.详解:∵8名女生,4名男生中选出3名学生组成课外小组,∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112.故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应 解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等. 14.或6【分析】由数据…的方差为1且把所给的式子进行整理两式相减得到关于数据的平均数的一元二次方程解方程即可【详解】数据…的方差为1①②将②-①得解得或故答案为:或6【点睛】本题主要考查一组数据的平均数 解析:2-或6.【分析】由数据1x ,2x ,…,10x 的方差为1,且()()()()2222123102222170x x x x -+-+-++-=,把所给的式子进行整理,两式相减,得到关于数据的平均数的一元二次方程,解方程即可.【详解】 数据1x ,2x ,…,10x 的方差为1,()()()()22221231010x x x x x x x x ∴-+-+-++-=, ()()22221210121010210x x x x x x x x ∴++++-+++=, ()222212101010x x x x ∴+++-=,① ()()()()2222123102222170x x x x -+-+-++-=, ()()22212101210440170x x x x x x ∴+++-++++=, ()22212104040170x x x x ∴+++-+=,② 将②-①得24120x x --=,解得2x =-,或6x =,故答案为:2-或6.【点睛】本题主要考查一组数据的平均数的求法,解题时要熟练掌握方差的计算公式的灵活运用,属于中档题.15.【分析】(1)由回归方程知相关变量与成负相关(2)为假命题则同时为假命题为假命题则中至少有一假命题(3)全称命题与特称命题转换条件不变结论变相反(4)由正态曲线的对称性可解【详解】(1)由回归方程知解析:(2)【分析】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题(3)全称命题与特称命题转换条件不变,结论变相反 (4)由正态曲线的对称性可解.【详解】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,若变量x 增加一个单位,则y 平均增加4-个单位,故(1)错误(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题,所以“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件是正确的.故(2)正确 (3)全称命题与特称命题转换条件不变,结论变相反,故(3)错误(4)由正态曲线的对称性知,随机变量()22X N σ~,,若()0.32P X a <=,对称轴是2x = ,则()40.32P X a >-=,故(4)错误.故答案为; (2)【点睛】 利用正态曲线的对称性求概率是常见的正态分布应用问题.解题的关键是利用对称轴=x μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时可借助图形判断.对于正态分布2()N μσ,,由=x μ是正态曲线的对称轴知: (1)对任意的a ,有()()P X a P X a μμ<->+=;(2)()001;()P X x P X x -≥=<;(3)()()=()P a X b P X b P X a <<<≤-.16.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以 解析:①②④【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解.【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确;根据相关指数的概念,可得2R 越大说明拟合效果越好,所以③不正确;若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间负相关,且线性相关性强,所以④正确;故答案为:①②④.【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.17.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题 解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b+的最小值.【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,故18,712,118a b a b a b ++=≤≤≤=, 49149()()18a b a b a b+=++ 149125(13)(13181818b a a b =++≥+= 当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518. 故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题. 18.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】 由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为3s =. 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题. 19.5【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5【解析】19.5,15,5m y x +== 将样本中心代入回归方程得到m=5.5. 故答案为:5.5. 20.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630.三、解答题21.(1)ˆ0.21yx =+;(2)①33.6万只;②到第10年该县养殖山羊的数量相比第1年减少了.【分析】(1)由已知求得,x y ,进一步套公式求出ˆb和ˆa 的值,就求出线性回归方程; (2)由题意求得()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++, 在①中,令x =1求解,在②中,令20.443033.6x x -++<,解不等式即可.【详解】解:(1)设y 关于x 的线性回归方程为y bx a =+,12345678959x ++++++++==, 1.2 1.5 1.6 1.6 1.8 2.5 2.5 2.6 2.729y ++++++++==, ()()()9192112ˆ0.260i ii i i x x y y b x x ==--===-∑∑, ˆ20.251a=-⨯=. 所以y 关于x 的线性回归方程为ˆ0.21yx =+. (2)估计第x 年山羊养殖的只数为()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++ 令1x =,则0.443033.6-++=,故该县第一年养殖山羊约33.6万只.由题意,得20.443033.6x x -++<,整理得()()910x x -->,解得9x >或1x <(舍去),所以到第10年该县养殖山羊的数量相比第1年减少了.【点睛】方法点睛:求线性回归方程的步骤:(1)先求 x 、y 的平均数,x y ;(2)套公式求出ˆb和ˆa 的值:()()()91921ˆi i i i i x x y y b x x ==--=-∑∑,ˆa y b x =-⨯;(3)写出回归直线的方程. 22.(1)0.5 2.3y x =+;(2)6800元.【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程;(2)将9x =代入即可预测.【详解】 解:(1)由表可得:123456747++++++==x , 2.9 3.3 3.6 4.4 4.8 5.2 5.9 4.37y ++++++==, 又77211134.4,140ii i i i x y x ====∑∑, 71722217134.474 4.30.5140747i ii i i x y x y b x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元.【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.23.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值.【详解】(1)4x =,5y =,52190ii x==∑,51112.3i i i x y ==∑, 12215 1.235n ii i n ii x y xy b xx ==-==-∑∑,0.08a y bx =-=,所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元.【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.24.(1)ˆ0.150.9yx =+;(2)2.25万元. 【分析】(1)由已知数据求出x 和y ,根据所给公式求出ˆb与ˆa 的值,即可得y 关于x 的线性回归方程;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可.【详解】解:(1)依题意可计算得,1(24466677810)610x =+++++++++=, 1(1.0 1.5 1.6 2.0 1.8 1.9 1.8 2.0 2.1 2.3) 1.810y =+++++++++=. 236x =,10.8x y ⋅=,又101115ii i x y ==∑,1021406i i x ==∑, 1022110151ˆ0.1100i i i i i x y x y b xx ==∴=≈⋅--∑∑,ˆˆ0.9ay bx =-=,ˆ0.150.9y x ∴=+, ∴所求的线性回归方程为ˆ0.150.9yx =+. (2)当9x =时,ˆ0.1590.9 2.25y=⨯+=(万元), ∴估计大多数年收入9万元的家庭每年饮食支出约为2.25万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题.25.机床乙的零件质量更符合要求,运算见解析.【详解】 先考虑各自的平均数:设机床甲的平均数、方差分别为211x s 、; 机床乙的平均数、方差分别为222x s 、. 1109.81010.2104x +++==,210.1109.910104x +++== ∴两者平均数相同,再考虑各自的方差: 2222211[(1010)(9.810)(1010)(10.210)]0.024s =-+-+-+-= 2222221[(1010)(10.110)(1010)(9.910)]0.0054s =-+-+-+-= ∵2212s s >,∴机床乙的零件质量较稳定,乙更符合要求.26.(1)a 0.001=;(2)0.62;(3)12.08吨【分析】(1)由频率分布直方图列出方程能求出a .(2)由频率分布直方图先求出满足题意的频率,即得概率.(3)由频率分布直方图先求出人均月饼购买量,由此能求出该超市应准备12.08吨月饼恰好能满足市场需求.【详解】 ()1由()0.00020.00055a 0.00050.000254001++++⨯=,解得a 0.001=.()2消费者月饼购买量在600g 1400g ~的频率为:()0.000550.0014000.62+⨯=,∴消费者月饼购买量在600g 1400g ~的概率为0.62.()3由频率分布直方图得人均月饼购买量为:()4000.00028000.0005512000.00116000.000520000.000254001208g ⨯+⨯+⨯+⨯+⨯⨯=,∴2012085%1208⨯⨯=万克12.08?=吨,∴该超市应准备12.08吨月饼恰好能满足市场需求.【点睛】本题考查用样本的频率分布估计总体分布及识图的能力,求解的重点是对题设条件及直方图的理解,了解直方图中每个小矩形的面积的意义,是中档题.。
(好题)高中数学必修三第一章《统计》检测卷(有答案解析)(3)
一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15B .45,45,45C .45,60,30D .30,90,152.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm 的株数n 是 ( )A .30B .60C .70D .803.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x甲,x乙及方差2s甲,2s乙的关系为( )A.x甲>x乙,2s甲>2s乙 B.x甲>x乙,2s甲<2s乙 C.x甲<x乙,2s甲<2s乙 D.x甲<x乙,2s甲>2s乙6.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是()A.45 B.47 C.48 D.637.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则()A.B.C.D.8.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为()A.0795 B.0780 C.0810 D.08159.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,总体方差大于0 C.丙地:中位数为2,众数为3 D.丁地:总体均值为2,总体方差为3 10.为了考察两个变量x和y之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是()A.直线l1和l2有交点(s,t)B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合11.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A .40B .45C .48D .5012.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.14.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.15.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.16.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.17.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.18.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 19.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.20.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.三、解答题21.某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x (单位:万元)和产量y (单位:吨)的数据,用两种模型①y bx a =+,②y x a =+分别进行拟合,得到相应的回归方程111.2 2.0y x =+,228.29.8y x =,进行残差分析得到如图所示的残差值及一些统计量的值: 月份 1 2 3 4 5 6 3.5x =41y =611049i ii x y==∑62191ii x==∑投入量x (万元) 1 2 3 4 5 6 产量y (吨) 13 22 4345 55 68 模型①的残差值 -0.2 -2.4-1.8 -3 -1.2 模型②的残差值-5.4-8.04.0-1.61.69.0(1)求上表中空格内的值;(2)残差值的绝对值之和越小说明模型拟合效果越好,根据残差比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(3)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(2)中所选模型的回归方程.(参考公式:i i ie y bx a =--,1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-)22.为提高某作物产量,种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了10块试验田的数据,得到下表:技术人员选择模型21y a bx =+作为y 与x 的回归方程类型,令2i i u x =,1ii v y =. (1)由最小二乘法得到线性回归方程v u βα=+,求y 关于x 的回归方程; (2)利用(1)得出的结果,计算当单位面积播种数x 为何值时,单位面积的总产量w xy =的预报值最大?(计算结果精确到0.01)附:对于一组数据()11,u v ,()22,u v …(),n n u v 其回归直线v u βα=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-.参考数据:1500nii u==∑,140ni i v ==∑,12321n i i i u v ==∑,2135642ni i u ==∑ 5.48≈.23.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniii ii i nni i i i x x y y x y nxybay bx x x x nx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某公司有400名员工,根据男女员工人数比例,用分层随机抽样的方法从中抽取了100人,调查他们的通勤时间(上下班途中花费的总时间,单位:分钟),将数据按照[)20,30,[)30,40,,[]80,90分成7组,并整理得到如下频率分布直方图:(I )从总体中随机抽取1人,估计其通勤时间小于40分钟的概率; (Ⅱ)求样本数据的中位数的估计值;(Ⅲ)已知样本中通勤时间大于或等于60分钟的人都是男员工,通勤时间小于60分钟的人中有一半是男员工,求该公司男员工的人数.26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.C解析:C解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.5.C【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.8.A解析:A【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为100020 50=所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.9.D解析:D【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差10.A解析:A【分析】由题意知,两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,所以两组数据的样本中心点是(s,t),回归直线经过样本的中心点,得到直线l1和l2都过(s,t).【详解】∵两组数据变量x的观测值的平均值都是s,对变量y的观测值的平均值都是t,∴两组数据的样本中心点都是(s,t)∵数据的样本中心点一定在线性回归直线上,∴回归直线l1和l2都过点(s,t)∴两条直线有公共点(s ,t ) 故选A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与Y 之间的关系,这条直线过样本中心点.11.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.12.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127;128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139; 140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4 【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=. 若13x =时,则()()()()2222234577774x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0, 此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9, 此时12345,,,,x x x x x 为4,6,7,8,10,符合题意. 故答案为:4 【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题.14.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.15.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论16.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】试题分析:由平均数及方差的定义可得10685675x ++++==;222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==.考点:样本数据的数字特征:平均值与方差.17.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.18.2【解析】分析:直接利用回归方程将代入即可求得的估计值详解:∵回归方程为∴当时的估计值为故答案为82点睛:本题考查回归方程的运用考查学生的计算能力属于基础题解析:2 【解析】分析:直接利用回归方程,将25x =代入,即可求得y 的估计值. 详解:∵回归方程为0.4 1.8y x =-,∴当25x =时,y 的估计值为 0.425 1.88.2y =⨯-=.故答案为8.2.点睛:本题考查回归方程的运用,考查学生的计算能力,属于基础题.19.8【解析】由题意得从名学生中采用系统抽样的方法抽取名学生需要把名学生平均分成组每组人设第一组抽取的号码为则第组抽取的号码为解得点睛:本题考查了抽样方法中的系统抽样问题对于系统抽样的抽法是先对总体编号解析:8 【解析】由题意得,从800名学生中采用系统抽样的方法抽取25名学生,需要把800名学生平均分成25组,每组8003225=人, 设第一组抽取的号码为x ,则第5组抽取的号码为432136x +⨯=,解得8x =.点睛:本题考查了抽样方法中的系统抽样问题,对于系统抽样的抽法是先对总体编号,根据样本平均分组,确定组距,再在第一组中抽取一个编号,依次等距抽取,其中把握系统抽样的原则是解答此类问题的关键.20.5【解析】根据频率分布直方图得;∵002×5+004×5=03<0503+008×5=07>05;∴中位数应在20∼25内设中位数为x 则03+(x−20)×008=05解得x=225;∴这批产品的中解析:5 【解析】根据频率分布直方图,得; ∵0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5; ∴中位数应在20∼25内, 设中位数为x ,则 0.3+(x −20)×0.08=0.5, 解得x =22.5;∴这批产品的中位数是22.5. 故答案为22.5.点睛:用频率分布直方图估计总体特征数字的方法: ①众数:最高小长方形底边中点的横坐标;②中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标; ③平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.三、解答题21.(1)7.4;(2)选模型①,理由见解析;(3)111y x =+. 【分析】(1)根据i i ie y bx a =--,结合表中所给数据,即可求得空格内的值;(2)分别计算出模型①和模型②的残差值绝对值之和,比较其大小,即可求得应选择哪一个模型;(3)根据所给数据计算出x ,y ,51i ii x y =∑,521ii x=∑,带入1221ni ii nii x y nx yb xnx==-=-∑∑,即可求得答案. 【详解】(1)根据i i ie y bx a =--∴空格处的值为()43311.2 2.07.4-⨯+=(2)应选择模型①模型①的残差值的绝对值之和为0.2 2.47.4 1.83 1.216+++++= 模型②的残差值的绝对值之和为5.48.0 4.0 1.6 1.69.029.6+++++=1629.6<∴模型①的拟合效果好,应该选模型①.(3)剔除异常数据,即剔除3月份的数据后, 得()13.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.211825 3.6 3.617.25i ii i i x y x yb x x==--⨯⨯====-⨯⨯-∑∑,40.611 3.61a y bx =-=-⨯=.所以y 关于x 的回归方程为111y x =+. 【点睛】本题解题关键是掌握残差的定义和回归直线方程的求解步骤,考查了分析能力和计算能力,属于中档题. 22.(1)212.50.03y x=+;(1)9.13x =棵2/m . 【分析】(1)先利用公式和数据计算,αβ,即得v 关于u 的线性回归方程,再代入得到y 关于x 的回归方程即可;(2)先利用(1)的结果计算w xy =,再利用基本不等式求其最大值即可. 【详解】解:(1)由题意得115010n i i u u ===∑,11410ni i v v ===∑, ∴1011022212321105040.033564210501010i i i i i u v u vu uβ==-⨯⨯=⨯⋅--≈=-∑∑, 2.5v u αβ=-=.所以v 关于u 的线性回归方程为0.03 2.5v u =+.则y 关于x 的回归方程为212.503ˆ0.yx =+.(2)根据(1)的结果并结合条件,单位面积的总产量的预报值21252.50.030.03x w x x x==++ 1.83≤=≈. 当且仅当2.50.03x x =时,等号成立,此时9.133x =≈. 即当9.13x =棵2/m 时,单位面积的总产量w 的预报值最大,最大值是1.83.【点睛】本题考查了非线性回归方程的求法以及方程的应用,属于中档题.23.(1)ˆ0.150.9yx =+;(2)2.25万元. 【分析】(1)由已知数据求出x 和y ,根据所给公式求出ˆb与ˆa 的值,即可得y 关于x 的线性回归方程;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】解:(1)依题意可计算得, 1(24466677810)610x =+++++++++=, 1(1.0 1.5 1.6 2.0 1.8 1.9 1.8 2.0 2.1 2.3) 1.810y =+++++++++=. 236x =,10.8x y ⋅=,又101115i ii x y==∑,1021406i i x ==∑,1022110151ˆ0.1100ii i iix y x ybxx==∴=≈⋅--∑∑,ˆˆ0.9ay bx =-=,ˆ0.150.9y x ∴=+, ∴所求的线性回归方程为ˆ0.150.9yx =+. (2)当9x =时,ˆ0.1590.9 2.25y=⨯+=(万元), ∴估计大多数年收入9万元的家庭每年饮食支出约为2.25万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 25.(Ⅰ)0.6;(Ⅱ)37.5;(Ⅲ)220. 【分析】(Ⅰ)根据频率分布直方图求解即可;(Ⅱ)先根据频率分布直方图判断中位数落在哪一区间上,然后利用中位数将频率分布直方图的面积分为相等的两部分求解;(Ⅲ)先计算出样本中男员工的人数,计算出男员工所占的比例,然后估计总体中男员工的人数. 【详解】解:(1)由频率分布直方图可知,样本中通勤时间小于40的概率()100.020.040.6p =⨯+=,故从总体中随机抽取1人,估计其通勤时间小于40分钟的概率也为0.6.(Ⅱ)由图可知,样本的中位数位于[)30,40之间,设中位数为x,则()0.2300.040.5x+-⨯=,解得37.5x=,故中位数为37.5.(Ⅲ)样本中通勤时间大于或等于60分钟的人的概率为0.1,共10人,通勤时间小于60分钟的人的频率为0.9,其中男员工有11000.9452⨯⨯=人,所以样本中男员工共有55人,占样本容量的55%,故该公司男员工人数为40055%220⨯=人.【点睛】本题考查频率分布直方图的应用,考查用样本估计总体,难度一般.26.(1)分布列见解析,1;(2)0.10=P,理由见解析.【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X的取值可能为0,1,2,然后计算概率得出分布列及其数学期望;(2)按照公式计算2K的值,然后由临界值表得出结果即可.【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
北师大版高中数学必修三第一章《统计》测试(含答案解析)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .333.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量4.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.55.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度6.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④7. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .639.已知x ,y 取值如下表:x0 1 4 5 6 8 y1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.1310.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.212.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带 租户业主已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.18.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________19.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.20.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.三、解答题21.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t==--=-∑∑,a y bt =-.(参考数据:()()616.3iii t t y y =--=∑)22.画糖人是一种以糖为材料在石板上进行造型的民间艺术.某糖人师傅在公园内画糖人,每天卖出某种糖人的个数与价格相关,其相关数据统计如下表: (1)根据表中数据求y 关于x 的回归直线方程;(2)若该种造型的糖人的成本为2元/个,为使糖人师傅每天获得最大利润,则该种糖人应定价多少元?(精确到1元)参考公式:回归直线方程^^^y b x a =+,其中^121()()()niii nii x x y y b x x ==--=-∑∑,^^^a y b x =-.23.某“双一流”大学专业奖学金是以所学专业各科考试成绩作为评选依据,分为专业一等奖学金(奖金额3000元)、专业二等奖学金(奖金额1500元)及专业三等奖学金(奖金额600元),且专业奖学金每个学生一年最多只能获得一次.图(1)是统计了该校2018年500名学生周课外平均学习时间频率分布直方图,图(2)是这500名学生在2018年周课外平均学习时间段获得专业奖学金的频率柱状图.(Ⅰ)求这500名学生中获得专业三等奖学金的人数;(Ⅱ)若周课外平均学习时间超过35小时称为“努力型”学生,否则称为“非努力型”学生,列22⨯联表并判断是否有99.9%的把握认为该校学生获得专业一、二等奖学金与是否是“努力型”学生有关?(Ⅲ)若以频率作为概率,从该校任选一名学生,记该学生2018年获得的专业奖学金额为随机变量X ,求随机变量X 的分布列和期望.22()()()()()n ad bc K a b c d a c b d -=++++24. 2.5PM 是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM 的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM 浓度的数据如下表:时间周一 周二 周三 周四 周五 车流量x (万辆)50 51 54 57 58 2.5PM 的浓度y (微克/立方米)3940424445(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标; (2)用最小二乘法求出y 关于x 的线性回归方程y bx a =+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM 的浓度是多少?(参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-)25.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下: x 的分组 [0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).26.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案(1)规定每日底薪50元,快递骑手每完成一单业务提成3元;方案(2)规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单提成5元.该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[)25,35、[)35,45、[)45,55、[)55,65、[)65,75、[)75,85、[]85,95七组,整理得到如图所示的频率分布直方图.(1)求直方图中a 的值;(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替);(3)假设公司中所有骑手都选择了你在(2)中所选的方案,已知公司现有骑手400人,某骑手希望自己的收入在公司众骑手中处于前100名内,求他每天的平均业务量至少应达多少单?【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 3.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.4.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.5.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.6.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯,故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误.所以说法正确的是①③.故选B.【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.7.C解析:C【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果.【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确;从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确;从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确;由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C.【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键. 8.A解析:A【解析】【分析】由茎叶图确定所给的所有数据,然后确定中位数即可.【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63,最中间的数为:45,所以,中位数为45.本题选择A 选项.【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.9.D解析:D【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果.详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=, 因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.10.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】 乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==== 因此s 1<s 2,选C.【点睛】本题考查标准差,考查基本求解能力.11.C解析:C【分析】 首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可.【详解】 由题意可得:12345305x x x x x x ++++==, 线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==.本题选择C 选项.【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.12.C解析:C【解析】【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可【详解】()19.59.39.18.99.79.35x =⨯++++= ()19289898793905y =⨯++++= 代入到回归方程为7.5ˆyx a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。
(完整word版)必修三统计练习题及解答
、选择题1某校有40个班,每班有50人,每班选派3人参加"学代会”,在这个问题中样本容量是 (). 2 .要从已编号(1 — 50)的50枚最新研制的某型号导弹中随机抽取 每部分选取的号码间隔一样的系统抽样方法确定所选取的 5枚导弹的编号可能是(). C. 1 , 2, 3, 4, 5 D. 2, 4, 8, 16, 323•某单位有老年人 27人,中年人54人,青年人81人,为了调查他们身体状况的某项指 标,需从他们中抽取一个容量为 36的样本,适合抽取样本的方法是().A.抽签法B.系统抽样C.随机数表法 D .分层抽样4•为了解某年级女生的身高情况,从中抽出20名进行测量,结果如下:(单位:cm ) 149 159 142 160 156 163 145 150148 151156144 148149 153143 168168 152 155 在列样本频率分布表的过程中,如果设组距为 4 cm ,那么组数为(). A. 4B. 5C. 6D. 75 •右图是由容量为100的样本得到的频率分布直方图. 其中前4组的频率成等比数列,后6组的频数成等差数列,设最行业名称计算机 机械 营销 物流 贸易 应聘人数215 830200 250154 67674 57065 280行业名称计算机 营销 机械 建筑 化工招聘人数124 620 102 935 89 115 76 51670 436若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况, 则根据表中的数据,就业形势一定是(). A.计算机行业好于化工行业 B.建筑行业好于物流行业 C.机械行业最紧张D.营销行业比贸易行业紧张&从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是 1.5 ,第二章统计A. 40B. 50C. 120D. 150 5枚来进行发射试验,用 A. 5, 10, 15, 20, 25 B. 3, 13, 23, 33, 43 10 [(x1 — 20)2 + (x2 — 20)2+…+ (x10 — 20)2]中,数字10和20分别表示(). A.数据的个数和方差 B.平均数和数据的个数 C.数据的个数和平均数D.数据组的方差和平均数7•某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:I. 6 , 1.4 , 1.6 , 1.3 , 1.4 , 1.2 , 1.7 , 1.8(单位:千克).依此估计这240尾鱼的总质量大约是().A. 300克B. 360千克C. 36千克D. 30千克9. 为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为11,12,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是().A. 直线11和12 一定有公共点(s,t)B. 直线l1和l2相交,但交点不-C. 必有直线l1 // l2D. 直线l1和l2必定重合10. 工人工资(元)依相应产值(千元)变化的回归方程为? = 50 + 80x,下列判断正确的是().A. 产值为1 000元时,工资为130元B. 产值提高1 000元时,工资提高80元C. 产值提高1 000元时,工资提高130元D. 当工资为250元时,产值为2 000元二、填空题:II. 某工厂生产A , B, C 三种不同型号的产品,产品数量之比依次为 2 : 3 : 5 .现用分层抽样方法抽出一个容量为n的样本,样本中A种型号的产品有16件,那么此样本的容量n 12. 若总体中含有1 650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除___________ 个个体,编号后应均分为___________ 段,每段有______ 个个体.13. 管理人员从一池塘内捞出30条鱼,做上标记后放回池塘.10天后,又从池塘内捞出50条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内共有______________ 条鱼.14. 已知x, y之间的一组数据:y与x之间的线性回归方程? = bx+ a必过定点 ____________ .15.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一数学分数(x)和初二16. 一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是17•某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?18•某单位有118名员工,为了完成本月的生产任务,现要从中随机抽取16人加班•请用系统抽样法选出加班的人员.19. 写出下列各题的抽样过程:(1 )请从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本.(2 )某车间有189名职工,现在要按1 : 21的比例选派质量检查员,采用系统抽样的方法进行.(3) —个电视台在因特网上就观众对某一节目喜爱的程度进行调查,被调查的总人数为12 000人,其中持各种态度的人数如下:很喜爱喜爱一般不喜爱2435 4 567 3 926 1 072打算从中抽取60人进行详细调查,如何抽取?20. 有一种鱼的身体吸收水银,水银的含量超过1.00 ppm(即百万分之一)时就会对人体产生危害.在30条鱼的样本中发现的水银含量是:0.07 0.24 0.95 0.98 1.02 0.98 1.37 1.40 0.39 1.021.44 1.58 0.54 1.08 0.61 0.72 1.20 1.14 1.62 1.681.85 1.20 0.81 0.82 0.84 1.29 1.262.10 0.91 1.31(1) 用前两位数作为茎,做出样本数据的茎叶图;(2) 描述一下水银含量的分布特点;(3) 从实际情况看,许多鱼的水银含量超标在于有些鱼在出售之前没有被检查过•那么,这种鱼的水银含量的平均水平都比 1.00 ppm大吗?(4) 求出上述样本数据的均值和标准差;(5) 有多少条鱼的水银含量在均值减加两倍标准差的范围内?第二章统计参考答案一、选择题1. C解析:样本容量等于40X 3 = 1 20.2. B解析:根据系统抽样的规则,1到10 一段,11到20 一段,如此类推,每段10个号码,那么每一段上都应该有号码.3. D解析:总体是由差异明显的几部分组成的.4. D解析:由于组距为4 cm,故可分组为142〜146,146〜150, 150- 154,154〜158, 158〜162 , 162〜166, 166〜170.5. A解析:由题意共有100个人.前4组频率成等比数列,由图知:第一组频率为0.01 ;第二组频率为0.03 ;所以a= 0.27 .前 3 组有100X (0.01 + 0.03 + 0.09) = 13 人,后 6 组共87 人,6组人数成等差数列,所以首项为27, s6 = 87,得d =- 5, s4 = 78,即b= 78.6. C1 n々(x- x)2解析:对照公式s2= n y 即可知道.7. B解析:从表中可以看出,计算机行业应聘人数与招聘人数都比较多,但录用率约占58%.化工行业招聘名额70 436虽少,但应聘它的人数少于应聘贸易行业的人数(65 280),录用率大于58%故A不正确.对于建筑行业,应聘人数少于招聘人数,显然好于物流行业.机械行业录用率约46%但物流、贸易招聘人数未知,无法比较得出机械行业最紧张.营销行业招聘人数与应聘人数的比约为 1 : 1.5,但贸易行业招聘数不详,无法比较.& B解析:从草鱼240尾,中任选9尾,这9尾鱼具有代表性,由此可由样本估计总体的情况. 9尾鱼中每尾鱼的平均质量为x= 9(1.5 + 1.6 + 1.4 + 1.6 + 1.3 + 1.4 + 1.2 + 1.7 + 1.8) = 1.5(千克),240 X 1.5 = 360(千克).9. A解析:线性回归直线方程为? = a+ bx,而a= y _bx,即a = t —bs, t = a+ bs .•••(s , t)在回归直线上,即直线l1和l2必有公共点(s , t).10. B解析:回归直线斜率为80,所以x每增加1, ?增加80,即劳动生产率提高1千元时,工资提咼80兀.二、填空题:11. 答案:80.16解析:n= 2 x (2 + 3+ 5)= 80.12. 答案:5; 35; 47.解析:1 650除以35商47余5,•••剔除5个个体.分为35段,每段47个个体.13 .答案:750 .50解析:30 X 2 = 750 (条).14. 答案:(1.167 5 , 2.392 5).解析:必过四组数据的平均数,即(1.167 5 , 2.392 5).15. 答案: y= 1.218x - 14.191 .解析:代入求a, b值的公式,解得? = 1.218x - 14.191 .16. 答案: * = 0.118 1 + 0.003 585x .“ 10 10_ 1 _ 2X =—无x =762,瓦(X i -X) =1 297 860解析:10 i 1 i 1,10y =2.85,二(X i -X)(y i「y) =4 653i 1三、解答题:17. [解析]简单随机抽样一般采用两种方法:抽签法和随机数表法.解法1:(抽签法)将100件轴编号为1, 2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00, 01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个随机数为68, 34, 30, 13, 70, 55, 74, 77, 40, 44,这10个号即所要抽取的样本号.18. 解析:(1)对这118名员工进行编号;118⑵计算间隔k = 16 = 7.375 ,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样.例如我们随机剔除了3, 46, 59, 57 , 112, 93这6名员工,然后再对剩余的112位员工进行编号,计算间隔k = 7;(3)在1〜7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12 ,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.19. 解析:(1)①将总体的500个分数从001开始编号,一直到500号;②从随机数表第1页第1行第2至第4列的347号开始使用该表;③抄录入样号码如下:347 437 386 469 011 410 145 073 245 276 329 050 176 099 061030 227 482 378 096 164 001 068 047 025 212 016 105 443 212④按以上编号从总体中将相应的分数提取出来组成样本,抽样完毕.(2)采取系统抽样.189-21= 9,所以将189人分成9组,每组21人,在每一组中随机抽取1人,这9人组成样本. (3)采取分层抽样.总人数为12 000 人,12 000 - 60 = 200,2 435 4 567200 = 12 …35(人),200 = 22 …167(人),3 926 1 072200 = 19…126(人),200 = 5…72(人).所以从很喜爱的人中剔除35人,再抽取12人;从喜爱的人中剔除167人,再抽取22人;从一般喜爱的人中剔除126人,再抽取19人;从不喜爱的人中剔除72人,再抽取5人. 20. 解析:(1)茎叶图为:⑵汞含量分布偏向于大于 1.00 ppm的方向,即多数鱼的汞含量分布在大于 1.00 ppm的区域.⑶不一定.因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同•即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于 1.00 ppm .⑷样本平均数X疋1.08,样本标准差s~ 0.45 .(5)有28条鱼的汞含量在平均数与两倍标准差的和(差)的范围内.。
(完整版)高一数学必修三《统计》知识点+练习+答案(最新整理)
三、
⑥控制图
总体特征的估计
中心线——y=μ 上界线——y=μ+3σ 下界线——y=μ-3σ
1、特征数:总体平均数 μ
总体方差 2 总体标准差
样本平均数 x
样本方差 s2 或 s*2
样本标准差
s 或 s*
1 2、有关公式:样本平均数 : x = (x1+x2 +...+xn)
n
样本方差
1 : s2 或 s*2 s 2= n [(x1- x )2+(x2+ x )2+...+(xn- x )2]
样本,则抽取的 m 个个体中带有标记的个数估计为( )
m
A. N·
M
M
B. m·
N
M
C. N·
D. N
m
8.从 60 件产品中抽取 10 件进行检查,写出抽取样本的过程.
9.某车间工人已加工一种轴 100 件,为了了解这种轴的直径,要从中抽出 10 件在同一条件 下测量(轴的直径要求为 20 mm±0.5 mm),如何采用简单随机抽样法抽取上述样本?
当总体由差异 明显的几部分 组成时,常将 总体分成几部 分,然后按照 各部分所占的 比进行抽样, 这样的抽样叫 ∽。其中分成 的各部分叫做 层。
各自
要点
从总 体中 逐个 抽取
总体 均分 成几 部分 按事 先确 定的 规则 在各 部分 抽取 将总 体分 成几 层, 分层 进行 抽取
方法步骤
1、 抽签法: ①编②放③抽
必修三统计知识点
一、
类 别 内 容 名 称
简 单 随 机 抽 样
系 统 抽 样
分 层 抽 样
抽样方法
定义
(压轴题)高中数学必修三第一章《统计》测试题(包含答案解析)(3)
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .3.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =4.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元5.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙6.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生7.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .188.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是( ) A .31号B .32号C .33号D .34号10.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( )A .10B .11C .12D .1311.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1812.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.15.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.16.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____17.已知一组数据126,,,x x x ⋅⋅⋅的方差是2,并且()()()22212611118x x x -+-+⋅⋅⋅+-=,0x ≠,则x =______.18.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 19.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.20.能够说明“若甲班人数为m ,平均分为a ;乙班人数为n n m ≠(),平均分为b ,则甲乙两班的数学平均分为2a b+”是假命题的一组正整数a ,b 的值依次为_____. 三、解答题21.某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行跟踪调查,张三提供了该县某山羊养殖场年养殖数量y (单位:万只)与相应年份x (序号)的数据表和散点图(如图所示),根据散点图,发现y 与x 有较强的线性相关关系,李四提供了该县山羊养殖场的个数z (单位:个)关于x 的回归方程ˆ230z x =-+.年份序号x 1 2 3 4 5 6 7 8 9 年养殖山羊y /万只1.21.51.61.61.82.52.52.62.7y x (2)试估计:①该县第一年养殖山羊多少万只? ②到第几年,该县养殖山羊的数量与第1年相比减少了? 参考统计量:()92160ii x x =⋅-=∑,()()9112i i i x x y y =⋅--=∑.附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表:①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.23.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格.(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下:用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700iii x x yy =--=∑,6214126ii x==∑,61240i i y ==∑,()6218816i i y y=-=∑,8.4≈786≈.24.2020年新冠肺炎疫情肆虐全球,各地医疗部门迅速进行防控意识宣传和流行病学调查.某疫区随机抽取100人调查其外出时佩戴口罩的情况,结果如下表.(1)是否有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)该疫区某新冠肺炎定点治疗医院统计了确诊患者中年龄x (单位:岁)的重症患者比例(单位:%),得到下表:若y 与x 之间具有线性相关关系,请用最小二乘法求出y 关于x 的线性回归方程y bx a =+,并预测该医院76岁确诊患者中的重症比例.参考公式和数据:用最小二乘法求线性回归方程系数公式:1221ni ii nii x y nx yb xn x=-=-=-∑∑,a y bx =-.817010.5657.5637.553 5.552 4.545 3.540 1.5320.52454i ii x y==⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=∑.82222222217065635345403223256i i x==++++++=∑.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 26.某校为“全国数学联赛”选拔人才,分初赛和复赛两个阶段进行,规定:分数不小于本次考试成绩中位数的具有复赛资格,该校有900名学生参加了初赛,所有学生的成绩均在区间(]30,150内,其频率分布直方图如图.(1)根据频率分布直方图,估计获得复赛资格应划定的最低分数线; (2)根据频率分布直方图,估计本次初赛的平均成绩.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.C解析:C 【分析】根据平均数和方差公式计算比较即可. 【详解】设这个班有n 个同学,分数分别是123,,,,n a a a a ⋅⋅⋅,假设第i 个同学的成绩没录入,这一次计算时,总分是()1n x -,方差为()()()()()222222121111i i n s a x a x a x a x a x n -+⎡⎤=-+-+⋅⋅⋅+-+-+⋅⋅⋅+-⎣⎦-; 第二次计算时,()11n nxx x -+=x =,方差为()()()()()()222222221121111++i i i n n s a x a x a x a x a x a x s n n-+-⎡⎤=-+-⋅⋅⋅-+-+-+⋅⋅⋅+-=⎣⎦故有1x x =,221s s >.故选:C 【点睛】本题主要考查样本的平均数和方差公式;属于中档题.4.B解析:B 【解析】 【分析】先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.5.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.6.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C .【点睛】本题主要考查系统抽样.7.A解析:A【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案.【详解】由题,因为中位数为12,所以242x y x y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小此时4212x y +=故选A【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.8.B解析:B【详解】 试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆy bx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a ,∴ˆa=9.1, ∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5考点:线性回归方程9.C解析:C【解析】【分析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷,已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.10.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.11.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】根据题意得,用分层抽样在各层中的抽样比为421 105020=,则在高三年级抽取的人数是14001625⨯=人,故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.12.A解析:A【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数.详解:∵8名女生,4名男生中选出3名学生组成课外小组,∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112.故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.331【分析】分段抽样由抽取时的分段间隔是20利用等差数列知识得解【详解】由抽取时的分段间隔是20即抽取20名同学其编号构成首项为11公差为20的等差数列第17组抽取的号码故答案为:331【点睛】本解析:331【分析】分段抽样由抽取时的分段间隔是20,利用等差数列知识得解.【详解】由抽取时的分段间隔是20.即抽取20名同学,其编号构成首项为11,公差为20的等差数列,第17组抽取的号码11(171)20331+-⨯=故答案为:331【点睛】本题考查系统抽样,属于基础题.14.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族 解析:20【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果.【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==, 解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20.【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题. 15.【分析】根据线性回归方程过样本数据中心点可求出b 代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的 解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解.【详解】 由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元.故答案为:4.74【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题. 16.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数 8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题 17.2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果【详解】由题意结合方差的定义有:①而②①-②有:③注意到将其代入③式整理可得:又故故答案为2【点睛】本题主要考查方差的计算公式整体的数学 解析:2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果.【详解】由题意结合方差的定义有:()()()22212612x x x x x x -+-++-= ①, 而()()()22212611118x x x -+-+⋅⋅⋅+-=, ②,①-②有:()()212612666226x x x x x x x x --+++++++=-, ③, 注意到1266x x x x +++=,将其代入③式整理可得:26120x x -+=, 又0x ≠,故2x =.故答案为2.【点睛】 本题主要考查方差的计算公式,整体的数学思想等知识,意在考查学生的转化能力和计算求解能力.18.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x =5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时 解析:75 【解析】【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求.【详解】∵4115i i x ==∑,∴154x =,∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+ a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75.【点睛】 本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.19.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b a a b=,即36b a ==时,取等号 故答案为2 20.是不相等的正整数即可【解析】∵甲班人数为平均分为乙班人数为平均分为∴甲乙两班的数学平均分为∵∴当时∴该命题是假命题时应满足是不相等的正整数故答案为:是不相等的正整数解析:,a b 是不相等的正整数即可【解析】∵甲班人数为m ,平均分为a ,乙班人数为()n n m ≠,平均分为b∴甲、乙两班的数学平均分为ma nb m n++ ∵m n ≠ ∴当a b =时,2ma nb a b m n ++=+ ∴该命题是假命题时,应满足,a b 是不相等的正整数 故答案为:,a b 是不相等的正整数三、解答题21.(1)ˆ0.21yx =+;(2)①33.6万只;②到第10年该县养殖山羊的数量相比第1年减少了.【分析】(1)由已知求得,x y ,进一步套公式求出ˆb和ˆa 的值,就求出线性回归方程; (2)由题意求得()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++, 在①中,令x =1求解,在②中,令20.443033.6x x -++<,解不等式即可.【详解】解:(1)设y 关于x 的线性回归方程为y bx a =+,12345678959x ++++++++==, 1.2 1.5 1.6 1.6 1.8 2.5 2.5 2.6 2.729y ++++++++==, ()()()9192112ˆ0.260i ii i i x x y y b x x ==--===-∑∑, ˆ20.251a=-⨯=. 所以y 关于x 的线性回归方程为ˆ0.21yx =+. (2)估计第x 年山羊养殖的只数为()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++ 令1x =,则0.443033.6-++=,故该县第一年养殖山羊约33.6万只.由题意,得20.443033.6x x -++<,整理得()()910x x -->,解得9x >或1x <(舍去),所以到第10年该县养殖山羊的数量相比第1年减少了.【点睛】方法点睛:求线性回归方程的步骤:(1)先求 x 、y 的平均数,x y ;(2)套公式求出ˆb和ˆa 的值:()()()91921ˆi i i i i x x y y b x x ==--=-∑∑,ˆa y b x =-⨯; (3)写出回归直线的方程. 22.(1)不同的样本的个数为432418C C .(2)①分布列见解析,()E ξ97=.②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分.【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩.【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名, 18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名,∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为∴()0123353535357E ξ=⨯+⨯+⨯+⨯=. ②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+.当96x =时,0.659633.6096y =⨯+=.可预测该同学的物理成绩为96分.【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).23.(Ⅰ)具有较强的线性相关关系,10220y x =-;(Ⅱ)330元【分析】(Ⅰ)代入公式计算r ,再做判断,根据公式求,b a ,即得结果;(Ⅱ)先确定温度达到28C ︒以上时概率,再确定随机变量取法,分别求出对应概率,最后根据数学期望公式求结果.【详解】(Ⅰ)21232527293171121226411526,4066x y ++++++++++=======()()7000.75786n ii x x y y r --==>=>∑ 所以潜叶蝇的平均产卵数y 与平均温度x 具有较强的线性相关关系, ()()()1217001070n i i i n i i x x y yb x x ==--===-∑∑,401026220a y bx =-=-⨯=- 10220y bx a x ∴=+=-;(Ⅱ)()12528,2P ξ<≤=()C ξ︒近似地服从正太分布()226.5,N σ, ()()12528128,24P P ξξ-<≤∴>== 0,1200,1600Y = 13141163(0)1,(1200),(1600)444101041020P Y P Y P Y ==-===⨯===⨯= 313()01200140033041020E Y =⨯+⨯+⨯=(元) 【点睛】本题考查线性回归方程、数学期望公式、正态分布,考查综合分析求解能力,属中档题.24.(1)有把握;(2)1ˆ84y x =-,11%. 【分析】(1)根据列联表,利用公式计算2K ,对照附表得出结论;(2)计算x 、y ,求出回归系数,写出线性回归方程,利用方程计算76x =时ˆy的值. 【详解】(1)根据题意,计算22100(45201025)8.1297.89770305545K ⨯⨯-⨯=≈>⨯⨯⨯; 所以有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)计算1105(7065635352454032)82x =⨯+++++++=,141(10.57.57.5 5.5 4.5 3.5 1.50.5)88y =⨯+++++++=; 所以122211054124548128ˆ1054232568()2n ii i n i i x y nxyb xnx ==--⨯⨯===-⨯-∑∑; 411105ˆˆ8842a y bx =-=-⨯=-; 所以y 关于x 的线性回归方程是1ˆ84y x =-, 计算76x =时,1ˆ768114y =⨯-=, 可以预测该医院76岁确诊患者中的重症比例为11%.【点睛】本题考查了列联表与独立性检验的应用问题,也考查了线性回归方程的应用问题,是中档题.25.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10(1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22( 1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++, 所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 26.(1)100分;(2)97.【分析】(1)根据题意,由频率分布直方图求出[]30,90的频率为0.35,[]90,110的频率为0.3,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,进而求出中位数,即可估计出本次考试复赛资格最低分数线;(2)利用频率分布直方图计算出各组的频率,即可估计本次初赛的平均成绩.【详解】解:(1)由题意知[]30,90的频率为:()200.00250.00750.00750.35⨯++=, 由题意知[]90,110的频率为: 200.01500.3⨯=,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,设最低分数线为x ,且(]90,110x ∈.由()0.35900.0150.5x +-⨯=得:100x =,故本次考试复赛资格最低分数线应划为100分.(2)由题意可知:初赛分数在区间(]30,50,(]50,70,(]70,90,(]90,110,(]110,130,(]130,150的频率分别为:0.05,0.15,0.15,0.3,0.25,0.1, 所以本次初赛的平均分为:400.05600.15800.151000.31200.251400.197⨯+⨯+⨯+⨯+⨯+⨯=.【点睛】本题考查频率分布直方图的频率、中位数、平均数的求法,考查解题分析和计算能力.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
挑战数学系列-----统计
出卷人:李务兵姓名:………….. 班级……………记分:……………
(本试卷共20道题,总分150 时间120分钟)
一、选择题(本题有10个小题,每小题5分,共50分)
1.为了了解所加工的一批零件的长度,抽测了200个零件的长度,在这个问题中,200个零件的长度是()A.总体 B. 个体 C. 总体的一个样本 D. 样本容量
2.要采用分层抽样方法从100道选择题、50道判断题、50道填空题、20道解答题中选取22道题目组成一份试卷,则从中选出填空题的道数是()
A.10
B.5
C.2
D.20
3.容量为20的样本,已知某组的频率为0.25,则该组的频数为()
A.5
B.15
C.2
D.80
4. 为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k为()A.40 B. 30 C. 20 D. 12
5. 一批热水器共98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器的台数是()A.甲厂9台,乙厂5台 B. 甲厂8台,乙厂6台
C. 甲厂10台,乙厂4台
D. 甲厂7台,乙厂7台
6. 下列叙述中正确的是()A.从频率分布表可以看出样本数据对于平均数的波动大小
B. 频数是指落在各个小组内的数据
C. 每小组的频数与样本容量之比是这个小组的频率
D. 组数是样本平均数除以组距
7. 某工厂生产产品,用传送带将产品送至下一个工序,质检人员每隔十分钟在传送带某一位置取一件检验,则这种抽样的方法为()A.简单随机抽样 B. 系统抽样
C. 分层抽样
D. 非上述情况
8. 频率分布直方图红,小长方形的面积等于()A.组距 B. 频率 C. 组数 D. 频数
9. 一组数据的方差为3,将这组数据中的每一个数据都扩大到原来的3倍,所得到的一组数据的方差是()A.1 B. 27 C. 9 D. 3
10. 两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2. 那么样本甲和样本乙的波动大小情况是()A.甲、乙波动大小一样 B. 甲的波动比乙的波动大
C. 乙的波动比甲的波动大 C. 甲、乙的波动大小无法比较
二、填空题(本题有4个小题,每小题5分,共20分)
11.要完成下列两项调查,①从钱二高高三658人、高二726人、高一578人中选取200人进行视力调查;②从钱二高高二(12)抽选4位学生参加座谈会。
应采取的抽样方法分别是…………………………………………………
12. 观察新生婴儿的体重,其频率分布直方图如图:
则新生婴儿体重在(2700,3000)的频率为______________________
13. 已知样本99,100,101,x,y的平均数是100,方差是2,则xy=_____________
14. 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图所示:
则甲得分的方差为__________,乙得分的方差为_____________.从而你得出的结论是__________________________________________.
三、解答题
15.(12分)某中学高一年级有x个学生,高二年级共有900个学生,高三年级有y个学生,采用分层抽样抽一个容量为370人样本,高一年级抽取120人,高三年级抽取100人,则全校高中部共有多少学生?
16.(14分)如图,是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案)
注:每组可含最低值,不含最高值
(1)该单位职工共有多少人?
(2)不小于38岁但小于44岁的职工人数占职工总人数的百分比是多少?
(3)如果42岁的职工有4人,那么年龄在42岁以上的职工有几人?
17.(14分)对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
门:甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?
18. (12分)下面是一个病人在4月7日早上6点到4月9日的体温记录折线图,回答下列问题:
(1)护士每隔几小时给病人量一次体温?
(2)这个病人的体温最高是多少摄氏度?最低是多少摄氏度?
(3)他在4月8日12时的体温约为多少摄氏度?
(4)他的体温在哪段时间里下降得最快?哪段时间里比较稳定?
(5)从体温看,这个病人的病情是在恶化还是在好转?
19.(14分)如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:
(1)79.5---89.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格)
20. (14分)以下是某地搜集到的新房屋的销售价格 y和房屋的面积x的数据:
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150㎡时的销售价格.
高一数学统计测试题参考答案
1.选(C )
2. 选(C )
3. 选(D )
4. 选(B)
5. 选(B)
6.选(C)
7.选(B)
8.选(B)
9. 选(B)
10.选(C)
11. 答案:10
1 12.答案:0.3
13.答案:996
14.答案:甲得分的方差为:4,乙得分的方差为:0.8,结论:乙的成绩较稳定,甲的成绩在不断提高,而乙的成绩则无明显提高.
15.【解】由题意得
100
120370900100120--==y x 解得 x=720,y=600
所以高中部共有学生2200人
16.【解】:(1)该单位有职工50人
(2)38--44岁之间的职工人数占职工总人数的60%
(3)年龄在42岁以上的职工有15人
17.【解】74)7090708060(5
1=++++=甲x 73)7580706080(5
1=++++=乙x 10441646145
1222222=++++=)(甲s 562731375
1222222=++++=)(乙s ∵ 2
2乙甲乙甲,s s x x >>
∴ 甲的平均成绩较好,乙的各门功课发展较平衡
18.【解】(1)6小时
(2)最高温度39.5℃,最低是36.8℃
(3)4月8日12时的体温是37.5℃
(4)在4月7日6点到12点的体温下降得最快,4月9日12点到18点比较稳定
(5)虚线表示标准体温
(6)好转
19.【解】(1)频率为:0.025×10=0.25,频数:60×0.25=15
(2)0.015×10+0.025×10+0.03×10+0.005×10=0.75
20.【解】(1)数据对应的散点图如图所示:
(2)1095151==∑=i i x x ,1570)(251
=-=∑=x x l i i xx , 308))((,2.2351
=--==∑=y y x x l y i i i xy
设所求回归直线方程为a bx y +=)
, 则1962.01570
308≈==xx xy
l l b 8166.115703081092.23≈⨯
-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y )
(3)据(2),当x=150(㎡)时,销售价格的估计值为:
2466.318166.11501962.0=+⨯=y )(万元)。