必修三数学统计综合训练题及答案

合集下载

北师大版高中数学必修三第一章《统计》测试卷(包含答案解析)(1)

北师大版高中数学必修三第一章《统计》测试卷(包含答案解析)(1)

一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。

高中数学必修三--统计-含答案解析--zhy365

高中数学必修三--统计-含答案解析--zhy365

高中数学必修三--统计卷I(选择题)一、选择题(本题共计 12 小题,每题 5 分,共计60分,)1. 下列调查中,适合用全面调查方式的是()A.了解某班学生“50米跑”的成绩B.了解一批灯泡的使用寿命C.了解一批炮弹的杀伤半径D.了解一批袋装食品是否含有防腐剂2. 某单位200名职工中,年龄在50岁以上占20%,40∼50岁占30%,40岁以下占50%;现要从中抽取40名职工作样本.若用系统抽样法,将全体职工随机按1∼200编号,并按编号顺序平均分为40组(1∼5号,6∼10号,…,196∼200号).若第5组抽出的号码为22,则第8组抽出的号码应是①;若用分层抽样方法,则40岁以下年龄段应抽取②人.①②两处应填写的数据分别为()A.82,20B.37,20C.37,4D.37,503. 某学校有教师160人,其中有高级职称的32人,中级职称的56人,初级职称的72人.现抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数应为()A.4B.6C.7D.94. 2013年中国政府提出共建丝绸之路经济带,受到了世界各国的高度重视和积极响应,并提出打造海上丝绸之路的总体规划,被简称为“一带一路”.经调查,沿线某地区自2013年到2019年经过6年的经济新建设,经济收入增加了3倍.为更好地了解该地区经济收入变化情况,统计了该地区建设前后经济收入构成比例,得到如下表格:则2019年与2013年经济收入相比较,下面结论中正确的是( )A.石油出口收入减少B.其他收入增加了三倍以上C.百姓购物收入增加了三倍D.百姓购物收入与教育文化收入的总和超过了经济收入的一半的样本,若采用系统抽样,则分段的间隔k为()A.50B.60C.30D.406. 如图是某社区工会对当地企业工人月收入情况进行一次抽样调查后画出的频率分布直方图,其中第二组月收入在[1.5, 2)千元的频数为300,则此次抽样的样本容量为()A.1000B.2000C.3000D.40007. 一样本的所有数据分组及频数如下:[−0.5, 0.5),C50;[0.5, 1.5),C51;[1.5, 2.5),C52;[2.5, 3.5),C53;[3.5, 4.5),C54;[4.5, 5.5),C55.则在[1.5, 4.5)的频率为()A.5 8B.12C.2532D.15168. 2019年,全国各地区坚持稳重求进工作总基调,经济运行总体平稳,发展水平迈上新台阶,发展质量稳步上升,人民生活福祉持续增进,全年最终消费支出对国内生产总值增长的贡献率为57.8%.下图为2019年居民消费价格月度涨跌幅度:(同比=本期数−去年同期数去年同期数×100%,环比=本期数−上期数上期数×100%),下列结论中不正确的是()A.2019年第三季度的居民消费价格一直都在增长B.2018年7月份的居民消费价格比同年8月份要低一些C.2019年全年居民消费价格比2018年涨了2.5%以上D.2019年3月份的居民消费价格全年最低A.数据4、4、6、7、9、6的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数10. 某中学就到校的方式问题对初三年级的所有学生进行了一次调查,并将调查结果制作了扇形统计图,已知步行的人数为60,则初三学生乘公交车的人数为( )A.60B.78C.132D.911. 绘制1000人的寿命直方图时,若组距均为20,60∼80岁范围的纵轴高为0.03,则60∼80岁的人数为()A.300B.500C.600D.80012. 以下两个图表是2019年初的4个月我国四大城市的居民消费价格指数(上一年同月=100)变化图表,给出下列结论:其中正确的是()(注:图表一每个城市的条形图从左到右依次是1、2、3、4月份;图表二每个月份的条形图从左到右四个城市依次是北京、天津,上海、重庆)①3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为平均;②4月份仅有三个城市居民消费价格指数超过102;③仅有天津市从年初开始居民消费价格指数的增长呈上升趋势;④四个月的数据显示北京市的居民消费价格指数增长幅度波动较大.A.①②B.②④C.①②④D.①③④卷II(非选择题)二、填空题(本题共计 6 小题,每题 5 分,共计30分,)13. 某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据,绘制了下面的折线图.已知该市的各月最低气温与最高气温具有较好的线性关系,则根据该折线图,下列结论错误的是_______.①最低气温与最高气温为正相关;②10月的最高气温不低于5月的最高气温;③月温差(最高气温减最低气温)的最大值出现在1月;④最低气温低于0∘C的月份有4个.14. 为了估计鱼塘中鱼的尾数,先从鱼塘中捕出2000尾鱼,并给每条尾鱼做上标记(不影响存活),然后放回鱼塘,经过适当的时机,再从鱼塘中捕出600尾鱼,其中有标记的鱼为40尾,根据上述数据估计该鱼塘中鱼的尾数为________.15. 已知数据:x,y,10,11,9,这组数据的平均值10,方差为2,则|x−y|=________.16. 抽样统计甲,乙两个城市连续5天的空气质量指数(AQI),数据如下:17. 某校从参加高一年级期末考试的学生中抽出60名学生,并统计了他们的数学成绩(成绩均为整数且满分为100分),把其中不低于50分的分成五段[50, 60),[60, 70),[70, 80),[80, 90),[90, 100]然后画出如下图的部分频率分布直方图.观察图形的信息,可知数学成绩低于50分的学生有________人;估计这次考试数学学科的及格率(60分及以上为及格)为________;18. 为了调查某野生动物保护区内某种野生动物的数量,调查人员逮到这种动物1200只作过标记后放回,一星期后,调查人员再次逮到该种动物1000只,其中作过标记的有100只,估算保护区有这种动物________只.三、解答题(本题共计 5 小题,每题 12 分,共计60分,)19. 已知甲、乙、丙三个车间一天内生产的产品分别是150件、130件、120件,为了掌握各车间产品质量情况,从中取出一个容量为40的样本,该用什么抽样方法?简述抽样过程.20. 某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(1)设消费者的年龄为x ,对该款智能家电的评分为y .若根据统计数据,用最小二乘法得到y 关于x 的线性回归方程为y ̂=1.2x +40,且年龄x 的方差为s x 2=14.4,评分y 的方差为s y 2=22.5.求y 与x 的相关系数r ,并据此判断对该款智能家电的评分与年龄的相关性强弱.(2)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“ 好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.附:线性回归直线y ̂=b ̂x +a ̂的斜率b̂=∑(x i −x ¯)n i=1(y i −y ¯)∑(x i −x ¯)2n i=1相关系数r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1.独立性检验中的K 2=n(ad−bc)2(a+b)(a+c)(b+d)(c+d), 其中n =a +b +c +d .临界值表:21. 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,⋯,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑x i 20i=1=60 ,∑y i 20i=1=1200, ∑(x i −x ¯)220i=1=80, ∑(y i −y ¯)220i=1=9000,∑(x i −x ¯)20i=1(y i −y ¯)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,⋯,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物短盖面积差异很大,为提高样本的代表性以获得附:相关系数: r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1√2≈1.414.22. 某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:i i−1i i−1x i 7i−1y i =3487. (1)求x ¯,y ¯;参考公式:b ̂=∑=n ∑(ni−1x i −x ¯)2∑n ∑x i 2n i−1−nx−2,a ̂=y ¯−b ̂x ¯(2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.23. 某网站欲调查网民对当前网页的满意程度,在登录的所有网民中,收回有效帖子共50000份,其中持各种态度的份数如下表所示:为了了解网民的具体想法和意见,以便决定如何更改才能使网页更完美,打算从中抽选500份,为使样本更具代表性,每类中各应抽选出多少份?并且写出具体操作过程.参考答案与试题解析高中数学必修三--统计一、选择题(本题共计 12 小题,每题 5 分,共计60分)1.【解答】A、了解某班学生“50米跑”的成绩,是精确度要求高的调查,适于全面调查;B、C、D了解一批灯泡的使用寿命,了解一批炮弹的杀伤半径,了解一批袋装食品是否含有防腐剂,都是具有破坏性的调查,无法进行普查,故不适于全面调查.2.【解答】解:若用系统抽样,则样本间隔为5,若第5组抽出的号码为22,则第8组抽出的号码应22+15=37,若用分层抽样方法,则40岁以下年龄段应抽取40×50%=20,故选:B.3.【解答】解:∵中级职称的56人,∴抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数为56160=n20,解得n=7,即抽取的中级职称的教师人数应为7人.故选C.4.【解答】解:假设建设前经济收入为a,则建设后经济收入为4a,所以石油出口收入在建设前为0.49a,建设后为4a×0.33=1.32a,石油出口收入较之前增加;其他收入在建设前为0.06a,建设后为0.24a,即其他收入增加了三倍;百姓购物收入建设前为0.3a,建设后为0.38×4a=1.52a,即百姓购物收入增加了四倍以上;教育文化收入建设前为0.1a,建设后为0.15×4a=0.6a,百姓购物收入与教育文化收入的总和为1.52a+0.6a=2.12a>2a,超过了经济收入的一半.故选D.5.【解答】解:由题意知本题是一个系统抽样问题,总体中个体数是3000,样本容量是100,根据系统抽样的步骤,得到分段的间隔k=3000100=30,解:由频率的意义可知,从左到右各个小组的频率之和是1,同时每小组的频率=小组的频数样本容量.∴[1.5, 2)长方形的面积为0.3.第二组月收入在[1.5, 2)千元的频数为300,所以此次统计的样本容量是300÷0.3=1000.故选A.7.【解答】解:由题意知本题共有C50+C51+C52+C53+C54+C55=25个数据,在[1.5, 4.5)的频数是C52+C53+C54∴在[1.5, 4.5)的频率为:C52+C53+C5425=2532,故选C.8.【解答】解:A,从环比看,2019年第三季度的居民消费价格一直都在增长,故A正确;B,从同比看,2018年7月份的居民消费价格比同年8月份要低一些,故B正确;C,从同比看,1.7+1.5+2.3+2.5+2.7+2.7+2.8+2.8+3.0+3.8+4.5+4.512=2.9,所以2019年全年居民消费价格比2018年涨了2.5%以上,故C正确;D,从环比看,2019年1月份的居民消费价格最低,故D错误.故选D.9.【解答】解:数据4、4、6、7、9、6的众数是4和6,故A错误;一组数据的标准差是这组数据的方差的算术平方根,故B错误;∵3,5,7,9的平均数=14(3+5+7+9)=6,∴3,5,7,9的标准差=√14[(3−6)2+(5−6)2+(7−6)2+(9−6)2]=√5.∵6、10、14、18的平均数=14(6+10+14+18)=12,∴6、10、14、18的标准差√14[(6−12)2+(10−12)2+(14−12)2+(18−12)2]= 2√5,∴数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半,故C正确;频率分布直方图中各小长方形的面积等于相应各组的频率,故D错误.故选:C.10.【解答】解:调查的学生总数是:60÷20%=300(人),则乘公交车的人数为:300×(1−20%−33%−3%)=300×44%=132(人).解:因为:组距均为20,60∼80岁范围的纵轴高为0.03,所以;频率为:0.03×20=0.6.∴60∼80岁的人数为:0.6×1000=600.故选:C.12.【解答】解:根据题目所给信息,①,3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为大,不平均,①错误;②,4月份仅有三个城市居民消费价格指数超过102;③,天津市和上海从年初开始居民消费价格指数的增长呈上升趋势,③错误;④,四个月的数据显示北京市的居民消费价格指数增长幅度波动较大,④正确.故正确的有②④.故选B.二、填空题(本题共计 6 小题,每题 5 分,共计30分)13.【解答】解:由该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据的折线图,得:在①中,最低气温与最高气温为正相关,故①正确;在②中,10月的最高气温不低于5月的最高气温,故②正确;在③中,月温差(最高气温减最低气温)的最大值出现在1月,故③正确;在④中,最低气温低于0∘C的月份有3个,故④错误.故答案为:④.14.【解答】解:根据题意,设该鱼塘中鱼的尾数为x,则;x 2000=60040,解得x=30000;∴估计该鱼塘中鱼的尾数为30000.故答案为:30000.15.【解答】解:由平均值10得,x+y+10+11+9=50,则x+y=20,①由方差为2得,2=15[(x−10)2+(y−10)2+0+1+1],即(x−10)2+(y−10)2=8,②设x=10+t,y=10−t,代入②2t2=8,解得t=±2,∴|x−y|=2|t|=4,故答案为:4.16.甲城市连续5天的空气质量指数是109,111,132,118,110;它的极差是132−109=23,且数据的波动性较大些;乙城市连续5天的空气质量指数是110,111,115,132,112;它的极差是132−110=22,且数据的波动性较小些;由此得出,空气质量指数较为稳定(方差较小)的城市是乙.故答案为:乙.17.【解答】解:由图可知,成绩在[50, 60)的频率为0,015×10=0.15,成绩在[60, 70)的频率为0.015×10=0.15,成绩在[70, 80)的频率为0.030×10=0.3,成绩在[80, 90)的频率为0.025×10=0.25,成绩在[90, 100]的频率为0.005×10=0.05,∴成绩不低于50分的频率为0.15+0.15+0.3+0.25+0.05=0.9,成绩不低于60分的频率为0.15+0.3+0.25+0.05=0.75∴成绩低于50分的频率为为1−0.9=0.1∵共有60名学生,∴成绩低于50分的学生数为60×0.1=6,这次考试数学学科的及格率为75%.故答案为6;75%18.【解答】解:设保护区有这种动物有x只,则由题意可得1200x =1001000,求得x=12000,故答案为12000.三、解答题(本题共计 5 小题,每题 12 分,共计60分)19.【解答】解:由于三个车间的产品有差别,故应采用分层抽样的方法,先计算抽样比:k=40150+130+120=110,再计算各车间内抽取样本的件数:甲车间:150×110=15,乙车间:130×110=13,丙车间:120×110=12,再分析使用简单随机抽样的办法在各个车间中抽取样本,最后终成一个样本.20.【解答】解:(1)相关系数r=∑(x−x¯)50(y−y¯)√∑(xi−x)250i=1∑(y i−y)250i=1;=∑(x i−x¯)50i=1(y i−y¯)∑(x i−x¯)250i=1√∑(xi−x¯)250i=1√∑(yi−y)250i=1=b̂⋅√50s x2√50s y =1.2×1215=0.96.故对该款智能家电的评分与年龄的相关性较强.(2)由列联表可得K 2=50×(8×6−20×16)224×26×28×22≈9.624>6.635.故有99%的把握认为对该智能家电的评价与年龄有关.21.【解答】解:(1)由题意可知,1个样区这种野生动物数量的平均数=120020=60,故这种野生动物数量的估计值=60×200=12000;(2)由参考公式得 ,r =∑(x i −x ¯)n i=1(y i −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1=80×9000=62≈0.94 ;(3)由题意可知,各地块间植物短盖面积差异很大,因此在调查时,先确定该地区各地块间植物短盖面积大小并且由小到大排序, 每十个分为一组,采用系统抽样的方法抽取20个地块作为样区进行样本统计. 22.【解答】解:(1)x ¯=17(3+4+5+6+7+8+9)=6, y ¯=17(66+69+73+81+89+90+91)=5597≈79.86;(2)把所给的7对数据写成对应的点的坐标,在坐标系中描出来,得到散点图.(3)∵ 3×66+4×69+5×73+6×81+7×89+8×90+9×91=3487,32+42+52+62+72+82+92=280,∴ b =3487−7×6×5597280−7×36=4.75,a =5597−6×4.75≈51.36,故线性回归方程为y =4.75x +51.36.23.【解答】解:每个个体被抽到的频率是 50050000=1100,10800×1100=108,12400×1100=124,15600×1100=156,11200×1100=112,每类中各应抽选出有效帖子的份数:很满意的108份,满意的124份,一般的156份,不满意的112份.在很满意的有效帖子中采用简单随机抽样的方法随机抽取108份,在满意的有效帖子中采用简单随机抽样的方法随机抽取124份,在一般的有效帖子中采用简单随机抽样的方法随机抽取156份,在不满意的有效帖子中采用简单随机抽样的方法随机抽取112份.。

必修三数学统计综合训练题及答案

必修三数学统计综合训练题及答案

8.在抽查某产品的尺寸过程中,将其尺寸数据分成假设干组,[a,b]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,那么|a-b|=( )A.h·m B.hm C.mh D.与m,h无关9.以下抽样中不是系统抽样的是〔〕B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止10.图2­2­8是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,假设80分以上为优秀,根据图形信息可知:这次考试的优秀率为( )图2­2­8A.25%B.30%C.35%D.40%11二、填空题12.以下四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④1314.超速行驶已成为马路上最大杀手之一,某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,否那么视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图2­7,那么违规的汽车大约为________辆.图2­715.某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,假设该校取一个容量为n的样本,那么n= 。

三、解答题16(1)样本中的作品落在[6,10)内的频数是多少?(2)估计众数、中位数和平均数各是多少?17.对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:甲2738303735312450乙3329383428364345分别求出甲、乙两名自行车赛手最大速度(单位:m/s)的数据的平均数、中位数、标准差,并判断选谁参加比赛更适宜(可用计算器).18.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午 8:00~12:00间各自的车流量(单位:百辆),得如图2­8所示的统计图,根据统计图:(1)甲、乙两个交通站的车流量的极差分别是多少?(2)甲交通站的车流量在[10,40]间的频率是多少?(3)甲、乙两个交通站哪个更繁忙?并说明理由.第二章自主检测1一.1.D 2.D 3.C 4.C 5.B 6.C 7.A 8.C 9.B 10.B 11.25二.12.①③ 13.0795 14.280 15.y^=1.23x+0.08三.16.解:(1)作品落在[6,10)内的频率为1-0.08-0.36-0.12-0.12=0.32,∴频数为200×0.32=64.(2)众数估计值为:10+142=12,中位数的估计值为:从左到右小矩形面积依次为0.08,0.32,0.36,0.12,0.12,由于中位数左、右两边的小矩形面积相等,假设设为x,那么(x-10)×0.09=0.1,∴x≈11.平均数的估计值为0.08×4+0.32×8+0.36×12+0.12×16+0.12×20≈12.17.解:(1)茎叶图如图D31,中间数为数据的十位数.图D31从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比拟稳定,总体得分情况比甲好.(2)利用科学计算器,得x甲=34,x乙=35.75;s甲≈7.55,s乙≈5.70;甲的中位数是33,乙的中位数是35. 综合比拟,选乙参加比赛更适宜.18.解:(1)甲交通站的车流量的极差为73-8=65;乙交通站的车流量的极差为71-5=66.(2)甲交通站的车流量在[10,40]间的频率为414=27.(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方.从数据的分布情况来看,甲交通站更繁忙.。

(好题)高中数学必修三第一章《统计》测试题(含答案解析)(1)

(好题)高中数学必修三第一章《统计》测试题(含答案解析)(1)

一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,152.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A.30 B.60C.70 D.803.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A.40 B.50 C.80 D.100a a>得到一组新4.一组数据的平均数为x,方差为2s,将这组数据的每个数都乘以()0数据,则下列说法正确的是()A.这组新数据的平均数为x B.这组新数据的平均数为a x+C .这组新数据的方差为2asD .这组新数据的标准差为2a s5.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .66.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.77.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .298.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081510.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A .消耗1升汽油,乙车最多可行驶5千米B .以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C .甲车以80千米/小时的速度行驶1小时,消耗10升汽油D .某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油 11.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.给出下列命题:①函数()π4cos 23f x x ⎛⎫=+ ⎪⎝⎭的一个对称中心为5π,012⎛⎫- ⎪⎝⎭;②若,αβ为第一象限角,且αβ>,则tan tan αβ>;③设一组样本数据12,,,n x x x ⋅⋅⋅的平均数是2,则数据1221,21,,21n x x x --⋅⋅⋅-的平均数为3;④函数sin 2y x =的图象向左平移π4个单位长度,得到πsin 24y x ⎛⎫=+ ⎪⎝⎭的图象.其中正确命题的序号是_____________(把你认为正确的序号都填上).14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).17.某种活性细胞的存活率y (%)与存放温度x (℃)之间具有线性相关关系,样本数据如下表所示 存放温度x (℃) 10 4 -2 -8 存活率y (%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.18.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 19.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.20.已知下列命题:①在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好; ②两个变量相关性越强,则相关系数r 就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④两个模型中残差平方和越小的模型拟合的效果越好.⑤回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;⑥若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;⑦从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 其中正确命题的序号是__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:第一天 第二天 第三天 第四天 第五天 就餐人数x (百人) 13 9 8 10 12 原材料y (袋)3223182428(1)根据所给的5组数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)24.某学校进行体验,现得到所有男生的身高数据,从中随机抽取50人进行统计(已知这50个身高介于155cm 到195cm 之间),现将抽取结果按如下方式分成八组:第一组[155,160),第二组[160,165),...,第八组[190,195],并按此分组绘制如图所示的频率分布直方图,其中第六组[180,185)和第七组[185,190)还没有绘制完成,已知第一组与第八组人数相同,第六组和第七组人数的比为5:2.(1)补全频率分布直方图;(2)根据频率分布直方图估计这50位男生身高的中位数;(3)用分层抽样的方法在身高为[170,180]内抽取一个容量为5的样本,从样本中任意抽取2位男生,求这两位男生身高都在[175,180]内的概率.25.某科研课题组通过一款手机APP软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:周跑量(/km周)[)10,15[)15,20[)20,25[)25,30[)30,35[)35,40[)40,45[)45,50[)50,55人数100120130180220150603010(1)在答题卡上补全该市1000名跑步爱好者周跑量的频率分布直方图:注意:请用2B铅笔在答题卡上作图,并将所作条形图涂黑.(2)根据以上图表数据,试求样本的中位数(保留一位小数).(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如下表:周跑量 小于20公里 20公里到40公里 不小于40公里 类别休闲跑者 核心跑者 精英跑者 装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?26.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数: 温度(单位:C ︒)21 23 24 27 29 32死亡数y (单位:株)6 11 20 27 57 77经计算:611266i i x x ===∑,611336i i y y ===∑,()()61557i i i x x y y =--=∑,()62184i i x x =-=∑,()6213930i i y y =-=∑,()621ˆ236.64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(结果精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程0.2303ˆ0.06x ye =,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.D解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s ,则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x xxxxxxxx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axaxaxaxaxaxaxax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.5.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.6.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.7.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.8.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.10.D解析:D【详解】解:对于A,由图象可知当速度大于40km/h时,乙车的燃油效率大于5km/L,∴当速度大于40km/h时,消耗1升汽油,乙车的行驶距离大于5km,故A错误;对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B错误;对于C,由图象可知当速度为80km/h时,甲车的燃油效率为10km/L,即甲车行驶10km时,耗油1升,故行驶1小时,路程为80km,燃油为8升,故C错误;对于D,由图象可知当速度小于80km/h时,丙车的燃油效率大于乙车的燃油效率,∴用丙车比用乙车更省油,故D正确故选D.考点:1、数学建模能力;2、阅读能力及化归思想.11.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】乙选手分数的平均数分别为7885848192767780949384,84, 55++++++++====因此s1<s2,选C.【点睛】本题考查标准差,考查基本求解能力.12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.①③【分析】求解的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④【详解】解:对于①函数的一个对称中心为故①正确;对于②取为第一象限角且但故②错误;对于③一组样本数据的平均数解析:①③ 【分析】 求解5()12f π-的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④. 【详解】 解:对于①,55()4cos()4cos()012632f ππππ-=-+=-=, ∴函数()4cos(2)3f x x π=+的一个对称中心为5(,0)12π-,故①正确;对于②,取94πα,3πβ=,α,β为第一象限角,且αβ>,但tan tan αβ<,故②错误;对于③,一组样本数据1x ,2x ,⋯,n x 的平均数是2,则数据121x -,221x -,⋯,21n x -的平均数为22132⨯-=,故③正确; 对于④,函数sin 2y x =的图象向左平移4π个单位长度,得到sin 2()sin(2)cos242y x x x ππ=+=+=的图象,故④错误.∴正确命题的序号是①③.故答案为:①③. 【点睛】本题考查命题的真假判断与应用,考查三角函数的图象与性质,训练了平均数的求法,属于中档题.14.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题15.【分析】首先求出xy 的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a 的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直 解析:214【分析】首先求出x ,y 的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a 的一元一次方程,解方程即可. 【详解】:14x =(1+2+3+4)=2.5,14y =(4.5+4+3+2.5)=3.5, 将(2.5,3.5)代入线性回归直线方程是ˆy=-0.7x +a ,可得3.5=﹣1.75+a , 故a =214. 故答案为214【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.34【解析】分析:根据表格中数据求出代入公式求得的值从而得到回归直线方程将代入回归方程即可得到结果详解:设回归直线方程由表中数据可得代入归直线方程可得所以回归方程为当时可得故答案为点睛:求回归直线方解析:34 【解析】分析:根据表格中数据求出,x y ,代入公式求得a 的值,从而得到回归直线方程,将6x =代入回归方程即可得到结果.详解:设回归直线方程3,ˆ2yx a =-+, 由表中数据可得1,50x y ==, 代入归直线方程可得53.2a =,所以回归方程为3,253.ˆ2yx =-+ 当6x =时,可得 3.2653.4ˆ23y=-⨯+=,故答案为34. 点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+;回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.18.2【解析】分析:直接利用回归方程将代入即可求得的估计值详解:∵回归方程为∴当时的估计值为故答案为82点睛:本题考查回归方程的运用考查学生的计算能力属于基础题解析:2 【解析】分析:直接利用回归方程,将25x =代入,即可求得y 的估计值. 详解:∵回归方程为0.4 1.8y x =-,∴当25x =时,y 的估计值为 0.425 1.88.2y =⨯-=.故答案为8.2.点睛:本题考查回归方程的运用,考查学生的计算能力,属于基础题.19.【解析】分析:先由茎叶图得数据再根据平均数公式求平均数详解:由茎叶图可知5位裁判打出的分数分别为故平均数为点睛:的平均数为解析:【解析】分析:先由茎叶图得数据,再根据平均数公式求平均数.详解:由茎叶图可知,5位裁判打出的分数分别为8989909191,,,,,故平均数为89+89+90+91+91905=.点睛:12,,,n x x x 的平均数为12nx x x n+++.20.①③④⑦【分析】根据线性回归分析的概念进行分析即可【详解】在线性回归模型中相关指数越接近于1表示回归效果越好①正确;两个变量相关性越强则相关系数r 的绝对值就越接近于1②错误;③正确;两个模型中残差平解析:①③④⑦ 【分析】根据线性回归分析的概念进行分析即可. 【详解】在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好,①正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,②错误;③正确;两个模型中残差平方和越小的模型拟合的效果越好,④正确;回归直线ˆˆˆybx a =+恒过样本点的中心(),x y ,不一定过样本点,⑤错误;若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,并不能说在100个吸烟的人中必有99人患有肺病,⑥错误;从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误,⑦正确.故答案为①③④⑦. 【点睛】本题考查线性回归分析的有关概念,掌握相关概念是解题基础,属于基础题.三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.94.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.22.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii ii x y x yb xx==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题. 23.(1)0.36 6.24y x =+;(2)8.76万吨. 【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量. 【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()616216.30.3617.5ˆiii i i t t y y bt t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨. 【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 24.(1)见解析;(2)174.5cm ;(3)0.3. 【详解】试题分析:(1)先分别算出第六组和第七组的人数,进而算出其频率与组距的比,补全直方图;(2)利用中位数两边频率相等,求出中位数的值;(3)先借助分层抽样的特征求出第四、第五组的人数,再运用列举法列举出所有可能数及满足题设的条件的数,运用古典概型的计算公式求解:解:(1)第六组与第七组频率的和为:∵第六组和第七组人数的比为5:2.∴第六组的频率为0.1,纵坐标为0.02;第七组频率为0.04,纵坐标为0.008.(2)设身高的中位数为,则∴估计这50位男生身高的中位数为174.5(3)由于第4,5组频率之比为2:3,按照分层抽样,故第4组中应抽取2人记为1,2,第5组应抽取3人记为3,4,5则所有可能的情况有:{1,2},{1,3},{1,4},{1,5},{2,3},{2,4},{2,5},{3,4},{3,5},{4,5}共10种满足两位男生身高都在[175,180]内的情况有{3,4},{3,5},{4,5}共3种,因此所求事件的概率为.25.(1)作图见解析;(2)中位数是29.2;(3)平均需要3720元.【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图.(2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱.【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=, 解得29.2x ≈.即样本中位数是29.2.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人, 核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人, 精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元.即该市每位跑步爱好者购买装备,平均需要3720元. 【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题.26.(1)ˆy=6.6x −139.4;(2)(i )回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好;(ii )190. 【分析】(1)根据公式,结合已知数据,分别求得ˆˆ,ba ,则问题得解; (2)根据相关指数的计算公式,结合已知数据,求得2R ,再进行比较即可; (3)将35x =代入回归方程,即可求得结果.【详解】(Ⅰ)由题意得,()()()121557ˆ 6.6384n i i i n i i x x y y b xx ==--==≈-∑∑ ∴ˆa =33−6.6326=−139.4,∴y 关于x 的线性回归方程为:ˆy=6.6x −139.4. (Ⅱ) (i )线性回归方程ˆy=6.6x −138.6对应的相关指数为: ()()6221621ˆ236.641110.06020.93983930i i i i i i y y R yy ==-=-=-≈-=-∑∑, 因为0.9398<0.9522,所以回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好. (ii )由(i )知,当温度35C x ︒=时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35C 时该批紫甘薯死亡株数为190.【点睛】本题考查线性回归直线方程的求解、相关指数的求解,以及用回归直线方程进行估算,属综合中档题.。

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)

(好题)高中数学必修三第一章《统计》测试题(包含答案解析)

一、选择题1.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为192.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差3.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙4.小明同学在做市场调查时得到如下样本数据x1 3 6 10 y 8a42他由此得到回归直线的方程为ˆ 2.115.5yx =-+,则下列说法正确的是( ) ①变量x 与y 线性负相关 ②当2x =时可以估计11.3y = ③6a = ④变量x 与y 之间是函数关系 A .①B .①②C .①②③D .①②③④5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和677.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④8.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .3二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小;④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 15.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.16.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________. 17.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称;②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________. 18.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.19.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.20.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.三、解答题21.2020年1月末,新冠疫情爆发,经过全国人民的努力,2月中旬,疫情得到了初步的控制,湖北省以外地区的每日新增确诊人数开始减少,某同学针对这个问题,选取他在统计学中学到的一元线性回归模型,作了数学探究:他于2月17日统计了2月7日至16日这十天湖北省以外地区的每日新增确诊人数,表格如下: 日期 2.7 2.8 2.9 2.10 2.11 2.12 2.132.14 2.15 2.16 代号x 123 45 678910新增确诊人数y558 509444381 377 312 267221166 115y x y x 计算出: 5.5,335x y ==,()()1013955iii x x y y =--=-∑,()210182.5ii x x =-=∑(1)请你帮这位同学计算出y 与x 的线性回归方程(精确到0.1),然后根据这个方程估计湖北省以外地区新增确诊人数为零时的大概日期;附:回归方程y bx a =+中斜率和截距的最小二乘法估计公式分别为:()()()1012101iii ii x x y y b x x ==--=-∑∑,a y bx =-(2)实际上2月17日至2月22日的新增确诊人数如下: 日期 2.17 2.18 2.19 2.20 2.21 2.22新增确诊人数7933 45 2583418出评价.22.已知某校6个学生的数学和物理成绩如下表:(1)若在本次考试中,规定数学在80分以上(包括80分)且物理在75分以上(包括75分)的学生为理科小能手.从这6个学生中抽出2个学生,设X 表示理科小能手的人数,求X 的分布列和数学期望;(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程.参考数据和公式:ˆˆˆybx a =+,其中1122211()()ˆ()nniii ii i nniii i x x y yx y nx yb x x xnx====---⋅==--∑∑∑∑,ˆˆay bx =-. 23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表:(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.在社会实践活动中,“求知”小组为了研究某种商品的价格x (元)和需求量y (件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料: 日期 11月1日 11月2日 11月3日 11月4日 11月5日 x (元) 14 16 18 20 22 y (件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义2.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 3.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.4.C解析:C 【解析】 【分析】根据数据和回归方程对每一个选项逐一判断得到答案. 【详解】① 2.1b =-⇒变量x 与y 线性负相关,正确 ②将2x =代入回归方程,得到11.3y =,正确 ③将(,)x y 代入回归方程,解得6a =,正确 ④变量x 与y 之间是相关关系,不是函数关系,错误 答案为C 【点睛】本题考查了回归方程的相关知识,其中中心点(,)x y 一定在回归方程上是同学容易遗忘的知识点.5.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.6.B解析:B 【解析】 【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解. 【详解】设更正前甲,乙,…的成绩依次为a 1,a 2,…,a 50, 则a 1+a 2+…+a 50=50×70,即60+90+a 3+…+a 50=50×70, (a 1﹣70)2+(a 2﹣70)2+…+(a 50﹣70)2=50×75, 即102+202+(a 3﹣70)2+…+(a 50﹣70)2=50×75. 更正后平均分为x =150×(80+70+a 3+…+a 50)=70; 方差为s 2=150×[(80﹣70)2+(70﹣70)2+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+50×75﹣102﹣202]=67. 故选B .本题考查平均数与方差的概念与应用问题,是基础题.7.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FP时,直线OP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FP时,直线OP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪(8,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.8.B【详解】试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a , ∴ˆa =9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程9.D解析:D 【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差10.C解析:C 【分析】先求均值,再根据标准差公式求标准差,最后比较大小. 【详解】乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==22222(7884)(8584)(8484)(8184)(9284)22,5-+-+-+-+-=22222(7684)(7784)(8084)(9484)(9384)62,5-+-+-+-+-=因此s 1<s 2,选C. 【点睛】本题考查标准差,考查基本求解能力.11.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n =++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.12.C解析:C 【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的. 故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③ 【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可. 【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确; 空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误, 故答案为:①②③. 【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.15.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论16.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】试题分析:由平均数及方差的定义可得10685675x ++++==;222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==.考点:样本数据的数字特征:平均值与方差.17.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.19.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.20.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.三、解答题21.(1)47.9598.7y x =-+,2月19日时新增确诊人数为零;(2)该数学探究估计的数据与实际的数据不吻合. 【分析】(1)根据数据套公式求出b a 、,写出回归方程,并估计新增确诊人数为零时的大概日期; (2)在(1)中求出的回归方程为线性的,再分析2月17日至2月22日的新增确诊人数不是线性的,所以选择模型不够理想. 【详解】解:()1设回归方程为y bx a =+, ∵ 5.5,335x y ==,()()1013955i ii x x y y =--=-∑,()210182.5ii x x =-=∑则()()()1012101395547.93982.5iii ii x x y y b x x ==---==≈--∑∑ 所以598.7a y bx =-≈所以回归方程为47.9598.7y x =-+估计在13x =即2月19日时新增确诊人数为零.()2该数学探究估计的数据与实际的数据不吻合.该同学首先通过线性相关系数进行线性相关判断,得到y 与x 有99%的把握线性相关,这只是说明选取的数据是线性的,但从整体看,不是线性的;出现这个结果的原因可能是传染病初发时的突发因素过多、湖北省外的人口众多、以及传染病机制复杂等因素决定的,说明对于传染病病例的变化趋势,选择线性模型可能不够理想. 【点睛】(1)求线性回归方程的步骤:①求出,x y ;②套公式求出b a 、;③写出回归方程y bx a =+;④利用回归方程y bx a =+进行预报;(2)可以建立多个函数模型时,要对每个模型进行分析比较,选择最优化模型. 22.(1)见解析;(2)129155y x =+ 【分析】(1)由题意得1号学生、2号学生为理科小能手,从而得到X 的可能取值为0,1,2,分别求出相应的概率,由此能求出X 的分布列和数学期望;(2)利用最小二乘法分别求出ˆb,ˆa ,由此能求出y 与x 的回归直线方程. 【详解】(1)由题意得1号学生、2号学生为理科小能手.X 的可能取值为:0,1,2。

(压轴题)高中数学必修三第一章《统计》测试(有答案解析)

(压轴题)高中数学必修三第一章《统计》测试(有答案解析)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .23.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④7.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,88.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为A .y = x-1B .y = x+1C .y =88+12x D .y = 1769.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.19.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。

必修三数学统计综合训练题及答案

必修三数学统计综合训练题及答案

第二章 统计章末综合检测1一、选择题1.某学校有男、女学生各500名,为了解男、女学生在学习爱好与业余爱好方面是不是存在显著不同,拟从全部学生中抽取100名学生进行调查,那么宜采纳的抽样方式是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,那么有( )A .a>b>cB .b>c>aC .c>a>bD .c>b>a3.2021年某大学自主招生面试环节中,七位评委为一考生打出分数的茎叶图如图2­1,去掉一个最高分和一个最低分,所剩数据的平均数和方不同离为( )图2­1 A .84,4.84 B .84,1.6C .85,1.6D .85,44甲 乙 丙 丁平均环数x 8.6 8.9 8.9 8.2方差s 2 3.5 3.5 2.1 5.6A .甲B .乙C .丙D .丁5.某校数学教研组为了解学生学习数学的情形,采纳分层抽样的方式从高一600人、高二780人、高三n 人中,抽取35人进行问卷调查,已知高二被抽取的人数为13人,那么n =( )A .660B .720C .780D .8006气温/℃ 18 13 10 4 -1杯数/杯 24 34 39 51 63假设热茶杯数y 与气温( )A .y =x +6B .y =x +42C .y =-2x +60D .y =-3x +787.x 是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,那么以下各式正确的选项是( )A.x =40a +60b 100B.x =60a +40b 100C.x =a +bD.x =a +b 28.在抽查某产品的尺寸进程中,将其尺寸数据分成假设干组,[a ,b ]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,那么|a-b|=( )A.h·m B.hmC.mhD.与m,h无关9.图2­5是某县参加2021年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,…,A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2­6是统计图中身高在必然范围内学生人数的一个算法流程图.现要统计身高在160~180 cm(含160 cm,不含180 cm)的学生人数,那么在流程图中的判定框内应填写的条件是( )图2­5图2­6A.i<9? B.i<8? C. i<7? D.i<6?10.图2­2­8是依照某班学生在一次数学考试中的成绩画出的频率散布直方图,假设80分以上为优秀,依照图形信息可知:这次考试的优秀率为( )图2­2­8A.25%B.30%C.35%D.40%11.一个社会调查机构就某地居民的月收入调查了10 000人,并依照所得数据得出样本频率散布直方图(如图2­2­9).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人顶用分层抽样方式抽出100人做进一步伐查,那么在[2500,3000)(单位:元)月收入段中应抽出________人.图2­2­9二、填空题12.以下四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④频率散布直方图中各小长方形的面积等于相应各组的频数.其中正确的有__________(填序号).13.将参加数学竞赛的1000名学生编号如下:0001,0002,003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方式把编号分成50个部份,若是第一部份编号为0001,0002,0003,…,0020,第一部份随机抽取一个号码为0015,那么抽取的第40个号码为________.14.超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,不然视为违规.某天,有1000辆汽车通过了该路段,通过雷达测速取得这些汽车运行时速的频率散布直方图如图2­7,那么违规的汽车大约为________辆.图2­715.已知回归直线斜率估量值为1.23,样本点中心为(4,5),那么回归方程是____________.三、解答题16.某校文学社开展“红五月”征文活动,作品上交时刻为5月2号~5月22号,评委从收到的作品中抽出200,经统计,其频率散布直方图如图2­2­16.(1)样本中的作品落在[6,10)内的频数是多少?(2)估量众数、中位数和平均数各是多少?17.对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:甲2738303735312450乙3329383428364345(1)画出茎叶图。

新教材高中数学章末综合检测三成对数据的统计分析新人教A版选择性必修第三册

新教材高中数学章末综合检测三成对数据的统计分析新人教A版选择性必修第三册

章末综合检测(三) 成对数据的统计分析A 卷——基本知能盘查卷一、单项选择题1.可用来分析身高与体重有关系的是( ) A .残差分析 B .线性回归模型 C .等高堆积条形图D .独立检验解析:选B 因为身高与体重是两个具有相关关系的变量,所以要用线性回归模型来解决.2.两个变量y 与x 的经验回归模型中,分别选择了四个不同模型来拟合y 与x 之间的关系,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1 C .模型3D .模型4解析:选A 两个变量y 与x 的经验回归模型中,它们的相关指数R 2越接近于1,这个模型的拟合效果越好,所给出的四个选项中0.98是相关指数最大的值,所以拟合效果最好的模型是模型1.3.已知一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )满足y i =a +bx i +e i (i =1,2,…,n ),若e i 恒为0,则R 2=( )A .0B .0.5C .0.9D .1选D4.如果有95%的把握说事件A 和B 有关系,那么具体计算出的数据为( ) A .χ2>3.841 B .χ2<3.841 C .χ2>6.635D .χ2<6.635解析:选A 由独立性判断的方法可知,如果有95%的把握,即小概率值α=0.05,则χ2>3.841.5.观察两个变量(存在线性相关关系)得如下数据:A.y ^=12x +1B.y ^=xC.y ^=2x +13D.y ^=x +1解析:选 B 根据表中数据得x -=18×(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,y -=18×(-9-7-5-3+4.01+4.99+7+8)=0,所以两变量x ,y 的经验回归方程过样本点的中心(0,0),可以排除A 、C 、D 选项,故选B.6.2020年初,新型冠状病毒(COVID ­19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:周数(x ) 1 2 3 4 5 治愈人数(y )2173693142由表格可得y 关于x 的二次回归方程为y ^=6x 2+a ,则此回归模型第4周的残差(实际值与预报值之差)为( )A .5B .4C .1D .0解析:选A 设t =x 2,则t -=15(1+4+9+16+25)=11,y -=15(2+17+36+93+142)=58,a =58-6×11=-8,所以y ^=6x 2-8.令x =4,得e 4=y 4-y ^4=93-6×42+8=5.7.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:喜爱程度 性别合计 男(Y =0) 女(Y =1) 爱好(X =0) 10 40 50 不爱好(X =1)20 30 50 合计3070100参考数据及公式:P (χ2≥x α)0.10 0.05 0.01 x α2.7063.8416.635其中χ2=n ad -bc 2a +bc +d a +cb +d,n =a +b +c +d .则下列结论正确的是( )A .根据小概率值α=0.05的独立性检验,认为爱吃零食与性别有关B .根据小概率值α=0.05的独立性检验,认为爱吃零食与性别无关C .根据小概率值α=0.01的独立性检验,认为爱吃零食与性别有关D .根据小概率值α=0.1的独立性检验,认为爱吃零食与性别无关 解析:选A 零假设为H 0:是否爱吃零食与性别相互独立,即是否爱吃零食与性别无关.根据列联表中的数据,经计算得到 χ2=100×10×30-40×20250×50×30×70≈4.762>3.841=x 0.05,所以依据小概率值α=0.05的独立性检验,推断H 0不成立,即认为是否爱吃零食与性别有关.同理可得,根据小概率值α=0.01的独立性检验,认为爱吃零食与性别无关;根据小概率值α=0.1的独立性检验,认为爱吃零食与性别有关.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A 将y ^=7.675代入回归方程,可计算得x ≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83,即约为83%.二、多项选择题9.下列说法正确的是( )A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在线性经验回归模型中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的水平带状区域的宽度越狭窄,其模型拟合的精度越高D .在经验回归模型中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好解析:选ACD 由于线性相关系数|r |≤1,且当|r |越大,线性相关性越强,故r <0时,选项B 不正确,A 、C 、D 均正确.10.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,则下列结论正确的是( )A .y 与x 负相关且y ^=2.347x -6.423 B .y 与x 负相关且y ^=-3.476x +5.648 C .y 与x 正相关且y ^=5.437x +8.493 D .y 与x 正相关且y ^=-4.326x -4.578解析:选BC 正相关指的是y 随x 的增大而增大,负相关指的是y 随x 的增大而减小,故正确的为B 、C.11.以下关于线性经验回归的判断中,正确的选项为( )A .若散点图中所有点都在一条直线附近,则这条直线为经验回归直线B .散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 点C .已知线性经验回归方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69 D .线性经验回归方程的意义是它反映了样本整体的变化趋势解析:选BCD 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=b ^x +a ^才是回归直线,所以A 错误;B 正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69,所以C 正确;D 正确.12.有两个分类变量X 与Y ,其2×2列联表如下表所示:X Y 合计 Y =0 Y =1X =0 a20-a 20 X =115-a 30+a 45 合计155065其中a,15-a 均为大于5的整数,根据小概率值α=0.05的独立性检验,认为X 与Y 之间有关,则a 等于( )A .7B .8C .9D .6解析:选BC 根据小概率值α=0.05的独立性检验,认为X 与Y 之间有关,需要χ2的值大于或等于3.841,由χ2=65×[a 30+a -20-a15-a ]220×45×15×50=1313a -6025 400≥3.841,解得a ≥7.69或a ≤1.54.而a >5且15-a >5,a ∈Z , 所以a =8或a =9. 三、填空题13.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:吸烟量年龄合计不超过40岁 (Y =0)超过40岁 (Y =1) 不多于20支/天(X =0) 50 1565多于20支/天 (X =1) 10 25 35 合计6040100则χ2=________(保留到小数点后两位有效数字). 解析:由列联表知χ2=100×10×15-50×25260×40×65×35≈22.16.答案:22.1614.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,具体数据如下表:性别专业非统计专业 (Y =0)统计专业 (Y =1) 男(X =0) 13 10 女(X =1)720为了判断主修统计专业是否与性别有关系,根据表中数据,得到χ2=50×13×20-10×7223×27×20×30≈4.844>3.841,所以能根据小概率值α=________,我们断定主修统计专业与性别有关系.解析:因为P (χ2≥3.841)=0.05,所以小概率值α=0.05. 答案:0.0515.下表是降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性经验回归方程y ^=0.7x +0.35,那么表中m 的值为________.x3 4 5 6y2.5 m 4 4.5解析:根据所给的表格可以求出x -=3+4+5+64=4.5,y -=2.5+m +4+4.54=11+m 4,因为这组数据的样本点的中心在线性经验回归直线上, 所以11+m4=0.7×4.5+0.35,所以m =3.答案:3 四、解答题16.(12分)为做好2022年北京冬季奥运会的宣传工作,组委会计划从某大学选取若干名大学生志愿者,某记者在该大学随机调查了1 000名大学生,以了解他们是否愿意做志愿者工作,得到的数据如表所示:性别 是否愿意做志愿者 合计 愿意(Y =0)不愿意(Y =1)男(X =0)610 女(X =1)90 合计800(1)根据题意完成表格.(2)依据小概率值α=0.05的独立性检验,分析愿意做志愿者工作与性别是否有关? 参考公式及数据:χ2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .P (χ2≥x α)0.10 0.05 0.01 x α2.7063.8416.635解:(1)性别 是否愿意做志愿者 合计 愿意(Y =0)不愿意(Y =1)男(X =0) 500 110 610 女(X =1) 300 90 390 合计8002001 000(2)零假设为H 0:愿意做志愿者工作与性别是相互独立,即愿意做志愿者工作与性别是无关的.根据列联表中的数据,经计算得到 χ2=1 000×500×90-110×3002610×390×800×200=3 000793≈3.783<3.841=x 0.05, 所以依据小概率值α=0.05的独立性检验,没有充分证据推断H 0不成立,即愿意做志愿者工作与性别是无关的.17.(12分)自从高中生通过高校自主招生可获得加分进入高校的政策出台后,自主招生越来越受到高中生家长的重视.某机构为了调查A 城市和B 城市的高中家长对于自主招生的关注程度,在这两个城市中抽取了100名高中生家长进行了调查,得到下表:城市高中家长是否关注合计关注(Y =0)不关注(Y =1)A 城高中家长(X =0)2050B 城高中家长(X =1) 20 合计100(1)完成上面的列联表;(2)根据上面列联表的数据,能否根据小概率值α=0.05的独立性检验,判断家长对自主招生关注与否与所处城市有关系;(3)为了进一步研究家长对自主招生的看法,该机构从关注的学生家长里面,按照分层随机抽样方法抽取了5人,并再从这5人里面抽取2人进行采访,求所抽取的2人恰好A ,B 两城市各一人的概率.参考公式:χ2=n ad -bc 2a +bc +d a +cb +d(其中n =a +b +c +d ).附表:P (χ2≥x α)0.10 0.05 0.010 x α2.7063.8416.635解:(1)列联表如下: 城市高中家长是否关注合计关注(Y =0) 不关注(Y =1)A 城高中家长(X =0)203050B 城高中家长(X =1) 30 20 50 合计 5050100(2)零假设为H 0:家长对自主招生关注与否与所处城市相互独立,即家长对自主招生关注与否与所处城市无关.根据列联表中的数据,经计算得到 χ2=100×20×20-30×30250×50×50×50=4>3.841.所以根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即认为家长对自主招生的关注与否与所处城市是有关的.(3)关注的人共有50人,按照分层随机抽样的方法,A 城市2人,B 城市3人,从5人中抽取2人有C 25=10种不同的方法,A ,B 两城市各取一人有C 12C 13=2×3=6种不同的方法,故所抽取的2人恰好A ,B 两城市各一人的概率为C 13C 12C 25=610=0.6.B 卷——高考能力达标卷一、单项选择题1.下列属于相关关系的是( ) A .利息与利率 B .居民收入与储蓄存款 C .电视机产量与苹果产量 D .某种商品的销售额与销售价格解析:选B A 与D 是函数关系,C 中两变量没有关系,B 中居民收入与储蓄存款是相关的,但不具有函数关系.2.已知一个经验回归方程为y ^=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y -=( )A .58.5B .46.5C .60D .75解析:选A x -=1+7+5+13+195=9,因为经验回归直线必过样本点的中心(x -,y -), 所以y -=1.5×9+45=13.5+45=58.5.3.已知每一吨铸铁成本y (元)与铸件废品率x %建立的经验回归方程y ^=56+8x ,则下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据经验回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.4.某商品销售量y (件)与销售价格x (元/件)负相关,则其经验回归方程可能是( ) A .y =-10x +200 B .y =10x +200 C .y =-10x -200D .y =10x -200解析:选A 由于销售量y 与销售价格x 成负相关,故排除B 、D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意.5.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的经验回归方程为y ^=0.85x -85.71,则下列说法错误的是( )A .y 与x 具有正的线性相关关系B .经验回归直线过样本点的中心C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 选项中,若该大学某女生身高为170 cm ,则可断定其体重约为0.85×170-85.71=58.79(kg).故D 选项错误.6.如图所示的是调查某地区男、女中学生喜欢理科的等高堆积条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的比例约为80%C .男生比女生喜欢理科的可能性大些D .男生中不喜欢理科的比例约为60%解析:选C 由题图可知女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.7.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.8.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:物理成绩数学成绩合计85~100分 (Y =0)85分以下 (Y =1) 85~100分(X =0) 37 85 122 85分以下(X =1)35 143 178 合计72228300 根据表中数据,分析数学成绩与物理成绩有关联的出错率不超过( ) A .0.5% B .1% C .0.1%D .5%解析:选D 由表中数据代入公式得 χ2=300×37×143-85×352122×178×72×228≈4.514>3.841=x 0.05,所以判断的出错率不超过5%. 二、多项选择题9.给出下列实际问题,其中用独立性检验可以解决的问题有( ) A .一种药物对某种病的治愈率 B .两种药物治疗同一种病是否有区别 C .吸烟得肺病的概率 D .吸烟与性别是否有关系答案:BD10.对于经验回归方程y ^=b ^x +a ^,下列说法正确的是( ) A .直线必经过点(x -,y -)B .x 增加1个单位时,y 平均增加b ^个单位 C .样本数据中x =0时,可能有y =a ^D .样本数据中x =0时,一定有y =a ^解析:选ABC 经验回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.11.下列说法中正确的有( ) A .若r >0,则x 增大时,y 也相应增大 B .若r <0,则x 增大时,y 也相应增大C .若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上D .|r |越接近1,相关关系越强解析:选ACD 若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故A 正确.r <0,表示两个变量负相关,x 增大时,y 相应减小,故B 错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故C 正确,D 正确.12.根据如下样本数据:得到的经验回归方程为y =b x +a ,则( ) A.a ^>0 B.a ^<0 C.b ^>0D.b ^<0解析:选AD 根据题意,画出散点图(图略).根据散点图,知两个变量为负相关,且经验回归直线与y 轴的交点在y 轴正半轴,所以a ^>0,b ^<0.三、填空题13.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若两名同学的总成绩相差50分,则他们的数学成绩大约相差________分.解析:令两人的总成绩分别为x 1,x 2.则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20. 答案:2014.为了判断高三年级学生选修文科是否与性别有关,现随机抽取70名学生,得到如图所示2×2列联表:已知P (≈4.667,则在犯错误的概率不大于________的前提下认为选修文科与性别有关.解析:由题意知, χ2≈4.667,因为6.635>4.667>3.841,所以在犯错误的概率不大于0.05的前提下认为选修文科与性别有关.答案:0.0515.已知x ,y 之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是______________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎪⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎪⎫4-1032+⎝⎛⎭⎪⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎪⎫3-722+(4-4)2+⎝⎛⎭⎪⎫5-922=12. 因为S 2<S 1,故用直线l 2:y =12x +12拟合程度更好.答案:y =12x +12四、解答题16.(12分)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上.若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,则使用微信的人中75%是青年人.如果规定每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中,中年人有40人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,请完成下面的2×2列联表;使用微信 年龄合计青年人(Y =0)中年人(Y =1)经常使用微信 (X =0)不经常使用微信(X =1) 合 计(2)根据列联表中的数据,依据小概率值α=0.001的独立性检验分析该公司经常使用微信的员工与年龄的关系.解:(1)由已知可得,该公司员工中使用微信的有200×90%=180(人). 经常使用微信的有180-60=120(人), 使用微信的人中青年人有180×75%=135(人), 故2×2列联表如下:使用微信 年龄合计青年人(Y =0)中年人(Y =1)经常使用微信 (X =0) 8040120不经常使用微信(X =1) 55 5 60 合 计 13545180(2)零假设为H 0:该公司经常使用微信的员工与年龄相互独立,即该公司经常使用微信的员工与年龄无关.将列联表中的数据代入公式可得, χ2=180×80×5-40×552135×45×120×60≈13.333>10.828=x 0.001,所以根据小概率值α=0.001的独立性检验,我们推断H 0不成立,即认为该公司经常使用微信的员工与年龄有关.17.(12分)淘宝网卖家在某商品的所有买家中,随机选择男女买家各50位进行调查,他们的评分等级如下:评分等级 [0,1] (1,2] (2,3] (3,4] (4,5] 女/人 2 7 9 20 12 男/人 3918128(1)从评分等级为(4,5]的人中随机选取2人,求恰有1人是男性的概率;(2)规定:评分等级在[0,3]为不满意该商品,在(3,5]为满意该商品.完成下面列联表,并根据小概率值α=0.05的独立性检验,分析性别与对商品满意度是否有关.性别评分等级合计满意该商品 (Y =0)不满意该商品(Y =1)女(X =0) 男(X =1) 合计解:(1)因为从评分等级(4,5]的20人中随机选取2人,共有C 220=190种选法,其中恰有1人为男性的共有C 112C 18=96种选法,所以所求概率P =96190=4895.(2)列联表如下:性别评分等级合计满意该商品 (Y =0)不满意该商品(Y =1) 女(X =0) 32 18 50 男(X =1) 20 30 50 合计5248100 零假设为H 0:性别与对商品满意度相互独立,即性别与对商品满意度无关.由公式得χ2=100×32×30-20×18250×50×52×48≈5.769>3.841=x 0.05,所以根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即可以认为性别与对商品满意度有关.。

(好题)高中数学必修三第一章《统计》测试卷(答案解析)

(好题)高中数学必修三第一章《统计》测试卷(答案解析)

一、选择题1.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.52.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度3.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙4.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,47.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元9.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三 周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表:根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.14.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.15.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________16.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______. 17.对具有线性相关关系的变量x ,y ,有一组观察数据(,)(1,2,9)i i x y i =⋅⋅⋅,其回归直线方程是:2y x a =+,且919ii x==∑,9118i i y ==∑,则实数a 的值是__________.18.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.19.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.20.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:月份i 7 8 9 10 11 12 销售单价i x (元) 9 9.5 10 10.5 11 8.5 销售量i y (元)111086514y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 22.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)23.据统计某品牌服装专卖店一周内每天获取得纯利润y (百元)与每天销售这种服装件数x (百件)之间有如下一组数据.该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500). (1)利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2)求该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程.(精确到0.01) (3)估计每天销售1200件这种服装时获多少纯利润? 附表:(随机数表第7行至第9行)84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 2387933211 23429 78645 60782 52420 74438 15510 01342 99660 27954 参考数据:721280i i x==∑,72145309i i y ==∑,713487i i i x y ==∑.参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-24.某公司有400名员工,根据男女员工人数比例,用分层随机抽样的方法从中抽取了100人,调查他们的通勤时间(上下班途中花费的总时间,单位:分钟),将数据按照[)20,30,[)30,40,,[]80,90分成7组,并整理得到如下频率分布直方图:(I )从总体中随机抽取1人,估计其通勤时间小于40分钟的概率; (Ⅱ)求样本数据的中位数的估计值;(Ⅲ)已知样本中通勤时间大于或等于60分钟的人都是男员工,通勤时间小于60分钟的人中有一半是男员工,求该公司男员工的人数.25.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:做不到科学用眼 能做到科学用眼 合计 男 45 10 55 女 30 15 45 合计7525100(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:26.某企业广告费支出与销售额(单位:百万元)数据如表所示: (1)求销售额y 关于广告费x 的线性回归方程;(2)预测当销售额为76百万元时,广告费支出为多少百万元. 回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.2.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.3.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.4.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.C解析:C 【解析】分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1ay bx =-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.9.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题 10.C解析:C【分析】设该样本中高三年级的学生人数为x ,则1800601200x=,解之即可 【详解】设该样本中高三年级的学生人数为x , 则1800601200x=,解得40x =, 故选C .【点睛】 本题考查了分层抽样方法的应用问题,属基础题.11.B解析:B【解析】【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果.【详解】由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72, a=84﹣0.72×108=6.24, ∴y =0.72x+6.24,故选:B .【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.12.A解析:A【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy =-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确.故选A. 点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平 解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解.【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=, 所以2221220()()() 4.2a x a x a x -+-++-=, 所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20.【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.14.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差5【解析】 试题分析:由平均数及方差的定义可得10685675x ++++==; 222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==. 考点:样本数据的数字特征:平均值与方差.15.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考 解析:18【解析】【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得.【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =.【点睛】本题主要考查了系统抽样,属于中档题.16.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归 解析:16- 【解析】【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值【详解】由已知,()12101210330x x x y y y +++=+++= ()12101310x x x x ∴=⨯+++=()12101110y y y y =⨯+++= 代入回归直线方程可得:3132b =+6故答案为16-【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果17.0【解析】分析:根据回归直线方程过样本中心点计算平均数代入方程求出的值详解:根据回归直线方程过样本中心点即答案为0点睛:本题考查了线性回归方程过样本中心点的应用问题是基础题解析:0【解析】 分析:根据回归直线方程过样本中心点x y (,), 计算平均数代入方程求出a 的值. 详解:根据回归直线方程ˆ2y x a =+过样本中心点x y (,),191191,99i i x x ==∑=⨯= 191118299i i y y ==∑=⨯=, 22210a y x ∴=-=-⨯=;即答案为0.点睛:本题考查了线性回归方程过样本中心点的应用问题,是基础题.18.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12【解析】分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.19.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140解析:140【解析】 根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.20.30【解析】由题意可得:则成绩不低于分的人数为人解析:30【解析】由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大.【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想;(3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可.【详解】(1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时, ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的.(3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大.【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .22.(1)0.36 6.24y x =+;(2)8.76万吨.【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量.【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()61621 6.30.3617.5ˆi ii i i t t y y b t t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨.【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 23.(1)301,169,105,071,286;(2) 4.7551.36y x =+;(3)10836元.【分析】(1)按照规则直接读取随机数表即可得解;(2)由题中数据可得x 、y ,代入公式即可得b 、a ,即可得解;(3)将12x =代入线性回归方程中,即可得解.【详解】(1)由随机数表可得,最先检测的5件服装的编号为:301,169,105,071,286; (2)由题意345678967x ++++++==, 6669738189909155977y ++++++==, 所以717222155973487767 4.75280767i ii i i x y x y b x x==--⨯⨯===-⨯-∑∑,5596 4.7551.367a y bx -⨯≈=-=, 所以该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程为 4.7551.36y x =+; (3)当12x =时, 4.751251.36108.36y =⨯+=(百元),故可估计每天销售1200件这种服装时获纯利润10836元.【点睛】本题考查了随机数表的应用及线性回归方程的求解与应用,考查了运算求解能力,属于中档题.24.(Ⅰ)0.6;(Ⅱ)37.5;(Ⅲ)220.【分析】(Ⅰ)根据频率分布直方图求解即可;(Ⅱ)先根据频率分布直方图判断中位数落在哪一区间上,然后利用中位数将频率分布直方图的面积分为相等的两部分求解;(Ⅲ)先计算出样本中男员工的人数,计算出男员工所占的比例,然后估计总体中男员工的人数.【详解】解:(1)由频率分布直方图可知,样本中通勤时间小于40的概率()100.020.040.6p =⨯+=,故从总体中随机抽取1人,估计其通勤时间小于40分钟的概率也为0.6.(Ⅱ)由图可知,样本的中位数位于[)30,40之间,设中位数为x ,则()0.2300.040.5x +-⨯=,解得37.5x =,故中位数为37.5.(Ⅲ)样本中通勤时间大于或等于60分钟的人的概率为0.1,共10人,通勤时间小于60分钟的人的频率为0.9,其中男员工有11000.9452⨯⨯=人,所以样本中男员工共有55人,占样本容量的55%,故该公司男员工人数为40055%220⨯=人.【点睛】本题考查频率分布直方图的应用,考查用样本估计总体,难度一般.25.(1)分布列见解析,1;(2)0.10=P ,理由见解析.【分析】 (1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望;(2)按照公式计算2K 的值,然后由临界值表得出结果即可.【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人, 则随机变量X 0=,1,2,∴343641 (0)205 ====CPXC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.26.(1)17.5 6.5y x=+;(2)9百万元.【分析】(1)由已知求得ˆb与ˆa的值,可得销售额y关于广告费x的线性回归方程;(2)在(1)中求得的线性回归方程中,取76y=求得x值即可.【详解】(1)6482555x++++==,5040703060505y++++==.61621()()10(1)(10)320(3)(20)010130ˆ 6.51199020()i iiiix x y ybx x==--⨯+-⨯-+⨯+-⨯-+⨯====++++-∑∑,50 6.5517.5ˆˆa y bx=-=-⨯=.∴销售额y关于广告费x的线性回归方程为ˆ17.5 6.5y x=+;(2)当ˆ76y=时,代入回归方程ˆ17.5 6.5y x=+,求得9x=.故预测当销售额为76百万元时,广告费支出为9百万元.【点睛】本题考查线性回归方程的求法,考查回归方程的应用,考查了计算能力,是中档题.。

高中数学人教A版必修三章节综合测评 第二章《统计》3 含解析

高中数学人教A版必修三章节综合测评 第二章《统计》3 含解析

章末综合测评(三) 概率(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列事件中,随机事件的个数为( )①在学校明年召开的田径运动会上,学生张涛获得100米短跑冠军;②在体育课上,体育老师随机抽取一名学生去拿体育器材,抽到李凯;③从标有1,2,3,4的4张号签中任取一张,恰为1号签; ④在标准大气压下,水在4℃时结冰. A .1 B .2 C .3D .4【解析】 ①在明年运动会上,可能获冠军,也可能不获冠军.②李凯不一定被抽到.③任取一张不一定为1号签.④在标准大气压下水在4℃时不可能结冰,故①②③是随机事件,④是不可能事件.【答案】 C2.下列说法正确的是( )A .甲、乙二人比赛,甲胜的概率为35,则比赛5场,甲胜3场 B .某医院治疗一种疾病的治愈率为10%,前9个病人没有治愈,则第10个病人一定治愈C .随机试验的频率与概率相等D .天气预报中,预报明天降水概率为90%,是指降水的可能性是90%【解析】 概率只是说明事件发生的可能性大小,其发生具有随机性.故选D.【答案】 D3.(2016·开封高一检测)给甲、乙、丙三人打电话,若打电话的顺序是任意的,则第一个打电话给甲的概率是( )A.16 B .13 C.12D .23【解析】 给三人打电话的不同顺序有6种可能,其中第一个给甲打电话的可能有2种,故所求概率为P =26=13.故选B.【答案】 B4.在区间[-2,1]上随机取一个数x ,则x ∈[0,1]的概率为( ) A.13 B .14 C.12D .23【解析】 由几何概型的概率计算公式可知x ∈[0,1]的概率P =1-01-(-2)=13.故选A. 【答案】 A5.1升水中有1只微生物,任取0.1升化验,则有微生物的概率为()A.0.1 B.0.2C.0.3 D.0.4【解析】本题考查的是体积型几何概型.【答案】 A6.(2016·天水高一检测)从一批产品中取出三件产品,设A=“三件产品全不是次品”,B=“三件产品全是次品”,C=“三件产品不全是次品”,则下列结论正确的是()A.A与C互斥B.B与C互斥C.任何两个均互斥D.任何两个均不互斥【解析】互斥事件是不可能同时发生的事件,所以B与C互斥.【答案】 B7.某人从甲地去乙地共走了500 m,途中要过一条宽为x m的河流,他不小心把一件物品丢在途中,若物品掉在河里就找不到,若物品不掉在河里,则能找到,已知该物品能找到的概率为45,则河宽为()A.100 m B.80 m C.50 m D.40 m【解析】设河宽为x m,则1-x500=45,所以x=100.【答案】 A8.从一批羽毛球中任取一个,如果其质量小于4.8 g 的概率是0.3,质量不小于4.85 g 的概率是0.32,那么质量在[4.8,4.85)范围内的概率是( )A .0.62B .0.38C .0.70D .0.68【解析】 记“取到质量小于4.8 g ”为事件A ,“取到质量不小于4.85 g ”为事件B ,“取到质量在[4.8,4.85)范围内”为事件C .易知事件A ,B ,C 互斥,且A ∪B ∪C 为必然事件.所以P (A ∪B ∪C )=P (A )+P (B )+P (C )=0.3+0.32+P (C )=1,即P (C )=1-0.3-0.32=0.38.【答案】 B9.如图1,矩形ABCD 中,点E 为边CD 的中点,若在矩形ABCD 内部随机取一个点Q ,则点Q 取自△ABE 内部的概率等于( ) 【导学号:28750071】图1A.14 B .13 C.12D .23【解析】 点E 为边CD 的中点,故所求的概率P =△ABE 的面积矩形ABCD 的面积=12.【答案】 C10.将区间[0,1]内的均匀随机数x 1转化为区间[-2,2]内的均匀随机数x ,需要实施的变换为( )A .x =x 1*2B .x =x 1*4C .x =x 1*2-2D .x =x 1*4-2【解析】 由题意可知x =x 1*(2+2)-2=4x 1-2. 【答案】 D11.先后抛掷两颗骰子,设出现的点数之和是12,11,10的概率依次是P 1,P 2,P 3,则( )A .P 1=P 2<P 3B .P 1<P 2<P 3C .P 1<P 2=P 3D .P 3=P 2<P 1【解析】 先后抛掷两颗骰子的点数共有36个基本事件:(1,1),(1,2),(1,3),…,(6,6),并且每个基本事件都是等可能发生的.而点数之和为12的只有1个:(6,6);点数之和为11的有2个:(5,6),(6,5);点数之和为10的有3个:(4,6),(5,5),(6,4),故P 1<P 2<P 3.【答案】 B12.在5件产品中,有3件一等品和2件二等品,从中任取2件,则下列选项中以710为概率的事件是( )A .恰有1件一等品B .至少有一件一等品C .至多有一件一等品D .都不是一等品【解析】 将3件一等品编号为1,2,3,2件二等品编号为4,5,从中任取2件有10种取法:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5).其中恰含有1件一等品的取法有:(1,4),(1,5),(2,4),(2,5),(3,4),(3,5),恰有1件一等品的概率为P 1=610,恰有2件一等品的取法有:(1,2),(1,3),(2,3).故恰有2件一等品的概率为P 2=310,其对立事件是“至多有一件一等品”,概率为P 3=1-P 2=1-310=710.【答案】 C二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上).13.一个袋子中有5个红球,3个白球,4个绿球,8个黑球,如果随机地摸出一个球,记A ={摸出黑球},B ={摸出白球},C ={摸出绿球},D ={摸出红球},则P (A )=________;P (B )=________;P (C ∪D )=________.【解析】 由古典概型的算法可得P (A )=820=25,P (B )=320,P (C ∪D )=P (C )+P (D )=420+520=920.【答案】 25 320 92014.在区间(0,1)内任取一个数a ,能使方程x 2+2ax +12=0有两个相异实根的概率为________.【解析】 方程有两个相异实根的条件是Δ=(2a )2-4×1×12=4a 2-2>0,解得|a |>22,又a ∈(0,1),所以22<a <1,区间⎝ ⎛⎭⎪⎫22,1的长度为1-22,而区间(0,1)的长度为1,所以方程有两个相异实根的概率为1-221=2-22.【答案】 2-2215.甲、乙两组各有三名同学,他们在一次测验中的成绩的茎叶图如图2所示,如果分别从甲、乙两组中各随机选取一名同学,则这两名同学的成绩相同的概率是________.图2【解析】 由题意可知从甲、乙两组中各随机选取一名同学,共有9种选法,其中这两名同学的成绩相同的选法只有1种,故所求概率P =19.【答案】 1916.(2016·合肥高一检测)甲乙两人玩猜数字游戏,先由甲心中任想一个数字记为a ,再由乙猜甲刚才想的数字,把乙猜的数字记为b ,且a、b∈{0,1,2,…,9}.若|a-b|≤1,则称甲乙“心有灵犀”.现任意找两人玩这个游戏,则二人“心有灵犀”的概率为________.【解析】此题可化为任意从0~9中取两数(可重复)共有10×10=100种取法.若|a-b|≤1分两类,当甲取0或9时,乙只能猜0、1或8、9共4种,当甲取2~8中的任一数字时,分别有3种选择,共3×8=24种,所以P=24+410×10=725.【答案】7 25三、解答题(本大题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本小题满分10分)(2015·陕西高考)随机抽取一个年份,对西安市该年4月份的天气情况进行统计,结果如下:(1)在4月份任取一天,估计西安市在该天不下雨...的概率;(2)西安市某学校拟从4月份的一个晴天..开始举行连续2天的运动会,估计运动会期间不下雨...的概率. 【解】 (1)在容量为30的样本中,不下雨的天数是26,以频率估计概率,4月份任选一天,西安市不下雨的概率为2630=1315.(2)称相邻的两个日期为“互邻日期对”(如,1日与2日,2日与3日等).这样,在4月份中,前一天为晴天的互邻日期对有16个,其中后一天不下雨的有14个,所以晴天的次日不下雨的频率为78.以频率估计概率,运动会期间不下雨的概率为78.18.(本小题满分12分)对某班一次测验成绩进行统计,如下表所示:(1)求该班成绩在[80,100]内的概率; (2)求该班成绩在[60,100]内的概率.【解】 记该班的测试成绩在[60,70),[70,80),[80,90),[90,100]内依次为事件A ,B ,C ,D ,由题意知事件A ,B ,C ,D 是彼此互斥的.(1)该班成绩在[80,100]内的概率是P (C ∪D )=P (C )+P (D )=0.25+0.15=0.4.(2)该班成绩在[60,100]内的概率是P (A ∪B ∪C ∪D )=P (A )+P (B )+P (C )+P (D )=0.17+0.36+0.25+0.15=0.93.19.(本小题满分12分)小王、小李两位同学玩掷骰子(骰子质地均匀)游戏,规则:小王先掷一枚骰子,向上的点数记为x;小李后掷一枚骰子,向上的点数记为y.(1)在直角坐标系xOy中,以(x,y)为坐标的点共有几个?(2)规定:若x+y≥10,则小王赢;若x+y≤4,则小李赢,其他情况不分输赢.试问这个游戏规则公平吗?请说明理由. 【导学号:28750072】【解】(1)由于x,y取值为1,2,3,4,5,6,则以(x,y)为坐标的点有:(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6),共有36个,即以(x,y)为坐标的点共有36个.(2)满足x+y≥10的点有:(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6个,所以小王赢的概率是636=1 6,满足x+y≤4的点有:(1,1),(1,2),(1,3),(2,1),(2,2),(3,1),共6个,所以小李赢的概率是636=1 6,则小王赢的概率等于小李赢的概率,所以这个游戏规则公平.20.(本小题满分12分)(2014·天津高考)某校夏令营有3名男同学A,B,C和3名女同学X,Y,Z,其年级情况如下表:现从这6名同学中随机选出2人参加知识竞赛(每人被选到的可能性相同).(1)用表中字母列举出所有可能的结果;(2)设M为事件“选出的2人来自不同年级且恰有1名男同学和1名女同学”,求事件M发生的概率.【解】(1)从6名同学中随机选出2人参加知识竞赛的所有可能结果为{A,B},{A,C},{A,X},{A,Y},{A,Z},{B,C},{B,X},{B,Y},{B,Z},{C,X},{C,Y},{C,Z},{X,Y},{X,Z},{Y,Z},共15种.(2)选出的2人来自不同年级且恰有1名男同学和1名女同学的所有可能结果为{A,Y},{A,Z},{B,X},{B,Z},{C,X},{C,Y},共6种.因此,事件M发生的概率P(M)=615=25.21.(本小题满分12分)(2014·四川高考)一个盒子里装有三张卡片,分别标记有数字1,2,3,这三张卡片除标记的数字外完全相同.随机有放回地抽取3次,每次抽取1张,将抽取的卡片上的数字依次记为a,b,c.(1)求“抽取的卡片上的数字满足a +b =c ”的概率;(2)求“抽取的卡片上的数字a ,b ,c 不完全相同”的概率.【解】 (1)由题意知,(a ,b ,c )所有的可能为(1,1,1),(1,1,2),(1,1,3),(1,2,1),(1,2,2),(1,2,3),(1,3,1),(1,3,2),(1,3,3),(2,1,1),(2,1,2),(2,1,3),(2,2,1),(2,2,2),(2,2,3),(2,3,1),(2,3,2),(2,3,3),(3,1,1),(3,1,2),(3,1,3),(3,2,1),(3,2,2),(3,2,3),(3,3,1),(3,3,2),(3,3,3),共27种.设“抽取的卡片上的数字满足a +b =c ”为事件A ,则事件A 包括(1,1,2),(1,2,3),(2,1,3),共3种.所以P (A )=327=19.因此,“抽取的卡片上的数字满足a +b =c ”的概率为19.(2)设“抽取的卡片上的数字a ,b ,c 不完全相同”为事件B ,则事件B 包括(1,1,1),(2,2,2),(3,3,3),共3种.所以P (B )=1-P (B )=1-327=89.因此,“抽取的卡片上的数字a ,b ,c 不完全相同”的概率为89.22.(本小题满分12分)把参加某次铅球投掷的同学的成绩(单位:米)进行整理,分成以下6个小组:[5.25,6.15),[6.15,7.05),[7.05,7.95),[7.95,8.85),[8.85,9.75),[9.75,10.65],并绘制出频率分布直方图,如图3所示是这个频率分布直方图的一部分.已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30,第6小组的频数是7.规定:投掷成绩不小于7.95米的为合格.图3(1)求这次铅球投掷成绩合格的人数;(2)你认为这次铅球投掷的同学的成绩的中位数在第几组?请说明理由;(3)若参加这次铅球投掷的学生中,有5人的成绩为优秀,现在要从成绩优秀的学生中,随机选出2人参加相关部门组织的经验交流会,已知a、b两位同学的成绩均为优秀,求a、b两位同学中至少有1人被选到的概率.【解】(1)∵第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)=0.14.∴参加这次铅球投掷的总人数为70.14=50.根据规定,第4、5、6组的成绩均为合格,人数为(0.28+0.30+0.14)×50=36.(2)∵成绩在第1、2、3组的人数为(0.04+0.10+0.14)×50=14,成绩在第5、6组的人数为(0.30+0.14)×50=22,参加这次铅球投掷的总人数为50,∴这次铅球投掷的同学的成绩的中位数在[7.95,8.85)内,即第4组.(3)设这次铅球投掷成绩优秀的5人分别为a、b、c、d、e,则选出2人的所有可能的情况为:ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10种,其中a、b至少有1人的情况为:ab,ac,ad,ae,bc,bd,be,共有7种,∴a、b两位同学中至少有1人被选到的概率为P=7 10.。

2021年高中数学 第二章 统计综合测试题(含解析)新人教B版必修3

2021年高中数学 第二章 统计综合测试题(含解析)新人教B版必修3

2021年高中数学 第二章 统计综合测试题(含解析)新人教B 版必修3一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1.下列哪种工作不能使用抽样方法进行( ) A .测定一批炮弹的射程B .测定海洋某一水域的某种微生物的含量C .高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D .检测某学校全体高三学生的身高和体重的情况 [答案] D[解析] 抽样是为了用总体中的部分个体(即样本)来估计总体的情况,选项A 、B 、C 都是从总体中抽取部分个体进行检验,选项D 是检测全体学生的身体状况,所以,要对全体学生的身体都进行检验,而不能采取抽样的方法.故选D.2.高一·一班李明同学进行一项研究,他想得到全班同学的臂长数据,他应选择的最恰当的数据收集方法是( )A .做试验B .查阅资料C .设计调查问卷D .一一询问[答案] A[解析] 全班人数不是很多,所以做试验最恰当.3.设有一个回归方程为y ^=2-2.5x ,变量x 增加一个单位时,变量y ( ) A .平均增加1.5个单位 B .平均增加2个单位 C .平均减少2.5个单位D .平均减少2个单位 [答案] C[解析] 因为随变量x 增大,y 减小,x 、y 是负相关的,且b ^=-2.5,故选C. 4.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,根据此图估计学生在课外读物方面的支出费用的中位数为( )元( )A .45B .3909C.4009D .46[答案] C [解析] 40+10×0.160.36=4009. 5.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人.为了了解职工的某种情况,要从中抽取一个容量为20的样本,按下述三种方法抽取:①将160人从1至160编上号,然后用白纸做成1~160号的签160个放入箱内拌匀,然后从中抽取20个签,与签号相同的20个人被选出;②将160人从1至160编上号,按编号顺序分成20组,每组8人,即1~8号,9~16号,…,153~160号.先从第1组中用抽签方法抽出k 号(1≤k ≤8),其余组的(k +8n )号(n =1、2、…、19)亦被抽出,如此抽取20人;③按20160=18的比例,从业务人员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人,都用随机数表法从各类人员中抽取所需的人数,他们合在一起恰好抽到20人.上述三种抽样方法,按简单随机抽样、分层抽样、系统抽样的顺序是( ) A .①、②、③ B .②、①、③ C .①、③、② D .③、①、②[答案] C[解析] ①是简单随机抽样;②是系统抽样;③是分层抽样,故选C.6.样本中共有五个个体,其值分别为a 、0、1、2、3.若该样本的平均值为1,则样本方差为( )A.65 B .65C. 2 D .2[答案] D [解析] ∵a +0+1+2+35=1,∴a =-1,故S 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.7.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )8 9 79 3 1 6 4 0 2A .91.5和91.5 C .91和91.5 D .92和92[答案] A[解析] 将这组数据从小到大排列,得87、89、90、91、92、93、94、96. 故平均数x -=87+89+90+91+92+93+94+968=91.5,中位数为91+922=91.5,故选A.8.对变量x 、y 有观测数据理据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u 、v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 [答案] C[解析] 本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力.由散点图可以判断变量x与y负相关,u与v正相关.9.已知样本容量为30,在样本频率分布直方图中,各小长方形的高的比从左到右依次为2431,则第2组的频率和频数分别是( )A.0.4,12 B.0.6,16C.0.4,16 D.0.6,12[答案] A[解析]因为各小长方形的高的比从左到右依次为2431,所以第2组的频率为0.4,频数为30×0.4=12.10.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高y(单位:cm)对年龄x(单位:岁)的回归直线方程y=73.93+7.19x,用此方程预测儿子10岁时的身高,有关叙述正确的是( )A.身高一定为145.83 cmB.身高大于145.83 cmC.身高小于145.83 cmD.身高在145.83 cm左右[答案] D[解析]用回归直线方程预测的不是准确值,而是估计值.当x=10时,y=145.83,只能说身高在145.83 cm左右.11.设矩形的长为a,宽为b,其比满足b a=5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( )A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定[答案] A[解析]本小题主要考查学生的知识迁移能力和统计的有关知识.x -甲=0.598+0.625+0.628+0.595+0.6395=0.617,x -乙=0.618+0.613+0.592+0.622+0.6205=0.613,故选A.12.某示范农场的鱼塘放养鱼苗8万条,根所这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg ,第二网捞出25条,称得平均每条鱼2.2 kg ,第三网捞出35条,称得平均每条鱼2.8 kg ,试估计鱼塘中鱼的总质量约为( )A .192 280 kgB .202 280 kgC .182 280 kgD .172 280 kg[答案] A[解析] 平均每条鱼的质量为x -=40×2.5+25×2.2+35×2.840+25+35=2.53(kg),所以估计这时鱼塘中鱼的总质量约为80 000×95%×2.53=192 280(kg).二、填空题(本大题共4小题,每小题4分,共16分.把答案填写在题中的横线上.) 13.一支田径队有男女运动员98人,其中男运动员有56人.按男、女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________.[答案] 12 [解析] ∵2898=27,即每7人抽取2人,又知女运动员人数为98-56=42, ∴应抽取女运动员人数为42×27=12(人).分层抽样中抓住“抽样比”是解决问题的关键.14.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数.则这10天甲、乙两人日加工零件的平均数分别为________和________.[答案] 24 23[解析] x -甲=110(10×2+20×5+30×3+17+6+7)=24,x -乙=110(10×3+20×4+30×3+17+11+2)=23.15.(xx·山东临沂高一期末测试)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55)、[55,65)、[65,75)、[75,85)、[85,95),由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[55,75)的人数是________.[答案]13[解析]由频率分布直方图知[55,75)之间的频率为(0.040+0.025)×10=0.65,故[55,75)之间的人数为0.65×20=13.16.某校甲、乙两个班级各有5名编号为1、2、3、4、5的学生进行投篮练习,每人投10次,投中的次数如下表:学生1号2号3号4号5号甲组67787乙组67679则以上两组数据的方差中较小的一个为s2=______.[答案]2 5[解析]x甲=6+7+7+8+75=7,x乙=6+7+6+7+95=7.∴s2甲=6-72+7-72+7-72+8-72+7-725=25,s2乙=7-62+7-72+7-62+7-72+7-925=65,则两组数据的方差中较小的一个为s2甲=25 .三、解答题(本大题共6个小题,共74分,解答应写出文字说明、证明过程或演算步骤)17.(本题满分12分)下面的抽样方法是简单随机抽样吗?为什么?(1)某班有40名同学,指定个子最高的5名同学参加学校组织的篮球赛;(2)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回,再拿一件,连续玩了5件;(3)从200个灯泡中逐个抽取20个进行质量检查. [解析] (1)不是简单随机抽样,因为这不是等可能抽样. (2)不是简单随机抽样,因为它是有放回的抽样.(3)是简单随机抽样,因为它满足简单随机抽样的几个特点.18.(本题满分12分)已知某班4个小组的人数分别为10、10、x 、8,这组数据的中位数与平均数相等,求这组数据的中位数.[解析] 该组数据的平均数为14(28+x ),中位数一定是其中两个数的平均数,因为x不知是多少,所以要分几种情况讨论.(1)当x ≤8时,原数据按从小到大的顺序为x,8,10,10,其中位数为12(10+8)=9.若14(x+28)=9,则x =8,此时中位数为9.(2)当8<x ≤10时,原数据按从小到大顺序排列为8,x,10,10,其中位数为12(x +10),若14(x +28)=12(x +10),则x =8,而8不在8<x ≤10的范围内, ∴舍去.(3)当x >10时,原数据为8,10,10,x , 其中位数为12(10+10)=10.若14(x +28)=10,则x =12,∴此时中位数为10. 综上所述,这组数据的中位数为9或10.19.(本题满分12分)一箱方便面共有50包,从中用随机抽样方法抽取了10包称量其重量(单位:g)结果为:60.5 61 60 60 61.5 59.5 59.5 58 60 60(1)指出总体、个体、样本、样本容量; (2)指出样本数据的众数、中位数、平均数; (3)求样本数据的方差.[解析] (1)总体是这50包方便面所有的包重,个体是这一箱方便面中每一包的包重,样本是抽取的10包的包重,样本容量为10.(2)这组样本数据的众数是60,中位数为60,样本平均数x -=110×(60.5+61+60+60+61.5+59.5+59.5+58+60+60)=60.(3)样本数据的方差为s 2=110[(60.5-60)2+(61-60)2+(60-60)2+(60-60)2+(61.5-60)2+(59.5-60)2+(59.5-60)2+(58-60)2+(60-60)2+(60-60)2]=0.8.20.(本题满分12分)(xx·安徽黄山高一期末测试)某班的全体学生共有50人,参加数学测试(百分制)成绩的频率分布直方图如图,数据的分组依次为:[20,40)、[40,60)、[60,80)、[80,100].依此表可以估计这一次测试成绩的中位数为70分.(1)求表中a、b的值;(2)请估计该班本次数学测试的平均分.[解析](1)由中位数为70可得,0.005×20+0.01×20+a×10=0.5,解得a=0.02.又20(0.005+0.01+0.02+b)=1,解得b=0.015.(2)该班本次数学测试的平均分的估计值为30×0.1+50×0.2+70×0.4+90×0.3=68分.21.(本题满分12分)有一容量为50的样本,数据的分组以及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)内的可能性约是多少?[解析](1)频率分布表为:分组频数频数频率[12.5,15.530.06)[15.5,18.580.16)[18.5,21.590.18)[21.5,24.5110.22)[24.5,27.5)100.20[27.5,30.5)50.10[30.5,33.5)40.08合计50 1.00(2)频率分布直方图如图所示:(3)数据落在[15.5,24.5)内的可能性为:8+9+1150=0.56.22.(本题满分14分)(x x·河南新乡市高一期末测试)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求线性回归方程y=b x+a;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是 3.5元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本).(参考公式与数据:6i=1x i y i=4 066,∑i=16x2i=434.2,∑i=16x i=51,∑i=16y i=480.b^=∑i=16x i y i-n x y∑i=16x2i-n x2,a^=y-b^x)[解析](1)x=16(8+8.2+8.4+8.6+8.8+9)=516=8.5,y=16(90+84+83+80+75+68)=4806=80.b ^=∑i =16x i y i -n x y∑i =16x 2i -n x 2=4 066-6×8.5×80434.2-6×8.52=-20, a ^=y -b ^x =80-(-20)×8.5=250.∴线性回归直线方程为y ^=-20x +250. (2)设工厂的利润为y ,依题意得y =(-20x +250)(x -3.5)=-20(x -8)2+405,∴当x =8时,y 取最大值405.即该产品的单价应定为8元时,工厂获得最大利润.i25332 62F4 拴! 7 23630 5C4E 屎26225 6671 晱32922 809A 肚360488CD0 賐22375 5767 坧(NF。

(好题)高中数学必修三第一章《统计》测试题(有答案解析)(1)

(好题)高中数学必修三第一章《统计》测试题(有答案解析)(1)

一、选择题1.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A .2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B .2019年1~4月的业务量同比增长率超过50%,在3月最高C .从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D .从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长2.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277; ②5,9,100,107,121,180,195,221,265,299; ③11,41,71,101,131,161,191,221,251,281; ④31,61,91,121,151,181,211,241,271,299. 关于上述样本的下列结论中,正确的是( ) A .②④都不能为分层抽样 B .①③都可能为分层抽样 C .①④都可能为系统抽样D .②③都不能为系统抽样3.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1964.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④5.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .507.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元8.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .1609.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变10.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.已知数据1x ,2x ,…,10x 的方差为1,且()()()222123222x x x -+-+-()2102170x ++-=,则数据1x ,2x ,…,10x 的平均数是________.15.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=16.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 17.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.18.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.19.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.20.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.三、解答题21.某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行跟踪调查,张三提供了该县某山羊养殖场年养殖数量y (单位:万只)与相应年份x (序号)的数据表和散点图(如图所示),根据散点图,发现y 与x 有较强的线性相关关系,李四提供了该县山羊养殖场的个数z (单位:个)关于x 的回归方程ˆ230zx =-+.年份序号x 1 2 3 4 5 6 7 8 9 年养殖山羊y /万只1.21.51.61.61.82.52.52.62.7y x (2)试估计:①该县第一年养殖山羊多少万只? ②到第几年,该县养殖山羊的数量与第1年相比减少了? 参考统计量:()92160ii x x =⋅-=∑,()()9112i i i x x y y =⋅--=∑.附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 22.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x2 3 4 5 6若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)24.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniiiii i nni ii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)25.两台机床同时生产直径为10的零件,为了检验产品质量,质量质检员从两台机床的产品中各抽取4件进行测量,结果如下:如果你是质量检测员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求.26.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:()1求频率分布直方图中a的值;()2以频率作为概率,试求消费者月饼购买量在600g1400g~的概率;()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?【参考答案】***试卷处理标记,请不要删除一、选择题1.D解析:D【分析】由题意结合所给的统计图确定选项中的说法是否正确即可.【详解】对于选项A: 2018年1~4月的业务量,3月最高,2月最低,-=,接近2000万件,所以A是正确的;差值为439724111986对于选项B: 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B是正确的;对于选项C:2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C是正确的;对于选项D,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D错误.本题选择D选项.【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.2.B解析:B 【分析】根据系统抽样和分层抽样的定义分别进行判断即可. 【详解】若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个; 若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.综上所述,B 选项正确. 故选:B. 【点睛】本题主要考查系统抽样和分层抽样,掌握系统抽样和分层抽样的定义是解题的关键,属于基础题.(1)系统抽样适用于总体容量较大的情况.将总体平均分成若干部分,按事先确定的规则在各部分中抽取,在起始部分抽样时采用简单随机抽样;(2)分层抽样适用于已知总体是由差异明显的几部分组成的.将总体分成互不交叉的层,然后分层进行抽取,各层抽样时采用简单随机抽样或系统抽样.3.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.4.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯, 故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误.所以说法正确的是①③. 故选B. 【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.8.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题 9.A解析:A【分析】可以通过n P 与0P 之间的大小关系进行判断.【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001n n P P k P =+<,呈下降趋势.【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断. 10.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】 乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==== 因此s 1<s 2,选C.【点睛】本题考查标准差,考查基本求解能力.11.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数.详解:∵8名女生,4名男生中选出3名学生组成课外小组,∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112.故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应 解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等. 14.或6【分析】由数据…的方差为1且把所给的式子进行整理两式相减得到关于数据的平均数的一元二次方程解方程即可【详解】数据…的方差为1①②将②-①得解得或故答案为:或6【点睛】本题主要考查一组数据的平均数 解析:2-或6.【分析】由数据1x ,2x ,…,10x 的方差为1,且()()()()2222123102222170x x x x -+-+-++-=,把所给的式子进行整理,两式相减,得到关于数据的平均数的一元二次方程,解方程即可.【详解】 数据1x ,2x ,…,10x 的方差为1,()()()()22221231010x x x x x x x x ∴-+-+-++-=, ()()22221210121010210x x x x x x x x ∴++++-+++=, ()222212101010x x x x ∴+++-=,① ()()()()2222123102222170x x x x -+-+-++-=, ()()22212101210440170x x x x x x ∴+++-++++=, ()22212104040170x x x x ∴+++-+=,② 将②-①得24120x x --=,解得2x =-,或6x =,故答案为:2-或6.【点睛】本题主要考查一组数据的平均数的求法,解题时要熟练掌握方差的计算公式的灵活运用,属于中档题.15.【分析】(1)由回归方程知相关变量与成负相关(2)为假命题则同时为假命题为假命题则中至少有一假命题(3)全称命题与特称命题转换条件不变结论变相反(4)由正态曲线的对称性可解【详解】(1)由回归方程知解析:(2)【分析】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题(3)全称命题与特称命题转换条件不变,结论变相反 (4)由正态曲线的对称性可解.【详解】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,若变量x 增加一个单位,则y 平均增加4-个单位,故(1)错误(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题,所以“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件是正确的.故(2)正确 (3)全称命题与特称命题转换条件不变,结论变相反,故(3)错误(4)由正态曲线的对称性知,随机变量()22X N σ~,,若()0.32P X a <=,对称轴是2x = ,则()40.32P X a >-=,故(4)错误.故答案为; (2)【点睛】 利用正态曲线的对称性求概率是常见的正态分布应用问题.解题的关键是利用对称轴=x μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时可借助图形判断.对于正态分布2()N μσ,,由=x μ是正态曲线的对称轴知: (1)对任意的a ,有()()P X a P X a μμ<->+=;(2)()001;()P X x P X x -≥=<;(3)()()=()P a X b P X b P X a <<<≤-.16.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以 解析:①②④【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解.【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确;根据相关指数的概念,可得2R 越大说明拟合效果越好,所以③不正确;若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间负相关,且线性相关性强,所以④正确;故答案为:①②④.【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.17.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题 解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b+的最小值.【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,故18,712,118a b a b a b ++=≤≤≤=, 49149()()18a b a b a b+=++ 149125(13)(13181818b a a b =++≥+= 当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518. 故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题. 18.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】 由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为3s =. 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题. 19.5【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5【解析】19.5,15,5m y x +== 将样本中心代入回归方程得到m=5.5. 故答案为:5.5. 20.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630.三、解答题21.(1)ˆ0.21yx =+;(2)①33.6万只;②到第10年该县养殖山羊的数量相比第1年减少了.【分析】(1)由已知求得,x y ,进一步套公式求出ˆb和ˆa 的值,就求出线性回归方程; (2)由题意求得()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++, 在①中,令x =1求解,在②中,令20.443033.6x x -++<,解不等式即可.【详解】解:(1)设y 关于x 的线性回归方程为y bx a =+,12345678959x ++++++++==, 1.2 1.5 1.6 1.6 1.8 2.5 2.5 2.6 2.729y ++++++++==, ()()()9192112ˆ0.260i ii i i x x y y b x x ==--===-∑∑, ˆ20.251a=-⨯=. 所以y 关于x 的线性回归方程为ˆ0.21yx =+. (2)估计第x 年山羊养殖的只数为()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++ 令1x =,则0.443033.6-++=,故该县第一年养殖山羊约33.6万只.由题意,得20.443033.6x x -++<,整理得()()910x x -->,解得9x >或1x <(舍去),所以到第10年该县养殖山羊的数量相比第1年减少了.【点睛】方法点睛:求线性回归方程的步骤:(1)先求 x 、y 的平均数,x y ;(2)套公式求出ˆb和ˆa 的值:()()()91921ˆi i i i i x x y y b x x ==--=-∑∑,ˆa y b x =-⨯;(3)写出回归直线的方程. 22.(1)0.5 2.3y x =+;(2)6800元.【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程;(2)将9x =代入即可预测.【详解】 解:(1)由表可得:123456747++++++==x , 2.9 3.3 3.6 4.4 4.8 5.2 5.9 4.37y ++++++==, 又77211134.4,140ii i i i x y x ====∑∑, 71722217134.474 4.30.5140747i ii i i x y x y b x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元.【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.23.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值.【详解】(1)4x =,5y =,52190ii x==∑,51112.3i i i x y ==∑, 12215 1.235n ii i n ii x y xy b xx ==-==-∑∑,0.08a y bx =-=,所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元.【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.24.(1)ˆ0.150.9yx =+;(2)2.25万元. 【分析】(1)由已知数据求出x 和y ,根据所给公式求出ˆb与ˆa 的值,即可得y 关于x 的线性回归方程;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可.【详解】解:(1)依题意可计算得,1(24466677810)610x =+++++++++=, 1(1.0 1.5 1.6 2.0 1.8 1.9 1.8 2.0 2.1 2.3) 1.810y =+++++++++=. 236x =,10.8x y ⋅=,又101115ii i x y ==∑,1021406i i x ==∑, 1022110151ˆ0.1100i i i i i x y x y b xx ==∴=≈⋅--∑∑,ˆˆ0.9ay bx =-=,ˆ0.150.9y x ∴=+, ∴所求的线性回归方程为ˆ0.150.9yx =+. (2)当9x =时,ˆ0.1590.9 2.25y=⨯+=(万元), ∴估计大多数年收入9万元的家庭每年饮食支出约为2.25万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题.25.机床乙的零件质量更符合要求,运算见解析.【详解】 先考虑各自的平均数:设机床甲的平均数、方差分别为211x s 、; 机床乙的平均数、方差分别为222x s 、. 1109.81010.2104x +++==,210.1109.910104x +++== ∴两者平均数相同,再考虑各自的方差: 2222211[(1010)(9.810)(1010)(10.210)]0.024s =-+-+-+-= 2222221[(1010)(10.110)(1010)(9.910)]0.0054s =-+-+-+-= ∵2212s s >,∴机床乙的零件质量较稳定,乙更符合要求.26.(1)a 0.001=;(2)0.62;(3)12.08吨【分析】(1)由频率分布直方图列出方程能求出a .(2)由频率分布直方图先求出满足题意的频率,即得概率.(3)由频率分布直方图先求出人均月饼购买量,由此能求出该超市应准备12.08吨月饼恰好能满足市场需求.【详解】 ()1由()0.00020.00055a 0.00050.000254001++++⨯=,解得a 0.001=.()2消费者月饼购买量在600g 1400g ~的频率为:()0.000550.0014000.62+⨯=,∴消费者月饼购买量在600g 1400g ~的概率为0.62.()3由频率分布直方图得人均月饼购买量为:()4000.00028000.0005512000.00116000.000520000.000254001208g ⨯+⨯+⨯+⨯+⨯⨯=,∴2012085%1208⨯⨯=万克12.08?=吨,∴该超市应准备12.08吨月饼恰好能满足市场需求.【点睛】本题考查用样本的频率分布估计总体分布及识图的能力,求解的重点是对题设条件及直方图的理解,了解直方图中每个小矩形的面积的意义,是中档题.。

2019学年【人教版】数学必修三《统计综合问题》课后练习(含答案)

2019学年【人教版】数学必修三《统计综合问题》课后练习(含答案)

(人教版)精品数学教学资料统计综合问题课后练习主讲教师:熊丹 北京五中数学教师题一:某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .先从老年人中剔除1人,再用分层抽样题二:某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到下列抽样方法( )①简单随机抽样 ②系统抽样 ③分层抽样A .②③B .①③C .③D .①②③题三:将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A .1169B .367C .36D .677题四:已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.①若第1组抽出的号码为2,则所有被抽出职工的号码为________;②分别统计这5名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,则该样本的方差为________.题五:某初级中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…300;使用系统抽样时,将学生统一编号为1,2,…300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277;②5,9,100,107,121,180,195,221,265,299;③11,41,71,101,131,161,191,221,251,281;④31,61,91,121,151,181,211,241,271,300关于上述样本的下列结论中,正确的是( )A .②③都不能为系统抽样B .②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样题六:从已编号为1—50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32题七:在某次人才交流会上,应聘人数和招聘人数分别居前5位的行业列表如下:行业名称计算机机械营销物流贸易应聘人数(单位:人)2231 2053 1546 748 659行业名称计算机营销机械建筑化工招聘人数(单位:人)1210 1030 895 763 725如果用同一行业应聘人数与招聘人数比值的大小来衡量该行业的就业情况,那么根据表中数据,对上述行业的就业情况判断正确的是()A.计算机行业好于其它行业B.贸易行业好于化工行业C.机械行业好于营销行业D.建筑行业好于物流行业题八:某人才市场2004年上半年应聘和招聘人数排名前5个类别的情况如下图所示,若用同一类别中应聘人数与招聘人数比值的大小来衡量该类别的就业情况,则根据图中信息,下列对就业形势的判断一定正确的是()提示:请注意理解图片是应聘和招聘人数排名前5个类别的情况.A.医学类好于营销类B.金融类好于计算机类C.外语类最紧张D.建筑类好于法律类题九:已知数据x1,x2,…,x n的平均数是4,则一组新数据x1+7,x2+7,…,x n+7的平均数是.题十:已知两组数x1, x2,…, x3和y1, y2,…, y3;它们的平均数分别是a和b.分别求下列各组新数据的平均数:(1)5x1,5x2,…,5x n;(2)x1-y1,x2-y2,…,x n-y n;题十一:一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A.13, 12 B.13, 13 C.12, 13 D.13, 14运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.题十三:一般地,家庭用电量y(千瓦)与气温x(℃)有函数关系y=f(x).图(1)表示某年12月中每月的平均气温,图(2)表示某家庭在12个月中每月的用电量.试在数集A={x|5≤x≤30,x是2.5的整数倍}中确定一个最小值x1和最大值x2,使y=f(x)是上的增函数,则区间= .题十四:某校从参加高三年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段后得到如图的频率分布直方图,请你根据频率分布直方图中的信息,估计出本次考试数学成绩的平均分为________.统计综合问题性课后练习参考答案题一: D .详解:总人数为28+54+81=163.样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.若按36∶163取样,无法得到整解,故考虑先剔除1人,抽取比例变为36∶162=2∶9,则中年人取12人,青年人取18人,先从老年人中剔除1人,老年人取6人,组成36的样本.题二: D .详解:由于各家庭有明显差异,所以首先应用分层抽样的方法分别从农民、工人、知识分子这三类家庭中抽出若干户,即36户、2户、2户.又由于农民家庭户数较多,那么在农民家庭这一层宜采用系统抽样;而工人、知识分子家庭户数较少,宜采用简单随机抽样法.故整个抽样过程要用到①②③三种抽样法.题三: B .详解:根据茎叶图,去掉1个最低分87,1个最高分99,则17=91,∴x =4. ∴s 2=17=367.题四: ①2,10,18,26,34 ②62.详解:由题意知被抽出职工的号码为2,10,18,26,34.由茎叶图知5名职工体重的平均数x =59+62+70+73+815=69,则该样本的方差s 2=15=62. 题五: D .详解:在系统抽样中,将学生统一编号为1,2,…300,并将整个编号依次分为10段.则每一段的号码数为30.①中数据为7,37,67,97,127,157,187,217,247,277,数据相差30,所以①为系统抽样或分层抽样.②中数据5,9,100,107,121,180,195,221,265,299;数据排列没有规律,可能为分层抽样. ③中数据11,41,71,101,131,161,191,221,251,281;数据相差30,所以③为系统抽样或分层抽样. ④中数据31,61,91,121,151,181,211,241,271,300,数据相差30,但第一个数据大于30,所以④不可能是系统抽样.故D 正确.题六: B .详解:用系统抽样的方法抽取到的导弹编号应该为k , k +d , k +2d , k +3d , k +4d ,其中d =50/5=10,k 是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求.题七: D .详解:本题综合考查统计部分的有关知识,通过统计表可以得到应聘人数与招聘人数,进而通过计算应聘人数与招聘人数的比值大小来衡量该行业的就业情况,比值越小越容易就业,比值越大越不容易就业,计算机行业比值为1.83;机械行业比值为2.29;营销行业比值为1.50;建筑行业为0;化工行业为0;而物流行业与贸易行业的比值为无穷大,所以此题应选D .题八: D .详解:因为同一类别中应聘人数与招聘人数比值越大的,说明该行业的就业形式越差;反之,比值越小的,说明就业形式越好,由此即可求出答案. 医学类的比值为7.11246021580=;外语类的比值为2.2891020030=; 金融类的比值为5.11029015460=;法律类的比值大于2.170408450=; 计算机类的比值大于65300.97040=;营销类的比值小于65300.97040=;建筑类的比值小于65300.857650=. 则一定正确的是建筑类好于法律类,故选D .题九: 11. 详解:由题意知,一组数据x 1,x 2,x 3,x 4,…,x n 的平均数为(x 1+x 2+x 3+x 4+…+x n )÷n =4∴x 1+7,x 2+7,x 3+7,x 4+7,…,x n +7这组数据的平均数为(x 1+7+x 2+7+x 3+7+x 4+7+…+x n +7)÷n=÷n=(x 1+x 2+x 3+x 4+…+x n )÷n +7=4+7=11.题十: (1)5a ;(2)a -b .详解:(1)第一组中各数据正好是原来数据的5倍,所以平均数也是原来的5倍,故这组数据的平均数为5a ;(2)第二组中各数据正好是原来两组数据的差,所以平均数也是原来两组数据的差,故这组数据的平均数为a -b .题十一: B .详解:设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,(8-2d )(8+4d )=64,(4-d )(2+d )=8,2d -d2=0,又d ≠0,故d =2,故样本数据为4,6,8,10,12,14,16,18,20,22,样本的平均数为(4+22)×510=13,中位数为12+142=13,故选B .题十二: 2.详解:x 甲=15(87+91+90+89+93)=90, x 乙=15(89+90+91+88+92)=90, s 2甲=15=4, s 2乙=15=2. 由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.故答案为2.题十三: .详解:先结合图形读懂题意,再找出图中随气温x (℃)增高家庭用电量y (千瓦)也增高的区间即可.观察两图中随气温x (℃)增高家庭用电量y (千瓦)也增高的是5月到8月,则y =f (x )在x ∈上的增函数,故答案为.题十四: 71.详解:由频率分布直方图得每一组的频率依次为0.1,0.15,0.15,0.3,0.25,0.05,又由频率分布直方图,得每一组数据的中点值依次为45,55,65,75,85,95.所以本次考试数学成绩的平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.故填71.。

青岛青岛超银中学必修三第一章《统计》检测题(答案解析)

青岛青岛超银中学必修三第一章《统计》检测题(答案解析)

一、选择题1.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .22.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A .40B .50C .80D .1003.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.54.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .6755.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9 C .y =1.9x +1.04 D .y =1.05x -0.96.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,47.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆy bx=+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .508.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >9.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .1610.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元11.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和9212.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合二、填空题13.给出下列命题:①函数()π4cos 23f x x ⎛⎫=+ ⎪⎝⎭的一个对称中心为5π,012⎛⎫- ⎪⎝⎭;②若,αβ为第一象限角,且αβ>,则tan tan αβ>;③设一组样本数据12,,,n x x x ⋅⋅⋅的平均数是2,则数据1221,21,,21n x x x --⋅⋅⋅-的平均数为3;④函数sin 2y x =的图象向左平移π4个单位长度,得到πsin 24y x ⎛⎫=+ ⎪⎝⎭的图象.其中正确命题的序号是_____________(把你认为正确的序号都填上).14.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.15.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.16.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 17.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.18.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.19.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.20.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.三、解答题21.某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得到数据如下表: 企业abcdefghij满意度x (%) 21 33 24 20 25 21 24 23 25 12 投资额y (万元)79868978767265625944y x (2)约定:投资额y 关于满意度x 的相关系数r 的绝对值在0.7以上(含0.7)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那一所企业,求关闭此企业后投资额y 关于满意度x 的线性回归方程(精确到0.1).参考数据:22.8x =,71y =,1022110248i i x x =-≈∑,10102222111010643.7i i i i x x y y ==⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑,10110406i i i x y x y =-=∑,222851984=,2287116188⨯=.附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆni ii nii x ynx y bxnx==-=-∑∑,ˆˆa y bx=-.线性相关系数1222211ni ii n ni i i i x y nxyr x nx y ny ===-=⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑.22.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.为培养学生在高中阶段的数学能力,某校将举行数学建模竞赛.已知该竞赛共有60名学生参加,他们成绩的频率分布直方图如图所示.(1)估计这60名参赛学生成绩的中位数;(2)为了对数据进行分析,将60分以下的成绩定为不合格.60分以上(含60分)的成绩定为合格,某评估专家决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会,记ξ为抽取的4人中,成绩不合格的人数,求ξ的分布列与数学期望;(3)已知这60名学生的数学建模竞赛成绩Z 服从正态分布()2,N μσ,其中μ可用样本平均数近似代替,2σ可用样本方差近似代替(同一组数据用该区间的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,估计此次竞赛受到奖励的人数(结果根据四舍五人保留整数).参考数据:()0.6827P Z μσμσ-<≤+≈,()220.9545P Z μσμσ-<≤+≈,()330.9973P Z μσμσ-<≤+≈.24.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据:(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x 与销售单价y 之间的关系,经统计得到如下数据:(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x +++++++÷=,635=917=6372x x ,∴+⨯∴=,故选D. 2.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.6.C解析:C 【解析】分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.7.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .8.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定故22s <故选A【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础 9.B解析:B【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯= 故选B【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错 10.B解析:B【详解】 试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆy bx a =+中的ˆb为9.4, ∴42=9.4×3.5+a ,∴ˆa=9.1, ∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5考点:线性回归方程11.A解析:A【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.5 12.A解析:A【分析】由题意知,两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,所以两组数据的样本中心点是(s ,t ),回归直线经过样本的中心点,得到直线l 1和l 2都过(s ,t ).【详解】∵两组数据变量x 的观测值的平均值都是s ,对变量y 的观测值的平均值都是t ,∴两组数据的样本中心点都是(s ,t )∵数据的样本中心点一定在线性回归直线上,∴回归直线l 1和l 2都过点(s ,t )∴两条直线有公共点(s ,t )故选A .【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与Y 之间的关系,这条直线过样本中心点.二、填空题13.①③【分析】求解的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④【详解】解:对于①函数的一个对称中心为故①正确;对于②取为第一象限角且但故②错误;对于③一组样本数据的平均数解析:①③【分析】 求解5()12f π-的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④.【详解】解:对于①,55()4cos()4cos()012632f ππππ-=-+=-=, ∴函数()4cos(2)3f x x π=+的一个对称中心为5(,0)12π-,故①正确; 对于②,取94πα,3πβ=,α,β为第一象限角,且αβ>,但tan tan αβ<,故②错误;对于③,一组样本数据1x ,2x ,⋯,n x 的平均数是2,则数据121x -,221x -,⋯,21n x -的平均数为22132⨯-=,故③正确; 对于④,函数sin 2y x =的图象向左平移4π个单位长度,得到sin 2()sin(2)cos242y x x x ππ=+=+=的图象,故④错误. ∴正确命题的序号是①③.故答案为:①③.【点睛】本题考查命题的真假判断与应用,考查三角函数的图象与性质,训练了平均数的求法,属于中档题.14.【分析】根据线性回归方程过样本数据中心点可求出b 代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的 解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解.【详解】 由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元.故答案为:4.74【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题. 15.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案.【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2,所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题. 16.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的 解析:2【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果.【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =,所以6788540x y ++++=⨯=,化简得19x y +=,又90xy =,所以,x y 的值分别为10,9或9,10,所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==, 故答案是:2.【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目. 17.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为221s =. 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题. 18.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了 解析:75.【解析】分析:由频率分布直方图算出各频率,然后计算中位数详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.3240~50的频率为0.250~60的频率为0.1前两组频率0.140.240.380.5=+=<前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯= 解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础. 19.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35解析:【解析】,解得,根据中位数为,可知,故.20.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为 解析:280【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.三、解答题21.(1)0.63;(2)ˆ0.757.4yx =+. 【分析】(1)代入公式即可得出结果.(2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业.重新计算,代入公式即可求出结果.【详解】(1)由题意,根据相关系数的公式,可得10104060.63643.7ii x y xy r -=≈≈∑ (2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业. 重新计算得22.810122162499x ⨯-'===,7110446667499y ⨯-'===, 922222192481022.812924118.4i i xx ='-≈+⨯--⨯=∑, 9194061022.87112449247482i ii x y x y =''-≈+⨯⨯-⨯-⨯⨯=∑. 所以919221982ˆ0.690.7118.49ii i i i x y x y b xx ==''-=≈≈≈'-∑∑, ˆˆ740.692457.4457.4ay bx ''=-≈-⨯=≈. 所以所求线性回归方程为ˆ0.757.4yx =+. 22.(1)0.5 2.3y x =+;(2)6800元.【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程;(2)将9x =代入即可预测.【详解】解:(1)由表可得:123456747++++++==x , 2.9 3.3 3.6 4.4 4.8 5.2 5.9 4.37y ++++++==, 又77211134.4,140ii i i i x y x ====∑∑, 71722217134.474 4.30.5140747i ii i i x y x y b x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元.【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.23.(1)中位数为65;(2)分布列见解析;期望为5635;(3)50. 【分析】(1)由图中的数据可判断中位数在60分到80分之间,若设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,从而可求得中位数;(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为6人,不合格的人数为4人,则ξ的可能取值为0,1,2,3,4,求出各自的概率,从而可得ξ的分布列与数学期望;(3)由已知求出=64=18μσ,,从而可得()()6418641846820.6827P Z P Z -<≤+=<≤≈,再利用正态分布的对称性可求得结果【详解】(1)设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,解得65x =,所以这60名参赛学生成绩的中位数为65.(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为()0.010.0220106+⨯⨯=,不合格的人数为1064-=.由题意可知ξ的可能取值为0,1,2,3,4.则()464101014C P C ξ===,()134********C C P C ξ===,()2246410327C C P C ξ===,()31464103435C C C P ξ===,()4441014210C P C ξ===. 所以ξ的分布列为所以ξ的数学期望01234142173521035E ξ=⨯+⨯+⨯+⨯+⨯=. (3)由题意可得,()300.005500.015700.02900.012064μ=⨯+⨯+⨯+⨯⨯=,()()()222230640.150640.370640.4σ=-⨯+-⨯+-⨯()290640.2324+-⨯=,则18σ=,由Z 服从正态分布()2,N μσ,得()()6418641846820.6827P Z P Z -<≤+=<≤≈,则()()18210.68270.158652P Z >≈-=,()460.68270.158650.84135P Z >≈+=,所以此次竞赛受到奖励的人数为600.8413550⨯≈.【点睛】此题考查频率分布直方图、分层抽样、离散型随机变量的分布列、正态分布等知识,考查分析问题的能力和计算能力,属于中档题24.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10( 1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22(1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++, 所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 25.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲,s 乙≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .26.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元.【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程; (2)将88x =代入(1)中的回归方程,求出y ,然后用25.8y和1比较即可判断;(3)将85x =代入回归方程估计出单价,即可计算出收入.【详解】(1)由题意,得3848586878585x ++++==, 16.818.820.822.82420.645y ++++==, 则515222156169.655820.641840.1841782055810005i i i i i x y x y b xx ==-⋅-⨯⨯====-⨯-∑∑, 20.640.184589.968a y bx =-=-⨯=,故所求回归方程为0.1849.968y x =+;(2)当88x =时,0.184889.96826.16y =⨯+=,所以26.1625.80.361-=<,所以所求回归直线方程是有效可靠的; (3)当85x =,0.184859.96825.608y =⨯+=,所以25.60898025095.84⨯=(元),所以该果园预计收入25095.84元.【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题.。

高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案

高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案

⑤确定样本:从总体中找出与号签上的号码对应的个体,组成样本.
随机数表法是随机数表由数字 0 ,1 ,2,3,⋯,9 这 10 个数字组成,并且每个数字在表中 各个位置上出现的机会都是一样的,通过随机数表,根据实际需要和方便使用的原则,将几个数
组成一组,然后通过随机数表抽取样本.随机数表的优点是简单易行,它很好的解决了当总体中
样.因为 50 名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单 随机抽样中“等可能抽样”的要求.(3)是简单随机抽样.因为总体中的个体数是有限的,并且
是从总体中逐个进行抽取的,是不放回、等可能的抽取.
2013年第27届世界大学生运动会在俄罗斯举行,为了支持这次运动会,某大学从报名的 20 名大 三学生中选取 6 人组成志愿小组,请用抽签法设计抽样方案. 解:(1)将 20 名志愿者编号,编号为 1,2,3,4,⋯,20; (2)将 20 个号码分别写在 20 张形状相同的卡片上,制成号签; (3)将 20 张卡片放入一个不透明的盒子里,搅拌均匀; (4)从盒子中逐个不放回地抽取 6 个号签,并记录上面的号码;
A.2
B.3
C.6
D.7
解:C
间隔相等,所以 126 − 8 × 15 = 6.
4.分层抽样
描述: 将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在 总体中所占比例进行简单随机抽样或系统抽样,这种抽样的方法叫做分层抽样.当总体由明显差 别的几部分组成时,为了使抽取样本更好地反映总体的情况,常采用分层抽样.
③简单随机抽样是一种不放回抽样.
④简单随机抽样是一种等可能的抽样,每个个体被抽取到的可能性均为
n N

常用的简单随机抽样方法有抽签法和随机数表法.

高中数学 第一章 统计综合能力测试(含解析)北师大版必修3-北师大版高一必修3数学试题

高中数学 第一章 统计综合能力测试(含解析)北师大版必修3-北师大版高一必修3数学试题

【成才之路】2015-2016学年高中数学第一章统计综合能力测试北师大版必修3本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.时间120分钟,满分150分.第Ⅰ卷(选择题共60分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.2015年的世界无烟日(5月31日)之前,小华学习小组为了了解本地区大约有多少成年人吸烟,随机调查了100个成年人,结果其中有15个成年人吸烟.对于这个关于数据收集与处理的问题,下列说法正确的是( )A.调查的方式是普查B.本地区约有15%的成年人吸烟C.样本是15个吸烟的成年人D.本地区只有85个成年人不吸烟[答案] B[解析]调查方式显然是抽样调查,∴A错误.样本是这100个成年人.∴C也错误,显然D不正确.故选B.2.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( )A.简单随机抽样法 B.系统抽样法C.分层抽样法 D.抽签法[答案] B[解析]所抽出的编号都间隔5,故是系统抽样.3.下列问题,最适合用简单随机抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某学校在编人员160人.其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本D.某乡农田有:山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩. 现抽取农田480亩估计全乡农田某种作物的平均亩产量[答案] B[解析]A项的总体容量较大,用简单随机抽样法比较麻烦;B项的总体容量较小,用简单随机抽样法比较方便;C项由于学校各类人员对这一问题的看法可能差异较大,不宜采用简单随机抽样法;D 项的总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法.4.一个容量为50的样本数据,分组后,组距与频数如下:[12.5,15.5),2;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),4.根据分组情况估计小于30.5的数据占( )A .18% B.30% C .60% D.92%[答案] D[解析] (2+8+9+11+10+6)÷50=92%.5.如图所示的是2006年至2015年某省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到2006年至2015年此省城镇居民百户家庭人口数的平均数为( )2 9 1 1 5 83 0 2 6 31247[答案] B[解析] 由茎叶图得到2006年至2015年城镇居民百户家庭人口数为:291,291,295,298,302,306,310,312,314,317,所以平均数为291+291+295+298+302+306+310+312+314+31710=3 03610=303.6.6.某地区共有10万户居民,该地区城市住户与农村住户之比为4∶6,根据分层抽样方法,调查了该地区1 000户居民冰箱拥有情况,调查结果如下表所示,那么可以估计该地区农村住户中无冰箱的总户数约为( )万户 C .1.76万户 D.0.24万户[答案] A[解析] 由于城市住户与农村住户之比为4∶6,城市住户有4万户,农村住户有6万户,调查的1 000户居民中共400户城市住户,有600户农村住户,其中农村住户中无冰箱的有160户,所以可估计该地区农村住户中无冰箱的总户数约为10×1601 000=1.6(万户).7.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 520 2 3 33 1 24 4 8 94 5 5 5 7 7 8 8 950 0 1 1 4 7 96 17 8A.46,45,56B.46,45,53C.47,45,56 D.45,47,53[答案] A[解析]本题考查了茎叶图的应用及其样本的中位数、众数、极差等数字特征,由茎叶图可知,中位数为46,众数为45,极差为68-12=56.在求一组数据的中位数时,一定不要忘记先将这些数据排序再判断.8.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A.18 B.36C.54 D.72[答案] B[解析]频率分布直方图中所有小矩形的面积之和为1,每个小矩形的面积表示样本数据落在该区间内的频率,故样本数据落在区间[10,12)内的频率为1-2×(0.02+0.05+0.15+0.19)=0.18,故样本数据落在区间[10,12)内的频数为0.18×200=36.9.已知两个变量x,y之间具有线性相关关系,测得(x,y)的四组值分别为(1,2),(2,4),(3,5),(4,7),则y与x之间的回归直线方程为( )A.y=0.8x+3 B.y=-1.2x+7.5C.y=1.6x+0.5 D.y=1.3x+1.2[答案] C[解析] 利用排除法. ∵x =14(1+2+3+4)= 2.5,y =14(2+4+5+7)=4.5,由于回归直线方程y =bx +a 必过定点(2.5,4.5),故排除A 、D.又由四组数值知y 随x 的增大而增大,知b >0,排除B.10.某路段检查站监控录像显示,在某时段内,有 1 000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如下图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90 km/h 的约有( )A .100辆 B.200辆 C .300辆 D.400辆[答案] C[解析] 由题图可知汽车中车速在[60,90)的频率为10×(0.01+0.02+0.04)=0.7, ∴在[90,110]的频率为(1-0.7)=0.3.∴车速不小于90 km/h 的汽车数量约为0.3×1 000=300辆.11.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1 B.2 C .3 D.4[答案] D[解析] 依题意,可得 ⎩⎪⎨⎪⎧10=x +y +10+11+95,2=15[x -102+y -102+10-102+11-102+9-102],⇒⎩⎪⎨⎪⎧x +y =20,x -102+y -102=8,⇒⎩⎪⎨⎪⎧x =12y =8,或⎩⎪⎨⎪⎧x =8y =12,所以|x-y|=4.12.甲,乙,丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图1,图2和图3,若s甲,s乙,s丙分别表示他们测试成绩的标准差,则( )A.s甲<s乙<s丙 B.s甲<s丙<s乙C.s乙<s甲<s丙 D.s丙<s甲<s乙[答案] D[解析]由频率分布条形图可得甲,乙,丙三名运动员的平均成绩分别为x-甲=0.25×(7+8+9+10)=8.5;x-乙=0.3×7+8×0.2+9×0.2+10×0.3=8.5;x-丙=0.2×7+8×0.3+9×0.3+10×0.2=8.5,s2甲=0.25×(1.52+0.52+0.52+1.52)=1.25;s2乙=0.3×1.52+0.52×0.2+0.52×0.2+1.52×0.3=1.45;s2丙=0.2×1.52+0.52×0.3+0.52×0.3+1.52×0.2=1.05,∴s丙<s甲<s乙.第Ⅱ卷(非选择题共90分)二、填空题(本大题共4个小题,每小题5分,共20分,将正确答案填在题中横线上)13.一个容量为40的样本,共分成6组,第1~4组的频数分别为10,5,7,6,第5组的频率是0.10,则第6组的频率是________.[答案]0.20[解析]第5组的频数为40×0.10=4,第6组的频数为40-(10+5+7+6+4)=8,则频率为840=0.20.14.(2015·某某文,12)已知样本数据x1,x2,…,x n的均值x=5,则样本数据2x1+1,2x2+1,…,2x n+1的均值为________.[答案]11[解析]因为样本数据x1,x2,…,x n的均值x=5,所以样本数据2x1+1,2x2+1,…,2x n+1的均值为2x+1=2×5+1=11.15.(2014·某某,6)设抽测的树木的底部周长均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.[答案] 24[解析] 本题考查频率分布直方图.由题意在抽测的60株树木中,底部周长小于100cm 的株数为(0.015+0.025)×10×60=24.频率分布直方图中的纵坐标为频率组距,此处经常误认为纵坐标是频率.16.下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.0 8 9 10 3 5(注:方差s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x -为x 1,x 2,…,x n 的平均数)[答案] 6.8[解析] 本题考查茎叶图、方差的概念. 由茎叶图知x -=8+9+10+13+155=11,∴s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)在同等条件下,对30辆同一型号的汽车进行耗油1升所行走路程的试验,得到如下数据(单位:km):14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.8 12.6 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.2 13.5 13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.[解析]茎叶图如图所示.1213566789130112223445566 6 788914012 4中位数为13.35.18.(本小题满分12分)某高级中学共有学生3 000名,各年级男、女人数如下表:高一年级高二年级高三年级女生523x y男生487490z已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.17.(1)问高二年级有多少名女生?(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?[解析](1)由题设可知x3000=0.17,所以x=510.(2)高三年级人数为y+z=3000-(523+487+490+510)=990,现用分层抽样的方法在全校抽取300名学生,应在高三年级抽取的人数为:3003000×990=99名.答:(1)高二年级有510名女生;(2)在高三年级抽取99名学生.19.(本小题满分12分)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示).分组频率[1.00,1.05)(1)(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.[解析] (1)根据频率分布直方图可知,频率=组距×频率组距故可得下表:(2)0.30+0.15+0.02=中的概率约为0.47. (3)120×1006=2000.所以水库中鱼的总条数约为2000条.20.(本小题满分12分)某农场为了从三种不同的西红柿品种中选出高产稳定的西红柿品种,分别在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下表:问哪一种西红柿既高产又稳定?[解析] 因为x 甲=15(21.5+20.4+22.0+21.2+19.9)=21.0(kg),x 乙=15(21.3+18.9+18.9+21.4+19.8)=20.06(kg), x 丙=15(17.8+23.3+21.4+19.9+20.9)=20.66(kg),所以s 甲=15[21.5-21.02+…+19.9-21.02]≈0.756(kg);s 乙=15[21.3-21.062+…+19.8-21.062]≈1.104(kg);s 丙=15[17.8-20.662+…+20.9-20.662]≈1.807(kg).由于x 甲>x 丙>x 乙,s 甲<s 乙<s 丙,所以甲种西红柿既高产又稳定.21.(本小题满分12分)某某统计局就某地居民的月收入调查了10 000人,并根据所得数据画出了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,3 500)的频率; (2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?[解析] (1)月收入在[3 000,3 500)的频率为0.000 3×(3 500-3 000)=0.15. (2)∵0.000 2×(1 500-1 000)=0.1, 0.000 4×(2 000-1 500)=0.2, 0.000 5×(2 500-2 000)=0.25,0.1+0.2+0.25=0.55>0.5.∴样本数据的中位数为2 000+0.5-0.1+0.20.000 5=2 000+400=2 400(元).(3)居民月收入在[2 500,3 000)的频率为0.000 5×(3 000-2 500)=0.25, 所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人), 再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×2 50010 000=25(人).22.(本小题满分12分)(2015·新课标Ⅰ理,19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =,(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:(①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为word 11 / 11 β^=,α^=v -β^u .[解析] (1)由散点图可以判断,y =c +d x 适合作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程,由于d ^=∑i =18w i -wy i -y ∑i =18 w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6.∴y 关于w 的线性回归方程为y ^=100.6+68w ,∴y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x=-x +13.6x +20.12,∴当x =13.62=6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.。

(完整版)高一数学必修三《统计》知识点+练习+答案(最新整理)

(完整版)高一数学必修三《统计》知识点+练习+答案(最新整理)

三、
⑥控制图
总体特征的估计
中心线——y=μ 上界线——y=μ+3σ 下界线——y=μ-3σ
1、特征数:总体平均数 μ
总体方差 2 总体标准差
样本平均数 x
样本方差 s2 或 s*2
样本标准差
s 或 s*
1 2、有关公式:样本平均数 : x = (x1+x2 +...+xn)
n
样本方差
1 : s2 或 s*2 s 2= n [(x1- x )2+(x2+ x )2+...+(xn- x )2]
样本,则抽取的 m 个个体中带有标记的个数估计为( )
m
A. N·
M
M
B. m·
N
M
C. N·
D. N
m
8.从 60 件产品中抽取 10 件进行检查,写出抽取样本的过程.
9.某车间工人已加工一种轴 100 件,为了了解这种轴的直径,要从中抽出 10 件在同一条件 下测量(轴的直径要求为 20 mm±0.5 mm),如何采用简单随机抽样法抽取上述样本?
当总体由差异 明显的几部分 组成时,常将 总体分成几部 分,然后按照 各部分所占的 比进行抽样, 这样的抽样叫 ∽。其中分成 的各部分叫做 层。
各自
要点
从总 体中 逐个 抽取
总体 均分 成几 部分 按事 先确 定的 规则 在各 部分 抽取 将总 体分 成几 层, 分层 进行 抽取
方法步骤
1、 抽签法: ①编②放③抽
必修三统计知识点
一、
类 别 内 容 名 称
简 单 随 机 抽 样
系 统 抽 样
分 层 抽 样
抽样方法
定义

(压轴题)高中数学必修三第一章《统计》测试(包含答案解析)(1)

(压轴题)高中数学必修三第一章《统计》测试(包含答案解析)(1)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为193.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .24.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .988.已知x ,y 取值如下表:x0 1 4 5 6 8 y 1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.139.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081510.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .2911.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,812.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.15.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.16.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中B 高中C 高中D 高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.17.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.18.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表: 学生序号i 1 2 3 4 5 6 7 数学成绩i x 60 65 70 75 85 87 90 物理成绩i y70778085908693①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.23.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniii ii i nni ii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)24.脐橙营养丰富,含有人体所必需的各类营养成份,若规定单个脐橙重量(单位:千克)在[0.1,0.3)的脐橙是“普通果”,重量在[0.3,0.5)的磨橙是“精品果”,重量在[0.5,0.7]的脐橙是“特级果”,有一果农今年种植脐橙,大获丰收为了了解脐橙的品质,随机摘取100个脐橙进行检测,其重量分别在[0.1,0.2),[0.2,0.3),[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7]中,经统计得到如图所示频率分布直方图(1)将频率视为概率,用样本估计总体.现有一名消费者从脐橙果园中,随机摘取5个脐橙,求恰有3个是“精品果”的概率.(2)现从摘取的100个脐橙中,采用分层抽样的方式从重量为[0.4,0.5),[0.5,0.6)的脐橙中随机抽取10个,再从这10个抽取3个,记随机变量X表示重量在[0.5,0.6)内的脐橙个数,求X的分布列及数学期望.25.从某小区抽取100个家庭进行月用电量调查,发现其月用电量都在50度至350度之间,频率分布直方图如图所示.(1)根据直方图求x的值,并估计该小区100个家庭的月均用电量(同一组中的数据用该组区间的中点值作代表);(2)从该小区已抽取的100个家庭中, 随机抽取月用电量超过300度的2个家庭,参加电视台举办的环保互动活动,求家庭甲(月用电量超过300度)被选中的概率.26.在社会实践活动中,“求知”小组为了研究某种商品的价格x(元)和需求量y(件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料:日期11月1日11月2日11月3日11月4日11月5日x(元)1416182022y(件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.C解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义3.D解析:D【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x +++++++÷=,635=917=6372x x ,∴+⨯∴=,故选D.4.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.5.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.8.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.9.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.10.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.11.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图12.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.二、填空题13.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题 解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差. 【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.14.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.15.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20.【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.16.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题解析:24 【分析】计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数. 【详解】应在D 高中抽取的学生人数为6001442480012001000600⨯=+++.【点睛】本小题主要考查分层抽样,考查频率的计算,属于基础题.17.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.18.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630 【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630. 19.【解析】因此 解析:4.7【解析】18914779,0.80.1424222ˆx y a====∴=-⨯=- 因此0.860.1 4.7y =⨯-= 20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)不同的样本的个数为432418C C . (2)①分布列见解析,()E ξ97=. ②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分. 【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩. 【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名,18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名, ∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为∴()0123353535357E ξ=⨯+⨯+⨯+⨯=. ②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+. 当96x =时,0.659633.6096y =⨯+=. 可预测该同学的物理成绩为96分. 【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).23.(1)ˆ0.150.9yx =+;(2)2.25万元. 【分析】(1)由已知数据求出x 和y ,根据所给公式求出ˆb与ˆa 的值,即可得y 关于x 的线性回归方程;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】解:(1)依题意可计算得, 1(24466677810)610x =+++++++++=, 1(1.0 1.5 1.6 2.0 1.8 1.9 1.8 2.0 2.1 2.3) 1.810y =+++++++++=. 236x =,10.8x y ⋅=,又101115i ii x y==∑,1021406i i x ==∑,1022110151ˆ0.1100ii i iix y x ybxx ==∴=≈⋅--∑∑,ˆˆ0.9ay bx =-=,ˆ0.150.9y x ∴=+, ∴所求的线性回归方程为ˆ0.150.9yx =+. (2)当9x =时,ˆ0.1590.9 2.25y=⨯+=(万元), ∴估计大多数年收入9万元的家庭每年饮食支出约为2.25万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题. 24.(1)516(2)见解析 【分析】(1)根据题意,先得到随机摘取一个脐橙,是“精品果”的概率为0.5,并且随机摘取5个脐橙,其中“精品果”的个数符合二项分布,再根据二项分布的概率公式,列出式子,得到答案.(2)先判断出X 可取的值为0,1,2,3,分别计算出其概率,然后列出概率分布列,再根据随机变量的数学期望公式,计算出其数学期望. 【详解】(1)从从脐橙果园中,随机摘取5个脐橙,其中“精品果”的个数记为Y , 由图可知,随机摘取一个脐橙,是“精品果”的概率为:0.2+0.3=0.5, ∴Y ~B (5,12), ∴随机摘取5个脐橙,恰有3个是“精品果”的概率为: P (Y =3)3325115()()2216C ==. (2)依题意,抽取10个脐橙,重量为[0.3,0.4),[0.4,0.5)的个数分别为6和4, X 的可能取值为0,1,2,3,P (X =0)3631016C C ==,P (X =1)216431012C C C ==, P (X =2)1264310310C C C ==,P (X =3)34310130C C ==, ∴X 的分布列为:E (X )1131601236210305=⨯+⨯+⨯+⨯=. 【点睛】本题考查满足二项分布的概率问题,以及随机变量的概率分布列和数学期望,属于中档题. 25.(1)x=0.0044, 月均用电量约为186度;(2).【详解】 (1)由题意得,.设该小区100个家庭的月均用电量为S 则9+22.5+52.5+49.5+33+19.5=186.(2),所以用电量超过300度的家庭共有6个.分别令为甲、A 、B 、C 、D 、E ,则从中任取两个,有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )、(A,B )、(A,C )、(A,D )、(A,E )、(B,C )、(B,D )、(B,E )、(C,D )、(C,E )、(D,E )15种等可能的基本事件,其中甲被选中的基本事件有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )5种. 家庭甲被选中的概率.26.(1) 1.534y x =-+;(2)详见解析. 【分析】(1)利用表中数据,分别求得:,x y ,再利用公式求得,b a ,然后写出回归直线方程即可. (2)根据(1)中的回归直线方程,令14x =, 22x =求得相应的y 值,再与实际值结合误差要求比较即可. 【详解】 由表中数据得: ()()1116182018,10747,33x y =++==++= 311610187204366i ii x y==⨯+⨯+⨯=∑,322221161820980ii x==++=∑,3132221336631871.59803183i ii i i x y x yb x x==--⨯⨯===--⨯-∑∑,()7 1.51834a y bx =-=--⨯=,所以y 关于x 的线性回归方程是 1.534y x =-+.(2)当14x =时, 1.5143413y =-⨯+=,131212-=<, 当22x =时, 1.522341y =-⨯+=,1322-=≤, 所以(1)中所得到的线性回归方程是可靠的. 【点睛】本题主要考查回归直线方程的求法以及应用,还考查了运算求解的能力,属于中档题.。

(必考题)高中数学必修三第一章《统计》检测题(含答案解析)

(必考题)高中数学必修三第一章《统计》检测题(含答案解析)

一、选择题1.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变2.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④3.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .984.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .5.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08156.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .157.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元8.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为39.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1310.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三 周四 周五 车流量x (万辆)100102108114116浓度y (微克)78 80 8488 90根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7615.已知一组数据为2,3,4,5,6,则这组数据的方差为______.16.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表: X 10 11.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.17.抽样统计甲、乙两位同学5次数学成绩绘制成如下图所示的茎叶图,则成绩较稳定的那位同学成绩的方差为__________.18.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.19.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.20.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:x1 2 3 4 5 y 7.06.5m3.82.2已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.三、解答题21.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x ty e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10ii v y i ==⋅⋅⋅,经计算得如下数据:xy()1021ii x x =-∑()1021ii yy =-∑uv2621565 26805.36()1021ii uu =-∑()()101iii u u y y =--∑()1021ii v v =-∑()()101iii x x v v =--∑11250130 2.612(2)(ⅰ)根据(1)的选择及表中数据,建立y关于x的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额y为250亿元,请预测2021年的研发资金投入额x为多少亿元?(结果精确到0.01)附:①相关系数12211()()()()ni iinni ii ix x y yrx x y y===--=--∑∑∑,回归直线ˆˆˆy a bx=+中:121()()ˆ()ni iiniix x y ybx x==--=-∑∑,ˆˆa y bx=-②参考数据:ln20.693≈,ln5 1.609≈.22.某企业投资两个新型项目,投资新型项目A的投资额m(单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m=-,投资新型项目B的投资额x(单位:十万元)与纯利润y(单位:万元)的散点图如图所示.(1)求y关于x的线性回归方程;(2)根据(1)中的回归方程,若A,B两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a=+的斜率和截距的最小二乘估计分别为1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x的频率分布表如下:-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80) x的分组[0.20,0)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例;(2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表:x℃272930323335气温()数量y121520272836(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 26.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式。

(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)

(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(1)

一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.54.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .815. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39 B .42C .45D .507.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64 B .96C .144D .1609.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 14.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________15.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.16.已知一组数据为2,3,4,5,6,则这组数据的方差为______.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:X 1011.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下: 年份 2014 2015 20162017 2018 2019 编号x 1 2 3 4 5 6 数量y (辆)4196116190218275(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位. 参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.23.2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起;与此同时,移动阅读方兴未艾,从侧面反应了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书APP 抽样调查了非一线城市M 和一线城市N 各100名用户的日使用时长(单位:分钟),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.(1)请填写以下22⨯列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?活跃用户 不活跃用户 合计城市M 城市N 合计(2)以频率估计概率,从城市M 中任选2名用户,从城市N 中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望.(3)该读书APP 还统计了2018年4个季度的用户使用时长y (单位:百万小时),发现y 与季度(x )线性相关,得到回归直线为ˆ4ˆyx a =+,已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2019年第一季度(5x =)该读书APP 用户使用时长约为多少百万小时. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.025 0.010 0.005 0.001 0k5.0246.6357.87910.82824.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:s =(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b cd =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.A解析:A 【解析】利用茎叶图、平均数的性质直接求解. 【详解】由一组数据的茎叶图得: 该组数据的平均数为:1(7581858995)855++++=. 故选:A . 【点睛】本题考查平均数的求法,考查茎叶图、平均数的性质等基础知识,考查运算求解能力,是基础题.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x=5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75 【解析】 【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求. 【详解】 ∵4115i i x ==∑,∴154x =, ∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75. 【点睛】本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.14.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.15.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.16.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2 【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1 【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果. 详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.56.15=,5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.76.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1.点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n =-+-++-,标准差s =18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为解析:280 【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑,ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =, 可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位. 【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 23.(1)见解析;(2)见解析;(3) 22.3百万小时 【分析】(1)根据频率分布直方图求数据填入对应表格,再根据卡方公式求2K ,最后对照数据作判断,(2)先确定随机变量取法,再判断从M 城市中任选的2名用户中活跃用户数服从二项分布,从N 城市中任选的1名用户中活跃用户数服从两点分布,进而求得对应概率,列表得分布列,最后根据数学期望公式得期望,(3)先求均值,解得ˆa,再估计5x =对应函数值. 【详解】(1)由已知可得以下22⨯列联表:计算()2220060208040200K 9.5247.8791001001406021⨯⨯-⨯==≈>⨯⨯⨯ , 所以有99.5%的把握认为用户是否活跃与所在城市有关. (2)由统计数据可知,城市M 中活跃用户占35,城市N 中活跃用户占45, 设从M 城市中任选的2名用户中活跃用户数为X ,则3~2,5X B ⎛⎫ ⎪⎝⎭设从N 城市中任选的1名用户中活跃用户数为Y ,则Y 服从两点分布,其中()415P Y ==. 故0,1,2,3ξ=,()()()20221400055125P P X P Y C ξ⎛⎫===⋅==⋅=⎪⎝⎭; ()()()()()2012224321*********555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅+⋅⋅⋅=⎪⎝⎭;()()()()()2122223431572112055555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅⋅+⋅⋅=⎪⎝⎭;()()()222343632155125P P X P Y C ξ⎛⎫===⋅==⋅= ⎪⎝⎭. 故所求ξ的分布列为()428573601232125125125125E ξ=⨯+⨯+⨯+⨯=. (3)由已知可得 2.5x =,又12.3y =,可得12.34ˆ2.5a=⨯+,所以ˆ 2.3a =,所以4 2.3ˆy x =+. 以5x =代入可得ˆ22.3y=(百万小时), 即2019年第一季度该读书APP 用户使用时长约为22.3百万小时. 【点睛】本题考查频率分布直方图、回归直线方程以及分布列和数学期望,考查基本分析求解能力,属中档题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为53)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

学考复习——统计
班级姓名
一、选择题
1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( ) A.抽签法 B.随机数法
C.系统抽样法 D.分层抽样法
2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
3.2014年某大学自主招生面试环节中,七位评委为一考生打出分数的茎叶图如图2­1,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为( )
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
4.甲、乙、丙、丁四人参加射击项目选拔赛,四人平均成绩和方差如下:
甲乙丙丁
平均环数x8.6 8.9 8.9 8.2
方差s2 3.5 3.5 2.1 5.6
若从四人中选一人,则最佳人选是( )
A.甲 B.乙 C.丙 D.丁
5.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查,已知高二被抽取的人数为13人,则n=( ) A.660 B.720 C.780 D.800
6.为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()
A、总体
B、个体是每一个学生
C、总体的一个样本
D、样本容量
7.x是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x41,x42,…,x100
的平均数,则下列各式正确的是( )
A.x=40a+60b
100
B.x=
60a+40b
100
C.x=a+b
D.x=
a+b
2
8.在抽查某产品的尺寸过程中,将其尺寸数据分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,则|a-b|=( )
A.h·m B.h
m C.m
h D.与m,h无关
9.下列抽样中不是系统抽样的是()
A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到
大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样
B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的
调查人数为止
D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来
座谈
10.图2­2­8是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知:这次考试的优秀率为( )
图2­2­8
A.25%
B.30%
C.35%
D.40%
11.一个社会调查机构就某地居民的月收入调查了10 000
人,并根据所得数据得出样本频率分布直方图.为了分析居民的
收入与年龄、学历、职业等方面的关系,要从这10 000人中用分层抽样方法抽出100人做进一步调查,则在[2500,3000)(单位:元)月收入段中
应抽出________人.
二、填空题
12.下列四种说法中,①数据4,6,6,7,9,3的众
数与中位数相等;②一组数据的标准差是这组数据的
方差的平方;③数据3,5,7,9的标准差是数据
6,10,14,18的标准差的一半;④频率分布直方图中各小长方形的面积等于相应各组的频数.其中正确的有__________(填序号).
13.将参加数学竞赛的1000名学生编号如下:0001,0002, 003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法把编号分成50个部分,如果第一部分编号为0001,0002,0003,…,0020,第一部分随机抽取一个号码为0015,那么抽取的第40个号码为________.
14.超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图2­7,则违规的汽车大约为________辆.
图2­7
15.某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n= 。

三、解答题
16.某校文学社开展“红五月”征文活动,作品上交时间为5月2号~5月22号,评委从收到的作品中抽出200,经统计,其频率分布直方图如图2­2­16.
(1)样本中的作品落在[6,10)内的频数是多少?
(2)估计众数、中位数和平均数各是多少?
17.对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:
甲2738303735312450
乙3329383428364345
分别求出甲、乙两名自行车赛手最大速度(单位:m/s)的数据的平均数、中位数、标准差,并判断选谁参加比赛更合适(可用计算器).
18.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午 8:00~12:00间各自的车流量(单位:百辆),得如图2­8所示的统计图,根据统计图:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,40]间的频率是多少?
(3)甲、乙两个交通站哪个更繁忙?并说明理由.
第二章自主检测1
一.1.D 2.D 3.C 4.C 5.B 6.C 7.A 8.C 9.B 10.B 11.25 二.12.①③ 13.0795 14.280 15.y^=1.23x+0.08
三.16.解:(1)作品落在[6,10)内的频率为1-0.08-0.36-0.12-0.12=0.32,∴频数为200×0.32=64.
(2)众数估计值为:10+14
2
=12,中位数的估计值为:从左到右小矩形面积依次为
0.08,0.32,0.36,0.12,0.12,由于中位数左、右两边的小矩形面积相等,若设为x,则(x-10)×0.09=0.1,∴x≈11.
平均数的估计值为0.08×4+0.32×8+0.36×12+0.12×16+0.12×20≈12.
17.解:(1)茎叶图如图D31,中间数为数据的十位数.
图D31
从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比较稳定,总体得分情况比甲好.
(2)利用科学计算器,得x甲=34,x乙=35.75;s甲≈7.55,s乙≈5.70;甲的中位数是33,乙的中位数是35. 综合比较,选乙参加比赛更合适.
18.解:(1)甲交通站的车流量的极差为73-8=65;
乙交通站的车流量的极差为71-5=66.
(2)甲交通站的车流量在[10,40]间的频率为
4
14

2
7
.
(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方.从数据的分布情况来看,甲交通站更繁忙.。

相关文档
最新文档