[实用参考]高中数学必修三统计练习.docx

合集下载

(易错题)高中数学必修三第一章《统计》测试卷(包含答案解析)

(易错题)高中数学必修三第一章《统计》测试卷(包含答案解析)

一、选择题1.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是()A.32 B.27 C.24 D.332.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是()A.B.C.D.3.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是()A .24B .48C .56D .644.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .296.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸7.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .638.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④10.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.111.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为 A .y = x-1B .y = x+1C .y =88+12x D .y = 17612.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元二、填空题13.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.14.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带 租户业主已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.15.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.16.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..17.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.18.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.19.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.20.对具有线性相关关系的变量x ,y ,有一组观察数据(,)(1,2,9)i i x y i =⋅⋅⋅,其回归直线方程是:2y x a =+,且919ii x==∑,9118i i y ==∑,则实数a 的值是__________.三、解答题21.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推)(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i i x ==∑.22.某大学为了了解数学专业研究生招生的情况,对近五年的报考人数进行了统计,得到如下统计数据:x1 2 3 45 报考人数y3060100140170(1)经分析,y 与x 存在显著的线性相关性,求y 关于x 的线性回归方程ˆˆˆybx a =+并预测2020年(按6x =计算)的报考人数;(2)每年报考该专业研究生的考试成绩大致符合正态分布()2,Nμσ,根据往年统计数据385μ=,2225σ=,录取方案:总分在400分以上的直接录取,总分在[]385,400之间的进入面试环节,录取其中的80%,低于385分的不予录取,请预测2020年该专业录取的大约人数(最后结果四舍五入,保留整数).参考公式和数据:()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-,()()51360iii x x y y =--=∑.若随机变量()2~,X Nμσ,则()0.6826P X μσμσ-<<+=,()220.9544P X μσμσ-<<+=,()330.9974P X μσμσ-<<+=.23.脐橙营养丰富,含有人体所必需的各类营养成份,若规定单个脐橙重量(单位:千克)在[0.1,0.3)的脐橙是“普通果”,重量在[0.3,0.5)的磨橙是“精品果”,重量在[0.5,0.7]的脐橙是“特级果”,有一果农今年种植脐橙,大获丰收为了了解脐橙的品质,随机摘取100个脐橙进行检测,其重量分别在[0.1,0.2),[0.2,0.3),[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7]中,经统计得到如图所示频率分布直方图(1)将频率视为概率,用样本估计总体.现有一名消费者从脐橙果园中,随机摘取5个脐橙,求恰有3个是“精品果”的概率.(2)现从摘取的100个脐橙中,采用分层抽样的方式从重量为[0.4,0.5),[0.5,0.6)的脐橙中随机抽取10个,再从这10个抽取3个,记随机变量X 表示重量在[0.5,0.6)内的脐橙个数,求X 的分布列及数学期望.24.某科研课题组通过一款手机APP 软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:周跑量(/km周)[)10,15[)15,20[)20,25[)25,30[)30,35[)35,40[)40,45[)45,50[)50,55人数100120130180220150603010(1)在答题卡上补全该市1000名跑步爱好者周跑量的频率分布直方图:注意:请用2B铅笔在答题卡上作图,并将所作条形图涂黑.(2)根据以上图表数据,试求样本的中位数(保留一位小数).(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如下表:周跑量小于20公里20公里到40公里不小于40公里类别休闲跑者核心跑者精英跑者装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?25.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案(1)规定每日底薪50元,快递骑手每完成一单业务提成3元;方案(2)规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单提成5元.该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[)25,35、[)35,45、[)45,55、[)55,65、[)65,75、[)75,85、[]85,95七组,整理得到如图所示的频率分布直方图.(1)求直方图中a的值;(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替);(3)假设公司中所有骑手都选择了你在(2)中所选的方案,已知公司现有骑手400人,某骑手希望自己的收入在公司众骑手中处于前100名内,求他每天的平均业务量至少应达多少单?26.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x(分钟)时刻的细菌个数为y个,统计结果如下:x12345y23445(Ⅰ)在给出的坐标系中画出x,y的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y关于x的回归直线方程ˆˆˆy bx a=+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni iiniix y nx yx naxb y bx====---∑∑)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 2.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.B解析:B 【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解. 【详解】 由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=, 又前3个小组的频率之比为1:2:3,所以第二组的频率为20.750.256⨯=, 所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.4.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.5.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.6.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.7.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.8.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FP时,直线OP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FP时,直线OP的斜率的取值范围是(8,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.10.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.11.C解析:C 【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176, 代入回归方程验证可知,只有方程y =88+12x 成立,故选C 12.C解析:C 【解析】 【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可 【详解】()19.59.39.18.99.79.35x =⨯++++=()19289898793905y =⨯++++=代入到回归方程为7.5ˆy x a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C 【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。

高中数学必修3统计测试题及其答案

高中数学必修3统计测试题及其答案

高中数学必修 3 第二章(统计)检测题班级姓名得分一、选择题:(此题共 10 小题,每题 3 分,共 30 分,在每题给出的四个选项中,只有一项为哪一项切合题目要求的)1.某单位有老年人28 人,中年人 54 人,青年人 81 人.为了检查他们的身体状况,需从他们中抽取一个容量为36 的样本,最适合抽取样本的方法是( D ).A .简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,而后分层抽样2.10 名工人某天生产同一部件,生产的件数是15,17,14, 10,15, 17,17,16,14,12.设其均匀数为a,中位数为 b,众数为 c,则有 ( D).A .a>b>c B. b>c>a C. c>a>b D.c>b>a3.以下说法错误的选项是 ( B ).A.在统计里,把所需观察对象的全体叫作整体B.一组数据的均匀数必定大于这组数据中的每个数据C.均匀数、众数与中位数从不一样的角度描绘了一组数据的集中趋向D.一组数据的方差越大,说明这组数据的颠簸越大4.以下说法中,正确的选项是 ( C ).A .数据 5,4,4,3,5,2 的众数是 4B.一组数据的标准差是这组数据的方差的平方C.数据 2,3,4,5 的标准差是数据 4,6,8,10 的标准差的一半D.频次散布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别随意抽出10 名学生进行英语口语测试,其测试成绩的方差分别2 2 .,则.为 S1 , 2A )= 13.2 S =26 26(A .甲班 10 名学生的成绩比乙班10 名学生的成绩齐整B.乙班 10 名学生的成绩比甲班10 名学生的成绩齐整C.甲、乙两班 10 名学生的成绩同样齐整D.不可以比较甲、乙两班10 名学生成绩的齐整程度6.以下说法正确的选项是 ( C ).A.依据样本预计整体,其偏差与所选择的样本容量没关B.方差和标准差拥有同样的单位2 2 2 2 是错的D.假如容量同样的两个样本的方差知足12 ,那么推得整体也知足S1 2S <S <S 7.某同学使用计算器求 30 个数据的均匀数时,错将此中一个数据 105 输人为 15,那么由此求出的均匀数与实质均匀数的差是( B ).A.3.5 B.-3 C. 3 D. -0.58.在一次数学测试中,某小组14 名学生疏别与全班的均匀分85 分的差是: 2,3,-3,-5, 12,12,8,2,-1,4,-10,-2, 5, 5,那么这个小组的均匀分是(B)分.A .97.2 B. 87.29 C. 92.32 D.82.869.某题的得分状况以下:此中众数是 ( C ).得分 /分0 1 2 3 4百分率 /(%) 37.0 8.6 6.0 28.2 20.2A .37.0%B. 20.2%C.0 分D.4 分10.假如一组数中每个数减去同一个非零常数,则这一组数的( 10 ).A .均匀数不变,方差不变B.均匀数改变,方差改变C.均匀数不变,方差改变D.均匀数改变,方差不变11.为检查参加运动会的 1 000 名运动员的年纪状况,从中抽查了 100 名运动员的年纪,就这个问题来说,以下说法正确的选项是A . 1 000 名运动员是整体C.抽取的 100 名运动员是样本( A)B.每个运动员是个体D.样本容量是 10012.为了检查某产品的销售状况,销售部门从部下的92 家销售连锁店中抽取30 家认识情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为( A )A.3,2B.2,3C.2,30D.30,213.某城区有农民、工人、知识分子家庭合计 2 000 家,此中农民家庭 1 800 户,工人家庭100 户.现要从中抽取容量为40 的样本,检查家庭收入状况,则在整个抽样过程中,能够用到以下抽样方法(D)①简单随机抽样;②系统抽样;③分层抽样.A .②③ B.①③ C.③ D.①②③ 14.以下说法不正确的选项是 ( A )A.频次散布直方图中每个小矩形的高就是该组的频次B.频次散布直方图中各个小矩形的面积之和等于 1C.频次散布直方图中各个小矩形的宽同样大D.频次散布直方图能直观地表示样本数据的散布状况15.容量为 20 的样本数据,分组后的频数以下表:分组[10,20) [20,30) [30,40) [40,50) [50,60) [60,70)频数 2 3 4 5 4 2则样本数据落在区间 [10,40)的频次为 ( B )A . 0.35 B.0.45 C.0.55 D.0.6516.已知 10 名工人生产同一部件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为 a,中位数为 b,众数为 c,则有 ( D )A . a>b>c B.a>c>b C.c>a>b D.c>b>a17. 已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为(B )A . 1 B. 2 C. 3 D.218.如图是 2012 年某校举行的元旦诗歌朗读竞赛中,七位评委为某位选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的均匀数和方差分别为(C)A . 84,4.84B .84,1.6C.85,1.6D.85,0.419.某中学有高中生 3500 人,初中生 1500 人.为认识学生的学习状况,用分层抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则 n 为( A) A.100B .150C .200D .25020.样本容量为100 的频次散布直方图以下图.依据样本的频次散布直方图预计样本数据落在 [6, 10)内的频数为 a,样本数据落在 [2,10)内的频次为 b,则 a, b 分别是 ( A )A .32,0.4 B.8,0.1C. 32,0.1 D.8,0.4二、填空题:(此题共 4 小题,每题 3 分,共 12 分)21.一个企业共有 240 名职工,下设一些部门,要采纳分层抽样方法从全体职工中抽取一个容量为20的样本.已知某部门有 60名职工,那么从这一部门抽取的职工人数是5。

(好题)高中数学必修三第一章《统计》测试卷(包含答案解析)

(好题)高中数学必修三第一章《统计》测试卷(包含答案解析)

一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15 B .45,45,45C .45,60,30D .30,90,152.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元3.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18555.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格99.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.56.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和678.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .299.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >10.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月. 14.已知数据1x ,2x ,…,10x 的方差为1,且()()()222123222x x x -+-+-()2102170x ++-=,则数据1x ,2x ,…,10x 的平均数是________.15.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=16.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中B 高中C 高中D 高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.17.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是____________.18.已知x,y的取值如下表:x2345y 2.2 3.8 5.5 6.5从散点图分析,y与x线性相关,且回归方程为y=1.46x+a,则实数a的值为________.,上,其频率分布直方图如19.某班60名学生参加普法知识竞赛,成绩都在区间[40100]图所示,则成绩不低于60分的人数为___.20.总体由编号为01,02, ,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号x1234567人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 x(2)预测该地区2015年农村居民家庭人均纯收入.附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.据统计某品牌服装专卖店一周内每天获取得纯利润y (百元)与每天销售这种服装件数x (百件)之间有如下一组数据.该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500). (1)利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2)求该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程.(精确到0.01) (3)估计每天销售1200件这种服装时获多少纯利润? 附表:(随机数表第7行至第9行)84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 23879 33211 23429 78645 60782 52420 74438 15510 01342 99660 27954 参考数据:721280i i x==∑,72145309i i y ==∑,713487i i i x y ==∑.参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推)(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121ni iinniniiiiiix y nx ybnx xxxyxxy====-=---=-∑∑∑∑,a y bx=-.95293i iix y==∑,925255iix==∑.24.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:()1求频率分布直方图中a的值;()2以频率作为概率,试求消费者月饼购买量在600g1400g~的概率;()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?25.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x(吨)对价格y(万元/吨)和年利润z(万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y=.x12345 y8764c (1)求表格中c的值;(2)求y关于x的线性回归方程y bx a=+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z取得最大值?参考公式:1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.26.在社会实践活动中,“求知”小组为了研究某种商品的价格x(元)和需求量y(件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料:日期 11月1日 11月2日 11月3日 11月4日 11月5日 x (元) 14 16 18 20 22 y (件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.C解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2,此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.3.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.4.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.5.A解析:A 【解析】 【分析】由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据, 可得,,又由回归直线的方程,则,即,又因为,解得,故选A.【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.6.A解析:A【解析】【分析】由茎叶图确定所给的所有数据,然后确定中位数即可.【详解】各数据为:122031323445454547474850506163,最中间的数为:45,所以,中位数为45.本题选择A选项.【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.B解析:B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解.【详解】设更正前甲,乙,…的成绩依次为a1,a2,…,a50,则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,(a1﹣70)2+(a2﹣70)2+…+(a50﹣70)2=50×75,即102+202+(a3﹣70)2+…+(a50﹣70)2=50×75.更正后平均分为x=150×(80+70+a3+…+a50)=70;方差为s2=150×[(80﹣70)2+(70﹣70)2+(a3﹣70)2+…+(a50﹣70)2]=150×[100+(a3﹣70)2+…+(a50﹣70)2]=150×[100+50×75﹣102﹣202]=67.故选B.【点睛】本题考查平均数与方差的概念与应用问题,是基础题.8.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.9.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础10.B解析:B 【解析】 【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】 根据题意可得,,由线性回归方程一定过样本中心点,.【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.11.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,, 所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.12.A解析:A 【分析】由题意知,两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,所以两组数据的样本中心点是(s ,t ),回归直线经过样本的中心点,得到直线l 1和l 2都过(s ,t ). 【详解】∵两组数据变量x 的观测值的平均值都是s , 对变量y 的观测值的平均值都是t , ∴两组数据的样本中心点都是(s ,t ) ∵数据的样本中心点一定在线性回归直线上, ∴回归直线l 1和l 2都过点(s ,t ) ∴两条直线有公共点(s ,t ) 故选A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与Y 之间的关系,这条直线过样本中心点.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可. 【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确; 空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误, 故答案为:①②③. 【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.或6【分析】由数据…的方差为1且把所给的式子进行整理两式相减得到关于数据的平均数的一元二次方程解方程即可【详解】数据…的方差为1①②将②-①得解得或故答案为:或6【点睛】本题主要考查一组数据的平均数解析:2-或6. 【分析】由数据1x ,2x ,…,10x 的方差为1,且()()()()2222123102222170x x x x -+-+-++-=,把所给的式子进行整理,两式相减,得到关于数据的平均数的一元二次方程,解方程即可. 【详解】数据1x ,2x ,…,10x 的方差为1,()()()()22221231010x x x x x x x x∴-+-+-++-=,()()22221210121010210x x x x x x x x ∴++++-+++=,()222212101010x x xx∴+++-=,①()()()()2222123102222170x x x x -+-+-++-=, ()()22212101210440170x x x x x x ∴+++-++++=,()22212104040170x x x x ∴+++-+=,②将②-①得24120x x --=,解得2x =-,或6x =, 故答案为:2-或6. 【点睛】本题主要考查一组数据的平均数的求法,解题时要熟练掌握方差的计算公式的灵活运用,属于中档题.15.【分析】(1)由回归方程知相关变量与成负相关(2)为假命题则同时为假命题为假命题则中至少有一假命题(3)全称命题与特称命题转换条件不变结论变相反(4)由正态曲线的对称性可解【详解】(1)由回归方程知 解析:(2)【分析】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题(3)全称命题与特称命题转换条件不变,结论变相反 (4)由正态曲线的对称性可解. 【详解】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,若变量x 增加一个单位,则y 平均增加4-个单位,故(1)错误(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题,所以“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件是正确的.故(2)正确 (3)全称命题与特称命题转换条件不变,结论变相反,故(3)错误 (4)由正态曲线的对称性知,随机变量()22X N σ~,,若()0.32P X a <=,对称轴是2x = ,则()40.32P X a >-=,故(4)错误. 故答案为; (2) 【点睛】利用正态曲线的对称性求概率是常见的正态分布应用问题.解题的关键是利用对称轴=x μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时可借助图形判断.对于正态分布2()N μσ,,由=x μ是正态曲线的对称轴知:(1)对任意的a ,有()()P X a P X a μμ<->+=; (2)()001;()P X x P X x -≥=<;(3)()()=()P a X b P X b P X a <<<≤-.16.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题解析:24 【分析】计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数. 【详解】应在D 高中抽取的学生人数为6001442480012001000600⨯=+++.【点睛】本小题主要考查分层抽样,考查频率的计算,属于基础题.17.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论18.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15 解析:15【解析】依次选取两个数字为23,75,93,21,15,04,…… 所以选出来的第3个个体的编号为15.三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.94.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元.本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)301,169,105,071,286;(2) 4.7551.36y x =+;(3)10836元. 【分析】(1)按照规则直接读取随机数表即可得解;(2)由题中数据可得x 、y ,代入公式即可得b 、a ,即可得解; (3)将12x =代入线性回归方程中,即可得解. 【详解】(1)由随机数表可得,最先检测的5件服装的编号为:301,169,105,071,286; (2)由题意345678967x ++++++==,6669738189909155977y ++++++==,所以717222155973487767 4.75280767i ii ii x y x yb xx==--⨯⨯===-⨯-∑∑,5596 4.7551.367a y bx -⨯≈=-=, 所以该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程为 4.7551.36y x =+; (3)当12x =时, 4.751251.36108.36y =⨯+=(百元), 故可估计每天销售1200件这种服装时获纯利润10836元. 【点睛】本题考查了随机数表的应用及线性回归方程的求解与应用,考查了运算求解能力,属于中档题. 23.(1)6;689;(2) 1.3 1.1y x =-,12人. 【分析】(1)由表格中的数据,利用平均数和方差的公式,即可求解;(2)由表中近五年的数据,利用公式,求得ˆˆ,ba ,求得回归直线方程,代入10x =,即可作出结论. 【详解】(1)由表格中的数据,利用平均数的计算公式,可得2354578101069++++++++=.由方差的公式,可得()()()2222168263610699s ⎡⎤=-+-++-=⎣⎦.(2)由表中近五年的数据知,7x =,8y =,95293i ii x y==∑,925255i i x ==∑,9592255293578ˆ 1.32555495i ii i i x y xybx x==--⨯⨯===-⨯-∑∑,又a y bx =-,所以8 1.37 1.1a =-⨯=-, 故y 与x 的线性回归方程为 1.3 1.1y x =-, 当10x =时, 1.310 1.111.912y =⨯-=≈,故估计该校2020年参加“北约”“华约”考试而获得加分的学生有12人. 【点睛】本题主要考查了平均数与方差的计算,以及回归直线方程的求解及应用,其中解答中认真审题,根据公式准确计算是解答的关键,着重考查运算与求解能力. 24.(1)a 0.001=;(2)0.62;(3)12.08吨 【分析】(1)由频率分布直方图列出方程能求出a .(2)由频率分布直方图先求出满足题意的频率,即得概率.(3)由频率分布直方图先求出人均月饼购买量,由此能求出该超市应准备12.08吨月饼恰好能满足市场需求. 【详解】()1由()0.00020.00055a 0.00050.000254001++++⨯=,解得a 0.001=. ()2消费者月饼购买量在600g 1400g ~的频率为: ()0.000550.0014000.62+⨯=,∴消费者月饼购买量在600g 1400g ~的概率为0.62.()3由频率分布直方图得人均月饼购买量为:()4000.00028000.0005512000.00116000.000520000.000254001208g⨯+⨯+⨯+⨯+⨯⨯=,∴2012085%1208⨯⨯=万克12.08?=吨, ∴该超市应准备12.08吨月饼恰好能满足市场需求. 【点睛】本题考查用样本的频率分布估计总体分布及识图的能力,求解的重点是对题设条件及直方图的理解,了解直方图中每个小矩形的面积的意义,是中档题.25.(1)2.5;(2) 1.49.7y x =-+;(3)年产量约为3.5吨时,年利润z 取得最大值. 【分析】(1)由均值概念求得c ;(2)根据所给数据计算系数即得;(3)利用(2)中回归直线方程作出预估值进行计算利润后,再由二次函数性质得最大值. 【详解】 (1)8764 5.55cy ++++==,解得 2.5c =;(2)1234535x ++++==,5118275 2.568.5i ii x y==⨯+⨯++⨯=∑,1222222168.553 5.51.4(125)53ni ii ni i x y nx yb x nx==--⨯⨯===-+++-⨯-∑∑,5.5(1.4)39.7a y bx =-=--⨯=,所以回归直线方程为 1.49.7y x =-+.(3)由(2)2(2)(1.49.7) 1.49.7z y x x x x x =-=-+=-+, 所以9.73.52( 1.4)x =-≈⨯-(吨)利润最大.【点睛】本题考查线性回归直线方程,考查回归方程的实际应用.考查学生的数据处理能力,运算求解能力.26.(1) 1.534y x =-+;(2)详见解析. 【分析】(1)利用表中数据,分别求得:,x y ,再利用公式求得,b a ,然后写出回归直线方程即可. (2)根据(1)中的回归直线方程,令14x =, 22x =求得相应的y 值,再与实际值结合误差要求比较即可. 【详解】 由表中数据得: ()()1116182018,10747,33x y =++==++= 311610187204366i ii x y==⨯+⨯+⨯=∑,322221161820980ii x==++=∑,3132221336631871.59803183i ii i i x y x yb x x==--⨯⨯===--⨯-∑∑,()7 1.51834a y bx =-=--⨯=,所以y 关于x 的线性回归方程是 1.534y x =-+.(2)当14x =时, 1.5143413y =-⨯+=,131212-=<, 当22x =时, 1.522341y =-⨯+=,1322-=≤, 所以(1)中所得到的线性回归方程是可靠的. 【点睛】本题主要考查回归直线方程的求法以及应用,还考查了运算求解的能力,属于中档题.。

(好题)高中数学必修三第一章《统计》测试卷(含答案解析)(1)

(好题)高中数学必修三第一章《统计》测试卷(含答案解析)(1)

一、选择题1.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+2.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度3.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元4.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y 的值是( )A .12B .14C .16D .185.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸6.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 7.已知x ,y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.138.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).A .02B .14C .18D .299.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是( ) A .31号B .32号C .33号D .34号10.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.已知某企业上半年前5个月产品广告投入与利润额统计如下:由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.15.由茎叶图可知,甲组数据的众数和乙组数据的极差分别是__________.16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________.17.对具有线性相关关系的变量x ,y ,有一组观察数据(,)(1,2,9)i i x y i =⋅⋅⋅,其回归直线方程是:2y x a =+,且919ii x==∑,9118i i y ==∑,则实数a 的值是__________.18.已知下列命题:①在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好; ②两个变量相关性越强,则相关系数r 就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④两个模型中残差平方和越小的模型拟合的效果越好.⑤回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;⑥若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;⑦从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 其中正确命题的序号是__________.19.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.20.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.三、解答题21.某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得到数据如下表:(2)约定:投资额y 关于满意度x 的相关系数r 的绝对值在0.7以上(含0.7)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那一所企业,求关闭此企业后投资额y 关于满意度x 的线性回归方程(精确到0.1).参考数据:22.8x =,71y =,1022110248i i x x =-≈∑,643.7,10110406i i i x y x y =-=∑,222851984=,2287116188⨯=.附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆni ii nii x ynx y bxnx==-=-∑∑,ˆˆay bx =-.线性相关系数1222211ni ii n ni i i i x y nx yr x nx y ny ===-=⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑.22.某科研课题组通过一款手机APP 软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表: 周跑量 [)10,15 [)15,20 [)20,25 [)25,30 [)30,35 [)35,40 [)40,45 [)45,50 []50,55人数100120130180220150603010周跑量 小于20公 20公里到 不小于40 类别 休闲跑者 核心跑者 精英跑者 装备价格250040004500);(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样(如表),根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?23.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:第一天 第二天 第三天 第四天 第五天 就餐人数x (百人) 13 9 8 10 12 原材料y (袋)3223182428(1)根据所给的5组数据,求出关于的线性回归方程ˆˆybx a =+;(2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑24.据统计某品牌服装专卖店一周内每天获取得纯利润y (百元)与每天销售这种服装件数x (百件)之间有如下一组数据.该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500). (1)利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2)求该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程.(精确到0.01) (3)估计每天销售1200件这种服装时获多少纯利润? 附表:(随机数表第7行至第9行)84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 23879 33211 23429 78645 60782 52420 74438 15510 01342 99660 27954 参考数据:721280i i x==∑,72145309i i y ==∑,713487i i i x y ==∑.参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-25.为了提高生产效益,某企业引进了一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取100件产品进行质量检测,所有产品质量指标值均在(]15,45以内,规定质量指标值大于30的产品为优质品,质量指标值在(]15,30的产品为合格品,旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标值如频数分布表所示.质量指标值频数(]15,202(]20,258(]25,3020(]30,3530(]35,4025(]40,4515合计100(1)请分别估计新、旧设备所生产的产品的优质品率.(2)优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高,根据已知图表数据填写下面列联表(单位:件),并判断是否有95%的把握认为“产品质量高于新设备有关”.非优质品优质品合计新设备产品旧设备产品合计附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (3)已知每件产品的纯利润y (单位:元)与产品质量指标值t 的关系式为2,3045,1,1530,t y t <≤⎧=⎨<≤⎩若每台新设备每天可以生产1000件产品,买一台新设备需要80万元,请估计至少需要生产多少天方可以收回设备成本.26.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x (吨)对价格y (万元/吨)和年利润z (万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y =.(1)求表格中c 的值;(2)求y 关于x 的线性回归方程y bx a =+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z 取得最大值?参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.3.B解析:B 【解析】 【分析】 先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.4.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+=数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.5.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.6.D解析:D 【分析】根据图形中给出的数据,对每个选项分别进行分析判断后可得错误的结论. 【详解】对于选项A ,由图可得3月份的销售任务是400台,所以A 正确. 对于选项B ,由图形得2018年月销售任务的平均值为1(3245810743413)10045012⨯+++++++++++⨯=,所以B 正确. 对于选项C ,由图形得第一季度的总销售量为13002001400 1.28302⨯+⨯+⨯=台,所以C 正确.对于选项D ,由图形得销售量最大的月份是5月份,为800台,所以D 不正确. 故选D . 【点睛】本题考查统计中的识图、用图和计算,解题的关键是从图中得到相关数据,然后再根据要求进行求解,属于基础题.7.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.8.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.9.C解析:C 【解析】 【分析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号. 【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷, 已知03号,18号被抽取,所以应该抽取181533+=号, 故选C. 【点睛】本题主要考查了抽样,系统抽样,属于中档题.10.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.C解析:C 【解析】 【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可 【详解】()19.59.39.18.99.79.35x =⨯++++=()19289898793905y =⨯++++=代入到回归方程为7.5ˆyx a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C 【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。

(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(3)

(必考题)高中数学必修三第一章《统计》测试(包含答案解析)(3)

一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量3.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277;②5,9,100,107,121,180,195,221,265,299;③11,41,71,101,131,161,191,221,251,281;④31,61,91,121,151,181,211,241,271,299.关于上述样本的下列结论中,正确的是()A.②④都不能为分层抽样B.①③都可能为分层抽样C.①④都可能为系统抽样D.②③都不能为系统抽样4.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是()A.2018年3月的销售任务是400台B.2018年月销售任务的平均值不超过600台C.2018年第一季度总销售量为830台D.2018年月销售量最大的是6月份5.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如号,再用系统抽样方法从中选取5人,图所示,现将参赛选手按成绩由好到差编为125已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为( )A.95 B.96 C.97 D.986.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为().7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .297.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④8.甲、乙两名同学在五次数学考试中的成绩统计如下面的茎叶图所示,若甲、乙两人的平均成绩分别是1x ,2x ,观察茎叶图,下列结论正确的是( )A .12x x <,乙比甲成绩稳定B .12x x >,乙比甲成绩稳定C .12x x <,甲比乙成绩稳定D .12x x >,甲比乙成绩稳定9.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3010.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一周二周三周四周五车流量x (万辆) 100 102 108114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1812.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.14.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=15.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个)1520304050由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).16.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________. 18.已知由样本数据点集合(){},|1,2,3,,i ix y i n =,求得的回归直线方程为1.230.08y x Λ=+ ,且4x =。

高一数学必修三统计习题

高一数学必修三统计习题

高一数学必修三统计习题高一数学必修三统计习题一选择题1.在统计中,样本的方差用来反映总体的()A.平均状态B.分布规律C.离散状态D.最大值和最小值2.已知一组数据1、2、y的平均数为4,那么()A.y=7B.y=8C.y=9D.y=103.甲、乙、丙、丁四人的数学测验成绩分别为90分、90分、_分、80分,若这组数据的众数与平均数恰好相等,则这组数据的中位数是()A.100分B.95分C.90分D.85分4.某校1000名学生中,O型血有400人,A型血有250人,B型血有250人,AB型血有100人,为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,按照分层抽样的方法抽取样本,则O型血、A型血、B型血、AB型血的人要分别抽的人数为()A.16、10、10、4B.14、10、10、6 C5.为了了解广州地区初三学生升学考试数学成绩的情况,从中抽取50本密封试卷,每本30份试卷,这个问题中的样本容量是()A.30B.50C.1500D.1506.某单位有技工18人、技术员12人、工程师6人,需要从这些人中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果容量增加一个,则在采用系统抽样时,需要在总体中剔除1个个体,则样本容量n为()A.4B.5C.6D.无法确定7.在频率分布直方图中,每个小长方形的面积表示()A.组数B.频数C.频率D.8.在某餐厅内抽取100人,其中有30人在15岁以下,35人在16至25岁,25人在26至45岁,10人在46岁以上,则数 0.35是16到25岁人员占总体分布的()A.概率B.频率C.累计频率D.频数9.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,适合的抽取样本的方法是()A.简单的随机抽样B.系统抽样C.先从老年人中排除一人,再用分层抽样D.分层抽样10.一个容量为20的样本数据,分组后组距与频数如下:[10,20]2个,[20,30]3个,[30,40]4个,[40,50]5个,[50,60]4个,[60,70]2个,则样本在区间(-∞,50)上的频率为()A.5B.25C.50D.70二填空题11.某校高一、高二、高三三个年级的学生数分别为1500人、120__人和1000人.现采用按年级分层抽样法了解学生的视力状况,已知在高一年级抽查了75人,则这次调查三个年级共抽查了人.12.有6个数4,_,-1,y,z,6,它们的平均数为5,则_,y,z三个数的平均数为.15.有一个简单的随机样本10,12,9,14,13,则样本平均数=,样本标准差s= .13.线性回归方程y=b_+a过定点.14.一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=_______.15.某种彩票编号为0000~9999,中奖规则规定末三位号码是123的为二等奖,则中二等奖的号码为____________________________________;若将中二等奖的号码看作一个样本,则这里采用的抽样方法是三解答题16.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如下图所示.分别求出两人得分的平均数与方差;根据图和上面算得的结果,对两人的训练成绩作出评价.。

(典型题)高中数学必修三第一章《统计》测试(有答案解析)(1)

(典型题)高中数学必修三第一章《统计》测试(有答案解析)(1)

一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =3.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.一组数据的平均数为x ,方差为2s ,将这组数据的每个数都乘以()0a a>得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均数为x B .这组新数据的平均数为a x + C .这组新数据的方差为2asD .这组新数据的标准差为2a s6.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >7.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s8.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元 B .11.8万元C .12.0万元D .12.2万元9.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和9210.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为( )A .127B .128C .128.5D .12911.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .3二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.15.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.16.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________.18.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.19.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.20.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.三、解答题21.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表: 年份 2014 2015 2016 2017 2018 2019 年份代码t 1 2 3 4 5 6 年产量y (万吨)6.66.97.47.788.4(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)22.“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨):一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由;(3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由.23.某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下:(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x (吨)对价格y (万元/吨)和年利润z (万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y =.(1)求表格中c 的值;(2)求y 关于x 的线性回归方程y bx a =+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z 取得最大值?参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】根据平均数和方差公式计算比较即可. 【详解】设这个班有n 个同学,分数分别是123,,,,n a a a a ⋅⋅⋅,假设第i 个同学的成绩没录入,这一次计算时,总分是()1n x -,方差为()()()()()222222121111i i n s a x a x a x a x a x n -+⎡⎤=-+-+⋅⋅⋅+-+-+⋅⋅⋅+-⎣⎦-; 第二次计算时,()11n nxx x -+=x =,方差为()()()()()()222222221121111++i i i n n s a x a x a x a x a x a x s n n-+-⎡⎤=-+-⋅⋅⋅-+-+-+⋅⋅⋅+-=⎣⎦故有1x x =,221s s >.故选:C 【点睛】本题主要考查样本的平均数和方差公式;属于中档题.3.D解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.4.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.D解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s , 则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x xxxxxxxx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axaxaxaxaxaxaxax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.6.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础7.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,()()()2221131653615661...726177s ⎡⎤=-+-++-=⎣⎦, ()()()2222134254625662 (736277)s ⎡⎤=-+-++-=⎣⎦, 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.8.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系. 9.A解析:A【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.5 10.D解析:D【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数.详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129.故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..11.D解析:D【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3,∴另一组数据1232,32,,32n x x x +++的平均数 121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.12.C解析:C【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的.故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.【分析】根据线性回归方程过样本数据中心点可求出b 代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解.【详解】 由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元.故答案为:4.74【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题.15.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题 解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b +的最小值. 【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,故18,712,118a b a b a b ++=≤≤≤=, 49149()()18a b a b a b+=++ 149125(13)(13181818b a a b =++≥+= 当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518. 故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题. 16.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果.详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.5 6.15=, 5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.7 6.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1. 点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式 12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =18.30【解析】由题意可得:则成绩不低于分的人数为人解析:30【解析】由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人19.8【解析】由题意得从名学生中采用系统抽样的方法抽取名学生需要把名学生平均分成组每组人设第一组抽取的号码为则第组抽取的号码为解得点睛:本题考查了抽样方法中的系统抽样问题对于系统抽样的抽法是先对总体编号解析:8【解析】由题意得,从800名学生中采用系统抽样的方法抽取25名学生,需要把800名学生平均分成25组,每组8003225=人, 设第一组抽取的号码为x ,则第5组抽取的号码为432136x +⨯=,解得8x =. 点睛:本题考查了抽样方法中的系统抽样问题,对于系统抽样的抽法是先对总体编号,根据样本平均分组,确定组距,再在第一组中抽取一个编号,依次等距抽取,其中把握系统抽样的原则是解答此类问题的关键.20.5【解析】根据频率分布直方图得;∵002×5+004×5=03<0503+008×5=07>05;∴中位数应在20∼25内设中位数为x 则03+(x−20)×008=05解得x=225;∴这批产品的中解析:5【解析】根据频率分布直方图,得;∵0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5;∴中位数应在20∼25内,设中位数为x ,则0.3+(x −20)×0.08=0.5,解得x =22.5;∴这批产品的中位数是22.5.故答案为22.5.点睛:用频率分布直方图估计总体特征数字的方法:①众数:最高小长方形底边中点的横坐标;②中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;③平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.三、解答题21.(1)0.36 6.24y x =+;(2)8.76万吨.【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量.【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()61621 6.30.3617.5ˆi ii i i t t y y b t t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨.【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题.22.(1)0.3;(2)16.2万;(3)2.8吨.【分析】(1)通过频率之和为1,构造方程求得结果;(2)计算出样本中不低于2.5吨人数占比,从而求得全市的人数;(3)由频率分布直方图频率分布可知2.53x <<,然后根据平均分布列方程求得相应结果.【详解】(1)由概率统计相关知识,可知各组频率之和的值为1即频率分布直方图各小矩形面积之和为1()0.50.080.160.40.520.120.080.0421a ∴⨯+++++++=解得:0.3a =(2)由图可知,不低于2.5吨人数所占百分比为()0.50.30.120.080.0427%⨯+++= ∴全市月均用水量不低于2.5吨的人数为:600.2716.2⨯=(万)(3)由(2)可知,月均用水量小于2.5吨的居民人数所占百分比为:73%即73%的居民月均用水量小于2.5吨,同理,88%的居民月均用水量小于3吨故2.53x <<假设月均用水量平均分布,则()82%73%2.5 2.80.3x -=+=(吨) 注:本次估计默认组间是平均分布,与实际可能会产生一定误差【点睛】本题考查补全频率分布直方图、利用频率分布直方图估计总体数据特征的问题,属于基础题.23.(Ⅰ)0.02;(Ⅱ)10800元.【分析】(Ⅰ)由频率分布直方图中小矩形面积和为1能求出a .(Ⅱ)根据频率分布直方图,日销售量不低于25件的天数为(0.040.02)5309+⨯⨯=,一个月可获得的奖励为900元,由此可以估计一年内获得的礼金数.【详解】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天),一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元.【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.24.(1)4%,13%.;(2)平均数为0.20,方差的估计值为0.0364.【分析】(1)直接根据频率分布表即可得到答案.(2)首先根据频率分布表估计企业产值增长率的平均数,然后再求方差即可.【详解】(1)制造业企业中产值增长率不低于60%的企业比例为4100%4%100⨯=, 产值负增长的企业比例13100%13%100⨯=, 所以制造业企业中产值增长率不低于60%的企业比例4%,产值负增长的企业比例13%. (2)100家制造业企业产值增长率的平均数为()1130.10400.10350.3080.5040.700.20100⎡⎤⨯-+⨯+⨯+⨯+⨯=⎣⎦, 方差为()222221130.100.2040(0.100.20)35(0.300.20)8(0.500.20)4(0.700.20)100⎡⎤⨯--+⨯-+⨯-+⨯-+⨯-⎣⎦0.0364=所以制造业企业产值增长率的平均数为0.20,方差的估计值为0.0364.【点睛】本题第一问考查频率分布表,第二问考查根据频率分布表估计平均值和方差,同时考查学生的计算能力,属于中档题.25.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .试题(1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36, 2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2, 则s 甲,s 乙≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .26.(1)2.5;(2) 1.49.7y x =-+;(3)年产量约为3.5吨时,年利润z 取得最大值.【分析】(1)由均值概念求得c ;(2)根据所给数据计算系数即得;(3)利用(2)中回归直线方程作出预估值进行计算利润后,再由二次函数性质得最大值.【详解】(1)8764 5.55c y ++++==,解得 2.5c =; (2)1234535x ++++==, 5118275 2.568.5ii i x y ==⨯+⨯++⨯=∑, 1222222168.553 5.5 1.4(125)53n i ii n i i x y nx y b x nx==--⨯⨯===-+++-⨯-∑∑,5.5(1.4)39.7a y bx =-=--⨯=,所以回归直线方程为 1.49.7y x =-+.(3)由(2)2(2)(1.49.7) 1.49.7z y x x x x x =-=-+=-+, 所以9.7 3.52( 1.4)x =-≈⨯-(吨)利润最大. 【点睛】本题考查线性回归直线方程,考查回归方程的实际应用.考查学生的数据处理能力,运算求解能力.。

(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(3)

(压轴题)高中数学必修三第一章《统计》测试题(有答案解析)(3)

一、选择题1.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.752.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =3.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e4.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是( )A .24B .48C .56D .645.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .727.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸8.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和679.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s < D .3x >,22s >10.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和9211.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3012.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变二、填空题13.对具有线性相关关系的变量x ,y 有一组观测数据()(),1,2,3,,8i i x y i =,其回归直线方程是12y x a =+,且8116i i x ==∑,8148i i y ==∑,则实数a =__________.14.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7615.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带 租户业主已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.16.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.17.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 18.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________. 19.已知下列命题:①在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好; ②两个变量相关性越强,则相关系数r 就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④两个模型中残差平方和越小的模型拟合的效果越好.⑤回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;⑥若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;⑦从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 其中正确命题的序号是__________.20.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.三、解答题21.为了了解高中新生的体能情况,某学校抽取部分高一学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12﹒(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.22.零部件生产水平是评判一个国家高端装备制造能力的重要标准之一,其中切割加工技术是一项重要技术某精密仪器制造商研发了一种切割设备,用来生产高精度的机械零件,经过长期生产检验,可以认为该设备生产的零件尺寸服从正态分布N(μ,σ2).某机械加工厂购买了该切割设备,在正式投入生产前进行了试生产,从试生产的零件中任意抽取10件作为样本,下面是样本的尺寸x i(i=1,2,3,…,10,单位:mm):100.03100.499.92100.5299.98100.3599.92100.44100.66100.78用样本的平均数x作为μ的估计值,用样本的标准差s作为σ的估计值.(1)按照技术标准的要求,若样本尺寸均在(μ﹣3σ,μ+3σ)范围内,则认定该设备质量合格,根据数据判断该切割设备的质量是否合格.(2)该机械加工厂将该切割设备投入生产,对生产的零件制定了两种销售方案(假设每种方案对销售量没有影响):方案1:每个零件均按70元定价销售;方案2:若零件的实际尺寸在(99.7,100.3)范围内,则该零件为A级零件,每个零件定价100元,否则为B级零件,每个零件定价60元.哪种销售方案的利润更大?请根据数据计算说明.附:1021iix=∑≈100601.8,样本方差()22221111n ni ii is x x x nxn n==⎛⎫=-=-⎪⎝⎭∑∑.若X~N(μ,σ2),则P(μ﹣σ<X<μ+σ)=0.6827,P(μ﹣2σ<X<μ+2σ)=0.9545 23.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:x23456y 2.2 3.8 5.5 6.57.0若由资料可知y对x呈线性相关关系,试求:(1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni iiniix y nxybx nx==-=-∑∑,a y bx=-)24.某“双一流”大学专业奖学金是以所学专业各科考试成绩作为评选依据,分为专业一等奖学金(奖金额3000元)、专业二等奖学金(奖金额1500元)及专业三等奖学金(奖金额600元),且专业奖学金每个学生一年最多只能获得一次.图(1)是统计了该校2018年500名学生周课外平均学习时间频率分布直方图,图(2)是这500名学生在2018年周课外平均学习时间段获得专业奖学金的频率柱状图.(Ⅰ)求这500名学生中获得专业三等奖学金的人数;(Ⅱ)若周课外平均学习时间超过35小时称为“努力型”学生,否则称为“非努力型”学生,列22⨯联表并判断是否有99.9%的把握认为该校学生获得专业一、二等奖学金与是否是“努力型”学生有关?(Ⅲ)若以频率作为概率,从该校任选一名学生,记该学生2018年获得的专业奖学金额为随机变量X,求随机变量X的分布列和期望.22()()()()()n ad bc K a b c d a c b d -=++++25.某土特产销售总公司为了解其经营状况,调查了其下属各分公司月销售额和利润,得到数据如下表: 分公司名称 雅雨 雅雨 雅女 雅竹 雅茶 月销售额(x 万元)3 5 6 7 9 月利润(y 万元)23345在统计中发现月销售额x 和月利润额y 具有线性相关关系.(Ⅰ)根据如下的参考公式与参考数据,求月利润y 与月销售额x 之间的线性回归方程; (Ⅱ)若该总公司还有一个分公司“雅果”月销售额为10万元,试求估计它的月利润额是多少?(参考公式:1221ni i i n i i x y nx y b x nx==-⋅=-∑∑,a y b x =-,其中:1112ni ii x y ==∑,21200)nii x==∑.26.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.2.C解析:C 【分析】根据平均数和方差公式计算比较即可. 【详解】设这个班有n 个同学,分数分别是123,,,,n a a a a ⋅⋅⋅,假设第i 个同学的成绩没录入,这一次计算时,总分是()1n x -,方差为()()()()()222222121111i i n s a x a x a x a x a x n -+⎡⎤=-+-+⋅⋅⋅+-+-+⋅⋅⋅+-⎣⎦-; 第二次计算时,()11n nxx x -+=x =,方差为()()()()()()222222221121111++i i i n n s a x a x a x a x a x a x s n n-+-⎡⎤=-+-⋅⋅⋅-+-+-+⋅⋅⋅+-=⎣⎦故有1x x =,221s s >.故选:C 【点睛】本题主要考查样本的平均数和方差公式;属于中档题.3.D解析:D 【分析】由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kx y ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+, 令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.4.B解析:B 【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解. 【详解】 由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=, 又前3个小组的频率之比为1:2:3,所以第二组的频率为20.750.256⨯=, 所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.5.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.6.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.7.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.8.B解析:B 【解析】 【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解. 【详解】设更正前甲,乙,…的成绩依次为a 1,a 2,…,a 50, 则a 1+a 2+…+a 50=50×70,即60+90+a 3+…+a 50=50×70, (a 1﹣70)2+(a 2﹣70)2+…+(a 50﹣70)2=50×75, 即102+202+(a 3﹣70)2+…+(a 50﹣70)2=50×75.更正后平均分为x =150×(80+70+a 3+…+a 50)=70; 方差为s 2=150×[(80﹣70)2+(70﹣70)2+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+50×75﹣102﹣202]=67. 故选B . 【点睛】本题考查平均数与方差的概念与应用问题,是基础题.9.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础10.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.511.C解析:C 【分析】设该样本中高三年级的学生人数为x ,则1800601200x=,解之即可 【详解】设该样本中高三年级的学生人数为x ,则1800601200x =,解得40x =, 故选C . 【点睛】本题考查了分层抽样方法的应用问题,属基础题.12.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,, 所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.二、填空题13.5【分析】求出数据的中心(26)代入回归直线方程即可【详解】由已知∵回归直线方程一定过样本点中心∴∴故答案为:5【点睛】本题考查了线性回归方程考查了计算能力和逻辑推理能力属于一般题目解析:5 【分析】求出数据的中心(2,6),代入回归直线方程即可. 【详解】由已知2x =,6y =,∵回归直线方程12y x a =+一定过样本点中心(),x y ∴1622a =⨯+ ∴5a = 故答案为:5 【点睛】本题考查了线性回归方程,考查了计算能力和逻辑推理能力,属于一般题目.14.05【分析】根据给定的随机数表的读取规则从第一行第67列开始两个数字一组从左向右读取重复的或超出编号范围的跳过即可【详解】根据随机数表排除超过33及重复的编号第一个编号为21第二个编号为32第三个编解析:05 【分析】根据给定的随机数表的读取规则,从第一行第6、7列开始,两个数字一组,从左向右读取,重复的或超出编号范围的跳过,即可.【详解】根据随机数表,排除超过33及重复的编号,第一个编号为21,第二个编号为32,第三个编号05,故选出来的第3个红色球的编号为05.【点睛】本题主要考查了简单随机抽样中的随机数表法,属于容易题.15.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数.【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户.【点睛】本小题主要考查用样本估计总体,考查频率的计算,属于基础题.16.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案.【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2,所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.17.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.18.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.19.①③④⑦【分析】根据线性回归分析的概念进行分析即可【详解】在线性回归模型中相关指数越接近于1表示回归效果越好①正确;两个变量相关性越强则相关系数r 的绝对值就越接近于1②错误;③正确;两个模型中残差平解析:①③④⑦ 【分析】根据线性回归分析的概念进行分析即可. 【详解】在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好,①正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,②错误;③正确;两个模型中残差平方和越小的模型拟合的效果越好,④正确;回归直线ˆˆˆybx a =+恒过样本点的中心(),x y ,不一定过样本点,⑤错误;若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,并不能说在100个吸烟的人中必有99人患有肺病,⑥错误;从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误,⑦正确.故答案为①③④⑦. 【点睛】本题考查线性回归分析的有关概念,掌握相关概念是解题基础,属于基础题.20.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人三、解答题21.(1)0.08,150;(2)88%;(3)第四小组,理由见解析 【解析】试题分析:(1)由频率分布直方图中各小矩形面积之和为1结合面积之比得到第二小组的频率,从而求得样本容量;(2)由频率分布直方图中各小矩形的面积和为1与面积之比可求出达标的频率即达标率;(3)求出前四组的频数即可得到中位数所在的区间. 试题(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为: 又因为频率=所以(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内. 考点:频率分布直方图22.(1)合格,理由见解析;(2)方案2,理由见详解. 【分析】(1)求得10个数据的平均数和标准差,根据题意,即可判断;(2)设出方案2中零件价格的随机变量,结合正态分布求得零件价格的分布列和数学期望,即可比较大小,则问题得解.【详解】(1)由表格中数据可得:x 1011100.310i i x ===∑,()101022221111(10)0.091010i i i i s x x x x ===-=-=∑∑.故可得:100.3μ=,0.3σ=. 因为所有样本都在区间()99.4,101.2, 故该切割设备质量合格.(2)对方案2,设零件价格的随机变量为X ,故X 可取60,100, 根据(1)中所求,可得()()()10099.7100.320.47725P X P x P x μσμ==<<=-<<=;()()6011000.52275P X P X ==-==.故()600.522751000.47725600.51000.477770E X =⨯+⨯>⨯+⨯=>. 又方案1中,每个零件售价均为70, 故可得方案2的利润更大. 【点睛】本题考查平均数和方差标准差的计算,涉及正态分布,随即变量数学期望的求解,属综合中档题.23.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii n ii x ynxyb x nx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值. 【详解】 (1)4x =,5y=,52190i i x==∑,51112.3i i i x y ==∑,12215 1.235ni ii nii x yxyb xx ==-==-∑∑,0.08a y bx =-=,所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元. 【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii n ii x ynxyb x nx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.24.(Ⅰ)160人;(Ⅱ)有;(Ⅲ)见解析. 【分析】(Ⅰ)根据频率之和为1,得到获得三等奖学金的频率,再由总人数得到答案;(Ⅱ)根据频率分布直方图和频率柱状图,填写好列联表,再计算出2K 进行判断,得到答案;(Ⅲ)先得到X 可取的值,再分别求出其概率,根据数学期望的公式,得到答案. 【详解】()I 获得三等奖学金的频率为:()()()0.0080.0160.0450.150.040.0560.01650.40.0160.00850.40.32++⨯⨯+++⨯⨯++⨯⨯=5000.32160⨯=,故这500名学生获得专业三等奖学金的人数为160人.()II 每周课外学习时间不超过35小时的“非努力型”学生有()5000.0080.0160.040.040.0560.0165440⨯+++++⨯=人,其中获得一、二等奖学金学生有()()()5000.0080.0160.0450.055000.040.0560.01650.250.0592x ++⨯⨯+⨯++⨯⨯+=每周课外学习时间超过35小时称为“努力型”学生有5000.1260⨯=人, 其中获得一、二等奖学金学生有()600.350.2536⨯+=人,22⨯列联表如图所示:()250034836922442.3610.8344060128372K ⨯⨯-⨯=≈>⨯⨯⨯故有99.9%的把握认为获得一二等奖学金与学习“努力型”学生的学习时间有关;()III X 的可能取值为0,600,1500,3000 ()6000.32P X ==, ()15000.198P X ==, ()30000.058P X ==,()010.320.1980.0580.424P X ==---=X 的分布列00.4246000.3215000.19830000.058192297174663EX x =⨯+⨯++⨯=++=元. 【点睛】本题考查利用频率分布直方图求频率和频数,通过求2K 的值进行判断是否相关,随机变量的分布列和数学期望,属于中档题.25.(1)ˆ0.50.4yx =+(2)5.4万元 【解析】 试题分析:(1)首先由题意求得平均数6, 3.4x y ==,然后利用系数公式计算可得回归方程为0.5.4ˆ0yx =+ . (2)由题意结合(1)中的结论预测可得“雅果”分公司的月利润额是5.4万元. 试题(Ⅰ) 由已知数据计算得:5n =,6, 3.4x y ==1221511256 3.40.5,20056653.40.560.4ni i i n ii x y xy b x x a ==--⨯⨯===-⨯⨯-=-⨯=∑∑∴线性回归方程为0.5.4ˆ0yx =+ (Ⅱ)将x =10代入线性回归方程中得到0.5100.4ˆ 5.4y=⨯+=(万元) ∴估计“雅果”分公司的月利润额是5.4万元26.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲,s 乙≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .。

(好题)高中数学必修三第一章《统计》检测卷(有答案解析)(3)

(好题)高中数学必修三第一章《统计》检测卷(有答案解析)(3)

一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15B .45,45,45C .45,60,30D .30,90,152.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm 的株数n 是 ( )A .30B .60C .70D .803.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x甲,x乙及方差2s甲,2s乙的关系为( )A.x甲>x乙,2s甲>2s乙 B.x甲>x乙,2s甲<2s乙 C.x甲<x乙,2s甲<2s乙 D.x甲<x乙,2s甲>2s乙6.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是()A.45 B.47 C.48 D.637.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则()A.B.C.D.8.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为()A.0795 B.0780 C.0810 D.08159.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,总体方差大于0 C.丙地:中位数为2,众数为3 D.丁地:总体均值为2,总体方差为3 10.为了考察两个变量x和y之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是()A.直线l1和l2有交点(s,t)B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合11.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A .40B .45C .48D .5012.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.14.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.15.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.16.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.17.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.18.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 19.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.20.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.三、解答题21.某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x (单位:万元)和产量y (单位:吨)的数据,用两种模型①y bx a =+,②y x a =+分别进行拟合,得到相应的回归方程111.2 2.0y x =+,228.29.8y x =,进行残差分析得到如图所示的残差值及一些统计量的值: 月份 1 2 3 4 5 6 3.5x =41y =611049i ii x y==∑62191ii x==∑投入量x (万元) 1 2 3 4 5 6 产量y (吨) 13 22 4345 55 68 模型①的残差值 -0.2 -2.4-1.8 -3 -1.2 模型②的残差值-5.4-8.04.0-1.61.69.0(1)求上表中空格内的值;(2)残差值的绝对值之和越小说明模型拟合效果越好,根据残差比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(3)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(2)中所选模型的回归方程.(参考公式:i i ie y bx a =--,1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-)22.为提高某作物产量,种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了10块试验田的数据,得到下表:技术人员选择模型21y a bx =+作为y 与x 的回归方程类型,令2i i u x =,1ii v y =. (1)由最小二乘法得到线性回归方程v u βα=+,求y 关于x 的回归方程; (2)利用(1)得出的结果,计算当单位面积播种数x 为何值时,单位面积的总产量w xy =的预报值最大?(计算结果精确到0.01)附:对于一组数据()11,u v ,()22,u v …(),n n u v 其回归直线v u βα=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-.参考数据:1500nii u==∑,140ni i v ==∑,12321n i i i u v ==∑,2135642ni i u ==∑ 5.48≈.23.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniii ii i nni i i i x x y y x y nxybay bx x x x nx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某公司有400名员工,根据男女员工人数比例,用分层随机抽样的方法从中抽取了100人,调查他们的通勤时间(上下班途中花费的总时间,单位:分钟),将数据按照[)20,30,[)30,40,,[]80,90分成7组,并整理得到如下频率分布直方图:(I )从总体中随机抽取1人,估计其通勤时间小于40分钟的概率; (Ⅱ)求样本数据的中位数的估计值;(Ⅲ)已知样本中通勤时间大于或等于60分钟的人都是男员工,通勤时间小于60分钟的人中有一半是男员工,求该公司男员工的人数.26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.C解析:C解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.5.C【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.8.A解析:A【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为100020 50=所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.9.D解析:D【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差10.A解析:A【分析】由题意知,两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,所以两组数据的样本中心点是(s,t),回归直线经过样本的中心点,得到直线l1和l2都过(s,t).【详解】∵两组数据变量x的观测值的平均值都是s,对变量y的观测值的平均值都是t,∴两组数据的样本中心点都是(s,t)∵数据的样本中心点一定在线性回归直线上,∴回归直线l1和l2都过点(s,t)∴两条直线有公共点(s ,t ) 故选A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与Y 之间的关系,这条直线过样本中心点.11.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.12.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127;128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139; 140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4 【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=. 若13x =时,则()()()()2222234577774x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0, 此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9, 此时12345,,,,x x x x x 为4,6,7,8,10,符合题意. 故答案为:4 【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题.14.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.15.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论16.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】试题分析:由平均数及方差的定义可得10685675x ++++==;222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==.考点:样本数据的数字特征:平均值与方差.17.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.18.2【解析】分析:直接利用回归方程将代入即可求得的估计值详解:∵回归方程为∴当时的估计值为故答案为82点睛:本题考查回归方程的运用考查学生的计算能力属于基础题解析:2 【解析】分析:直接利用回归方程,将25x =代入,即可求得y 的估计值. 详解:∵回归方程为0.4 1.8y x =-,∴当25x =时,y 的估计值为 0.425 1.88.2y =⨯-=.故答案为8.2.点睛:本题考查回归方程的运用,考查学生的计算能力,属于基础题.19.8【解析】由题意得从名学生中采用系统抽样的方法抽取名学生需要把名学生平均分成组每组人设第一组抽取的号码为则第组抽取的号码为解得点睛:本题考查了抽样方法中的系统抽样问题对于系统抽样的抽法是先对总体编号解析:8 【解析】由题意得,从800名学生中采用系统抽样的方法抽取25名学生,需要把800名学生平均分成25组,每组8003225=人, 设第一组抽取的号码为x ,则第5组抽取的号码为432136x +⨯=,解得8x =.点睛:本题考查了抽样方法中的系统抽样问题,对于系统抽样的抽法是先对总体编号,根据样本平均分组,确定组距,再在第一组中抽取一个编号,依次等距抽取,其中把握系统抽样的原则是解答此类问题的关键.20.5【解析】根据频率分布直方图得;∵002×5+004×5=03<0503+008×5=07>05;∴中位数应在20∼25内设中位数为x 则03+(x−20)×008=05解得x=225;∴这批产品的中解析:5 【解析】根据频率分布直方图,得; ∵0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5; ∴中位数应在20∼25内, 设中位数为x ,则 0.3+(x −20)×0.08=0.5, 解得x =22.5;∴这批产品的中位数是22.5. 故答案为22.5.点睛:用频率分布直方图估计总体特征数字的方法: ①众数:最高小长方形底边中点的横坐标;②中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标; ③平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.三、解答题21.(1)7.4;(2)选模型①,理由见解析;(3)111y x =+. 【分析】(1)根据i i ie y bx a =--,结合表中所给数据,即可求得空格内的值;(2)分别计算出模型①和模型②的残差值绝对值之和,比较其大小,即可求得应选择哪一个模型;(3)根据所给数据计算出x ,y ,51i ii x y =∑,521ii x=∑,带入1221ni ii nii x y nx yb xnx==-=-∑∑,即可求得答案. 【详解】(1)根据i i ie y bx a =--∴空格处的值为()43311.2 2.07.4-⨯+=(2)应选择模型①模型①的残差值的绝对值之和为0.2 2.47.4 1.83 1.216+++++= 模型②的残差值的绝对值之和为5.48.0 4.0 1.6 1.69.029.6+++++=1629.6<∴模型①的拟合效果好,应该选模型①.(3)剔除异常数据,即剔除3月份的数据后, 得()13.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.211825 3.6 3.617.25i ii i i x y x yb x x==--⨯⨯====-⨯⨯-∑∑,40.611 3.61a y bx =-=-⨯=.所以y 关于x 的回归方程为111y x =+. 【点睛】本题解题关键是掌握残差的定义和回归直线方程的求解步骤,考查了分析能力和计算能力,属于中档题. 22.(1)212.50.03y x=+;(1)9.13x =棵2/m . 【分析】(1)先利用公式和数据计算,αβ,即得v 关于u 的线性回归方程,再代入得到y 关于x 的回归方程即可;(2)先利用(1)的结果计算w xy =,再利用基本不等式求其最大值即可. 【详解】解:(1)由题意得115010n i i u u ===∑,11410ni i v v ===∑, ∴1011022212321105040.033564210501010i i i i i u v u vu uβ==-⨯⨯=⨯⋅--≈=-∑∑, 2.5v u αβ=-=.所以v 关于u 的线性回归方程为0.03 2.5v u =+.则y 关于x 的回归方程为212.503ˆ0.yx =+.(2)根据(1)的结果并结合条件,单位面积的总产量的预报值21252.50.030.03x w x x x==++ 1.83≤=≈. 当且仅当2.50.03x x =时,等号成立,此时9.133x =≈. 即当9.13x =棵2/m 时,单位面积的总产量w 的预报值最大,最大值是1.83.【点睛】本题考查了非线性回归方程的求法以及方程的应用,属于中档题.23.(1)ˆ0.150.9yx =+;(2)2.25万元. 【分析】(1)由已知数据求出x 和y ,根据所给公式求出ˆb与ˆa 的值,即可得y 关于x 的线性回归方程;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】解:(1)依题意可计算得, 1(24466677810)610x =+++++++++=, 1(1.0 1.5 1.6 2.0 1.8 1.9 1.8 2.0 2.1 2.3) 1.810y =+++++++++=. 236x =,10.8x y ⋅=,又101115i ii x y==∑,1021406i i x ==∑,1022110151ˆ0.1100ii i iix y x ybxx==∴=≈⋅--∑∑,ˆˆ0.9ay bx =-=,ˆ0.150.9y x ∴=+, ∴所求的线性回归方程为ˆ0.150.9yx =+. (2)当9x =时,ˆ0.1590.9 2.25y=⨯+=(万元), ∴估计大多数年收入9万元的家庭每年饮食支出约为2.25万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 25.(Ⅰ)0.6;(Ⅱ)37.5;(Ⅲ)220. 【分析】(Ⅰ)根据频率分布直方图求解即可;(Ⅱ)先根据频率分布直方图判断中位数落在哪一区间上,然后利用中位数将频率分布直方图的面积分为相等的两部分求解;(Ⅲ)先计算出样本中男员工的人数,计算出男员工所占的比例,然后估计总体中男员工的人数. 【详解】解:(1)由频率分布直方图可知,样本中通勤时间小于40的概率()100.020.040.6p =⨯+=,故从总体中随机抽取1人,估计其通勤时间小于40分钟的概率也为0.6.(Ⅱ)由图可知,样本的中位数位于[)30,40之间,设中位数为x,则()0.2300.040.5x+-⨯=,解得37.5x=,故中位数为37.5.(Ⅲ)样本中通勤时间大于或等于60分钟的人的概率为0.1,共10人,通勤时间小于60分钟的人的频率为0.9,其中男员工有11000.9452⨯⨯=人,所以样本中男员工共有55人,占样本容量的55%,故该公司男员工人数为40055%220⨯=人.【点睛】本题考查频率分布直方图的应用,考查用样本估计总体,难度一般.26.(1)分布列见解析,1;(2)0.10=P,理由见解析.【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X的取值可能为0,1,2,然后计算概率得出分布列及其数学期望;(2)按照公式计算2K的值,然后由临界值表得出结果即可.【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。

(典型题)高中数学必修三第一章《统计》测试(包含答案解析)

(典型题)高中数学必修三第一章《统计》测试(包含答案解析)

一、选择题1.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+2.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.53.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差4.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .295.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 6.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .7.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.98.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .1510.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元11.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A .消耗1升汽油,乙车最多可行驶5千米B .以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C .甲车以80千米/小时的速度行驶1小时,消耗10升汽油D .某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油 12.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .15.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.16.为调查某校学生每天用于课外阅读的时间,现从该校3000名学生中随机抽取100名学生进行问卷调查,所得数据均在区间[50,100]上,其频率分布直方图如图所示,则估计该校学生中每天用于阅读的时间在[70,80)(单位:分钟)内的学生人数为____.17.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.18.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:x1 2 3 4 5 y 7.06.5m3.82.2已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.19.已知某人连续5次投掷飞镖的环数分别是8,9,10,10,8,则该组数据的方差为______.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行跟踪调查,张三提供了该县某山羊养殖场年养殖数量y (单位:万只)与相应年份x (序号)的数据表和散点图(如图所示),根据散点图,发现y 与x 有较强的线性相关关系,李四提供了该县山羊养殖场的个数z (单位:个)关于x 的回归方程ˆ230z x =-+.年份序号x 1 2 3 4 5 6 7 8 9 年养殖山羊y /万只1.21.51.61.61.82.52.52.62.7y x (2)试估计:①该县第一年养殖山羊多少万只? ②到第几年,该县养殖山羊的数量与第1年相比减少了?参考统计量:()92160ii x x =⋅-=∑,()()9112i i i x x y y =⋅--=∑.附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆv u αβ=-. 22.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-.23.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下: (1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位. 参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.24.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格.(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bxa =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下:用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本)参考公式和数据:()()niix x y y r --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700iii x x y y =--=∑,6214126ii x==∑,61240i i y==∑,()6218816i i y y=-=∑,8.4≈786≈.25.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆn ni i i i i i n n i i i i x x y y x y nxy b x x x nx ====---==--∑∑∑∑,ˆˆa y bx =-) 26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.3.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.4.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.5.D解析:D【分析】根据图形中给出的数据,对每个选项分别进行分析判断后可得错误的结论.【详解】对于选项A,由图可得3月份的销售任务是400台,所以A正确.对于选项B,由图形得2018年月销售任务的平均值为1(3245810743413)10045012⨯+++++++++++⨯=,所以B正确.对于选项C,由图形得第一季度的总销售量为13002001400 1.28302⨯+⨯+⨯=台,所以C正确.对于选项D,由图形得销售量最大的月份是5月份,为800台,所以D不正确.故选D.【点睛】本题考查统计中的识图、用图和计算,解题的关键是从图中得到相关数据,然后再根据要求进行求解,属于基础题.6.D解析:D【解析】【分析】先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.7.B解析:B【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程.详解:123+4=2.54x++=,3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.8.C解析:C 【解析】分析:①根据进位制的互化可得结果;②根据系统抽样的性质可得结论;③由正弦定理可得结论.详解:①45222...1÷=,22211...0÷=,112 5...1÷=,52 2...1÷=,22 1...0÷=,120...1÷=,故()()10245101101=,①正确;②因为1000个个题抽取50个样本,∴每个样本编号间隔为20,第六个编号为8205108+⨯=,即编号为0108,故②错误;③由正弦定理可得342,1sin 32sinC C ==,,c a C >∴∠可能是锐角,也可能是钝角,三角形有两个解,③正确,故选C.点睛:本题主要考查进位制、正弦定理的应用,分层抽样的应用,意在考查综合运用所学知识解决问题的能力,属于中档题.9.C解析:C 【详解】 抽取比例为150130000200=, 1400020200∴⨯=, 抽取数量为20,故选C.10.B解析:B 【详解】试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4,∴42=9.4×3.5+a,∴ˆa=9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5考点:线性回归方程11.D解析:D【详解】解:对于A,由图象可知当速度大于40km/h时,乙车的燃油效率大于5km/L,∴当速度大于40km/h时,消耗1升汽油,乙车的行驶距离大于5km,故A错误;对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B错误;对于C,由图象可知当速度为80km/h时,甲车的燃油效率为10km/L,即甲车行驶10km时,耗油1升,故行驶1小时,路程为80km,燃油为8升,故C错误;对于D,由图象可知当速度小于80km/h时,丙车的燃油效率大于乙车的燃油效率,∴用丙车比用乙车更省油,故D正确故选D.考点:1、数学建模能力;2、阅读能力及化归思想.12.A解析:A【分析】由题意知,两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,所以两组数据的样本中心点是(s,t),回归直线经过样本的中心点,得到直线l1和l2都过(s,t).【详解】∵两组数据变量x的观测值的平均值都是s,对变量y的观测值的平均值都是t,∴两组数据的样本中心点都是(s,t)∵数据的样本中心点一定在线性回归直线上,∴回归直线l1和l2都过点(s,t)∴两条直线有公共点(s,t)故选A.【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x与Y之间的关系,这条直线过样本中心点.二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名,故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等.14.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:底部周长大于110cm的频率为(0.0200.010)100.3+⨯=,所以底部周长大于110cm的频数为600.318⨯=(株),故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.15.【分析】根据线性回归方程过样本数据中心点可求出b代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解. 【详解】由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元. 故答案为:4.74 【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题.16.【分析】利用频率分布直方图中频率和为1求a 值根据7080)的频率求出在此区间的人数即可【详解】由1﹣005﹣035﹣02﹣01=03故a =003故阅读的时间在7080)(单位:分钟)内的学生人数为: 解析:900【分析】利用频率分布直方图中频率和为1求a 值,根据[70,80)的频率求出在此区间的人数即可. 【详解】由1﹣0.05﹣0.35﹣0.2﹣0.1=0.3, 故a =0.03,故阅读的时间在[70,80)(单位:分钟)内的学生人数为:0.3×3000=900, 故答案为900. 【点睛】本题考查频率分布直方图中的有关性质的应用,考查直方图中频率和频数的求法.17.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了解析:75. 【解析】分析:由频率分布直方图算出各频率,然后计算中位数 详解:由图可知,10~20的频率为0.1420~30的频率为0.24 30~40的频率为0.32 40~50的频率为0.2 50~60的频率为0.1前两组频率0.140.240.380.5=+=<前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯=解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.18.5【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5 【解析】19.5,15,5my x +== 将样本中心代入回归方程得到m=5.5. 故答案为:5.5. 19.【解析】20.【解析】因为平均数为所以方差为解析:45【解析】因为平均数为8,所以9,x = 方差为222214[10111]55++++=三、解答题21.(1)ˆ0.21yx =+;(2)①33.6万只;②到第10年该县养殖山羊的数量相比第1年减少了. 【分析】(1)由已知求得,x y ,进一步套公式求出ˆb和ˆa 的值,就求出线性回归方程; (2)由题意求得()()2ˆˆ0.212300.4430zy x x x x ⋅=+⋅-+=-++, 在①中,令x =1求解,在②中,令20.443033.6x x -++<,解不等式即可. 【详解】解:(1)设y 关于x 的线性回归方程为y bx a =+,12345678959x ++++++++==,1.2 1.5 1.6 1.6 1.82.5 2.5 2.6 2.729y ++++++++==,()()()9192112ˆ0.260iii i i x x y y bx x ==--===-∑∑, ˆ20.251a=-⨯=. 所以y 关于x 的线性回归方程为ˆ0.21yx =+. (2)估计第x 年山羊养殖的只数为()()2ˆˆ0.212300.4430zy x x x x ⋅=+⋅-+=-++ 令1x =,则0.443033.6-++=, 故该县第一年养殖山羊约33.6万只. 由题意,得20.443033.6x x -++<,整理得()()910x x -->,解得9x >或1x <(舍去),所以到第10年该县养殖山羊的数量相比第1年减少了. 【点睛】方法点睛:求线性回归方程的步骤: (1)先求 x 、y 的平均数,x y ;(2)套公式求出ˆb和ˆa 的值:()()()91921ˆiii ii x x y y b x x ==--=-∑∑,ˆa y b x =-⨯;(3)写出回归直线的方程.22.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】 (1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .23.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑,ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =, 可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位. 【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 24.(Ⅰ)具有较强的线性相关关系,10220y x =-;(Ⅱ)330元 【分析】(Ⅰ)代入公式计算r ,再做判断,根据公式求,b a ,即得结果;(Ⅱ)先确定温度达到28C ︒以上时概率,再确定随机变量取法,分别求出对应概率,最后根据数学期望公式求结果. 【详解】 (Ⅰ)21232527293171121226411526,4066x y ++++++++++=======()()7000.75786niix x y y r --==>=>∑所以潜叶蝇的平均产卵数y 与平均温度x 具有较强的线性相关关系,()()()1217001070nii i nii xx y yb xx==--===-∑∑,401026220a y bx =-=-⨯=- 10220y bx a x ∴=+=-;(Ⅱ)()12528,2P ξ<≤=()C ξ︒近似地服从正太分布()226.5,N σ,()()12528128,24P P ξξ-<≤∴>==0,1200,1600Y =13141163(0)1,(1200),(1600)444101041020P Y P Y P Y ==-===⨯===⨯= 313()01200140033041020E Y =⨯+⨯+⨯=(元)【点睛】本题考查线性回归方程、数学期望公式、正态分布,考查综合分析求解能力,属中档题.25.(1)5ˆ32yx =-(2)可靠 【分析】(1)根据所给的数据,先做出,y x 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程;(2)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的. 【详解】 (1)由题意:111312123x ++==,253026273y ++==,()()()()()()()()()()()()31122331322221231ˆii i i i x x y y x x y y x x y y x x y y b x x x x x x x x ==----+--+--==-+-+--∑∑ ()()()()()()()()()22211122527131230271212262752111213121212-⨯-+-⨯-+-⨯-==-+-+-. 527123ˆˆ2ay bx =-=-⨯=-, 故回归直线方程为:ˆ532yx =-. (2)当10x =时,510322,2223122y =⨯-=-=<, 当8x =时,58317,1716122y =⨯-=-=<,所以(1)中所得的回归直线方程是可靠的. 【点睛】本题主要考查线性回归方程的求解与应用,属于中档题.求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人, 则随机变量X 0=,1,2,∴343641(0)205====C P X C ,122436123(1)205C C P X C ====,21243641(2)205C C P X C ====,分布列为:0 1 20121555EX =⨯+⨯+⨯=; (2)22100(45153010) 3.03075255545⨯-⨯=≈⨯⨯⨯K ,由表可知2.706 3.030 3.840<<, ∴0.10=P .【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。

高中数学必修三统计练习

高中数学必修三统计练习

准文档§11.1 随机抽样A1.判断下边能否正确(在括号中打“√”或“×”)(1) 随机抽是一种不放回抽.()(2) 随机抽每个个体被抽到的时机不一,与先后有关.()(3) 系抽在开端部分抽采纳随机抽.()(4) 要从 1 002 个学生顶用系抽的方法取一个容量20 的本,需要剔除 2 个学生,被剔除者不公正.()(5) 分抽中,每个个体被抽到的可能性与数及分有关.()2.在某班的50 名学生中,挨次抽取学号5、 10、 15、20、 25、30、 35、40、 45、 50 的 10 名学生行作,种抽方法是()A .随机抽B.分抽C.系抽D.以上都不是3.将参加英口的 1 000 名学生号000,001,002 ,⋯, 999,从中抽取一个容量50 的本,按系抽的方法分50 ,假如第一号000,001,002 ,⋯, 019,且第一随机抽取的号015,抽取的第35 个号()A . 700 B. 669 C. 695 D . 6764.大、中、小三个盒子中分装有同一种品120 个、 60 个、 20 个,在需从三个盒子中抽取一个本容量25的本,适合的抽方法________________ .5.一支田径有男运48 人,女运36 人.若用分抽的方法从的全体运中抽取一个容量21 的本,抽取男运的人数________.B1. (2012 四·川 )交通管理部认识机(称 )某新法的知状况,甲、乙、丙、丁四个社区做分抽.假四个社区的人数N,此中甲社区有96 人.若在甲、乙、丙、丁四个社区抽取的人数分12,21,25,43,四个社区的人数N()A . 101 B. 808 C. 1 212 D .2 0122.某校修球程的学生中,高一年有30 名,高二年有40 名.用分抽的方法在70 名学生中抽取一个本,已知在高一年的学生中抽取了 6 名,在高二年的学生中抽取的人数()A .6 B.8 C.10 D.123.某位有工750 人,此中青年工350 人,中年工250 人,老年工150 人,了认识位工的健康情况,用分抽的方法从中抽取本,若本中的青年工7 人,本容量()A .7 B.15 C.25 D.354.范学校学,省教育督察某所高中行了抽.抽到的班一共有52 名学生,将班学生随机号,用系抽的方法抽取一个容量 4 的本,已知7 号、 33 号、 46 号同学在本中,那么本中有一位同学的号()5.某学校高一、高二、高三三个年共有学生 3 500 人,此中高三学生是高一学生的两倍,高二学生比高一学生多准文档1300 人,在按100的抽比率用分抽的方法抽取本,高一学生抽取的人数()A .8 B.11 C. 16 D.106. (2012 天·津 ) 某地区有小学 150所,中学 75 所,大学 25 所.采纳分抽的方法从些学校中抽取30 所学校学生行力,从小学中抽取________所学校,中学中抽取 ________所学校.7.将某班的 60 名学生号 01,02,⋯, 60,采纳系抽方法抽取一个容量 5 的本,且随机抽得的一个号04,剩下的四个号挨次是________.8. (2012 ·建福 )一支田径有男女运98 人,此中男运有56 人,按男女比率用分抽的方法,从全体运中抽出一个容量28 的本,那么抽取女运人数是________.9.行城市空气量,按地区把24 个城市分红甲、乙、丙三,的城市数分4,12,8,若用分抽抽取 6 个城市,丙中抽取的城市数________.10.用系抽法要从160 名学生中抽取容量20 的本,将160 名学生从 1~ 160 号,按号序均匀分红20(1 ~8 号,9~ 16 号,⋯,153~160 号 ),若第 16 抽出的号123,第 2 中抽出个体的号是______________.C1.某初中学有学生270 人,此中一年 108 人,二、三年各 81 人,要利用抽方法抽取10 人参加某,考用随机抽、分抽和系抽三种方案,使用随机抽和分抽,将学生按一、二、三年挨次一号1,2,⋯, 270,使用系抽,将学生一随机号1,2,⋯, 270,并将整个号挨次分 10 段,假如抽得号有以下四种状况:①7,34,61,88,115,142,169,196,223,250②5,9,100,107,111,121,180,195,200,265③11,38,65,92,119,146,173,200,227,254④30,57,84,111,138,165,192,219,246,270对于上述本的以下中,正确的选项是()A .②、③都不可以系抽B.②、④都不可以分抽C.①、④都可能系抽D.①、③都可能分抽2. (2012 山· )采纳系抽方法从960 人中抽取32 人做卷,此将他随机号1,2,⋯, 960,分后在第一采纳随机抽的方法抽到的号9.抽到的 32 人中,号落入区[1,450] 的人做卷A,号落入区[451,750] 的人做卷B,其他的人做卷 C.抽到的人中,做卷 B 的人数()A .7 B.9 C.10 D.153.认识 1 200 名学生学校某教改的意,打算从中抽取一个容量30 的本,考采纳系抽,分段的隔k ________.答案404. 200 名工年散布如所示,从中随机抽取40 名工作本,采纳系抽方法,按1~ 200 号分40 ,分1~ 5,6~ 10,⋯, 196~ 200,第 5 抽取号22,第 8 抽取号______.若采纳分抽,40 以下年段抽取______人.5.一个体中有90 个个体,随机号0,1,2,⋯,89,允从小到大的号序均匀分红9 个小,号挨次1,2,3,⋯,准文档9.用系抽方法抽取一个容量9 的本,定假如在第 1 随机抽取的号m,那么在第k 中抽取的号个位数字与m+ k 的个位数字同样,若m= 8,在第8 中抽取的号是________.6.某公路院有工程 6 人,技 12 人,技工 18 人,要从些人中抽取n 个人参加市里召开的科学技大会.如果采纳系抽和分抽的方法抽取,不用剔除个体,假如参会人数增添 1 个,在采纳系抽,需要在体中先剔除 1 个个体,求n.§ 11.2用样本预计整体A1.判断下边能否正确 (在括号中打“√”或“×” )(1)均匀数、众数与中位数从不一样的角度描绘了一数据的集中.()(2)一数据的众数能够是一个或几个,那么中位数也拥有同样的.()(3)从率散布直方得不出原始的数据内容,把数据表示成直方后,原有的详细数据信息就被抹掉了.()(4)茎叶一般左的叶按从大到小的序写,右的叶按从小到大的序写,同样的数据能够只一次.()2.某老从礼拜一到礼拜五收到的信函数分10,6,8,5,6,数据的方差s2=________.3.一个容量20 的本,数据的分及各的数以下:[10,20) ,2; [20,30) , 3; [30,40) , x; [40,50) , 5; [50,60) , 4;[60,70) ,2; x=________;依据本的率散布估,数据落在[10,50) 的概率 ________.4. (2012 ·南湖 )如所示是某学校一名球运在五比中所得分数的茎叶,运在五比中得分的方差________.21222],此中 x x(注:方差 s = [(x1- x )+(x2- x ) +⋯+ (x n- x )1,x2,⋯, x n的均匀数 )n5.某中学认识学生数学程的学状况,在 3000 名学生中随机抽取200 名,并 200 名学生的某次数学考成,获取了本的率散布直方(如 ).依据率散布直方推, 3 000 名学生在次数学考中成小于 60 分的学生数是 ________.B1. (2013 · 重 )下是某公司10 个售店某月售某品数目(位:台 )的茎叶,数据落在区[22,30) 内的概率()标准文档B. 0.4C. 0.5D. 0.62. (2013 ·宁辽)某班的全体学生参加英语测试,成绩的频次散布直方图如图,数据的分组挨次为[20,40) ,[40,60) ,[60,80) ,[80,100] .若低于 60 分的人数是15,则该班的学生人数是()A .45 B.50 C.55D. 603. (2012 ·西陕 )对某商铺一个月内每日的顾客人数进行了统计,获取样本的茎叶图 (以下图 ),则该样本的中位数、众数、极差分别是()A . 46,45,56B. 46,45,53C. 47,45,56D. 45,47,534.为了普及环保知识,加强环保意识,某大学随机抽取30 名学生参加环保知识测试,得分(十分制 )以下图,假定得分值的中位数为m e,众数为 m o,均匀值为x ,则 ()A . m e=m o= x.m e= m o< xC. m e< m o< x.m o< m e< x5.若一个样本容量为8 的样本的均匀数为5,方差为 2.现样本中又加入一个新数据5,此时样本容量为9,均匀数为 x ,方差为 s2,则()A. x = 5,s2<2B. x = 5, s2>2C. x >5 , s2<2D. x >5, s2>26. (2013 湖·北 )某学员在一次射击测试中射靶10 次,命中环数以下:7,8,7,9,5,4,9,10,7,4.则: (1) 均匀命中环数为 ________;(2)命中环数的标准差为 ________.7. (2012 山·东 )如图是依据部分城市某年 6 月份的均匀气温(单位:℃ )数据获取的样本频次散布直方图,此中均匀气温标准文档的范围是 [20.5,26.5] ,样本数据的分组为[20.5,21.5) , [21.5 , 22.5) , [22.5,23.5) , [23.5,24.5) , [24.5,25.5) , [25.5 ,26.5] .已知样本中均匀气温低于22.5 ℃的城市个数为11,则样本中均匀气温不低于25.5 ℃的城市个数为________.8.将容量为 n 的样本中的数据分红 6 组,绘制频次散布直方图,若第一组至第六组数据的频次之比为2∶ 3∶ 4∶ 6∶4∶ 1,且前三组数据的频数之和等于27,则 n=________.9. (2012 ·徽安 )若某产品的直径长与标准值的差的绝对值不超出 1 mm 时,则视为合格品,不然视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取 5 000 件进行检测,结果发现有50 件不合格品.计算这 50 件不合格品的直径长与标准值的差(单位: mm),将所得数据分组,获取以下频次散布表:分组频数频次[- 3,- 2)0.10[- 2,- 1)8(1,2]0.50(2,3]10(3,4]共计50 1.00(1)将上边表格中缺乏的数据填在相应地点;(2)预计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3) 现对该厂这类产品的某个批次进行检查,结果发现有20 件不合格品.据此估量这批产品中的合格品的件数.10.(2012 ·东广 )某校 100 名学生期中考试语文成绩的频次散布直方图以下图,此中成绩分组区间是[50,60) ,[60,70) ,[70,80) , [80,90) , [90,100] .(1)求图中 a 的值;(2)依据频次散布直方图,预计这100 名学生语文成绩的均匀分;(3)若这 100 名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比方下表所示,求数学成绩在[50,90) 以外的人数 .分数段[50,60)[60,70)[70,80)[80,90)x∶ y1∶ 12∶13∶ 44∶5准文档C1. (2013 ·川四 ) 某学校随机抽取20 个班,各班中有网上物的人数,所得数据的茎叶如所示,以距5 将数据分成[0,5) , [5,10) ,⋯, [30,35) , [35,40] ,所作的率散布直方是()2.了认识某校高三学生的力状况,随机地抽了校100 名高三学生的力状况,获取率散布直方,如所示.因为不慎将部分数据失,但知道前 4 的数成等比数列,后 6 的数成等差数列,最大率a,力在 4.6 到 5.0 之的学生数b, a, b 的分()A . 0.27,78B. 0.27,83C. 2.7,78D. 2.7,833.某班有 48 名学生,在一次考中出均匀分70 分,方差75,以后有 2 名同学的分数登了,甲得80 分,却了50 分,乙得70 分,却了 100 分,改正后均匀分和方差分是()A . 70,75B. 70,50C. 75,1.04D. 62,2.354.在本的率散布直方中,共有 4 个小方形, 4 个小方形的面由小到大组成等比数列{ a n} ,已知 a2=2a1,且本容量300,小方形面最大的一的数________.5.从某小学随机抽取100 名学生,将他的身高(位:厘米 )数据制成率散布直方( 如 ).由中数据可知a = ____________. 若要从身高在 [120,130) , [130,140) ,[140,150] 三内的学生中,用分抽的方法取18 人参标准文档加一项活动,则从身高在[140,150] 内的学生中选用的人数应为________.6.某高校在2013 年的自主招生考试成绩中随机抽取100 名学生的笔试成绩,按成绩分组,获取的频次散布表以下表所示 .组号分组频数频次第 1 组[160,165)50.050第 2 组[165,170)①0.350第 3 组[170,175)30②第 4 组[175,180)200.200第 5 组[180,185]100.100共计100 1.00(1)请先求出频次散布表中①、②地点相应数据,再达成以下频次散布直方图;(2) 为了能选拔出最优异的学生,高校决定在笔试成绩高的第3、 4、 5 组顶用分层抽样的方法抽取 6 名学生进入第二轮面试,则第3、4、 5 组每组各抽取多少名学生进入第二轮面试?(3) 在 (2) 的前提下,学校决定在 6 名学生中随机抽取 2 名学生接受 A 考官进行面试,求:第 4 组起码有一名学生被考官 A 面试的概率.§ 11.3变量间的有关关系、统计事例A 组1.判断下边结论能否正确 (请在括号中打“√”或“×”)(1)有关关系与函数关系都是一种确立性的关系,也是一种因果关系.()(2)“名师出高徒”能够解说为教师的教课水平与学生的水平成正有关关系.()(3)只有两个变量有有关关系,所获取的回归模型才有展望价值.()^(4)某同学研究卖出的热饮杯数y 与气温 x(℃ )之间的关系,得回归方程y=- 2.352x+ 147.767,则气温为 2℃时,一定可卖出 143 杯热饮.()(5)事件 X, Y 关系越亲密,则由观察数据计算获取的2()χ的值越大.准文档(6) 由独立性可知,有99%的掌握物理成秀与数学成有关,某人数学成秀,他有99%的可能物理秀.()2.下边哪些量是有关关系()A .出租与行的里程B .房子面与房子价钱C.身高与体重D .的大小与量3.了价某个目的改革成效,在改革前后分从居民点抽取了100 位居民行,算2χ≈ 0.99,根据一数据剖析,以下法正确的选项是()A .有 99%的人目秀B .有 99%的人目能否秀与改革有关系C.有 99%的掌握目能否秀与改革有关系D.没有原因目能否秀与改革有关系4.在一打鼾与患心病的中,共了21 671 人,算χ= 27.63,依据一数据剖析,我有原因打鼾与患心病是 ________的(填“有关”或“没关”).5.某医研究所了某种血清防感冒的作用,把500 名使用血清的人与此外500 名未用血清的人一年中的感冒作比,提出假H0:“ 种血清不可以起到防感冒的作用”,利用22×2 列表算得χ≈3.918,已知2P(χ≥ 3.841)≈ 0.05.此,四名同学作出了以下的判断:p:有 95%的掌握“ 种血清能起到防感冒的作用”;q:若某人未使用血清,那么他在一年中有95%的可能性得感冒;r :种血清防感冒的有效率95%;s:种血清防感冒的有效率5%.以下中,正确的序号是________.①p∧﹁ q;②﹁ p∧ q;③ (﹁ p∧﹁ q) ∧(r ∨s) ;④ (p∨﹁ r )∧ (﹁ q∨ s).B^1.某地区了 2~ 9 的少儿的身高,由此成立的身高y(cm) 与年 x( )的回模型 y= 8.25x+ 60.13,以下表达正确的选项是()A .地区一个 10 少儿的身高 142.63 cmB .地区 2~ 9 的少儿每年身高增添8.25 cmC.地区 9 少儿的均匀身高是 134.38 cmD .利用个模型能够正确地算地区每个2~ 9 少儿的身高2.(x1, y1), (x2, y2),⋯, (x n, y n)是量 x 和 y 的 n 个本点,直 l 是由些本点通最小二乘法获取的性回直(如 ),以下中正确的选项是()A .直 l 点 ( x , y )准文档B . x 和 y 的有关系数直l 的斜率C. x 和 y 的有关系数在 0 到 1 之D .当 n 偶数,散布在l 两的本点的个数必定同样3. (2012 湖·南 )某大学的女生体重y(位: kg) 与身高 x(位: cm)拥有性有关关系,依据一本数据( x i, y i)( i^= 1,2,⋯, n),用最小二乘法成立的回方程y= 0.85x- 85.71,以下中不正确的是...()A . y 与 x 拥有正的性有关关系B .回直本点的中心( x , y )C.若大学某女生身高增添 1 cm,其体重增添0.85 kgD .若大学某女生身高170 cm,可判定其体重必58.79 kg4.通随机110 名性不一样的大学生能否好某运,获取以下的列表:男女好402060不好20305060501102110× 40× 30- 20× 20 2算可得χ=≈ 7.8.60× 50× 60× 50附表:20.0500.010P(χ≥ k)k 3.841 6.635参照附表,获取的正确是()A .有 99%以上的掌握“ 好运与性有关”B .有 99%以上的掌握“ 好运与性没关”C.在犯的概率不超0.1%的前提下,“ 好运与性有关”D .在犯的概率不超0.1%的前提下,“ 好运与性没关”5. (2013 · 模大)某品的广告用x 与售 y 的数据以下表:广告用 x(万元 )4235售 y(万元 )49263954^^^^依据上表可得回直方程y =b x+ a 中的 b9.4,据此模型广告用 6 万元售()A . 63.6 万元B. 65.5 万元C. 67.7 万元D. 72.0 万元6.以下四个命,此中正确的序号是________.①从匀速的品生流水上,每20 分从中抽取一件品行某指,的抽是分抽;②两个随机量有关性越,有关系数的越靠近于 1 ;标准文档^^③在回归直线方程 y = 0.2x + 12 中,当解说变量x 每增添一个单位时,预告变量y 均匀增添 0.2 个单位;22有关系”的掌握程度越大.④对分类变量 X 与 Y ,它们的随机变量 χ来说, χ越小,“ X 与 Y^7. 已知回归方程 y = 4.4x +838.19 ,则可预计 x 与 y 的增添速度之比约为 ________.8. 某数学老师身高 176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和 182 cm. 因儿子的身高与父亲的身高有关,该老师用线性回归剖析的方法展望他孙子的身高为________ cm.9. 某公司有两个分厂生产某种部件,按规定内径尺寸(单位: mm)的值落在 [29.94,30.06) 的部件为优良品.从两个分厂生产的部件中各抽出了 500 件,量其内径尺寸,得结果以下表:甲厂:乙厂:(1) 试分别预计两个分厂生产的部件的优良品率;(2) 由以上统计数据填下边 2× 2 列联表,问能否有 99%的掌握以为“两个分厂生产的部件的质量有差别”?甲厂乙厂共计优良品非优良品共计10.(2013 重·庆 )从某居民区随机抽取 10 个家庭,获取第i 个家庭的月收入 x i (单位:千元 )与月积蓄 y i (单位:千元 )的数10101010x i 2= 720.据资料,算得x i = 80,y i = 20, x i y i = 184,i =1i =1i =1i =1 ^^^^(1) 求家庭的月积蓄 y 对月收入 x 的回归直线方程 y = b x + a ; (2) 判断变量 x 与 y 之间是正有关仍是负有关;(3) 若该居民区某家庭月收入为7 千元,展望该家庭的月积蓄.nx i y i -n x y^^^^i =1^^附:回归直线方程 y = b x + a 中, b =, a = y -b x ,此中 x , y 为样本均匀值.nx 2x i 2- ni =1C 组标准文档1.以下说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;^②设有一个回归方程y = 3- 5x,变量 x 增添一个单位时,y 均匀增添 5 个单位;^^^③回归方程 y= b x+ a 必过 ( x , y );2④有一个 2×2 列联表中,由计算得χ=13.079,则有 99%的掌握确认这两个变量间有关系.此中错误的个数是()A . 0B. 1C. 2D. 32. (2013 福·建 )已知 x 与 y 之间的几组数据以下表:x123456y021334^^^假定依据上表数据所得线性回归直线方程y = b x+ a,若某同学依据上表中的前两组数据(1,0)和 (2,2) 求得的直线方程为 y=b′ x+ a′,则以下结论正确的选项是()^^^^A. b >b′, a >a′B.b >b′, a <a′^^^^C.b <b′, a >a′D.b <b′, a <a′3.有甲、乙两个班级进行数学考试,依据大于等于85 分为优异, 85 分以下非优异统计成绩,获取以下所示的列联表:优异非优异总计甲班10b乙班c30共计2已知在所有105 人中随机抽取 1人,成绩优异的概率为7,则以下说法正确的选项是 ()A .列联表中 c 的值为 30, b 的值为 35B .列联表中 c 的值为 15,b 的值为 50C.依据列联表中的数据,若按95%的靠谱性要求,能以为“成绩与班级有关系”D .依据列联表中的数据,若按95%的靠谱性要求,不可以以为“成绩与班级有关系”4.某车间为了规定工时定额,需要确立加工部件所花销的时间,为此进行了 5 次试验.依据采集到的数据(以下表 ),^由最小二乘法求得回归方程y= 0.67x+ 54.9.部件数 x(个 )1020304050加工时间 y(min)62758189现发现表中有一个数据看不清,请你推测出该数据的值为________.5.为认识某班学生喜欢打篮球能否与性别有关,对该班50 名学生进行了问卷检查,获取了以下的2× 2 列联表:喜欢打篮球不喜欢打篮球总计男生20525女生101525适用文案标准文档总计 3020 50则在出错误的概率不超出________的前提下以为喜欢打篮球与性别有关 (请用百分数表示 ).2≥k0)0.10 0.05 0.025 0.010 0.005 0.001 P(χk 02.7063.841 5.024 6.635 7.879 10.8286. (2013 ·建福 )某工厂有 25 周岁以上 (含 25 周岁 )工人 300 名, 25 周岁以下工人200 名.为研究工人的日均匀生产量能否与年纪有关,现采纳分层抽样的方法,从中抽取了100 名工人,先统计了他们某月的日均匀生产件数,而后按工人年纪在“ 25 周岁以上 (含 25 周岁 )”和“ 25 周岁以下”分为两组, 再将两组工人的日均匀生产件数分红5 组:[50,60) , [60,70) , [70,80) , [80,90) , [90,100] 分别加以统计,获取以下图的频次散布直方图.(1) 从样本中日均匀生产件数不足 60 件的工人中随机抽取 2 人,求起码抽到一名“ 25 周岁以下组”工人的概率; (2) 规定日均匀生产件数许多于80 件者为“生产好手”,请你依据已知条件达成2× 2 列联表,并判断能否有 90%的掌握以为“生产好手与工人所在的年纪组有关”?22 n n 11n 22- n 12n 21附: χ=n 1+ n 2+n +1 n + 220.100 0.050 0.010 0.001P(χ≥ k)k2.7063.8416.63510.828适用文案。

(好题)高中数学必修三第一章《统计》测试题(答案解析)(1)

(好题)高中数学必修三第一章《统计》测试题(答案解析)(1)

一、选择题1.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[]10,14,[]15,19,[]20,24,[]25,29,[]30,34的爱看比例分别为10%,18%,20%,30%,%t .现用这5个年龄段的中间值x 代表年龄段,如12代表[]10,14,17代表[]15,19,根据前四个数据求得x 关于爱看比例y 的线性回归方程为( 4.68)%y kx =-,由此可推测t 的值为( )A .33B .35C .37D .392.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高3.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277; ②5,9,100,107,121,180,195,221,265,299; ③11,41,71,101,131,161,191,221,251,281; ④31,61,91,121,151,181,211,241,271,299. 关于上述样本的下列结论中,正确的是( ) A .②④都不能为分层抽样 B .①③都可能为分层抽样 C .①④都可能为系统抽样D .②③都不能为系统抽样4.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x3456y 2.5 t 4 4.5A .3B .3.15C .3.5D .4.55.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006 B .041C .176D .1967.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元8.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16011.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.212.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表:根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知数据1x ,2x ,…,10x 的方差为1,且()()()222123222x x x -+-+-()2102170x ++-=,则数据1x ,2x ,…,10x 的平均数是________.14.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为__________.15.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.16.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.17.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.18.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______. 19.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x34 5 6y 23.555.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 20.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.三、解答题21.2020年1月末,新冠疫情爆发,经过全国人民的努力,2月中旬,疫情得到了初步的控制,湖北省以外地区的每日新增确诊人数开始减少,某同学针对这个问题,选取他在统计学中学到的一元线性回归模型,作了数学探究:他于2月17日统计了2月7日至16日这十天湖北省以外地区的每日新增确诊人数,表格如下: 日期 2.7 2.8 2.9 2.10 2.11 2.12 2.132.14 2.15 2.16 代号x 123 45 6 78910新增确诊人数y558 509444381 377 312 267221166 115y x y x 计算出: 5.5,335x y ==,()()1013955iii x x y y =--=-∑,()210182.5ii x x =-=∑(1)请你帮这位同学计算出y 与x 的线性回归方程(精确到0.1),然后根据这个方程估计湖北省以外地区新增确诊人数为零时的大概日期;附:回归方程y bx a =+中斜率和截距的最小二乘法估计公式分别为:()()()1012101iii ii x x y y b x x ==--=-∑∑,a y bx =-(2)实际上2月17日至2月22日的新增确诊人数如下: 日期 2.17 2.18 2.19 2.20 2.21 2.22新增确诊人数7933 45 2583418出评价.22.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.为培养学生在高中阶段的数学能力,某校将举行数学建模竞赛.已知该竞赛共有60名学生参加,他们成绩的频率分布直方图如图所示.(1)估计这60名参赛学生成绩的中位数;(2)为了对数据进行分析,将60分以下的成绩定为不合格.60分以上(含60分)的成绩定为合格,某评估专家决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会,记ξ为抽取的4人中,成绩不合格的人数,求ξ的分布列与数学期望;(3)已知这60名学生的数学建模竞赛成绩Z 服从正态分布()2,Nμσ,其中μ可用样本平均数近似代替,2σ可用样本方差近似代替(同一组数据用该区间的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,估计此次竞赛受到奖励的人数(结果根据四舍五人保留整数).参考数据:()0.6827P Z μσμσ-<≤+≈,()220.9545P Z μσμσ-<≤+≈,()330.9973P Z μσμσ-<≤+≈.24.2019年2月13日《西安市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数;(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i )你认为9个名额应该怎么分配?并说明理由;(ii )座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的22⨯列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?(精确到0.1)阅读时间不足8.5小时 阅读时间超过8.5小时 理工类专业 4060非理工类专业附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:20()P K k ≥0.1500.100 0.050 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82825. 2.5PM 是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM 的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM 浓度的数据如下表:时间周一 周二 周三 周四 周五 车流量x (万辆)50 51 54 57 58 2.5PM 的浓度y (微克/立方米) 3940424445(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标; (2)用最小二乘法求出y 关于x 的线性回归方程y bx a =+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM 的浓度是多少?(参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-)26.某校为“全国数学联赛”选拔人才,分初赛和复赛两个阶段进行,规定:分数不小于本次考试成绩中位数的具有复赛资格,该校有900名学生参加了初赛,所有学生的成绩均在区间(]30,150内,其频率分布直方图如图.(1)根据频率分布直方图,估计获得复赛资格应划定的最低分数线; (2)根据频率分布直方图,估计本次初赛的平均成绩.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】前4个数据对应的19.5x = ,0.195y = (把百分数转化为小数),而0( 4.68)0y kx ∧=-=0.0468bx -,0.19519.50.0468b ∧∴=⨯-,0.0124b ∧∴=,0(1.24 4.68)0y x ∧∴=- ,当3034322x +==, 1.2432 4.6835t =⨯-=.2.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.3.B解析:B 【分析】根据系统抽样和分层抽样的定义分别进行判断即可. 【详解】若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个; 若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.综上所述,B 选项正确. 故选:B. 【点睛】本题主要考查系统抽样和分层抽样,掌握系统抽样和分层抽样的定义是解题的关键,属于基础题.(1)系统抽样适用于总体容量较大的情况.将总体平均分成若干部分,按事先确定的规则在各部分中抽取,在起始部分抽样时采用简单随机抽样;(2)分层抽样适用于已知总体是由差异明显的几部分组成的.将总体分成互不交叉的层,然后分层进行抽取,各层抽样时采用简单随机抽样或系统抽样.4.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.5.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.6.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.7.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.8.B解析:B试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a , ∴ˆa =9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程9.D解析:D 【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差10.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题11.C解析:C 【分析】首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可.由题意可得:12345305x x x x x x ++++==,线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==. 本题选择C 选项. 【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.或6【分析】由数据…的方差为1且把所给的式子进行整理两式相减得到关于数据的平均数的一元二次方程解方程即可【详解】数据…的方差为1①②将②-①得解得或故答案为:或6【点睛】本题主要考查一组数据的平均数解析:2-或6. 【分析】由数据1x ,2x ,…,10x 的方差为1,且()()()()2222123102222170x x x x -+-+-++-=,把所给的式子进行整理,两式相减,得到关于数据的平均数的一元二次方程,解方程即可. 【详解】数据1x ,2x ,…,10x 的方差为1,()()()()22221231010x x x x x x x x∴-+-+-++-=,()()22221210121010210x x xx x x x x ∴++++-+++=,()222212101010x x x x∴+++-=,①()()()()2222123102222170x x x x -+-+-++-=, ()()22212101210440170x x x x x x ∴+++-++++=,()22212104040170x x x x ∴+++-+=,②将②-①得24120x x --=,解得2x =-,或6x =, 故答案为:2-或6. 【点睛】本题主要考查一组数据的平均数的求法,解题时要熟练掌握方差的计算公式的灵活运用,属于中档题.14.8【分析】先设五个班的人数分别为样本平均数为5又因样本方差为4则代入大于且不相等的整数可得的值依次为24568即可得最大值【详解】解:设五个班的人数分别为则则所以的值依次为24568即有最大值为8故解析:8 【分析】先设五个班的人数分别为1a ,2a ,3a ,4a ,5a ,样本平均数为5,1234525a a a a a ++++=,又因样本方差为4,则()()()()()22222123455555520a a a a a -+-+-+-+-=,代入大于0且不相等的整数,可得1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8,即可得最大值. 【详解】解:设五个班的人数分别为1a ,2a ,3a ,4a ,5a , 则()12345155a a a a a ++++=, 15()()()()()2222212345555554a a a a a ⎡⎤-+-+-+-+-=⎣⎦, 则1234525a a a a a ++++=,()()()()()22222123455555520a a a a a -+-+-+-+-=,所以1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8, 即有最大值为8. 故答案为: 8【点睛】本题考查利用平均数公式和方差公式求样本数据中的最大值,是基础题.合理应用公式是关键.15.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题 解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b+的最小值. 【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b , 且平均数为9,故18,712,118a ba b a b ++=≤≤≤=, 49149()()18a b a b a b +=++ 149125(13)(13181818b a a b =++≥+= 当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518.故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题.16.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为s = 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题.17.【分析】依题意可得解之即得解【详解】依题意可得解得故答案为1320【点睛】本题主要考查分层抽样意在考查学生对这些知识的理解掌握水平和分析推理能力 解析:1320【分析】依题意可得6512111110n⎛⎫-⨯= ⎪⎝⎭,解之即得解. 【详解】 依题意可得6512111110n⎛⎫-⨯=⎪⎝⎭,解得1320n =. 故答案为1320 【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.18.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归解析:16-【解析】 【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值 【详解】 由已知,()12101210330x x x y y y +++=+++=()12101310x x x x ∴=⨯+++= ()12101110y y y y =⨯+++=代入回归直线方程可得:3132b =+解得16b =-故答案为16- 【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果19.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和 解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.20.240【解析】该校2000名男生中体重在的人数为解析:240 【解析】该校2000名男生中体重在()7078kg ~的人数为2000(0.020.01)4240⨯+⨯=.三、解答题21.(1)47.9598.7y x =-+,2月19日时新增确诊人数为零;(2)该数学探究估计的数据与实际的数据不吻合. 【分析】(1)根据数据套公式求出b a 、,写出回归方程,并估计新增确诊人数为零时的大概日期; (2)在(1)中求出的回归方程为线性的,再分析2月17日至2月22日的新增确诊人数不是线性的,所以选择模型不够理想. 【详解】解:()1设回归方程为y bx a =+, ∵ 5.5,335x y ==,()()1013955i ii x x y y =--=-∑,()210182.5ii x x =-=∑则()()()1012101395547.93982.5iii ii x x y y b x x ==---==≈--∑∑ 所以598.7a y bx =-≈所以回归方程为47.9598.7y x =-+估计在13x =即2月19日时新增确诊人数为零.()2该数学探究估计的数据与实际的数据不吻合.该同学首先通过线性相关系数进行线性相关判断,得到y 与x 有99%的把握线性相关,这只是说明选取的数据是线性的,但从整体看,不是线性的;出现这个结果的原因可能是传染病初发时的突发因素过多、湖北省外的人口众多、以及传染病机制复杂等因素决定的,说明对于传染病病例的变化趋势,选择线性模型可能不够理想. 【点睛】(1)求线性回归方程的步骤:①求出,x y ;②套公式求出b a 、;③写出回归方程y bx a =+;④利用回归方程y bx a =+进行预报;(2)可以建立多个函数模型时,要对每个模型进行分析比较,选择最优化模型. 22.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 23.(1)中位数为65;(2)分布列见解析;期望为5635;(3)50. 【分析】(1)由图中的数据可判断中位数在60分到80分之间,若设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,从而可求得中位数;(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为6人,不合格的人数为4人,则ξ的可能取值为0,1,2,3,4,求出各自的概率,从而可得ξ的分布列与数学期望;(3)由已知求出=64=18μσ,,从而可得()()6418641846820.6827P Z P Z -<≤+=<≤≈,再利用正态分布的对称性可求得结果 【详解】(1)设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,解得65x =,所以这60名参赛学生成绩的中位数为65.(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为()0.010.0220106+⨯⨯=,不合格的人数为1064-=.由题意可知ξ的可能取值为0,1,2,3,4.则()464101014C P C ξ===,()13464108121C C P C ξ===,()2246410327C C P C ξ===,()31464103435C C C P ξ===,()4441014210C P C ξ===.所以ξ的分布列为所以ξ的数学期望01234142173521035E ξ=⨯+⨯+⨯+⨯+⨯=. (3)由题意可得,()300.005500.015700.02900.012064μ=⨯+⨯+⨯+⨯⨯=,()()()222230640.150640.370640.4σ=-⨯+-⨯+-⨯()290640.2324+-⨯=,则18σ=,由Z 服从正态分布()2,Nμσ,得()()6418641846820.6827P Z P Z -<≤+=<≤≈,则()()18210.68270.158652P Z >≈-=,()460.68270.158650.84135P Z >≈+=,所以此次竞赛受到奖励的人数为600.8413550⨯≈. 【点睛】此题考查频率分布直方图、分层抽样、离散型随机变量的分布列、正态分布等知识,考查分析问题的能力和计算能力,属于中档题24.(1)9, (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由见解析, (ii )有95%的把握认为学生阅读时间不足与“是否理工类专业”有关. 【分析】(1)取各区间中点值乘以频率再相加即得;(2)(i )两组差异明显,用分层抽样计算.(ii )求出两组的人数,填写列联表,计算2K 可得.【详解】(1)60.0370.180.290.35100.19110.09120.049⨯+⨯+⨯+⨯+⨯+⨯+⨯= (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配 (ii )22⨯列联表为:2K 200(40742660) 4.4 3.84166134100100⨯⨯-⨯=≈>⨯⨯⨯, 所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关. 【点睛】本题考查频率分布直方图,分层抽样,考查独立性检验.属于基础题. 25.(1)()54,42(2)0.72 3.12y x =+(3)75.12微克/立方米 【分析】(1)求出,x y 从而得到样本点的中心; (2)利用参考公式求出()52150ii x x =-=∑,()()136ni ii x xy y =--=∑,从而得到b ,再将样本中心坐标代入求得a ,从而得到回归方程; (3)将100x =代入回方程,求出y 的值,即可得到答案. 【详解】 (1)5051545758394042444554,4255x y ++++++++====,所以样本中心坐标为()54,42. (2)因为()52116991650ii x x =-=+++=∑,()()1(4)(3)(3)(2)324336niii x x y y =--=-⋅-+-⋅-+⋅+⋅=∑,所以360.7250b ==, 3.12a =, 线性回归方程为0.72 3.12y x =+.(3)0.72100 3.1275.12y =⨯+=(微克/立方米) 此时 2.5PM 的浓度是75.12微克/立方米. 【点睛】本题考查回归直线方程的最小二乘法求解及回归方程的应用,考查数据处理能力,求解时注意运算的准确性. 26.(1)100分;(2)97. 【分析】(1)根据题意,由频率分布直方图求出[]30,90的频率为0.35,[]90,110的频率为0.3,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,进而求出中位数,即可估计出本次考试复赛资格最低分数线;(2)利用频率分布直方图计算出各组的频率,即可估计本次初赛的平均成绩. 【详解】解:(1)由题意知[]30,90的频率为:()200.00250.00750.00750.35⨯++=, 由题意知[]90,110的频率为: 200.01500.3⨯=, 由0.30.350.650.5+=>知:最低分数线在(]90,110之间, 设最低分数线为x ,且(]90,110x ∈. 由()0.35900.0150.5x +-⨯=得:100x =, 故本次考试复赛资格最低分数线应划为100分.(2)由题意可知:初赛分数在区间(]30,50,(]50,70,(]70,90,(]90,110,(]110,130,(]130,150的频率分别为:0.05,0.15,0.15,0.3,0.25,0.1, 所以本次初赛的平均分为:400.05600.15800.151000.31200.251400.197⨯+⨯+⨯+⨯+⨯+⨯=.【点睛】本题考查频率分布直方图的频率、中位数、平均数的求法,考查解题分析和计算能力.。

(完整word版)必修三统计练习题及解答

(完整word版)必修三统计练习题及解答

、选择题1某校有40个班,每班有50人,每班选派3人参加"学代会”,在这个问题中样本容量是 (). 2 .要从已编号(1 — 50)的50枚最新研制的某型号导弹中随机抽取 每部分选取的号码间隔一样的系统抽样方法确定所选取的 5枚导弹的编号可能是(). C. 1 , 2, 3, 4, 5 D. 2, 4, 8, 16, 323•某单位有老年人 27人,中年人54人,青年人81人,为了调查他们身体状况的某项指 标,需从他们中抽取一个容量为 36的样本,适合抽取样本的方法是().A.抽签法B.系统抽样C.随机数表法 D .分层抽样4•为了解某年级女生的身高情况,从中抽出20名进行测量,结果如下:(单位:cm ) 149 159 142 160 156 163 145 150148 151156144 148149 153143 168168 152 155 在列样本频率分布表的过程中,如果设组距为 4 cm ,那么组数为(). A. 4B. 5C. 6D. 75 •右图是由容量为100的样本得到的频率分布直方图. 其中前4组的频率成等比数列,后6组的频数成等差数列,设最行业名称计算机 机械 营销 物流 贸易 应聘人数215 830200 250154 67674 57065 280行业名称计算机 营销 机械 建筑 化工招聘人数124 620 102 935 89 115 76 51670 436若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况, 则根据表中的数据,就业形势一定是(). A.计算机行业好于化工行业 B.建筑行业好于物流行业 C.机械行业最紧张D.营销行业比贸易行业紧张&从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是 1.5 ,第二章统计A. 40B. 50C. 120D. 150 5枚来进行发射试验,用 A. 5, 10, 15, 20, 25 B. 3, 13, 23, 33, 43 10 [(x1 — 20)2 + (x2 — 20)2+…+ (x10 — 20)2]中,数字10和20分别表示(). A.数据的个数和方差 B.平均数和数据的个数 C.数据的个数和平均数D.数据组的方差和平均数7•某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:I. 6 , 1.4 , 1.6 , 1.3 , 1.4 , 1.2 , 1.7 , 1.8(单位:千克).依此估计这240尾鱼的总质量大约是().A. 300克B. 360千克C. 36千克D. 30千克9. 为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为11,12,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是().A. 直线11和12 一定有公共点(s,t)B. 直线l1和l2相交,但交点不-C. 必有直线l1 // l2D. 直线l1和l2必定重合10. 工人工资(元)依相应产值(千元)变化的回归方程为? = 50 + 80x,下列判断正确的是().A. 产值为1 000元时,工资为130元B. 产值提高1 000元时,工资提高80元C. 产值提高1 000元时,工资提高130元D. 当工资为250元时,产值为2 000元二、填空题:II. 某工厂生产A , B, C 三种不同型号的产品,产品数量之比依次为 2 : 3 : 5 .现用分层抽样方法抽出一个容量为n的样本,样本中A种型号的产品有16件,那么此样本的容量n 12. 若总体中含有1 650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除___________ 个个体,编号后应均分为___________ 段,每段有______ 个个体.13. 管理人员从一池塘内捞出30条鱼,做上标记后放回池塘.10天后,又从池塘内捞出50条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内共有______________ 条鱼.14. 已知x, y之间的一组数据:y与x之间的线性回归方程? = bx+ a必过定点 ____________ .15.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一数学分数(x)和初二16. 一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是17•某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?18•某单位有118名员工,为了完成本月的生产任务,现要从中随机抽取16人加班•请用系统抽样法选出加班的人员.19. 写出下列各题的抽样过程:(1 )请从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本.(2 )某车间有189名职工,现在要按1 : 21的比例选派质量检查员,采用系统抽样的方法进行.(3) —个电视台在因特网上就观众对某一节目喜爱的程度进行调查,被调查的总人数为12 000人,其中持各种态度的人数如下:很喜爱喜爱一般不喜爱2435 4 567 3 926 1 072打算从中抽取60人进行详细调查,如何抽取?20. 有一种鱼的身体吸收水银,水银的含量超过1.00 ppm(即百万分之一)时就会对人体产生危害.在30条鱼的样本中发现的水银含量是:0.07 0.24 0.95 0.98 1.02 0.98 1.37 1.40 0.39 1.021.44 1.58 0.54 1.08 0.61 0.72 1.20 1.14 1.62 1.681.85 1.20 0.81 0.82 0.84 1.29 1.262.10 0.91 1.31(1) 用前两位数作为茎,做出样本数据的茎叶图;(2) 描述一下水银含量的分布特点;(3) 从实际情况看,许多鱼的水银含量超标在于有些鱼在出售之前没有被检查过•那么,这种鱼的水银含量的平均水平都比 1.00 ppm大吗?(4) 求出上述样本数据的均值和标准差;(5) 有多少条鱼的水银含量在均值减加两倍标准差的范围内?第二章统计参考答案一、选择题1. C解析:样本容量等于40X 3 = 1 20.2. B解析:根据系统抽样的规则,1到10 一段,11到20 一段,如此类推,每段10个号码,那么每一段上都应该有号码.3. D解析:总体是由差异明显的几部分组成的.4. D解析:由于组距为4 cm,故可分组为142〜146,146〜150, 150- 154,154〜158, 158〜162 , 162〜166, 166〜170.5. A解析:由题意共有100个人.前4组频率成等比数列,由图知:第一组频率为0.01 ;第二组频率为0.03 ;所以a= 0.27 .前 3 组有100X (0.01 + 0.03 + 0.09) = 13 人,后 6 组共87 人,6组人数成等差数列,所以首项为27, s6 = 87,得d =- 5, s4 = 78,即b= 78.6. C1 n々(x- x)2解析:对照公式s2= n y 即可知道.7. B解析:从表中可以看出,计算机行业应聘人数与招聘人数都比较多,但录用率约占58%.化工行业招聘名额70 436虽少,但应聘它的人数少于应聘贸易行业的人数(65 280),录用率大于58%故A不正确.对于建筑行业,应聘人数少于招聘人数,显然好于物流行业.机械行业录用率约46%但物流、贸易招聘人数未知,无法比较得出机械行业最紧张.营销行业招聘人数与应聘人数的比约为 1 : 1.5,但贸易行业招聘数不详,无法比较.& B解析:从草鱼240尾,中任选9尾,这9尾鱼具有代表性,由此可由样本估计总体的情况. 9尾鱼中每尾鱼的平均质量为x= 9(1.5 + 1.6 + 1.4 + 1.6 + 1.3 + 1.4 + 1.2 + 1.7 + 1.8) = 1.5(千克),240 X 1.5 = 360(千克).9. A解析:线性回归直线方程为? = a+ bx,而a= y _bx,即a = t —bs, t = a+ bs .•••(s , t)在回归直线上,即直线l1和l2必有公共点(s , t).10. B解析:回归直线斜率为80,所以x每增加1, ?增加80,即劳动生产率提高1千元时,工资提咼80兀.二、填空题:11. 答案:80.16解析:n= 2 x (2 + 3+ 5)= 80.12. 答案:5; 35; 47.解析:1 650除以35商47余5,•••剔除5个个体.分为35段,每段47个个体.13 .答案:750 .50解析:30 X 2 = 750 (条).14. 答案:(1.167 5 , 2.392 5).解析:必过四组数据的平均数,即(1.167 5 , 2.392 5).15. 答案: y= 1.218x - 14.191 .解析:代入求a, b值的公式,解得? = 1.218x - 14.191 .16. 答案: * = 0.118 1 + 0.003 585x .“ 10 10_ 1 _ 2X =—无x =762,瓦(X i -X) =1 297 860解析:10 i 1 i 1,10y =2.85,二(X i -X)(y i「y) =4 653i 1三、解答题:17. [解析]简单随机抽样一般采用两种方法:抽签法和随机数表法.解法1:(抽签法)将100件轴编号为1, 2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00, 01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个随机数为68, 34, 30, 13, 70, 55, 74, 77, 40, 44,这10个号即所要抽取的样本号.18. 解析:(1)对这118名员工进行编号;118⑵计算间隔k = 16 = 7.375 ,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样.例如我们随机剔除了3, 46, 59, 57 , 112, 93这6名员工,然后再对剩余的112位员工进行编号,计算间隔k = 7;(3)在1〜7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12 ,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.19. 解析:(1)①将总体的500个分数从001开始编号,一直到500号;②从随机数表第1页第1行第2至第4列的347号开始使用该表;③抄录入样号码如下:347 437 386 469 011 410 145 073 245 276 329 050 176 099 061030 227 482 378 096 164 001 068 047 025 212 016 105 443 212④按以上编号从总体中将相应的分数提取出来组成样本,抽样完毕.(2)采取系统抽样.189-21= 9,所以将189人分成9组,每组21人,在每一组中随机抽取1人,这9人组成样本. (3)采取分层抽样.总人数为12 000 人,12 000 - 60 = 200,2 435 4 567200 = 12 …35(人),200 = 22 …167(人),3 926 1 072200 = 19…126(人),200 = 5…72(人).所以从很喜爱的人中剔除35人,再抽取12人;从喜爱的人中剔除167人,再抽取22人;从一般喜爱的人中剔除126人,再抽取19人;从不喜爱的人中剔除72人,再抽取5人. 20. 解析:(1)茎叶图为:⑵汞含量分布偏向于大于 1.00 ppm的方向,即多数鱼的汞含量分布在大于 1.00 ppm的区域.⑶不一定.因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同•即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于 1.00 ppm .⑷样本平均数X疋1.08,样本标准差s~ 0.45 .(5)有28条鱼的汞含量在平均数与两倍标准差的和(差)的范围内.。

(典型题)高中数学必修三第一章《统计》测试(答案解析)

(典型题)高中数学必修三第一章《统计》测试(答案解析)

一、选择题1.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A.2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B.2019年1~4月的业务量同比增长率超过50%,在3月最高C.从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长2.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A.30 B.60C.70 D.803.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.已知x ,y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.137.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .508.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A .消耗1升汽油,乙车最多可行驶5千米B .以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C .甲车以80千米/小时的速度行驶1小时,消耗10升汽油D .某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油 9.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元10.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤ 12.根据如下样本数据 x 3 4 5 6 7 8 y﹣4.0﹣2.50.5﹣0.52.03.0得到的回归方程为y bx a =+,则( ) A .a >0,b <0B .a >0,b >0C .a <0,b <0D .a <0,b >0二、填空题13.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 14.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人.15.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.16.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.17.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 18.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 19.一组样本数据按从小到大的顺序排列为:1-,0,4,x ,y ,14,已知这组数据的平均数与中位数均为5,则其方差为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:(1)根据所给的5组数据,求出关于的线性回归方程ˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推)(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i i x ==∑.24.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格.(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下:用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700i i i x xy y =--=∑,6214126i i x ==∑,61240i i y ==∑,()6218816i i y y=-=∑,8.4≈786≈.25.零部件生产水平是评判一个国家高端装备制造能力的重要标准之一,其中切割加工技术是一项重要技术某精密仪器制造商研发了一种切割设备,用来生产高精度的机械零件,经过长期生产检验,可以认为该设备生产的零件尺寸服从正态分布N (μ,σ2).某机械加工厂购买了该切割设备,在正式投入生产前进行了试生产,从试生产的零件中任意抽取10件作为样本,下面是样本的尺寸x i (i =1,2,3,…,10,单位:mm ):用样本的平均数x 作为μ的估计值,用样本的标准差s 作为σ的估计值.(1)按照技术标准的要求,若样本尺寸均在(μ﹣3σ,μ+3σ)范围内,则认定该设备质量合格,根据数据判断该切割设备的质量是否合格.(2)该机械加工厂将该切割设备投入生产,对生产的零件制定了两种销售方案(假设每种方案对销售量没有影响):方案1:每个零件均按70元定价销售;方案2:若零件的实际尺寸在(99.7,100.3)范围内,则该零件为A 级零件,每个零件定价100元,否则为B 级零件,每个零件定价60元. 哪种销售方案的利润更大?请根据数据计算说明.附:1021ii x =∑≈100601.8,样本方差()22221111n n i i i i s x x x nx n n ==⎛⎫=-=- ⎪⎝⎭∑∑.若X ~N (μ,σ2),则P (μ﹣σ<X <μ+σ)=0.6827,P (μ﹣2σ<X <μ+2σ)=0.9545 26.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniii ii i nni i i i x x y y x y nxybay bx x x x nx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意结合所给的统计图确定选项中的说法是否正确即可. 【详解】对于选项A : 2018年1~4月的业务量,3月最高,2月最低, 差值为439724111986-=,接近2000万件,所以A 是正确的;对于选项B : 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B 是正确的;对于选项C :2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C 是正确的;对于选项D ,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D 错误. 本题选择D 选项. 【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 4.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.5.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.6.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.7.B解析:B分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .8.D解析:D 【详解】解:对于A ,由图象可知当速度大于40km /h 时,乙车的燃油效率大于5km /L , ∴当速度大于40km /h 时,消耗1升汽油,乙车的行驶距离大于5km ,故A 错误; 对于B ,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B 错误; 对于C ,由图象可知当速度为80km /h 时,甲车的燃油效率为10km /L ,即甲车行驶10km 时,耗油1升,故行驶1小时,路程为80km ,燃油为8升,故C 错误; 对于D ,由图象可知当速度小于80km /h 时,丙车的燃油效率大于乙车的燃油效率, ∴用丙车比用乙车更省油,故D 正确 故选D .考点:1、数学建模能力;2、阅读能力及化归思想.9.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1ay bx =-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=,【点睛】本题考查了线性回归方程的求法与应用,属于基础题.10.B解析:B 【解析】 【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】 根据题意可得,,由线性回归方程一定过样本中心点,.故选:B . 【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.11.B解析:B 【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择. 详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y =x d 或y =p +q ln x 较适宜,故选B . 点睛:本题考查散点图以及函数图像,考查识别能力.12.D解析:D 【解析】分析:利用公式求出ˆb,ˆa ,即可得出结论. 详解:样本平均数x =5.5,y =﹣0.25, ∴()()61i i i x x y y =--∑=23,621()i i x x =-∑=17.5,∴ˆb=2317.5=4635>0, ∴ˆa=﹣0.25﹣4635•5.5<0, 故选:D .点睛:求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.14.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.15.【解析】【分析】先求出这个数据的平均数为此时这个数据的方差为由此求出结果【详解】某个数据的平均数为方差为现又加入一个新数据则这个数据的平均数为此时这个数据的方差为故答案为【点睛】本题主要考查了平均数解析:83【解析】 【分析】先求出这9个数据的平均数为5,此时这9个数据的方差为()22183559S ⎡⎤=⨯+-⎣⎦,由此求出结果 【详解】某8个数据的平均数为5,方差为3,现又加入一个新数据5, 则这9个数据的平均数为85559⨯+= ∴此时这9个数据的方差为()2218835593S ⎡⎤=⨯+-=⎣⎦故答案为83【点睛】本题主要考查了平均数和方差的计算公式,属于基础题。

(易错题)高中数学必修三第一章《统计》测试题(包含答案解析)

(易错题)高中数学必修三第一章《统计》测试题(包含答案解析)

一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,15a a>得到一组新3.一组数据的平均数为x,方差为2s,将这组数据的每个数都乘以()0数据,则下列说法正确的是()A.这组新数据的平均数为x B.这组新数据的平均数为a x+C.这组新数据的方差为2as D.这组新数据的标准差为2a s4.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为29,则抽到的32人中,编号200,480的人数为落入区间[]A.7 B.9 C.10 D.125.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是()A.抽样表明,该校有一半学生为阅读霸B .该校只有50名学生不喜欢阅读C .该校只有50名学生喜欢阅读D .抽样表明,该校有50名学生为阅读霸6.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,47.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .508.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10 B .11C .12D .139.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.已知x ,y 的取值如表: x 2 6 7 8y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.为了考察两个变量x和y之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是()A.直线l1和l2有交点(s,t)B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.18二、填空题13.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.14.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为__________.15.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是____________.16.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.17.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.18.已知一组数据为2,3,4,5,6,则这组数据的方差为______.19.一组样本数据按从小到大的顺序排列为:1 ,0,4,x,y,14,已知这组数据的平均数与中位数均为5,则其方差为__________.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iii ni ni x x y y bay bx x x ==--==--∑∑ 22.某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得到数据如下表: 企业abcdefghij满意度x (%) 21 33 24 20 25 21 24 23 25 12 投资额y (万元)79868978767265625944y x (2)约定:投资额y 关于满意度x 的相关系数r 的绝对值在0.7以上(含0.7)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那一所企业,求关闭此企业后投资额y 关于满意度x 的线性回归方程(精确到0.1).参考数据:22.8x =,71y =,1022110248i i x x =-≈∑,643.7,10110406i i i x y x y =-=∑,222851984=,2287116188⨯=.附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆni ii nii x ynx y bxnx==-=-∑∑,ˆˆay bx =-.线性相关系数ni ix y nx yr -=∑.23.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:(1)根据所给的5组数据,求出关于的线性回归方程ˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑24.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑25.某土特产销售总公司为了解其经营状况,调查了其下属各分公司月销售额和利润,得到数据如下表:在统计中发现月销售额x 和月利润额y 具有线性相关关系.(Ⅰ)根据如下的参考公式与参考数据,求月利润y 与月销售额x 之间的线性回归方程; (Ⅱ)若该总公司还有一个分公司“雅果”月销售额为10万元,试求估计它的月利润额是多少?(参考公式:1221ni i i n i i x y nx y b x nx==-⋅=-∑∑,a y b x =-,其中:1112niii x y ==∑,21200)nii x==∑.26.经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y (万元)、年份及其编号t ,有如下统计资料:y 9.5 12.2 14.6 17.4 19.6 m已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y 与年份编号t 呈线性相关关系.(1)求2019年该公司的经营费用;(2)y 关于t 的回归方程为 2.6y t a =+,求a ,并预测2020年所需要支出的经营费用; (3)该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润=销售利润-经营费用).【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58yx =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.C解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 3.D解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s , 则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x x x xx xx xx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axax axax axax axax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.4.C解析:C 【分析】根据系统抽样的定义,可知抽到的号码数可组成一个以301=-n a n 为通项公式的等差数列,令*200301480,≤-≤∈n n N ,解不等式可得结果. 【详解】每组人数=9603230÷=人,即抽到号码数的间隔为30,因为第一组抽到的号码为29,根据系统抽样的定义,抽到的号码数可组成一个等差数列,且*2930(1)301,=+-=-∈n n n n N a ,令200301480≤-≤n ,得2014813030≤≤n ,可得n 的取值可以从7取到16,共10个,故选C . 【点睛】本题主要考查系统抽样的定义及应用,转化为等差数列是解决本题的关键.5.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.6.C解析:C 【解析】分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.7.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果.详解:因为2523.52220.5330333639122,344442x y++++++====,所以1348022,3224ˆb-==-所以19(2)8042y=⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b,写出回归方程,回归直线方程恒过点(,)x y.8.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.A解析:A【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可.【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95,所以中位数为90+91=90.52,故选A.【点睛】本题主要考查了中位数,茎叶图,属于中档题. 10.B解析:B【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标.【详解】根据题意可得,,由线性回归方程一定过样本中心点,.故选:B.【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.11.A解析:A【分析】由题意知,两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,所以两组数据的样本中心点是(s,t),回归直线经过样本的中心点,得到直线l1和l2都过(s,t).【详解】∵两组数据变量x的观测值的平均值都是s,对变量y的观测值的平均值都是t,∴两组数据的样本中心点都是(s,t)∵数据的样本中心点一定在线性回归直线上,∴回归直线l1和l2都过点(s,t)∴两条直线有公共点(s,t)故选A.【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x与Y之间的关系,这条直线过样本中心点.12.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C. 【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.二、填空题13.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4 【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=. 若13x =时,则()()()()2222234577774x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0, 此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=, 则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9, 此时12345,,,,x x x x x 为4,6,7,8,10,符合题意. 故答案为:4 【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题.14.8【分析】先设五个班的人数分别为样本平均数为5又因样本方差为4则代入大于且不相等的整数可得的值依次为24568即可得最大值【详解】解:设五个班的人数分别为则则所以的值依次为24568即有最大值为8故解析:8 【分析】先设五个班的人数分别为1a ,2a ,3a ,4a ,5a ,样本平均数为5,1234525a a a a a ++++=,又因样本方差为4,则()()()()()22222123455555520a a a a a -+-+-+-+-=,代入大于0且不相等的整数,可得1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8,即可得最大值. 【详解】解:设五个班的人数分别为1a ,2a ,3a ,4a ,5a , 则()12345155a a a a a ++++=, 15()()()()()2222212345555554a a a a a ⎡⎤-+-+-+-+-=⎣⎦, 则1234525a a a a a ++++=,()()()()()22222123455555520a a a a a -+-+-+-+-=,所以1a ,2a ,3a ,4a ,5a 的值依次为2,4,5,6,8, 即有最大值为8. 故答案为: 8 【点睛】本题考查利用平均数公式和方差公式求样本数据中的最大值,是基础题.合理应用公式是关键.15.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论16.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.17.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果. 详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.18.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.19.【解析】分析:根据中位数为求出是代入平均数公式可求出从而可得出平均数代入方差公式得到方差详解中位数为这组数据的平均数是可得这组数据的方差是故答案为点睛:本题主要考查平均数与方差属于中档题样本数据的算 解析:743【解析】分析:根据1,0,4,,,14x y -中位数为5,,求出x 是6 ,代入平均数公式,可求出7y =,从而可得出平均数,代入方差公式,得到方差. 详解1,0,4,,7,14x -中位数为45,52x+∴=,6x ∴=,∴这组数据的平均数是10461456y -+++++=,7y =可得这组数据的方差是()17436251148163+++++=,故答案为743. 点睛:本题主要考查平均数与方差,属于中档题.样本数据的算术平均数公式为12n 1(x +x +...+x )x n=.样本方差2222121[()()...()]n s x x x x x x n =-+-++-,标准差222121[()()...()]n s x x x x x x n=-+-++-. 20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(1)171277y =⨯;(2)该小组所得线性回归方程是理想的. 【分析】(1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论. 【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=,故有()()520(1)2513(3)(7)34iii x x y y =--=⨯-+⨯+⨯+-⨯-=∑,()5222222021(3)14ii x x =-=+++-=∑,34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=, 1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的. 【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论. 22.(1)0.63;(2)ˆ0.757.4yx =+. 【分析】(1)代入公式即可得出结果.(2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业.重新计算,代入公式即可求出结果. 【详解】(1)由题意,根据相关系数的公式,可得10104060.63643.7i ix yx yr -=≈≈∑ (2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业. 重新计算得22.810122162499x ⨯-'===,7110446667499y ⨯-'===, 922222192481022.812924118.4i i xx ='-≈+⨯--⨯=∑, 9194061022.87112449247482iii x yx y =''-≈+⨯⨯-⨯-⨯⨯=∑.所以919221982ˆ0.690.7118.49i ii ii x yx y bxx ==''-=≈≈≈'-∑∑, ˆˆ740.692457.4457.4ay bx ''=-≈-⨯=≈. 所以所求线性回归方程为ˆ0.757.4yx =+. 23.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii ii x y x yb xx==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩, 所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题. 24.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程; (2)将15x =代入回归直线方程即可求得结果. 【详解】 (1)1234535x ++++==,5678107.25++++==y51120i ii x y==∑,522222211234555i i x ==++++=∑25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题.25.(1)ˆ0.50.4yx =+(2)5.4万元 【解析】 试题分析:(1)首先由题意求得平均数6, 3.4x y ==,然后利用系数公式计算可得回归方程为0.5.4ˆ0yx =+ .(2)由题意结合(1)中的结论预测可得“雅果”分公司的月利润额是5.4万元. 试题(Ⅰ) 由已知数据计算得:5n =,6, 3.4x y ==1221511256 3.40.5,20056653.40.560.4ni i i n i i x y xy b x x a ==--⨯⨯===-⨯⨯-=-⨯=∑∑∴线性回归方程为0.5.4ˆ0yx =+ (Ⅱ)将x =10代入线性回归方程中得到0.5100.4ˆ 5.4y=⨯+=(万元) ∴估计“雅果”分公司的月利润额是5.4万元26.(1)22.7万元;(2)6.9;25.1万元;(3)254.9万元. 【分析】(1)根据均值定义列式计算;(2)求出t ,代入方程可得a ,令7t =代入可得估计值;(3)由频率分布直方图是三种产品的概率,得三种产品的件数,根据各产品赢利可计算出总赢利,注意减去(2)中估计的经营费用. 【详解】 (1)9.512.214.617.419.6166my +++++==.解得22.7m =,即2019年该公司的经营费用为22.7万元. (2) 3.5t =,16y =,所以 2.6 6.9a y t =-=,取7t =,代入得25.1y =,预测2020年所需要支出的经营费用为25.1万元. (3)由图可得生产优质品的概率是0.1,生产合格品的概率是0.79,生产次品的概率是0.11,则预测该公司2020年的总利润为1.50.15000.70.79500 1.30.1150025.1254.9⨯⨯+⨯⨯-⨯⨯-=(万元). 【点睛】本题考查线性回归方程及其应用,考查频率分布直方图及其期望,考查学生的数据处理能力,运算求解能力,属于中档题.。

(压轴题)高中数学必修三第一章《统计》测试题(包含答案解析)(3)

(压轴题)高中数学必修三第一章《统计》测试题(包含答案解析)(3)

一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .3.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =4.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元5.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙6.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生7.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .188.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是( ) A .31号B .32号C .33号D .34号10.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( )A .10B .11C .12D .1311.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1812.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.15.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.16.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____17.已知一组数据126,,,x x x ⋅⋅⋅的方差是2,并且()()()22212611118x x x -+-+⋅⋅⋅+-=,0x ≠,则x =______.18.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 19.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.20.能够说明“若甲班人数为m ,平均分为a ;乙班人数为n n m ≠(),平均分为b ,则甲乙两班的数学平均分为2a b+”是假命题的一组正整数a ,b 的值依次为_____. 三、解答题21.某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行跟踪调查,张三提供了该县某山羊养殖场年养殖数量y (单位:万只)与相应年份x (序号)的数据表和散点图(如图所示),根据散点图,发现y 与x 有较强的线性相关关系,李四提供了该县山羊养殖场的个数z (单位:个)关于x 的回归方程ˆ230z x =-+.年份序号x 1 2 3 4 5 6 7 8 9 年养殖山羊y /万只1.21.51.61.61.82.52.52.62.7y x (2)试估计:①该县第一年养殖山羊多少万只? ②到第几年,该县养殖山羊的数量与第1年相比减少了? 参考统计量:()92160ii x x =⋅-=∑,()()9112i i i x x y y =⋅--=∑.附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表:①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.23.潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y 和夏季平均温度x 有关,现收集了某地区以往6年的数据,得到下面数据统计表格.(Ⅰ)根据相关系数r 判断,潜叶蝇的平均产卵数y 与平均温度x 是否具有较强的线性相关关系,若有较强的线性相关关系,求出线性回归方程y bx a =+,若没有较强的线性相关关系,请说明理由(一般情况下,当0.75r >时,可认为变量有较强的线性相关关系);(Ⅱ)根据以往的统计,该地区夏季平均气温为()C ξ︒近似地服从正太分布()226.5,N σ,且()125282P ξ<≤=.当该地区某年平均温度达到28C ︒以上时,潜叶蝇快速繁殖引发虫害,需要进行一次人工治理,每次的人工治理成本为200元/公顷(其他情况均不需要人工治理),且虫害一定会导致水稻减产,对过往10次爆发虫害时的减产损失进行统计,结果如下:用样本的频率估计概率,预测未来2年,每公顷水稻可能因潜叶蝇虫害造成的经济损失Y (元)的数学期望.(经济损失=减产损失+治理成本) 参考公式和数据:()()ni i x xy yr --=∑()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-()()61700iii x x yy =--=∑,6214126ii x==∑,61240i i y ==∑,()6218816i i y y=-=∑,8.4≈786≈.24.2020年新冠肺炎疫情肆虐全球,各地医疗部门迅速进行防控意识宣传和流行病学调查.某疫区随机抽取100人调查其外出时佩戴口罩的情况,结果如下表.(1)是否有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)该疫区某新冠肺炎定点治疗医院统计了确诊患者中年龄x (单位:岁)的重症患者比例(单位:%),得到下表:若y 与x 之间具有线性相关关系,请用最小二乘法求出y 关于x 的线性回归方程y bx a =+,并预测该医院76岁确诊患者中的重症比例.参考公式和数据:用最小二乘法求线性回归方程系数公式:1221ni ii nii x y nx yb xn x=-=-=-∑∑,a y bx =-.817010.5657.5637.553 5.552 4.545 3.540 1.5320.52454i ii x y==⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=∑.82222222217065635345403223256i i x==++++++=∑.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 26.某校为“全国数学联赛”选拔人才,分初赛和复赛两个阶段进行,规定:分数不小于本次考试成绩中位数的具有复赛资格,该校有900名学生参加了初赛,所有学生的成绩均在区间(]30,150内,其频率分布直方图如图.(1)根据频率分布直方图,估计获得复赛资格应划定的最低分数线; (2)根据频率分布直方图,估计本次初赛的平均成绩.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.C解析:C 【分析】根据平均数和方差公式计算比较即可. 【详解】设这个班有n 个同学,分数分别是123,,,,n a a a a ⋅⋅⋅,假设第i 个同学的成绩没录入,这一次计算时,总分是()1n x -,方差为()()()()()222222121111i i n s a x a x a x a x a x n -+⎡⎤=-+-+⋅⋅⋅+-+-+⋅⋅⋅+-⎣⎦-; 第二次计算时,()11n nxx x -+=x =,方差为()()()()()()222222221121111++i i i n n s a x a x a x a x a x a x s n n-+-⎡⎤=-+-⋅⋅⋅-+-+-+⋅⋅⋅+-=⎣⎦故有1x x =,221s s >.故选:C 【点睛】本题主要考查样本的平均数和方差公式;属于中档题.4.B解析:B 【解析】 【分析】先求出,由样本点的中心在回归直线上,可求出,从而求出回归方程,然后令,可求出答案.【详解】 由题意,,则样本中心点在回归方程上,则,故线性回归方程为,则广告费用为万元时销售额为万元,故选B.【点睛】本题考查了线性回归方程的求法,考查了学生的计算能力,属于基础题.5.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.6.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C .【点睛】本题主要考查系统抽样.7.A解析:A【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案.【详解】由题,因为中位数为12,所以242x y x y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小此时4212x y +=故选A【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.8.B解析:B【详解】 试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆy bx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a ,∴ˆa=9.1, ∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5考点:线性回归方程9.C解析:C【解析】【分析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷,已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.10.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.11.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】根据题意得,用分层抽样在各层中的抽样比为421 105020=,则在高三年级抽取的人数是14001625⨯=人,故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.12.A解析:A【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数.详解:∵8名女生,4名男生中选出3名学生组成课外小组,∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112.故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.331【分析】分段抽样由抽取时的分段间隔是20利用等差数列知识得解【详解】由抽取时的分段间隔是20即抽取20名同学其编号构成首项为11公差为20的等差数列第17组抽取的号码故答案为:331【点睛】本解析:331【分析】分段抽样由抽取时的分段间隔是20,利用等差数列知识得解.【详解】由抽取时的分段间隔是20.即抽取20名同学,其编号构成首项为11,公差为20的等差数列,第17组抽取的号码11(171)20331+-⨯=故答案为:331【点睛】本题考查系统抽样,属于基础题.14.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族 解析:20【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果.【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==, 解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20.【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题. 15.【分析】根据线性回归方程过样本数据中心点可求出b 代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的 解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解.【详解】 由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元.故答案为:4.74【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题. 16.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数 8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题 17.2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果【详解】由题意结合方差的定义有:①而②①-②有:③注意到将其代入③式整理可得:又故故答案为2【点睛】本题主要考查方差的计算公式整体的数学 解析:2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果.【详解】由题意结合方差的定义有:()()()22212612x x x x x x -+-++-= ①, 而()()()22212611118x x x -+-+⋅⋅⋅+-=, ②,①-②有:()()212612666226x x x x x x x x --+++++++=-, ③, 注意到1266x x x x +++=,将其代入③式整理可得:26120x x -+=, 又0x ≠,故2x =.故答案为2.【点睛】 本题主要考查方差的计算公式,整体的数学思想等知识,意在考查学生的转化能力和计算求解能力.18.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x =5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时 解析:75 【解析】【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求.【详解】∵4115i i x ==∑,∴154x =,∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+ a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75.【点睛】 本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.19.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b a a b=,即36b a ==时,取等号 故答案为2 20.是不相等的正整数即可【解析】∵甲班人数为平均分为乙班人数为平均分为∴甲乙两班的数学平均分为∵∴当时∴该命题是假命题时应满足是不相等的正整数故答案为:是不相等的正整数解析:,a b 是不相等的正整数即可【解析】∵甲班人数为m ,平均分为a ,乙班人数为()n n m ≠,平均分为b∴甲、乙两班的数学平均分为ma nb m n++ ∵m n ≠ ∴当a b =时,2ma nb a b m n ++=+ ∴该命题是假命题时,应满足,a b 是不相等的正整数 故答案为:,a b 是不相等的正整数三、解答题21.(1)ˆ0.21yx =+;(2)①33.6万只;②到第10年该县养殖山羊的数量相比第1年减少了.【分析】(1)由已知求得,x y ,进一步套公式求出ˆb和ˆa 的值,就求出线性回归方程; (2)由题意求得()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++, 在①中,令x =1求解,在②中,令20.443033.6x x -++<,解不等式即可.【详解】解:(1)设y 关于x 的线性回归方程为y bx a =+,12345678959x ++++++++==, 1.2 1.5 1.6 1.6 1.8 2.5 2.5 2.6 2.729y ++++++++==, ()()()9192112ˆ0.260i ii i i x x y y b x x ==--===-∑∑, ˆ20.251a=-⨯=. 所以y 关于x 的线性回归方程为ˆ0.21yx =+. (2)估计第x 年山羊养殖的只数为()()2ˆˆ0.212300.4430z y x x x x ⋅=+⋅-+=-++ 令1x =,则0.443033.6-++=,故该县第一年养殖山羊约33.6万只.由题意,得20.443033.6x x -++<,整理得()()910x x -->,解得9x >或1x <(舍去),所以到第10年该县养殖山羊的数量相比第1年减少了.【点睛】方法点睛:求线性回归方程的步骤:(1)先求 x 、y 的平均数,x y ;(2)套公式求出ˆb和ˆa 的值:()()()91921ˆi i i i i x x y y b x x ==--=-∑∑,ˆa y b x =-⨯; (3)写出回归直线的方程. 22.(1)不同的样本的个数为432418C C .(2)①分布列见解析,()E ξ97=.②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分.【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩.【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名, 18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名,∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为∴()0123353535357E ξ=⨯+⨯+⨯+⨯=. ②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+.当96x =时,0.659633.6096y =⨯+=.可预测该同学的物理成绩为96分.【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).23.(Ⅰ)具有较强的线性相关关系,10220y x =-;(Ⅱ)330元【分析】(Ⅰ)代入公式计算r ,再做判断,根据公式求,b a ,即得结果;(Ⅱ)先确定温度达到28C ︒以上时概率,再确定随机变量取法,分别求出对应概率,最后根据数学期望公式求结果.【详解】(Ⅰ)21232527293171121226411526,4066x y ++++++++++=======()()7000.75786n ii x x y y r --==>=>∑ 所以潜叶蝇的平均产卵数y 与平均温度x 具有较强的线性相关关系, ()()()1217001070n i i i n i i x x y yb x x ==--===-∑∑,401026220a y bx =-=-⨯=- 10220y bx a x ∴=+=-;(Ⅱ)()12528,2P ξ<≤=()C ξ︒近似地服从正太分布()226.5,N σ, ()()12528128,24P P ξξ-<≤∴>== 0,1200,1600Y = 13141163(0)1,(1200),(1600)444101041020P Y P Y P Y ==-===⨯===⨯= 313()01200140033041020E Y =⨯+⨯+⨯=(元) 【点睛】本题考查线性回归方程、数学期望公式、正态分布,考查综合分析求解能力,属中档题.24.(1)有把握;(2)1ˆ84y x =-,11%. 【分析】(1)根据列联表,利用公式计算2K ,对照附表得出结论;(2)计算x 、y ,求出回归系数,写出线性回归方程,利用方程计算76x =时ˆy的值. 【详解】(1)根据题意,计算22100(45201025)8.1297.89770305545K ⨯⨯-⨯=≈>⨯⨯⨯; 所以有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)计算1105(7065635352454032)82x =⨯+++++++=,141(10.57.57.5 5.5 4.5 3.5 1.50.5)88y =⨯+++++++=; 所以122211054124548128ˆ1054232568()2n ii i n i i x y nxyb xnx ==--⨯⨯===-⨯-∑∑; 411105ˆˆ8842a y bx =-=-⨯=-; 所以y 关于x 的线性回归方程是1ˆ84y x =-, 计算76x =时,1ˆ768114y =⨯-=, 可以预测该医院76岁确诊患者中的重症比例为11%.【点睛】本题考查了列联表与独立性检验的应用问题,也考查了线性回归方程的应用问题,是中档题.25.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10(1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22( 1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++, 所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 26.(1)100分;(2)97.【分析】(1)根据题意,由频率分布直方图求出[]30,90的频率为0.35,[]90,110的频率为0.3,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,进而求出中位数,即可估计出本次考试复赛资格最低分数线;(2)利用频率分布直方图计算出各组的频率,即可估计本次初赛的平均成绩.【详解】解:(1)由题意知[]30,90的频率为:()200.00250.00750.00750.35⨯++=, 由题意知[]90,110的频率为: 200.01500.3⨯=,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,设最低分数线为x ,且(]90,110x ∈.由()0.35900.0150.5x +-⨯=得:100x =,故本次考试复赛资格最低分数线应划为100分.(2)由题意可知:初赛分数在区间(]30,50,(]50,70,(]70,90,(]90,110,(]110,130,(]130,150的频率分别为:0.05,0.15,0.15,0.3,0.25,0.1, 所以本次初赛的平均分为:400.05600.15800.151000.31200.251400.197⨯+⨯+⨯+⨯+⨯+⨯=.【点睛】本题考查频率分布直方图的频率、中位数、平均数的求法,考查解题分析和计算能力.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§11.1 随机抽样A组1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.()(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(3)系统抽样在起始部分抽样时采用简单随机抽样.()(4)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()2.在某班的50名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是()A.随机抽样B.分层抽样C.系统抽样D.以上都不是3.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()A.700B.669C.695D.6764.大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________________.5.一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.B组1.(20KK·四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101B.808C.1212D.20PP2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为()A.6B.8C.10D.123.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为()A.7B.15C.25D.354.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为()5.某学校高一、高二、高三三个年级共有学生3500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按1100的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为()A.8B.11C.16D.106.(20KK·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.7.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.8.(20KK·福建)一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________.9.课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________.10.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是______________.C组1.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250②5,9,100,107,111,121,180,195,200,265③11,38,65,92,119,146,173,200,227,254④30,57,84,111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是()A.②、③都不能为系统抽样B.②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样2.(20KK·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10D.153.为了解1200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________.答案404.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为______.若采用分层抽样,40岁以下年龄段应抽取______人.5.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________.6.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n .§11.2 用样本估计总体A 组1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. ( )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )2.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________. 3.一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),P ;[40,50),5;[50,60),4;[60,70),2;则P =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________.4.(20KK·湖南)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(P 1-x )2+(P 2-x )2+…+(P n -x )2],其中x 为P 1,P 2,…,P n 的平均数)5.某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.B 组1.(20KK·重庆)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为( )A.0.2 B.0.4C.0.5 D.0.62.(20KK·辽宁)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.603.(20KK·陕西)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56 B.46,45,53C.47,45,56 D.45,47,534.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m o,平均值为x,则()A.m e=m o=x.m e=m o<xC.m e<m o<x.m o<m e<x5.若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为x,方差为s2,则()A.x=5,s2<2B.x=5,s2>2C.x>5,s2<2D.x>5,s2>26.(20KK·湖北)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________;(2)命中环数的标准差为________.7.(20KK·山东)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.8.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.9.(20KK·安徽)若某产品的直径长与标准值的差的绝对值不超过1mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.10.(20KK·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(P)与数学成绩相应分数段的人数(P)之比如下表所示,求数学成绩在[50,90)之外的人数.C组1.(20KK·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()2.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83C.2.7,78 D.2.7,833.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是()A.70,75 B.70,50C.75,1.04 D.62,2.354.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.5.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.6.某高校在20KK 年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下表所示.(1)(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试?(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A 考官进行面试,求:第4组至少有一名学生被考官A 面试的概率.§11.3 变量间的相关关系、统计案例A 组1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( )(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( )(4)某同学研究卖出的热饮杯数P 与气温P (℃)之间的关系,得回归方程y ^=-2.352P +147.767,则气温为2℃时,一定可卖出143杯热饮.( )(5)事件P ,P 关系越密切,则由观测数据计算得到的χ2的值越大. ( )(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( ) 2.下面哪些变量是相关关系( )A .出租车车费与行驶的里程B .房屋面积与房屋价格C .身高与体重D .铁块的大小与质量3.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是 ( )A .有99%的人认为该电视栏目优秀B .有99%的人认为该电视栏目是否优秀与改革有关系C .有99%的把握认为该电视栏目是否优秀与改革有关系D .没有理由认为该电视栏目是否优秀与改革有关系4.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“无关”).5.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,已知P (χ2≥3.841)≈0.05.对此,四名同学作出了以下的判断: p :有95%的把握认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%. 则下列结论中,正确结论的序号是________. ①p ∧﹁q ;②﹁p ∧q ;③(﹁p ∧﹁q )∧(r ∨s ); ④(p ∨﹁r )∧(﹁q ∨s ).B 组1.某地区调查了2~9岁的儿童的身高,由此建立的身高P (cm)与年龄P (岁)的回归模型为y ^=8.25P +60.13,下列叙述正确的是( )A .该地区一个10岁儿童的身高为142.63cmB .该地区2~9岁的儿童每年身高约增加8.25cmC .该地区9岁儿童的平均身高是134.38cmD .利用这个模型可以准确地预算该地区每个2~9岁儿童的身高2.设(P 1,P 1),(P 2,P 2),…,(P n ,P n )是变量P 和P 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是 ( )A .直线l 过点(x ,y )B .P 和P 的相关系数为直线l 的斜率C .P 和P 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同3.(20KK·湖南)设某大学的女生体重P (单位:kg)与身高P (单位:cm)具有线性相关关系,根据一组样本数据(P i ,P i )(i=1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85P -85.71,则下列结论中不正确...的是( )A .P 与P 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:计算可得χ2=110×(40×30-20×20)60×50×60×50≈7.8.附表:参照附表,得到的正确结论是)A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 5.(20KK·大连模拟)某产品的广告费用P 与销售额P 的统计数据如下表:根据上表可得回归直线方程y =b P +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元6.以下四个命题,其中正确的序号是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程y ^=0.2P +12中,当解释变量P 每增加一个单位时,预报变量y ^平均增加0.2个单位; ④对分类变量P 与P ,它们的随机变量χ2来说,χ2越小,“P 与P 有关系”的把握程度越大.7.已知回归方程y ^=4.4P +838.19,则可估计P 与P 的增长速度之比约为________.8.某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.9.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂:乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?10.(20KK·重庆)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入P i (单位:千元)与月储蓄P i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i P i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y ^对月收入P 的回归直线方程y ^=b ^P +a ^; (2)判断变量P 与P 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.。

相关文档
最新文档