高中数学必修三《统计综合问题》课后练习(含答案)
高中数学必修3统计测试题及其答案
高中数学必修 3 第二章(统计)检测题班级姓名得分一、选择题:(此题共 10 小题,每题 3 分,共 30 分,在每题给出的四个选项中,只有一项为哪一项切合题目要求的)1.某单位有老年人28 人,中年人 54 人,青年人 81 人.为了检查他们的身体状况,需从他们中抽取一个容量为36 的样本,最适合抽取样本的方法是( D ).A .简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,而后分层抽样2.10 名工人某天生产同一部件,生产的件数是15,17,14, 10,15, 17,17,16,14,12.设其均匀数为a,中位数为 b,众数为 c,则有 ( D).A .a>b>c B. b>c>a C. c>a>b D.c>b>a3.以下说法错误的选项是 ( B ).A.在统计里,把所需观察对象的全体叫作整体B.一组数据的均匀数必定大于这组数据中的每个数据C.均匀数、众数与中位数从不一样的角度描绘了一组数据的集中趋向D.一组数据的方差越大,说明这组数据的颠簸越大4.以下说法中,正确的选项是 ( C ).A .数据 5,4,4,3,5,2 的众数是 4B.一组数据的标准差是这组数据的方差的平方C.数据 2,3,4,5 的标准差是数据 4,6,8,10 的标准差的一半D.频次散布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别随意抽出10 名学生进行英语口语测试,其测试成绩的方差分别2 2 .,则.为 S1 , 2A )= 13.2 S =26 26(A .甲班 10 名学生的成绩比乙班10 名学生的成绩齐整B.乙班 10 名学生的成绩比甲班10 名学生的成绩齐整C.甲、乙两班 10 名学生的成绩同样齐整D.不可以比较甲、乙两班10 名学生成绩的齐整程度6.以下说法正确的选项是 ( C ).A.依据样本预计整体,其偏差与所选择的样本容量没关B.方差和标准差拥有同样的单位2 2 2 2 是错的D.假如容量同样的两个样本的方差知足12 ,那么推得整体也知足S1 2S <S <S 7.某同学使用计算器求 30 个数据的均匀数时,错将此中一个数据 105 输人为 15,那么由此求出的均匀数与实质均匀数的差是( B ).A.3.5 B.-3 C. 3 D. -0.58.在一次数学测试中,某小组14 名学生疏别与全班的均匀分85 分的差是: 2,3,-3,-5, 12,12,8,2,-1,4,-10,-2, 5, 5,那么这个小组的均匀分是(B)分.A .97.2 B. 87.29 C. 92.32 D.82.869.某题的得分状况以下:此中众数是 ( C ).得分 /分0 1 2 3 4百分率 /(%) 37.0 8.6 6.0 28.2 20.2A .37.0%B. 20.2%C.0 分D.4 分10.假如一组数中每个数减去同一个非零常数,则这一组数的( 10 ).A .均匀数不变,方差不变B.均匀数改变,方差改变C.均匀数不变,方差改变D.均匀数改变,方差不变11.为检查参加运动会的 1 000 名运动员的年纪状况,从中抽查了 100 名运动员的年纪,就这个问题来说,以下说法正确的选项是A . 1 000 名运动员是整体C.抽取的 100 名运动员是样本( A)B.每个运动员是个体D.样本容量是 10012.为了检查某产品的销售状况,销售部门从部下的92 家销售连锁店中抽取30 家认识情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为( A )A.3,2B.2,3C.2,30D.30,213.某城区有农民、工人、知识分子家庭合计 2 000 家,此中农民家庭 1 800 户,工人家庭100 户.现要从中抽取容量为40 的样本,检查家庭收入状况,则在整个抽样过程中,能够用到以下抽样方法(D)①简单随机抽样;②系统抽样;③分层抽样.A .②③ B.①③ C.③ D.①②③ 14.以下说法不正确的选项是 ( A )A.频次散布直方图中每个小矩形的高就是该组的频次B.频次散布直方图中各个小矩形的面积之和等于 1C.频次散布直方图中各个小矩形的宽同样大D.频次散布直方图能直观地表示样本数据的散布状况15.容量为 20 的样本数据,分组后的频数以下表:分组[10,20) [20,30) [30,40) [40,50) [50,60) [60,70)频数 2 3 4 5 4 2则样本数据落在区间 [10,40)的频次为 ( B )A . 0.35 B.0.45 C.0.55 D.0.6516.已知 10 名工人生产同一部件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为 a,中位数为 b,众数为 c,则有 ( D )A . a>b>c B.a>c>b C.c>a>b D.c>b>a17. 已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为(B )A . 1 B. 2 C. 3 D.218.如图是 2012 年某校举行的元旦诗歌朗读竞赛中,七位评委为某位选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的均匀数和方差分别为(C)A . 84,4.84B .84,1.6C.85,1.6D.85,0.419.某中学有高中生 3500 人,初中生 1500 人.为认识学生的学习状况,用分层抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则 n 为( A) A.100B .150C .200D .25020.样本容量为100 的频次散布直方图以下图.依据样本的频次散布直方图预计样本数据落在 [6, 10)内的频数为 a,样本数据落在 [2,10)内的频次为 b,则 a, b 分别是 ( A )A .32,0.4 B.8,0.1C. 32,0.1 D.8,0.4二、填空题:(此题共 4 小题,每题 3 分,共 12 分)21.一个企业共有 240 名职工,下设一些部门,要采纳分层抽样方法从全体职工中抽取一个容量为20的样本.已知某部门有 60名职工,那么从这一部门抽取的职工人数是5。
(典型题)高中数学必修三第一章《统计》测试题(答案解析)(1)
一、选择题1.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差2.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .293. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日 4.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .5.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .296.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s7.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④8.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,89.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1310.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.2二、填空题13.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.14.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带租业主户已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.18.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x和销售量y之间的一组数据如表所示:月份i789101112销售单价i x(元)99.51010.5118.5销售量i y(元)111086514y x(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本).参考数据:51392i iix y==∑,521502.5iix==∑.参考公式:回归直线方程ˆˆˆy bx a=+,其中1221ˆni iiniix y nx ybx nx==-=-∑∑,ˆˆa y bx=-.22.某企业投资两个新型项目,投资新型项目A的投资额m(单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m=-,投资新型项目B的投资额x(单位:十万元)与纯利润y(单位:万元)的散点图如图所示.(1)求y关于x的线性回归方程;(2)根据(1)中的回归方程,若A,B两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a=+的斜率和截距的最小二乘估计分别为1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.23.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii niix y nx yb xnx==-=-∑∑,ay bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑24.某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x (单位:万元)和产量y (单位:吨)的数据,用两种模型①y bx a =+,②y a =+分别进行拟合,得到相应的回归方程111.2 2.0y x =+,29.8y =,进行残差分析得到如图所示的残差值及一些统计量的值:(1)求上表中空格内的值;(2)残差值的绝对值之和越小说明模型拟合效果越好,根据残差比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(3)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(2)中所选模型的回归方程.(参考公式:i i ie y bx a =--,1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-)25.为保护农民种粮收益,促进粮食生产,确保国家粮食安全,调动广大农民生产粮食的积极性,从2014年开始,国家实施了对种粮农民直接补贴的政策通过对2014~2018年的数据进行调查,发现某地区发放粮食补贴额x (单位:亿元)与该地区粮食产量y (单位:万亿吨)之间存在着线性相关关系,统计数据如下表: 年份 2014 2015 2016 2017 2018 补贴额x /亿元 9 10 12 11 8 粮食产量y /万亿2526312721(1)请根据上表所给的数据,求出y 关于x 的线性回归直线方程ˆˆˆybx a =+; (2)通过对该地区粮食产量的分析研究,计划2019年在该地区发放粮食补贴7亿元,请根据(1)中所得到的线性回归直线方程,预测2019年该地区的粮食产量.参考公式:()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-. 26.党的十八大以来,我国精准扶贫已经实施了六年,我国贫困人口从2012年的9899万人,减少到2018年的1660万人,2019年将努力实现减少贫困人口1000万人以上的目标,力争2020年在现行标准下,农村贫困人口全部脱贫,贫困县全部脱贫摘帽.某市为深入分析该市当前扶贫领域存在的突出问题,市扶贫办近三年来,每半年对贫困户(用y 表示,单位:万户)进行取样,统计结果如图所示,从2016年6月底到2019年6月底的共进行了七次统计,统计时间用序号t 表示,例如:2016年12月底(时间序号为2)贫困户为5.2万户.(1)求y 关于t 的线性回归方程y bx a =+,并预测到2020年12月底,该市能否实现贫困户全部脱贫;(2)为尽快打赢脱贫攻坚战,该市扶贫办在2019年6月底时,对全市贫困户随机抽取了100户贫困户,对每个家庭最主要经济收入来源进行抽样调查,统计结果如图.并决定据此选派一批农业技术人员对全市所有贫困户中,家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶,每一名农业技术人员对口帮扶贫困户90户,则该市应分别安排多少农业技术人员对家庭最主要经济收入来源为养殖收入和种植收入的贫困户进行对口帮扶? 附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题.2.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.3.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.4.D解析:D 【解析】 【分析】先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.5.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.6.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,()()()2221131653615661...726177s ⎡⎤=-+-++-=⎣⎦, ()()()2222134254625662 (736277)s ⎡⎤=-+-++-=⎣⎦ 则1212,x x s s <<故选C【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.7.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FP时,直线OP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FP时,直线OP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.8.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图9.C解析:C 【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论. 【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列, ∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19, 由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25, ∴做问卷C 的人数为25﹣14+1=12, 故选C . 【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.10.C解析:C 【分析】设该样本中高三年级的学生人数为x ,则1800601200x=,解之即可 【详解】设该样本中高三年级的学生人数为x ,则1800601200x =,解得40x =, 故选C . 【点睛】本题考查了分层抽样方法的应用问题,属基础题.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.C解析:C 【分析】首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可. 【详解】由题意可得:12345305x x x x x x ++++==,线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==. 本题选择C 选项. 【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方解析:11 【分析】根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】根据题意,一组样本数据1210,,...,x x x ,且22212102020x x x ++⋯+=,平均数9x =,则其方差()()()()22221210110S x x x x x x =-+-+⋯+-()2222121011012110x x x x =++⋯+-=,则其标准差11S ==, 故答案为:11. 【点睛】本题主要考查平均数、方差与标准差,属于基础题. 样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =14.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题 解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数. 【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户. 【点睛】 本小题主要考查用样本估计总体,考查频率的计算,属于基础题.15.92【解析】【分析】由题可得进而可得再计算出从而得出答案【详解】5个样本成份的平均值为标准差为所以即解得因为所以所以这批中成药的药物功效的平均值药物单位【点睛】本题考查求几个数的平均数解题的关键是求解析:92 【解析】 【分析】由题可得1234540x x x x x ++++=,()()()22212520x x x x x x -+-++-=进而可得222125340x x x +++=,再计算出125y y y +++,从而得出答案.【详解】5个样本12345,,,,x x x x x 成份A 的平均值为8g ,标准差为2g ,所以1234540x x x x x ++++=,()()()22212520x x x x x x -+-++-=,即()22221251252520x x x x x x x x +++-++++=,解得222125340x x x +++=因为2(20)20y x x x x =-=-,所以()()22212512512520460y y y x x x x x x +++=+++-+++=所以这批中成药的药物功效的平均值460925y ==药物单位 【点睛】本题考查求几个数的平均数,解题的关键是求出222125x x x +++,属于一般题.16.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.17.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归解析:16-【解析】 【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值 【详解】 由已知,()12101210330x x x y y y +++=+++=()12101310x x x x ∴=⨯+++= ()12101110y y y y =⨯+++=代入回归直线方程可得:3132b =+ 解得16b =-故答案为16- 【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果18.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果. 详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15 解析:15【解析】依次选取两个数字为23,75,93,21,15,04,…… 所以选出来的第3个个体的编号为15.三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】(1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b-⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y . 22.(1) 1.60.2y x =+;(2)B 项目的收益更好. 【分析】(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出b 的值,最后将样本中心点的坐标代入回归方程求得a 的值即可;(2)分别利用所给关系式以及所求回归方程,求出A ,B 两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好. 【详解】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8, 所以1234535x ++++==,2357855y ++++==,22222212233547585351.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元; 因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元. 因为9.89.7>,所以可预测B 项目的收益更好.【点睛】方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a=+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 23.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程; (2)将15x =代入回归直线方程即可求得结果. 【详解】 (1)1234535x ++++==,5678107.25++++==y51120i ii x y==∑,522222211234555i i x ==++++=∑25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题.24.(1)7.4;(2)选模型①,理由见解析;(3)111y x =+. 【分析】(1)根据i i ie y bx a =--,结合表中所给数据,即可求得空格内的值;(2)分别计算出模型①和模型②的残差值绝对值之和,比较其大小,即可求得应选择哪一个模型;(3)根据所给数据计算出x ,y ,51i ii x y =∑,521ii x=∑,带入1221ni ii nii x y nx yb xnx==-=-∑∑,即可求得答案. 【详解】(1)根据i i ie y bx a =--∴空格处的值为()43311.2 2.07.4-⨯+=(2)应选择模型①模型①的残差值的绝对值之和为0.2 2.47.4 1.83 1.216+++++= 模型②的残差值的绝对值之和为5.48.0 4.0 1.6 1.69.029.6+++++=1629.6<∴模型①的拟合效果好,应该选模型①.(3)剔除异常数据,即剔除3月份的数据后, 得()13.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.211825 3.6 3.617.25i ii i i x y x yb x x==--⨯⨯====-⨯⨯-∑∑,40.611 3.61a y bx =-=-⨯=.所以y 关于x 的回归方程为111y x =+. 【点睛】本题解题关键是掌握残差的定义和回归直线方程的求解步骤,考查了分析能力和计算能力,属于中档题.25.(1)ˆ 2.24yx =+;(2)19.4万亿吨. 【分析】(1)利用最小二乘法公式求回归直线的系()()()51521ˆiii ii x x y y bx x ==--=-∑∑,即可得答案;(2)将7x =代入回归方程ˆ 2.24yx =+,可得,ˆ19.4y =,即可得答案; 【详解】解:(1)由表中所给数据可得,91012118105x ++++==,2526312721265y ++++==,代入公式()()()51521ˆiii ii x x y y bx x ==--=-∑∑,解得ˆ 2.2b=,所以ˆˆ4a y bx =-=. 故所求的y 关于x 的线性回归直线方程为ˆ 2.24yx =+. (2)由题意,将7x =代入回归方程ˆ 2.24yx =+,可得,ˆ19.4y =. 所以预测2019年该地区的粮食产量大约为19.4万亿吨. 【点睛】本题考查利用最小二乘法求回归直线方程、回归方程进行预报,考查数据处理能力. 26.(1)0.5 6.3y t =-+,不能;(2)58人和116人. 【分析】(1)由题意求得t 、y 后,代入公式即可得b 、a ,即可得线性回归方程;代入10t =求得 1.3y =即可得解;(2)由统计图计算可得家庭最主要经济收入来源为养殖收入和种植收入的贫困户户数,即可得解. 【详解】 (1)∵123456747t ++++++==,5.9 5.2 4.8 4.4 3.6 3.3 2.9 4.37y ++++++==,()()()()()()3 1.620.910.5010.7213 1.40.59410149b -⨯+-⨯+-⨯++⨯-+⨯-+⨯-==-++++++,()4.30.54 6.3a y bt =-=--⨯=,y 关于t 的线性回归方程0.5 6.3y t =-+.2020年12月底时,10t =,代入知 1.30y =>,不能实现贫困户全部脱贫.(2)2019年6月底时,贫困户共2.9万户,由图知,家庭最主要经济收入来源为养殖收入和种植收入分别占18%和36%,290000.189058⨯÷=,290000.3690116⨯÷=,对家庭最主要经济收入来源为养殖收入和种植收入的贫困户分别安排58人和116人. 【点睛】本题考查了统计的应用,考查了线性回归方程的求解和应用,属于中档题.。
高中数学必修三--统计-含答案解析--zhy365
高中数学必修三--统计卷I(选择题)一、选择题(本题共计 12 小题,每题 5 分,共计60分,)1. 下列调查中,适合用全面调查方式的是()A.了解某班学生“50米跑”的成绩B.了解一批灯泡的使用寿命C.了解一批炮弹的杀伤半径D.了解一批袋装食品是否含有防腐剂2. 某单位200名职工中,年龄在50岁以上占20%,40∼50岁占30%,40岁以下占50%;现要从中抽取40名职工作样本.若用系统抽样法,将全体职工随机按1∼200编号,并按编号顺序平均分为40组(1∼5号,6∼10号,…,196∼200号).若第5组抽出的号码为22,则第8组抽出的号码应是①;若用分层抽样方法,则40岁以下年龄段应抽取②人.①②两处应填写的数据分别为()A.82,20B.37,20C.37,4D.37,503. 某学校有教师160人,其中有高级职称的32人,中级职称的56人,初级职称的72人.现抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数应为()A.4B.6C.7D.94. 2013年中国政府提出共建丝绸之路经济带,受到了世界各国的高度重视和积极响应,并提出打造海上丝绸之路的总体规划,被简称为“一带一路”.经调查,沿线某地区自2013年到2019年经过6年的经济新建设,经济收入增加了3倍.为更好地了解该地区经济收入变化情况,统计了该地区建设前后经济收入构成比例,得到如下表格:则2019年与2013年经济收入相比较,下面结论中正确的是( )A.石油出口收入减少B.其他收入增加了三倍以上C.百姓购物收入增加了三倍D.百姓购物收入与教育文化收入的总和超过了经济收入的一半的样本,若采用系统抽样,则分段的间隔k为()A.50B.60C.30D.406. 如图是某社区工会对当地企业工人月收入情况进行一次抽样调查后画出的频率分布直方图,其中第二组月收入在[1.5, 2)千元的频数为300,则此次抽样的样本容量为()A.1000B.2000C.3000D.40007. 一样本的所有数据分组及频数如下:[−0.5, 0.5),C50;[0.5, 1.5),C51;[1.5, 2.5),C52;[2.5, 3.5),C53;[3.5, 4.5),C54;[4.5, 5.5),C55.则在[1.5, 4.5)的频率为()A.5 8B.12C.2532D.15168. 2019年,全国各地区坚持稳重求进工作总基调,经济运行总体平稳,发展水平迈上新台阶,发展质量稳步上升,人民生活福祉持续增进,全年最终消费支出对国内生产总值增长的贡献率为57.8%.下图为2019年居民消费价格月度涨跌幅度:(同比=本期数−去年同期数去年同期数×100%,环比=本期数−上期数上期数×100%),下列结论中不正确的是()A.2019年第三季度的居民消费价格一直都在增长B.2018年7月份的居民消费价格比同年8月份要低一些C.2019年全年居民消费价格比2018年涨了2.5%以上D.2019年3月份的居民消费价格全年最低A.数据4、4、6、7、9、6的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数10. 某中学就到校的方式问题对初三年级的所有学生进行了一次调查,并将调查结果制作了扇形统计图,已知步行的人数为60,则初三学生乘公交车的人数为( )A.60B.78C.132D.911. 绘制1000人的寿命直方图时,若组距均为20,60∼80岁范围的纵轴高为0.03,则60∼80岁的人数为()A.300B.500C.600D.80012. 以下两个图表是2019年初的4个月我国四大城市的居民消费价格指数(上一年同月=100)变化图表,给出下列结论:其中正确的是()(注:图表一每个城市的条形图从左到右依次是1、2、3、4月份;图表二每个月份的条形图从左到右四个城市依次是北京、天津,上海、重庆)①3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为平均;②4月份仅有三个城市居民消费价格指数超过102;③仅有天津市从年初开始居民消费价格指数的增长呈上升趋势;④四个月的数据显示北京市的居民消费价格指数增长幅度波动较大.A.①②B.②④C.①②④D.①③④卷II(非选择题)二、填空题(本题共计 6 小题,每题 5 分,共计30分,)13. 某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据,绘制了下面的折线图.已知该市的各月最低气温与最高气温具有较好的线性关系,则根据该折线图,下列结论错误的是_______.①最低气温与最高气温为正相关;②10月的最高气温不低于5月的最高气温;③月温差(最高气温减最低气温)的最大值出现在1月;④最低气温低于0∘C的月份有4个.14. 为了估计鱼塘中鱼的尾数,先从鱼塘中捕出2000尾鱼,并给每条尾鱼做上标记(不影响存活),然后放回鱼塘,经过适当的时机,再从鱼塘中捕出600尾鱼,其中有标记的鱼为40尾,根据上述数据估计该鱼塘中鱼的尾数为________.15. 已知数据:x,y,10,11,9,这组数据的平均值10,方差为2,则|x−y|=________.16. 抽样统计甲,乙两个城市连续5天的空气质量指数(AQI),数据如下:17. 某校从参加高一年级期末考试的学生中抽出60名学生,并统计了他们的数学成绩(成绩均为整数且满分为100分),把其中不低于50分的分成五段[50, 60),[60, 70),[70, 80),[80, 90),[90, 100]然后画出如下图的部分频率分布直方图.观察图形的信息,可知数学成绩低于50分的学生有________人;估计这次考试数学学科的及格率(60分及以上为及格)为________;18. 为了调查某野生动物保护区内某种野生动物的数量,调查人员逮到这种动物1200只作过标记后放回,一星期后,调查人员再次逮到该种动物1000只,其中作过标记的有100只,估算保护区有这种动物________只.三、解答题(本题共计 5 小题,每题 12 分,共计60分,)19. 已知甲、乙、丙三个车间一天内生产的产品分别是150件、130件、120件,为了掌握各车间产品质量情况,从中取出一个容量为40的样本,该用什么抽样方法?简述抽样过程.20. 某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(1)设消费者的年龄为x ,对该款智能家电的评分为y .若根据统计数据,用最小二乘法得到y 关于x 的线性回归方程为y ̂=1.2x +40,且年龄x 的方差为s x 2=14.4,评分y 的方差为s y 2=22.5.求y 与x 的相关系数r ,并据此判断对该款智能家电的评分与年龄的相关性强弱.(2)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“ 好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.附:线性回归直线y ̂=b ̂x +a ̂的斜率b̂=∑(x i −x ¯)n i=1(y i −y ¯)∑(x i −x ¯)2n i=1相关系数r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1.独立性检验中的K 2=n(ad−bc)2(a+b)(a+c)(b+d)(c+d), 其中n =a +b +c +d .临界值表:21. 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,⋯,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑x i 20i=1=60 ,∑y i 20i=1=1200, ∑(x i −x ¯)220i=1=80, ∑(y i −y ¯)220i=1=9000,∑(x i −x ¯)20i=1(y i −y ¯)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,⋯,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物短盖面积差异很大,为提高样本的代表性以获得附:相关系数: r =∑(x −x ¯)n (y −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1√2≈1.414.22. 某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:i i−1i i−1x i 7i−1y i =3487. (1)求x ¯,y ¯;参考公式:b ̂=∑=n ∑(ni−1x i −x ¯)2∑n ∑x i 2n i−1−nx−2,a ̂=y ¯−b ̂x ¯(2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.23. 某网站欲调查网民对当前网页的满意程度,在登录的所有网民中,收回有效帖子共50000份,其中持各种态度的份数如下表所示:为了了解网民的具体想法和意见,以便决定如何更改才能使网页更完美,打算从中抽选500份,为使样本更具代表性,每类中各应抽选出多少份?并且写出具体操作过程.参考答案与试题解析高中数学必修三--统计一、选择题(本题共计 12 小题,每题 5 分,共计60分)1.【解答】A、了解某班学生“50米跑”的成绩,是精确度要求高的调查,适于全面调查;B、C、D了解一批灯泡的使用寿命,了解一批炮弹的杀伤半径,了解一批袋装食品是否含有防腐剂,都是具有破坏性的调查,无法进行普查,故不适于全面调查.2.【解答】解:若用系统抽样,则样本间隔为5,若第5组抽出的号码为22,则第8组抽出的号码应22+15=37,若用分层抽样方法,则40岁以下年龄段应抽取40×50%=20,故选:B.3.【解答】解:∵中级职称的56人,∴抽取一个容量为20的样本,用分层抽样法抽取的中级职称的教师人数为56160=n20,解得n=7,即抽取的中级职称的教师人数应为7人.故选C.4.【解答】解:假设建设前经济收入为a,则建设后经济收入为4a,所以石油出口收入在建设前为0.49a,建设后为4a×0.33=1.32a,石油出口收入较之前增加;其他收入在建设前为0.06a,建设后为0.24a,即其他收入增加了三倍;百姓购物收入建设前为0.3a,建设后为0.38×4a=1.52a,即百姓购物收入增加了四倍以上;教育文化收入建设前为0.1a,建设后为0.15×4a=0.6a,百姓购物收入与教育文化收入的总和为1.52a+0.6a=2.12a>2a,超过了经济收入的一半.故选D.5.【解答】解:由题意知本题是一个系统抽样问题,总体中个体数是3000,样本容量是100,根据系统抽样的步骤,得到分段的间隔k=3000100=30,解:由频率的意义可知,从左到右各个小组的频率之和是1,同时每小组的频率=小组的频数样本容量.∴[1.5, 2)长方形的面积为0.3.第二组月收入在[1.5, 2)千元的频数为300,所以此次统计的样本容量是300÷0.3=1000.故选A.7.【解答】解:由题意知本题共有C50+C51+C52+C53+C54+C55=25个数据,在[1.5, 4.5)的频数是C52+C53+C54∴在[1.5, 4.5)的频率为:C52+C53+C5425=2532,故选C.8.【解答】解:A,从环比看,2019年第三季度的居民消费价格一直都在增长,故A正确;B,从同比看,2018年7月份的居民消费价格比同年8月份要低一些,故B正确;C,从同比看,1.7+1.5+2.3+2.5+2.7+2.7+2.8+2.8+3.0+3.8+4.5+4.512=2.9,所以2019年全年居民消费价格比2018年涨了2.5%以上,故C正确;D,从环比看,2019年1月份的居民消费价格最低,故D错误.故选D.9.【解答】解:数据4、4、6、7、9、6的众数是4和6,故A错误;一组数据的标准差是这组数据的方差的算术平方根,故B错误;∵3,5,7,9的平均数=14(3+5+7+9)=6,∴3,5,7,9的标准差=√14[(3−6)2+(5−6)2+(7−6)2+(9−6)2]=√5.∵6、10、14、18的平均数=14(6+10+14+18)=12,∴6、10、14、18的标准差√14[(6−12)2+(10−12)2+(14−12)2+(18−12)2]= 2√5,∴数据3,5,7,9的标准差是数据6、10、14、18的标准差的一半,故C正确;频率分布直方图中各小长方形的面积等于相应各组的频率,故D错误.故选:C.10.【解答】解:调查的学生总数是:60÷20%=300(人),则乘公交车的人数为:300×(1−20%−33%−3%)=300×44%=132(人).解:因为:组距均为20,60∼80岁范围的纵轴高为0.03,所以;频率为:0.03×20=0.6.∴60∼80岁的人数为:0.6×1000=600.故选:C.12.【解答】解:根据题目所给信息,①,3月份四个城市之间的居民消费价格指数与其它月份相比增长幅度较为大,不平均,①错误;②,4月份仅有三个城市居民消费价格指数超过102;③,天津市和上海从年初开始居民消费价格指数的增长呈上升趋势,③错误;④,四个月的数据显示北京市的居民消费价格指数增长幅度波动较大,④正确.故正确的有②④.故选B.二、填空题(本题共计 6 小题,每题 5 分,共计30分)13.【解答】解:由该市2018年1月份至10月份各月最低气温与最高气温(单位:∘C)的数据的折线图,得:在①中,最低气温与最高气温为正相关,故①正确;在②中,10月的最高气温不低于5月的最高气温,故②正确;在③中,月温差(最高气温减最低气温)的最大值出现在1月,故③正确;在④中,最低气温低于0∘C的月份有3个,故④错误.故答案为:④.14.【解答】解:根据题意,设该鱼塘中鱼的尾数为x,则;x 2000=60040,解得x=30000;∴估计该鱼塘中鱼的尾数为30000.故答案为:30000.15.【解答】解:由平均值10得,x+y+10+11+9=50,则x+y=20,①由方差为2得,2=15[(x−10)2+(y−10)2+0+1+1],即(x−10)2+(y−10)2=8,②设x=10+t,y=10−t,代入②2t2=8,解得t=±2,∴|x−y|=2|t|=4,故答案为:4.16.甲城市连续5天的空气质量指数是109,111,132,118,110;它的极差是132−109=23,且数据的波动性较大些;乙城市连续5天的空气质量指数是110,111,115,132,112;它的极差是132−110=22,且数据的波动性较小些;由此得出,空气质量指数较为稳定(方差较小)的城市是乙.故答案为:乙.17.【解答】解:由图可知,成绩在[50, 60)的频率为0,015×10=0.15,成绩在[60, 70)的频率为0.015×10=0.15,成绩在[70, 80)的频率为0.030×10=0.3,成绩在[80, 90)的频率为0.025×10=0.25,成绩在[90, 100]的频率为0.005×10=0.05,∴成绩不低于50分的频率为0.15+0.15+0.3+0.25+0.05=0.9,成绩不低于60分的频率为0.15+0.3+0.25+0.05=0.75∴成绩低于50分的频率为为1−0.9=0.1∵共有60名学生,∴成绩低于50分的学生数为60×0.1=6,这次考试数学学科的及格率为75%.故答案为6;75%18.【解答】解:设保护区有这种动物有x只,则由题意可得1200x =1001000,求得x=12000,故答案为12000.三、解答题(本题共计 5 小题,每题 12 分,共计60分)19.【解答】解:由于三个车间的产品有差别,故应采用分层抽样的方法,先计算抽样比:k=40150+130+120=110,再计算各车间内抽取样本的件数:甲车间:150×110=15,乙车间:130×110=13,丙车间:120×110=12,再分析使用简单随机抽样的办法在各个车间中抽取样本,最后终成一个样本.20.【解答】解:(1)相关系数r=∑(x−x¯)50(y−y¯)√∑(xi−x)250i=1∑(y i−y)250i=1;=∑(x i−x¯)50i=1(y i−y¯)∑(x i−x¯)250i=1√∑(xi−x¯)250i=1√∑(yi−y)250i=1=b̂⋅√50s x2√50s y =1.2×1215=0.96.故对该款智能家电的评分与年龄的相关性较强.(2)由列联表可得K 2=50×(8×6−20×16)224×26×28×22≈9.624>6.635.故有99%的把握认为对该智能家电的评价与年龄有关.21.【解答】解:(1)由题意可知,1个样区这种野生动物数量的平均数=120020=60,故这种野生动物数量的估计值=60×200=12000;(2)由参考公式得 ,r =∑(x i −x ¯)n i=1(y i −y ¯)√∑(x i −x )2n i=1∑(y i −y )2n i=1=80×9000=62≈0.94 ;(3)由题意可知,各地块间植物短盖面积差异很大,因此在调查时,先确定该地区各地块间植物短盖面积大小并且由小到大排序, 每十个分为一组,采用系统抽样的方法抽取20个地块作为样区进行样本统计. 22.【解答】解:(1)x ¯=17(3+4+5+6+7+8+9)=6, y ¯=17(66+69+73+81+89+90+91)=5597≈79.86;(2)把所给的7对数据写成对应的点的坐标,在坐标系中描出来,得到散点图.(3)∵ 3×66+4×69+5×73+6×81+7×89+8×90+9×91=3487,32+42+52+62+72+82+92=280,∴ b =3487−7×6×5597280−7×36=4.75,a =5597−6×4.75≈51.36,故线性回归方程为y =4.75x +51.36.23.【解答】解:每个个体被抽到的频率是 50050000=1100,10800×1100=108,12400×1100=124,15600×1100=156,11200×1100=112,每类中各应抽选出有效帖子的份数:很满意的108份,满意的124份,一般的156份,不满意的112份.在很满意的有效帖子中采用简单随机抽样的方法随机抽取108份,在满意的有效帖子中采用简单随机抽样的方法随机抽取124份,在一般的有效帖子中采用简单随机抽样的方法随机抽取156份,在不满意的有效帖子中采用简单随机抽样的方法随机抽取112份.。
必修三数学统计综合训练题及答案
8.在抽查某产品的尺寸过程中,将其尺寸数据分成假设干组,[a,b]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,那么|a-b|=( )A.h·m B.hm C.mh D.与m,h无关9.以下抽样中不是系统抽样的是〔〕B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止10.图228是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,假设80分以上为优秀,根据图形信息可知:这次考试的优秀率为( )图228A.25%B.30%C.35%D.40%11二、填空题12.以下四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④1314.超速行驶已成为马路上最大杀手之一,某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,否那么视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图27,那么违规的汽车大约为________辆.图2715.某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,假设该校取一个容量为n的样本,那么n= 。
三、解答题16(1)样本中的作品落在[6,10)内的频数是多少?(2)估计众数、中位数和平均数各是多少?17.对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:甲2738303735312450乙3329383428364345分别求出甲、乙两名自行车赛手最大速度(单位:m/s)的数据的平均数、中位数、标准差,并判断选谁参加比赛更适宜(可用计算器).18.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午 8:00~12:00间各自的车流量(单位:百辆),得如图28所示的统计图,根据统计图:(1)甲、乙两个交通站的车流量的极差分别是多少?(2)甲交通站的车流量在[10,40]间的频率是多少?(3)甲、乙两个交通站哪个更繁忙?并说明理由.第二章自主检测1一.1.D 2.D 3.C 4.C 5.B 6.C 7.A 8.C 9.B 10.B 11.25二.12.①③ 13.0795 14.280 15.y^=1.23x+0.08三.16.解:(1)作品落在[6,10)内的频率为1-0.08-0.36-0.12-0.12=0.32,∴频数为200×0.32=64.(2)众数估计值为:10+142=12,中位数的估计值为:从左到右小矩形面积依次为0.08,0.32,0.36,0.12,0.12,由于中位数左、右两边的小矩形面积相等,假设设为x,那么(x-10)×0.09=0.1,∴x≈11.平均数的估计值为0.08×4+0.32×8+0.36×12+0.12×16+0.12×20≈12.17.解:(1)茎叶图如图D31,中间数为数据的十位数.图D31从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比拟稳定,总体得分情况比甲好.(2)利用科学计算器,得x甲=34,x乙=35.75;s甲≈7.55,s乙≈5.70;甲的中位数是33,乙的中位数是35. 综合比拟,选乙参加比赛更适宜.18.解:(1)甲交通站的车流量的极差为73-8=65;乙交通站的车流量的极差为71-5=66.(2)甲交通站的车流量在[10,40]间的频率为414=27.(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方.从数据的分布情况来看,甲交通站更繁忙.。
高一数学必修3第二章统计测试题及答案(K12教育文档)
高一数学必修3第二章统计测试题及答案(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高一数学必修3第二章统计测试题及答案(word版可编辑修改))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高一数学必修3第二章统计测试题及答案(word版可编辑修改)的全部内容。
数学必修3 第二章 统计 测试题班级 姓名 学号 成绩第Ⅰ卷(选择题,共60分)一选择题:(本题共12小题,每小题5分,共60分)1。
对于随机抽样,个体被抽到的机会是 ( )A .相等B .不相等C .不确定D .与抽取的次数有关2。
用随机数表法从100名学生(男生25人)中抽取20人进行评教,某男生被抽取的机率是 ( )A .1001B .251C .51D .41 3.从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为 ( )A .n N B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4. 有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为 ( )A .5,10,15,20,25B .5,15,20,35,40C .5,11,17,23,29D .10,20,30,40,505.一个容量为20的样本数据,分组后组距与频数如下表:则样本在区间(-∞,50)上的频率为()A.0。
5 B.0.25 C.0。
6 D.0.76.用样本频率分布估计总体频率分布的过程中,下列说法正确的是 ( )A.总体容量越大,估计越精确 B.总体容量越小,估计越精确C.样本容量越大,估计越精确 D.样本容量越小,估计越精确7.对于两个变量之间的相关系数,下列说法中正确的是 ( )A.|r|越大,相关程度越大B.|r|()∈,0,|r|越大,相关程度越小,|r|越小,相关程度越大+∞C.|r|≤1且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小 D.以上说法都不对8.若样本x1+1,x2+1,…,x n+1的平均数为10,方差为2,则对于样本x1+2,x2+2,…,x n+2,下列结论正确的是( )A.平均数为10,方差为2 B.平均数为11,方差为3C.平均数为11,方差为2 D.平均数为14,方差为45发子弹,命中环数如下9.甲,乙两人在相同条件下练习射击,每人打则两人射击成绩的稳定程度是 ( )A .甲比乙稳定B .乙比甲稳定C .甲、乙的稳定程度相同D .无法进行比较10.已知一组数据为0,—1,x,15,4,6,且这组数据的中位数为5,则数据的众数为 ( )A .5B .6C .4D .5.511.在统计中,样本的方差可以近似地反映总体的( )A .平均状态B .分布规律C .波动大小D .最大值和最小值12.线性回归方程 a bx y += 必经过点 ( )A .(0,0)B .)0,(xC .),0(yD .),(y x二填空题:(本题共4小题,每小题5分,共20分)13.条形图用 来表示各取值的频率,直方图用 来表示频率.14.若数据x 1,x 2,x 3,…,x n 的平均数为x ,方差为S 2,则3x 1+5,3x 2+5,…,3x n +5的平均数和方差为 , 。
必修三数学统计综合训练题和答案解析
第二章统计章末综合检测1一、选择题1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A.抽签法B.随机数法C.系统抽样法D.分层抽样法2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.2014年某大学自主招生面试环节中,七位评委为一考生打出分数的茎叶图如图2-1,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()图2-1 A.84,4.84 B.84,1.6C.85,1.6 D.85,44甲乙丙丁平均环数x8.6 8.9 8.9 8.2方差s2 3.5 3.5 2.1 5.6A.甲B.乙C.丙D.丁5.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查,已知高二被抽取的人数为13人,则n=()A.660B.720 C.780D.8006气温/℃1813104-1杯数/杯2434395163若热茶杯数y() A.y=x+6 B.y=x+42 C.y=-2x+60 D.y=-3x+787.x是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x41,x42,…,x100的平均数,则下列各式正确的是()A.x=40a+60b100 B.x=60a+40b100 C.x=a+b D.x=a+b28.在抽查某产品的尺寸过程中,将其尺寸数据分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,则|a -b|=()A.h·m B.hm C.mh D.与m,h无关9.图2-5是某县参加2014年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,…,A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2-6是统计图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180 cm(含160 cm,不含180 cm)的学生人数,那么在流程图中的判断框内应填写的条件是()图2-5图2-6A.i<9? B.i<8? C. i<7? D.i<6?10.图2-2-8是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知:这次考试的优秀率为()图2-2-8A.25%B.30%C.35%D.40%11.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据得出样本频率分布直方图(如图2-2-9).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中用分层抽样方法抽出100人做进一步调查,则在[2500,3000)(单位:元)月收入段中应抽出________人.图2-2-9二、填空题12.下列四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④频率分布直方图中各小长方形的面积等于相应各组的频数.其中正确的有__________(填序号).13.将参加数学竞赛的1000名学生编号如下:0001,0002, 003, (1000)打算从中抽取一个容量为50的样本,按系统抽样的方法把编号分成50个部分,如果第一部分编号为0001,0002,0003,…,0020,第一部分随机抽取一个号码为0015,那么抽取的第40个号码为________.14.超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图2-7,则违规的汽车大约为________辆.图2-715.已知回归直线斜率估计值为1.23,样本点中心为(4,5),则回归方程是____________.三、解答题16.某校文学社开展“红五月”征文活动,作品上交时间为5月2号~5月22号,评委从收到的作品中抽出200,经统计,其频率分布直方图如图2-2-16.(1)样本中的作品落在[6,10)内的频数是多少?(2)估计众数、中位数和平均数各是多少?17.对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(甲2738303735312450乙3329383428364345(1)(单位:m/s)的数据的平均数、中位数、标准差,并判断选谁参加比赛更合适(可用计算器).18.有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)数据落在[18.5,27.5)范围内的可能性为百分之几?19.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图2-8所示的统计图,根据统计图:(1)甲、乙两个交通站的车流量的极差分别是多少?(2)甲交通站的车流量在[10,40]间的频率是多少?(3)甲、乙两个交通站哪个更繁忙?并说明理由.图2-820(1)(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y对销售额x 的回归直线方程;(3)据(2)的结果估计当销售额为1亿元时的利润额.第二章自主检测1一.1.D 2.D 3.C 4.C 5.B 6.C 7.A 8.C 9.B 10.B 11.25 二.12.①③ 13.0795 14.280 15.y ^=1.23x +0.08三.16. 解:(1)作品落在[6,10)内的频率为1-0.08-0.36-0.12-0.12=0.32, ∴频数为200×0.32=64.(2)众数估计值为:10+142=12,中位数的估计值为:从左到右小矩形面积依次为0.08,0.32,0.36,0.12,0.12,由于中位数左、右两边的小矩形面积相等,若设为x ,则(x -10)×0.09=0.1,∴x ≈11.平均数的估计值为0.08×4+0.32×8+0.36×12+0.12×16+0.12×20≈12.17.解:(1)茎叶图如图D31,中间数为数据的十位数.图D31从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比较稳定,总体得分情况比甲好.(2)利用科学计算器,得x 甲=34,x 乙=35.75;s 甲≈7.55,s 乙≈5.70;甲的中位数是33,乙的中位数是35. 综合比较,选乙参加比赛更合适.18.解:(1)分组 频数 频率[12.5,15.5) 6 0.06[15.5,18.5) 16 0.16[18.5,21.5) 18 0.18[21.5,24.5) 22 0.22[24.5,27.5) 20 0.20[27.5,30.5) 10 0.10[30.5,33.5] 8 0.08合计100 1.00 (2)图D32(3)0.18+0.22+0.20=0.60=60%.19.解:(1)甲交通站的车流量的极差为73-8=65;乙交通站的车流量的极差为71-5=66.(2)甲交通站的车流量在[10,40]间的频率为414=27.(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方.从数据的分布情况来看,甲交通站更繁忙.20.解:(1)销售额和利润额的散点图如图D33.图D33(2)所以b ^=200-5×62=0.5, a ^=y -b^x =3.4-6×0.5=0.4. 从而得回归直线方程y ^=0.5x +0.4.(3)当x =10时,y ^=0.5×10+0.4=5.4(百万元).故当销售额为1亿元时,利润额估计为540万元.。
(好题)高中数学必修三第一章《统计》测试题(含答案解析)(1)
一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,152.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A.30 B.60C.70 D.803.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A.40 B.50 C.80 D.100a a>得到一组新4.一组数据的平均数为x,方差为2s,将这组数据的每个数都乘以()0数据,则下列说法正确的是()A.这组新数据的平均数为x B.这组新数据的平均数为a x+C .这组新数据的方差为2asD .这组新数据的标准差为2a s5.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .66.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.77.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .298.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081510.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A .消耗1升汽油,乙车最多可行驶5千米B .以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C .甲车以80千米/小时的速度行驶1小时,消耗10升汽油D .某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油 11.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.给出下列命题:①函数()π4cos 23f x x ⎛⎫=+ ⎪⎝⎭的一个对称中心为5π,012⎛⎫- ⎪⎝⎭;②若,αβ为第一象限角,且αβ>,则tan tan αβ>;③设一组样本数据12,,,n x x x ⋅⋅⋅的平均数是2,则数据1221,21,,21n x x x --⋅⋅⋅-的平均数为3;④函数sin 2y x =的图象向左平移π4个单位长度,得到πsin 24y x ⎛⎫=+ ⎪⎝⎭的图象.其中正确命题的序号是_____________(把你认为正确的序号都填上).14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).17.某种活性细胞的存活率y (%)与存放温度x (℃)之间具有线性相关关系,样本数据如下表所示 存放温度x (℃) 10 4 -2 -8 存活率y (%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.18.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 19.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.20.已知下列命题:①在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好; ②两个变量相关性越强,则相关系数r 就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④两个模型中残差平方和越小的模型拟合的效果越好.⑤回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;⑥若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;⑦从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 其中正确命题的序号是__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:第一天 第二天 第三天 第四天 第五天 就餐人数x (百人) 13 9 8 10 12 原材料y (袋)3223182428(1)根据所给的5组数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)24.某学校进行体验,现得到所有男生的身高数据,从中随机抽取50人进行统计(已知这50个身高介于155cm 到195cm 之间),现将抽取结果按如下方式分成八组:第一组[155,160),第二组[160,165),...,第八组[190,195],并按此分组绘制如图所示的频率分布直方图,其中第六组[180,185)和第七组[185,190)还没有绘制完成,已知第一组与第八组人数相同,第六组和第七组人数的比为5:2.(1)补全频率分布直方图;(2)根据频率分布直方图估计这50位男生身高的中位数;(3)用分层抽样的方法在身高为[170,180]内抽取一个容量为5的样本,从样本中任意抽取2位男生,求这两位男生身高都在[175,180]内的概率.25.某科研课题组通过一款手机APP软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:周跑量(/km周)[)10,15[)15,20[)20,25[)25,30[)30,35[)35,40[)40,45[)45,50[)50,55人数100120130180220150603010(1)在答题卡上补全该市1000名跑步爱好者周跑量的频率分布直方图:注意:请用2B铅笔在答题卡上作图,并将所作条形图涂黑.(2)根据以上图表数据,试求样本的中位数(保留一位小数).(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如下表:周跑量 小于20公里 20公里到40公里 不小于40公里 类别休闲跑者 核心跑者 精英跑者 装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?26.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数: 温度(单位:C ︒)21 23 24 27 29 32死亡数y (单位:株)6 11 20 27 57 77经计算:611266i i x x ===∑,611336i i y y ===∑,()()61557i i i x x y y =--=∑,()62184i i x x =-=∑,()6213930i i y y =-=∑,()621ˆ236.64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(结果精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程0.2303ˆ0.06x ye =,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.D解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s ,则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x xxxxxxxx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axaxaxaxaxaxaxax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.5.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.6.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.7.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.8.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.10.D解析:D【详解】解:对于A,由图象可知当速度大于40km/h时,乙车的燃油效率大于5km/L,∴当速度大于40km/h时,消耗1升汽油,乙车的行驶距离大于5km,故A错误;对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B错误;对于C,由图象可知当速度为80km/h时,甲车的燃油效率为10km/L,即甲车行驶10km时,耗油1升,故行驶1小时,路程为80km,燃油为8升,故C错误;对于D,由图象可知当速度小于80km/h时,丙车的燃油效率大于乙车的燃油效率,∴用丙车比用乙车更省油,故D正确故选D.考点:1、数学建模能力;2、阅读能力及化归思想.11.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】乙选手分数的平均数分别为7885848192767780949384,84, 55++++++++====因此s1<s2,选C.【点睛】本题考查标准差,考查基本求解能力.12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.①③【分析】求解的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④【详解】解:对于①函数的一个对称中心为故①正确;对于②取为第一象限角且但故②错误;对于③一组样本数据的平均数解析:①③ 【分析】 求解5()12f π-的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④. 【详解】 解:对于①,55()4cos()4cos()012632f ππππ-=-+=-=, ∴函数()4cos(2)3f x x π=+的一个对称中心为5(,0)12π-,故①正确;对于②,取94πα,3πβ=,α,β为第一象限角,且αβ>,但tan tan αβ<,故②错误;对于③,一组样本数据1x ,2x ,⋯,n x 的平均数是2,则数据121x -,221x -,⋯,21n x -的平均数为22132⨯-=,故③正确; 对于④,函数sin 2y x =的图象向左平移4π个单位长度,得到sin 2()sin(2)cos242y x x x ππ=+=+=的图象,故④错误.∴正确命题的序号是①③.故答案为:①③. 【点睛】本题考查命题的真假判断与应用,考查三角函数的图象与性质,训练了平均数的求法,属于中档题.14.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题15.【分析】首先求出xy 的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a 的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直 解析:214【分析】首先求出x ,y 的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a 的一元一次方程,解方程即可. 【详解】:14x =(1+2+3+4)=2.5,14y =(4.5+4+3+2.5)=3.5, 将(2.5,3.5)代入线性回归直线方程是ˆy=-0.7x +a ,可得3.5=﹣1.75+a , 故a =214. 故答案为214【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.34【解析】分析:根据表格中数据求出代入公式求得的值从而得到回归直线方程将代入回归方程即可得到结果详解:设回归直线方程由表中数据可得代入归直线方程可得所以回归方程为当时可得故答案为点睛:求回归直线方解析:34 【解析】分析:根据表格中数据求出,x y ,代入公式求得a 的值,从而得到回归直线方程,将6x =代入回归方程即可得到结果.详解:设回归直线方程3,ˆ2yx a =-+, 由表中数据可得1,50x y ==, 代入归直线方程可得53.2a =,所以回归方程为3,253.ˆ2yx =-+ 当6x =时,可得 3.2653.4ˆ23y=-⨯+=,故答案为34. 点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+;回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.18.2【解析】分析:直接利用回归方程将代入即可求得的估计值详解:∵回归方程为∴当时的估计值为故答案为82点睛:本题考查回归方程的运用考查学生的计算能力属于基础题解析:2 【解析】分析:直接利用回归方程,将25x =代入,即可求得y 的估计值. 详解:∵回归方程为0.4 1.8y x =-,∴当25x =时,y 的估计值为 0.425 1.88.2y =⨯-=.故答案为8.2.点睛:本题考查回归方程的运用,考查学生的计算能力,属于基础题.19.【解析】分析:先由茎叶图得数据再根据平均数公式求平均数详解:由茎叶图可知5位裁判打出的分数分别为故平均数为点睛:的平均数为解析:【解析】分析:先由茎叶图得数据,再根据平均数公式求平均数.详解:由茎叶图可知,5位裁判打出的分数分别为8989909191,,,,,故平均数为89+89+90+91+91905=.点睛:12,,,n x x x 的平均数为12nx x x n+++.20.①③④⑦【分析】根据线性回归分析的概念进行分析即可【详解】在线性回归模型中相关指数越接近于1表示回归效果越好①正确;两个变量相关性越强则相关系数r 的绝对值就越接近于1②错误;③正确;两个模型中残差平解析:①③④⑦ 【分析】根据线性回归分析的概念进行分析即可. 【详解】在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好,①正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,②错误;③正确;两个模型中残差平方和越小的模型拟合的效果越好,④正确;回归直线ˆˆˆybx a =+恒过样本点的中心(),x y ,不一定过样本点,⑤错误;若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,并不能说在100个吸烟的人中必有99人患有肺病,⑥错误;从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误,⑦正确.故答案为①③④⑦. 【点睛】本题考查线性回归分析的有关概念,掌握相关概念是解题基础,属于基础题.三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.94.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.22.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii ii x y x yb xx==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题. 23.(1)0.36 6.24y x =+;(2)8.76万吨. 【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量. 【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()616216.30.3617.5ˆiii i i t t y y bt t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨. 【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 24.(1)见解析;(2)174.5cm ;(3)0.3. 【详解】试题分析:(1)先分别算出第六组和第七组的人数,进而算出其频率与组距的比,补全直方图;(2)利用中位数两边频率相等,求出中位数的值;(3)先借助分层抽样的特征求出第四、第五组的人数,再运用列举法列举出所有可能数及满足题设的条件的数,运用古典概型的计算公式求解:解:(1)第六组与第七组频率的和为:∵第六组和第七组人数的比为5:2.∴第六组的频率为0.1,纵坐标为0.02;第七组频率为0.04,纵坐标为0.008.(2)设身高的中位数为,则∴估计这50位男生身高的中位数为174.5(3)由于第4,5组频率之比为2:3,按照分层抽样,故第4组中应抽取2人记为1,2,第5组应抽取3人记为3,4,5则所有可能的情况有:{1,2},{1,3},{1,4},{1,5},{2,3},{2,4},{2,5},{3,4},{3,5},{4,5}共10种满足两位男生身高都在[175,180]内的情况有{3,4},{3,5},{4,5}共3种,因此所求事件的概率为.25.(1)作图见解析;(2)中位数是29.2;(3)平均需要3720元.【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图.(2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱.【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=, 解得29.2x ≈.即样本中位数是29.2.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人, 核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人, 精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元.即该市每位跑步爱好者购买装备,平均需要3720元. 【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题.26.(1)ˆy=6.6x −139.4;(2)(i )回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好;(ii )190. 【分析】(1)根据公式,结合已知数据,分别求得ˆˆ,ba ,则问题得解; (2)根据相关指数的计算公式,结合已知数据,求得2R ,再进行比较即可; (3)将35x =代入回归方程,即可求得结果.【详解】(Ⅰ)由题意得,()()()121557ˆ 6.6384n i i i n i i x x y y b xx ==--==≈-∑∑ ∴ˆa =33−6.6326=−139.4,∴y 关于x 的线性回归方程为:ˆy=6.6x −139.4. (Ⅱ) (i )线性回归方程ˆy=6.6x −138.6对应的相关指数为: ()()6221621ˆ236.641110.06020.93983930i i i i i i y y R yy ==-=-=-≈-=-∑∑, 因为0.9398<0.9522,所以回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好. (ii )由(i )知,当温度35C x ︒=时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35C 时该批紫甘薯死亡株数为190.【点睛】本题考查线性回归直线方程的求解、相关指数的求解,以及用回归直线方程进行估算,属综合中档题.。
最新北师大版高中数学必修三第一章《统计》测试(含答案解析)(2)
一、选择题1.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为192.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .333.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高4.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .165.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④6.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份7.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50 B .70和67C .75和50D .75和678.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.59.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆy bx=+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .5010.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3012.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.2二、填空题13.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示: 等级A + AB + BB -C + CC -D + DE 分数 7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B 级及以上,平均分是64分,这个班级选考物理学业水平等级考的人数至少为______人.14.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 15.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x3 4 5 6y23.5 55.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 16.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.17.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 .18.目前北方空气污染越来越严重,某大学组织学生参加环保知识竞赛,从参加学生中抽取40名,将其成绩(均为整数)整理后画出的频率分布直方图如图,若从成绩是80分以上(包括80分)的学生中选两人,则他们在同一分数段的概率为_______.19.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88,若B 样本数据恰好是A 样本数据每个都加2后所得数据,则,A B 两样本的数字特征(众数、中位数、平均数、方差)对应相同的是__________.20.已知某人连续5次投掷飞镖的环数分别是8,9,10,10,8,则该组数据的方差为______.三、解答题21.为培养学生在高中阶段的数学能力,某校将举行数学建模竞赛.已知该竞赛共有60名学生参加,他们成绩的频率分布直方图如图所示.(1)估计这60名参赛学生成绩的中位数;(2)为了对数据进行分析,将60分以下的成绩定为不合格.60分以上(含60分)的成绩定为合格,某评估专家决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会,记ξ为抽取的4人中,成绩不合格的人数,求ξ的分布列与数学期望;(3)已知这60名学生的数学建模竞赛成绩Z 服从正态分布()2,N μσ,其中μ可用样本平均数近似代替,2σ可用样本方差近似代替(同一组数据用该区间的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,估计此次竞赛受到奖励的人数(结果根据四舍五人保留整数).参考数据:()0.6827P Z μσμσ-<≤+≈,()220.9545P Z μσμσ-<≤+≈,()330.9973P Z μσμσ-<≤+≈.22.某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:日期 4月1日 4月7日 4月15日 4月21日 4月30日 温差x C ︒ 10 11 13 12 8 发芽数y 颗2325302616(1)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.23.某地区不同身高的未成年男性的体重平均值如下表: 身高/cm6070 80 90 100 110 120 130 140 150 160 170 体重/kg 6.137.909.9012.1515.0217.5020.9226.8631.1138.8547.2555.05(1)根据散点图判断,y a bx =+与x y a b =⋅哪一个能比较近似地反映这个地区未成年男性体重kg y 与身高cm x 的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及下表中数据,建立y 关于x 的回归方程(表中ln i i u y =,0.66 1.93e ≈,0.22 1.02e ≈).xyu()1221ii x x =-∑()()121iii x x y y =--∑ ()()121iii x x u u =--∑11524.0532.9614200 6143.3 284参考公式:()()() 1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---⋅==--∑∑∑∑,a y b x=-⋅.24.某科研课题组通过一款手机APP软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:周跑量(/km周)[)10,15[)15,20[)20,25[)25,30[)30,35[)35,40[)40,45[)45,50[)50,55人数100120130180220150603010(1)在答题卡上补全该市1000名跑步爱好者周跑量的频率分布直方图:注意:请用2B铅笔在答题卡上作图,并将所作条形图涂黑.(2)根据以上图表数据,试求样本的中位数(保留一位小数).(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如下表:周跑量小于20公里20公里到40公里不小于40公里类别休闲跑者核心跑者精英跑者装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?25.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表:气温()x℃272930323335数量y121520272836(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 26.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案(1)规定每日底薪50元,快递骑手每完成一单业务提成3元;方案(2)规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单提成5元.该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[)25,35、[)35,45、[)45,55、[)55,65、[)65,75、[)75,85、[]85,95七组,整理得到如图所示的频率分布直方图.(1)求直方图中a 的值;(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替);(3)假设公司中所有骑手都选择了你在(2)中所选的方案,已知公司现有骑手400人,某骑手希望自己的收入在公司众骑手中处于前100名内,求他每天的平均业务量至少应达多少单?【参考答案】***试卷处理标记,请不要删除1.C 解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义2.D解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 3.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.4.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果.176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A .【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.5.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯,故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误. 所以说法正确的是①③. 故选B. 【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.6.D解析:D 【分析】根据图形中给出的数据,对每个选项分别进行分析判断后可得错误的结论. 【详解】对于选项A ,由图可得3月份的销售任务是400台,所以A 正确. 对于选项B ,由图形得2018年月销售任务的平均值为1(3245810743413)10045012⨯+++++++++++⨯=,所以B正确.对于选项C,由图形得第一季度的总销售量为13002001400 1.28302⨯+⨯+⨯=台,所以C正确.对于选项D,由图形得销售量最大的月份是5月份,为800台,所以D不正确.故选D.【点睛】本题考查统计中的识图、用图和计算,解题的关键是从图中得到相关数据,然后再根据要求进行求解,属于基础题.7.B解析:B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解.【详解】设更正前甲,乙,…的成绩依次为a1,a2,…,a50,则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,(a1﹣70)2+(a2﹣70)2+…+(a50﹣70)2=50×75,即102+202+(a3﹣70)2+…+(a50﹣70)2=50×75.更正后平均分为x=150×(80+70+a3+…+a50)=70;方差为s2=150×[(80﹣70)2+(70﹣70)2+(a3﹣70)2+…+(a50﹣70)2]=150×[100+(a3﹣70)2+…+(a50﹣70)2]=150×[100+50×75﹣102﹣202]=67.故选B.【点睛】本题考查平均数与方差的概念与应用问题,是基础题.8.C解析:C【解析】分析:利用平均数的公式,求得6x=,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x的平均数为6,即258924655x xx+++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=, 故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.9.B解析:B【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====, 所以1348022,3224ˆb -==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .10.B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标.【详解】根据题意可得,,由线性回归方程一定过样本中心点,. 故选:B .【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.11.C解析:C【分析】设该样本中高三年级的学生人数为x ,则1800601200x =,解之即可 【详解】设该样本中高三年级的学生人数为x , 则1800601200x=,解得40x =, 故选C .【点睛】本题考查了分层抽样方法的应用问题,属基础题.12.C解析:C【分析】 首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可.【详解】 由题意可得:12345305x x x x x x ++++==, 线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==.本题选择C 选项.【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.15【解析】【分析】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人由题意可得:解得:结合xy 可求的最【详解】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人则即又xy 即当且仅当时取得最小值15取得 解析:15【解析】【分析】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,由题意可得:()70567x 64y 61z 645x y z ⨯+++=⨯+++,解得:z x 10-=,结合x ,y ,z N ∈,可求5x y z +++的最.【详解】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,则()70567x 64y 61z 645x y z ⨯+++=⨯+++,即z x 10-=,又x ,y ,z N ∈,即当且仅当x 0=,y 0=,z 10=时,5x y z +++取得最小值15,取得A 成绩的0人,取得B +成绩的0人,取得B 成绩的10人,这个班级选考物理学业水平等级考的人数至少为15人,故答案为15【点睛】本题考查了实际问题通过数学问题解决,考查了阅读理解及数学建模的能力,属中档题. 14.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x =5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75【解析】【分析】 计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求.【详解】∵4115i i x ==∑,∴154x =, ∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+ a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75.【点睛】 本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.15.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a的值即可.详解:由题意可得:34569==42x+++,2 3.55 5.544y+++==,线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a=⨯+,解得:0.85a=.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.16.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了解析:75.【解析】分析:由频率分布直方图算出各频率,然后计算中位数详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.3240~50的频率为0.250~60的频率为0.1前两组频率0.140.240.380.5=+=<前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x,则()300.380.320.510x-+⨯=解得33.75x=故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.17.【解析】分析:先根据平均数求x的值再求数据的方差详解:由题得所以数据的方差为故答案为点睛:(1)本题主要考查平均数和方差的计算意在考查学生对这些基础知识的掌握水平(2)方差公式为解析:4 5【解析】分析:先根据平均数求x 的值,再求数据的方差. 详解:由题得8+9+8109,10.5x x ++=∴= 所以数据的方差为22222214[(89)(99)(109)(109)(89)]55S =-+-+-+-+-=.故答案为45. 点睛:(1)本题主要考查平均数和方差的计算,意在考查学生对这些基础知识的掌握水平.(2) 方差公式为222121[()()()]n S x x x x x x n =-+-+⋅⋅⋅+-. 18.【解析】设第二组及第五组数据对应矩形的高为a 则10×(a+0015+0025+0035+a+0005)=1解得a=0010故各组的频率依次为:010015025035010005∵前三组的累积频率为 解析:715【解析】设第二组及第五组数据对应矩形的高为a ,则10×(a+0.015+0.025+0.035+a+0.005)=1,解得a=0.010,故各组的频率依次为:0.10,0.15,0.25,0.35,0.10,0.05,∵前三组的累积频率为:0.10+0.15+0.25=0.50,故这次环保知识竞赛成绩的中位数为70;成绩在[80,90)段的人数有10×0.010×40=4人,成绩在[90,100]段的人数有10×0.005×40=2人,从成绩是80分以上(包括80分)的学生中任选两人共有15种不同的基本事件, 其中他们在同一分数段的基本事件有:7, 故他们在同一分数段的概率为7.15 故答案为:715. 19.方差【解析】根据样本数字特征样本数据都加上2后新数据的众数中位数和平均数都增加2只有方差计算公式为结果不变故答案为方差解析:方差【解析】根据样本数字特征,样本数据都加上2后新数据的众数、中位数和平均数都增加2,只有方差计算公式为2211()n i i S x x n ==-∑,结果不变,故答案为方差. 20.【解析】三、解答题21.(1)中位数为65;(2)分布列见解析;期望为5635;(3)50. 【分析】(1)由图中的数据可判断中位数在60分到80分之间,若设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,从而可求得中位数;(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为6人,不合格的人数为4人,则ξ的可能取值为0,1,2,3,4,求出各自的概率,从而可得ξ的分布列与数学期望;(3)由已知求出=64=18μσ,,从而可得()()6418641846820.6827P Z P Z -<≤+=<≤≈,再利用正态分布的对称性可求得结果【详解】(1)设中位数为x ,则()0.005200.01520600.020.5x ⨯+⨯+-⨯=,解得65x =,所以这60名参赛学生成绩的中位数为65.(2)结合频率分布直方图和分层抽样的方法可知,抽取的10人中合格的人数为()0.010.0220106+⨯⨯=,不合格的人数为1064-=.由题意可知ξ的可能取值为0,1,2,3,4.则()464101014C P C ξ===,()134********C C P C ξ===,()2246410327C C P C ξ===,()31464103435C C C P ξ===,()4441014210C P C ξ===. 所以ξ的分布列为所以ξ的数学期望01234142173521035E ξ=⨯+⨯+⨯+⨯+⨯=. (3)由题意可得,()300.005500.015700.02900.012064μ=⨯+⨯+⨯+⨯⨯=,()()()222230640.150640.370640.4σ=-⨯+-⨯+-⨯()290640.2324+-⨯=,则18σ=,由Z 服从正态分布()2,N μσ,得()()6418641846820.6827P Z P Z -<≤+=<≤≈,则()()18210.68270.158652P Z >≈-=,()460.68270.158650.84135P Z >≈+=,所以此次竞赛受到奖励的人数为600.8413550⨯≈.【点睛】此题考查频率分布直方图、分层抽样、离散型随机变量的分布列、正态分布等知识,考查分析问题的能力和计算能力,属于中档题22.(1)532y x =-;(2)线性回归方程是可靠的. 【分析】(1)根据最小二乘法公式,分别将数据代入计算,即可得答案;(2)选取的是4月1日与4月30日的两组数据,即10x =和8x =代入判断即可;【详解】解:(1)由数据得12x =,27y =,3972xy =,23432x =;又31977ii i x y ==∑,321434i i x ==∑;97797254344322b -==-,5271232a =-⨯=-; 所以y 关于x 的线性回归方程为:532y x =-. (2)当10x =时,5103222y =⨯-=,22232-<; 当8x =时,583222y =⨯-=,17162-<, 所得到的线性回归方程是可靠的.【点睛】本题考查最小二乘法求回归直线方程及利用回归方程进行判断拟合效果,考查数据处理能力,求解时注意回归直线必过样本点中心的应用.23.(1)x y a b =⋅;(2) 1.93 1.02x y =⨯.【分析】(1)根据散点图的趋势可以判断回归方程类型.(2)令ln u y =,由x y a b =⋅,得()1212ln ,ln u c x c c b c a =+==,由公式计算可得回归方程.【详解】(1)根据散点图判断,x y a b =⋅能比较近似地反映这个地区未成年男性体重kg y 与身高cm x 的回归方程类型.(2)令ln u y =,由x y a b =⋅,得()1212ln ,ln u c x c c b c a =+==,()()()121112212840.0214200i ii ii x x u u c x x ====--=-∑∑, 而 2.96u =,所以21 2.960.021150.66c u c x =-⋅=-⨯=,0.020.66u x =+,所以0.020.660.660.02 1.93 1.02x x x y e e e +==⨯=⨯,y 关于x 的回归方程为 1.93 1.02x y =⨯.【点睛】本题考查由散点图辨别回归方程的类型,求回归方程,属于中档题.24.(1)作图见解析;(2)中位数是29.2;(3)平均需要3720元.【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图. (2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱.【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=,解得29.2x ≈.即样本中位数是29.2.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人,核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人,精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元. 即该市每位跑步爱好者购买装备,平均需要3720元.【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题. 25.(1)作图见解析,4310111414y x =-;(2)40. 【分析】 (1)描点法得出散点图,根据所给数据及公式计算回归方程的系数,得回归方程; (2)36.6x =代入回归方程计算即得.【详解】(1)散点图如图所示.根据销量与气温对照表知,272930323335316x +++++==,1215207836236y +++++==, 则()()()()()()()()()()()12222222141128131425413421124ni ii n ii x x y y b x x ==---⨯-+-⨯-+-⨯-+⨯+⨯+⨯==-+-+-+++-∑∑129434214==, 43101123311414a y bx =-=-⨯=-, 所以y 关于x 的线性回归方程为4310111414y x =-. (2)当36.6x =时,43101136.640.2401414y =⨯-=≈.答:当最高气温为36.6℃时,可预测这天小卖部卖出的冷饮数量约为40.【点睛】本题考查散点图,考查线性回归直线方程,考查学生的数据处理能力,运算求解能力,属于中档题.26.(1)0.02a =;(2)骑手应选择方案(2),理由见解析;(3)该骑手每天的平均业务量至少应达到73单.【分析】(1)利用所有直方图的面积之和为1可求得a 的值;(2)利用频率分布直方图计算出每天骑手的人均业务量的平均值,进而可计算出两种方案中骑手的日均工资,由此可选择合适的方案;(3)由频率分布直方图可得前4个小组的频率之和为0.6,前5个小组的频率之和为0.8,从而可知该骑手的平均业务量应在[)65,75内,设他的平均业务量为x ,结合题意可得出关于x 的不等式,进而可求得结果.【详解】(1)依题意,各组的频率之和为:100.005100.00510100.0310100.015100.05a a +⨯+⨯+⨯+⨯+⨯+⨯⨯故0.6201a +=,解得0.02a =;(2)快递公司人均每日完成快递数量的平均数是:300.05400.05500.2600.3700.2800.15900.0562+⨯+⨯+⨯+⨯+⨯+⨯=⨯, ∴方案(1)日工资为50623236+⨯=,方案(2)日工资约为()15062445240236+-⨯=>,故骑手应选择方案(2); (3)该骑手要使自己的收入在公司众骑手中处于前100名内,则平均业务量应超过的75%的骑手.前五个小组的频率分别为0.05、0.05、0.2、0.3、0.2.前四个小组的频率之和为0.050.050.20.30.6+++=;前五个小组的频率之和为0.050.050.20.30.20.8++++=;故该骑手的平均业务量应在区间[)65,75内.设他的平均业务量为x ,则()0.6650.020.75x +-⨯≥,解得:72.5x ≥,又x N *∈,故x 的最小值为73.所以,该骑手每天的平均业务量至少应达到73单.【点睛】本题考查利用频率分布直方图求参数、平均数,考查计算能力,属于中等题.。
最新人教版必修三高中数学配套习题第二章 统计 2.2.2 及答案
2.2.2 用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数、中位数、平均数、标准差、方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1.众数、中位数、平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,xn,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2.标准差、方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=______________________________________________________________________ __.(2)方差的求法:标准差的平方s2叫做方差.s2=______________________________________________________________________ __.一、选择题1.下列说法正确的是( )A.在两组数据中,平均值较大的一组方差较大B.平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C.方差的求法是求出各个数据与平均值的差的平方后再求和D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高2.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )A.a>b>c B.a>c>bC.c>a>b D.c>b>a3.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )A.甲B.乙C.甲、乙相同D.不能确定4.一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是( )A.13s2B.s2C.3s2D.9s25.如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为( )A.84,4.84 B.84,1.6C.85,1.6 D.85,0.46.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为xA和xB ,样本标准差分别为sA和sB则( )A.xA >xB,sA>sBB.xA<xB,sA>sBC.xA >xB,sA<sBD.xA<xB,sA<sB7.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________. 8.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.9.若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a 2,…,a20,x这21个数据的方差为________.三、解答题10.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11.下面是一家快餐店所有工作人员(共7人)一周的工资表:(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12.师大附中三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:1.平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3.极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2.2.2 用样本的数字特征估计总体的数字特征知识梳理1.(1)最多(2)中间①中间位置的②平均数(3)①x1+x2+…+xnn②总体中样本中2.(1)1n[(x1-x)2+(x2-x)2+…+(xn-x)2] (2)1n[(x1-x)2+(x2-x)2+…+(xn-x)2]作业设计1.B[A中平均值和方差是数据的两个特征,不存在这种关系;C中求和后还需取平均数;D中方差越大,射击越不平稳,水平越低.]2.D[由题意a=110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b=16,c=18,∴c>b>a.]3.B[方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B.]4.D[s20=1n[9x21+9x22+…+9x2n-n(3x)2]=9·1n(x21+x22+…+x2n-n x2)=9·s2(s2为新数据的方差).]5.C[由题意x=15(84+84+86+84+87)=85.s2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.]6.B[样本A数据均小于或等于10,样本B数据均大于或等于10,故x A<x B,又样本B波动范围较小,故sA >sB.]7.91解析由题意得8.甲解析x甲=9,2S甲=0.4,x乙=9,2S乙=1.2,故甲的成绩较稳定,选甲.9.0.19解析这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19.10.解由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为:2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x甲=110×(5+6×2+7×4+8×2+9)=7010=7(环),x乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9)=5.4.根据以上的分析与计算填表如下:2 S 甲<2S乙,∴甲成绩比乙稳定.②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11.解 (1)平均工资即为该组数据的平均数 x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元). (2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410) =16×2 250=375(元). 这个平均工资能代表一般工作人员一周的收入水平. 12.解 设第一组20名学生的成绩为x i (i =1,2,…,20), 第二组20名学生的成绩为y i (i =1,2,…,20), 依题意有:x =120(x 1+x 2+…+x 20)=90,y =120(y 1+y 2+…+y 20)=80,故全班平均成绩为:140(x 1+x 2+…+x 20+y 1+y 2+…+y 20) =140(90×20+80×20)=85; 又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 21=120(x 21+x 22+…+x 220-20x 2),s 22=120(y 21+y 22+…+y 220-20y 2) (此处,x =90,y =80),又设全班40名学生的标准差为s ,平均成绩为z (z =85),故有s2=140(x21+x22+…+x220+y21+y22+…+y220-40z2)=140(20s21+20x2+20s22+20y2-40z2)=12(62+42+902+802-2×852)=51.s=51.所以全班同学的平均成绩为85分,标准差为51.。
(好题)高中数学必修三第一章《统计》测试(包含答案解析)(1)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格99.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.57.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差8.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >10.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5 B.5,5 C.5,8 D.8,811.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为()A.127 B.128 C.128.5 D.129二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.15.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______. 16.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___17.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.18.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.19.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.某家庭2015-2019年的年收入和年支出情况统计如下表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(精确到0.01); (2)假设受新冠肺炎疫情影响,该家庭2020年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2020年的年支出金额.(参考公式:回归方程ˆˆy bxa =+中斜率和截距的最小二乘估计分别为()()()1122211ˆn niii ii i nniii i x x y y x y n x ybx x xn x ====---⋅⋅==--⋅∑∑∑∑,ˆˆay bx =-) 22.2019年2月13日《西安市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数;(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i )你认为9个名额应该怎么分配?并说明理由;(ii )座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的22⨯列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?(精确到0.1)阅读时间不足8.5小时 阅读时间超过8.5小时附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x (吨)对价格y (万元/吨)和年利润z (万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y =.(1)求表格中c 的值;(2)求y 关于x 的线性回归方程y bx a =+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z 取得最大值?参考公式:1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x,已知这10个分数的平均数90x=,标准差6s=,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221niix nxsn=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某城市200户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,280,[)280,300分组的频率分布直方图如图:(1)求直方图中x 的值;(2)在月平均用电量为[)220,240,[)240,260,[)260,280的三组用户中,用分层抽样的方法抽取20户居民,则月平均用电量在[)220,240的用户中应抽取多少户? (3)求月平均用电量的中位数和平均数.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 4.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.6.A解析:A 【解析】 【分析】由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据, 可得,,又由回归直线的方程,则,即,又因为,解得,故选A. 【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.7.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确.②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++() 平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确. ④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.8.B解析:B 【解析】 分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.26 4.5,4y +++== ∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A【分析】 由题意计算出加入新数据后的平均数,然后比较方差【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定故22s <故选A【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础 10.C解析:C【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图 11.B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标.【详解】根据题意可得,,由线性回归方程一定过样本中心点,. 故选:B .【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题. 12.D解析:D【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数.详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129.故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应 解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等. 14.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族 解析:20【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果.【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==, 解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20.【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题. 15.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差.【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题. 16.【分析】首先求出xy 的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a 的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直 解析:214【分析】首先求出x ,y 的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a 的一元一次方程,解方程即可.【详解】 :14x =(1+2+3+4)=2.5,14y =(4.5+4+3+2.5)=3.5, 将(2.5,3.5)代入线性回归直线方程是ˆy =-0.7x +a ,可得3.5=﹣1.75+a , 故a =214. 故答案为214 【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题17.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归 解析:16- 【解析】【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值【详解】由已知,()12101210330x x x y y y +++=+++= ()12101310x x x x ∴=⨯+++=()12101110y y y y =⨯+++= 代入回归直线方程可得:3132b =+解得16b =- 故答案为16-【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果18.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140解析:140【解析】 根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.19.240【解析】该校2000名男生中体重在的人数为解析:240【解析】该校2000名男生中体重在()7078kg ~的人数为2000(0.020.01)4240⨯+⨯=. 20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15解析:15【解析】依次选取两个数字为23,75,93,21,15,04,……所以选出来的第3个个体的编号为15.三、解答题21.(1)0.780.24y x =+;(2)7.65万元.【分析】(1)利用回归直线方程计算公式,计算出回归直线方程.(2)将9.5x =代入回归直线方程,求得预测值.【详解】(1)由题可得()199.61010.411105x =⨯++++=, ()17.37.588.58.785y =⨯++++=, ()()()5222222110.400.41 2.32ii x x =-=-+-+++=∑, ()()()()()()5110.70.40.5000.40.510.7 1.8i ii x x y y =--=-⨯-+-⨯-+⨯+⨯+⨯=∑,()()()51521 1.845ˆ0.782.3258i ii i i x x y y b x x ==--===≈-∑∑, 45ˆˆ8100.2458x a y b =-⋅=-⨯≈, 则y 关于x 的线性回归方程为0.780.24y x =+.(2)当2020年的年收入为9.5x =万元时,0.789.50.247.65y =⨯+=.所以预测该家庭2020年的年支出金额为7.65万元.【点睛】本小题主要考查回归直线方程的计算,考查利用回归直线方程进行预测,属于中档题. 22.(1)9, (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由见解析, (ii )有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【分析】(1)取各区间中点值乘以频率再相加即得;(2)(i )两组差异明显,用分层抽样计算.(ii )求出两组的人数,填写列联表,计算2K 可得.【详解】(1)60.0370.180.290.35100.19110.09120.049⨯+⨯+⨯+⨯+⨯+⨯+⨯=(2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配(ii )22⨯列联表为:2K 200(40742660) 4.4 3.84166134100100⨯⨯-⨯=≈>⨯⨯⨯, 所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【点睛】本题考查频率分布直方图,分层抽样,考查独立性检验.属于基础题.23.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10(1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22( 1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 24.(1)2.5;(2) 1.49.7y x =-+;(3)年产量约为3.5吨时,年利润z 取得最大值.【分析】(1)由均值概念求得c ;(2)根据所给数据计算系数即得;(3)利用(2)中回归直线方程作出预估值进行计算利润后,再由二次函数性质得最大值.【详解】(1)8764 5.55c y ++++==,解得 2.5c =; (2)1234535x ++++==, 5118275 2.568.5ii i x y ==⨯+⨯++⨯=∑, 1222222168.553 5.5 1.4(125)53n i ii n i i x y nx y b x nx==--⨯⨯===-+++-⨯-∑∑,5.5(1.4)39.7a y bx =-=--⨯=,所以回归直线方程为 1.49.7y x =-+.(3)由(2)2(2)(1.49.7) 1.49.7z y xx x x x =-=-+=-+,所以9.7 3.52( 1.4)x =-≈⨯-(吨)利润最大. 【点睛】本题考查线性回归直线方程,考查回归方程的实际应用.考查学生的数据处理能力,运算求解能力.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为3)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费.【详解】 (1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=>所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为010********x x --==因为10个分数的标准差6s == 所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元;将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元.【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)0.0075;(2)10户;(3)224a =,225.6x =.【分析】(1)由频率和为1列出方程求解x ;(2)求出三组用户的月平均用电量的频率推出比例关系,用20乘以月平均用电量在[)220,240的用户所占比例即可得解;(3)根据中位数左边和右边的直方图面积相等列出等式估计中位数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.【详解】(1)由直方图的性质可得 ()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=,解得0.0075x =,所以直方图中x 的值是0.0075.(2)因为月平均用电量为[)220,240,[)240,260,[)260,280的三组用户的频率分别为0.25、0.15、0.1,所以这三组用户的月平均用电量比例为5:3:2,所以月平均用电量在[)220,240的用户中应抽取5201010⨯=(户). (3)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,则()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=,解得224a =.平均数 1700.041900.192100.222300.252500.152700.12900.05x =⨯+⨯+⨯+⨯+⨯+⨯+⨯ 225.6=,所以月平均用电量的中位数为224,平均数为225.6.【点睛】本题考查统计案例、分层抽样、根据频率分布直方图估计总体的数字特征,属于中档题.。
新北师大版高中数学必修三第一章《统计》测试题(答案解析)(1)
一、选择题1.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .22.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A .40B .50C .80D .1003.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生 B .200号学生C .616号学生D .815号学生4.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表:价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.75.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .636.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .987.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .8.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变10.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A.40 B.45 C.48 D.5011.设有一个直线回归方程为2 1.5=-,则变量x增加一个单位时()y xA.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位12.根据如下样本数据x345678y﹣4.0﹣2.50.5﹣0.5 2.0 3.0得到的回归方程为y bx a=+,则()A.a>0,b<0 B.a>0,b>0 C.a<0,b<0 D.a<0,b>0二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.15.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示:学校A高中B高中C高中D高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D高中中抽取的学生人数为_______.16.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.17.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.18.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.19.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.20.一组样本数据按从小到大的顺序排列为:1-,0,4,x ,y ,14,已知这组数据的平均数与中位数均为5,则其方差为__________.三、解答题21.某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得到数据如下表: 企业abcdefghij满意度x (%) 21 33 24 20 25 21 24 23 25 12 投资额y (万元)79868978767265625944y x (2)约定:投资额y 关于满意度x 的相关系数r 的绝对值在0.7以上(含0.7)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那一所企业,求关闭此企业后投资额y 关于满意度x 的线性回归方程(精确到0.1).参考数据:22.8x =,71y =,1022110248i i x x =-≈∑,10102222111010643.7i i i i x x y y ==⎛⎫⎛⎫--≈ ⎪⎪⎝⎭⎝⎭∑∑,10110406i i i x y x y =-=∑,222851984=,2287116188⨯=.附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆni ii nii x ynx y bxnx==-=-∑∑,ˆˆay bx =-.线性相关系数1222211ni ii n ni i i i x y nx yr x nx y ny ===-=⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑.22.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+的斜率和截距的最小二乘估计分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.23.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x1234567人均纯收入y2.93.3 3.64.4 4.85.2 5.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-24.峰谷电是目前在城市居民当中开展的一种电价类别.它是将一天24小时划分成两个时间段,把8:00—22:00共14小时称为峰段,执行峰电价,即电价上调;22:00—次日8:00共10个小时称为谷段,执行谷电价,即电价下调.为了进一步了解民众对峰谷电价的使用情况,从某市一小区随机抽取了50 户住户进行夏季用电情况调查,各户月平均用电量以[100,300),[300500),,[500700),,[700900),,[9001100),,[]11001300,(单位:度)分组的频率分布直方图如下图:若将小区月平均用电量不低于700度的住户称为“大用户”,月平均用电量低于700度的住户称为“一般用户”.其中,使用峰谷电价的户数如下表: 月平均用电量(度) [)100,300 [)300,500 [)500,700 [)700,900 [)900,1100 []11001300, 使用峰谷电价的户数3913721值作代表);(2)(i )将“一般用户”和“大用户”的户数填入下面22⨯的列联表:一般用户 大用户“使用峰谷电价”有关?附:()22()()()()n ad bc K a b c d a c b d -=++++,25.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下:(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位.参考数据:61936i i y ==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.26.为提高某作物产量,种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了10块试验田的数据,得到下表:技术人员选择模型21y a bx =+作为y 与x 的回归方程类型,令2i i u x =,1i iv y =. (1)由最小二乘法得到线性回归方程v u βα=+,求y 关于x 的回归方程; (2)利用(1)得出的结果,计算当单位面积播种数x 为何值时,单位面积的总产量w xy =的预报值最大?(计算结果精确到0.01)附:对于一组数据()11,u v ,()22,u v …(),n n u v 其回归直线v u βα=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-.参考数据:1500nii u==∑,140ni i v ==∑,12321n i i i u v ==∑,2135642ni i u ==∑ 5.48≈.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x +++++++÷=,635=917=6372x x ,∴+⨯∴=,故选D.2.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =,所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.4.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.5.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可.【详解】各数据为:122031323445454547474850506163,最中间的数为:45,所以,中位数为45.本题选择A选项.【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.6.C解析:C【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可.【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等. 7.D解析:D【解析】【分析】先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.8.B解析:B【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程.详解:123+4=2.54x ++=, 3 3.8 5.26 4.5,4y +++== ∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A【分析】可以通过n P 与0P 之间的大小关系进行判断.【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001n n P P k P =+<,呈下降趋势.【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断. 10.C解析:C【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数.【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=,则前3小组的频率之和为10.250.75-=,则该校报名学生的总人数为360.7548÷=,故选C.【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.D解析:D【解析】分析:利用公式求出ˆb,ˆa ,即可得出结论. 详解:样本平均数x =5.5,y =﹣0.25, ∴()()61i i i x x y y =--∑=23,621()i i x x =-∑=17.5,∴ˆb =2317.5=4635>0, ∴ˆa =﹣0.25﹣4635•5.5<0, 故选:D . 点睛:求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,a b ;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.331【分析】分段抽样由抽取时的分段间隔是20利用等差数列知识得解【详解】由抽取时的分段间隔是20即抽取20名同学其编号构成首项为11公差为20的等差数列第17组抽取的号码故答案为:331【点睛】本解析:331【分析】分段抽样由抽取时的分段间隔是20,利用等差数列知识得解.【详解】由抽取时的分段间隔是20.即抽取20名同学,其编号构成首项为11,公差为20的等差数列,第17组抽取的号码11(171)20331+-⨯=故答案为:331【点睛】本题考查系统抽样,属于基础题.14.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】 设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=.若13x =时,则()()()()2222234577774x x x x -+-+-+-=,则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0,此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=,则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9,此时12345,,,,x x x x x 为4,6,7,8,10,符合题意.故答案为:4【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题. 15.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题解析:24【分析】计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数.【详解】应在D 高中抽取的学生人数为6001442480012001000600⨯=+++. 【点睛】本小题主要考查分层抽样,考查频率的计算,属于基础题.16.【分析】依题意可得解之即得解【详解】依题意可得解得故答案为1320【点睛】本题主要考查分层抽样意在考查学生对这些知识的理解掌握水平和分析推理能力解析:1320【分析】 依题意可得6512111110n ⎛⎫-⨯=⎪⎝⎭,解之即得解. 【详解】 依题意可得6512111110n ⎛⎫-⨯= ⎪⎝⎭,解得1320n =. 故答案为1320【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.17.60【分析】采用分层抽样的方法从该校四个年级的本科生中抽取一个容量为300的样本进行调查的【详解】∵该校一年级二年级三年级四年级的本科生人数之比为4:5:5:6∴应从一年级本科生中抽取学生人数为:故解析:60【分析】采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查的.【详解】∵该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,∴应从一年级本科生中抽取学生人数为:4300604556⨯=+++. 故答案为60. 18.【解析】分析:根据方差与均值的关系求解即可详解:剔除最高分和最低分后的则原始平均分 原始原始方差即原始方差为88点睛:本题考查方差与均值的关系属基础题解析:88【解析】分析:根据方差与均值的关系()()()22D x E xE x ⎡⎤=-⎣⎦ 求解即可. 详解:剔除最高分和最低分后的 222()()()92168480,E x E x D x =+=+=22()8480(152)110240,x E x n ∑=⨯=⨯-=则原始平均分()921?3? 96? 58 9015E x ;⨯++==原始 22229658()8188,15x E x ∑++== 原始方差 222()?()?()81889088.D x E X E X =-=-=原始原始即原始方差为 88 .点睛:本题考查方差与均值的关系,属基础题.19.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12【解析】分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.20.【解析】分析:根据中位数为求出是代入平均数公式可求出从而可得出平均数代入方差公式得到方差详解中位数为这组数据的平均数是可得这组数据的方差是故答案为点睛:本题主要考查平均数与方差属于中档题样本数据的算 解析:743【解析】分析:根据1,0,4,,,14x y -中位数为5,,求出x 是6 ,代入平均数公式,可求出7y =,从而可得出平均数,代入方差公式,得到方差.详解1,0,4,,7,14x -中位数为45,52x +∴=,6x ∴=,∴这组数据的平均数是10461456y -+++++=,7y =可得这组数据的方差是()17436251148163+++++=,故答案为743. 点睛:本题主要考查平均数与方差,属于中档题.样本数据的算术平均数公式为12n 1(x +x +...+x )x n=.样本方差2222121[()()...()]n s x x x x x x n =-+-++-,标准差s = 三、解答题21.(1)0.63;(2)ˆ0.757.4yx =+. 【分析】(1)代入公式即可得出结果.(2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业.重新计算,代入公式即可求出结果.【详解】(1)由题意,根据相关系数的公式,可得10104060.63643.7ii x y x y r -=≈≈∑ (2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业. 重新计算得22.810122162499x ⨯-'===,7110446667499y ⨯-'===, 922222192481022.812924118.4i i xx ='-≈+⨯--⨯=∑, 9194061022.87112449247482i ii x y x y =''-≈+⨯⨯-⨯-⨯⨯=∑. 所以919221982ˆ0.690.7118.49ii i i i x y x y b xx ==''-=≈≈≈'-∑∑, ˆˆ740.692457.4457.4ay bx ''=-≈-⨯=≈. 所以所求线性回归方程为ˆ0.757.4yx =+. 22.(1) 1.60.2y x =+;(2)B 项目的收益更好.【分析】(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出b 的值,最后将样本中心点的坐标代入回归方程求得a 的值即可;(2)分别利用所给关系式以及所求回归方程,求出A ,B 两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好.【详解】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8, 所以1234535x ++++==,2357855y ++++==, 2222221223354758535 1.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯, 则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元; 因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元.因为9.89.7>,所以可预测B 项目的收益更好.【点睛】方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,n n i ii i i x y x x y ==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a=+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.23.(1)0.5 2.3y x =+;(2)6800元.【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程;(2)将9x =代入即可预测.【详解】解:(1)由表可得:123456747++++++==x , 2.9 3.3 3.6 4.4 4.8 5.2 5.9 4.37y ++++++==, 又77211134.4,140ii i i i x y x ====∑∑, 71722217134.474 4.30.5140747i ii i i x y x y b x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元.【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.24.(1)众数600度,平均数640度(2)(i )见解析;(ii )不能有99%的把握认为 “用电量的高低”与“使用峰谷电价”有关.【分析】(1)由频率分布直方图计算出众数与平均数(2)完善列表联并计算出是否有关【详解】(1)根据频率分布直方图的得到100度到300度的频率为:10.0012000.00152000.00122000.00062000.00022000.1-⨯-⨯-⨯-⨯-⨯=,估计所抽取的50户的月均用电量的众数为:500+700=6002(度); 估计所抽取的50户的月均用电量的平均数为:(2000.00054000.0016000.00158000.001210000.000612000.0002)200640=⨯+⨯+⨯+⨯+⨯+⨯⨯=x (度)(2)依题意,22⨯列联表如下2K 的观测值50(2510510)400 6.349 6.6353515302063k ⨯⨯-⨯==≈<⨯⨯⨯ 所以不能有99%的把握认为 “用电量的高低”与“使用峰谷电价”有关.【点睛】本题考查了频率分布直方图,并完善列表联计算线性相关性,较为基础,需要掌握解题方法25.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可.【详解】解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=. 6162221640816 3.5156ˆ46916356i i i ii x y xyb xx ==--⨯⨯===-⨯-∑∑, ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556i i i yy =-=∑.6221621()556110.9737586()i i i ii y y R y y ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好;(2)在(1)中求得的线性回归方程中,取9x =,可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位.【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 26.(1)212.50.03y x=+;(1)9.13x =棵2/m . 【分析】(1)先利用公式和数据计算,αβ,即得v 关于u 的线性回归方程,再代入得到y 关于x 的回归方程即可;(2)先利用(1)的结果计算w xy =,再利用基本不等式求其最大值即可. 【详解】 解:(1)由题意得115010n i i u u ===∑,11410ni i v v ===∑, ∴1011022212321105040.0335*******1010i ii i i u v u v u uβ==-⨯⨯=⨯⋅--≈=-∑∑, 2.5v u αβ=-=. 所以v 关于u 的线性回归方程为0.03 2.5v u =+.则y 关于x 的回归方程为212.503ˆ0.y x=+. (2)根据(1)的结果并结合条件,单位面积的总产量的预报值21252.50.030.03x w x x x==++ 1.833≤=≈. 当且仅当2.50.03x x =时,等号成立,此时9.13x =≈. 即当9.13x =棵2/m 时,单位面积的总产量w 的预报值最大,最大值是1.83. 【点睛】本题考查了非线性回归方程的求法以及方程的应用,属于中档题.。
高中数学必修3(人教B版)第二章统计2.2知识点总结含同步练习题及答案
4. 某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方 图,其中产品净重的范围是 [96, 106] ,样本数据分组为 [96, 98) , [98, 100) , [100, 102) ,
[102, 104) , [104, 106] ,已知样本中产品净重小于 100 克的个数是 36 ,则样本中净重大于或等于 98 克
并且小于 104 克的产品的个数是 (
).
A.90
答案: A 解析: 产品净重小于
B.75
C.60
D.45
100 克的概率为 (0.050 + 0.100) × 2 = 0.300 , 已知样本中产品净重小于 100 克的个数是 36 ,设样本容量为 n , 36 则 ,所以 n = 120 ,净重大于或等于 98 克并且小于 n 104 克的产品的概率为 (0.100 + 0.150 + 0.125) × 2 = 0.75 ,所以样本 中净重大于或等于 98 克并且小于 104 克的产品的个数是 120 × 0.75 = 90 .
).
A.2, 5
答案: C
B.5, 5
C.5, 8
D.8, 8
3. 样本中共有五个个体,其值分别为 a, 0, 1, 2, 3 ,若该样本的平均值为 1 ,则样本方差为 (
− − 6 A.√ 5
答案: D 解析:
)
B.
6 5
C.√2
D.2
a+0+1+2+3 = 1 ,得 a = −1 . 5 1 所以 s2 = [(−1 − 1)2 + (0 − 1)2 + (1 − 1)2 + (2 − 1)2 + (3 − 1)2 ] = 2 . 5
(易错题)高中数学必修三第一章《统计》测试题(答案解析)
一、选择题1.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为192.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元3.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A .40B .50C .80D .1004.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.55.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .167.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙8.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795 B .0780C .0810D .08159.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合 11.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为__________.14.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.15.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示:宽带 租户业主已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.16.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
北师大版高中数学必修三第一章《统计》测试(含答案解析)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .333.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量4.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.55.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度6.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④7. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .639.已知x ,y 取值如下表:x0 1 4 5 6 8 y1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.1310.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.212.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带 租户业主已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.18.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________19.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.20.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.三、解答题21.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t==--=-∑∑,a y bt =-.(参考数据:()()616.3iii t t y y =--=∑)22.画糖人是一种以糖为材料在石板上进行造型的民间艺术.某糖人师傅在公园内画糖人,每天卖出某种糖人的个数与价格相关,其相关数据统计如下表: (1)根据表中数据求y 关于x 的回归直线方程;(2)若该种造型的糖人的成本为2元/个,为使糖人师傅每天获得最大利润,则该种糖人应定价多少元?(精确到1元)参考公式:回归直线方程^^^y b x a =+,其中^121()()()niii nii x x y y b x x ==--=-∑∑,^^^a y b x =-.23.某“双一流”大学专业奖学金是以所学专业各科考试成绩作为评选依据,分为专业一等奖学金(奖金额3000元)、专业二等奖学金(奖金额1500元)及专业三等奖学金(奖金额600元),且专业奖学金每个学生一年最多只能获得一次.图(1)是统计了该校2018年500名学生周课外平均学习时间频率分布直方图,图(2)是这500名学生在2018年周课外平均学习时间段获得专业奖学金的频率柱状图.(Ⅰ)求这500名学生中获得专业三等奖学金的人数;(Ⅱ)若周课外平均学习时间超过35小时称为“努力型”学生,否则称为“非努力型”学生,列22⨯联表并判断是否有99.9%的把握认为该校学生获得专业一、二等奖学金与是否是“努力型”学生有关?(Ⅲ)若以频率作为概率,从该校任选一名学生,记该学生2018年获得的专业奖学金额为随机变量X ,求随机变量X 的分布列和期望.22()()()()()n ad bc K a b c d a c b d -=++++24. 2.5PM 是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM 的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM 浓度的数据如下表:时间周一 周二 周三 周四 周五 车流量x (万辆)50 51 54 57 58 2.5PM 的浓度y (微克/立方米)3940424445(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标; (2)用最小二乘法求出y 关于x 的线性回归方程y bx a =+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM 的浓度是多少?(参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-)25.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下: x 的分组 [0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).26.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案(1)规定每日底薪50元,快递骑手每完成一单业务提成3元;方案(2)规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单提成5元.该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[)25,35、[)35,45、[)45,55、[)55,65、[)65,75、[)75,85、[]85,95七组,整理得到如图所示的频率分布直方图.(1)求直方图中a 的值;(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替);(3)假设公司中所有骑手都选择了你在(2)中所选的方案,已知公司现有骑手400人,某骑手希望自己的收入在公司众骑手中处于前100名内,求他每天的平均业务量至少应达多少单?【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 3.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.4.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.5.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.6.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯,故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误.所以说法正确的是①③.故选B.【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.7.C解析:C【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果.【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确;从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确;从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确;由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C.【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键. 8.A解析:A【解析】【分析】由茎叶图确定所给的所有数据,然后确定中位数即可.【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63,最中间的数为:45,所以,中位数为45.本题选择A 选项.【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.9.D解析:D【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果.详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=, 因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.10.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】 乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==== 因此s 1<s 2,选C.【点睛】本题考查标准差,考查基本求解能力.11.C解析:C【分析】 首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可.【详解】 由题意可得:12345305x x x x x x ++++==, 线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==.本题选择C 选项.【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.12.C解析:C【解析】【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可【详解】()19.59.39.18.99.79.35x =⨯++++= ()19289898793905y =⨯++++= 代入到回归方程为7.5ˆyx a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。
(完整版)高一数学必修三《统计》知识点+练习+答案(最新整理)
三、
⑥控制图
总体特征的估计
中心线——y=μ 上界线——y=μ+3σ 下界线——y=μ-3σ
1、特征数:总体平均数 μ
总体方差 2 总体标准差
样本平均数 x
样本方差 s2 或 s*2
样本标准差
s 或 s*
1 2、有关公式:样本平均数 : x = (x1+x2 +...+xn)
n
样本方差
1 : s2 或 s*2 s 2= n [(x1- x )2+(x2+ x )2+...+(xn- x )2]
样本,则抽取的 m 个个体中带有标记的个数估计为( )
m
A. N·
M
M
B. m·
N
M
C. N·
D. N
m
8.从 60 件产品中抽取 10 件进行检查,写出抽取样本的过程.
9.某车间工人已加工一种轴 100 件,为了了解这种轴的直径,要从中抽出 10 件在同一条件 下测量(轴的直径要求为 20 mm±0.5 mm),如何采用简单随机抽样法抽取上述样本?
当总体由差异 明显的几部分 组成时,常将 总体分成几部 分,然后按照 各部分所占的 比进行抽样, 这样的抽样叫 ∽。其中分成 的各部分叫做 层。
各自
要点
从总 体中 逐个 抽取
总体 均分 成几 部分 按事 先确 定的 规则 在各 部分 抽取 将总 体分 成几 层, 分层 进行 抽取
方法步骤
1、 抽签法: ①编②放③抽
必修三统计知识点
一、
类 别 内 容 名 称
简 单 随 机 抽 样
系 统 抽 样
分 层 抽 样
抽样方法
定义
(压轴题)高中数学必修三第一章《统计》测试(包含答案解析)(1)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为193.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .24.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .988.已知x ,y 取值如下表:x0 1 4 5 6 8 y 1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.139.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081510.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .2911.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,812.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.15.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.16.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中B 高中C 高中D 高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.17.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.18.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表: 学生序号i 1 2 3 4 5 6 7 数学成绩i x 60 65 70 75 85 87 90 物理成绩i y70778085908693①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.23.庐江县统计局统计了该县2019年10户家庭的年收入和年饮食支出的统计资料如下表:(1)由散点图可知y 与x 是线性相关的,求线性回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. 附:回归直线的斜率和截距的最小二乘估计公式分别为:1122211()ˆˆ).ˆ(,()nniii ii i nni ii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑(参考数据:1010211115,406i ii i i x yx ====∑∑)24.脐橙营养丰富,含有人体所必需的各类营养成份,若规定单个脐橙重量(单位:千克)在[0.1,0.3)的脐橙是“普通果”,重量在[0.3,0.5)的磨橙是“精品果”,重量在[0.5,0.7]的脐橙是“特级果”,有一果农今年种植脐橙,大获丰收为了了解脐橙的品质,随机摘取100个脐橙进行检测,其重量分别在[0.1,0.2),[0.2,0.3),[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7]中,经统计得到如图所示频率分布直方图(1)将频率视为概率,用样本估计总体.现有一名消费者从脐橙果园中,随机摘取5个脐橙,求恰有3个是“精品果”的概率.(2)现从摘取的100个脐橙中,采用分层抽样的方式从重量为[0.4,0.5),[0.5,0.6)的脐橙中随机抽取10个,再从这10个抽取3个,记随机变量X表示重量在[0.5,0.6)内的脐橙个数,求X的分布列及数学期望.25.从某小区抽取100个家庭进行月用电量调查,发现其月用电量都在50度至350度之间,频率分布直方图如图所示.(1)根据直方图求x的值,并估计该小区100个家庭的月均用电量(同一组中的数据用该组区间的中点值作代表);(2)从该小区已抽取的100个家庭中, 随机抽取月用电量超过300度的2个家庭,参加电视台举办的环保互动活动,求家庭甲(月用电量超过300度)被选中的概率.26.在社会实践活动中,“求知”小组为了研究某种商品的价格x(元)和需求量y(件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料:日期11月1日11月2日11月3日11月4日11月5日x(元)1416182022y(件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.C解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义3.D解析:D【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x +++++++÷=,635=917=6372x x ,∴+⨯∴=,故选D.4.A解析:A 【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小. 【详解】 由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+,22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选:A . 【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.5.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.8.D解析:D 【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果. 详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=,因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.9.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.10.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.11.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图12.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.二、填空题13.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题 解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差. 【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.14.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.15.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20.【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.16.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题解析:24 【分析】计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数. 【详解】应在D 高中抽取的学生人数为6001442480012001000600⨯=+++.【点睛】本小题主要考查分层抽样,考查频率的计算,属于基础题.17.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.18.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630 【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630. 19.【解析】因此 解析:4.7【解析】18914779,0.80.1424222ˆx y a====∴=-⨯=- 因此0.860.1 4.7y =⨯-= 20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)不同的样本的个数为432418C C . (2)①分布列见解析,()E ξ97=. ②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分. 【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩. 【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名,18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名, ∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为∴()0123353535357E ξ=⨯+⨯+⨯+⨯=. ②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+. 当96x =时,0.659633.6096y =⨯+=. 可预测该同学的物理成绩为96分. 【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).23.(1)ˆ0.150.9yx =+;(2)2.25万元. 【分析】(1)由已知数据求出x 和y ,根据所给公式求出ˆb与ˆa 的值,即可得y 关于x 的线性回归方程;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】解:(1)依题意可计算得, 1(24466677810)610x =+++++++++=, 1(1.0 1.5 1.6 2.0 1.8 1.9 1.8 2.0 2.1 2.3) 1.810y =+++++++++=. 236x =,10.8x y ⋅=,又101115i ii x y==∑,1021406i i x ==∑,1022110151ˆ0.1100ii i iix y x ybxx ==∴=≈⋅--∑∑,ˆˆ0.9ay bx =-=,ˆ0.150.9y x ∴=+, ∴所求的线性回归方程为ˆ0.150.9yx =+. (2)当9x =时,ˆ0.1590.9 2.25y=⨯+=(万元), ∴估计大多数年收入9万元的家庭每年饮食支出约为2.25万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题. 24.(1)516(2)见解析 【分析】(1)根据题意,先得到随机摘取一个脐橙,是“精品果”的概率为0.5,并且随机摘取5个脐橙,其中“精品果”的个数符合二项分布,再根据二项分布的概率公式,列出式子,得到答案.(2)先判断出X 可取的值为0,1,2,3,分别计算出其概率,然后列出概率分布列,再根据随机变量的数学期望公式,计算出其数学期望. 【详解】(1)从从脐橙果园中,随机摘取5个脐橙,其中“精品果”的个数记为Y , 由图可知,随机摘取一个脐橙,是“精品果”的概率为:0.2+0.3=0.5, ∴Y ~B (5,12), ∴随机摘取5个脐橙,恰有3个是“精品果”的概率为: P (Y =3)3325115()()2216C ==. (2)依题意,抽取10个脐橙,重量为[0.3,0.4),[0.4,0.5)的个数分别为6和4, X 的可能取值为0,1,2,3,P (X =0)3631016C C ==,P (X =1)216431012C C C ==, P (X =2)1264310310C C C ==,P (X =3)34310130C C ==, ∴X 的分布列为:E (X )1131601236210305=⨯+⨯+⨯+⨯=. 【点睛】本题考查满足二项分布的概率问题,以及随机变量的概率分布列和数学期望,属于中档题. 25.(1)x=0.0044, 月均用电量约为186度;(2).【详解】 (1)由题意得,.设该小区100个家庭的月均用电量为S 则9+22.5+52.5+49.5+33+19.5=186.(2),所以用电量超过300度的家庭共有6个.分别令为甲、A 、B 、C 、D 、E ,则从中任取两个,有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )、(A,B )、(A,C )、(A,D )、(A,E )、(B,C )、(B,D )、(B,E )、(C,D )、(C,E )、(D,E )15种等可能的基本事件,其中甲被选中的基本事件有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )5种. 家庭甲被选中的概率.26.(1) 1.534y x =-+;(2)详见解析. 【分析】(1)利用表中数据,分别求得:,x y ,再利用公式求得,b a ,然后写出回归直线方程即可. (2)根据(1)中的回归直线方程,令14x =, 22x =求得相应的y 值,再与实际值结合误差要求比较即可. 【详解】 由表中数据得: ()()1116182018,10747,33x y =++==++= 311610187204366i ii x y==⨯+⨯+⨯=∑,322221161820980ii x==++=∑,3132221336631871.59803183i ii i i x y x yb x x==--⨯⨯===--⨯-∑∑,()7 1.51834a y bx =-=--⨯=,所以y 关于x 的线性回归方程是 1.534y x =-+.(2)当14x =时, 1.5143413y =-⨯+=,131212-=<, 当22x =时, 1.522341y =-⨯+=,1322-=≤, 所以(1)中所得到的线性回归方程是可靠的. 【点睛】本题主要考查回归直线方程的求法以及应用,还考查了运算求解的能力,属于中档题.。
(典型题)高中数学必修三第一章《统计》检测题(包含答案解析)(1)
一、选择题1.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .2.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+3.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是( )A .24B .48C .56D .644.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙5.小明同学在做市场调查时得到如下样本数据x1 3 6 10 y 8a42他由此得到回归直线的方程为ˆ 2.115.5yx =-+,则下列说法正确的是( ) ①变量x 与y 线性负相关 ②当2x =时可以估计11.3y = ③6a = ④变量x 与y 之间是函数关系 A .①B .①②C .①②③D .①②③④6.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1967.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .188.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,49.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .1610.甲、乙两名同学在五次数学考试中的成绩统计如下面的茎叶图所示,若甲、乙两人的平均成绩分别是1x ,2x ,观察茎叶图,下列结论正确的是( )A .12x x <,乙比甲成绩稳定B .12x x >,乙比甲成绩稳定C .12x x <,甲比乙成绩稳定D .12x x >,甲比乙成绩稳定11.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .1512.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .13二、填空题13.对具有线性相关关系的变量x ,y 有一组观测数据()(),1,2,3,,8i i x y i =,其回归直线方程是12y x a =+,且8116i i x ==∑,8148i i y ==∑,则实数a =__________.14.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________. 15.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.16.若1a ,2a,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.17.下表记录了某公司投入广告费x 与销售额y 的统计结果,由表可得线性回归方程为^^^y b x a =+,据此方程预报当6x =时,y =__. x4 2 35 y 49263954附:参考公式:^1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,^^^a y b x =-18.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.19.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.某地政府拟在该地一水库上建造一座水电站,用泄流水量发电.下图是根据该水库历年的日泄流量的水文资料画成的日泄流量X (单位:万立方米)的频率分布直方图(不完整),已知[)0,120X ∈,历年中日泄流量在区间[30,60) 的年平均天数为156,一年按364天计.(Ⅰ)请把频率分布直方图补充完整;(Ⅱ)该水电站希望安装的发电机尽可能运行,但每30万立方米的日泄流量才够运行一台发电机,如6090X ≤<时才够运行两台发电机,若运行一台发电机,每天可获利润为4000元,若不运行,则该台发电机每天亏损500元,以各段的频率作为相应段的概率,以水电站日利润的期望值为决策依据,问:为使水电站日利润的期望值最大,该水电站应安装多少台发电机?22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表: 学生序号i 1 2 3 4 5 6 7 数学成绩i x 60 65 70 75 85 87 90 物理成绩i y70778085908693①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.xy721()ii x x =-∑71()()iii x x y y =--∑7683812 52623.某湿地公园占地约44万2m ,风景优美,吸引了大批市民前来游玩、健身.当地政府为了开展全民健身活动,组织了跑步队,并给每位队员发放统一服装,吸引了越来越多的市民加入跑步队.组织者统计了跑步队成立一个月内每一天队员的人数,用x 表示跑步队成立的天数,y 表示当天跑步队的人数,给出部分数据如下表所示:经研究发现,可以用y c =+y 关于x 的回归方程类型. (1)根据表中的数据,建立y 关于x 的回归方程; (2)请预测第36天跑步队的人数. 参考数据:其中5115i i x x ==∑,5115i i y y ==∑,i t =5115i i t t ==∑.参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v a u β=+的斜率和截距的最小二乘法估计公式分别为:1221ni i i nii u v nuvunuβ==-=-∑∑,a v u β=-.24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下:(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案(1)规定每日底薪50元,快递骑手每完成一单业务提成3元;方案(2)规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单提成5元.该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[)25,35、[)35,45、[)45,55、[)55,65、[)65,75、[)75,85、[]85,95七组,整理得到如图所示的频率分布直方图.(1)求直方图中a 的值;(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替);(3)假设公司中所有骑手都选择了你在(2)中所选的方案,已知公司现有骑手400人,某骑手希望自己的收入在公司众骑手中处于前100名内,求他每天的平均业务量至少应达多少单?26.某校为“全国数学联赛”选拔人才,分初赛和复赛两个阶段进行,规定:分数不小于本次考试成绩中位数的具有复赛资格,该校有900名学生参加了初赛,所有学生的成绩均在区间(]30,150内,其频率分布直方图如图.(1)根据频率分布直方图,估计获得复赛资格应划定的最低分数线; (2)根据频率分布直方图,估计本次初赛的平均成绩.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.D解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.3.B解析:B 【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解. 【详解】 由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=, 又前3个小组的频率之比为1:2:3,所以第二组的频率为20.750.256⨯=, 所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.4.C解析:C 【解析】 【分析】利用公式求得x 甲和x 乙,从而得到x 甲和x 乙的大小,观察两组数据的波动程度,可以得到2s 甲与2s 乙的大小,从而求得结果.【详解】 甲班平均身高1691621501601591605x ++++==甲,乙班平均身高1801601501501651615x ++++==乙,所以x x <甲乙,方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距则比加大,波动比较大,所以22s s >乙甲,故选C. 【点睛】该题考查的是有关所给数据的平均数与方差的比较大小的问题,涉及到的知识点有平均数的公式,观察数据波动程度来衡量方差的大小,属于简单题目.5.C解析:C 【解析】 【分析】根据数据和回归方程对每一个选项逐一判断得到答案. 【详解】① 2.1b =-⇒变量x 与y 线性负相关,正确 ②将2x =代入回归方程,得到11.3y =,正确 ③将(,)x y 代入回归方程,解得6a =,正确 ④变量x 与y 之间是相关关系,不是函数关系,错误 答案为C 【点睛】本题考查了回归方程的相关知识,其中中心点(,)x y 一定在回归方程上是同学容易遗忘的知识点.6.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.7.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.8.C解析:C分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.9.B解析:B 【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值 【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=故选B 【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错10.A解析:A 【解析】 【分析】根据茎叶图中的数据,即可计算出两人平均分,再根据茎叶图的分布情况可知乙成绩稳定. 【详解】 由茎叶图知, 甲的平均数是110210410511413391.65x ++++==,乙的平均数是2108115116122123116.85x ++++==,所以12x x <,从茎叶图上可以看出乙的数据比甲的数据集中,乙比甲成绩稳定 故选:A .本题考查茎叶图中两组数据的平均数和稳定程度,平均数要进行计算,稳定程度可通过计算方差或通过数据排布形状作出比较.11.C解析:C 【详解】 抽取比例为150130000200=, 1400020200∴⨯=, 抽取数量为20,故选C.12.C解析:C 【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论. 【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列, ∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19, 由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25, ∴做问卷C 的人数为25﹣14+1=12, 故选C . 【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.二、填空题13.5【分析】求出数据的中心(26)代入回归直线方程即可【详解】由已知∵回归直线方程一定过样本点中心∴∴故答案为:5【点睛】本题考查了线性回归方程考查了计算能力和逻辑推理能力属于一般题目解析:5 【分析】求出数据的中心(2,6),代入回归直线方程即可. 【详解】由已知2x =,6y =,∵回归直线方程12y x a =+一定过样本点中心(),x y∴1622a =⨯+ ∴5a = 故答案为:5 【点睛】本题考查了线性回归方程,考查了计算能力和逻辑推理能力,属于一般题目.14.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.15.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方解析:11 【分析】根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】根据题意,一组样本数据1210,,...,x x x ,且22212102020x x x ++⋯+=,平均数9x =,则其方差()()()()22221210110S x x x x x x =-+-+⋯+-()2222121011012110x x x x =++⋯+-=,则其标准差11S ==,故答案为:11. 【点睛】本题主要考查平均数、方差与标准差,属于基础题. 样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =16.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平 解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20. 【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.17.5【分析】根据表中数据先求出回归方程然后将代入可得到答案【详解】由题意故回归方程为当时【点睛】本题考查了回归方程的求法考查了学生的计算求解能力属于基础题解析:5 【分析】根据表中数据,先求出回归方程,然后将6x =代入,可得到答案. 【详解】 由题意,2345 3.54x +++==,49263954424y +++==,4144492263395544 3.54263558847i ii x y xy =-=⨯+⨯+⨯+⨯-⨯⨯=-=∑,2211649254 3.5 3.55nii x nx =-=+++-⨯⨯=∑,479.45ˆb ==,42ˆˆ9.4 3.59.1ay bx =-=-⨯=,故回归方程为9.194ˆ.y x =+, 当6x =时,9.19.4665.5y =+⨯=. 【点睛】本题考查了回归方程的求法,考查了学生的计算求解能力,属于基础题.18.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】试题分析:由平均数及方差的定义可得10685675x ++++==;222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==.考点:样本数据的数字特征:平均值与方差.19.60【分析】采用分层抽样的方法从该校四个年级的本科生中抽取一个容量为300的样本进行调查的【详解】∵该校一年级二年级三年级四年级的本科生人数之比为4:5:5:6∴应从一年级本科生中抽取学生人数为:故解析:60 【分析】采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查的. 【详解】∵该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6, ∴应从一年级本科生中抽取学生人数为:4300604556⨯=+++.故答案为60.20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(Ⅰ)见解析;(Ⅱ)要使水电站日利润的期望值最大,该水电站应安装3台发电机. 【详解】试题分析:(Ⅰ)可利用频率分布直方图的性质,补全图像;(Ⅱ)分别计算安装1台,2台,3台的日利润的期望值,然后进行比较. (Ⅰ)在区间[30,60)的频率为15633647= 31==73070⨯频率组距, 设在区间[0,30)上,a 频率组距=, 则11130170105210a ⎛⎫+++⨯= ⎪⎝⎭, 解得1210a =, 补充频率分布直方图如图;(Ⅱ)记水电站日利润为Y 元.由(Ⅰ)知:不能运行发电机的概率为17,恰好运行一台发电机的概率为37,恰好运行二台发电机的概率为27,恰好运行三台发电机的概率为17,①若安装1台发电机,则Y 的值为-500,4000,其分布列为Y -5004000P1767E (Y )=5004000777-⨯+⨯=; ②若安装2台发电机,则Y 的值为-1000,3500,8000,其分布列为 Y -100035008000P17 37 37E (Y )=1000350080007777-⨯+⨯+⨯=; ③若安装3台发电机,则Y 的值为-1500,3000,7500,12000,其分布列为E (Y )=1500300075001200077777-⨯+⨯+⨯+⨯=; ∵345003350023500777>> ∴要使水电站日利润的期望值最大,该水电站应安装3台发电机. 22.(1)不同的样本的个数为432418C C . (2)①分布列见解析,()E ξ97=. ②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分. 【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩. 【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名, 18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名, ∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为∴()0123353535357E ξ=⨯+⨯+⨯+⨯=.②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+. 当96x =时,0.659633.6096y =⨯+=. 可预测该同学的物理成绩为96分. 【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).23.(1)18y =+;(2)198人. 【分析】 (1)令t =,y c d t =+⋅,计算得3t =,511920i i i t y ==∑,52155i i t ==∑,30d =,把样本点的中心()3,108代入108303c =+⨯,得18c =,可得1830y t =+,所以18y =+(2)将36x =代入18y =+. 【详解】(1)∵y c =+,令t =∴y c d t =+⋅,∵1234535t ++++==,108y =,511920i i i t y ==∑,52155i i t ==∑, ∴515222151920531083055535i ii ii t y t yd tt==--⨯⨯===-⨯-∑∑,把样本点的中心()3,108代入108303c =+⨯,得18c =, ∴1830y t =+,∴y 关于x的回归方程式:18y =+; (2)将36x =代入18y =+18198y =+=, 故预测第36天跑步队的人数为198人. 【点睛】本题考查了转化化归思想,考查了利用最小二乘法求回归直线方程,考查了利用回归方程对总体进行预测,属于中档题.24.(1)4%,13%.;(2)平均数为0.20,方差的估计值为0.0364. 【分析】(1)直接根据频率分布表即可得到答案.(2)首先根据频率分布表估计企业产值增长率的平均数,然后再求方差即可. 【详解】(1)制造业企业中产值增长率不低于60%的企业比例为4100%4%100⨯=, 产值负增长的企业比例13100%13%100⨯=, 所以制造业企业中产值增长率不低于60%的企业比例4%,产值负增长的企业比例13%. (2)100家制造业企业产值增长率的平均数为()1130.10400.10350.3080.5040.700.20100⎡⎤⨯-+⨯+⨯+⨯+⨯=⎣⎦, 方差为()222221130.100.2040(0.100.20)35(0.300.20)8(0.500.20)4(0.700.20)100⎡⎤⨯--+⨯-+⨯-+⨯-+⨯-⎣⎦0.0364=所以制造业企业产值增长率的平均数为0.20,方差的估计值为0.0364. 【点睛】本题第一问考查频率分布表,第二问考查根据频率分布表估计平均值和方差,同时考查学生的计算能力,属于中档题.25.(1)0.02a =;(2)骑手应选择方案(2),理由见解析;(3)该骑手每天的平均业务量至少应达到73单. 【分析】(1)利用所有直方图的面积之和为1可求得a 的值;(2)利用频率分布直方图计算出每天骑手的人均业务量的平均值,进而可计算出两种方案中骑手的日均工资,由此可选择合适的方案;(3)由频率分布直方图可得前4个小组的频率之和为0.6,前5个小组的频率之和为0.8,从而可知该骑手的平均业务量应在[)65,75内,设他的平均业务量为x ,结合题意可得出关于x 的不等式,进而可求得结果. 【详解】(1)依题意,各组的频率之和为:100.005100.00510100.0310100.015100.05a a +⨯+⨯+⨯+⨯+⨯+⨯⨯ 故0.6201a +=,解得0.02a =;(2)快递公司人均每日完成快递数量的平均数是: 300.05400.05500.2600.3700.2800.15900.0562+⨯+⨯+⨯+⨯+⨯+⨯=⨯, ∴方案(1)日工资为50623236+⨯=,方案(2)日工资约为()15062445240236+-⨯=>,故骑手应选择方案(2); (3)该骑手要使自己的收入在公司众骑手中处于前100名内,则平均业务量应超过的75%的骑手.前五个小组的频率分别为0.05、0.05、0.2、0.3、0.2. 前四个小组的频率之和为0.050.050.20.30.6+++=; 前五个小组的频率之和为0.050.050.20.30.20.8++++=;故该骑手的平均业务量应在区间[)65,75内.设他的平均业务量为x ,则()0.6650.020.75x +-⨯≥,解得:72.5x ≥, 又x N *∈,故x 的最小值为73.所以,该骑手每天的平均业务量至少应达到73单. 【点睛】本题考查利用频率分布直方图求参数、平均数,考查计算能力,属于中等题. 26.(1)100分;(2)97. 【分析】(1)根据题意,由频率分布直方图求出[]30,90的频率为0.35,[]90,110的频率为0.3,由0.30.350.650.5+=>知:最低分数线在(]90,110之间,进而求出中位数,即可估计出本次考试复赛资格最低分数线;(2)利用频率分布直方图计算出各组的频率,即可估计本次初赛的平均成绩. 【详解】解:(1)由题意知[]30,90的频率为:()200.00250.00750.00750.35⨯++=, 由题意知[]90,110的频率为: 200.01500.3⨯=, 由0.30.350.650.5+=>知:最低分数线在(]90,110之间, 设最低分数线为x ,且(]90,110x ∈. 由()0.35900.0150.5x +-⨯=得:100x =, 故本次考试复赛资格最低分数线应划为100分.(2)由题意可知:初赛分数在区间(]30,50,(]50,70,(]70,90,(]90,110,(]110,130,(]130,150的频率分别为:0.05,0.15,0.15,0.3,0.25,0.1, 所以本次初赛的平均分为:400.05600.15800.151000.31200.251400.197⨯+⨯+⨯+⨯+⨯+⨯=.【点睛】本题考查频率分布直方图的频率、中位数、平均数的求法,考查解题分析和计算能力.。
高中数学必修三《统计综合问题》课后练习(含答案)
统计综合问题课后练习主讲教师:熊丹 北京五中数学教师题一:某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .先从老年人中剔除1人,再用分层抽样题二:某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到下列抽样方法( )①简单随机抽样 ②系统抽样 ③分层抽样A .②③B .①③C .③D .①②③题三:将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91, 现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A .1169B .367C .36D .677题四:已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.①若第1组抽出的号码为2,则所有被抽出职工的号码为________;②分别统计这5名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,则该样本的方差为________.题五:某初级中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…300;使用系统抽样时,将学生统一编号为1,2,…300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277;②5,9,100,107,121,180,195,221,265,299;③11,41,71,101,131,161,191,221,251,281;④31,61,91,121,151,181,211,241,271,300关于上述样本的下列结论中,正确的是( )A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样题六:从已编号为1—50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32题八:某人才市场2004年上半年应聘和招聘人数排名前5个类别的情况如下图所示,若用同一类别中应聘人数与招聘人数比值的大小来衡量该类别的就业情况,则根据图中信息,下列对就业形势的判断一定正确的是()提示:请注意理解图片是应聘和招聘人数排名前5个类别的情况.A.医学类好于营销类B.金融类好于计算机类C.外语类最紧张D.建筑类好于法律类题九:已知数据x1,x2,…,x n的平均数是4,则一组新数据x1+7,x2+7,…,x n+7的平均数是.题十:已知两组数x1, x2,…, x3和y1, y2,…, y3;它们的平均数分别是a和b.分别求下列各组新数据的平均数:(1)5x1,5x2,…,5x n;(2)x1-y1,x2-y2,…,x n-y n;题十一:一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A.13, 12 B.13, 13 C.12, 13 D.13, 14题十三:一般地,家庭用电量y(千瓦)与气温x(℃)有函数关系y=f(x).图(1)表示某年12月中每月的平均气温,图(2)表示某家庭在12个月中每月的用电量.试在数集A={x|5≤x≤30,x是2.5的整数倍}中确定一个最小值x1和最大值x2,使y=f(x)是上的增函数,则区间= .题十四:某校从参加高三年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段后得到如图的频率分布直方图,请你根据频率分布直方图中的信息,估计出本次考试数学成绩的平均分为________.统计综合问题性课后练习参考答案题一: D .详解:总人数为28+54+81=163.样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.若按36∶163取样,无法得到整解,故考虑先剔除1人,抽取比例变为36∶162=2∶9,则中年人取12人,青年人取18人,先从老年人中剔除1人,老年人取6人,组成36的样本.题二: D .详解:由于各家庭有明显差异,所以首先应用分层抽样的方法分别从农民、工人、知识分子这三类家庭中抽出若干户,即36户、2户、2户.又由于农民家庭户数较多,那么在农民家庭这一层宜采用系统抽样;而工人、知识分子家庭户数较少,宜采用简单随机抽样法.故整个抽样过程要用到①②③三种抽样法.题三: B .详解:根据茎叶图,去掉1个最低分87,1个最高分99,则17=91,∴x =4. ∴s 2=17=367.题四: ①2,10,18,26,34 ②62.详解:由题意知被抽出职工的号码为2,10,18,26,34.由茎叶图知5名职工体重的平均数x =59+62+70+73+815=69,则该样本的方差s 2=15=62. 题五: D .详解:在系统抽样中,将学生统一编号为1,2,…300,并将整个编号依次分为10段.则每一段的号码数为30.①中数据为7,37,67,97,127,157,187,217,247,277,数据相差30,所以①为系统抽样或分层抽样.②中数据5,9,100,107,121,180,195,221,265,299;数据排列没有规律,可能为分层抽样.③中数据11,41,71,101,131,161,191,221,251,281;数据相差30,所以③为系统抽样或分层抽样. ④中数据31,61,91,121,151,181,211,241,271,300,数据相差30,但第一个数据大于30,所以④不可能是系统抽样.故D 正确.题六: B .详解:用系统抽样的方法抽取到的导弹编号应该为k , k +d , k +2d , k +3d , k +4d ,其中d =50/5=10,k 是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求.题七: D .详解:本题综合考查统计部分的有关知识,通过统计表可以得到应聘人数与招聘人数,进而通过计算应聘人数与招聘人数的比值大小来衡量该行业的就业情况,比值越小越容易就业,比值越大越不容易就业,计算机行业比值为1.83;机械行业比值为2.29;营销行业比值为1.50;建筑行业为0;化工行业为0;而物流行业与贸易行业的比值为无穷大,所以此题应选D .题八: D .详解:因为同一类别中应聘人数与招聘人数比值越大的,说明该行业的就业形式越差;反之,比值越小的,说明就业形式越好,由此即可求出答案. 医学类的比值为7.11246021580=;外语类的比值为2.2891020030=; 金融类的比值为5.11029015460=;法律类的比值大于2.170408450=; 计算机类的比值大于65300.97040=;营销类的比值小于65300.97040=;建筑类的比值小于65300.857650=. 则一定正确的是建筑类好于法律类,故选D .题九: 11.详解:由题意知,一组数据x 1,x 2,x 3,x 4,…,x n 的平均数为(x 1+x 2+x 3+x 4+…+x n )÷n =4∴x 1+7,x 2+7,x 3+7,x 4+7,…,x n +7这组数据的平均数为(x 1+7+x 2+7+x 3+7+x 4+7+…+x n +7)÷n=÷n=(x 1+x 2+x 3+x 4+…+x n )÷n +7=4+7=11.题十: (1)5a ;(2)a -b .详解:(1)第一组中各数据正好是原来数据的5倍,所以平均数也是原来的5倍,故这组数据的平均数为5a ;(2)第二组中各数据正好是原来两组数据的差,所以平均数也是原来两组数据的差,故这组数据的平均数为a -b .题十一: B .详解:设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,(8-2d )(8+4d )=64,(4-d )(2+d )=8,2d -d2=0,又d ≠0,故d =2,故样本数据为4,6,8,10,12,14,16,18,20,22,样本的平均数为(4+22)×510=13,中位数为12+142=13,故选B .题十二: 2.详解:x 甲=15(87+91+90+89+93)=90, x 乙=15(89+90+91+88+92)=90, s 2甲=15=4, s 2乙=15=2. 由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.故答案为2.题十三: .详解:先结合图形读懂题意,再找出图中随气温x (℃)增高家庭用电量y (千瓦)也增高的区间即可.观察两图中随气温x (℃)增高家庭用电量y (千瓦)也增高的是5月到8月,则y =f (x )在x ∈上的增函数,故答案为.题十四: 71.详解:由频率分布直方图得每一组的频率依次为0.1,0.15,0.15,0.3,0.25,0.05,又由频率分布直方图,得每一组数据的中点值依次为45,55,65,75,85,95.所以本次考试数学成绩的平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.故填71.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计综合问题课后练习 题一:某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .先从老年人中剔除1人,再用分层抽样题二:某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到下列抽样方法( )①简单随机抽样 ②系统抽样 ③分层抽样A .②③B .①③C .③D .①②③题三:将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A .1169B .367C .36D .677题四:已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.①若第1组抽出的号码为2,则所有被抽出职工的号码为________;②分别统计这5名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,则该样本的方差为________.题五:某初级中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…300;使用系统抽样时,将学生统一编号为1,2,…300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277;②5,9,100,107,121,180,195,221,265,299;③11,41,71,101,131,161,191,221,251,281;④31,61,91,121,151,181,211,241,271,300关于上述样本的下列结论中,正确的是( )A .②③都不能为系统抽样B .②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样题六:从已编号为1—50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32题七:在某次人才交流会上,应聘人数和招聘人数分别居前5位的行业列表如下:行业名称计算机机械营销物流贸易应聘人数(单位:人)2231 2053 1546 748 659行业名称计算机营销机械建筑化工招聘人数(单位:人)1210 1030 895 763 725如果用同一行业应聘人数与招聘人数比值的大小来衡量该行业的就业情况,那么根据表中数据,对上述行业的就业情况判断正确的是()A.计算机行业好于其它行业B.贸易行业好于化工行业C.机械行业好于营销行业D.建筑行业好于物流行业题八:某人才市场2004年上半年应聘和招聘人数排名前5个类别的情况如下图所示,若用同一类别中应聘人数与招聘人数比值的大小来衡量该类别的就业情况,则根据图中信息,下列对就业形势的判断一定正确的是()提示:请注意理解图片是应聘和招聘人数排名前5个类别的情况.A.医学类好于营销类B.金融类好于计算机类C.外语类最紧张D.建筑类好于法律类题九:已知数据x1,x2,…,x n的平均数是4,则一组新数据x1+7,x2+7,…,x n+7的平均数是.题十:已知两组数x1, x2,…, x3和y1, y2,…, y3;它们的平均数分别是a和b.分别求下列各组新数据的平均数:(1)5x1,5x2,…,5x n;(2)x1-y1,x2-y2,…,x n-y n;题十一:一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A.13, 12 B.13, 13 C.12, 13 D.13, 14题十二:抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.题十三:一般地,家庭用电量y(千瓦)与气温x(℃)有函数关系y=f(x).图(1)表示某年12月中每月的平均气温,图(2)表示某家庭在12个月中每月的用电量.试在数集A={x|5≤x≤30,x是2.5的整数倍}中确定一个最小值x1和最大值x2,使y=f(x)是上的增函数,则区间= .题十四:某校从参加高三年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段后得到如图的频率分布直方图,请你根据频率分布直方图中的信息,估计出本次考试数学成绩的平均分为________.统计综合问题性课后练习参考答案题一: D .详解:总人数为28+54+81=163.样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.若按36∶163取样,无法得到整解,故考虑先剔除1人,抽取比例变为36∶162=2∶9,则中年人取12人,青年人取18人,先从老年人中剔除1人,老年人取6人,组成36的样本.题二: D .详解:由于各家庭有明显差异,所以首先应用分层抽样的方法分别从农民、工人、知识分子这三类家庭中抽出若干户,即36户、2户、2户.又由于农民家庭户数较多,那么在农民家庭这一层宜采用系统抽样;而工人、知识分子家庭户数较少,宜采用简单随机抽样法.故整个抽样过程要用到①②③三种抽样法.题三: B .详解:根据茎叶图,去掉1个最低分87,1个最高分99,则17=91,∴x =4. ∴s 2=17=367.题四: ①2,10,18,26,34 ②62.详解:由题意知被抽出职工的号码为2,10,18,26,34.由茎叶图知5名职工体重的平均数x =59+62+70+73+815=69,则该样本的方差s 2=15=62. 题五: D .详解:在系统抽样中,将学生统一编号为1,2,…300,并将整个编号依次分为10段.则每一段的号码数为30.①中数据为7,37,67,97,127,157,187,217,247,277,数据相差30,所以①为系统抽样或分层抽样.②中数据5,9,100,107,121,180,195,221,265,299;数据排列没有规律,可能为分层抽样.③中数据11,41,71,101,131,161,191,221,251,281;数据相差30,所以③为系统抽样或分层抽样. ④中数据31,61,91,121,151,181,211,241,271,300,数据相差30,但第一个数据大于30,所以④不可能是系统抽样.故D 正确.题六: B .详解:用系统抽样的方法抽取到的导弹编号应该为k , k +d , k +2d , k +3d , k +4d ,其中d =50/5=10,k 是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求.题七: D .详解:本题综合考查统计部分的有关知识,通过统计表可以得到应聘人数与招聘人数,进而通过计算应聘人数与招聘人数的比值大小来衡量该行业的就业情况,比值越小越容易就业,比值越大越不容易就业,计算机行业比值为1.83;机械行业比值为2.29;营销行业比值为1.50;建筑行业为0;化工行业为0;而物流行业与贸易行业的比值为无穷大,所以此题应选D .题八: D .详解:因为同一类别中应聘人数与招聘人数比值越大的,说明该行业的就业形式越差;反之,比值越小的,说明就业形式越好,由此即可求出答案. 医学类的比值为7.11246021580=;外语类的比值为2.2891020030=; 金融类的比值为5.11029015460=;法律类的比值大于2.170408450=; 计算机类的比值大于65300.97040=;营销类的比值小于65300.97040=;建筑类的比值小于65300.857650=. 则一定正确的是建筑类好于法律类,故选D .题九: 11.详解:由题意知,一组数据x 1,x 2,x 3,x 4,…,x n 的平均数为(x 1+x 2+x 3+x 4+…+x n )÷n =4∴x 1+7,x 2+7,x 3+7,x 4+7,…,x n +7这组数据的平均数为(x 1+7+x 2+7+x 3+7+x 4+7+…+x n +7)÷n=÷n=(x 1+x 2+x 3+x 4+…+x n )÷n +7=4+7=11.题十: (1)5a ;(2)a -b .详解:(1)第一组中各数据正好是原来数据的5倍,所以平均数也是原来的5倍,故这组数据的平均数为5a ;(2)第二组中各数据正好是原来两组数据的差,所以平均数也是原来两组数据的差,故这组数据的平均数为a -b .题十一: B .详解:设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,(8-2d )(8+4d )=64,(4-d )(2+d )=8,2d -d2=0,又d ≠0,故d =2,故样本数据为4,6,8,10,12,14,16,18,20,22,样本的平均数为(4+22)×510=13,中位数为12+142=13,故选B .题十二: 2.详解:x 甲=15(87+91+90+89+93)=90, x 乙=15(89+90+91+88+92)=90, s 2甲=15=4, s 2乙=15=2. 由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.故答案为2.题十三: .详解:先结合图形读懂题意,再找出图中随气温x (℃)增高家庭用电量y (千瓦)也增高的区间即可.观察两图中随气温x (℃)增高家庭用电量y (千瓦)也增高的是5月到8月,则y =f (x )在x ∈上的增函数,故答案为.题十四: 71.详解:由频率分布直方图得每一组的频率依次为0.1,0.15,0.15,0.3,0.25,0.05,又由频率分布直方图,得每一组数据的中点值依次为45,55,65,75,85,95.所以本次考试数学成绩的平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.故填71.。