2019高考数学二轮复习 小题专项练习(十五)统计与统计案例(无答案)理

合集下载

2019年高考数学(理)二轮专题练习:概率与统计(含答案)

2019年高考数学(理)二轮专题练习:概率与统计(含答案)

高考数学精品复习资料2019.5概率与统计1.随机抽样方法简单随机抽样、系统抽样、分层抽样的共同点是抽样过程中每个个体被抽取的机会相等,且是不放回抽样.[问题1] 某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福社区的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次抽取的总户数为________. 答案 24解析 由抽样比例可知6x =480-200-160480,则x =24.2.对于统计图表问题,求解时,最重要的就是认真观察图表,从中提取有用信息和数据.对于频率分布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率.茎叶图没有原始数据信息的损失,但数据很大或有多组数据时,茎叶图就不那么直观、清晰了. [问题2] 从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图所示.若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为________.答案 203.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 众数为频率分布直方图中最高矩形的底边中点的横坐标.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).平均数等于频率分布直方图中每个小矩形的面积乘以小距形底边中点的横坐标之和. 标准差的平方就是方差,方差的计算(1)基本公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)简化计算公式①s 2=1n [(x 21+x 22+…+x 2n )-n x 2],或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方和的平均数减去平均数的平方.[问题3] 已知一个样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是________. 答案 0.15、0.145 4.变量间的相关关系假设我们有如下一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ).回归方程y ^=b ^x +a ^,其中⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y∑i =1n x 2i-n x2,a ^=y -b ^x .[问题4] 回归直线方程y ^=b ^x +a ^必经过点________. 答案 (x ,y )5.独立性检验的基本方法一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表如表:根据观测数据计算由公式k =n (ad -bc )(a +b )(a +c )(b +d )(c +d )所给出的检验随机变量K 2的观测值k ,并且k 的值越大,说明“X 与Y 有关系”成立的可能性越大,可以利用数据来确定“X 与Y 有关系”的可信程度.[问题5] 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:则至少有________附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )答案 6.互斥事件有一个发生的概率P (A +B )=P (A )+P (B ) (1)公式适合范围:事件A 与B 互斥. (2)P (A )=1-P (A ).[问题6] 抛掷一枚骰子,观察掷出的点数,设事件A 为出现奇数点,事件B 为出现2点,已知P (A )=12,P (B )=16,则出现奇数点或2点的概率之和为________.答案 237.古典概型P (A )=mn (其中,n 为一次试验中可能出现的结果总数,m 为事件A 在试验中包含的基本事件个数)[问题7] 若将一枚质地均匀的骰子先后抛掷2次,则出现向上的点数之和为4的概率为________. 答案1128.几何概型一般地,在几何区域D 内随机地取一点,记事件“该点在其内部一个区域d 内”为事件A ,则事件A 发生的概率为P (A )=d 的度量D 的度量.此处D 的度量不为0,其中“度量”的意义依D 确定,当D 分别是线段、平面图形和立体图形时,相应的度量分别为长度、面积和体积等. 即P (A )=构成事件A 的区域长度(面积和体积)试验的全部结果所构成的区域长度(面积和体积)[问题8] 在棱长为2的正方体ABCD —A 1B 1C 1D 1中,点O 为底面ABCD 的中心,在正方体ABCD —A 1B 1C 1D 1内随机取一点P ,则点P 到点O 的距离大于1的概率为( ) A.π12B .1-π12C.π6 D .1-π6答案 B解析 记“点P 到点O 的距离大于1”为A , P (A )=23-12×43π×1323=1-π12. 9.解排列、组合问题的依据是:分类相加,分步相乘,有序排列,无序组合.解排列、组合问题的规律是:相邻问题捆绑法;不相邻问题插空法;多排问题单排法;定位问题优先法;定序问题倍缩法;多元问题分类法;有序分配分步法;综合问题先选后排法;至多至少问题间接法. (1)排列数公式A m n =n (n -1)(n -2)…[n -(m -1)]=n !(n -m )!,其中m ,n ∈N *,m ≤n .当m =n 时,A n n =n ·(n -1)·……·2·1=n !,规定0!=1. (2)组合数公式C mn =A m n A m m =n (n -1)(n -2)…[n -(m -1)]m !=n !m !(n -m )!.(3)组合数性质C m n =C n-mn,C m n +C m -1n =C m n +1,规定C 0n =1,其中m ,n ∈N *,m ≤n .[问题9] (1)将5封信投入3个邮筒,不同的投法共有________种.(2)从4台甲型和5台乙型电视机中任意取出3台,其中至少要甲型和乙型电视机各一台,则不同的取法共有________种. 答案 (1)35 (2)70 10.二项式定理(1)定理:(a +b )n =C 0n a n +C 1n a n -1b +…+C r n a n -r b r +…+C n -1n ab n -1+C n n b n (n ∈N *).通项(展开式的第r +1项):T r +1=C rna n -r b r ,其中C r n (r =0,1,…,n )叫做二项式系数.(2)二项式系数的性质①在二项式展开式中,与首末两端“等距离”的两项的二项式系数相等,即C 0n =C n n ,C 1n =C n -1n ,C 2n =C n -2n ,…,C r n =C n -r n .②二项式系数的和等于2n (组合数公式),即C 0n +C 1n +C 2n +…+C n n =2n .③二项式展开式中,偶数项的二项式系数和等于奇数项的二项式系数和,即C 1n +C 3n +C 5n +…=C 0n +C 2n +C 4n +…=2n -1.特别提醒:二项式系数最大项与展开式系数最大项是两个不同的概念,在求法上也有很大的差别,往往因为概念不清导致出错. [问题10] 设⎝⎛⎭⎫x -2x 6的展开式中x 3的系数为A ,二项式系数为B ,则A ∶B =________. 答案 4∶1解析 T r +1=C r 6x6-r(-1)r ⎝⎛⎭⎫2x r=C r 6(-1)r 2r362r x-,6-32r =3,r =2,系数A =60,二项式系数B =C 26=15,所以A ∶B =4∶1.4∶1.11.要注意概率P (A |B )与P (AB )的区别:(1)在P (A |B )中,事件A ,B 发生有时间上的差异,B 先A 后;在P (AB )中,事件A ,B 同时发生.(2)样本空间不同,在P (A |B )中,事件B 成为样本空间;在P (AB )中,样本空间仍为Ω,因而有P (A |B )≥P (AB ).[问题11] 设A 、B 为两个事件,若事件A 和B 同时发生的概率为310,在事件A 发生的条件下,事件B 发生的概率为12,则事件A 发生的概率为________.答案 3512.求分布列,要检验概率的和是否为1,如果不是,要重新检查修正.还要注意识别独立重复试验和二项分布,然后用公式.如果事件A 在一次试验中发生的概率是p ,那么它在n 次独立重复试验中恰好发生k 次的概率为P n (k )=C k n p k ·(1-p )n -k . [问题12] 若随机变量ξ的分布列如下表,则E (ξ)的值为________.答案209解析 根据概率之和为1,求出x =118,则E (ξ)=0×2x +1×3x +…+5x =40x =209.13.一般地,如果对于任意实数a <b ,随机变量X 满足P (a <X ≤b )=ʃba φμ,σ(x )d x ,则称X 的分布为正态分布.正态分布完全由参数μ和σ确定,因此正态分布常记作N (μ,σ2).如果随机变量X 服从正态分布,则记为X ~N (μ,σ2).满足正态分布的三个基本概率的值是:①P (μ-σ<X ≤μ+σ)=0.682 6;②P (μ-2σ<X ≤μ+2σ)=0.954 4;③P (μ-3σ<X ≤μ+3σ)=0.9974.[问题13] 已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)等于( ) A .0.6 B .0.4 C .0.3 D .0.2 答案 C解析 ∵P (ξ<4)=0.8,∴P (ξ>4)=0.2,由题意知图象的对称轴为直线x =2, P (ξ<0)=P (ξ>4)=0.2,∴P (0<ξ<4)=1-P (ξ<0)-P (ξ>4)=0.6. ∴P (0<ξ<2)=12P (0<ξ<4)=0.3.易错点1 统计图表识图不准致误例1 如图所示是某公司(共有员工300人)20xx 年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的大约有________人.错解 由频率分布直方图,员工中年薪在1.4万元~1.6万元之间的频率为1-(0.02+0.08+0.10+0.10+0.08)=0.62.∴估计年薪在1.4万元~1.6万元之间约有300×0.62=186(人).找准失分点 本题主要混淆频率分布直方图与条形图纵轴的意义,频率分布直方图中,纵轴(矩形高)表示“频率组距”,每个小矩形的面积才表示落在该区间上的频率,由于概念不清,识图不准导致计算错误.正解 由所给图形可知,员工中年薪在1.4万元~1.6万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24.所以员工中年薪在1.4万元~1.6万元之间的共有300×0.24=72(人). 答案 72易错点2 在几何概型中“测度”确定不准致误例2 如图所示,在等腰Rt △ABC 中,过直角顶点C 在∠ACB 内部任意作一条射线CM ,与线段AB 交于点M ,求AM <AC 的概率.错解 记AM <AC 为事件E ,设CA =CB =a ,因为△ABC 是直角三角形, 所以,AB =2a ,在AB 上取一点D ,使AD =AC =a ,那么对线段AD 上的任意一点M 都有AM <AD ,即AM <AC , 因此AM <AC 的概率为P (E )=AD AB =a 2a =22. 找准失分点 据题意,过直角顶点C 在∠ACB 内部作一条射线CM ,射线CM 在∠ACB 内部均匀分布,但是点M 在AB 上的分布不是均匀的.正解 在AB 上取一点D ,使AD =AC ,因为AD =AC =a ,∠A =π4,所以∠ACD =∠ADC =3π8,则P (E )=∠ACD ∠ACB =3π8π2=34.易错点3 分不清是排列还是组合致误例3 如图所示,A ,B ,C ,D 是海上的四个小岛,要建三座桥,将这四个岛连接起来,不同的建桥方案共有多少种?错解 对于有一个中心的结构形式有A 44,对于四个岛依次相连的形式有A 44,∴共有2A 44=48(种).找准失分点 没有分清是排列还是组合. 正解 由题意可能有两种结构,如图:第一种:,第二种:对于第一种结构,连接方式只需考虑中心位置的情况,共有C 14种方法.对于第二种结构,有C 24A 22种方法. ∴总共有C 14+C 24A 22=16(种).易错点4 均匀分组与非均匀分组混淆致误例4 4个不同的小球放入编号为1、2、3、4的4个盒中,则恰有1个空盒的放法共有________种.(用数字作答) 错解 288错误!未找到引用源。

2019版二轮复习数学(理)全国版第一部分 第二层级 重点增分专题十三 统计、统计案例

2019版二轮复习数学(理)全国版第一部分  第二层级  重点增分专题十三 统计、统计案例

重点增分专题十三 统计、统计案例[全国卷3年考情分析](1)统计与统计案例在选择题或填空题中的命题热点主要集中在随机抽样、用样本估计总体以及变量间的相关性判断等,难度较低,常出现在3~4题的位置.(2)统计与统计案例在解答题中多出现在18或19题,多考查直方图、茎叶图及数字特征计算、统计案例的应用.考点一抽样方法 保分考点·练后讲评 1.[简单随机抽样]福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球号码为( )A .12B .33C .06D .16解析:选C 被选中的红色球号码依次为17,12,33,06,32,22.所以第四个被选中的红色球号码为06,故选C.2.[分层抽样]某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽选100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选的人数分别为( )A .25,25,25,25B .48,72,64,16C .20,40,30,10D .24,36,32,8解析:选D 因为抽样比为10020 000=1200,所以每类人中应抽选的人数分别为4 800×1200=24,7 200×1200=36,6 400×1200=32,1 600×1200=8.故选D. 3.[系统抽样]某班共有学生56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知学号为2,30,44的同学在样本中,则样本中还有一位同学的学号为________.解析:由题意得,将56人按学号从小到大分成4组,则分段间隔为14,所以抽取的学号依次为2,16,30,44,故还有一位同学的学号为16.答案:16[解题方略] 系统抽样和分层抽样中的计算 (1)系统抽样①总体容量为N ,样本容量为n ,则要将总体均分成n 组,每组Nn 个(有零头时要先去掉).②若第一组抽到编号为k 的个体,则以后各组中抽取的个体编号依次为k +Nn ,…,k +(n -1)Nn .(2)分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.考点二 用样本估计总体 保分考点·练后讲评 [大稳定——常规角度考双基]1.[频数分布表中的数字特征]某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:则这20户家庭该月用电量的众数和中位数分别是( ) A .180,170B .160,180C .160,170D .180,160解析:选A 用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.2.[茎叶图中的数字特征]甲、乙两名同学在7次数学测试中的成绩如茎叶图所示,其中甲同学成绩的众数是85,乙同学成绩的中位数是83,则成绩较稳定的是________.解析:根据众数及中位数的概念易得x =5,y =3,故甲同学成绩的平均数为78+79+80+85+85+92+967=85,乙同学成绩的平均数为72+81+81+83+91+91+967=85,故甲同学成绩的方差为17×(49+36+25+49+121)=40,乙同学成绩的方差为17×(169+16+16+4+36+36+121)=3987>40,故成绩较稳定的是甲.答案:甲3.[频率分布直方图中的数字特征]为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量的数据(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a 的值;(2)估计这种植物果实重量的平均数x 和方差s 2(同一组中的数据用该组区间的中点值作代表).解:(1)由5×(0.020+0.040+0.075+a +0.015)=1,得a =0.050. (2)各组中点值和相应的频率依次为x=30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,s2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.[解题方略]1.方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算.(2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大.2.从频率分布直方图中得出有关数据的方法[小创新——变换角度考迁移]1.[统计中的创新]空气质量指数A Q I是检测空气质量的重要参数,其数值越大说明空气污染状况越严重,空气质量越差.某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数A Q I,根据得到的数据绘制出如图所示的折线图.则下列说法错误的是()A.该地区在12月2日空气质量最好B.该地区在12月24日空气质量最差C.该地区从12月7日到12月12日A Q I持续增大D.该地区的空气质量指数A Q I与这段日期成负相关解析:选D12月2日空气质量指数最低,所以空气质量最好,A正确;12月24日空气质量指数最高,所以空气质量最差,B正确;12月7日到12月12日A Q I在持续增大,所以C 正确;在该地区统计这段时间内,空气质量指数A Q I 整体呈上升趋势,所以空气质量指数与这段日期成正相关,D 错误.2.[与基本不等式的交汇]为保障食品安全,某市质量监督局对某超市进行食品安全检查,如图所示是某品牌食品中某元素含量数据的茎叶图,已知该组数据的平均数为11.75,则4a +1b 的最小值为( )A .9 B.92C .3D.73解析:选C 根据茎叶图中的数据得,该组数据的平均数x =14(a +11+13+20+b )=11.75,∴a +b =3,∴4a +1b =13⎝⎛⎭⎫4a +1b (a +b )=13⎝⎛⎭⎫5+4b a +a b ≥135+24b a ·a b =13(5+4)=3.当且仅当a =2b ,即a =2,b =1时取“=”.∴4a +1b的最小值为3.故选C.3.[借助数学文化考查]《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问:各几何?”其意为:今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱,则丙应出________钱(所得结果四舍五入,保留整数).解析:甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,丙应出100×180560+350+180=1656109≈17(钱).答案:17考点三 统计案例 增分考点·广度拓展 [分点研究]题型一 回归分析在实际问题中的应用[例1] 某商店为了更好地规划某种商品的进货量,从某一年的销售数据中,随机抽取了8组数据作为研究对象,如下表所示(x 为该商品的进货量,y 为销售天数):(1)根据上表数据在如图所示的网格中绘制散点图;(2)根据上表提供的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)根据(2)中的计算结果,若该商店准备一次性进货该商品24吨,预测需要销售的天数.参考公式和数据:b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^=y -b ^x .∑i =18x 2i =356,∑i =18x i y i =241.[解] (1)散点图如图所示:(2)依题意,得x =18×(2+3+4+5+6+8+9+11)=6,y =18×(1+2+3+3+4+5+6+8)=4,又∑i =18x 2i =356,∑i =18x i y i =241, 所以b ^=∑i =18x i y i -8x y∑i =18x 2i -8x2=241-8×6×4356-8×62=4968, a ^=4-4968×6=-1134,故线性回归方程为y ^=4968x -1134.(3)由(2)知,当x =24时,y ^=4968×24-1134≈17,故若该商店一次性进货24吨,则预计需要销售17天.[解题方略] 求回归直线方程的方法(1)若所求的回归直线方程是在选择题中,常利用回归直线y ^=b ^x +a ^必经过样本点的中心(x ,y )快速选择.(2)若所求的回归直线方程是在解答题中,则求回归直线方程的一般步骤为:题型二 独立性检验在实际问题中的应用[例2] (2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),[解] (1)第二种生产方式的效率更高. 理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min ,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min ,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80 min ;用第二种生产方式的工人完成生产任务所需平均时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分) (2)由茎叶图知m =79+812=80.列联表如下:(3)因为K 2=40(15×15-5×5)20×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.[解题方略] 独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d )计算出K 2的观测值;(3)比较K 2的观测值与临界值的大小,作出统计推断.[多练强化]1.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分)2.(2019届高三·湖北五校联考)通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:(1)将题中的2×2列联表补充完整;(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解:(1)题中的2×2列联表补充如下:(2)由(1)表中数据得K 2=100×(40×25-20×15)255×45×60×40≈8.25>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.考点四概率与统计的综合问题增分考点·讲练冲关[典例](2018·福州质量检测)从某技术公司开发的某种产品中随机抽取200件,测量这些产品的一项质量指标值(记为Z),由测量结果得如下频率分布直方图:(1)公司规定:当Z≥95时,产品为正品;当Z<95时,产品为次品.公司每生产一件这种产品,若是正品,则盈利90元;若是次品,则亏损30元,记ξ为生产一件这种产品的利润,求随机变量ξ的分布列和数学期望;(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2(同一组中的数据用该区间的中点值作代表).①利用该正态分布,求P(87.8<Z<112.2);②某客户从该公司购买了500件这种产品,记X表示这500件产品中该项质量指标值位于区间(87.8,112.2)内的产品件数,利用①的结果,求E(X).附:150≈12.2.若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 7.P(μ-2σ<Z<μ+2σ)=0.954 5.[解](1)由频率估计概率,产品为正品的概率为(0.033+0.024+0.008+0.002)×10=0.67,所以随机变量ξ的分布列为所以E(ξ)=90×0.67+(-30)×0.33=50.4.(2)由频率分布直方图知,抽取产品的该项质量指标值的样本平均数x和样本方差s2分别为x=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150.①因为Z~N(100,150),从而P(87.8<Z<112.2)=P(100-12.2<Z<100+12.2)=0.682 7.②由①知,一件产品中该项质量指标值位于区间(87.8,112.2)内的概率为0.682 7,依题意知X~B(500,0.682 7),所以E(X)=500×0.682 7=341.35.[解题方略]解决概率与统计综合问题的一般步骤[多练强化](2018·郑州第一次质量测试)为了减少雾霾,还城市一片蓝天,某市政府于12月4日到12月31日在主城区实行车辆限号出行政策,鼓励民众不开车低碳出行.市政府为了了解民众低碳出行的情况,统计了该市甲、乙两个单位各200名员工12月5日到12月14日共10天的低碳出行的人数,画出茎叶图如图所示:(1)若甲单位数据的平均数是122,求x;(2)现从图中的数据中任取4天的数据(甲、乙两个单位中各取2天),记抽取的4天中甲、乙两个单位员工低碳出行的人数不低于130的天数分别为ξ1,ξ2,令η=ξ1+ξ2,求η的分布列和数学期望.解:(1)由题意知110[105+107+113+115+119+126+(120+x )+132+134+141]=122, 解得x =8.(2)由题得ξ1的所有可能取值为0,1,2,ξ2的所有可能取值为0,1,2,因为η=ξ1+ξ2,所以随机变量η的所有可能取值为0,1,2,3,4.因为甲单位低碳出行的人数不低于130的天数为3,乙单位低碳出行的人数不低于130的天数为4,所以P (η=0)=C 27C 26C 210C 210=745;P (η=1)=C 17C 13C 26+C 27C 14C 16C 210C 210=91225; P (η=2)=C 23C 26+C 27C 24+C 17C 13C 16C 14C 210C 210=13; P (η=3)=C 23C 16C 14+C 17C 13C 24C 210C 210=22225; P (η=4)=C 23C 24C 210C 210=2225.所以η的分布列为E (η)=0×745+1×91225+2×13+3×22225+4×2225=75.数学建模——回归分析问题的求解[典例] (2018·汕头模拟)二手车经销商小王对其所经营的A 型号二手汽车的使用年数x 与销售价格y (单位:万元/辆)进行整理,得到如下数据:下面是z 关于x 的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关系数加以说明.(2)求y 关于x 的回归方程并预测某辆A 型号二手车当使用年数为9年时售价约为多少?(b ^,a ^小数点后保留两位有效数字).(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考公式:回归方程y ^=b ^x +a ^中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2.参考数据:∑i =16x i y i =187.4,∑i =16x i z i =47.64,∑i =16x 2i=139,∑i =16(x i -x )2≈4.18,∑i =16(y i -y )2≈13.96,∑i =16(z i -z )2≈1.53,ln 1.46≈0.38,ln 0.711 8≈-0.34.[解] (1)因为x =16×(2+3+4+5+6+7)=4.5,z =16×(3+2.48+2.08+1.86+1.48+1.10)=2,且 ∑i =16x i z i =47.64,∑i =16(x i -x )2≈4.18,∑i =16(z i -z )2≈1.53,所以r =∑i =16(x i -x )(z i -z )∑i =16 (x i -x )2∑i =16(z i -z )2≈47.64-6×4.5×24.18×1.53≈-0.99,所以z 与x 的相关系数大约为0.99,说明z 与x 的线性相关程度很高. (2)由已知,得b ^=∑i =16x i z i -6 x z∑i =16x 2i -6x2=47.64-6×4.5×2139-6×4.52≈-0.36,所以a ^=z -b ^x =2+0.36×4.5=3.62, 所以z 与x 的线性回归方程是z ^=-0.36x +3.62. 又z =ln y ,所以y 关于x 的回归方程是y ^=e -0.36x +3.62. 令x =9,得y ^=e -0.36×9+3.62≈1.46,即预测某辆A 型号二手车当使用年数为9年时售价约1.46万元. (3)当y ^≥0.711 8时,e -0.36x +3.62≥0.711 8=e ln 0.711 8=e -0.34, 所以-0.36x +3.62≥-0.34,解得x ≤11,因此预测在收购该型号二手车时车辆的使用年数不得超过11年. [素养通路]本题是典型的回归分析问题,在实际问题中收集数据,画散点图,可以用线性回归模型拟合变量关系,再用最小二乘法求出回归方程,进而用回归模型对实际问题进行预测,考查了数学建模这一核心素养.。

2019届高考数学二轮复习解题技巧统计与统计案例学案(全国通用)

2019届高考数学二轮复习解题技巧统计与统计案例学案(全国通用)

(这是边文,请据需要手工删加)名师导学·高考二轮总复习·理科数学(这是边文,请据需要手工删加)专题七统计与概率(这是边文,请据需要手工删加)专题七统计与概率第16讲统计与统计案例知识网络【p57】考情分析【p57】年份卷别 题号 考查内容命题规律2018Ⅰ 3 统计图的识别与分析 Ⅱ18变量间的相关关系、利用回归直线 方程进行估计Ⅲ 18 茎叶图、中位数、列联表、独立性检验2017 Ⅰ19正态分布、数学期望、3σ原则Ⅱ 18 独立性检验、相互独立事件的概率、 频率分布直方图Ⅲ 3 折线图的识别2016 Ⅲ4统计图的识别18线性回归方程、相关性检验、利用线性回归方程解决实际问题如何抽取数据,如何从数据中提取信息,判断所得结论的可靠性,以及求随机变量分布的概率与特征. 一是根据实际条件选择抽样方法;二是提取统计图表中的有用信息(包括相关变量的关系判断);三是求正态分布、二项分布(含两点分布)、超几何分布的概率情况和特征.通过样本推断总体的过程,考查统计思想,重点是通过从已知数据和图表中提取有用的信息,以及个别事件的概率和整体随机变量的分布,或经过回归分析,解决实际问题.备 考 建 议 【p 57】本节考点与实际问题联系紧密,复习中不能依赖记忆公式和简单的套用公式解题,应在充分认识统计方法特点的基础上,深刻理解回归分析和独立性检验的基本思想、方法及初步应用,提高阅读能力,找准数学模型,经历较为系统的数据处理的全过程,培养对数据的直观感觉,另外还要有意识的提高运算能力.典 例 剖 析 【p 57】探究一 抽样方法例1(1)现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查.②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.③高新中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是( )A .①简单随机抽样,②系统抽样,③分层抽样B .①简单随机抽样,②分层抽样,③系统抽样C .①系统抽样,②简单随机抽样,③分层抽样D .①分层抽样,②系统抽样,③简单随机抽样 【解析】选A .对于①,个体没有差异且总数不多可用随机抽样法,是简单随机抽样;对于②,将总体分成均衡的若干部分指的是将总体分段,在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号,是系统抽样;对于③,个体有明显的差异,所以选用分层抽样,故选A .(2)[2017·江苏卷]某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.【解析】18丙种型号的产品在所有产品中所占比例为300200+400+300+100=310,所以应从丙种型号的产品中抽取60×310=18(件).(3)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.【解析】6设第1组抽取的号码为b ,则第n 组抽取的号码为8(n -1)+b ,∴8×(16-1)+b =126,∴b =6,故第1组抽取的号码为6.【点评】(1)在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,总体就需要分成几个组,则分段间隔即为Nn (n 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.(2)分层抽样中要注意按比例抽取各层次的样本数据,样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数与各层原有的人数,若各层应抽取的个体数不都是整数,则应当先剔除部分个体,调整总体个数.探究二 用样本估计总体例2(1)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(Ⅰ)分别求出两人得分的平均数与方差;(Ⅱ)根据上图和(Ⅰ)中算得的结果,对两人的训练成绩作出评价. 【解析】(Ⅰ)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,∴x 甲=x 乙.s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(Ⅱ)由s2甲>s2乙可知乙的成绩较稳定,从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.(2)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表满意度评[50,60) [60,70) [70,80) [80,90) [90,100]分分组频数 2 8 14 10 6 (Ⅰ)在下图中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.【解析】(Ⅰ)如下图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(Ⅱ)判断:A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.(3)某工厂36名工人的年龄数据如下表.工人编号年龄工人编号年龄工人编号年龄工人编号年龄140 1036 1927 2834244 1131 2043 2939340 1238 2141 3043441 1339 2237 3138533 1443 2334 3242640 1545 2442 3353745 1639 2537 3437842 1738 2644 3549943 1836 2742 3639 (Ⅰ)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(Ⅱ)计算(Ⅰ)中样本的均值x和方差s2;(Ⅲ)36名工人中年龄在x-s与x+s之间的有多少人?所占的百分比是多少(精确到0.01%)?【解析】(Ⅰ)36人分成9组,每组4人,其中第一组抽取的工人年龄为44,因为它在组中的编号为2,所以所有样本数据的编号为4n-2(n=1,2,…,9),其年龄数据为:44,40,36,43,36,37,44,43,37.(Ⅱ)由均值公式知:x =44+40+…+379=40,由方差公式知:s 2=19[(44-40)2+(40-40)2+…+(37-40)2]=1009.(Ⅲ)因为s 2=1009,s =103,所以36名工人中年龄在x -s 和x +s 之间的人数等于年龄在区间[37,43]上的人数, 即40,40,41,…,39,共23人.所以36名工人中年龄在x -s 和x +s 之间的人数所占的百分比为2336×100%≈63.89%.【点评】(1)在作茎叶图或读茎叶图时,首先要弄清楚“茎”和“叶”分别代表什么,根据茎叶图,我们可方便地求出数据的众数与中位数,大体上估计出两组数据平均数的大小与稳定性的高低.(2)解决与频率分布直方图有关的问题时,应正确理解已知数据的含义,掌握图表中各个量的意义,通过图表对已知数据进行分类.探究三 回归分析例3某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t )和年利润z(单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x - y - w - 错误!(w i -错误!)(y i-y -) 46.65636.8289.81.61 469108.8表中w i =x i ,w -=18 i =18w i(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利率z 与x 、y 的关系为z =0.2y -x.根据(2)的结果回答下列问题:(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),……,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=错误!,错误!=错误!-β错误!【解析】(1)由散点图可以判断,y =c +d x 适合作为年销售量y 关于年宣传费用x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程, 由于d ^=错误!=错误!=68, ∴c ^=y --d ^w -=563-68×6.8=100.6.∴y 关于w 的线性回归方程为y ^=100.6+68w , ∴y 关于x 的回归方程为y ^=100.6+68x. (3)(i )由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6, z ^=576.6×0.2-49=66.32.(ii )根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x)-x =-x +13.6x +20.12, ∴当x =13.62=6.8,即x =46.24时,z ^取得最大值.故宣传费用为46.24千元时,年利润的预报值最大.【点评】已知变量的某个值去预测与其有线性相关关系的变量的值时,一般先求出回归直线方程y ^=b ^x +a ^,若a ^,b ^中有一个是已知的,常利用公式a ^=y --b ^x -求另一个量,再把x 取值代入回归直线方程y ^=b ^x +a ^中,求出y ^的估计值.探究四 独立性检验例4海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:P(K 2≥k)0.050 0.010 0.001 k3.8416.63510.828K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).【解析】(1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表:箱产量<50kg箱产量≥50kg旧养殖法 62 38 新养殖法3466K2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.【点评】独立性检验的具体步骤:第一步,根据题意确定临界值并作无关假设;第二步,找相关数据,列出2×2列联表;第三步,由公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d)计算出K2的观测值;第四步,将K2的观测值与临界值进行比较,进而作出推断.探究五正态分布例5从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(1)求这500件产品质量指标值的样本平均数x-和样本方差s2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数x-,σ2近似为样本方差s2.(ⅰ)利用该正态分布,求P(187.8<Z<212.2);(ⅱ)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数.利用(ⅰ)的结果,求E(X).附:150≈12.2.若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4.【解析】(1)抽取产品的质量指标值的样本平均数x -和样本方差s 2分别为x -=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,s 2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.(2)(ⅰ)由(1)知,Z ~N(200,150),从而P(187.8<Z<212.2)=P(200-12.2<Z<200+12.2)=0.682 6.(ⅱ)由(ⅰ)知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 6,依题意知X ~B(100,0.682 6),所以E(X)=100×0.682 6=68.26.【点评】本题主要考查用样本估计总体、正态分布等基本知识和数据分析能力及运算求解能力.规 律 总 结 【p 61】1.进行系统抽样的关键是根据总体和样本的容量确定分段间隔,根据第一段确定编号.如果总体不能被样本整除,即每段不能等分,应采用等可能剔除的方法剔除部分个体,以获得整数间隔.2.进行分层抽样时应注意以下几点:①分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;②为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性要相同;③在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.3.进行线性回归分析时应注意的问题:(1)正确理解计算b ^,a ^的公式和准确的计算是求线性回归方程的关键.(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.4.独立性检验在实际应用中应注意的问题:(1)独立性检验的关键是根据2×2列联表准确计算K 2,若2×2列联表没有列出来,要先列出此表.(2)复习独立性检验时,要根据实际问题,深刻体会独立性检验的思想.5.理解正态分布的概念与性质,它的密度曲线可以表示成一条钟形曲线,而且随着总体的均值与标准差的不同,曲线的形状产生相应的变化.此外还要掌握好μ-3σ原则的应用.高考回眸【p61】考题1[2018·全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下的饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解析】选A.通解:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选A.优解:因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.故选A.【命题立意】本题主要考查以实际生活为背景的统计知识等,考查了学生的转化与化归能力、运算求解能力.考查的数学核心素养是数学运算、数据分析.考题2[2018·全国卷Ⅱ]下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为 y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,答出其中任意一种或其他合理理由均可得分.【命题立意】本题主要考查线性回归模型,折线统计图,意在考查数据处理能力、运算求解能力、图形的识别能力.考查的数学核心素养是数据分析、数学建模、数学运算.考题3[2018·全国卷Ⅲ]某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).P(K 2≥k)0.050 0.010 0.001 k3.8416.63510.828【解析】(1)第二种生产方式的效率更高. 理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知m=79+812=80.列联表如下:超过m 不超过m第一种生产方式15 5第二种生产方式 5 15(3)由于K2=40(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.【命题立意】本题主要考查茎叶图、独立性检验,考查学生分析问题、解决问题的能力.考查的数学核心素养是数学运算、数据分析.考点限时训练 【p 141】1.[2017·山东卷]如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7 【解析】选A .由茎叶图知,甲组的中位数为65,当乙组的中位数也为65时,y =5,此时乙组的平均数为59+61+65+67+785=66,所以甲组中的未知数为66×5-(56+65+62+74-70)=73,所以x =3.故选A .2.某全日制大学共有学生5 400人,其中专科生有1 500人,本科生有3 000人,研究生有900人.现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本容量为180,则应在专科生、本科生与研究生这三类学生中分别抽取( )A .55人,80人,45人B .40人,100人,40人C .60人,60人,60人D .50人,100人,30人【解析】选D .抽取比例为1805 400=130,故应在专科生、本科生、研究生中分别抽取1 500×130=50(人),3 000×130=100(人),900×130=30(人).故选D .3.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的直方图如图所示,假设得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m e =m 0<x -C .m e <m 0<x -D .m 0<m e <x - 【解析】选D .由图知m 0=5.将30名学生的得分从小到大排列,第15个数是5,第16个数是6,所以m e =5.5.又x -=3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230>5.9,所以m 0<m e <x -.4.从某学校随机抽取的5名女大学生的身高x(cm )和体重y(kg )数据如下表:x 165 160 175 155 170 y5852624360根据上表可得回归直线方程为y ^=0.92x +a ^,则a ^=( ) A .-96.8 B .96.8 C .-104.4 D .104.4 【解析】选A .x -=165,y -=55,所以a ^=55-0.92×165=-96.8.故选A .*5.从气象意义上来说春季进入夏季的标志为:连续5天的日平均温度均不低于22 ℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):①甲地:5个数据的中位数为24,众数为22; ②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.4.则肯定进入夏季的地区为( ) A .甲、乙、丙 B .甲、丙 C .乙、丙 D .甲 【解析】选B .甲地气温数据的中位数为24,即5个数据从小到大排序,第3个数是24,出现最多的数是22,因此至少有2个22,故甲地连续5天的日平均气温都不低于22℃,故甲地肯定进入夏季;乙地气温数据的中位数为27,数据尽可能集中的情况是a 1,a 2,27,27,27,由均值为24,可得a 1+a 2=39,此时a 1,a 2中至少有一个小于22,故乙地肯定没有进入夏季;设丙地的其他4个气温数据为a 1,a 2,a 3,a 4,则(a 1-26)2+(a 2-26)2+(a 3-26)2+(a 4-26)2+(32-26)25=10.4,即(a 1-26)2+(a 2-26)2+(a 3-26)2+(a 4-26)2=16,显然(a 1-26)2≤16,(a 2-26)2≤16,(a 3-26)2≤16,(a 4-26)2≤16,即a 1,a 2,a 3,a 4∈[22,30],故丙地肯定进入夏季.故选B . *6.为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为____________.【解析】10设五个班级的数据分别为a<b<c<d<e. 由平均数和方差的公式得a +b +c +d +e5=7,(a -7)2+(b -7)2+(c -7)2+(d -7)2+(e -7)25=4,显然各个括号为整数.设a -7,b -7,c -7,d -7,e -7分别为p ,q ,r ,s ,t ,(p ,q ,r ,s ,t ∈Z ),则⎩⎪⎨⎪⎧p +q +r +s +t =0...(1)p 2+q 2+r 2+s 2+t 2=20 (2).设f (x )=(x -p )2+(x -q )2+(x -r )2+(x -s )2=4x 2-2(p +q +r +s )x +(p 2+q 2+r 2+s 2)=4x 2+2tx +20-t 2,由已知f (x )>0,由判别式Δ<0得t <4,所以t ≤3,所以e ≤10.7.某中学团委组织了“我对祖国知多少”的知识竞赛,从参加考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60),…,[90,100],其部分频率分布直方图如图所示.观察图形,回答下列问题.(1)求成绩在[70,80)的频率,并补全这个频率分布直方图;(2)估计这次考试的及格率(60分及以上为及格)和平均分;(计算时可以用组中值代替各组数据的平均值)(3)从成绩在[40,50)和[90,100]的学生中选两人,求他们在同一分数段的概率.【解析】(1)因为各组的频率和等于1,故成绩在[70,80)的频率是1-(0.025+0.015×2+0.01+0.005)×10=0.3.频率分布直方图如图所示:(2)依题意,60分及以上的分数在[60,70),[70,80),[80,90),[90,100]这四个组,其频率和为(0.015+0.03+0.025+0.005)×10=0.75.所以估计这次考试的及格率是75%. 利用组中值估算学生成绩的平均分,则有45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.所以估计这次考试的平均分是71分.(3)成绩在[40,50)的人数是60×0.1=6,成绩在[90,100]的人数是60×0.05=3,所以从成绩在[40,50)与[90,100]的学生中选两人,他们在同一分数段的概率是P =C 26+C 23C 29=15+336=12. 8.某校为了探索一种新的教学模式,进行了一项课题实验,乙班为实验班,甲班为对比班,甲乙两班的人数均为50人,一年后对两班进行测试,成绩如下表(总分:150分):甲班成绩 [80,90)[90,100)[100,110)[110,120)[120,130)频数42015 101乙班成绩[80,90)[90,100)[100,110)[110,120)[120,130)频数1 11 23 132 (1)现从甲班成绩位于[90,120)内的试卷中抽取9份进行试卷分析,请问用什么抽样方法更合理,并写出最后的抽样结果;(2)根据所给数据可估计在这次测试中,甲班的平均分是101.8,请你估计乙班的平均分,并计算两班平均分相差几分;(3)完成下面2×2列联表,你能有97.5%的把握认为“这两个班在这次测试中成绩的差异与实施课题实验有关”吗?并说明理由.成绩小于100分成绩不小于100分合计 甲班 a = b = 50 乙班 c = d = 50 合计3664 100 附: P (K 2≥k 0)0.15 0.10 0.050.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).【解析】(1)用分层抽样抽取样本更合理.在[90,100),[100,110),[110,120)各分数段分别抽取4份、3份、2份试卷.(2)估计乙班的平均分为x -乙=85×150+95×1150+105×2350+115×1350+125×250=105.8.105.8-101.8=4,即两班平均成绩相差4分. (3)a =24,b =26,c =12,d =38.K 2=100×(24×38-26×12)250×50×36×64=6.25.而6.25>5.024,所以有97.5%的把握认为“这两个班在这次测试中成绩的差异与实施课题实验有关”.9.专家研究表明,PM2.5是霾的主要成份,在研究PM2.5形成原因时,某研究人员研究了PM2.5与燃烧排放的CO 2、NO 2、CO 、O 3等物质的相关关系.下图是PM2.5与CO 和O 3相关性的散点图.(1)根据上面散点图,请你就CO ,O 3对PM2.5的影响关系做出初步评价; (2)根据有关规定,当CO 排放量低于100 ug/m 3时CO 排放量达标,反之为CO 排放量超标;当PM2.5值大于200 ug/m 3时雾霾严重,反之雾霾不严重.根据PM2.5与CO 相关性的散点图填写好下面2×2列联表,并判断有多大的把握认为“雾霾是否严重与CO 排放量有关”;雾霾不严重雾霾严重总计 CO 排放量达标 CO 排放量超标总计。

(通用版)2019版高考数学二轮复习 专题检测(十七)统计、统计案例 理(普通生,含解析)

(通用版)2019版高考数学二轮复习 专题检测(十七)统计、统计案例 理(普通生,含解析)

专题检测(十七)统计、统计案例A组——“6+3+3”考点落实练一、选择题1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A.73 B.78C.77 D.76解析:选B 样本的分段间隔为错误!=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78。

故选B.2.(2019届高三·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.100,20 B.200,20C.200,10 D.100,10解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B。

3.从某地高中男生中随机抽取100名同学,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图),由直方图可知()A.估计体重的众数为50或60B.a=0.03C.学生体重在[50,60)有35人D.从这100名男生中随机抽取一人,体重在[60,80)的概率为错误!解析:选 C 根据频率分布直方图知,最高的小矩形对应的底边中点为错误!=55,所以估计众数为55,A错误;根据频率和为1,计算(a+0.035+0。

030+0.020+0.010)×10=1,解得a=0。

005,B错误;体重在[50,60)内的频率是0。

35,估计体重在[50,60)内的学生有100×0.35=35人,C正确;体重在[60,80)内的频率为0。

3+0。

2=0。

5,用频率估计概率,知这100名男生中随机抽取一人,体重在[60,80)的概率为12,D错误.4.如图是民航部门统计的2019年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是()A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格从高到低居于前三位的城市为北京、深圳、广州D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门解析:选D 由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D错误,选D.5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A.13,12 B.13,13C.12,13 D.13,14解析:选B 设等差数列{a n}的公差为d(d≠0),a3=8,a1a7=a错误!=64,(8-2d)(8+4d)=64,即2d-d2=0,又d≠0,故d=2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为错误!=13,中位数为错误!=13.6.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为错误!=错误!x+错误!,已知错误!i=225,错误!i=1 600,错误!=4。

高考数学二轮复习 小题专项练习(十五)统计与统计案例理

高考数学二轮复习 小题专项练习(十五)统计与统计案例理

小题专项练习(十五) 统计与统计案例一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.[2019·江西重点中学协作体第二次联考]九江联盛某超市为了检查货架上的奶粉是否合格,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用系统抽样方法确定所选取的5袋奶粉的编号可能是( )A .6,12,18,24,30B .2,4,8,16,32C .2,12,23,35,48D .7,17,27,37,472.[2019·重庆江津第二次阶段考试]设X ~N(1,1)其正态分布密度曲线如图所示,那么向正方形ABCD 中随机投掷10 000个点,则落入阴影部分的点的个数的估计值是( )(注:若X ~N(μ,σ2),则P(μ-σ<X<μ+σ)=68.26%,P(μ-2σ<X<μ+2σ)=95.44%)A .7 539B .6 038C .7 028D .6 5873.[2019·山东烟台高三适应性练习]下图是8位同学400米测试成绩的茎叶图(单位:秒),则( )A .平均数为64B .众数为77C .极差为17D .中位数为64.54.[2019·X 的分布列为:则常数q A .1 B .32±336C .32-336D .32+3365.[2019·河北南宫市月考]已知随机变量X 的分布列如下表,则随机变量(2X +3)A .-12B .712C .73D .766.[2019·华中师范大学附属中学模拟]从某企业生产的某种产品中抽取若干件,经测量得这些产品的一项质量指标值Z 服从正态分布N(200,150),某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,则E(X)等于( )(附:150≈12.2.若Z ~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6, P (μ-2σ<Z <μ+2σ)=0.954 4.)A .34.13B .31.74C .68.26D .95.447.[2019·全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍家庭是幼儿语言活动的重要环境,为了与家长配合做好幼儿阅读训练工作,孩子一入园就召开家长会,给家长提出早期抓好幼儿阅读的要求。

(通用版)2019版高考数学二轮复习课件+训练:第一部分专题十五统计、统计案例课件理

(通用版)2019版高考数学二轮复习课件+训练:第一部分专题十五统计、统计案例课件理

n
n
(2)计算xiyi,x2i ;
i=1
i=1
n
n
xi- x yi- y xiyi-n x y
i=1
i=1
(3)计算^b=


n
xi- x 2
n
x2i -n x 2
i=1
i=1
^a= y -^b x ; (4)写出线性回归方程^y=^bx+^a.
[注意] 样本点的 中心( x , y )必在回 归直线上.
解析:根据频率分布直方图,得第二小组的频率是0.04×10 =0.4,∵频数是40,∴样本容量是 04.04 =100,又成绩在80~ 100分的频率是(0.01+0.005)×10=0.15,∴成绩在80~100 分的学生人数是100×0.15=15.
答案:A
2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济 收入增加了一倍,实现翻番.为更好地了解该地区农村的经 济收入变化情况,统计了该地区新农村建设前后农村的经济 收入构成比例,得到如下饼图:则下面结论中不正确的是 ()

卷Ⅲ
卷Ⅲ3年4考,既有选择 题也有解答题,小题主 要考查统计图表、折线 图的识别与分析,解答 题考查线性回归方程的 应用及独立性检验.预 计2019年会以解答题的 形式考查线性回归模型 的应用,同时以选择题 的形式考查统计图表的 识别与分析
横向 把握 重点
1.统计与统计案例在选择题或填空题中的命题热点主要集中在
高中生的近视率为 50%,所以高中生的近视人数为 40×50%
=20,故选 B.
答案:B
3.从 30 个个体(编号为 00~29)中抽取 10 个样本,现给出某随机
数表的第 11 行到第 15 行(见下表),如果某人选取第 12 行的第

数学高考复习统计与统计案例专题训练(含答案)

数学高考复习统计与统计案例专题训练(含答案)

数学2019年高考复习统计与统计案例专题训练(含答案)统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。

以下是数学2019年高考复习统计与统计案例专题训练,请考生掌握。

一、选择题1.(2019山西省重点中学第三次四校联考)已知x、y的取值如下表所示:x 0 1 3 4 y 0.9 1.9 3.2 4.4 从散点图分析,y与x线性相关,且=0.8x+a,则a=()A.0.8B.1C.1.2D.1.5[答案] B[解析] ==2,==2.6,又因为回归直线=0.8x+a过样本中心点(2,2.6)所以2.6=0.82+a,解得a=1.2.(文)(2019豫东、豫北十所名校联考)某厂生产A、B、C三种型号的产品,产品数量之比为32∶4,现用分层抽样的方法抽取一个样本容量为180的样本,则样本中B型号的产品的数量为()A.20B.40C.60D.80[答案] B[解析] 由分层抽样的定义知,B型号产品应抽取180=40件.(理)(2019济南模拟)某全日制大学共有学生5600人,其中专科生有1300人,本科生有3000人,研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取()A.65人,150人,65人B.30人,150人,100人C.93人,94人,93人D.80人,120人,80人[答案] A[解析] =,1300=65,3000=150,故选A.3.(文)(2019新乡、许昌、平顶山二调)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{an}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100B.120C.150D. 200[答案] A[解析] 设公差为d,则a1+d=2a1,a1=d,d+2d+3d+4d+5d=1,d=,面积最大的一组的频率等于5=.小长方形面积最大的一组的频数为300=100.(理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:[0,10),[10,20),[20,30),[30,40),[40,50),[50,60].将日均收看该类体育节目时间不低于40分钟的观众称为体育迷,则图中x的值为()A.0.01B.0.02C.0.03D.0.04[答案] A[解析] 由题设可知(0.005+x+0.012+0.02+0.025+0.028)10=1,解得x=0.01,选A.4.(2019东北三校二模)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A、B两样本的下列数字特征对应相同的是()A.平均数B.标准差C.众数D.中位数[答案] B[解析] 因为A组数据为:42,43,46,52,42,50B组数据为:37,38,41,47,37,45.可知平均数、众数、中位数都发生了变化,比原来A组数据对应量都减小了5,但标准差不发生变化,故选B.5.(2019石家庄质检)等差数列x1,x2,x3,,x9的公差为1,若以上述数据x1,x2,x3,,x9为样本,则此样本的方差为()A. B. C.60 D.30[答案] A[解析] 令等差数列为1,2,39,则样本的平均值=5,S2=[(1-5)2+(2-5)2++(9-5)2]==.6.(文)(2019郑州市第二次质检)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元) 4 5 6 7 8 9 销量y(件) 90 84 83 80 75 68 由表中数据,求得线性回归方程为=-4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为()A. B. C. D.[答案] B[解析] ==,==80,回归直线过点(,80),a=106,=-4x+106,点(5,84),(9,68)在回归直线左下方,故所求概率P==.(理)(2019河北衡水中学二调)关于统计数据的分析,有以下几个结论,其中正确的个数为()利用残差进行回归分析时,若残差点比较均匀地落在宽度较窄的水平带状区域内,则说明线性回归模型的拟合精度较高;将一组数据中的每个数据都减去同一个数后,期望与方差均没有变化;调查剧院中观众观后感时,从50排(每排人数相同)中任意抽取一排的人进行调查是分层抽样法;已知随机变量X服从正态分布N(3,1),且P(24)=0.682 6,则P(X4)等于0.158 7某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为15人.A.2B.3C.4D.5[答案] A[解析] 正确,错误,设样本容量为n,则=,n=30,故错.二、填空题7.(2019吉林九校联合体二模)将某班的60名学生编号为:01,02,,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.[答案] 16,28,40,52[解析] 依据系统抽样方法的定义得知,将这60名学生依次按编号每12人作为一组,即01~12、13~24、、49~60,当第一组抽得的号码是04时,剩下的四个号码依次是16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码).8.(2019龙岩模拟)10名工人某天生产同一零件,生产的件数分别是10,12,14,14,14,15,15,16,16,17,设这10个数的中位数为a,众数为b,则a-b=________.[答案] 0.5[解析] 从数据中可以看出,众数b=14,且中位数a==14.5,a-b=14.5-14=0.5.9.(2019烟台质检)为了解某校高三学生身体状况,用分层抽样的方法抽取部分男生和女生的体重,将男生体重数据整理后,画出了频率分布直方图,已知图中从左到右前三个小组频率之比为123,第二小组频数为12,若全校男、女生比例为32,则全校抽取学生数为________.[答案] 80[解析] 第四小组和第五小组的频率之和是5(0.0125+0.0375)=0.25,故前三个小组的频率之和是0.75,则第二小组的频率是0.25,则抽取的男生人数是120.25=48人,抽取的女生人数是48=32人,全校共抽取80人.三、解答题10.(文)(2019东北三省三校二模)某个团购网站为了更好地满足消费者需求,对在其网站发布的团购产品展开了用户调查,每个用户在使用了团购产品后可以对该产品进行打分,最高分是10分.上个月该网站共卖出了100份团购产品,所有用户打分的平均分作为该产品的参考分值,将这些产品按照得分分成以下几组:第一组[0,2),第二组[2,4),第三组[4,6),第四组[6,8),第五组[8,10],得到的频率分布直方图如图所示.(1)分别求第三,四,五组的频率;(2)该网站在得分较高的第三,四,五组中用分层抽样的方法抽取了6个产品作为下个月团购的特惠产品,某人决定在这6个产品中随机抽取2个购买,求他抽到的两个产品均来自第三组的概率.[解析] (1)第三组的频率是0.1502=0.3;第四组的频率是0.1002=0.2;第五组的频率是0.0502=0.1(2)设抽到的两个产品均来自第三组为事件A,由题意可知,从第三、四、五组中分别抽取3个,2个,1个.不妨设第三组抽到的是A1,A2,A3;第四组抽到的是B1,B2;第五组抽到的是C1,所含基本事件总数为:{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,B2},{A1,C1},{A2,B1},{A2,B2},{A2,C1},{A3,B1},{A3,B2},{A3,C1},{B1,B2},{B1,C1},{B2,C1}所以P(A)==.(理)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲 82 81 79 78 95 88 93 84 乙 92 95 80 75 83 80 90 85(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由;(3)若将频率视为概率,对甲同学在今后的3次数学竞赛成绩进行预测,记这3次成绩中高于80分的次数为,求的分布列及数学期望E().[解析] (1)作出茎叶图如下:(2)派甲参赛比较合适,理由如下:甲=(702+804+902+8+9+1+2+4+8+3+5)=85乙=(701+804+903+5+0+0+3+5+0+2+5)=85.S=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88 -85)2+(93-85)2+(95-85)2]=35.5S=[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90 -85)2+(92-85)2+(95-85)2]=41甲=乙,SP1,派乙参赛比较合适.(3)记甲同学在一次数学竞赛中成绩高于80分为事件A,则P(A)==,随机变量的分布列为0 1 2 3 P E()=0+1+2+3=.(或E()=np=3=)数学2019年高考复习统计与统计案例专题训练及答案解析的全部内容就是这些,查字典数学网希望考生可以取得优异的成绩。

2019高考数学二轮复习 第二部分 专题六 概率与统计 专题强化练十五 统计与统计案例 文

2019高考数学二轮复习 第二部分 专题六 概率与统计 专题强化练十五 统计与统计案例 文

专题强化练十五 统计与统计案例一、选择题1.(2018·福建福州3月质量检测)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A .简单随机抽样B .按性别分层抽样C .按年龄段分层抽样D .系统抽样解析:根据分层抽样的特征,应按年龄段分层抽样. 答案:C2.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数 解析:刻画评估这种农作物亩产量稳定程度的指标是标准差. 答案:B3.(2018·河南焦作四模)已知变量x 和y 的统计数据如下表:根据上表可得回归直线方程为y =b x -0.25,据此可以预测当x =8时,y ^=( ) A .6.4 B .6.25 C .6.55 D .6.45 解析:由题意知x -=3+4+5+6+75=5,y -=2.5+3+4+4.5+65=4.将点(5,4)代入y ^=b ^x -0.25,解得b ^=0.85, 则y ^=0.85x -0.25,所以当x =8时,y ^=0.85×8-0.25=6.55.答案:C4.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析:由题图可知,2014年8月到9月的月接待游客量在减少,则A 选项错误. 答案:A5.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15解析:抽取号码的间隔为96032=30,从而区间[451,750]包含的段数为75030-45030=10,则编号落入区间[451,750]的人数为10人,即做问卷B 的人数为10.答案:C 二、填空题6.(2018·辽宁丹东期末教学质量监测)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动没有..关系”. 附:解析:关系.答案:1%7.(2018·江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.解析:5位裁判打出的分数分别为89,89,90,91,91,则这5位裁判打出的分数的平均数为15×(89+89+90+91+91)=90.答案:908.(2018·安徽马鞍山第一次教学质量检测)已知样本容量为200,在样本的频率分布直方图中,共有n 个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积和的13,则该组的频数为________.解析:设除中间一个小矩形外的(n -1)个小矩形面积的和为P ,则中间一个小矩形面积为13P . 又P +13P =1,P =34.则中间一个小矩形的面积等于13P =14,该组的频数是200×14=50.答案:50 三、解答题9.(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(2)估计该家庭使用节水龙头后,日用水量小于0.35(m 3)的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).解:(1)所求的频率分布直方图如下:(2)根据以上数据,该家庭使用节水龙头后,日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天的日用水量的平均数为x -1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天的日用水量的平均数为 x -2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m 3).10.某市春节期间7家超市的广告费支出x i (万元)和销售额y i (万元)数据如下:(1)若用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程;(2)用对数回归模型拟合y 与x 的关系,可得回归方程y ^=12ln x +22,经计算得出线性回归模型和对数回归模型的R 2分别约为0.75和0.97,请用R 2说明选择哪个回归模拟更合适,并用此模型预测A 超市广告费支出为8万元时的销售额.参数数据及公式:x -=8,y -=42,解:(1)因为=708.所以b ^==2 794-7×8×42708-7×82=1.7, 因此a ^=y --b ^x -=42-1.7×8=28.4.所以y 关于x 的线性回归方程是y ^=1.7x +28.4. (2)因为0.75<0.97,所以对数回归模型更合适.当x =8时,y ^=12ln 8+22=36ln 2+22=36×0.7+22=47.2万元. 所以广告费支出8万元时,预测A 超市销售额为47.2万元.。

统计与统计案例小题突破练-高三数学二轮专题复习

统计与统计案例小题突破练-高三数学二轮专题复习

冲刺高考二轮统计与统计案例小题突破练(原卷+答案)一、单项选择题1.已知某地区中小学生人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本容量和该地区的高中生近视人数分别为() A.200,25 B.200,2 500C.8 000,25 D.8 000,25002.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差3.国外新冠肺炎疫情形势严峻,国内疫情传播风险加大,为了更好地抗击疫情,国内进一步加大新冠疫苗的接种力度.某制药企业对某种新冠疫苗开展临床接种试验,若使用该疫苗后的抗体呈阳性,则认为该新冠疫苗有效.该企业对参与试验的1 000名受试者的年龄和抗体情况进行统计,结果如下图表所示:年龄频率[20,30)0.20[30,40)0.30[40,50)0.10[50,60)0.20[60,70)0.10[70,80]0.10则下列结论正确的是( )A .在受试者中,50岁以下的人数为700B .在受试者中,抗体呈阳性的人数为800C .受试者的平均年龄为45岁D .受试者的疫苗有效率为80%4.下图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,则由直方图得到的25%分位数为( )A .66.5B .67C .67.5D .685.已知一组数据:x 1,x 2,x 3的平均数是5,方差是4,则由2x 1+1,2x 2+1,2x 3+1和11 这四个数据组成的新数据组的方差是( )A .16B .14C .12D .116.某新能源汽车销售公司统计了某款汽车行驶里程x (单位:万千米)对应维修保养费用y (单位:万元)的四组数据,这四组数据如下表:行驶里程x /万千米 1 2 4 5 维修保养费用y /万元 0.50 0.90 2.30 2.70若用最小二乘法求得回归直线方程为y ^ =0.58x +a ^,则估计该款汽车行驶里程为6万千米时的维修保养费是( )A .3.34万元B .3.62万元C .3.82万元D .4.02万元7.通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:已知χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),P (χ2≥10.828)=0.001,根据小概率值α=0.001的χ2独立性检验,以下结论正确的为( )A .爱好跳绳与性别有关B .爱好跳绳与性别有关,这个结论犯错误的概率不超过0.001C .爱好跳绳与性别无关D .爱好跳绳与性别无关,这个结论犯错误的概率不超过0.0018.为研究变量x ,y 的相关关系,收集得到下面五个样本点(x ,y ):x 5 6.5 7 8 8.5 y 9 8 6 4 3若由最小二乘法求得y 关于x 的回归直线方程为y ^ =-1.8x +a ^,则据此计算残差为0的样本点是( )A .(5,9)B .(6.5,8)C .(7,6)D .(8,4)二、多项选择题9.下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A .样本x 1,x 2,…,x n 的标准差 B .样本x 1,x 2,…,x n 的中位数 C .样本x 1,x 2,…,x n 的极差 D .样本x 1,x 2,…,x n 的平均数10.有一组样本数据x 1,x 2,…,x n ,由这组数据得到新样本数据y 1,y 2,…,y n ,其中y i =x i +c (i =1,2,…,n ),c 为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同11.某车间加工某种机器的零件数x 与加工这些零件所花费的时间y 之间的对应数据如下表所示:x /个 10 20 30 40 50 y /min 62 68 75 81 89由表中的数据可得回归直线方程y ^ =b ^x +54.9,则以下结论正确的有( ) A .相关系数r >0B .b ^=0.67C .零件数10,20,30,40,50的中位数是30D .若加工60个零件,则加工时间一定是95.1 min12.小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )A .骑车时间的中位数的估计值是22分钟B .骑车时间的众数的估计值是21分钟C .坐公交车时间的中位数的估计值是20分钟D .坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值 三、填空题13.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为________.14.为了解某社区居民的2021年家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元) 6.2 7.5 8.0 t 9.8根据上表可得回归直线方程y ^=0.76x +0.4,则t =________.15.定义一个同学数学成绩优秀的标准为“连续5次数学考试成绩均不低于120分(满分150分)”.现有甲、乙、丙三位同学连续5次数学考试成绩的数据(数据都是正整数)的描述:①甲同学的5个数据的中位数为125,总体均值为128; ②乙同学的5个数据的中位数为127,众数为121;③丙同学的5个数据的众数为125,极差为10,总体均值为125. 则数学成绩一定优秀的同学是________.16.在对某中学高一年级学生每周体育锻炼时间的调查中,采用随机数法,抽取了男生30人,女生20人. 已知男同学每周锻炼时间的平均数为17小时,方差为11;女同学每周锻炼时间的平均数为12小时,方差为16. 依据样本数据,估计本校高一年级学生每周体育锻炼时间的方差为________.参考答案1.解析:由扇形分布图结合分层抽样知识易知样本容量为8040% =200,则样本中高中生的人数为200×25%=50,易知总体的容量为501%=5 000,结合近视率条形图得该地区高中生近视人数为5 000×50%=2 500. 故选B. 答案:B 2.解析:由统计图可知,讲座前这10位社区居民问卷答题的正确率分别为65%,60%,70%,60%,65%,75%,90%,85%,80%,95%.对于A 项,将这10个数据从小到大排列为60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,因此这10个数据的中位数是第5个与第6个数的平均数,为70%+75%2=72.5%>70%,A 错误.对于B 项,由统计图可知,讲座后这10位社区居民问卷答题的正确率分别为90%,85%,80%,90%,85%,85%,95%,100%,85%,100%,所以讲座后这10位社区居民问卷答题的正确率的平均数为110×(90%+85%+80%+90%+85%+85%+95%+100%+85%+100%)=89.5%>85%,B 正确.对于C 项,讲座后这10位社区居民问卷答题的正确率的方差s 2后 =110×[(90%-89.5%)2+(85%-89.5%)2+…+(85%-89.5%)2+(100%-89.5%)2]=42.2510 000 ,所以标准差s 后=6.5%.讲座前这10位社区居民问卷答题的正确率的平均数为110×(60%+60%+65%+65%+70%+75%+80%+85%+90%+95%)=74.5%,所以讲座前这10位社区居民问卷答题的正确率的方差为s 2前 =110×[(60%-74.5%)2+(60%-74.5%)2+…+(90%-74.5%)2+(95%-74.5%)2]=142.2510 000,所以标准差s 前≈11.93%.所以s 前>s 后,C 错误.对于D 项,讲座前问卷答题的正确率的极差为95%-60%=35%,讲座后问卷答题的正确率的极差为100%-80%=20%,D 错误.故选B.答案:B3.解析:50岁以下1 000×(0.2+0.3+0.1)=600人,A 选项错误.在受试者中,抗体呈阳性的人数为600×0.9+400×0.85=880,B 选项错误.受试者的平均年龄为25×0.2+35×0.3+45×0.1+55×0.2+65×0.1+75×0.1=45,C 选项正确.受试者的疫苗有效率为8801 000×100%=88%,D 选项错误.故选C. 答案:C4.解析:第一组的频率为0.010×10=0.1,前两组的频率之和为(0.010+0.020)×10=0.3,知25%分位数在第二组[60,70)内,故25%分位数为60+10×0.25-0.10.2=67.5.故选C. 答案:C5.解析:由已知得x 1+x 2+x 3=15,(x 1-5)2+(x 2-5)2+(x 3-5)2=12,则新数据的平均数为14 (2x 1+1+2x 2+1+2x 3+1+11)=2(x 1+x 2+x 3)+3+114=11,所以方差为14[(2x 1+1-11)2+(2x 2+1-11)2+(2x 3+1-11)2+(11-11)2],=14 [4(x 1-5)2+4(x 2-5)2+4(x 3-5)2]=(x 1-5)2+(x 2-5)2+(x 3-5)2=12, 故选C. 答案:C6.解析:由已知x - =1+2+4+54 =3,y - =0.5+0.9+2.3+2.74=1.6,所以1.6=0.58×3+a ^ ,a ^ =-0.14,即y ^=0.58x -0.14,x =6时,y ^=0.58×6-0.14=3.34, 故选A. 答案:A7.解析:a +b =40+20=60,c +d =20+30=50,a +c =40+20=60, b +d =20+30=50,ad -bc =40×30-20×20=800,n =110,χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ) =110×800260×50×60×50 ≈7.822<10.828,故爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001, 故选D. 答案:D8.解析:由题意可知,x - =5+6.5+7+8.5+85 =7,y - =9+8+6+4+35=6,所以回归方程的样本中心点为(7,6),因此有6=-1.8×7+a ^ ⇒a ^=18.6,所以y ^=-1.8x +18.6,在收集的5个样本点中,(7,6)一点在y ^=-1.8x +18.6上,故计算残差为0的样本点是(7,6).故选C. 答案:C9.解析:由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度; 由平均数的定义可知,平均数考查的是数据的集中趋势. 答案:AC10.解析:A :E (y )=E (x +c )=E (x )+c 且c ≠0,故平均数不相同,错误;B :若第一组中位数为x i ,则第二组的中位数为y i =x i +c ,显然不相同,错误;C :D (y )=D (x )+D (c )=D (x ),故方差相同,正确; D :由极差的定义知:若第一组的极差为x max -x min ,则第二组的极差为y max -y min =(x max+c )-(x min +c )=x max -x min ,故极差相同,正确.答案:CD11.解析:由表中的数据,得x - =10+20+30+40+505=30,y -=62+68+75+81+895 =75,将x - ,y - 代入y ^ =b ^ x +54.9,得b ^=0.67,选项A ,B 均正确, 10,20,30,40,50的中位数是30,选项C 正确;当x =60时,y ^=0.67×60+54.9=95.1,所以加工时间约是95.1 min ,而非一定是95.1min ,选项D 错误.故选ABC. 答案:ABC12.解析:在骑车时间频率分布直方图中,设骑车时间的中位数为a 1, 所以有0.1×2+0.2×(a 1-20)=0.5⇒a 1=21.5,因此选项A 不正确; 骑车时间的众数的估计值为21分钟,因此选项B 正确; 设骑车时间的平均数为b 1,b 1=(19×0.1+21×0.2+23×0.15+25×0.05)×2=21.6;在坐公交车时间频率分布直方图中,设坐公交车时间的中位数为a 2,因为(0.025+0.05+0.075+0.1)×2=0.5,所以a 2=20,因此选项C 正确; 设坐公交车时间的平均数为b 2,b 2=(13×0.025+15×0.05+17×0.075+19×0.1+21×0.1+23×0.075+25×0.05+27×0.025)×2=20,因为b 1>b 2,所以选项D 正确, 故选BCD. 答案:BCD13.解析:根据等高条形图可知: 喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层抽样的方法抽取23人,则抽取的男生人数为300460×23=15人.答案:1514.解析:分别求出收入和支出的平均数,可得:x - =8.2+8.6+10.0+11.3+11.95=10,y - =6.2+7.5+8.0+9.8+t 5 =31.5+t 5,代入y ^=0.76x +0.4可得:31.5+t 5=0.76×10+0.4,解得:t =8.5. 答案:8.515.解析:在①中,甲同学的5个数据的中位数为125,总体均值为128,可以找到很多反例,如118,119,125,128,150,故甲同学的数学成绩不一定优秀; 在②中,乙同学的5个数据的中位数为127,众数为121,所以前三个数为121,121,127,则后两个数肯定大于127,故乙同学的数学成绩一定优秀;在③中,丙同学的5个数据的众数为125,极差为10,总体均值为125,最大值与最小值的差为10,若最大值为129,则最小值为119.即119,125,125,127,129,故丙同学的数学成绩不一定优秀.综上,数学成绩一定优秀的同学只有乙. 答案:乙16.解析:根据平均数的计算公式,全班的平均数为z - =17×30+12×2030+20=15,设男同学为x 1,x 2,…,x 30,女同学为y 1,y 2,…,y 20,答案:19。

2019届高三数学二模试卷理科附答案

2019届高三数学二模试卷理科附答案

2019届高三数学二模试卷理科附答案理科数学(二)注意事项:1.答题前,先将自己的姓名、准考证号填写在试题卷和答题卡上,并将准考证号条形码粘贴在答题卡上的指定位置。

2.选择题的作答:每小题选出答案后,用2B铅笔把答题卡上对应题目的答案标号涂黑,写在试题卷、草稿纸和答题卡上的非答题区域均无效。

3.非选择题的作答:用签字笔直接答在答题卡上对应的答题区域内。

写在试题卷、草稿纸和答题卡上的非答题区域均无效。

4.考试结束后,请将本试题卷和答题卡一并上交。

一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.[2019•乐山调研]若与互为共轭复数,则的值为()A.B.C.D.2.[2019•济南外国语]已知集合,,则()A.B.C.D.3.[2019•九江一模] 的部分图像大致为()A.B.C.D.4.[2019•榆林一模]已知向量,满足,,,则()A.2 B.C.D.5.[2019•湘潭一模]以双曲线的焦点为顶点,且渐近线互相垂直的双曲线的标准方程为()A.B.C.D.6.[2019•武邑中学]在中,角,,的对边分别为,,,若,,,则角()A.B.C.或D.或7.[2019•新乡调研]某医院今年1月份至6月份中,每个月为感冒来就诊的人数如下表所示:()上图是统计该院这6个月因感冒来就诊人数总数的程序框图,则图中判断框、执行框依次应填()A.;B.;C.;D.;8.[2019•优创名校联考]袋子中有四个小球,分别写有“美、丽、中、国”四个字,有放回地从中任取一个小球,直到“中”“国”两个字都取到就停止,用随机模拟的方法估计恰好在第三次停止的概率.利用电脑随机产生0到3之间取整数值的随机数,分别用0,1,2,3代表“中、国、美、丽”这四个字,以每三个随机数为一组,表示取球三次的结果,经随机模拟产生了以下18组随机数:232 321 230 023 123 021 132 220 001231 130 133 231 031 320 122 103 233由此可以估计,恰好第三次就停止的概率为()A.B.C.D.9.[2019•成都一诊]在各棱长均相等的四面体中,已知是棱的中点,则异面直线与所成角的余弦值为()A.B.C.D.10.[2019•长沙一模]已知是函数图象的一个最高点,,是与相邻的两个最低点.设,若,则的图象对称中心可以是()A.B.C.D.11.[2019•湖北联考]已知偶函数满足,现给出下列命题:①函数是以2为周期的周期函数;②函数是以4为周期的周期函数;③函数为奇函数;④函数为偶函数,则其中真命题的个数是()A.1 B.2 C.3 D.412.[2019•宜昌调研]已知椭圆:上存在、两点恰好关于直线:对称,且直线与直线的交点的横坐标为2,则椭圆的离心率为()A.B.C.D.二、填空题:本大题共4小题,每小题5分,共20分.13.[2019•泉州质检]若函数的图象在点处的切线过点,则______.14.[2019•湖北联考]设,满足约束条件,则的最大值为____.15.[2019•镇江期末]若,,则_______.16.[2019•遵义联考]已知三棱锥中,面,且,,,,则该三棱锥的外接球的表面积为__________.三、解答题:本大题共6大题,共70分,解答应写出文字说明、证明过程或演算步骤.17.(12分)[2019•潍坊期末]已知数列的前项和为,且,,成等差数列.(1)求数列的通项公式;(2)数列满足,求数列的前项和.18.(12分)[2019•开封一模]大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中成功开设大学先修课程已有两年,共有250人参与学习先修课程,这两年学习先修课程的学生都参加了高校的自主招生考试(满分100分),结果如下表所示:分数人数25 50 100 50 25参加自主招生获得通过的概率(1)这两年学校共培养出优等生150人,根据下图等高条形图,填写相应列联表,并根据列联表检验能否在犯错的概率不超过的前提下认为学习先修课程与优等生有关系?优等生非优等生总计学习大学先修课程250没有学习大学先修课程总计150(2)已知今年全校有150名学生报名学习大学选项课程,并都参加了高校的自主招生考试,以前两年参加大学先修课程学习成绩的频率作为今年参加大学先修课程学习成绩的概率.(i)在今年参与大学先修课程学习的学生中任取一人,求他获得高校自主招生通过的概率;(ii)某班有4名学生参加了大学先修课程的学习,设获得高校自主招生通过的人数为,求的分布列,试估计今年全校参加大学先修课程学习的学生获得高校自主招生通过的人数.参考数据:参考公式:,其中.19.(12分)[2019•湖北联考]如图,在四棱锥中,,,,且,.(1)证明:平面;(2)在线段上,是否存在一点,使得二面角的大小为?如果存在,求的值;如果不存在,请说明理由.20.(12分)[2019•河北联考]在直角坐标系中,直线与抛物线交于,两点,且.(1)求的方程;(2)试问:在轴的正半轴上是否存在一点,使得的外心在上?若存在,求的坐标;若不存在,请说明理由.21.(12分)[2019•泉州质检]已知函数.(1)讨论的单调性;(2)当时,,求的取值范围.请考生在22、23两题中任选一题作答,如果多做,则按所做的第一题记分.22.(10分)【选修4-4:坐标系与参数方程】[2019•九江一模]在直角坐标系中,曲线的参数方程为(为参数),以坐标原点为极点,以轴正半轴为极轴,建立极坐标系(,),点为曲线上的动点,点在线段的延长线上,且满足,点的轨迹为.(1)求,的极坐标方程;(2)设点的极坐标为,求面积的最小值.23.(10分)【选修4-5:不等式选讲】[2019•湘潭一模]设函数.(1)当时,求关于的不等式的解集;(2)若在上恒成立,求的取值范围.2019届高三第二次模拟考试卷理科数学(二)答案一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.【答案】A【解析】∵,,又与互为共轭复数,∴,,则.故选A.2.【答案】C【解析】∵集合,,∴,,∴.故选C.3.【答案】B【解析】,则函数是偶函数,图象关于轴对称,排除A,D,,排除C,故选B.4.【答案】A【解析】根据题意得,,又,∴,∴,∴.故选A.5.【答案】D【解析】由题可知,所求双曲线的顶点坐标为,又∵双曲线的渐近线互相垂直,∴,则该双曲线的方程为.故选D.6.【答案】A【解析】∵,,,∴由正弦定理可得,∵,由大边对大角可得,∴解得.故选A.7.【答案】C【解析】∵要计算1月份至6月份的6个月的因感冒来就诊的人数,∴该程序框图要算出所得到的和,①当时,,没有算出6个月的人数之和,需要继续计算,因此变成2,进入下一步;②当时,用前一个加上,得,仍然没有算出6个月的人数之和而需要继续计算,因此变成3,进入下一步;③当时,用前一个加上,得,仍然没有算出6个月的人数之和而需要继续计算,因此变成4,进入下一步;④当时,用前一个加上,得,仍然没有算出6个月的人数之和而需要继续计算,因此变成5,进入下一步;⑤当时,用前一个加上,得,仍然没有算出6个月的人数之和而需要继续计算,因此变成6,进入下一步;⑥当时,用前一个加上,得,刚好算出6个月的人数之和,因此结束循环体,并输出最后的值,由以上的分析,可得图中判断框应填“”,执行框应填“”.故选C.8.【答案】C【解析】∵随机模拟产生18组随机数,由随机产生的随机数可知,恰好第三次就停止的有,,,共4个基本事件,根据古典概型概率公式可得,恰好第三次就停止的概率为,故选C.9.【答案】C【解析】设各棱长均相等的四面体中棱长为2,取中点,连结,,∴是棱的中点,∴,∴是异面直线与所成角(或所成角的补角),,,∴,∴异面直线与所成角的余弦值为,故选C.10.【答案】D【解析】结合题意,绘图又,,∴周期,解得,∴,,令,得到,∴,令,,得对称中心,令,得到对称中心坐标为,故选D.11.【答案】B【解析】偶函数满足,即有,即为,,可得的最小正周期为4,故①错误;②正确;由,可得,又,即有,故为奇函数,故③正确;由,若为偶函数,即有,可得,即,可得6为的周期,这与4为最小正周期矛盾,故④错误.故选B.12.【答案】C【解析】由题意可得直线与直线的交点,,设,,则,,∵、是椭圆上的点,∴①,②,①﹣②得:,∴,∴,∴,∴,故选C.二、填空题:本大题共4小题,每小题5分,共20分.13.【答案】1【解析】函数,可得,∴,又,∴切线方程为,切线经过,∴,解得.故答案为1.14.【答案】5【解析】作出,满足约束条件,所示的平面区域,如图:作直线,然后把直线向可行域平移,结合图形可知,平移到点时最大,由可得,此时.故答案为5.15.【答案】【解析】由得,即,又,解得,∴.16.【答案】【解析】取的中点,连结、,∵平面,平面,∴,可得中,中线,由,,,可知,又∵,、是平面内的相交直线,∴平面,可得,因此中,中线,∴是三棱锥的外接球心,∵中,,,∴,可得外接球半径,因此,外接球的表面积,故答案为.三、解答题:本大题共6大题,共70分,解答应写出文字说明、证明过程或演算步骤.17.【答案】(1);(2).【解析】(1)∵,,成等差数列,∴,当时,,∴,当时,,,两式相减得,∴,∴数列是首项为,公比为的等比数列,∴.(2),∴,∴.18.【答案】(1)见解析;(2)见解析.【解析】(1)列联表如下:优等生非优等生总计学习大学先修课程50 200 250没有学习大学先修课程100 900 1000总计150 **** ****由列联表可得,因此在犯错误的概率不超过的前提下认为学习先修课程与优等生有关系.(2)(i)由题意得所求概率为.(ii)设获得高校自主招生通过的人数为,则,,,1,2,3,4,∴的分布列为0 1 2 3 4估计今年全校参加大学先修课程的学生获得大学自主招生通过的人数为.19.【答案】(1)见证明;(2)见解析.【解析】(1)∵在底面中,,,且,∴,,∴,又∵,,平面,平面,∴平面,又∵平面,∴,∵,,∴,又∵,,平面,平面,∴平面.(2)方法一:在线段上取点,使,则,又由(1)得平面,∴平面,又∵平面,∴,作于,又∵,平面,平面,∴平面,又∵平面,∴,又∵,∴是二面角的一个平面角,设,则,,这样,二面角的大小为,即,即,∴满足要求的点存在,且.方法二:取的中点,则、、三条直线两两垂直∴可以分别以直线、、为、、轴建立空间直角坐标系,且由(1)知是平面的一个法向量,设,则,,∴,,设是平面的一个法向量,则,∴,令,则,它背向二面角,又∵平面的法向量,它指向二面角,这样,二面角的大小为,即,即,∴满足要求的点存在,且.20.【答案】(1);(2)在轴的正半轴上存在一点,使得的外心在上.【解析】(1)联立,得,则,,从而.∵,∴,即,解得,故的方程为.(2)设线段的中点为,由(1)知,,,则线段的中垂线方程为,即.联立,得,解得或,从而的外心的坐标为或.假设存在点,设的坐标为,∵,∴,则.∵,∴.若的坐标为,则,,则的坐标不可能为.故在轴的正半轴上存在一点,使得的外心在上.21.【答案】(1)见解析;(2).【解析】解法一:(1),①当时,↘极小值↗∴在上单调递减,在单调递增.②当时,的根为或.若,即,0 0↗极大值↘极小值↗∴在,上单调递增,在上单调递减.若,即,在上恒成立,∴在上单调递增,无减区间.若,即,0 0↗极大值↘极小值↗∴在,上单调递增,在上单调递减.综上:当时,在上单调递减,在单调递增;当时,在,上单调递增,在上单调递减;当时,在上单调递增,无减区间;当时,在,上单调递增,在上单调递减.(2)∵,∴.当时,恒成立.当时,.令,,设,∵在上恒成立,即在上单调递增.又∵,∴在上单调递减,在上单调递增,则,∴.综上,的取值范围为.解法二:(1)同解法一;(2)令,∴,当时,,则在上单调递增,∴,满足题意.当时,令,∵,即在上单调递增.又∵,,∴在上有唯一的解,记为,↘极小值↗,满足题意.当时,,不满足题意.综上,的取值范围为.请考生在22、23两题中任选一题作答,如果多做,则按所做的第一题记分.22.【答案】(1);;(2)2.【解析】(1)∵曲线的参数方程为(为参数),∴曲线的普通方程为,∴曲线的极坐标方程为,设点的极坐标为,点的极坐标为,则,,,,∵,∴,∴,,∴的极坐标方程为.(2)由题设知,,当时,取得最小值为2.23.【答案】(1);(2).【解析】(1)∵,∴的解集为.(2)∵,∴,即,则,∴.。

2019高考数学二轮复习课时跟踪检测十三概率统计统计案例小题练理

2019高考数学二轮复习课时跟踪检测十三概率统计统计案例小题练理

课时跟踪检测(十三) 概率、统计、统计案例 (小题练)A 级——12+4提速练一、选择题1.(2018·长春模拟)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )A .95,94B .92,86C .99,86D .92,91解析:选B 由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B.2.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大依次构成等比数列{a n }(n =1,2,3,4).已知a 2=2a 1,且样本容量为300,则小长方形面积最小的一组的频数为( )A .20B .40C .30D .无法确定解析:选A 由已知,得4个小长方形的面积分别为a 1,2a 1,4a 1,8a 1,所以a 1+2a 1+4a 1+8a 1=1,得a 1=115,因此小长方形面积最小的一组的频数为115×300=20.3.(2018·许昌二模)某校共有在职教师140人,其中高级教师28人,中级教师56人,初级教师56人,现采用分层抽样的方法从在职教师中抽取5人进行职称改革调研,然后从抽取的5人中随机抽取2人进行深入了解,则抽取的这2人中至少有1人是初级教师的概率为( )A.710B.310C.320D.720解析:选 A 由题意得,应从高级、中级、初级教师中抽取的人数分别为5×28140=1,5×56140=2,5×56140=2,则从5人中随机抽取2人,这2人中至少有1人是初级教师的概率为C12C13+C22C25=710.4.(2018·昆明模拟)如图是1951~2016年我国的年平均气温变化的折线图,根据图中信息,下列结论正确的是( )A .1951年以来,我国的年平均气温逐年增高B .1951年以来,我国的年平均气温在2016年再创新高C .2000年以来,我国每年的年平均气温都高于1981~2010年的平均值D .2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值解析:选D 由图可知,1951年以来,我国的年平均气温变化是有起伏的,不是逐年增高的,所以选项A 错误;1951年以来,我国的年平均气温最高的不是2016年,所以选项B 错误;由图可知,1981~2010年的气温平均值为9.5,2012年的年平均气温低于1981~2010年的平均值,所以选项C 错误;2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值,所以选项D 正确.5.(2018·全国卷Ⅱ)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是( )A.112B.114C.115D.118解析:选C 不超过30的所有素数为2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有C210=45种情况,而和为30的有7+23,11+19,13+17这3种情况,∴所求概率为345=115.故选C.6.(2018·合肥一模)某广播电台只在每小时的整点和半点开始播放新闻,时长均为5分钟,则一个人在不知道时间的情况下打开收音机收听该电台,能听到新闻的概率是( )A.114B.112C.17D.16解析:选D 由题意知,该广播电台在一天内播放新闻的时长为24×2×5=240分钟,即4个小时,所以所求的概率为424=16,故选D.7.(2018·石家庄模拟)某种电路开关闭合后会出现红灯或绿灯闪烁,已知开关第一次闭合后出现红灯的概率为12,两次闭合后都出现红灯的概率为15,则开关在第一次闭合后出现红灯的条件下第二次闭合后出现红灯的概率为( )A.110B.15C.25D.12解析:选C 设“开关第一次闭合后出现红灯”为事件A ,“开关第二次闭合后出现红灯”为事件B ,则“开关两次闭合后都出现红灯”为事件AB ,“开关在第一次闭合后出现红灯的条件下第二次闭合后出现红灯”为事件B |A ,由题意得P (B |A )==25,故选C.8.(2019届高三·辽宁五校联考)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有显著效果的图形是( )解析:选D 分析四个等高条形图得选项D 中,不服用药物与服用药物患病的差异最大,所以最能体现该药物对预防禽流感有显著效果,故选D.9.(2018·郑州、湘潭联考)已知a ∈{-2,0,1,2,3},b ∈{3,5},则函数f (x )=(a 2-2)ex+b 为减函数的概率是( )A.310B.35C.25D.15解析:选C 由题意知a ,b 的组合共有10种,函数f (x )=(a 2-2)e x+b 为减函数,则a 2-2<0,又a ∈{-2,0,1,2,3},故只有a =0,a =1满足题意,又b ∈{3,5},所以当a =0时,b 可取3,5;当a =1时,b 可取3,5,满足题意的组合有4种,所以函数f (x )=(a 2-2)ex+b 为减函数的概率是410=25.故选C.10.为比较甲、乙两地某月11时的气温情况,随机选取该月中的5天,将这5天中11时的气温数据(单位:℃)制成如图所示的茎叶图,给出以下结论: ①甲地该月11时的平均气温低于乙地该月11时的平均气温; ②甲地该月11时的平均气温高于乙地该月11时的平均气温;③甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差; ④甲地该月11时的气温的标准差大于乙地该月11时的气温的标准差.其中根据茎叶图能得到的正确结论的编号为( )A .①③B .①④C .②③D .②④解析:选C 由茎叶图和平均数公式可得甲、乙两地的平均数分别是30,29,则甲地该月11时的平均气温高于乙地该月11时的平均气温,①错误,②正确,排除A 和B ;又甲、乙两地该月11时的标准差分别是s 甲=4+1+1+45=2,s 乙= 9+1+4+45=185,则甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差,③正确,④错误,故选项C 正确.11.由不等式组⎩⎪⎨⎪⎧x≤0,y≥0,y -x -2≤0确定的平面区域记为Ω1,不等式组⎩⎪⎨⎪⎧x +y≤1,x +y≥-2确定的平面区域记为Ω2.在Ω1中随机取一点,则该点恰好在Ω2内的概率为( )A.18B.14C.34D.78解析:选D 由题意作图,如图所示,Ω1的面积为12×2×2=2,图中阴影部分的面积为2-12×12×1=74,则所求的概率P =742=78.12.(2018·内蒙古包头铁路一中调研)甲、乙、丙三人参加一次考试,他们合格的概率分别为23,34,25,那么三人中恰有两人合格的概率是( )A.25B.1130C.715D.16解析:选C 三人中恰有两人合格的概率P =23×34×⎝ ⎛⎭⎪⎫1-25+23×⎝⎛⎭⎪⎫1-34×25+⎝ ⎛⎭⎪⎫1-23×34×25=715,故选C. 二、填空题13.(2018·南昌模拟)某校高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为________.解析:由题知分组间隔为648=8,又第1组中抽取的号码为5,所以第6组中抽取的号码为5×8+5=45.答案:4514.(2018·天津和平区调研)从混有5张假钞的20张百元钞票中任意抽取两张,将其中一张放到验钞机上检验发现是假钞,则两张都是假钞的概率是________.解析:设事件A 为“抽到的两张都是假钞”,事件B 为“抽到的两张至少有一张假钞”,则所求的概率为P (A |B ),因为P (AB )=P (A )=C25C220=119,P (B )=C25+C15C115C220=1738,所以P (A |B )==1191738=217. 答案:21715.某篮球比赛采用7局4胜制,即若有一队先胜4局,则此队获胜,比赛就此结束.由于参加比赛的两队实力相当,每局比赛两队获胜的可能性均为12.据以往资料统计,第一局比赛组织者可获得门票收入40万元,以后每局比赛门票收入比上一局增加10万元,则组织者在此次比赛中获得的门票收入不少于390万元的概率为________.解析:依题意,每局比赛获得的门票收入组成首项为40,公差为10的等差数列,设此数列为{a n },则易知首项a 1=40,公差d =10,故S n =40n +-2×10=5n 2+35n .由S n ≥390,得n 2+7n ≥78,所以n ≥6.所以要使获得的门票收入不少于390万元,则至少要比赛6局.①若比赛共进行6局,则P 6=C35×⎝ ⎛⎭⎪⎫125=516;②若比赛共进行了7局,则P 7=C36×⎝ ⎛⎭⎪⎫126=516.所以门票收入不少于390万元的概率P =P 6+P 7=1016=58.答案:5816.(2018·石家庄摸底)为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2=-23×27×20×30≈4.844,则认为选修文理科与性别有关系出错的可能性约为________.解析:由K 2=4.844>3.841.故认为选修文理科与性别有关系出错的可能性约为5%.答案:5%B 级——难度小题强化练1.(2018·成都模拟) 小明在花店定了一束鲜花,花店承诺将在第二天早上7:30~8:30之间将鲜花送到小明家.若小明第二天离开家去公司上班的时间在早上8:00~9:00之间,则小明在离开家之前收到这束鲜花的概率是( )A.18B.14C.34D.78解析:选D 如图,设送花人到达小明家的时间为x ,小明离家去上班的时间为y ,记小明离家前能收到鲜花为事件A .(x ,y )可以看成平面中的点,试验的全部结果所构成的区域为Ω={(x ,y )|7.5≤x ≤8.5,8≤y ≤9},这是一个正方形区域,面积为S Ω=1×1=1,事件A 所构成的区域为A ={(x ,y )|y ≥x,7.5≤x ≤8.5,8≤y ≤9},即图中的阴影部分,面积为S A =1-12×12×12=78.这是一个几何概型,所以P (A )=SA S Ω=78,故选D.2.(2018·福州四校联考)某汽车的使用年数x 与所支出的维修总费用y 的统计数据如下表:根据上表可得y 关于x 的线性回归方程y =b x -0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)( )A .8年B .9年C .10年D .11年解析:选D 由y 关于x 的线性回归直线y ^=b ^x -0.69过样本点的中心(3,2.34),得b ^=1.01,即线性回归方程为y ^=1.01x -0.69,由y ^=1.01x -0.69=10得x ≈10.6,所以预测该汽车最多可使用11年,故选D.3.(2018·长春模拟)如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩y 关于测试序号x 的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好;②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升.其中正确结论的个数为( )A .0B .1C .2D .3解析:选D ①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.②由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选D.4.(2018·郑州模拟)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为( )A.49 B .2 C.94D .9解析:选C 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4.由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a+4b =⎝ ⎛⎭⎪⎫1a +4b ×⎝ ⎛⎭⎪⎫a 4+b 4=14⎝ ⎛⎭⎪⎫1+b a +4a b +4≥14×(5+4)=94(当且仅当b =2a 时取等号).故1a +4b 的最小值为94,选C.5.正六边形ABCDEF 的边长为1,在正六边形内随机取点M ,则使△MAB 的面积大于34的概率为________.解析:如图所示,作出正六边形ABCDEF ,其中心为O ,过点O 作OG⊥AB ,垂足为G ,则OG 的长为中心O 到AB 边的距离.易知∠AOB =360°6=60°,且OA =OB ,所以△AOB 是等边三角形,所以OA =OB =AB =1,OG =OA ·sin 60°=1×32=32,即对角线CF 上的点到AB 的距离都为32.设△MAB 中AB 边上的高为h ,则由S △MAB =12×1×h >34,解得h >32.所以要使△MAB 的面积大于34,只需满足h >32,即需使M 位于CF 的上方. 故由几何概型得,△MAB 的面积大于34的概率P =S 梯形CDEF S 正六边形ABCDEF =12.答案:126.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.解析:总体容量为6+12+18=36.当样本容量为n 时,由题意可知,系统抽样的抽样距为36n ,分层抽样的抽样比是n36,则采用分层抽样法抽取的乒乓球运动员人数为6×n 36=n 6,篮球运动员人数为12×n 36=n3,足球运动员人数为18×n 36=n2,可知n 应是6的倍数,36的约数,故n =6,12,18.当样本容量为n +1时,剔除1个个体,此时总体容量为35,系统抽样的抽样距为35n +1,因为35n +1必须是整数,所以n 只能取6,即样本容量n 为6.答案:6。

2019年高考数学一轮复习 小题精练系列 专题15 统计与统计案例(含解析)文

2019年高考数学一轮复习 小题精练系列 专题15 统计与统计案例(含解析)文

2019年高考数学一轮复习 小题精练系列 专题15 统计与统计案例(含解析)文1.已知样本789x y 、、、、的平均数是8,则xy 值为A . 8B . 32C . 60D . 80【答案】C 【解析】由78982x y ++++==得=60xy ,故选C .2.某校高一(1)班共有54人,如图是该班期中考试数学成绩的频率分布直方图,则成绩在[]100,120内的学生人数为A . 36B . 27C . 22 D.11【答案】B3.如图是2014年在某电视节目中七位评委为某民族舞蹈打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为A . 84,4.84B . 84,1.6C . 85,1.6D . 85,4【答案】C【解析】由茎叶图知,去掉一个最高分93和一个最低分79后,所剩数据84,84,86,84,87的平均数为=85,方差为 [(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]==1.6.故选C.4.某企业有职工450人,其中高级职工45人,中级职工135人,一般职工270人,现抽30人进行分层抽样,则各职称人数分别为()A.5,10,15 B. 5,9,16 C. 3,10,17 D. 3,9,18【答案】D点睛:进行分层抽样的相关计算时,常利用以下关系式巧解:(1)nN样本容量该层抽取的个体数总体个数该层的个体数;(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.5.具有线性相关关系的两变量满足的一组数据如下表,若与的回归直线方程为,则的值为()A. 4 B. C. 5 D. 6【答案】A【解析】由表中数据得:,根据最小二乘法,将代入回归方程,得,故选A.6.某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为()A. 6万元 B. 8万元 C. 10万元 D. 12万元【答案】C【解析】设11时到12时的销售额为万元,依题意有,,故选C.点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.7.下面对相关系数r描述正确的是()r>表明两个变量负相关 B.r>1表明两个变量正相关A.0C.r只能大于零 D.r越接近于0,两个变量相关关系越弱【答案】D8.下列说法错误的是( )A . 在统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法B . 在残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好C . 线性回归方程对应的直线ˆˆˆybx a =+至少经过其样本数据点中的一个点 D . 在回归分析中,相关指数2R 越大,模拟的效果越好【答案】C【解析】对于A ,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,正确;对于B ,残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好,正确;对于C ,线性回归方程对应的直线ˆˆˆybx a =+过样本中心点,不一定过样本数据中的点,故C 错误;对于D ,回归分析中,相关指数R 2越大,其模拟的效果就越好,正确.故选C .9.以下四个命题,其中正确的个数有( )①由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.②两个随机变量相关性越强,则相关系数的绝对值越接近于1; ③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说, k 越小,“X 与Y 有关系”的把握程度越大.A . 1B . 2C . 3D . 4【答案】B10.下表是某工厂1—4月份用电量(单位:万度)的一组数据:由散点图可知,用电量y 与月份x 间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a =( )A .10.5B .5.25C .5.2D .5.15 【答案】B【解析】试题分析:因为1234 4.543 2.52.5, 3.544x y++++++====,所以()2.5,3.5在归直线方程0.7y x a =-+上,即3.50.7 2.5,5.25a a =-⨯+=,故选B .考点:线性回归直线的性质和应用.11.某高中共有学生1000名,其中高一年级共有学生380人,高二年级男生有180人.如果在全校学生中抽取1名学生,抽到高二年级女生的概率为19.0,先采用分层抽样(按年级分层)在全校抽取100人,则应在高三年级中抽取的人数等于 .【答案】25考点:分层抽样方法.12.总体编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为_______.【答案】01【解析】试题分析:从随机数表的第一行的第5列和第6列数字开始由左到右选取两个谁中小于20的编号依次为08,02,14,07,02,01,其中第二个和第四个都是02,重复,所以对应的数值为08,02,14,07,02,01.考点:简单的随机抽样.。

专题15 统计与统计案例(基础篇)-2019年高考数学艺体生备考百日冲刺资料

专题15 统计与统计案例(基础篇)-2019年高考数学艺体生备考百日冲刺资料

专题十五 统计与统计案例抽样方法【背一背基础知识】1.简单随机抽样:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小.2.系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =N n ;当Nn (n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[Nn ];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等.3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.【讲一讲释疑解惑】1.必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2.典型例题:例1【2018年全国卷Ⅲ文】某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________. 【答案】分层抽样 【解析】由于从不同龄段客户中抽取,故采用分层抽样,故答案为:分层抽样.例2.【2017江苏,3】 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取( )件.②回归方程: y bx a =+是两个具有线性相关关系的变量的一组数据的回归方程,其中a b 、是待定参数. a b 、的计算公式.2.独立性检验:2×2列联表构造一个随机变量,利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验:若2 3.841χ>,则有95%把握认为A 与B 有关;若2 6.635χ>,则有99%把握认为A 与B 有关; 其中2 3.841χ=是判断是否有关系的临界值,2 3.841χ≤应判断为没有充分证据显示A 与B 有关,而不能作为小于95%的量化值来判断.【讲一讲释疑解惑】1.必备技能:①求回归直线,使“离差平方和为最小”的方法叫做最小二乘法,用最小二乘法求得回归方程y bx a =+是两个具有线性相关关系的变量的一组数据的回归方程,其中a b 、是待定参数.可以看出:(ⅰ)回归直线必过点(),x y;(ⅱ)b与r符号相同.②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,主要判断特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式.比如线性回归分析就是分析求出的回归直线是否有意义,而判断的依据就是|r|的大小:|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.从散点图来看,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.线性相关检验的步骤如下:(ⅰ)作统计假设:x与Y不具有线性相关关系;(ⅱ)根据小概率0.05与n-2在附表中查出r的一个临界值0.05r;(ⅲ)根据样本相关系数计算公式求出r的值;(ⅳ)作统计推断,如果|r|>0.05r,表明有95%的把握认为x与Y之间具有线性相关关系;如果|r|≤0.05r,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.③注意:线性回归分析以散点图为基础,具有很强的直观性,有散点图作比较时,拟合效果的好坏可由直观性直接判断,没有散点图时,只须套用公式求r,再作判断即可.独立性检验没有直观性,必须依靠2χ作判断.2.典型例题例1【2017山东,理5】为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为ˆˆˆy bx a=+.已知101225 iix ==∑,,ˆ4b=.该班某学生的脚长为24,据此估计其身高为(A)160(B)163(C)166(D)170【答案】C【解析】由已知,选C.【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数r公式求出r,然后根据r的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.例2【2018届高考二轮专题】为了调查“小学成绩”与“中学成绩”两个变量之间是否存在相关关系,某科研机构将所调查的结果统计如下表所示:则下列说法正确的是( )参考数据:A. 在犯错误的概率不超过0.1的前提下,认为“小学成绩与中学成绩无关”B. 在犯错误的概率不超过0.1的前提下,认为“小学成绩与中学成绩有关”C. 在犯错误的概率不超过0.01的前提下,认为“小学成绩与中学成绩无关”D. 在犯错误的概率不超过0.01的前提下,认为“小学成绩与中学成绩有关”【答案】D【解析】K2的观测值k=≈8.71>6.635,可知,在犯错误的概率不超过0.01的前提下,认为“小学成绩与中学成绩有关”.故选:D【练一练能力提升】一、选择题(12*5=60分)1.【山东省德州市2019届高三期末联考】已知某产品连续4个月的广告费(千元)与销售额(万元)()满足,,若广告费用和销售额之间具有线性相关关系,且回归直线方程为,,那么广告费用为5千元时,可预测的销售额为___万元.【答案】3.75【解析】∵,∴,∵,∴,∴样本中心点为(,3),又回归直线过(,3),即3=0.6×+,解得=,所以回归直线方程为y=0.6x+,令x=5时,y=0.6×5+=3.75万元故答案为:3.75.2.【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()(A)56 (B)60 (C)120 (D)140【答案】D【解析】由频率分布直方图知,自习时间不少于22.5小时的有,选D.3.【河北省衡水中学2019届高三第一次摸底】某地某高中2018年的高考考生人数是2015年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2015和2018年高考情况,得到如下饼图:2018年与2015年比较,下列结论正确的是()A.一本达线人数减少B.二本达线人数增加了0.5倍C.艺体达线人数相同D.不上线的人数有所增加【答案】D【解析】不妨设2015年的高考人数为100,则2018年的高考人数为150.2015年一本达线人数为28,2018年一本达线人数为36,可见一本达线人数增加了,故选项错误;2015年二本达线人数为32,2018年二本达线人数为60,显然2018年二本达线人数不是增加了0.5倍,故选项错误;艺体达线比例没变,但是高考人数是不相同的,所以艺体达线人数不相同,故选项错误;2015年不上线人数为32,2018年不上线人数为42,不上线人数有所增加,选项正确. 故选D.4.【2017课标1,文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B5.【2018届黑龙江省佳木斯市第一中学高三第七次调研】如果数据的平均数是,方差是,则,……的平均数和方差分别是()A. 与B. 和C. 和D. 和【答案】D【解析】,故选D.6.【2018届福建省莆田市高三3月教学质量检测】为了解某校一次期中考试数学成绩情况,抽取100位学生的数学成绩,得如图所示的频率分布直方图,其中成绩分组区间是,则估计该次数学成绩的中位数是()A. 71.5B. 71.8C. 72D. 75【答案】C的频率和为:.由,得中位数为:.故选C.点睛:用频率分布直方图估计总体特征数字的方法:①众数:最高小长方形底边中点的横坐标;②中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;③平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.7.【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A. 3,5B. 5,5C. 3,7D. 5,7【答案】A【解析】8.【2018届北京市海淀区高三上学期期末】下面的茎叶图记录的是甲、乙两个班级各5各同学在一次数学测试中的选择题的成绩(单位:分,每道题5分,共8道题):已知两组数据的平均数相等,则的值分别为A. 0,0B. 0,5C. 5,0D. 5,5【答案】B【解析】根据平均数的概念得到根据选项得到故选.8.【2018届安徽省池州市高三上学期期末】某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元),根据下表求出y关于x的线性回归方程为,则表中a的值为()A. 50B. 54C. 56.5D. 64【答案】B【解析】根据规律知道回归直线一定过样本中心,故得到,将坐标代入方程得到a的值为54.故答案为:B.9.【四川省乐山市2019届高三第一次调研】胡萝卜中含有大量的胡萝卜素,摄入人体消化器官后,可以转化为维生素,现从,两个品种的胡萝卜所含的胡萝卜素(单位:)得到茎叶图如图所示,则下列说法不正确的是( )A. B.的方差大于的方差C.品种的众数为 D.品种的中位数为【答案】C【解析】由茎叶图知,品种所含胡萝卜素普遍高于品种,所以,故A正确;品种的数据波动比品种的数据波动大,所以的方差大于的方差,故B正确;品种的众数为与,故C错误;品种的数据的中位数为,故D正确.故选.10.【2018届辽宁省丹东市高三上学期期末】某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算2 6.705K =,则所得到的统计学结论是:有( )的把握认为“学生性别与支持该活动没有..关系”.A. 99.9%B. 99%C. 1%D. 0.1% 【答案】C【解析】6.635<6.705<10.828,因此有1%的把握,故选C.11.【2018届吉林省长春市第十一高中、东北师范大学附属中学、吉林一中,重庆一中等五校高三1月联合模拟】下列命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率, 2R 越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④对分类变量X与Y ,它们的随机变量2K 的观测值k 来说, k 越小,“X 与Y 有关系”的把握程度越大.其中正确命题的个数是( )A. 1个B. 2个C. 3个D. 4个 【答案】C【解析】对于①,在回归分析模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率, 2R 越接近于1,表示回归效果越好,正确,因为相关指数2R 越大,则残差平方和越小,模型的拟合效果越好,①正确.对于②两个变量相关性越强,则相关系数的绝对值就越接近于1; 对于③在回归直线方程中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;正确;对于④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说, k 越小,“X 与Y 有关系”的把握程度越大.错误,因为在对分类变量X 与Y 进行独立性检验时,随机变量2K 的观测值k 越大,则“X 与Y 相关”可信程度越大,故④错误; 故选C.12.【2018届山东省威海市高三期末】某单位为了落实“绿水青山就是金山银山”理念,制定节能减排的目标,先调查了用电量(单位:度)与气温(单位:)之间的关系,随机选取了天的用电量与当天气温,并制作了对照表:(单位:)(单位:度)由表中数据得线性回归方程:.则的值为A. B. C. D.【答案】C【解析】样本平均数为,即样本中心,则线性回归方程过,则,解得,即的值为,故选C.二、填空题(4*5=20分)13.【2016高考江苏卷】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_______ ________. 【答案】0.1【解析】这组数据的平均数为,.故答案应填:0.1,14.【2018届山东省淄博市高三3月模拟】某校高三年级3个学部共有600名学生,编号为:001,002,…,600,从001到300在第一学部,从301到495在第二学部,496到600在第三【答案】①②③【解析】对于①,2至月份的收入的变化率为20,11至12月份的变化率为20,故相同,正确.对于②,支出最高值是2月份60万元,支出最低值是5月份的10万元,故支出最高值与支出最低值的比是6:1,正确.对于③,第三季度的7,8,9月每个月的收入分别为40万元,50万元,60万元,故第三季度的平均收入为50万元,正确.对于④,利润最高的月份是3月份和10月份都是30万元,高于2月份的利润是80﹣60=20万元,错误.故答案为:①②③.16.【广东省肇庆市实验中学2019届高三第四次月考】某校组织高一全体学生参加计算机操作比赛,等级分为1至10分,随机调阅了60名学生的成绩,得到样本数据条形图如下图所示,则样本数据的均值和方差分别为_____和_____【答案】6 1.5。

2019高考数学(理)精准提分二轮(课件+讲义+优选习题)通用版:第18 练 统计与统计案例[小题提速练]

2019高考数学(理)精准提分二轮(课件+讲义+优选习题)通用版:第18 练 统计与统计案例[小题提速练]

第18 练 统计与统计案例[小题提速练][明晰考情] 1.命题角度:统计中的抽样方法、统计图表、样本估计总体,回归分析与独立性检验是考查的热点.2.题目难度:中低档难度.考点一 随机抽样要点重组 简单随机抽样的特点是逐个抽取,适用于总体个数较少的情况;系统抽样也称等距抽样,适用总体个数较多的情况;分层抽样一定要注意按比例抽取,总体由差异明显的几部分组成.1.某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法抽取4个班进行调查,若抽到的编号之和为48,则抽到的最小编号为( )A.2B.3C.4D.5 答案 B解析 由题意得系统抽样的抽样间隔为244=6.设抽到的最小编号为x ,则x +(6+x )+(12+x )+(18+x )=48,所以x =3,故选B.2.某林场有树苗30 000棵,其中松树苗4 000棵,为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A.20 B.15 C.25 D.30 答案 A解析 根据分层抽样的定义可得样本中松树苗的数量为4 00030 000×150=20.3.(2018·全国Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________. 答案 分层抽样解析 因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.4.某单位有职工72人,现需用系统抽样法从中抽取一个样本,若样本容量为n ,则不需要剔除个体,若样本容量为n +1,则需剔除2个个体,则n =________.答案 4或6或9解析 由题意知n 为72的约数,n +1为70的约数,其中72的约数有1,2,3,4,6,8,9,12,18,24,36,72,其中加1能被70整除的有1,4,6,9,其中n =1不符合题意,故n =4或6或9.考点二 统计图表和样本数字特征方法技巧 (1)由频率分布直方图进行相关计算时,需掌握关系式:频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.(2)总体估计的方法:用样本的数字特征估计总体的数字特征.(3)图表判断法:若根据统计图表比较样本数据的大小,可根据数据的分布情况直观分析,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.5. (2018·太原期末)某中学初中部共有110名教师,高中部共有150名教师,根据下列频率分布条形图(部分)可知,该校女教师的人数为( )A.93B.123C.137D.167 答案 C解析 110×0.7+150×(1-0.6)=77+60=137.6.(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 答案 A解析 对于选项A ,由图易知月接待游客量每年7,8月份明显高于12月份,故A 错; 对于选项B ,观察折线图的变化趋势可知年接待游客量逐年增加,故B 正确; 对于选项C ,D ,由图可知显然正确.故选A.7.设样本数据x 1,x 2,…,x 10的平均数和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的平均数和方差分别为( ) A.1+a ,4 B.1+a ,4+a C.1,4 D.1,4+a 答案 A解析 ∵x 1,x 2,…,x 10的平均数x =1,方差s 21=4, 且y i =x i +a (i =1,2,…,10), ∴y 1,y 2,…,y 10的平均数y =110·(y 1+y 2+…+y 10)=110·(x 1+x 2+…+x 10+10a )=110·(x 1+x 2+…+x 10)+a =x +a =1+a , 其方差s 22=110·[(y 1-y )2+(y 2-y )2+…+(y 10-y )2] =110[(x 1-1)2+(x 2-1)2+…+(x 10-1)2]=s 21=4.故选A. 8.如图是检测600个某产品的质量(单位:g)得到的频率分布直方图,前三组的长方形的高度成等差数列,后三组所对应的长方形的高度成公比为0.5的等比数列,已知检测的质量在[100.5,105.5)内的产品数为150,则质量在[115.5,120.5)内的长方形高度为( )A.112B.130C.16D.160 答案 D解析 由题意知质量在[100.5,105.5)内的产品的频率为150600=14,设质量在[105.5,110.5)内的产品的频率为h ,则质量在[105.5,110.5)内的产品的频率为2×14-h =12-h ,质量在[110.5,115.5)内与质量在[115.5,120.5]内的产品的频率分别为12h ,14h ,故由频率的性质可知,12-h +14+h +12h +14h =1,解得h =13,所以质量在[115.5,120.5]内的长方形高度为13×14×15=160. 考点三 统计案例方法技巧 (1)线性回归方程问题的两个要点:样本点的中心在回归直线上;由线性回归方程求出的数值是估计值.(2)独立性检验的关键在于准确求出K 2值,然后对比临界值表中的数据,然后下结论. 9.设某中学的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到线性回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心(x ,y )C.若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kgD.若该中学某高中女生身高为160 cm ,则可断定其体重必为50.29 kg 答案 D解析 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,A 正确; 由线性回归方程必过样本点中心(x ,y )知,B 正确;由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,C 正确; 当某女生的身高为160 cm 时,其体重估计值是50.29 kg ,而不是具体值,因此D 错误.故选D. 10.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁.为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过________(填百分比)的前提下,认为“小鼠是否被感染与服用疫苗有关”. 答案 5%解析 因为K 2的观测值k =100×(10×30-20×40)230×70×50×50≈4.762>3.841,所以在犯错误的概率不超过5%的前提下,认为“小鼠是否被感染与服用疫苗有关”.11.(2018·成都外国语学校质检)从某大学随机抽取的5名女大学生的身高x (厘米)和体重y (公斤)数据如下表:根据上表可得线性回归方程为y ^=0.92x -96.8,则表格中空白处的值为________. 答案 60解析 由x =165,根据回归直线经过样本点中心(x ,y ), 可得y =0.92×165-96.8=55, 所以y =58+52+62+43+y5,解得y =60.12.(2018·黑龙江哈尔滨三中模拟)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,哈三中积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:根据上表可得线性回归方程y ^=b ^x +a ^中的b ^为1.35,我校2018届同学在学科竞赛中获省级一等奖及以上学生人数为63,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为________. 答案 117解析 x =53,y =103.5,故a ^=y -b ^x =103.5-1.35×53=31.95,即y ^=1.35x +31.95,将x =63代入上式,求得y ^=117.1.(2018·新余模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数答案 C解析由比例图,可得是否倾向选择生育二胎与户籍有关、与性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为0.6×60=36,女性人数为0.4×60=24,不相同. 故选C.2.中国诗词大会节目是央视首档全民参与的诗词节目,节目以“赏中华诗词、寻文化基因、品生活之美”为基本宗旨,力求通过对诗词知识的比拼及赏析,带动全民重温那些曾经学过的古诗词,分享诗词之美,感受诗词之趣,从古人的智慧和情怀中汲取营养,涵养心灵.如图是2017年中国诗词大会中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有( )A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84,a 2=80+4+4+6+4+75=85,故选B.解题秘籍 (1)在频率分布直方图中:①最高的小长方形底边中点的横坐标即是众数; ②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.(2)茎叶图的特点是保留了完整的原始数据,根据茎叶图就可以得到数据的所有数字特征.求解茎叶图问题需注意:重复出现的数字应该按原次数写入叶子部位,不能只写入一次.1.(2018·烟台模拟)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取( ) A.24件 B.18件 C.12件 D.6件 答案 B解析 由题意,得丙中型号的产品在总体中占的比例为300200+400+300+100=310,根据分层抽样可得从丙种型号的产品中抽取60×310=18(件).2.某市8所中学学生参加比赛的得分茎叶图如图所示,其中茎为十位数,叶为个位数,则这组数据的平均数和方差分别是( )A.91,5.5B.91,5C.92,5.5D.92,5 答案 A解析 把茎叶图中的数据按由小到大的顺序排列,如下: 87,88,90,91,92,93,93,94.平均数是18×(87+88+90+91+92+93+93+94)=91,s 2=18×[(87-91)2+(88-91)2+(90-91)2+…+(94-91)2]=5.5.3.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由题意知,平均最高气温高于20 ℃的只有七月,八月,故选D.4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.135B.145C.140D.147答案 C解析设所求人数为n,由频率分布直方图,得自习时间不少于22.5小时的频率为(0.04+0.08+0.16)×2.5=0.7,∴n=0.7×200=140.5.如图是八位同学400米测试成绩的茎叶图(单位:秒),则( )A.平均数为64B.众数为7C.极差为17D.中位数为64.5答案 D解析 由茎叶图可知,该组数据为58,59,61,62,67,67,70,76,平均数为58+59+61+62+67+67+70+768=65,众数为67,极差为76-58=18,中位数为62+672=64.5,故选D.6.实验测得四组数对(x ,y )的值为(1,2),(2,5),(4,7),(5,10),则y 与x 之间的线性回归方程可能是( )A.y ^=x +3 B.y ^=x +4 C.y ^=2x +3 D.y ^=2x +4 答案 A解析 由题意可知,x =3,y =6,线性回归方程经过点(3,6). 代入选项,A 符合.7.(2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( ) A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 答案 A解析 设新农村建设前,农村的经济收入为a ,则新农村建设后,农村的经济收入为2a .新农村建设前后,各项收入的对比如下表:故选A.8.(2017·山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其线性回归方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170 答案 C解析 ∵∑10i =1x i =225,∴x =110∑10i =1x i =22.5. ∵∑10i =1y i =1 600,∴y =110∑10i =1y i =160. 又b ^=4,∴a ^=y -b ^x =160-4×22.5=70.∴线性回归方程为y ^=4x +70.将x =24代入上式,得y ^=4×24+70=166.故选C.9.(2018·江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.答案 90解析 这5位裁判打出的分数分别是89,89,90,91,91, 因此这5位裁判打出的分数的平均数为89+89+90+91+915=90.10.(2018·衡阳模拟) 已知样本x 1,x 2,…,x n 的平均数为x ;样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ;其中0<a <12,则n ,m ()n ,m ∈N *的大小关系为________.答案 n <m 解析 由题意得z =1n +m (nx +my )=n n +m x +⎝ ⎛⎭⎪⎫1-n n +m y ,∴a =n n +m, ∵0<a <12,∴0<n n +m <12,∴n <m .11.在一次百米测试中,某年级120名学生成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]内的学生人数是________.答案 54解析 成绩在[16,18]内的学生人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]内的学生人数为120×920=54.12.各大城市出现了修建地铁的高潮,地铁时代的到来能否缓解城市的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:则所得到的统计学结论是:有____的把握认为“对能否缓解交通拥堵的认识与性别有关”.附:K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d ).答案 95%解析 由2×2列联表,得K 2=110×(48×20-12×30)278×32×60×50≈5.288>3.841,由附表P (K 2≥3.841)=0.05,∴有95%的把握认为“对能否缓解交通拥堵的认识与性别有关”.。

2019版高考数学二轮复习课件+训练:第一部分专题十五统计、统计案例讲义理

2019版高考数学二轮复习课件+训练:第一部分专题十五统计、统计案例讲义理

5131 8186 3709 4521 6665 5325 5383 2702
9055 7196 2172 3207 1114 1384 4359 4488
A.76,63,17,00
B.16,00,02,30
C.17,00,02,25
D.17,00,02,07
解析:选 D 在随机数表中,将处于 00~29 的号码选出,满足要求的前 4 个号码为
角度二 非线性回归分析 [例2] 某机构为研究某种图书每册的成本费 y(单位:元)与印刷数量 x(单位:千册)的 关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.
落入区间[1,400]的人做问卷 A,编号落入区间[401,750]的人做问卷 B,其余的人做问卷 C,
则抽到的人中,做问卷 C 的人数为________.
解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为 8,公差 d=
1 000 50 =20 的等差数列{an},∴通项公式 an=8+20(n-1)=20n-12,令 751≤20n-12≤1
A.15
B.18
C.20
D.25
解析:选 A 根据频率分布直方图,得第二小组的频率是 0.04×10=0.4,∵频数是 40,∴
40 样本容量是 =100,又成绩在 80~100 分的频率是(0.01+0.005)×10=0.15,∴成绩在
0.4 80~100 分的学生人数是 100×0.15=15.
重点 2.统计与统计案例在解答题中多出现在 18 或 19 题,多考查直方图、茎叶图及
数字特征计算、统计案例的应用.
抽样方法
[题组全练]
1.(2018·石家庄模拟)某校高一年级有男生 560 人,女生 420 人,用分层抽样的方法

2019版二轮复习数学(理)全国版专题四 第二讲 小题考法——概率、统计、统计案例

2019版二轮复习数学(理)全国版专题四  第二讲  小题考法——概率、统计、统计案例

第二讲 小题考法——概率、统计、统计案例[典例感悟][典例] (1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x1,x 2,…,x n 的中位数(2)(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 (3)(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )A.5B.7C.10 D.50[解析](1)标准差能反映一组数据的稳定程度.故选B.(2)根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A错误.由图可知,B、C、D正确.(3)根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50,故选D.[答案](1)B(2)A(3)D[方法技巧]1.样本方差、标准差的计算与含义(1)计算:计算方差或标准差首先要计算平均数,然后再按照方差或标准差的计算公式进行计算.(2)含义:方差和标准差是描述一个样本和总体的波动大小的特征数,方差和标准差大说明波动大.2.频率分布直方图中常见问题及解题策略(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可以求出其他数据.(2)已知频率分布直方图,求某个范围内的数据.可利用图形及某范围结合求解.[演练冲关]1.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A设新农村建设前,农村的经济收入为a,则新农村建设后,农村经济收入为2a .新农村建设前后,各项收入的对比如下表:2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示:则这20A .180,170 B .160,180 C .160,170D .180,160解析:选A 用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.3.(2018·武汉调研)从某选手的7个得分中去掉1个最高分,去掉一个最低分后,剩余5个得分的平均数为91分,如图所示是该选手得分的茎叶图,其中有一个数字模糊,无法辨认,在图中用x 表示,则剩余5个得分的方差为________.解析:去掉一个最高分99分,一个最低分87分,剩余的得分为93分,90分,(90+x )分,91分,87分,则93+90+90+x +91+875=91,解得x =4,所以这5个数的方差s 2=15[(91-93)2+(91-90)2+(91-94)2+(91-91)2+(91-87)2]=6.答案:6[典例] (1)(2018·豫东、豫北十所名校联考)根据如下样本数据:得到的回归方程为y =bx +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位(2)通过随机询问110名学生是否爱好打篮球,得到如下的列联表:附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .A .在犯错误的概率不超过0.1%的前提下,认为“爱好打篮球与性别无关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好打篮球与性别有关”C .有99%以上的把握认为“爱好打篮球与性别无关”D .有99%以上的把握认为“爱好打篮球与性别有关” [解析] (1)依题意得,a +b -25=0.9,故a +b =6.5;①又样本点的中心为(5,0.9),故0.9=5b +a ,② 联立①②,解得b =-1.4,a =7.9, 则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位.(2)因为K 2=110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过1%的前提下,即有99%以上的把握认为“爱好打篮球与性别有关”. [答案] (1)B (2)D[方法技巧]求回归直线方程的关键及实际应用(1)求回归直线方程的关键是正确理解b ^,a ^的计算公式和准确地求解.(2)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.[演练冲关]1.(2018·湖北七市(州)联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如下表(单位:万元):由上表可得回归方程为y =10.2x +a ,据此模型,预测广告费为10万元时的销售额约为( )A .101.2万元B .108.8万元C .111.2万元D .118.2万元解析:选C 根据统计数据表,可得x -=15×(2+3+4+5+6)=4,y -=15×(29+41+50+59+71)=50,而回归直线y ^=10.2x +a ^经过样本点的中心(4,50),∴50=10.2×4+a ^,解得a ^=9.2,∴回归方程为y ^=10.2x +9.2.当x =10时,y =10.2×10+9.2=111.2,故选C.2.(2019届高三·湘中名校联考)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 和Y 有关系”的可信度.如果k >3.841,那么有把握认为“X 和Y 有关系”的百分比为( )C .99.5%D .95%解析:选D 由表中数据可得,当k >3.841时,有0.05的机率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的机率,也就是有95%的把握认为变量之间有关系,故选D.[典例] (1)(2017·全国卷Ⅰ)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A.14 B.π8 C.12D.π4(2)(2017·全国卷Ⅱ)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为( )A.110B.15C.310D.25(3)(2018·全国卷Ⅰ)如图,来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p 1,p 2,p 3,则( )A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 3[解析] (1)不妨设正方形的边长为2,则正方形的面积为4,正方形的内切圆的半径为1,面积为π.由题意,得S 黑=12S 圆=π2,故此点取自黑色部分的概率P =π24=π8.(2)记两次取得卡片上的数字依次为a ,b ,则一共有25个不同的数组(a ,b ),其中满足a >b 的数组共有10个,分别为(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),(5,2),(5,3),(5,4), 因此所求的概率P =1025=25.(3)法一:∵S △ABC =12AB ·AC ,以AB 为直径的半圆的面积为12π·⎝⎛⎭⎫AB 22=π8AB 2,以AC 为直径的半圆的面积为12π·⎝⎛⎭⎫AC 22=π8AC 2,以BC 为直径的半圆的面积为12π·⎝⎛⎭⎫BC 22=π8BC 2,∴S Ⅰ=12AB ·AC ,S Ⅲ=π8BC 2-12AB ·AC ,S Ⅱ=⎝⎛⎭⎫π8AB 2+π8AC 2-⎝⎛⎭⎫π8BC 2-12AB ·AC =12AB ·AC . ∴S Ⅰ=S Ⅱ.由几何概型概率公式得p 1=S ⅠS 总,p 2=S ⅡS 总,∴p 1=p 2.故选A.法二:不妨设△ABC 为等腰直角三角形, AB =AC =2,则BC =22, 所以区域Ⅰ的面积即△ABC 的面积, 为S 1=12×2×2=2,区域Ⅱ的面积S 2=π×12-⎣⎢⎡⎦⎥⎤π×(2)22-2=2, 区域Ⅲ的面积S 3=π×(2)22-2=π-2.根据几何概型的概率计算公式, 得p 1=p 2=2π+2,p 3=π-2π+2,所以p 1≠p 3,p 2≠p 3,p 1≠p 2+p 3,故选A. [答案] (1)B (2)D (3)A[方法技巧]1.古典概型概率的求解关键及注意点(1)正确求出基本事件总数和所求事件包含的基本事件总数. (2)对于较复杂的题目条件计数时要正确分类,分类时应不重不漏. 2.几何概型的适用条件及求解关键(1)当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解.(2)求解关键是寻找构成试验的全部结果的区域和事件发生的区域,有时需要设出变量,在坐标系中表示所需要的区域.[演练冲关]1.(2019届高三·湘中名校联考)从集合A ={-2,-1,2}中随机选取一个数记为a ,从集合B ={-1,1,3}中随机选取一个数记为b ,则直线ax -y +b =0不经过第四象限的概率为( )A.29B.13C.49D.14解析:选A 从集合A ,B 中随机选取一个数后组合成的数对有(-2,-1),(-2,1),(-2,3),(-1,-1),(-1,1),(-1,3),(2,-1),(2,1),(2,3),共9对,要使直线ax -y +b =0不经过第四象限,则需a ≥0,b ≥0,共有2对满足,所以所求概率P =29,故选A.2.(2018·贵阳模拟)某公交车站每隔10分钟有一辆公交车到站,乘客到达该车站的时刻是任意的,则一个乘客候车时间大于等于7分钟的概率为( )A.15B.710C.12D.310解析:选D 由几何概型的概率计算公式可知所求概率P =10-710=310,故选D.3.(2018·福州四校联考)如图,在圆心角为90°的扇形AOB 中,以圆心O 为起点在AB 上任取一点C 作射线OC ,则使得∠AOC 和∠BOC 都不小于30°的概率是( )A.13 B.23 C.12D.16解析:选A 记事件T 是“作射线OC ,使得∠AOC 和∠BOC 都不小于30°”,如图,记AB 的三等分点为M ,N ,连接OM ,ON ,则∠AON =∠BOM =∠MON =30°,则符合条件的射线OC 应落在扇形MON 中,所以P (T )=∠MON ∠AOB =30°90°=13,故选A.[典例] (1)(2018·武昌调研)小赵、小钱、小孙、小李到4个景点旅游,每人只去一个景点,设事件A =“4个人去的景点不相同”,事件B =“小赵独自去一个景点”,则P (A |B )=( )A.29 B.13 C.49D.59(2)为向国际化大都市目标迈进,某市今年新建三大类重点工程,它们分别是30项基础设施类工程、20项民生类工程和10项产业建设类工程.现有3名民工相互独立地从这60个项目中任选一个项目参与建设,则这3名民工选择的项目所属类别互异的概率是( )A.12B.13C.14D.16(3)某批花生种子,如果每1粒发芽的概率均为45,那么播下4粒种子恰好有2粒发芽的概率是( )A.256625B.192625C.96625D.16625[解析] (1)小赵独自去一个景点共有4×3×3×3=108种情况,4个人去的景点不同有A 44=4×3×2×1=24种情况,∴P (A |B )=24108=29. (2)记第i 名民工选择的项目属于基础设施类、民生类、产业建设类分别为事件A i 、B i 、C i ,i =1、2、3.由题意知,事件A i 、B i 、C i (i =1、2、3)相互独立, 则P (A i )=3060=12,P (B i )=2060=13,P (C i )=1060=16,故这3名民工选择的项目所属类别互异的概率是P =A 33P (A i B i C i)=6×12×13×16=16.选D.(3)P =C 24×⎝⎛⎭⎫452×⎝⎛⎭⎫152=96625. [答案] (1)A (2)D (3)C[方法技巧]1.条件概率的求法(1)利用定义,先分别求出P (A )和P (AB ),再利用P (B |A )=P (AB )P (A )求得.这是通用的求条件概率的方法.(2)借助古典概型概率公式,先求事件A 包含的基本事件数n (A ),再在事件A 发生的条件下求事件B 包含的基本事件数,即n (AB ),得P (B |A )=n (AB )n (A ).2.复杂事件概率的求法(1)直接法:正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的积事件或一独立重复试验问题,然后用相应概率公式求解.(2)间接法:当复杂事件正面情况比较多,反面情况较少时,则可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.[演练冲关]1.(2018·广西三市联考)某机械研究所对新研发的某批次机械元件进行寿命追踪调查,随机抽查的200个机械元件情况如下:命在30天以上的概率为( )A.1316B.2764C.2532D.2732解析:选D 由表可知元件使用寿命在30天以上的频率为80+50+20200=34,则所求概率为C 23·⎝⎛⎭⎫342×14+⎝⎛⎭⎫343=2732. 2.1号箱中有2个白球和4个红球,2号箱中有5个白球和3个红球,现随机地从1号箱中取出一球放入2号箱,然后从2号箱随机取出一球,则从2号箱取出红球的概率为( )A.1127B.1124C.1627D.924解析:选A 记事件A :从2号箱中取出的是红球;事件B :从1号箱中取出的是红球.则根据古典概型和对立事件的概率和为1,可知:P (B )=42+4=23,P (B )=1-23=13;由条件概率公式知P (A |B )=3+18+1=49,P (A |B )=38+1=39.从而P (A )=P (AB )+P (A B )=P (A |B )·P (B )+P (A |B )·P (B )=1127,故选A. 3.(2018·全国卷Ⅲ)某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立.设X 为该群体的10位成员中使用移动支付的人数,DX =2.4,P (X =4)<P (X =6),则p =( )A .0.7B .0.6C .0.4D .0.3解析:选B 由题意可知,10位成员中使用移动支付的人数X 服从二项分布,即X ~B (10,p ),所以DX =10p (1-p )=2.4,所以p =0.4或0.6.又因为P (X =4)<P (X =6),所以C 410p 4(1-p )6<C 610p 6(1-p )4,所以p >0.5,所以p =0.6.[必备知能·自主补缺] 依据学情课下看,针对自身补缺漏;临近高考再浏览,考前温故熟主干[主干知识要记牢]1.概率的计算公式 (1)古典概型:P (A )=事件A 包含的基本事件数m基本事件总数n ;(2)互斥事件:P (A ∪B )=P (A )+P (B ); (3)对立事件: P (A )=1-P (A ); (4)几何概型: P (A )=构成事件A 的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积);(5)独立事件: P (AB )=P (A )P (B ); (6)独立重复试验:P n (k )=C k n p k (1-p )n -k; (7)条件概率: P (B |A )=P (AB )P (A ). 2.分层抽样中公式的运用(1)抽样比=样本容量个体总量=各层样本容量各层个体数量;(2)层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量.3.用样本数字特征估计总体 (1)众数、中位数、平均数(2)方差和标准差方差和标准差反映了数据波动程度的大小. ①方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2];②标准差: s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2] . [二级结论要用好]1.频率分布直方图的3个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形高的和为1组距.2.与平均数和方差有关的4个结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ;(2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2; (4)s 2=1n ∑i =1n (x i -x -)2=1n ∑i =1n x 2i -x -2,即各数平方的平均数减去平均数的平方.求s 2时,可根据题目的具体情况,结合题目给出的参考数据,灵活选用公式.3.线性回归方程线性回归方程y ^=b ^x +a ^一定过样本点的中心(x -,y -).[针对练1] (2018·惠州调研)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):由最小二乘法求得回归方程y =0.67x +a ,则a 的值为________.解析:因为x -=10+20+30+40+505=30,y -=62+68+75+81+895=75,所以回归直线一定过样本点的中心(30,75),将其代入y ^=0.67x +a ^,可得75=0.67×30+a ^,解得a ^=54.9.答案:54.9[易错易混要明了]1.应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.2.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.3.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.4.在求解几何概型的概率时,要注意分清几何概型的类别(体积型、面积型、长度型、角度型等).[针对练2] 一种小型电子游戏的主界面是半径为r 的圆,点击圆周上的点A 后,该点在圆周上随机转动,最后落在点B 处,当线段AB 的长不小于3r 时自动播放音乐,则一次转动能播放音乐的概率为________.解析:如图,当|AB |≥3r ,即点B 落在劣弧CC ′上时才能播放音乐.又劣弧CC ′所对应的圆心角为2π3,所以一次转动能播放音乐的概率为2π32π=13. 答案:13[课时跟踪检测] A 级——12+4提速练一、选择题1.(2018·长春模拟)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )A .95,94B .92,86C .99,86D .92,91解析:选B由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B.2.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大依次构成等比数列{a n }(n =1,2,3,4).已知a 2=2a 1,且样本容量为300,则小长方形面积最小的一组的频数为( )A .20B .40C .30D .无法确定解析:选A 由已知,得4个小长方形的面积分别为a 1,2a 1,4a 1,8a 1,所以a 1+2a 1+4a 1+8a 1=1,得a 1=115,因此小长方形面积最小的一组的频数为115×300=20.3.(2018·许昌二模)某校共有在职教师140人,其中高级教师28人,中级教师56人,初级教师56人,现采用分层抽样的方法从在职教师中抽取5人进行职称改革调研,然后从抽取的5人中随机抽取2人进行深入了解,则抽取的这2人中至少有1人是初级教师的概率为( )A.710 B.310 C.320D.720解析:选A 由题意得,应从高级、中级、初级教师中抽取的人数分别为5×28140=1,5×56140=2,5×56140=2,则从5人中随机抽取2人,这2人中至少有1人是初级教师的概率为C 12C 13+C 22C 25=710. 4.(2018·昆明模拟)如图是1951~2016年我国的年平均气温变化的折线图,根据图中信息,下列结论正确的是( )A .1951年以来,我国的年平均气温逐年增高B .1951年以来,我国的年平均气温在2016年再创新高C .2000年以来,我国每年的年平均气温都高于1981~2010年的平均值D .2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值解析:选D 由图可知,1951年以来,我国的年平均气温变化是有起伏的,不是逐年增高的,所以选项A 错误;1951年以来,我国的年平均气温最高的不是2016年,所以选项B 错误;由图可知,1981~2010年的气温平均值为9.5,2012年的年平均气温低于1981~2010年的平均值,所以选项C 错误;2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值,所以选项D 正确.5.(2018·全国卷Ⅱ)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是( )A.112B.114C.115D.118解析:选C 不超过30的所有素数为2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有C 210=45种情况,而和为30的有7+23,11+19,13+17这3种情况,∴所求概率为345=115.故选C.6.(2018·合肥一模)某广播电台只在每小时的整点和半点开始播放新闻,时长均为5分钟,则一个人在不知道时间的情况下打开收音机收听该电台,能听到新闻的概率是( )A.114B.112C.17D.16解析:选D 由题意知,该广播电台在一天内播放新闻的时长为24×2×5=240分钟,即4个小时,所以所求的概率为424=16,故选D.7.(2018·石家庄模拟)某种电路开关闭合后会出现红灯或绿灯闪烁,已知开关第一次闭合后出现红灯的概率为12,两次闭合后都出现红灯的概率为15,则开关在第一次闭合后出现红灯的条件下第二次闭合后出现红灯的概率为( )A.110 B.15 C.25D.12解析:选C 设“开关第一次闭合后出现红灯”为事件A ,“开关第二次闭合后出现红灯”为事件B ,则“开关两次闭合后都出现红灯”为事件AB ,“开关在第一次闭合后出现红灯的条件下第二次闭合后出现红灯”为事件B |A ,由题意得P (B |A )=P (AB )P (A )=25,故选C. 8.(2019届高三·辽宁五校联考)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有显著效果的图形是( )解析:选D 分析四个等高条形图得选项D 中,不服用药物与服用药物患病的差异最大,所以最能体现该药物对预防禽流感有显著效果,故选D.9.(2018·郑州、湘潭联考)已知a ∈{-2,0,1,2,3},b ∈{3,5},则函数f (x )=(a 2-2)e x +b 为减函数的概率是( )A.310B.35C.25D.15解析:选C 由题意知a ,b 的组合共有10种,函数f (x )=(a 2-2)e x +b 为减函数,则a 2-2<0,又a ∈{-2,0,1,2,3},故只有a =0,a =1满足题意,又b ∈{3,5},所以当a =0时,b 可取3,5;当a =1时,b 可取3,5,满足题意的组合有4种,所以函数f (x )=(a 2-2)e x +b为减函数的概率是410=25.故选C.10.为比较甲、乙两地某月11时的气温情况,随机选取该月中的5天,将这5天中11时的气温数据(单位:℃)制成如图所示的茎叶图,给出以下结论:①甲地该月11时的平均气温低于乙地该月11时的平均气温; ②甲地该月11时的平均气温高于乙地该月11时的平均气温; ③甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差; ④甲地该月11时的气温的标准差大于乙地该月11时的气温的标准差. 其中根据茎叶图能得到的正确结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选C 由茎叶图和平均数公式可得甲、乙两地的平均数分别是30,29,则甲地该月11时的平均气温高于乙地该月11时的平均气温,①错误,②正确,排除A 和B ;又甲、乙两地该月11时的标准差分别是s 甲=4+1+1+45=2,s 乙= 9+1+4+45=185,则甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差,③正确,④错误,故选项C 正确.11.由不等式组⎩⎪⎨⎪⎧x ≤0,y ≥0,y -x -2≤0确定的平面区域记为Ω1,不等式组⎩⎪⎨⎪⎧x +y ≤1,x +y ≥-2确定的平面区域记为Ω2.在Ω1中随机取一点,则该点恰好在Ω2内的概率为( )A.18B.14C.34D.78解析:选D 由题意作图,如图所示,Ω1的面积为12×2×2=2,图中阴影部分的面积为2-12×12×1=74,则所求的概率P =742=78.12.(2018·内蒙古包头铁路一中调研)甲、乙、丙三人参加一次考试,他们合格的概率分别为23,34,25,那么三人中恰有两人合格的概率是( )A.25B.1130C.715D.16解析:选C 三人中恰有两人合格的概率P =23×34×⎝⎛⎭⎫1-25+23×⎝⎛⎭⎫1-34×25+⎝⎛⎭⎫1-23×34×25=715,故选C. 二、填空题13.(2018·南昌模拟)某校高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为________.解析:由题知分组间隔为648=8,又第1组中抽取的号码为5,所以第6组中抽取的号码为5×8+5=45.答案:4514.(2018·天津和平区调研)从混有5张假钞的20张百元钞票中任意抽取两张,将其中一张放到验钞机上检验发现是假钞,则两张都是假钞的概率是________.解析:设事件A 为“抽到的两张都是假钞”,事件B 为“抽到的两张至少有一张假钞”, 则所求的概率为P (A |B ), 因为P (AB )=P (A )=C 25C 220=119,P (B )=C 25+C 15C 115C 220=1738,所以P (A |B )=P (AB )P (B )=1191738=217.答案:21715.某篮球比赛采用7局4胜制,即若有一队先胜4局,则此队获胜,比赛就此结束.由于参加比赛的两队实力相当,每局比赛两队获胜的可能性均为12.据以往资料统计,第一局比赛组织者可获得门票收入40万元,以后每局比赛门票收入比上一局增加10万元,则组织者在此次比赛中获得的门票收入不少于390万元的概率为________.解析:依题意,每局比赛获得的门票收入组成首项为40,公差为10的等差数列,设此数列为{a n },则易知首项a 1=40,公差d =10,故S n =40n +n (n -1)2×10=5n 2+35n .由S n ≥390,得n 2+7n ≥78,所以n ≥6.所以要使获得的门票收入不少于390万元,则至少要比赛6局.①若比赛共进行6局,则P 6=C 35×⎝⎛⎭⎫125=516;②若比赛共进行了7局,则P 7=C 36×⎝⎛⎭⎫126=516.所以门票收入不少于390万元的概率P =P 6+P 7=1016=58.答案:5816.(2018·石家庄摸底)为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文理科与性别有关系出错的可能性约为________.解析:由K 2=4.844>3.841.故认为选修文理科与性别有关系出错的可能性约为5%. 答案:5%B 级——难度小题强化练1.(2018·成都模拟) 小明在花店定了一束鲜花,花店承诺将在第二天早上7:30~8:30之间将鲜花送到小明家.若小明第二天离开家去公司上班的时间在早上8:00~9:00之间,则小明在离开家之前收到这束鲜花的概率是( )A.18B.14C.34D.78解析:选D 如图,设送花人到达小明家的时间为x ,小明离家去上班的时间为y ,记小明离家前能收到鲜花为事件A .(x ,y )可以看成平面中的点,试验的全部结果所构成的区域为Ω={(x ,y )|7.5≤x ≤8.5,8≤y ≤9},这是一个正方形区域,面积为S Ω=1×1=1,事件A 所构成的区域为A ={(x ,y )|y ≥x,7.5≤x ≤8.5,8≤y ≤9},即图中的阴影部分,面积为S A =1-12×12×12=78.这是一个几何概型,所以P (A )=S A S Ω=78,故选D.2.(2018·福州四校联考)某汽车的使用年数x 与所支出的维修总费用y 的统计数据如下表:根据上表可得y 关于x 的线性回归方程y =b x -0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)( )A .8年B .9年C .10年D .11年解析:选D 由y 关于x 的线性回归直线y ^=b ^x -0.69过样本点的中心(3,2.34),得b ^=1.01,即线性回归方程为y ^=1.01x -0.69,由y ^=1.01x -0.69=10得x ≈10.6,所以预测该汽车最多可使用11年,故选D.3.(2018·长春模拟)如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩y 关于测试序号x 的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好; ②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升. 其中正确结论的个数为( )A .0B .1C .2D .3解析:选D ①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.②由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选D.4.(2018·郑州模拟)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为( ) A.49B .2 C.94 D .9解析:选C 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4.由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a +4b =⎝⎛⎭⎫1a +4b ×⎝⎛⎭⎫a 4+b 4=14⎝⎛⎭⎫1+b a +4a b +4≥14×(5+4)=94(当且仅当b =2a 时取等号).故1a +4b 的最小值为94,选C. 5.正六边形ABCDEF 的边长为1,在正六边形内随机取点M ,则使△MAB 的面积大于34的概率为________.解析:如图所示,作出正六边形ABCDEF ,其中心为O ,过点O作OG ⊥AB ,垂足为G ,则OG 的长为中心O 到AB 边的距离.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

小题专项练习(十五) 统计与统计案例
一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.[2018·江西重点中学协作体第二次联考]九江联盛某超市为了检查货架上的奶粉是否合格,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用系统抽样方法确定所选取的5袋奶粉的编号可能是( )
A .6,12,18,24,30
B .2,4,8,16,32
C .2,12,23,35,48
D .7,17,27,37,47
2.[2018·重庆江津第二次阶段考试]
设X ~N(1,1)其正态分布密度曲线如图所示,那么向正方形ABCD 中随机投掷10 000个点,则落入阴影部分的点的个数的估计值是( )
(注:若X ~N(μ,σ2),则P(μ-σ<X<μ+σ)=68.26%,P(μ-2σ<X<μ+2σ)=
95.44%)
A .7 539
B .6 038
C .7 028
D .6 587
3.[2018·山东烟台高三适应性练习]下图是8位同学400米测试成绩的茎叶图(单位:秒),则( )
.众数为77
5.[2018·河北南宫市月考]已知随机变量X 的分布列如下表,则随机变量(2X +3)的方差D(2X +3)为( )
A .-12
B .712
C .73
D .76
6.[2018·华中师范大学附属中学模拟]从某企业生产的某种产品中抽取若干件,经测量得这些产品的一项质量指标值Z服从正态分布N(200,150),某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,则E(X)等于( )
(附:150≈12.2.若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,
P(μ-2σ<Z<μ+2σ)=0.954 4.)
A.34.13 B.31.74
C.68.26 D.95.44
7.[2018·全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
8.[2018·福建适应性练习]
出土青铜器表面的有害氯化物通常采用化学溶液洗涤结合物理超声波技术进行清除.有害氯化物残存量受超声波频率的影响,某文物保护单位采集28例青铜器表面有害氯化物处理案例中,超声波频率及对应有害氯化物残存量数据,绘制散点图(如图所示),根据该图数据,下列判断正确的是( )
A.超声波频率的最大值等于25
B.氯化物残存量的极差大于20
C.氯化物残存量的中位数为15
D.氯化物残存量与超声波频率成正相关关系
9.[2018·高考预测卷]已知变量x与y之间存在几组对照数据如下表所示,由对照数据可以求出回归直线方程为y
^
=-3+2x;若
i=1
4
x i=16,则m+n=( )
x i 2 3 5 m
y i 3 n 5.5 6.5
A.14 B.D.12
10.[2018·台州中学模拟]已知某8个数的期望为5,方差为3,现又加入一个新数据5,此时这9个数的期望记为E(X),方差记为D(X),则( )
A.E(X)=5,D(X)>3 B.E(X)=5,D(X)<3
C.E(X)<5,D(X)>3 D.E(X)<5,D(X)<3
11.[2018·内蒙古北重三中第九次调研]某校高一年级进行研究性学习,得出五个百货商场今年6月份的销售情况统计图,如图,下列陈述正确的是( )
①这五个商场中销售额与去年同期相比增长率排序居同一位的只有1个;②与去年6月份相比,这五个商场的销售额均在增长;③与去年6月份相比,A的增长率最大,所以A的销售额增量也最大;④去年6月份C比D的销售额大.
A.①②B.①②④ C.②③④D.①③④
12.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,
≈9.616,参照附表,得到的正确结论是( ) 由K2=
58×42×35×65
附:
A.
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
二、填空题:本大题共4小题,每小题5分,共20分,把答案填在题中的横线上.
13.[2018·江苏卷]
已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.
14.[2018·内蒙古赤峰统考]某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1:3:7:6:3,那么成绩在[16,18]的学生人数是________.
15.[2018·广东东莞市冲刺演练]已知样本x1,x2,x3,…,x n方差s2=2,则样本2x1+1,2x2+1,2x3+1,…,2x n+1的方差为________.
16.[2018·江苏沭阳月考]甲、乙两队进行一场排球比赛,根据以往经验,单局比赛甲队胜乙队的概率为0.5,本场比赛采用五局三胜制,即先胜三局的队获胜,比赛结束,设各
局比赛相互之间没有影响,用ξ表示本场比赛的局数,则ξ的数学期望为________.。

相关文档
最新文档