12、2020版高考数学大二轮培优理科通用版能力升级练(十二) 统计与统计案例 Word版含解析
通用版2020版高考数学大二轮复习能力升级练十一统计与统计案例文
能力升级练(十一) 统计与统计案例一、选择题.某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将60个同学按01,02,03,…,601进) (,则选出的第6个个体的编号是,行编号然后从随机数表第9行第5列的数开始向右读(注:下表为随机数表的第8行和第9行)6301 6378 5916 9555 6719 9810 5071 7512 8673 5807 4439 5238 793321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279 54A.07B.25C.42D.52.52因此选出的第6个个体的编号是依次选出的个体分别是解析依题意得,12,34,29,56,07,52,D答案n..n分别为:kg)块地作试验田(这单位2块地的亩产量为评估一种农作物的种植效果,选了xxx),下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 ,(,…,n21xxxxxx的平均数,的标准差 B.A.,,…,,…,nn2211xxxxxx,,…,的最大值 D.,,…,的中位数C.nn2112.解析刻画评估这种农作物亩产量稳定程度的指标是这组数据的标准差 B 答案.3(2019云南昆明模拟)AQI(空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程.~~~150);四级中度污染100);(0三级轻度污染50);二级良(51度(101AQI共分六级,从一级优~~.如图是昆明市2017年4六级严重污染(大于300)(151月份随200);直至五级重度污染(201300);) 月份空气质量优的天数为(利用该样本估计昆明市2019年4茎叶图机抽取10天的AQI,A.3B.4C.12D.212所以估计昆明市天空气质量为优,所以空气质量为优的频率解析从茎叶图知10天中有4102.×= C12,2019年4月份空气质量为优的天数为30故选答案C.对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方4图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,)则该样本中三等品的件数为(其余均为三等品,D.50B.7C.10A.5.=+.×.-+.因此00375)三等品的频率为解析根据题中的频率分布直方图可知,10(0050050062525,..=× 2550该样本中三等品的件数为2000答案D.(2019广西桂林、百色、梧州、崇左、北海五市联考)如图是2017年第一季度A,B,C,D,E五省5) (则下列陈述正确的是,情况图GDP.②①年第一季度;,2017与去年同期相比2017年第一季度GDP总量和增速均居同一位的省只有1个④③年同期;2016省、B省、A省五个省的GDP总量均实现了增长;D去年同期的GDP总量前三位是.GDP总量也是第三位A省的②③④①② A.B.①③④②④ D. C.①总量和增速分别省的GDP个,B省和C解析年第一季度2017GDP总量和增速均居同一位的省有2②①可知前三位为总量,2016年同期五省的;错误由图知GDP正确;由图计算居第一位和第四位,故..③③④ ,故故选正确B,故总量是第三位正确;由知2016年同期A省的GDPAD省、B省、省 B答案..甲、轮选拔人参加该行业全国技能大赛,经过66并从参赛职工中选某企业开展职工技能比赛,1.得分情况如茎叶图所示乙两人成绩突出,) (,若甲、乙两人的平均成绩分别是则下列说法正确的是乙甲 .应该选乙参加比赛,乙比甲成绩稳定A,乙甲 .,甲比乙成绩稳定B,应该选甲参加比赛乙甲 .应该选甲参加比赛C,甲比乙成绩稳定,乙甲..,乙比甲成绩稳定,应该选乙参加比赛 D乙甲 2 6 2 6 1 32 = 82,≈87,所以解析乙甲甲乙甲6611222 +++++. .+++++,41因为67,36)≈(81221所以乙成绩比甲成绩1(1001667,9191616100)≈乙乙甲66.应该选乙参加比赛稳定,答案D.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将8407人按1,2,…, 0随机) 的人数为(42人中,编号落入区间[481,720]编号,则抽取的A.11B.12C.13D.140 20- 0==. 1220人抽取1人,所以抽取编号落入区间[481,720]的人数为解析由20,即每20 2 B答案.(2019北京燕博园质检)某超市从2018年甲、乙两种酸奶的日销售量8(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下:2222 a 与,记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为则频率分布直方图中的的值及2211)(的大小关系分别是2222 ..a= a= 015,B.15, 0A.022112222 .a= .a= 15,D. 0C.015,02121..+.+.+a+.×=a=..根据频率分布直方图,图030002025)01510解析由(0020中的数据较稳01,010得022. 则定,21答案C.某省二线城市地铁正式开工建设,地铁时代的到来能否缓解该市的交通拥堵状况呢9?某社团进行社会调查,得到的数据如下表:男性女性认为能缓解交483078 拥认为不能缓解122032通拥6050110总)则下列结论正确的是(2- 2=K附:2k....KP001 0005 0005 (010 0≥) 0k. (828)0879 36841 1635 70.05的前提下认为“对能否缓解交通拥堵的认识与性别有关”在犯错误的概率不超过A.0.的前提下认为“对能否缓解交通拥堵的认识与性别无关”050在犯错误的概率不超过B..01的前提下认为“对能否缓解交通拥堵的认识与性别有关” C.在犯错误的概率不超过0.01的前提下认为“对能否缓解交通拥堵的认识与性别无关” D.在犯错误的概率不超过02K× ,可求2解析由的观测值2列联表2110 20 -1230 .>k=.. 3≈58412883260 02.=K.P05,≥3(0由统计表841)∴..的前提下认为“对能否缓解交通拥堵的认识与性别有关”05在犯错误的概率不超过0答案A二、填空题.xy(吨))与生产能耗的对应数据如表福建泉州模拟)某厂在生产甲产品的过程中,产量:(吨10(2018x 30 40 50 60y 25 35 40 45x+ =.预计需要生产能耗为根据最小二乘法求得回归方程为80吨时0,65 ,当产量为. 吨∴=x+ .. = = =预计需要生产能耗为,解析由题意,可得45,80367,25,代入0吨时65当产量为,.+=.× 59(065吨807)59答案.则这组数据的110,114,121,119,126,11,某同学在高三学年的五次阶段性考试中数学成绩依次为. 方差是解析因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可先对这5个数据同时减122--+s=(4根据方差公式可得8)[(0去110,得到新的数据分别为0,4,11,9,16,其平均数为8,.8 30答案.122222.-++-=.+- 8)30(1688)(98)8)](11是定量描述空气质量状况的指简称(Air Quality Index,AQI)(2018河北邯郸模拟)空气质量指数~~~~为中度200150为轻度污染50为优;51;101100为良,0数,空气质量按照AQI大小分为六级;151.~随机抽,从某地一环保人士某年的AQI为严重污染300为重度污染;大于300污染;201记录数据中.的天数约为AQI大于100取10个,用茎叶图记录如图估计此地该年根据该统计数据,. 天)(该年为3652,频率为大于100的频数是4,解析该样本中AQI2,大于100的频率为AQI由此估计该地全年2.×= 146100的天数约为365AQI估计此地该年大于146答案.:13给出下列四个命题①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,23;那么样本中另一位同学的编号为,号同学在样本中46号、33号、7已知.②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;③a,0,1,2,3的平均数为1,若一组数据则其标准差为2;== ④ x = 3,,其中根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为2,1,. =则1. )(其中真命题有填序号=①÷号、20故抽取的样本的编号分别为7,由系统抽样知抽样的分段间隔为52号、4解析在13,中1=+++①②++3,33,中,数据1,2,3,3,4,5的平均数为(1425)3号、3346号,故在是假命题;中位数为6②③a++++=a=-1,解得2,因为样本的平均数为1,所以30故1众数为3,都相同,故是真命题;在5,中122222④=③+-+----++-回归中(3,1)]2,标准差为2,[(样本的方差为故11);(01)是假命题(11)在(21).x++ =④ 2,又回归直线过点(,)把(1,3)直线方程为代入回归直线方程1,故2,得是真命题②④答案三、解答题.一经推出,14它支持发送语音短信、视频、图片和文字微信是腾讯公司推出的一种手机通讯软件,.为了调查每天微信用)被称为微商甚至涌现出一批在微信的朋友圈内销售商品的人便风靡全国,(将男性、女性50名,某经销化妆品的微商在一广场随机采访男性、女性用户各户使用微信的时间,得到如图所示的频率5使用微信的时间分成组分别加以统计,:(0,2],(2,4],(4,6],(6,8],(8,10].分布直方图(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件×2的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”完成2?2k..........PK001 0050 0025 40 0025 015 0005 10 0(010 05 0≥) 0k. (828)1879 635 706 37841 50 00455 024 708 16323 2072 22- 2=.解(1)女性平均使用微信的时间为:.×+.×+.×+.×+.×=..小时02470)161002476(30122859.+a+.+×.=a=.. 012)1,(2)由已知得:2(004解得0140820由题设条件得列联表微信非微总计信控控男38 12 50性女30 20 50性总68 32 100计.>.∴Kk=. 941的观测值706≈2232 0 06212 30100 3 20-2.的把握认为“微信控”与“性别”有关所以有90%.在2018年俄罗斯世界杯期间,莫斯科的部分餐厅销售了来自中国的小龙虾15,这些小龙虾均标有.xy(单位:元)之间的关系,经统计得到如下数据等级代码为得到小龙虾等级代码数值:与销售单价38485868788824811888yyxyx的线性回归方程(求之间存在线性相关关系,系数精关于已知销售单价(1)与等级代码数值.1);0确到(2)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价?为多少元.xy x+xyxy的斜率和截距的最小二乘,其回归直线,参考公式:对于一组数据( ,…, ,),),(nn2211 - . 1估计分别为22- 1662. xy== 25 564参考数据: 8 440, ii116 3 = 63,(1)由题意,得解622 20 22 16 1 . =5,2166 6 -21 663 0-. 12,≈06636632 6 -22 6 -1..× =.-=. 295630821..x+. = 2908故所求线性回归方程为..=.+.y=x=× 28895,知当由(2)(1),98时0298..∴元估计该等级的中国小龙虾销售单价为285。
2020版高考数学二轮复习第二部分专题四概率与统计第2讲统计与统计案例练习(含解析)(最新整理)
(京津鲁琼专用)2020版高考数学二轮复习第二部分专题四概率与统计第2讲统计与统计案例练习(含解析)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((京津鲁琼专用)2020版高考数学二轮复习第二部分专题四概率与统计第2讲统计与统计案例练习(含解析))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(京津鲁琼专用)2020版高考数学二轮复习第二部分专题四概率与统计第2讲统计与统计案例练习(含解析)的全部内容。
第2讲统计与统计案例[做真题]题型一抽样方法与总体分布的估计1.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分。
7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差解析:选A。
记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A。
2.(2018·高考全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A.法一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0。
2020年高考数学二轮限时训练计数原理、概率、随机变量及其分步、统计、统计案例2理
第七部分:计数原理、概率、随机变量及其分步、统计、 统计案例(2)(限时:时间45分钟,满分100分)、选择题1 31 •已知(X 2—二)"的展开式中第三项与第五项的系数之比为 帀,则展开式中常数项是()A •— 1B • 1 C.— 45 D • 45r当 20 — 2r — = 0,即当 r = 8 时, 常数项为 C 108( — 1)8= C o 2= 45,选 D.【答案】 D1 n2 •若(x + -)n展开式的二项式系数之和为64,则展开式的常数项为( )XA . 10B • 20 C. 30 D • 120【解析】•.•2n = 64,「. n = 6, 1•••T k +1= C 6kx 6— k(-)k= C 6kx6— 2k,•••当k = 3时,T 4为常数项,3• -T 4= C o = 20.【答案】 B3 • (2020年献县二模)(1 — ,x) 6(1 + ,x)4的展开式中x 的系数是()A • — 4B • — 3C . 3D • 4【解析】 方法一 :(1 — . x) 6(1 + . x)4的展开式中x 的一次项为:C 60•C 42( x)2+ G 2( — x) 2•C 40+ C 61( — x)・C 41( .x)【解析】 由题知第三项的系数为 G 2( — 1)2= G 2,第五项的系数为G 2G 4( — 1)4= G 4,则有吕C n£解得n =10,由 T r + 1= C r 20— 2r oXr rx — 2( —=6x + 15x — 24x = — 3x ,所以(1 — x) 6(1 + x)4的展开式中x 的系数是一3.方法二:由于(1 — x) 6(1 + x) 4= (1 — x) 4(1 — x) 1 2的展开式中x 的一次项为: 。
3( — x) •C 2 + C 4°•C 22( — J x) 2=— 4x + x =— 3x , 所以(1 —■ x) 6(1 + x)4的展开式中x 的系数是一3.【答案】 B8 84 .设(1 + x) = a o + a 1x +…+ a $x ,则 a o , a 1,…,a 8中奇数的个数 为() A . 2 B . 3 C. 4 D . 58 2 8_,【解析】 由(1 + x) = a o + a 1x + a 2x +…+ a $x 可以知道,a o 、a” a 2、…、a 8均为二项式系数,依次是 C 0、Q 4、C 2…、C 8,0 8 1 7 2 6 3 5C 8 = C 8 = 1, C 8 = C 8 = 8, C 8 = C 8 = 28, C = C 8 = 56 ,Q = 70,.・a o , a-1,…,a 8中奇数只有a o 和a s 两个. 【答案】 A1 n 1 15 .若(2x —-)展开式中含 广项的系数与含项的系数之比为一5,则n 等于()入 入 入A . 4B . 6 C. 8 D . 1o 【解析】1kn —kk• T =C (2x) (—x )kk 亠 n —k n — 2k=G ( — 1)・2 x ,n + 2•••令 n — 2k = — 2 得 k = -; n + 4令 n — 2k =— 4 得 k =〒,n +4n +4C2n(— 1)22n—解得n = 6. 【答案】 B 二、填空题6. 1 + 3 + 32+…+ 399被4除所得的余数是 ___________2 991 — 3100【解析】•/ 1+ 3+ 3 +…+ 3 =1 — 34则(1 + x + x 2)(x + p n 的展开式中无常数项.n+2 n+2 C〒n( —1)〒2 n-n+ 2 2 n+ 4 21100 1 99 8 2 9 =—(4 — C 100 4 +…+ C 1009 ・4 — C oo9 4)=8(4 98— C o 。
2020高考数学(理科)二轮专题复习课标通用版跟踪检测:概率与统计含答案 (2)
C .123.3D .126.7C 解析 由题意可知身高在(100,110],(110,120],(120,130]的频率依次为0.05,0.35,0.3,前两组的频率和为0.4,组距为10,设中位数为x ,则(x -120)×0.310=0.1,解得x =123.3.故选C 项.6.(20xx·山西实验中学模拟)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表所示.产品数x /个 10 20 30 40 50 产品总成本y /元62a758189由最小二乘法得到回归方程y ^=0.67x +54.9,则a =________.解析 计算可得,x -=30,y -=307+a 5,所以307+a 5=0.67×30+54.9,解得a =68.答案 687.为比较甲、乙两地14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图,则甲、乙两地该月14时的平均气温x甲,x乙的大小关系为________,标准差s 甲,s 乙的大小关系为________.解析 x -甲=15×(26+28+29+31+31)=29,x -乙=15×(28+29+30+31+32)=30,则x -甲<x -乙;由茎叶图知,乙地的气温相对比较集中,甲地的气温相对比较离散,所以甲地该月的标准差大于乙地该月的标准差,即s 甲>s 乙.答案 x -甲<x -乙 s 甲>s 乙8.为了研究雾霾天气的治理情况,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y。
2020版高考数学大二轮专题突破理科通用版专题突破练:20 统计与统计案例
使用寿
命
1个 2个 3个 4个 总
月月月月计
材料类型
A
20 35 35 10 100
B
10 30 40 20 100
经甲公司测算,平均每包新型材料每月可以带来 5 万元收入,不考虑除采购成本之外的其他成本,假设 每包新型材料的使用寿命都是整数月,且以频率作为每包新型材料使用寿命的概率,如果你是甲公司 的负责人,以每包新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?
1
16
∑
经计算得 16������ = 1xi=9.97,s=
1 16������
16
=∑1(������������
-
������)2
=
1
16(������
16
=∑1������2������
-
16������2) ≈0.212,
16
∑ (������ - 8.5)2
16
∑
������ = 1
≈18.439,������ = 1(xi-
(2)一天内抽检零件中,如果出现了尺寸在(������-3s,������+3s)之外的零件,就认为这条生产线在这一天的生产 过程可能出现了异常情况,需对当天的生产过程进行检查.
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在(������-3s,������+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值 与标准差.(精确到 0.01)
.
8.(2019 山东青岛二模,理 20)“爱国,是人世间最深层、最持久的情感,是一个人立德之源、立功之本.” 在中华民族几千年绵延发展的历史长河中,爱国主义始终是激昂的主旋律.爱国汽车公司拟对“东方红” 款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入 x(亿元)与科技改造直接收 益 y(亿元)的数据统计如下:
2020高考理科数学二轮分层特训卷:热点练(十二)Word版含解析
热门 (十二 )图表在概率中的应用1. (频次散布直方图)200 辆汽车经过某一段公路时的时速的频次散布直方图以下图,则时速的众数、中位数的预计值分别为()A . 62, 62.5B .65, 62C.65, 63.5 D .65, 65答案: D分析:由题图易知最高的矩形为第三个矩形,因此时速的众数为65.因为前两个矩形的0.2× 10= 5,因此中位数为60+ 5= 65.应选面积为 (0.01+0.02) × 10= 0.3, 0.5- 0.3= 0.2,0.4D.2.(概率散布 )经过一年的新乡村建设,某地域乡村的经济收入增添了一倍,实现翻番.为更好地认识该地域乡村的经济收入变化状况,现统计了该地域新乡村建设前后乡村的经济收入组成比率,获取以下饼图:则下边构造中不正确的选项是()A.新乡村建设后,栽种收入减少B.新乡村建设后,其余收入增添了一倍以上C.新乡村建设后,养殖收入增添了一倍D.新乡村建设后,养殖收入与第三家产收入的总和超出了经济收入的一半答案: A分析:设新乡村建设前的经济收入为M,则新乡村建设后的经济收入为2M.新乡村建设前栽种收入为0.6M,新乡村建设后的栽种收入为0.74M ,因此栽种收入增添了,因此 A 选项不正确;新乡村建设前其余收入为0.04M,新乡村建设后其余收入为0.1M,因此增添了一倍以上,因此 B 选项正确;新乡村建设前养殖收入为0.3M,新乡村建设后养殖收入为0.6M,因此增添了一倍,因此 C 选项正确;新乡村建设后,养殖收入与第三家产收入的总和占经济收入的30%+ 28% = 58%>50%,因此超出了经济收入的一半,因此 D 正确.应选 A.3. (频次散布折线图)某城市为认识旅客人数的变化规律,提升旅行服务质量,采集并整理了 2015 年 1 月至 2017 年 12 月期间月招待旅客量(单位:万人 )的数据,绘制了下边的折线图.依据该折线图,以下结论错误的选项是() A.年招待旅客量逐年增添B.各年的月招待旅客量顶峰期在8 月C.2015 年 1 月至 12 月月招待旅客量的中位数为D.各年 1 月至 6 月的月招待旅客量相关于7 月至30 万人12 月,颠簸性更小,变化比较均衡答案: C分析:由折线图中2015 年1 月至2017 年12 月期间月招待旅客量(单位:万人)的数据可得:年招待旅客量奉上涨趋向,因此年招待旅客量逐年增添,故 A 正确;每一年的招待量八月份的最大,故 B 正确;折线图中没有详细数据,中位数没法计算,故 C 错误;各年1 月至 6 月的月招待旅客量相关于7 月至12 月,颠簸性更小,变化比较均衡,故D 正确.故选 C.4. (条形图 ) 如图是 2017 年第一季度五省GDP 状况图,则以下陈说正确的选项是()① 2017 年第一季度GDP 总量和增速均居同一位的省只有 1 个②与昨年同期对比,2017 年第一季度五个省的GDP 总量均实现了增添③昨年同期的GDP 总量前三位是 D 省、B 省、 A 省④ 2016年同期A省的GDP总量也是第三位A .①②C.②④B.②③④D.①③④答案: B分析:① 2017 年第一季度GDP 总量和增速均居同一位的省有 2 个,B 省和 C 省的GDP 总量和增速分别居第一位和第四位,故①错误;由题图知②正确;由题图计算2016 年同期五省的GDP 总量,可知前三位为 D 省、B 省、 A 省,故③ 正确;由③知2016 年同期 A 省的GDP 总量是第三位,故④正确.应选 B.5. (雷达圆 ) 某旅行城市为向旅客介绍当地的气温状况,绘制了一年中各月均匀最高气平和均匀最低气温的雷达图.图中 A 点表示十月的均匀最高气温约为15 ℃, B 点表示四月的均匀最低气温约为 5 ℃ .下边表达不正确的选项是()A .各月的均匀最低气温都在0 ℃以上B.七月的均匀温差比一月的均匀温差大C.三月和十一月的均匀最高气温基真同样D.均匀气温高于20 ℃的月份有 5 个答案: D分析:由题图可知0 ℃在虚线框内,因此各月的均匀最低气温都在0 ℃以上, A 正确;由题图可知七月的均匀温差比一月的均匀温差大, B 正确;由题图可知三月和十一月的均匀最高气温都约为10 ℃,基真同样, C 正确;由题图可知均匀最高气温高于20 ℃的月份是两个, D 不正确,应选 D.6.(扇形图+分层抽样)已知某地域中小学生的人数和近视状况分别如图 1 和图 2 所示,为认识该地域中小学生的近视形成原由,用分层抽样的方法抽取2%的学生进行检查,则抽取的高中生中近视的人数为________.答案: 20分析:分层抽样抽取的比率为2%,高中生抽取的学生数为40,抽取的高中生中近视人数为40× 50%= 20,故答案为20.7. [2019 ·汉市武昌区高三年级调研武]( 茎叶图 )某选手的7 个得分去掉 1 个最高分,去掉 1 个最低分,节余 5 个得分的均匀数为91,如图,该选手的7 个得分的茎叶图有一个数据模糊,没法辩认,在图顶用x 表示,则节余 5 个得分的方差为________.答案: 6分析:由茎叶图知,最低分为87 分,最高分为99 分.依题意得,15× (87+ 93+ 90+ 9× 10+x+ 91)= 91,解得 x= 4.则节余 5 个得分的方差 s2=15× [(87 - 91)2+ (93- 91)2+ (90- 91)2+(94- 91)2+ (91- 91)2]=15× (16+ 4+1+ 9)= 6.8. (几何概型 )三国期间吴国的数学家赵爽曾创制了一幅“勾股圆方图”,用数形联合的方法给出了勾股定理的详尽证明.以下图的“勾股圆方图”中,四个全等的直角三角形与中间的小正方形拼成一个大正方形,此中一个直角三角形中较小的锐角α知足 tan α= 3,________. 4现向大正方形内随机扔掷一枚飞镖,则飞镖落在小正方形内的概率是答案:1253π34分析: 由 tan α= 4且 α∈ 0, 2 得 sin α=5, cos α=5,不如设三角形的斜边长为 5,所以较小直角边长为 5sin α= 3,较大直角边长为5cos α= 4,因此小正方形的边长为1,而大1 1正方形面积为 25,因此飞镖落在小正方形内的概率 P =25,故答案是 25.9. (频次散布直方图 )“中国人均念书 4.3 本 (包含网络文学和教科书 ),比韩国的 11 本、 法国的 20 本、日本的 40 本、犹太人的 64 本少得多,是世界上人均念书最少的国家.”这 个论断被各种媒体频频引用. 出现这样的统计结果无疑是令人难堪的. 某小区为了提升小区 内人员的念书兴趣, 准备举办念书活动, 并进必定量的书本丰富小区图书站. 因为不一样年纪 段的人看不一样种类的书本, 为了合理装备资源, 现对小区内看书人员进行年纪检查, 随机抽取了 40 名念书者,将他们的年纪 (单位:岁 )分红 6 段: [20,30),[30 ,40),[40 ,50), [50,60),[60, 70), [70 , 80] ,获取以下图的频次散布直方图.(1)求这 40 名念书者中年纪散布在 [40 , 70)的人数;(2)求这 40 名念书者年纪的均匀数和中位数.分析:(1) 由频次散布直方图知年纪在 [40,70)的频次为 (0.020+ 0.030+0.025)× 10=0.75,故这 40 名念书者中年纪散布在 [40 , 70)的人数为 40× 0.75= 30.(2)这 40 名念书者年纪的均匀数为25× 0.05+ 35×0.10+ 45× 0.20+ 55× 0.30+65× 0.25+ 75× 0.10= 54. 设中位数为 x ,则 0.005×10+ 0.010× 10+ 0.020× 10+0.030× (x - 50)=0.5,解得 x =55,故这 40 名念书者年纪的中位数为55.10. (概率散布 )电影企业随机采集了电影的相关数据,经分类整理获取下表:电影种类 第一类 第二类第三类 第四类 第五类 第六类 电影部数14050300200800 510 好评率 0.4 0.2 0.15 0.25 0.20.1好评率是指一类电影中获取好评的部数与该类电影的部数的比值.假定全部电影能否获取好评互相独立.(1)从电影企业采集的电影中随机选用1 部,求这部电影是获取好评的第四类电影的概率;(2)从第四类电影和第五类电影中各随机选用 1 部,预计恰有 1 部获取好评的概率;(3)假定每类电影获取人们喜爱的概率与表格中该类电影的好评率相等,用“ξk=1”表示第 k 类电影获取人们喜爱,“ξk= 0”表示第 k 类电影没有获取人们喜爱(k= 1, 2, 3,4,5, 6),写出方差 Dξ1, Dξ2,Dξ3, Dξ4, Dξ5, Dξ6的大小关系.分析: (1)由题意知,样本中电影的总部数是140+50+ 300+ 200+ 800+ 510=2 000,第四类电影中获取好评的电影部数是200× 0.25= 50.50故所求概率为2 000= 0.025.(2)设事件 A 为“从第四类电影中随机选出的电影获取好评影中随机选出的电影获取好评”,因此所求概率为P(A B +”,事件 B 为“从第五类电A B)= P(A B )+ P( A B)=P(A)((1 -P(B)) +((1-P(A))P(B).由题意知,P(A)为 0.25, P(B)为0.2,故所求概率预计为0.25× 0.8+ 0.75× 0.2= 0.35.(3)Dξ1>Dξ4>Dξ2= Dξ5>Dξ3>Dξ6.。
2020届高考数学(理)二轮强化专题卷(12)概率与统计
(12)概率与统计1、用随机数表法从100名学生(其中男生40名)中抽取20名参加一项文体活动,某男生被抽到的可能性是( )A.110B.12C.15D.252、某学校为了解1000名新生的近视情况,将这些学生编号为000,001,002, (999)从这些新生中用系统抽样的方法抽取100名学生进行检查,若036号学生被抽到,则下面4名学生中被抽到的是()A. 008号学生B. 200号学生C. 616号学生D. 815号学生3、根据新高考改革方案,某地高考由文理分科考试变为“3+3”模式考试.某学校为了解高一年级425名学生选课情况,在高一年级下学期进行模拟选课,统计得到选课组合排名前4种如下表所示,其中物理、化学、生物为理科,政治、历史、地理为文科,“√”表示选择该科,“×”表示未选择该科,根据统计数据,下列判断错误..的是()A.前4种组合中,选择生物学科的学生更倾向选择两理一文组合B.前4种组合中,选择两理一文的人数多于选择两文一理的人数C.整个高一年段,选择地理学科的人数多于选择其他任一学科的人数D.整个高一年段,选择物理学科的人数多于选择生物学科的人数4、已知一组数据的频率分布直方图如图所示则众数、中位数、平均数分别为( )A.63、64、66B.65、65、67C.65、64、66D.64、65、645、为研究变量x和y的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l和2l,两人计算知x相同, y也相同,下列正确的是( )A. 1l与2l重合B. 1l与2l一定平行C. 1l与2l相交于点(),x yD.无法判断1l和2l是否相交6、从一箱产品中随机地抽取一件,设事件A={抽到一等品},事件B={抽到二等品},事件C={抽到三等品},且已知()0.65P A=,()0.2P B=,()0.1P C=,则事件“抽到的产品不是一等品”的概率为( )A. 0.7B. 0.65C. 0.35D. 0.37、《西游记》《三国演义》《水浒传》《红楼梦》我国古典小说四大名著,若在这四大名著中任取2种进行阅读,则取到《红楼梦》的概率为()A. 23B.12C.13D.148、如图是一个中心对称的几何图形,已知大圆半径为2,以半径为直径画出两个半圆,在大圆内随机取一点,则此点取自阴影部分的概率为( )A.18B.π8C.14D.129、甲、乙两人参加“社会主义价值观”知识竞赛,甲、乙两人能荣获一等奖的概率分別为2 3和34,甲、乙两人是否获得一等奖相互独立,则这两个人中恰有一人获得一等奖的概率为( ) A.34B.23C.57D.51210、设随机变量,X Y 满足:31Y X =-,()2,X B p ~,若()519P X ≥=,则()D Y =( )A .4B .5C .6D .711、某药厂选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:Pa k )的分组区间为12,1313,1414,1515,16[),[),[),[),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,则第三组的人数为__________.12、一个骰子连续投2次,点数积大于21的概率__________.13、如图,在一个边长为1的正方形中随机撒入100粒豆子,恰有60粒落在阴影区域内,则该阴影区域的面积约为___。
2020新高考文科数学二轮培优统计、统计案例考点考向考题点拨(27页)
2020新高考文科数学二轮培优统计、统计案例考点考向考题点拨「考情研析」 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等. 2.概率与统计的交汇问题是高考的热点,以解答题形式出现,难度中等.核心知识回顾1.三种抽样方法的特点简单随机抽样:操作简便、适当,总体个数较少. 分层抽样:按比例抽样. 系统抽样:等距抽样. 2.必记公式数据x 1,x 2,x 3,…,x n 的数字特征公式 (1)平均数:x -=□01x 1+x 2+x 3+…+x n n. (2)方差:s 2□021[(-x -)2+(x 2-x -)2+…+(x n -x -)2].(3)标准差:s =3.重要性质及结论(1)频率分布直方图的三个结论①小长方形的面积=□01组距×频率组距=频率;②各小长方形的面积之和等于1;③小长方形的高=□02频率组距,所有小长方形高的和为1组距. (2)回归直线方程:一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )其回归方程y ^=□03b ^x +a ^ ,其过样本点中心□04(x -,y -)⎝ ⎛⎭⎪⎪⎪⎫其中b ^=∑i =1n(x i-x -)(y i-y -)∑i =1nx 2i-n x -2,a ^=y --b ^x -. (3)独立性检验K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点考向探究考向1 抽样方法例1 (1)从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为( )A .480B .481C .482D .483答案 C解析 ∵样本中编号最小的两个编号分别为007,032,∴样本数据组距为32-7=25,则样本容量为50025=20,则对应的号码数x =7+25(n -1),当n =20时,x 取得最大值,此时x =7+25×19=482.故选C .(2)(2019·广州普通高中高三综合测试)某公司生产A ,B ,C 三种不同型号的轿车,产量之比依次为2∶3∶4,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n 的样本,若样本中A 种型号的轿车比B 种型号的轿车少8辆,则n =( )A .96B .72C .48D .36 答案 B解析 由题意,得29n -39n =-8,∴n =72.选B .系统抽样与分层抽样的求解方法(1)系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定.每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列{a n},第k组抽取样本的号码a k=m+(k-1)d.(2)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,求解此类问题需先求出抽样比——样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数与抽样比的乘积.在每层抽样时,应采用简单随机抽样或系统抽样进行.1.(2019·云南省第二次高三统一检测)某中学高一年级有学生1200人,高二年级有学生900人,高三年级有学生1500人,现按年级为标准,用分层抽样的方法从这三个年级学生中抽取一个容量为720的样本进行某项研究,则应从高三年级学生中抽取学生()A.200人B.300人C.320人D.350人答案 B解析由分层抽样可得高三抽取的学生人数为15001200+900+1500×720=300.故选B.2.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入[1,450]的人做问卷A,编号落入[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为________.答案10解析由题意得系统抽样的抽样间隔为96032=30,又因为第一组内抽取的号码为9,则由451≤9+30k≤750(k∈N*),得141115≤k≤24710,所以做问卷B的人数为10.考向2 用样本估计总体例2(1)甲、乙两名学生在5次数学考试中的成绩统计如茎叶图所示,若x-甲,x-乙分别表示甲、乙两人的平均成绩,则下列结论正确的是()A.x-甲>x-乙,乙比甲稳定B.x-甲>x-乙,甲比乙稳定C.x-甲<x-乙,乙比甲稳定D.x-甲<x-乙,甲比乙稳定答案 A解析因为x-甲=15×(74+82+88+91+95)=86,x-乙=15×(77+77+78+86+92)=82,所以x-甲>x-乙.因为s2甲=15×[(-12)2+(-4)2+22+52+92]=54,s2乙=15×[(-5)2+(-5)2+(-4)2+42+102]=36.4,所以s2甲>s2乙,故乙比甲稳定.故选A.(2)(2019·皖南八校高三第三次联考)从某地区年龄在25~55岁的人员中,随机抽出100人,了解他们对今年两会的热点问题的看法,绘制出频率分布直方图如图所示,则下列说法正确的是()A.抽出的100人中,年龄在40~45岁的人数大约为20B.抽出的100人中,年龄在35~45岁的人数大约为30C.抽出的100人中,年龄在40~50岁的人数大约为40D.抽出的100人中,年龄在35~50岁的人数大约为50答案 A解析根据频率分布直方图的性质得(0.01+0.05+0.06+a+0.02+0.02)×5=1,解得a=0.04,所以抽出的100人中,年龄在40~45岁的人数大约为0.04×5×100=20,所以A正确;年龄在35~45岁的人数大约为(0.06+0.04)×5×100=50,所以B不正确;年龄在40~50岁的人数大约为(0.04+0.02)×5×100=30,所以C不正确;年龄在35~50岁的人数大约为(0.06+0.04+0.02)×5×100=60,所以D不正确.故选A.(1)频率分布直方图中每个小矩形的面积为对应的频率,不要混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.(2)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断.1.(2019·福建省高三模拟)为比较甲、乙两名高二学生的数学素养,对课程标准中规定的数学六大素养进行指标测验(指标值满分为5分,分值高者为优),根据测验情况绘制了如图所示的六大素养指标雷达图,则下面叙述正确的是()A.乙的数据分析素养优于甲B.乙的数学建模素养优于数学抽象素养C.甲的六大素养整体水平优于乙D.甲的六大素养中数据分析最差答案 C解析根据雷达图得到如下数据所示.由数据可知选C .2.(2019·江西省吉安一中、九江一中、新余一中等八所重点中学高三4月联考)某地区某村的前三年的经济收入分别为100,200,300万元,其统计数据的中位数为x ,平均数为y ;经过今年政府新农村建设后,该村经济收入在上年基础上翻番,则在这4年里收入的统计数据中,下列说法正确的是( )A .中位数为x ,平均数为1.5yB .中位数为1.25x ,平均数为yC .中位数为1.25x ,平均数为1.5yD .中位数为1.5x ,平均数为2y 答案 C解析 依题意,前三年中位数x =200,平均数y =100+200+3003=200,第四年收入为600万元,故中位数为200+3002=250=1.25x ,平均数为 100+200+300+6004=300=1.5y .故选C . 考向3 回归分析与独立性检验 角度1 回归分析在实际中的应用例3 (2019·沧州市普通高等学校招生全国统一模拟考试)近年来,随着互联网技术的快速发展,共享经济覆盖的范围迅速扩张,继共享单车、共享汽车之后,共享房屋以“民宿”“农家乐”等形式开始在很多平台上线.某创业者计划在某景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近六家“农家乐”跟踪调查了100天.得到的统计数据如下表,x 为收费标准(单位:元/日),t 为入住天数(单位:天),以频率作为各自的“入住率”,收费标准x 与“入住率”y 的散点图如图.(1)令z =ln x ,由散点图判断y ^=b ^x +a ^与y ^=b ^z +a ^哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程(b ^结果保留一位小数);(2)若一年按365天计算,试估计收费标准为多少时,年销售额L 最大?(年销售额L =365·入住率·收费标准x )参考数据:b ^=∑ni =1x i y i -n x - y -∑n i =1x 2i-n x - 2,a ^=y --b ^ x -,x -=200,y -=0.45,∑6i =1x 2i =325000,z -≈5.1,∑6i =1y i z i ≈12.7,∑6i =1z 2i ≈158.1,e 5≈148.4. 解 (1)由散点图可知y ^=b ^z +a ^更适合于此模型.其中b ^=∑6i =1z i y i -6z -y -∑6i =1z 2i -6z - 2=-1.072.04≈-0.5,a ^=y --b ^ z -=3,所求的回归方程为y ^=-0.5ln x +3.(2)L =365(-0.5ln x +3)x =-3652x ln x +1095x .L ′=-3652 ln x -3652+365×3,令L ′=0⇒ln x =5⇒x =e 5≈148.4. ∴若一年按365天计算,当收费标准约为148.4元/日时,年销售额L 最大,最大值约为27083元.在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.(2019·太原市高三模拟)近年来随着互联网的高速发展,旧货交易市场也得以快速发展.某网络旧货交易平台对2018年某种机械设备的线上交易进行了统计,得到如图所示的频率分布直方图和散点图.现把直方图中各组的频率视为概率,用x(单位:年)表示该设备的使用时间,y(单位:万元)表示其相应的平均交易价格.(1)已知2018年在此网络旧货交易平台成交的该种机械设备为100台,现从这100台设备中,按分层抽样抽取使用时间x∈(12,20]的4台设备,再从这4台设备中随机抽取2台,求这2台设备的使用时间都在(12,16]的概率;(2)由散点图分析后,可用y=e bx+a作为此网络旧货交易平台上该种机械设备的平均交易价格y关于其使用时间x的回归方程.表中z =ln y ,z -=110∑i =110z i . ①根据上述相关数据,求y 关于x 的回归方程;②根据上述回归方程,求当使用时间x =15时,该种机械设备的平均交易价格的预报值(精确到0.01).附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu的斜率和截距的最小二乘估计分别为β^=∑i =110u i v i -n u -v -∑i =110u 2i -n u -2,α^=v --β^u -.参考数据:e 0.55=1.733,e -0.95=0.3867,e -1.85=0.1572.解 (1)由图1中频率分布直方图可知,从2018年成交的该种机械设备中使用时间x ∈(12,16]的台数为100×4×0.03=12,使用时间x ∈(16,20]的台数为100×4×0.01=4,∴按分层抽样所抽取4台中,使用时间x ∈(12,16]的设备有3台,分别记为A ,B ,C ;使用时间x ∈(16,20]的设备有1台,记为d ,∴从这4台设备中随机抽取2台的结果为(A ,B ),(A ,C ),(A ,d ),(B ,C ),(B ,d ),(C ,d ),共有6种等可能出现的结果,其中这2台设备的使用时间x 都在(12,16]的结果为(A ,B ),(A ,C ),(B ,C ),共有3种,所求事件的概率为36=12.(2)①由题意得z =ln y =ln e bx +a =bx +a ,∵b ^=∑i =110x i z i -10x -z -∑i =110x 2i -10x -2=79.75-10×5.5×1.9385-10×5.52=-0.3,a ^=z --b ^x -=1.9+0.3×5.5=3.55, ∴z 关于x 的线性回归方程为z =-0.3x +3.55, ∴y 关于x 的回归方程为y =e -0.3x +3.55.②由①知,当使用时间x =15时,y =e -0.3×15+3.55≈0.39,故该种机械设备的平均交易价格的预报值为0.39万元.角度2 独立性检验在实际中的应用例4 (2019·贵州遵义航天高级中学七模)某中学为了解中学生的课外阅读时间,决定在该中学的1200名男生和800名女生中按分层抽样的方法抽取20名学生,对他们的课外阅读时间进行问卷调查.现在按课外阅读时间的情况将学生分成三类:A 类(不参加课外阅读),B 类(参加课外阅读,但平均每周参加课外阅读的时间不超过3小时),C 类(参加课外阅读,且平均每周参加课外阅读的时间超过3小时).调查结果如下表:(1)求出表中x ,y (2)根据表中的统计数据,完成下面的列联表,并判断是否有90%的把握认为“参加课外阅读与否与性别有关”.附:K 2=(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .解 (1)设抽取别为n 1,n 2,则⎩⎨⎧n 1=20×12002000=12,n 2=20×8002000=8,所以x =12-5-3=4,y =8-3-3=2. (2)列联表如下:K 2=20×(4×6-2×8)212×8×14×6=1063≈0.159<2.706,所以没有90%的把握认为“参加阅读与否”与性别有关.独立性检验的关键(1)根据2×2列联表准确计算K 2,若2×2列联表没有列出来,要先列出此表.(2)K 2的观测值k 越大,对应假设事件H 0成立的概率越小,H 0不成立的概率越大.(2019·西安地区陕师大附中、西安高级中学等八校联考)西安市自2017年5月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,斑马线前礼让行人也成为了一张新的西安“名片”.但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患及机动车通畅率降低,交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到2×2列联表如下:十字路口试行了对闯红灯行人进行经济处罚,并从试行经济处罚后穿越该路口行人中随机抽取了200人进行调查,得到下表:(1)将2×2列联表填写完整(不需写出填写过程),并根据表中数据分析,在未试行对闯红灯行人进行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关;(2)当处罚金额为10元时,行人闯红灯的概率会比不进行处罚降低多少;(3)结合调查结果,谈谈如何治理行人闯红灯现象.参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d. 参考数据:∵K2=200×(100×100×80×120=1003≈33.333>10.828.∴有99.9%的把握认为闯红灯与年龄有关.(2)∵未进行处罚前,行人闯红灯的概率为0.4,进行处罚10元后,行人闯红灯的概率为40200=15=0.2,∴降低了0.2.(3)①根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展“道路安全”宣传教育;②由于处罚可以明显降低行人闯红灯的概率,可以进行适当处罚来降低行人闯红灯的概率.真题押题『真题模拟』1.(2019·益阳市高三模拟)如图所示的三个统计图分别是随机抽查甲、乙、丙三地的若干个家庭教育年投入(万元),记A表示众数,B表示中位数,C表示平均数,则根据图表提供的信息,下面的结论正确的是()A.A甲=A乙=A丙,B甲=B乙=B丙B.B丙>B甲=B乙,C甲=C乙=C丙C.A丙>A甲=A乙,C丙>C甲>C乙D.A丙>A甲=A乙,B丙>B甲>B乙答案 C解析由甲地的条形图可知,家庭教育年投入的中位数为10,众数为10,平均数为10.32;由乙地的折线图可知,家庭教育年投入的中位数为10,众数为10,平均数为9.7;由丙地的扇形图可知,家庭教育年投入的中位数为12,众数为12,平均数为12.4.结合选项可知C正确.故选C.2.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是() A.中位数B.平均数C.方差D.极差答案 A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.3.(2019·郴州市高三第三次质量检测)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2012年至2016年我国新闻出版业和数字出版业营收增长情况:给出下列四个结论:①2012年至2016年我国新闻出版业和数字出版业营收均逐年增加②2016年我国数字出版业营收超过2012年我国数字出版业营收的2倍③2016年我国新闻出版业营收超过2012年我国新闻出版业营收的1.5倍④2016年我国数字出版业营收占新闻出版业营收的比例未超过三分之一其中所有正确结论的编号为()A.①②B.①②③C.①②④D.②③④答案 C解析 根据图示数据可知①正确;对于②:1935.5×2=3871<5720.9,正确;对于③:16635.3×1.5>23595.8,不正确;对于④:23595.8×13≈7865>5720.9,正确.故选C .4.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. 答案 53解析 这组数据的平均数为8,故方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.5.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解 (1)由已知得0.70=a +0.20+0.15,故a =0.35.b =1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05, 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.6.(2019·湖北武汉高三第二次质量检测)光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能.近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表:某位同学分别用两种模型:①y ^=bx 2+a ,②y ^=dx +c 进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于y i -y ^i ):经过计算得∑i =18(x i -x -)(y i -y -)=72.8,∑i =18(x i -x -)2=42,∑i =18(t i -t )(y i -y -)=686.8,∑i =18(t i -t )2=3570,其中t i =x 2i ,t =18∑i =18t i.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;(2)根据(1)的判断结果及表中数据建立y 关于x 的回归方程,并预测该地区2020年新增光伏装机量是多少?(在计算回归系数时精确到0.01)附:回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑i =18(x i -x -)(y i -y -)∑i =18(x i -x -)2,a ^=y --b ^x -.解 (1)选择模型①.理由如下:根据残差图可以看出,模型①的估计值和真实值比较相近,模型②的残差值相对较大一些,所以模型①的拟合效果相对较好.(2)由(1)可知,y 关于x 的回归方程为y ^=b ^x 2+a ^,令t =x 2,则y ^=b ^t +a ^. 由所给数据可得t =18∑i =18t i =18×(1+4+9+16+25+36+49+64)=25.5.y -=18∑i =18y i =18×(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5,∴b ^=∑i =18(t i -t )(y i -y -)∑i =18(t i -t )2=686.83570≈0.19,a ^=y --b ^ t ≈5-0.19×25.5≈0.16,所以y 关于x 的回归方程为y ^=0.19x 2+0.16,预测该地区2020年新增光伏装机量为y ^=0.19×102+0.16=19.16(兆瓦).『金版押题』7.某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如表所示.2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下,认为是否为“环保关注者”与性别有关?(2)保达人”中利用分层抽样的方法随机抽取5名市民参与环保知识问答,再从这5名市民中抽取2人参与座谈会,求抽取的2名市民中,既有男“环保达人”又有女“环保达人”的概率.附表及公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b+d ),n =a +b +c +d .解 将2×2K 2的观测值k =100×(45×15-30×10)225×75×55×45≈3.03<3.841,所以在犯错误的概率不超过0.05的前提下,不能认为是“环保关注者”与性别有关.(2)由题可知,利用分层抽样的方法可得男“环保达人”3人,女“环保达人”2人.设男“环保达人”3人分别为A ,B ,C ;女“环保达人”2人为D ,E . 从中抽取两人的所有情况为(A ,B ),(A ,C ),(A ,D ),(A ,E ),(B ,C ),(B ,D ),(B ,E ),(C ,D ),(C ,E ),(D ,E ),共10种情况,且这10种情况发生的可能性相等.既有男“环保达人”又有“女环保达人”的情况有(A ,D ),(A ,E ),(B ,D ),(B ,E ),(C ,D ),(C ,E ),共6种情况.所求概率P =610=35.配套作业一、选择题1.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且回归方程为y ^=0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )A .66%B .67%C .79%D .84%答案 D解析 ∵y 与x 具有线性相关关系,满足回归方程y ^=0.6x +1.2,该城市居民人均工资为x =5,∴可以估计该城市的职工人均消费水平y =0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为4.25=84%.2.(2019·上海市嘉定(长宁)区高三第二次质量调研)产能利用率是指实际产出与生产能力的比率,工业产能利用率是衡量工业生产经营状况的重要指标,下图为国家统计局发布的2015年至2018年第2季度我国工业产能利用率的折线图.在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,例如2016年第二季度与2015年第二季度相比较;环比是指本期统计数据与上期统计数据相比较,例如2015年第二季度与2015年第一季度相比较.根据上述信息,下列结论中正确的是( )A .2015年第三季度环比有所提高B .2016年第一季度同比有所提高C .2017年第三季度同比有所提高D .2018年第一季度环比有所提高 答案 C解析 2015年第二季度利用率为74.3%,第三季度利用率为74.0%,故2015年第三季度环比有所下降,故A 错误;2015年第一季度利用率为74.2%,2016年第一季度利用率为72.9%,故2016年第一季度同比有所下降,故B 错误;2016年第三季度利用率为73.2%,2017年第三季度利用率为76.8%,故2017年第三季度同比有所提高,故C 正确;2017年第四季度利用率为78%,2018年第一季度利用率为76.5%,故2018年第一季度环比有所下降,故D 错误.故选C .3.(2019·大庆市高三第三次教学质量检测)在某线性回归分析中,已知数据满足线性回归方程y ^=b ^x +a ^,并且由观测数据算得x -=5,y -=56,b ^=10.5,则当x =10时,预测数值y ^=( )A .108.5B .210C .140D .210.5答案 A解析 由题意得样本中心为(5,56),由于回归直线y ^=10.5x +a ^过样本中心,所以56=10.5×5+a ^,解得a ^=3.5,所以回归直线方程为y ^=10.5x +3.5.当x =10时,y ^=10.5×10+3.5=108.5.故选A .4.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.R2变大D.解释变量x与预报变量y的相关性变强答案 B解析由散点图知,去掉D(3,10)后,y与x的线性相关性加强,且为正相关,所以r变大,R2变大,残差平方和变小,故选B.5.对某两名高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如图所示的折线图.下面关于这两名同学的数学成绩的分析中,正确的个数为()①甲同学的成绩折线图具有较好的对称性,故而平均成绩为130分;②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在[110,120)内;③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关;④乙同学在这连续9次测试中的最高分与最低分的差超过40分.A.1 B.2C.3 D.4答案 C解析由折线图可得②③④正确,甲的最高分是130,平均分在[110,120)内,则①不正确,即正确的有3个,故选C.二、填空题6.(2019·焦作市高三第四次模拟)条形图给出的是2017年全年及2018年全年全国居民人均可支配收入的平均数与中位数,饼状图给出的是2018年全年全国居民人均消费及其构成,现有如下说法:①2018年全年全国居民人均可支配收入的平均数的增长率低于2017年;②2018年全年全国居民人均可支配收入的中位数约是平均数的86%;③2018年全年全国居民衣(衣着)食(食品烟酒)住(居住)行(交通通信)的支出超过人均消费的70%.则上述说法中,正确的是________.(写出所有正确说法的序号)答案①②③解析2018年全年全国居民人均可支配收入的平均数的增长率为8.7%,而2017年全年全国居民人均可支配收入的平均数的增长率为9%,故①正确;因为2433628228≈0.862,所以2018年全年全国居民人均可支配收入的中位数约是平均数的86%,故②正确;因为6.5%+28.4%+23.4%+13.5%=71.8%,2018年全年全国居民衣(衣着)食(食品烟酒)住(居住)行(交通通信)的支出超过人均消费的70%,故③正确.故正确的是①②③.7.(2019·武汉市高三4月调研)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图,请根据图中信息,求本次抽查的学生中A 类人数是________.答案 30解析 根据选择D 方式的有18人,所占比例为15%,得总人数为1815%=120,故选择A 方式的人数为120-42-30-18=30.8.甲、乙两人要竞争一次大型体育竞技比赛射击项目的参赛资格,如图是在测试中甲、乙各射靶10次的条形图,则参加比赛的最佳人选为________.答案 乙解析 甲的平均数x -1=4×0.2+5×0.1+7×0.3+8×0.1+9×0.2+10×0.1=7.0,乙的平均数x -2=5×0.1+6×0.2+7×0.4+8×0.2+9×0.1=7.0,所以x -1=x -2;甲的方差s 21=110×[(7-4)2×2+(7-5)2×1+(7-7)2×3+(7-8)2×1+(7-9)2×2+(7-10)2×1]=4,乙的方差s 22=110×[(7-5)2×1+(7-6)2×2+(7-7)2×4+(7-8)2×2+(7-9)2×1]=1.2,所以s 21>s 22,所以参加比赛的最佳人选为乙.三、解答题9.(2019·青岛市高三一模)某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取100件产品作为样本称出它们的质量(单位:毫克),质量值落在(175,225]的产品为合格品,否则为不合格品.如表是甲流水线样本频数分布表,如图是乙流水线样本的频率分布直方图.(1)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过0.15的前提下认为“产品的包装合格与否与两条自动包装流水线的选择有关”?附表:⎝ ⎭⎪参考公式:K 2=(a +b )(a +c )(b +d )(c +d ),n =a +b +c +d(2)按照以往经验,在每小时次品数超过180件时,产品的次品率会大幅度增加,为检测公司的生产能力,同时尽可能控制不合格品总量,公司工程师抽取几组一小时生产的产品数据进行次品情况检查分析,在x (单位:百件)件产品中,得到次品数量y (单位:件)的情况汇总如下表所示:按照公司的现有生产技术设备情况,判断可否安排一小时生产2000件的任务?解 (1)由乙流水线样本的频率分布直方图可知,合格品的个数为100×(1-0.04)=96,所以,2×2列联表是:所以K 2=(a +b )(a +c )(b +d )(c +d )=200×(92×4-96×8)2100×100×188×12≈1.418<2.072.所以,在犯错误的概率不超过0.15的前提下,不能认为“产品的包装合格与否与两条自动包装流水线的选择有关”.(2)由已知可得,x -=0.5+2+3.5+4+55=3; y -=2+14+24+35+405=23; ∑5i =1x i y i =0.5×2+2×14+3.5×24+4×35+5×40=453;∑5i =1x 2i =0.52+22+3.52+42+52=57.5. 由回归直线的系数公式,b ^=∑5i =1x i y i-5x -y -∑5i =1x 2i-5x -2=453-5×3×2357.5-5×32=10812.5=8.64. a ^=y --b ^x -=23-8.64×3=-2.92. 所以y ^=b ^x +a ^=8.64x -2.92.当x =20(百件)时,y =8.64×20-2.92=169.88<180,符合有关要求. 所以按照公司的现有生产技术设备情况,可以安排一小时生产2000件的任务.10.(2019·聊城市高三一模)某小学为了了解四年级学生的家庭作业用时情况,从本校四年级随机抽取了一批学生进行调查,并绘制了学生作业用时的频率分布直方图,如图所示.(1)估算这批学生的作业平均用时情况;(2)作业用时不能完全反映学生学业负担情况,这与学生自身的学习习惯有很大关系,如果用时四十分钟之内评价为优异,一个小时以上为一般,其他评价为良好.现从优异和良好的学生里面用分层抽样的方法抽取300人,其中女生有90人(优异20人).请完成列联表,并根据列联表分析能否在犯错误的概率不超过0.05的前提下认为学习习惯与性别有关系?附:K 2=n (ad (a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .。
2020年高考数学(理)二轮复习讲练测 专题12 概率与统计(测)(原卷版)
据用该组区间中点作代表,则下列说法中有误的是
A.成绩在[70,80] 分的考生人数最多
C.考生竞赛成绩的平均分约 70.5 分
B.不及格的考生人数为 1000 人 D.考生竞赛成绩的中位数为 75 分
0 „ x „ 2
11.设不等式组 0 „
y„
表示的平面区域为 D ,在区域 D 内随机取一个点,则此点到坐标原点的距离大 2
放回,直到检测出 2 件次品或者检测出 3 件正品时检测结果.
(1)求第一次检测出的是次品且第二次检测出的是正品的概率
(2)已知每检测一件产品需要费用 100 元,设 X 表示直到检测出 2 件次品或者检测出 3 件正品时所需要
的检测费用(单位:元),求 X 的分布列和均值(数学期望).
19、某教师为了分析所任教班级某次考试的成绩,将全班同学的成绩作成统计表和频率分布直方图为
二、解答题(6*12=70 分)
17.【天津市南开中学 2020 届高三模拟试题】《中国诗词大会》是央视推出的一档以“赏中华诗词,寻文化
基因,品生活之美”为宗旨的大型文化类竞赛节目,邀请全国各个年龄段、各个领域的诗词爱好者共同
参与诗词知识比拼.“百人团”由一百多位来自全国各地的选手组成,成员上至古稀老人,下至垂髫小儿, 人数按照年龄分组统计如下表:
A.9
B.10 C.12 D.13
2、设条件甲:“事件 A 与事件 B 是对立事件”,结论乙:“概率满足 P(A)+P(B)=1”,则甲是乙的( )
A.充分不必要条件 B.必要不充分条件 C.充要条件 D.既不充分也不必要条件 3、已知 x,y 的取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方程为^y=0.95x+a,则 a=( )
【精品推荐】2020版高三数学新课标大二轮专题辅导与增分攻略数学(理)课件:3-5-3 统计与统计案例、正态
面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有
井位重合或接近,便利用旧井的地质资料,不必打这口新井,以
节约勘探费用,勘探初期数据资料见下表:
井号 i
1
2
3
4
5
6
坐标(x,y)(km) (2,30) (4,40) (5,60) (6,50) (8,70) (1,y)
勘探深度(km) 2
4
5
6
(xi--x )(yi--y )=35,
i=1
i=1
1330≈36.5.
参考公式:相关系数 r=
n
xi--x yi--y
i=1
;
n
xi--x 2n
yi--y 2
i=1
i=1
n
xi--x yi--y
i=1
回归直线方程为y^=b^x+a^,其中b^=
,
n
xi--x 2
4.(2019·山东临沂一模)传承传统文化再掀热潮,央视科教频 道以诗词知识竞赛为主的《中国诗词大会》火爆荧屏,如图的茎 叶图是两位选手在个人追逐赛中的比赛得分,则下列说法正确的 是( C )
A.甲的平均数大于乙的平均数 B.甲的中位数大于乙的中位数 C.甲的方差大于乙的方差 D.甲的平均数等于乙的中位数
∴ E(Y) = - 300×0.15 + 200×0.4 + 700×0.35 + 1200×0.1 = 400(元).
以每辆单车产生利润的期望值为决策依据,故应选择 B 款车 型.
考点三 独立性检验
1.列联表 列出两个分类变量的频数表,称为列联表.假设有两个分类
变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本 频数列联表(称为 2×2 列联表)为:
2020高考数学二轮复习解题思维提升专题及答案解析 (统计知识及统计案例小题部分)
9、某工厂采用系统抽样方法,从一车间全体 名职工中抽取 名职工进行一项安全生产调查,现将 名职工从 到 进行编号,已知从 到 这 个编号中抽到的编号是 ,则在 到 中随机抽到的编号应是( )
A. B. C.6 D.7
【答案】C
【解析】
某工厂采用系统抽样方法,从一车间全体 名职工中抽取 名职工进行一项安全生产调查,∴抽样间隔为: ,现将 名职工从 到 进行编号,
5、熟记平均数,方差的计算公式及性质,理解平均数,中位数,众数,方差的实际意义;
6、能根据数据和公式求线性回归方程,把握线性回归方程的核心即一定经过样本中心点 ;
7、理解相关系数,残差等概念及相应的含义,并能正确的使用公式求解;
8、会根据数据列 列联表,掌握利用 公式进行独立性检验的方法;
【温馨小提示】
①有 的把握认为“这套眼保健操能起到预防近视的作用”;
②若某人未做该套眼保健操,那么他有 的可能近视;
③这套眼保健操预防近视的有效率为 ;
④这套眼保健操预防近视的有效率为 .
其中所 有正确结论的序号是_________.
【答案】①
【解析】根据查对临界表知 ,故有 的把握认为“这套眼保健操能起到预防近视的作用”,即①正确; 仅指“这套眼保健操能起到预防近视的作用”的可信程度,所以②③④错误.
【答案】
【解析】
由表中数据得, , ,样本中心点 一定在回归直线上, ,解得 .当 时, ,点 在回归直线下方;当 时, ,点 在回归直线上方;当 时, ,点 在回归直线下方.
A.甲、乙型号平板电脑的综合得分相同B.乙型号平板电脑的拍照功能比较好
C.在性能方面,乙型号平板电脑做得比较好D.消费者比较喜欢乙型号平板电脑的屏幕
2020版高考数学大二轮专题突破理科通用版 课件:6.3.1 统计与统计案例
s2=1010
5
∑ ni(yi-y)2
������=1
=1010[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,
s= 0.029 6=0.02× 74 ≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为
30%,17%.
-14-
企业数 2
24 53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产 值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组 中的数据用该组区间的中点值为代表).(精确到0.01)
附: 74≈8.602.
-13-
考向一 考向二 考向三 考向四
解 (1)根据产值增长率频数分布表得,所调查的 100 个企业中产值增
数列与函 数的应用, 随机变量 的分布列
概率与 分析、计 数列的 算、证明, 综合 函数思想
2019 全国 2
求某相互独立事件发 概率、独
生的概率
立事件
相互独 分析、判
立事件 断、计算
的概率
全国 3
依据已知条件求频率 分布直方图中的未知 量;求某量频率的平 均值
频率,频率 分布直方 图;平均数
样本估 计总体
6.3 统计与概率大题
年份卷 设问特点 别
全 据散点图选函数
国 模型拟合,求回归 1 方程,求预报值
2015 全 国 2
用茎叶图比较平 均值及分散程度, 求独立事件及互 斥事件的概率
涉及知识点
题目类型 解题思 想方法
整体代
散点图、回归方
2020理科数学能力提升卷 数理(答案)
式 建 立 方 程 组"求 出 公 差"即 可 求 出 通 项 公 式)
#%$求出 *)0 .的 通 项 公 式"利 用 错 位 相 减 法 求 出 :0 "再 利 用 不 等 式 的 性 质 即 可 证 明 结 论 ! 解题分析#$$设数列*(0.的公差为 7" 由(*'(>%0&可 得 &(.%0&"即(.%."
!*!答 案 !
致错误!
命题意图本题 考 查 线 性 规 划 的 应 用考 查 数 形 结
!数学理科 答"!
合的思想与运算求解能力! 解题分析作出不等式组表示的平面区域 如 图 中 阴
* 影部 分 #含 边 界$所 示"由 %)&'0%4" 可 得 点 " &%)*&'.%4 的坐标为#*",$"平 移 直 线 ,%)&&%4"易 得 目 标 函 数$%),%'&& 在 点 " 处 取 得 最 小 值$:-;% ),6 *'&6,%),"故选 !!
心素养!
解题分析根据命题的否定的定义知全称 命 题 的 否
定是特称命 题所 以 该 命 题 的 否 定 为 +%4&4 ,+ %&4'&& 4 与 %4&4 都 不 是 正 数故 选 "! 易 错 点 拨 命 题 的 否 定 和 否 命 题 是 有 区 别 的 在 解 题
&!答 案 $
#!答 案 # 命题意图本题考查充分条件与必要条件 的 判 定考 查运算求解能力!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
能力升级练(十二)统计与统计案例一、选择题1.某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体的编号是()(注:下表为随机数表的第8行和第9行)6301 6378 5916 9555 6719 9810 5071 7512 8673 5807 4439 5238 793321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279 54A.07B.25C.42D.52解析依题意得,依次选出的个体分别是12,34,29,56,07,52,因此选出的第6个个体的编号是52.答案D2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数解析刻画评估这种农作物亩产量稳定程度的指标是这组数据的标准差.答案B3.(2019云南昆明模拟)AQI(空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,从一级优(0~50);二级良(51~100);三级轻度污染(101~150);四级中度污染(151~200);1直至五级重度污染(201~300);六级严重污染(大于300).如图是昆明市2017年4月份随机抽取10天的AQI茎叶图,利用该样本估计昆明市2019年4月份空气质量优的天数为()A.3B.4C.12D.21解析从茎叶图知10天中有4天空气质量为优,所以空气质量为优的频率为,所以估计昆明市2019年4月份空气质量为优的天数为30×=12,故选C.答案C4.对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为()A.5B.7C.10D.50解析根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50.答案D5.(2019广西桂林、百色、梧州、崇左、北海五市联考)如图是2017年第一季度A,B,C,D,E五省GDP情况图,则下列陈述正确的是()2①2017年第一季度GDP总量和增速均居同一位的省只有1个;②与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长;③去年同期的GDP总量前三位是D省、B省、A省;④2016年同期A省的GDP总量也是第三位.A.①②B.②③④C.②④D.①③④解析①2017年第一季度GDP总量和增速均居同一位的省有2个,B省和C省的GDP 总量和增速分别居第一位和第四位,故①错误;由图知②正确;由图计算2016年同期五省的GDP总量,可知前三位为D省、B省、A省,故③正确;由③知2016年同期A省的GDP总量是第三位,故④正确.故选B.答案B6.某企业开展职工技能比赛,并从参赛职工中选1人参加该行业全国技能大赛.经过6轮选拔,甲、乙两人成绩突出,得分情况如茎叶图所示.若甲、乙两人的平均成绩分别是,则下列说法正确的是()A.,乙比甲成绩稳定,应该选乙参加比赛B.,甲比乙成绩稳定,应该选甲参加比赛C.,甲比乙成绩稳定,应该选甲参加比赛D.,乙比甲成绩稳定,应该选乙参加比赛解析=82,≈87,所以(100+16+9+9+16+100)≈41.67,(81+1+1+1+16+36)≈22.67,因为,所以乙成绩比甲成绩稳定,应该选乙参加比赛.37.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10D.15解析抽取号码的间隔为=30,从而区间[451,750]包含的段数为=10,则编号落入区间[451,750]的人数为10人,即做问卷B的人数为10.答案C8.(2019北京燕博园质检)某超市从2018年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下:记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为,则频率分布直方图中的a的值及的大小关系分别是()A.a=0.015,B.a=0.15,C.a=0.015,D.a=0.15,解析由(0.020+0.010+0.030+a+0.025)×10=1,得a=0.015.根据频率分布直方图,图2中的数据较稳定,则.49.某省二线城市地铁正式开工建设,地铁时代的到来能否缓解该市的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:男性市民女性市民总计认为能缓解交通拥堵483078认为不能缓解交通拥堵122032总计6050110则下列结论正确的是()附:K2=P(K2≥k0)0.050.0100.0050.001k03.8416.6357.87910.828A.在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别有关”B.在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别无关”C.在犯错误的概率不超过0.01的前提下认为“对能否缓解交通拥堵的认识与性别有关”D.在犯错误的概率不超过0.01的前提下认为“对能否缓解交通拥堵的认识与性别无关”解析由2×2列联表,可求K2的观测值k=≈5.288>3.841.由统计表P(K2≥3.841)=0.05,5∴在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别有关”.答案A二、填空题10.(2018福建泉州模拟)某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如表:x30405060y25354045根据最小二乘法求得回归方程为=0.65x+,当产量为80吨时,预计需要生产能耗为吨.解析由题意,=45,=36.25,代入=0.65x+,可得=7,∴当产量为80吨时,预计需要生产能耗为0.65×80+7=59(吨).答案5911.某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是.解析因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s2=[(0-8)2+(4-8)2+(11-8)2+(9-8)2+(16-8)2]=30.8.答案30.812.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为.解析根据系统抽样的特点,共有80个产品,抽取5个样品,则可得组距为=16,又其中有1个为28,则与之相邻的为12和44,故所取5个依次为12,28,44,60,76,即最大的为76.6答案7613.给出下列四个命题:①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;③若一组数据a,0,1,2,3的平均数为1,则其标准差为2;④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为x,其中=2,=1,=3,则=1.其中真命题有(填序号).解析在①中,由系统抽样知抽样的分段间隔为52÷4=13,故抽取的样本的编号分别为7号、20号、33号、46号,故①是假命题;在②中,数据1,2,3,3,4,5的平均数为(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,故②是真命题;在③中,因为样本的平均数为1,所以a+0+1+2+3=5,解得a=-1,故样本的方差为[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,标准差为,故③是假命题;在④中,回归直线方程为x+2,又回归直线过点(),把(1,3)代入回归直线方程+2,得=1,故④是真命题.答案②④三、解答题14.某校为了解高一学生周末的“阅读时间”,从高一年级中随机抽取了100名学生进行调查,获得了每人的周末“阅读时间”(单位:小时),按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示:7(1)求图中a的值;(2)估计该校高一学生周末“阅读时间”的中位数;(3)用样本频率代替概率.现从全校高一年级随机抽取20名学生,其中有k名学生“阅读时间”在[1,2.5)内的概率为P(X=k),其中k=0,1,2,…,20.当P(X=k)最大时,求k的值.解(1)由频率分布直方图可知,周末“阅读时间”在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,所以1-(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a+0.5a,解得a=0.30.(2)设该校高一学生周末“阅读时间”的中位数为m小时.因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5,而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m<2.5.由0.5×(m-2)=0.5-0.47,解得m=2.06.故可估计该校高一学生周末“阅读时间”的中位数为2.06小时.(3)设在取出的20名学生中,周末“阅读时间”在[1,2.5)内的有X人,则X服从二项分布,即X~B(20,0.6),所以恰好有k名学生周末“阅读时间”在[1,2.5)内的概率为P(X=k)=(0.6)k(0.4)20-k, 其中k=0,1,2, (20)设t=,k=1,2, (20)若t>1,则k<12.6,P(X=k-1)<P(X=k);若t<1,则k>12.6,P(X=k-1)>P(X=k).8又<1,所以当k=12时,P(X=k)最大.所以k的值为12.15.(2018陕西西安八校联考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产件数是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],分别加以统计,得到如图所示的频率分布直方图.25周岁以上(含25周岁)组25周岁以下组(1)根据“25周岁以上(含25周岁)组”的频率分布直方图,求25岁以上(含25周岁)组工人日平均生产件数的中位数的估计值(四舍五入保留整数);(2)规定日平均生产件数不少于80的工人为生产能手,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”.生产能手非生产能手合计25周岁以上(含25周岁)组925周岁以下组合计附:K2=.P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828解采用分层抽样,“25周岁以上(含25周岁)组”应抽取工人100×=60(名),“25周岁以下组”应抽取工人100×=40(名).(1)由“25周岁以上(含25周岁)组”的频率分布直方图可知,其中位数为70+10×=70+≈73(件).综上,25周岁以上(含25周岁)组工人日平均生产件数的中位数的估计值为73件.(2)由频率分布直方图可知,25周岁以上(含25周岁)的生产能手共有60×[(0.020 0+0.0050)×10]=15(名),25周岁以下的生产能手共有40×[(0.032 5+0.005 0)×10]=15(名),则2×2列联表如下:生产能手非生产能手合计25周岁以上(含25周岁)组15456025周岁以下组152540合计307010010K2的观测值k=≈1.786<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.11。