精品2019届高考数学二轮复习专题检测七统计与统计案例理08
【精品】备战2019高考数学(理科)大二轮复习课件:专题七概率与统计7.2

= ������ −
^
������������=43-6×4=19,故 y 关于 x 的线性回归方程为������=6x+19. (2)①当车流量为 8 万辆,即 x=8 时,������=6×8+19=67.故当车流 量为 8 万辆时,PM2.5 的浓度为 67 微克/立方米. ②根据题意得 6x+19≤100,即 x≤13.5,故要使该市某日空气 质量为优或良,应控制当天车流量在 13 万辆以内.
^ ^ ^ ∑ (������ ������ -������ )(������ ������ -������ )
������ =1 8
∑ (������ ������ -������ )
2
=
108.8 1.6
=68,
������ = ������ − ������ ������=563- 68×6.8= 100.6, 所以 y 关于 w 的线性回归方程为������=100.6+68w,因此 y 关于 x 的回归方程为������=100.6+ 68 ������ .
题型
复习策略 抓住考查 的主要题 目类型进 行训练,重 点是互斥 事件的概 率、 古典概 型、 几何概 型、 用样本 估计总体、 回归分析、 独立性检 验等.
核心归纳
仅供学习交流!!!
-22命题热点一 命题热点二 命题热点三 命题热点四 命题热点五
解: (1)由散点图可以判断 ,y=c+d ������ 适宜作为年销售量 y 关于 年宣传费 x 的回归方程类型. (2)令 w= ������ ,先建立 y 关于 w 的线性回归方程. 由于������ = i=1 8
7.2
概率、统计与统计案例
2019高考数学二轮复习 小题专项练习(十五)统计与统计案例理

小题专项练习(十五) 统计与统计案例一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.[2019·江西重点中学协作体第二次联考]九江联盛某超市为了检查货架上的奶粉是否合格,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用系统抽样方法确定所选取的5袋奶粉的编号可能是( )A.6,12,18,24,30 B.2,4,8,16,32C.2,12,23,35,48 D.7,17,27,37,472.[2019·重庆江津第二次阶段考试]设X~N(1,1)其正态分布密度曲线如图所示,那么向正方形中随机投掷10 000个点,则落入阴影部分的点的个数的估计值是( )(注:若X~N(μ,σ2),则P(μ-σ<X<μ+σ)=68.26%,P(μ-2σ<X<μ+2σ)=95.44%)A.7 539 B.6 038 C.7 028 D.6 5873.[2019·山东烟台高三适应性练习]下图是8位同学400米测试成绩的茎叶图(单位:秒),则( )A.平均数为64 B.众数为77C.极差为17 D.中位数为64.54则常数q的值为(A.1 ±-+5.[2019·河北南宫市月考]已知随机变量X的分布列如下表,则随机变量(2X+3)的方差D(2X +3)为( )A.-6.[2019·华中师范大学附属中学模拟]从某企业生产的某种产品中抽取若干件,经测量得这些产品的一项质量指标值Z服从正态分布N(200,150),某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,则E(X)等于( )(附:≈12.2.若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4.)A.34.13 B.31.74C.68.26 D.95.447.[2019·全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半8.[2019·福建适应性练习]出土青铜器表面的有害氯化物通常采用化学溶液洗涤结合物理超声波技术进行清除.有害氯化物残存量受超声波频率的影响,某文物保护单位采集28例青铜器表面有害氯化物处理案例中,超声波频率及对应有害氯化物残存量数据,绘制散点图(如图所示),根据该图数据,下列判断正确的是( )A.超声波频率的最大值等于25B.氯化物残存量的极差大于20C.氯化物残存量的中位数为15D.氯化物残存量与超声波频率成正相关关系9.[2019·高考预测卷]已知变量x与y之间存在几组对照数据如下表所示,由对照数)A.14 B.D.1210.[2019·台州中学模拟]已知某8个数的期望为5,方差为3,现又加入一个新数据5,此时这9个数的期望记为E(X),方差记为D(X),则( )A.E(X)=5,D(X)>3 B.E(X)=5,D(X)<3C.E(X)<5,D(X)>3 D.E(X)<5,D(X)<311.[2019·内蒙古北重三中第九次调研]某校高一年级进行研究性学习,得出五个百货商场今年6月份的销售情况统计图,如图,下列陈述正确的是( )①这五个商场中销售额与去年同期相比增长率排序居同一位的只有1个;②与去年6月份相比,这五个商场的销售额均在增长;③与去年6月份相比,A的增长率最大,所以A的销售额增量也最大;④去年6月份C比D的销售额大.A.①②B.①②④ C.②③④D.①③④12.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,由K2附:A.B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”二、填空题:本大题共4小题,每小题5分,共20分,把答案填在题中的横线上.13.[2019·江苏卷]已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.14.[2019·内蒙古赤峰统考]某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1:3:7:6:3,那么成绩在[16,18]的学生人数是.15.[2019·广东东莞市冲刺演练]已知样本x1,x2,x3,…,方差s2=2,则样本2x1+1,2x2+1,2x3+1,…,2+1的方差为.16.[2019·江苏沭阳月考]甲、乙两队进行一场排球比赛,根据以往经验,单局比赛甲队胜乙队的概率为0.5,本场比赛采用五局三胜制,即先胜三局的队获胜,比赛结束,设各局比赛相互之间没有影响,用ξ表示本场比赛的局数,则ξ的数学期望为.。
2019高考数学二轮复习专题七概率与统计2.7.3正态分布、统计与统计案例课件理

2.正态分布 X~N(μ,σ2)的三个常用数据 (1)P(μ-σ<X≤μ+σ)=0.6826; (2)P(μ-2σ<X≤μ+2σ)=0.9544; (3)P(μ-3σ<X≤μ+3σ)=0.9974.
[解题指导]
[解]
(1)抽取的一个零件的尺寸在(μ-3σ, μ+3σ)之内的概率
为 0.9974, 从而零件的尺寸在(μ-3σ, μ+3σ)之外的概率为 0.0026, 故 X~B(16,0.0026). 因此 P(X≥1)=1-P(X=0)=1-0.997416≈0.0408. X 的数学期望为 E(X)=16×0.0026=0.0416.
[对点训练]
2 1.(2018· 兰州检测)设 X~N(μ1,σ2 1),Y~N(μ2,σ2),这两个
正态分布密度曲线如图所示,下列结论中正确的是(
)
A. P(Y≥μ2)≥P(Y≥μ1) B.P(X≤σ2)≤P(X≤σ1) C.对任意正数 t,P(X≥t)≥P(Y≥t) D.对任意正数 t,P(X≤t)≥P(Y≤t)
3.方差公式 1 - - - s = [(x1- x )2+(x2- x )2+…+(xn- x )2] n
2
[对点训练] 1.(2018· 安徽皖南八校联考)某校为了解 1000 名高一新生的 健康状况, 用系统抽样法(按等距的规则)抽取 40 名同学进行检查, 将学生从 1~1000 进行编号,现已知第 18 组抽取的号码为 443, 则第一组用简单随机抽样抽取的号码为( A.16 B.17 C.18 D.19 )
[答案]
C
2. 某校组织了“2017 年第 15 届希望杯数学竞赛(第一试)”, 已知此次选拔赛的数学成绩 X 服从正态分布 N(72,121)(单位: 分), 此次考生共有 500 人,估计数学成绩在 72 分到 83 分之间的人数 约为(参数数据:P(μ-σ<X<μ+σ)=0.6826,P(μ-2σ<X<μ+2σ)= 0.9544.)( A.238 ) B.170 C.340 D.477
高考数学二轮复习 统计与统计案例专题训练(含解析)

【状元之路】2015版高考数学二轮复习 统计与统计案例专题训练(含解析)一、选择题1.(2014·四川卷)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A .总体B .个体C .样本的容量D .从总体中抽取的一个样本解析 由题目条件知5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.答案 A2.(2014·重庆卷)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250解析 由分层抽样的特点可知703 500=n3 500+1 500,解之得n =100. 答案 A3.(2014·广东卷)为了解 1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20解析 由系统抽样的定义知,分段间隔为1 00040=25.故答案为C .答案 C4.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生人数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,84D .2.7,83解析 前4组的频数成等比数列,由图知:第一组的频率是0.01,故第一组有1名学生;第二组的频率为0.03,故第二组有3名;所以第三组有9名,第四组有27名.所以后6组共87名学生,设最后一组人数为x ,则27+x 2×6=87,解得x =2,故公差d =2-275=-5,所以a =27100=0.27,倒数第二组人数为7,则b =87-2-7=78.故选A .答案 A5.对于下列表格所示的五个散点,已知求得的线性回归直线方程为y ^=0.8x -155.x 196 197 200 203 204 y1367m则实数m 的值为( A .8 B .8.2 C .8.4D .8.5解析 本题主要考查统计的相关知识,意在考查考生的运算求解能力.依题意得x -=15(196+197+200+203+204)=200,y -=15(1+3+6+7+m)=17+m 5,回归直线必经过样本中心点(x -,y -),于是有17+m5=0.8×200-155,由此解得m =8,选A .答案 A6.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=n ad -bc 2a +bc +d a +cb +d算得,K 2=110×40×30-20×20260×50×60×50≈7.8.附表:P(K 2≥k)0.050 0.010 0.001 k3.8416.63510.828A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”解析 根据独立性检验的思想方法,正确选项为C . 答案 C 二、填空题7.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为________.解析 根据系统抽样的特点,共有80个产品,抽取5个样品,则可得组距为805=16,又其中有1个为28,则与之相邻的为12和44,故所取5个依次为12,28,44,60,76,即最大的为76.答案 768.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生人数是________.解析 因为(0.002+0.006+0.012)×10×200=40,40x =2003 000,所以x =600.故在该次数学考试中成绩小于60分的学生人数是600.答案 600 9.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.(1)若第1组抽出的号码为2,则所有被抽出职工的号码为________;(2)分别统计这5名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,则该样本的方差为________.解析 (1)由题意知被抽出职工的号码为2,10,18,26,34. (2)由茎叶图知5名职工体重的平均数x -=59+62+70+73+815=69,则该样本的方差s 2=15[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.答案 (1)2,10,18,26,34 (2)62 三、解答题10.(2014·课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部分评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.11.(2014·课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解 (1)(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100. 质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.B级——能力提高组1.(2014·郑州一模)PM2.5是指大气中直径小于或等于 2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )A.甲B.乙C.甲、乙相等D.无法确定解析从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.答案A2.(理)(2014·贵州六校联考)某校学习小组开展“学生语文成绩与外语成绩的关系”的课题研究,对该校高二年级800名学生上学期期末语文和外语成绩,按优秀和不优秀分类得结果:语文和外语都优秀的有60人,语文成绩优秀但外语不优秀的有140人,外语成绩优秀但语文不优秀的有100人.(1)能否在犯错概率不超过0.001的前提下认为该校学生的语文成绩与外语成绩有关系?(2)将上述调查所得的频率视为概率,从该校高二年级学生成绩中,有放回地随机抽取3名学生的成绩,记抽取的3个成绩中语文、外语两科成绩至少有一科优秀的个数为X,求X的分布列和期望E(X).解 (1)由题意得列联表:语文优秀 语文不优秀总计 外语优秀 60 100 160 外语不优秀140 500 640 总计200600800因为K 2=800×60×500-100×1402160×640×200×600≈16.667>10.828,所以能在犯错概率不超过0.001的前提下认为该校学生的语文成绩与外语成绩有关系. (2)由已知数据,语文、外语两科成绩至少一科为优秀的频率是38.则X ~B ⎝ ⎛⎭⎪⎫3,38, P(X =k)=C k 3⎝ ⎛⎭⎪⎫38k ⎝ ⎛⎭⎪⎫583-k,k =0,1,2,3.X 的分布列为X 0 1 2 3 P12551222551213551227512E(X)=3×38=98.2.(文)(2014·东北三校联考)某城市随机抽取一年(365天)内100天的空气质量指数API 的监测数据,结果统计如下:API[0,50] (50,100] (100,150] (150,200] (200,250] (250,300] >300 空气质量 优 良 轻微污染 轻度污染 中度污染中重度污染重度污染 天数413183091115式为S =⎩⎪⎨⎪⎧0,0≤w≤100,4w -400,100<w≤300,2 000,w>300,试估计在本年度内随机抽取一天,该天经济损失S 大于200元且不超过600元的概率;(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染.完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关?附:P(K2≥k0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828由200<S≤600,得150<w≤250,频数为39,所以P(A)=39100.(2)根据以上数据得到如下列联表:非重度污染重度污染合计供暖季22 8 30非供暖季63 7 70合计85 15 100K2的观测值为285×15×30×70≈4.575>3.841.所以有95%的把握认为空气重度污染与供暖有关.。
数学高考复习统计与统计案例专题训练(含答案)

数学2019年高考复习统计与统计案例专题训练(含答案)统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。
以下是数学2019年高考复习统计与统计案例专题训练,请考生掌握。
一、选择题1.(2019山西省重点中学第三次四校联考)已知x、y的取值如下表所示:x 0 1 3 4 y 0.9 1.9 3.2 4.4 从散点图分析,y与x线性相关,且=0.8x+a,则a=()A.0.8B.1C.1.2D.1.5[答案] B[解析] ==2,==2.6,又因为回归直线=0.8x+a过样本中心点(2,2.6)所以2.6=0.82+a,解得a=1.2.(文)(2019豫东、豫北十所名校联考)某厂生产A、B、C三种型号的产品,产品数量之比为32∶4,现用分层抽样的方法抽取一个样本容量为180的样本,则样本中B型号的产品的数量为()A.20B.40C.60D.80[答案] B[解析] 由分层抽样的定义知,B型号产品应抽取180=40件.(理)(2019济南模拟)某全日制大学共有学生5600人,其中专科生有1300人,本科生有3000人,研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取()A.65人,150人,65人B.30人,150人,100人C.93人,94人,93人D.80人,120人,80人[答案] A[解析] =,1300=65,3000=150,故选A.3.(文)(2019新乡、许昌、平顶山二调)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{an}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100B.120C.150D. 200[答案] A[解析] 设公差为d,则a1+d=2a1,a1=d,d+2d+3d+4d+5d=1,d=,面积最大的一组的频率等于5=.小长方形面积最大的一组的频数为300=100.(理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:[0,10),[10,20),[20,30),[30,40),[40,50),[50,60].将日均收看该类体育节目时间不低于40分钟的观众称为体育迷,则图中x的值为()A.0.01B.0.02C.0.03D.0.04[答案] A[解析] 由题设可知(0.005+x+0.012+0.02+0.025+0.028)10=1,解得x=0.01,选A.4.(2019东北三校二模)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A、B两样本的下列数字特征对应相同的是()A.平均数B.标准差C.众数D.中位数[答案] B[解析] 因为A组数据为:42,43,46,52,42,50B组数据为:37,38,41,47,37,45.可知平均数、众数、中位数都发生了变化,比原来A组数据对应量都减小了5,但标准差不发生变化,故选B.5.(2019石家庄质检)等差数列x1,x2,x3,,x9的公差为1,若以上述数据x1,x2,x3,,x9为样本,则此样本的方差为()A. B. C.60 D.30[答案] A[解析] 令等差数列为1,2,39,则样本的平均值=5,S2=[(1-5)2+(2-5)2++(9-5)2]==.6.(文)(2019郑州市第二次质检)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元) 4 5 6 7 8 9 销量y(件) 90 84 83 80 75 68 由表中数据,求得线性回归方程为=-4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为()A. B. C. D.[答案] B[解析] ==,==80,回归直线过点(,80),a=106,=-4x+106,点(5,84),(9,68)在回归直线左下方,故所求概率P==.(理)(2019河北衡水中学二调)关于统计数据的分析,有以下几个结论,其中正确的个数为()利用残差进行回归分析时,若残差点比较均匀地落在宽度较窄的水平带状区域内,则说明线性回归模型的拟合精度较高;将一组数据中的每个数据都减去同一个数后,期望与方差均没有变化;调查剧院中观众观后感时,从50排(每排人数相同)中任意抽取一排的人进行调查是分层抽样法;已知随机变量X服从正态分布N(3,1),且P(24)=0.682 6,则P(X4)等于0.158 7某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为15人.A.2B.3C.4D.5[答案] A[解析] 正确,错误,设样本容量为n,则=,n=30,故错.二、填空题7.(2019吉林九校联合体二模)将某班的60名学生编号为:01,02,,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.[答案] 16,28,40,52[解析] 依据系统抽样方法的定义得知,将这60名学生依次按编号每12人作为一组,即01~12、13~24、、49~60,当第一组抽得的号码是04时,剩下的四个号码依次是16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码).8.(2019龙岩模拟)10名工人某天生产同一零件,生产的件数分别是10,12,14,14,14,15,15,16,16,17,设这10个数的中位数为a,众数为b,则a-b=________.[答案] 0.5[解析] 从数据中可以看出,众数b=14,且中位数a==14.5,a-b=14.5-14=0.5.9.(2019烟台质检)为了解某校高三学生身体状况,用分层抽样的方法抽取部分男生和女生的体重,将男生体重数据整理后,画出了频率分布直方图,已知图中从左到右前三个小组频率之比为123,第二小组频数为12,若全校男、女生比例为32,则全校抽取学生数为________.[答案] 80[解析] 第四小组和第五小组的频率之和是5(0.0125+0.0375)=0.25,故前三个小组的频率之和是0.75,则第二小组的频率是0.25,则抽取的男生人数是120.25=48人,抽取的女生人数是48=32人,全校共抽取80人.三、解答题10.(文)(2019东北三省三校二模)某个团购网站为了更好地满足消费者需求,对在其网站发布的团购产品展开了用户调查,每个用户在使用了团购产品后可以对该产品进行打分,最高分是10分.上个月该网站共卖出了100份团购产品,所有用户打分的平均分作为该产品的参考分值,将这些产品按照得分分成以下几组:第一组[0,2),第二组[2,4),第三组[4,6),第四组[6,8),第五组[8,10],得到的频率分布直方图如图所示.(1)分别求第三,四,五组的频率;(2)该网站在得分较高的第三,四,五组中用分层抽样的方法抽取了6个产品作为下个月团购的特惠产品,某人决定在这6个产品中随机抽取2个购买,求他抽到的两个产品均来自第三组的概率.[解析] (1)第三组的频率是0.1502=0.3;第四组的频率是0.1002=0.2;第五组的频率是0.0502=0.1(2)设抽到的两个产品均来自第三组为事件A,由题意可知,从第三、四、五组中分别抽取3个,2个,1个.不妨设第三组抽到的是A1,A2,A3;第四组抽到的是B1,B2;第五组抽到的是C1,所含基本事件总数为:{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,B2},{A1,C1},{A2,B1},{A2,B2},{A2,C1},{A3,B1},{A3,B2},{A3,C1},{B1,B2},{B1,C1},{B2,C1}所以P(A)==.(理)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲 82 81 79 78 95 88 93 84 乙 92 95 80 75 83 80 90 85(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由;(3)若将频率视为概率,对甲同学在今后的3次数学竞赛成绩进行预测,记这3次成绩中高于80分的次数为,求的分布列及数学期望E().[解析] (1)作出茎叶图如下:(2)派甲参赛比较合适,理由如下:甲=(702+804+902+8+9+1+2+4+8+3+5)=85乙=(701+804+903+5+0+0+3+5+0+2+5)=85.S=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88 -85)2+(93-85)2+(95-85)2]=35.5S=[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90 -85)2+(92-85)2+(95-85)2]=41甲=乙,SP1,派乙参赛比较合适.(3)记甲同学在一次数学竞赛中成绩高于80分为事件A,则P(A)==,随机变量的分布列为0 1 2 3 P E()=0+1+2+3=.(或E()=np=3=)数学2019年高考复习统计与统计案例专题训练及答案解析的全部内容就是这些,查字典数学网希望考生可以取得优异的成绩。
(通用版)2019版高考数学二轮复习 专题跟踪检测(十六)统计、统计案例 理(重点生,含解析)

专题跟踪检测(十六)统计、统计案例1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A.3 B.4C.5 D.6解析:选B 由系统抽样可知,35人分为7组,每组5人,最后一组成绩均大于151,前两组成绩均小于139,故成绩在区间[139,151]上的运动员人数为4.2.“双色球"彩票中红色球的号码由编号为01,02,…,33的33个个体组成,一位彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为()49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 8426 34 91 6457 24 55 06 88 77 04 74 47 67 21 76 33 50 25 8392 12 06 76A。
23 B.09C.02 D.17解析:选C 从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02。
故选C.3.(2018·昆明调研)下图是1951~2016年我国年平均气温变化图.根据上图,判断下列结论正确的是( )A.1951年以来,我国年平均气温逐年增高B.1951年以来,我国年平均气温在2016年再创新高C.2000年以来,我国年平均气温都高于1981~2010年的平均值D.2000年以来,我国年平均气温的平均值高于1981~2010年的平均值解析:选D 由1951~2016年我国年平均气温变化图可以看出,年平均气温有升高的也有降低的,所以选项A不正确;2016年的年平均气温不是最高的,所以选项B不正确;2012年的年平均气温低于1981~2010年的平均值,所以选项C不正确;2000年以来,只有2012年的年平均气温低于1981~2010年的平均值,所以2000年以来,我国年平均气温的平均值高于1981~2010年的平均值,故选项D正确,故选 D.4.(2018·惠州模拟)某商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x/℃171382月销售量y/件24334055由表中数据算出线性回归方程错误!=错误!x+错误!中的错误!=-2,气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣销售量约为()A.46件B.40件C.38件D.58件解析:选 A 由题中数据,得x=10,y=38,回归直线错误!=错误!x+错误!过点(错误!,错误!),且错误!=-2,代入得错误!=58,则回归方程错误!=-2x+58,所以当x=6时,y=46,故选A。
2019年高考数学大二轮专题复习与测试课件:1.7.3统计与统计案例

1 解析: 由茎叶图知,最低分为 87 分,最高分为 99 分,依题意得5×(87+ 1 93+90+9×10+z+91)=91,解得 x=4.则剩余 5 个得分的方差 s = ×[(87-91)2 5
2
1 +(93-91) +(90-91) +(94-91) +(91-91) ]=5×(16+4+1+9)=6.故选 C.
n
∧ ∧ ∧ ∧
方程y =bx+a称为线性回归方程,其中b= y )称为样本中心点. 2.随机变量 2 a + b + c + d ad - bc K2(χ2)= , a+bc+da+cb+d
i=1
xiyi-n x y
n
∧
∧
2 2 x - n x i i=1
,a= y -b x ;( x ,
题型一
题型一 用样本估计总体 1.频率分布直方图的三个结论 频率 (1)小长方形的面积=组距× =频率; 组距 (2)各小长方形的面积之和等于 1; 频率 (3)小长方形的高= . 组距
2.统计中的四个数字特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数 据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即 1 x =n(x1+x2+…+xn).
若 K2(χ2)>3.841,则有 95%的把握说两个事件有关; 若 K2(χ2)>6.635,则有 99%的把握说两个事件有关.
(2018· 全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了 完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取 40 名 工人,将他们随机分成两组,每组 20 人.第一组工人用第一种生产方式,第二组 工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如 下茎叶图:
2019年高考数学(理)二轮复习专题突破课件:7.3统计与统计案例

[例 1] (1)[2018· 全国卷Ⅲ]某公司有大量客户,且不同年龄段 客户对其服务的评价有较大差异.为了解客户的评价,该公司准备 进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和 系统抽样,则最合适的抽样方法是________.
[解析] 因为客户数量大,且不同年龄段客户对其服务的评价 有较大差异,所以最合适的抽样方法是分层抽样. [答案] 分层抽样
(2)[2018· 南昌市摸底调研考试]某校高三(2)班现有 64 名学生, 随机编号为 0,1,2,„,63,依编号顺序平均分成 8 组,组号依次为 1,2,3,„,8.现用系统抽样方法抽取一个容量为 8 的样本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为________.
1.[2017· 江苏卷]某工厂生产甲、乙、丙、丁四种不同型号的 产品,产量分别为 200,400,300,100 件.为检验产品的质量,现用分 层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙 种型号的产品中抽取________件.
样本容量 60 3 解析:∵ = = , 总体个数 200+400+300+100 50 3 ∴ 应从丙种型号的产品中抽取50×300=18(件). 答案:18
64 [解析] 由题知分组间隔为 8 =8, 又第 1 组中抽取的号码为 5, 所以第 6 组中抽取的号码为 5×8+5=45. [答案] 45
技法领悟 (1)随机抽样各种方法中,每个个体被抽到的概率都是相等的; (2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同; (3)分层抽样满足: 各层抽取的比例都等于样本容量在总体容量 中的比例.
2019届高考数学二轮专题复习精品资料专题五 第1讲 统计与统计案例

第1讲统计与统计案例1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点.1.抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ).(4)方差与标准差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 3.直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^=b ^x +a ^经过样本点的中心点(x ,y ),若x 取某一个值代入回归直线方程y ^=b ^x +a ^中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:则K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d为样本容量).型更合适,并用此模型预测A超市广告费支出为8万元时的销售额.参数数据及公式:x=8,y=42,∑7i=1x i y i=2 794,∑7i=1x2i=708,(1)解析∵k≈3.918>3.841,且P(K2≥k0=3.841)=0.05,根据独立性检验思想“这种血清能起到预防感冒的作用”出错的可能性不超过5%.答案 B(2)解①∵x=8,y=42,∑7i=1x i y i=2 794,∑7i=1x2i=708.因此a^=y-b^x=42-1.7×8=28.4.所以,y关于x的线性回归方程是y^=1.7x+28.4.②∵0.75<0.97,∴对数回归模型更合适.当x=8时,y^=12ln 8+22=36ln 2+22=36×0.7+22=47.2万元.∴广告费支出8万元时,预测A超市销售额为47.2万元.1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg) 分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是() A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数2.(2018·全国I 卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是() A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半3.(2018·全国III 卷))某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.4.7.(2018·全国II 卷)下图是某地区2000年至2016年环境基础设施投资额 (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了 与时间变量 的两个线性回归模型.根据2000年至2016年的数据(时间变量 的值依次为 )建立模型①: . . ;根据2010年至2016经典常规题(45分钟)年的数据(时间变量 的值依次为 )建立模型②: . . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.1.(2018·内江期末)为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查, 若60~70岁这个年龄段中抽查了8人,那么x 为() A .64B .96C .144D .1602.(2017·全国Ⅲ卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是() A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 3.(2017·泉州模拟)某厂在生产甲产品的过程中,产量x (吨)与生产能耗y (吨)的对应数据如表:根据最小二乘法求得回归方程为y ^=0.65x +a ,当产量为80吨时,预计需要生产能耗为________吨. 4.(2018·全国I 卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表高频易错题使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)1.(2017·汉中模拟)已知两个随机变量x ,y 之间的相关关系如表所示:根据上述数据得到的回归方程为y =b x +a ,则大致可以判断() A .a ^>0,b ^>0B .a ^>0,b ^<0C .a ^<0,b ^>0D .a ^<0,b ^<02.(2018·衡水中学)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据表中的全部数据,用最小二乘法得出y 与x 的线性回归方程为. . ,则表中m 的值为( ) A .45B .50C .55D .703.为了研究雾霾天气的治理情况,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y ,z ,依次构成等差数列,且4,y ,z +4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为________.4.(2017·赤峰二模)微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”?精准预测题参考答案1.【解题思路】刻画评估这种农作物亩产量稳定程度的指标是标准差. 【答案】B2.【解题思路】首先设出新农村建设前的经济收入为M ,根据题意,得到新农村建设后的经济收入为2M , 之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【答案】设新农村建设前的收入为M ,而新农村建设后的收入为2M ,则新农村建设前种植收入为0.6M ,而新农村建设后的种植收入为0.74M ,所以种植收入增加了, 所以A 项不正确;新农村建设前其他收入我0.04M ,新农村建设后其他收入为0.1M ,故增加了一倍以上,所以B 项正确; 新农村建设前,养殖收入为0.3M ,新农村建设后为0.6M ,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的 ,所以超过了经济收入的一半,所以D 正确; 故选A .3.【解题思路】由题可知满足分层抽样特点【答案】由于从不同龄段客户中抽取,故采用分层抽样,故答案为分层抽样.4.【解题思路】(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果, (2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.【答案】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 =–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为 =99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(i )从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =–30.4+13.5t 上下, 这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势. 2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的 附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型 =99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.经典常规题(ii )从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. 以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点 求参数.1.【解题思路】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为, 因为共抽出30人,所以总人数为 人,即可求出20~30岁年龄段的人数. 【答案】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为, 因为共抽出30人,所以总人数为 人,所以,20~30岁龄段的人有 ,故选D .2.【解题思路】由题图可知,2014年8月到9月的月接待游客量在减少,则A 选项错误. 【答案】A3.【解题思路】由回归直线方程过样本点中心可得a ^.【答案】由题意,x =45,y =36.25,代入y ^=0.65x +a ^,可得a ^=7,∴当产量为80吨时,预计需要生产能耗为0.65×80+7=59.故填 59.4.【解题思路】(1)根据题中所给的使用了节水龙头50天的日用水量频数分布表,算出落在相应区间上的频率,借助于直方图中长方形的面积表示的就是落在相应区间上的频率,从而确定出对应矩形的高,从而得到直方图; (2)结合直方图,算出日用水量小于0.35的矩形的面积总和,即为所求的频率;(3)根据组中值乘以相应的频率作和求得50天日用水量的平均值,作差乘以365天得到一年能节约用水多少 ,从而求得结果. 【答案】(1)高频易错题(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m 3的频率为 0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为. . . . . . . . . 该家庭使用了节水龙头后50天日用水量的平均数为. . . . . . . . 估计使用节水龙头后,一年可节省水 . . . .1.【解题思路】作出散点图,画出回归直线直观判定b ^>0,a ^<0. 【答案】C2.【解题思路】根据回归直线经过样本平均数点,可求得m 的值. 【答案】由表可知,,,因为回归直线会经过平均数样本中心点,代入. . ,解得 ,所以选D .3.【解题思路】根据等差数列和等比数列的定义列方程组解出y ,z .精准预测题【答案】由题意可得⎩⎪⎨⎪⎧2y =4+z ,y 2=4(z +4),即⎩⎪⎨⎪⎧y =2+z 2,y 2=4z +16,解得z =12或z =-4(舍去),故y =8.所以甲、乙、丙三组城市的个数分别为4,8,12. 因为一共要抽取6个城市,所以抽样比为64+8+12=14.故乙组城市应抽取的个数为8×14=2.故填 2.4.【解题思路】(1)取每组的中间值n x 代表这组,平均数1122n n x p x p x p =++⋅⋅⋅+;(2)根据题意列出2×2列联表,并计算K 2.【答案】解 (1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76 (小时).(2)由已知得:2(0.04+a +0.14+2×0.12)=1,解得a =0.08. 由题设条件得列联表∴K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100(38×20-30×12)50×50×68×32≈2.941>2.706.所以有90%的把握认为“微信控”与“性别”有关.。
2019年高考数学二轮复习 专题训练七 第3讲 统计与统计案例 理

2019年高考数学二轮复习 专题训练七 第3讲 统计与统计案例 理考情解读 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.1.随机抽样(1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.(3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.2.常用的统计图表 (1)频率分布直方图①小长方形的面积=组距×频率组距=频率;②各小长方形的面积之和等于1;③小长方形的高=频率组距,所有小长方形的高的和为1组距.(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数(2)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差:s =1n[x 1-x 2+x 2-x2+…+x n -x2].4.变量的相关性与最小二乘法(1)相关关系的概念、正相关和负相关、相关系数.(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1n(y i-a -bx i )2最小时,得到线性回归方程y ^=b ^x +a ^的方法叫做最小二乘法.5.独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +dn则K 2(χ2)=n ad -bc 2a +bc +d a +cb +d(其中n =a +b +c +d 为样本容量).热点一 抽样方法例1 (1)(xx·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14(2)(xx·石家庄高三调研)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________. 思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例. 答案 (1)B (2)200解析 (1)由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. (2)本题属于分层抽样,设该学校的教师人数为x ,所以1603 200=160-150x,所以x =200. 思维升华 (1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为()A.15 B.16 C.17 D.18(2)(xx·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20 B.100,20C.200,10 D.100,10答案(1)C(2)A解析(1)由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,故共抽取高二学生人数为33-16=17,故选C.(2)该地区中、小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A.热点二用样本估计总体例2(1)(xx·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8 C.12 D.18(2)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是()A.甲B.乙C.甲乙相等D.无法确定甲乙20.041236930.0596210.06293310.079640.08770.09246思维启迪(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;(2)直接根据公式计算方差.答案(1)C(2)A解析(1)志愿者的总人数为200.16+0.24×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.(2)x甲=(0.042+0.053+0.059+0.061+0.062+0.066+0.071+0.073+0.073+0.084+0.086+0.097)÷12≈0.068 9,x乙=(0.041+0.042+0.043+0.046+0.059+0.062+0.069+0.079+0.087+0.092+0.094+0.096)÷12≈0.067 5,s2=112[(0.042-0.068 9)2+(0.053-0.068 9)2+…+(0.097-0.068 9)2]≈0.000 212.s2=112[(0.041-0.067 5)2+(0.042-0.067 5)2+…+(0.096-0.067 5)2]≈0.000 429.所以甲、乙两地浓度的方差较小的是甲地.思维升华(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.(2)(xx·陕西)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4D .1,4+a答案 (1)10 (2)A解析 (1)由频率分布直方图可知: 0.100.40=2.5x,所以x =10. (2)x 1+x 2+…+x 1010=1,y i =x i +a ,所以y 1,y 2,…,y 10的均值为1+a ,方差不变仍为4. 故选A.热点三 统计案例例3 (1)以下是某年2月某地区搜集到的新房屋的销售价格y 和房屋的面积x 的数据.房屋面积x /m 2 115 110 80 135 105 销售价格y /万元24.821.618.429.222根据上表可得线性回归方程y ^=b ^x +a ^中的b ^=0.196 2,则面积为150 m 2的房屋的销售价格约为________万元.(2)(xx·江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1成绩 性别不及格 及格 总计 男 6 14 20 女102232总计 16 36 52表2视力 性别好 差 总计 男 4 16 20 女 12 20 32 总计16 3652表3智商 性别偏高 正常 总计 男 8 12 20 女 8 24 32 总计163652表4阅读量 性别丰富 不丰富 总计 男 14 6 20 女 2 30 32 总计163652A.成绩 B .视力 C .智商 D .阅读量思维启迪 (1)回归直线过样本点中心(x ,y ); (2)根据列联表,计算K 2的值 答案 (1)31.244 2 (2)D解析 (1)由表格可知x =15(115+110+80+135+105)=109,y =15(24.8+21.6+18.4+29.2+22)=23.2.所以a ^=y -b ^x =23.2-0.196 2×109=1.814 2. 所以所求线性回归方程为y ^=0.196 2x +1.814 2.故当x =150时,销售价格的估计值为y ^=0.196 2×150+1.814 2=31.244 2(万元).(2)A 中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×6×22-14×10220×32×16×36=131 440.B 中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×4×20-16×12220×32×16×36=637360. C 中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×8×24-12×8220×32×16×36=1310. D 中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×14×30-6×2220×32×16×36=3 757160. ∵131 440<1310<637360<3 757160, ∴与性别有关联的可能性最大的变量是阅读量.思维升华 (1)线性回归方程求解的关键在于准确求出样本点中心.回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解;(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K 2(χ2)计算公式求其值,根据K 2(χ2)取值范围求解即可. (1)已知x 、y 取值如下表:x 0 1 4 5 6 8 y1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且y ^=0.95x +a ^,则a ^等于( ) A .1.30 B .1.45 C .1.65 D .1.80(2)某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了20人,若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”,“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”.得以下2×2列联表:高个 非高个 总计 大脚 5 2 7 非大脚 1 12 13 总计61420则在犯错误的概率不超过 (附:P (K 2>k ) 0.05 0.01 0.001 k3.8416.63510.828)答案 (1)B (2)0.01解析 (1)依题意得,x =16×(0+1+4+5+6+8)=4,y =16(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;又直线y ^=0.95x +a ^必过样本点中心(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ^,由此解得a ^=1.45. (2)由题意得 K 2=20×5×12-1×226×14×7×13≈8.802>6.635.而K 2>6.635的概率约为0.01,所以在犯错误的概率不超过0.01的前提下认为人的脚的大小与身高之间有关系.1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重要的特征是“等距”,分层抽样,最重要的是各层的“比例”. 2.用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1. (2)众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布. ①总体期望的估计,计算样本平均值x =1n ∑n i =1x i .②总体方差(标准差)的估计:方差=1n ∑ni =1 (x i -x )2,标准差=方差,方差(标准差)较小者较稳定.3.线性回归方程y ^=b ^x +a ^过样本点中心(x ,y ),这为求线性回归方程带来很多方便. 4.独立性检验(1)作出2×2列联表.(2)计算随机变量K 2(χ2)的值.(3)查临界值,检验作答.真题感悟1.(xx·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案 24解析 底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.2.(xx·重庆)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B 中的线性回归方程进行检验,可以排除B ,故选A. 押题精练1.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h 以下的汽车有________辆.答案 20解析 时速在70 km/h 以下的汽车所占的频率为0.01×10+0.03×10=0.4,共有0.4×50=20(辆). 2.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600名学生对在此期间购买教辅资料的情况进行调研,得到如下数据:购买图书情况只买试题类只买讲解类试题类和讲解类都买人数240200160若该教育出版社计划用分层抽样的方法从这600人中随机抽取60人进行座谈,则只买试题类的学生应抽取的人数为________. 答案 24解析 只买试题类的学生应抽取的人数为60×240600=24.3.下表提供了某厂节能减排技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:x 3 4 5 6 y2.5t44.5根据上表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,那么表中t 的值为________. 答案 3解析 ∵样本点中心为⎝⎛⎭⎫4.5,11+t 4,∴11+t 4=0.7×4.5+0.35,解得t =3.4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男 45 10 女3015附:P (K 2≥k 0) 0.10 0.05 0.025 k 02.7063.8415.024K 2=n ad -bc 2a +bc +d a +cb +d参照附表,得到的正确结论是( )A .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 答案 C解析 由公式可计算K 2的观测值k =n ad -bc 2a +bc +d a +cb +d=100×45×15-30×10255×45×75×25≈3.03>2.706,所以有90%以上的把握认为“该市民能否做到‘光盘’与性别有关”,故选C.(推荐时间:40分钟)一、选择题1.(xx·湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则() A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D解析由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.2.某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200人的样本,则高中二年级被抽取的人数为()A.28 B.32C.40 D.64答案D解析由已知,得样本容量为400+320+280=1 000,所以,高中二年级被抽取的人数为2001 000×320=64,选D.3.(xx·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08C.02 D.01答案D解析从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.4.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是( )A .240B .280C .320D .480答案 D解析 由频率分布直方图知:学生的体重在65~75 kg 的频率为(0.012 5+0.037 5)×5=0.25, 则学生的体重在50~65 kg 的频率为1-0.25=0.75. 从左到右第2个小组的频率为0.75×26=0.25.所以抽取的学生人数是120÷0.25=480.5.某产品在某零售摊位上的零售价x (单位:元)与每天的销售量y (单位:个)的统计资料如下表所示:x 16 17 18 19 y50344131由上表可得线性回归方程y ^=b ^x +a ^中的b ^=-4,据此模型预计零售价定为15元时,每天的销售量为( ) A .48个 B .49个 C .50个 D .51个答案 B解析 由题意知x =17.5,y =39,代入线性回归方程得a ^=109,109-15×4=49,故选B. 6.某校为了研究学生的性别和对待某一活动的态度(支持和不支持的两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动有关系.”( ) 附:P (K 2≥k 0) 0.100 0.050 0.025 0.010 0.001 k 02.7063.8415.0246.63510.828A.0.1% B .1% C .99% D .99.9%答案 C解析 因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”,选C.7.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲,x 乙和中位数y 甲,y 乙进行比较,下面结论正确的是( ) A.x 甲>x 乙,y 甲>y 乙 B.x 甲<x 乙,y 甲<y 乙 C.x 甲<x 乙,y 甲>y 乙 D.x 甲>x 乙,y 甲<y 乙 答案 B 二、填空题8.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________.答案 125,124解析 由图可知(a +a -0.005)×10=1-(0.010+0.015+0.030)×10,解得a =0.025,则x =105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125.中位数在120~130之间,设为x ,则0.01×10+0.03×10+0.025×(x -120)=0.5,解得x =124.9.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是__________. 答案 1解析 当x ≥4时,89+89+92+93+92+91+947=6407≠91,∴x <4,∴89+89+92+93+92+91+x +907=91,∴x=1.10.某小学对学生的身高进行抽样调查,如图,是将他们的身高(单位:厘米)数据绘制的频率分布直方图.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人,则从身高在[140,150]内的学生中选取的人数应为________.答案 3解析 由图可知,身高在[100,110),[110,120),[120,130),[130,140),[140,150]这五组的频率分别是0.05、0.35、10α、0.2、0.1,因为五组频率之和应为1,所以10α=0.3.根据分层抽样的知识,在[120,130),[130,140),[140,150]三组内的学生中取18人,则从身高在[140,150]内的学生中选取的人数应为18×0.10.3+0.2+0.1=3.三、解答题11.(xx·课标全国Ⅱ)某地区xx 年至xx 年农村居民家庭人均纯收入y (单位:千元)的数据如下表:年份 xx xx xx xx 2011 xx xx 年份代号t 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析xx 年至xx 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区xx 年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解 (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17=(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17t i -ty i -y∑i =17t i -t2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3, 所求线性回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故xx 年至xx 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将xx 年的年份代号t =9代入(1)中的线性回归方程,得y ^=0.5×9+2.3=6.8, 故预测该地区xx 年农村居民家庭人均纯收入为6.8千元.12.某城市随机抽取一年(365天)内100天的空气质量指数API 的监测数据,结果统计如下: API [0,50] (50,100] (100,150] (150,200] (200,250] (250,300] >300空气质量 优 良 轻微污染 轻度污染 中度污染中重度污染重度污染 天数413183091115(1)若某企业每天由空气污染造成的经济损失S(单位:元)与空气质量指数API(记为w )的关系式为:S =⎩⎪⎨⎪⎧0, 0≤w ≤1004w -400,100<w ≤3002 000, w >300,试估计在本年度内随机抽取一天,该天经济损失S 大于200元且不超过600元的概率;(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染.完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关?非重度污染 重度污染 合计 供暖季 非供暖季 合计100附:P (K 2≥k 0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0 1.3232.0722.7063.8415.0246.6357.87910.828K 2=n ad -bc 2a +bc +d a +cb +d.解 (1)设“在本年内随机抽取一天,该天经济损失S 大于200元且不超过600元”为事件A , 由200<S≤600,得150<w ≤250,频数为39, 所以P (A )=39100.(2)根据以上数据得到如下列联表:非重度污染重度污染合计 供暖季 22 8 30 非供暖季 63 7 70 合计8515100K 2的观测值k =100×63×8-22×7285×15×30×70≈4.575>3.841.所以有95%的把握认为空气重度污染与供暖有关..。
(通用版)2019版高考数学二轮复习 专题检测(十七)统计、统计案例 理(普通生,含解析)

专题检测(十七)统计、统计案例A组——“6+3+3”考点落实练一、选择题1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A.73 B.78C.77 D.76解析:选B 样本的分段间隔为错误!=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78。
故选B.2.(2019届高三·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.100,20 B.200,20C.200,10 D.100,10解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B。
3.从某地高中男生中随机抽取100名同学,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图),由直方图可知()A.估计体重的众数为50或60B.a=0.03C.学生体重在[50,60)有35人D.从这100名男生中随机抽取一人,体重在[60,80)的概率为错误!解析:选 C 根据频率分布直方图知,最高的小矩形对应的底边中点为错误!=55,所以估计众数为55,A错误;根据频率和为1,计算(a+0.035+0。
030+0.020+0.010)×10=1,解得a=0。
005,B错误;体重在[50,60)内的频率是0。
35,估计体重在[50,60)内的学生有100×0.35=35人,C正确;体重在[60,80)内的频率为0。
3+0。
2=0。
5,用频率估计概率,知这100名男生中随机抽取一人,体重在[60,80)的概率为12,D错误.4.如图是民航部门统计的2019年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是()A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格从高到低居于前三位的城市为北京、深圳、广州D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门解析:选D 由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D错误,选D.5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A.13,12 B.13,13C.12,13 D.13,14解析:选B 设等差数列{a n}的公差为d(d≠0),a3=8,a1a7=a错误!=64,(8-2d)(8+4d)=64,即2d-d2=0,又d≠0,故d=2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为错误!=13,中位数为错误!=13.6.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为错误!=错误!x+错误!,已知错误!i=225,错误!i=1 600,错误!=4。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题检测(七) 统计与统计案例一、选择题1.(2018届高三·西安八校联考)某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是( )(注:下表为随机数表的第8行和第9行)6301 6378 5916 9555 6719 9810 5071 7512 8673 5807 4439 5238 793321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279 54A .07B .25C .42D .52解析:选D 依题意得,依次选出的个体分别是12,34,29,56,07,52,…因此选出的第6个个体是52. 2.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A .各月的平均最低气温都在0 ℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20 ℃的月份有5个解析:选D 由图形可得各月的平均最低气温都在0 ℃以上,A 正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B 正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C 正确;故D 错误.3.为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k ∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为( )A .240B .300C .360D .400解析:选C 因为高一年级抽取学生的比例为2401 200=15,所以k k +5+3=15,解得k =2,故高三年级抽取的人数为1 200×32+5+3=360.4.某同学为了解自己记忆成语的个数与所花费的时间(单位:秒)的关系,做了5次试验,收集到的数据如表所示,由最小二乘法求得的回归直线方程为y ^=0.74x +50.则m +n 的值为( ) A .130 B .129 C .121D .118解析:选A 由表中数据得,x =30,y =15(61+m +n +81+89)=15(231+m +n ),将x =30,y =15(231+m +n )代入回归直线方程,得m +n =130.5.(2017·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )A .5B .7C .10D .50解析:选D 根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50.6.为比较甲、乙两地某月11时的气温情况,随机选取该月中的5天,将这5天中11时的气温数据(单位:℃)制成如图所示的茎叶图,考虑以下结论:①甲地该月11时的平均气温低于乙地该月11时的平均气温 ②甲地该月11时的平均气温高于乙地该月11时的平均气温 ③甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差 ④甲地该月11时的气温的标准差大于乙地该月11时的气温的标准差 其中根据茎叶图能得到的正确结论的编号为( ) A .①③B .①④C .②③D .②④解析:选C 由茎叶图和平均数公式可得甲、乙两地的平均数分别是30,29,则甲地该月11时的平均气温高于乙地该月11时的平均气温,①错误,②正确,排除A 和B ;又甲、乙两地该月11时的标准差分别是s 甲=4+1+1+45=2,s 乙=9+1+4+45=185,则甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差,③正确,④错误,故选项C 正确.7.(2017·石家庄一模)下列说法错误的是( ) A .回归直线过样本点的中心(x ,y )B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小 D .在回归直线方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^就增加0.2个单位 解析:选C 根据相关定义知选项A 、B 、D 均正确;选项C 中,对分类变量X 与Y ,随机变量K 2的观测值k 越大,对判断“X 与Y 有关系”的把握程度越大,故C 错误.8.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B 标准差能反映一组数据的稳定程度.故选B.9.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8,且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A .13,12B .13,13C .12,13D .13,14解析:选B 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,(8-2d )(8+4d )=64,即2d -d 2=0,又d ≠0,故d =2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为+10=13,中位数为12+142=13.10.通过随机询问110名学生是否爱好打篮球,得到如下的列联表:附:K 2=n ac -bd 2a +bc +d a +cb +d,其中n =a +b +c +d .参照附表:得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好打篮球与性别无关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好打篮球与性别有关”C .有99%以上的把握认为“爱好打篮球与性别无关”D .有99%以上的把握认为“爱好打篮球与性别有关” 解析:选D 因为K 2=-260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过1%的前提下,即有99%以上的把握认为“爱好打篮球与性别有关”.11.给出下列四个命题:①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同; ③若一组数据a,0,1,2,3的平均数为1,则其标准差为2;④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y ^=a ^+b ^x ,其中a ^=2,x =1,y =3,则b ^=1.其中真命题有( ) A .①②④ B .②④ C .②③④ D .③④解析:选B 在①中,由系统抽样知抽样的分段间隔为52÷4=13,故抽取的样本的编号分别为7号、20号、33号、46号,故①是假命题;在②中,数据1,2,3,3,4,5的平均数为16(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,故②是真命题;在③中,因为样本的平均数为1,所以a +0+1+2+3=5,解得a =-1,故样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,标准差为2,故③是假命题;在④中,回归直线方程为y ^=b ^x +2,又回归直线过点(x ,y ),把(1,3)代入回归直线方程y ^=b ^x +2,得b ^=1,故④是真命题.12.某中学为了普及奥运会知识和提高学生参加体育运动的积极性,举行了一次奥运知识竞赛.随机抽取了30名学生的成绩,绘成如图所示的茎叶图.若规定成绩在75分以上(包括75分)的学生为甲组,成绩在75分以下(不包括75分)的学生为乙组.已知在这30名学生中,甲组学生中有男生9人,乙组学生中有女生12人,则认为“成绩分在甲组或乙组与性别有关”的把握有( )A .90%B .95%C .99%D .99.9%附:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解析:选B 根据茎叶图的知识作出2×2列联表为由列联表中的数据代入公式得K 2的观测值k =12×18×15×15=5,因为5>3.841,故有95%的把握认为“成绩分在甲组或乙组与性别有关”.二、填空题13.如图是某学校一名篮球运动员在10场比赛中所得分数的茎叶图,则该运动员在这10场比赛中得分的中位数为________.解析:把10场比赛的所得分数按顺序排列:5,8,9,12,14,16,16,19,21,24,中间两个为14与16,故中位数为14+162=15. 答案:1514.为了研究雾霾天气的治理,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y ,z 依次构成等差数列,且4,y ,z +4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为________.解析:由题意可得⎩⎪⎨⎪⎧2y =4+z ,y 2=z +,即⎩⎪⎨⎪⎧y =2+z 2,y 2=4z +16,解得z =12,或z =-4(舍去),故y =8.所以甲、乙、丙三组城市的个数分别为4,8,12.因为一共要抽取6个城市,所以抽样比为64+8+12=14.故乙组城市应抽取的个数为8×14=2.答案:215.(2017·惠州三调)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):由最小二乘法求得回归方程y ^=0.67x +a ^,则a ^的值为________. 解析:因为x =10+20+30+40+505=30,y =62+68+75+81+895=75,所以回归直线一定过样本点的中心(30,75),则由y ^=0.67x +a ^可得75=30×0.67+a ^,求得a ^=54.9.答案:54.916.(2017·合肥质检)某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是________.解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可以先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s 2=15[(0-8)2+(4-8)2+(11-8)2+(9-8)2+(16-8)2]=30.8.答案:30.8。