2019版二轮复习数学通用版讲义:第一部分 专题十五 统计、统计案例 Word版含解析
2019版二轮复习数学(理)全国版第一部分 第二层级 重点增分专题十三 统计、统计案例
重点增分专题十三 统计、统计案例[全国卷3年考情分析](1)统计与统计案例在选择题或填空题中的命题热点主要集中在随机抽样、用样本估计总体以及变量间的相关性判断等,难度较低,常出现在3~4题的位置.(2)统计与统计案例在解答题中多出现在18或19题,多考查直方图、茎叶图及数字特征计算、统计案例的应用.考点一抽样方法 保分考点·练后讲评 1.[简单随机抽样]福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球号码为( )A .12B .33C .06D .16解析:选C 被选中的红色球号码依次为17,12,33,06,32,22.所以第四个被选中的红色球号码为06,故选C.2.[分层抽样]某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽选100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选的人数分别为( )A .25,25,25,25B .48,72,64,16C .20,40,30,10D .24,36,32,8解析:选D 因为抽样比为10020 000=1200,所以每类人中应抽选的人数分别为4 800×1200=24,7 200×1200=36,6 400×1200=32,1 600×1200=8.故选D. 3.[系统抽样]某班共有学生56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知学号为2,30,44的同学在样本中,则样本中还有一位同学的学号为________.解析:由题意得,将56人按学号从小到大分成4组,则分段间隔为14,所以抽取的学号依次为2,16,30,44,故还有一位同学的学号为16.答案:16[解题方略] 系统抽样和分层抽样中的计算 (1)系统抽样①总体容量为N ,样本容量为n ,则要将总体均分成n 组,每组Nn 个(有零头时要先去掉).②若第一组抽到编号为k 的个体,则以后各组中抽取的个体编号依次为k +Nn ,…,k +(n -1)Nn .(2)分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.考点二 用样本估计总体 保分考点·练后讲评 [大稳定——常规角度考双基]1.[频数分布表中的数字特征]某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:则这20户家庭该月用电量的众数和中位数分别是( ) A .180,170B .160,180C .160,170D .180,160解析:选A 用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.2.[茎叶图中的数字特征]甲、乙两名同学在7次数学测试中的成绩如茎叶图所示,其中甲同学成绩的众数是85,乙同学成绩的中位数是83,则成绩较稳定的是________.解析:根据众数及中位数的概念易得x =5,y =3,故甲同学成绩的平均数为78+79+80+85+85+92+967=85,乙同学成绩的平均数为72+81+81+83+91+91+967=85,故甲同学成绩的方差为17×(49+36+25+49+121)=40,乙同学成绩的方差为17×(169+16+16+4+36+36+121)=3987>40,故成绩较稳定的是甲.答案:甲3.[频率分布直方图中的数字特征]为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量的数据(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a 的值;(2)估计这种植物果实重量的平均数x 和方差s 2(同一组中的数据用该组区间的中点值作代表).解:(1)由5×(0.020+0.040+0.075+a +0.015)=1,得a =0.050. (2)各组中点值和相应的频率依次为x=30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,s2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.[解题方略]1.方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算.(2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大.2.从频率分布直方图中得出有关数据的方法[小创新——变换角度考迁移]1.[统计中的创新]空气质量指数A Q I是检测空气质量的重要参数,其数值越大说明空气污染状况越严重,空气质量越差.某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数A Q I,根据得到的数据绘制出如图所示的折线图.则下列说法错误的是()A.该地区在12月2日空气质量最好B.该地区在12月24日空气质量最差C.该地区从12月7日到12月12日A Q I持续增大D.该地区的空气质量指数A Q I与这段日期成负相关解析:选D12月2日空气质量指数最低,所以空气质量最好,A正确;12月24日空气质量指数最高,所以空气质量最差,B正确;12月7日到12月12日A Q I在持续增大,所以C 正确;在该地区统计这段时间内,空气质量指数A Q I 整体呈上升趋势,所以空气质量指数与这段日期成正相关,D 错误.2.[与基本不等式的交汇]为保障食品安全,某市质量监督局对某超市进行食品安全检查,如图所示是某品牌食品中某元素含量数据的茎叶图,已知该组数据的平均数为11.75,则4a +1b 的最小值为( )A .9 B.92C .3D.73解析:选C 根据茎叶图中的数据得,该组数据的平均数x =14(a +11+13+20+b )=11.75,∴a +b =3,∴4a +1b =13⎝⎛⎭⎫4a +1b (a +b )=13⎝⎛⎭⎫5+4b a +a b ≥135+24b a ·a b =13(5+4)=3.当且仅当a =2b ,即a =2,b =1时取“=”.∴4a +1b的最小值为3.故选C.3.[借助数学文化考查]《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问:各几何?”其意为:今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱,则丙应出________钱(所得结果四舍五入,保留整数).解析:甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,丙应出100×180560+350+180=1656109≈17(钱).答案:17考点三 统计案例 增分考点·广度拓展 [分点研究]题型一 回归分析在实际问题中的应用[例1] 某商店为了更好地规划某种商品的进货量,从某一年的销售数据中,随机抽取了8组数据作为研究对象,如下表所示(x 为该商品的进货量,y 为销售天数):(1)根据上表数据在如图所示的网格中绘制散点图;(2)根据上表提供的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)根据(2)中的计算结果,若该商店准备一次性进货该商品24吨,预测需要销售的天数.参考公式和数据:b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^=y -b ^x .∑i =18x 2i =356,∑i =18x i y i =241.[解] (1)散点图如图所示:(2)依题意,得x =18×(2+3+4+5+6+8+9+11)=6,y =18×(1+2+3+3+4+5+6+8)=4,又∑i =18x 2i =356,∑i =18x i y i =241, 所以b ^=∑i =18x i y i -8x y∑i =18x 2i -8x2=241-8×6×4356-8×62=4968, a ^=4-4968×6=-1134,故线性回归方程为y ^=4968x -1134.(3)由(2)知,当x =24时,y ^=4968×24-1134≈17,故若该商店一次性进货24吨,则预计需要销售17天.[解题方略] 求回归直线方程的方法(1)若所求的回归直线方程是在选择题中,常利用回归直线y ^=b ^x +a ^必经过样本点的中心(x ,y )快速选择.(2)若所求的回归直线方程是在解答题中,则求回归直线方程的一般步骤为:题型二 独立性检验在实际问题中的应用[例2] (2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),[解] (1)第二种生产方式的效率更高. 理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min ,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min ,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80 min ;用第二种生产方式的工人完成生产任务所需平均时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分) (2)由茎叶图知m =79+812=80.列联表如下:(3)因为K 2=40(15×15-5×5)20×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.[解题方略] 独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d )计算出K 2的观测值;(3)比较K 2的观测值与临界值的大小,作出统计推断.[多练强化]1.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分)2.(2019届高三·湖北五校联考)通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:(1)将题中的2×2列联表补充完整;(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解:(1)题中的2×2列联表补充如下:(2)由(1)表中数据得K 2=100×(40×25-20×15)255×45×60×40≈8.25>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.考点四概率与统计的综合问题增分考点·讲练冲关[典例](2018·福州质量检测)从某技术公司开发的某种产品中随机抽取200件,测量这些产品的一项质量指标值(记为Z),由测量结果得如下频率分布直方图:(1)公司规定:当Z≥95时,产品为正品;当Z<95时,产品为次品.公司每生产一件这种产品,若是正品,则盈利90元;若是次品,则亏损30元,记ξ为生产一件这种产品的利润,求随机变量ξ的分布列和数学期望;(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2(同一组中的数据用该区间的中点值作代表).①利用该正态分布,求P(87.8<Z<112.2);②某客户从该公司购买了500件这种产品,记X表示这500件产品中该项质量指标值位于区间(87.8,112.2)内的产品件数,利用①的结果,求E(X).附:150≈12.2.若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 7.P(μ-2σ<Z<μ+2σ)=0.954 5.[解](1)由频率估计概率,产品为正品的概率为(0.033+0.024+0.008+0.002)×10=0.67,所以随机变量ξ的分布列为所以E(ξ)=90×0.67+(-30)×0.33=50.4.(2)由频率分布直方图知,抽取产品的该项质量指标值的样本平均数x和样本方差s2分别为x=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150.①因为Z~N(100,150),从而P(87.8<Z<112.2)=P(100-12.2<Z<100+12.2)=0.682 7.②由①知,一件产品中该项质量指标值位于区间(87.8,112.2)内的概率为0.682 7,依题意知X~B(500,0.682 7),所以E(X)=500×0.682 7=341.35.[解题方略]解决概率与统计综合问题的一般步骤[多练强化](2018·郑州第一次质量测试)为了减少雾霾,还城市一片蓝天,某市政府于12月4日到12月31日在主城区实行车辆限号出行政策,鼓励民众不开车低碳出行.市政府为了了解民众低碳出行的情况,统计了该市甲、乙两个单位各200名员工12月5日到12月14日共10天的低碳出行的人数,画出茎叶图如图所示:(1)若甲单位数据的平均数是122,求x;(2)现从图中的数据中任取4天的数据(甲、乙两个单位中各取2天),记抽取的4天中甲、乙两个单位员工低碳出行的人数不低于130的天数分别为ξ1,ξ2,令η=ξ1+ξ2,求η的分布列和数学期望.解:(1)由题意知110[105+107+113+115+119+126+(120+x )+132+134+141]=122, 解得x =8.(2)由题得ξ1的所有可能取值为0,1,2,ξ2的所有可能取值为0,1,2,因为η=ξ1+ξ2,所以随机变量η的所有可能取值为0,1,2,3,4.因为甲单位低碳出行的人数不低于130的天数为3,乙单位低碳出行的人数不低于130的天数为4,所以P (η=0)=C 27C 26C 210C 210=745;P (η=1)=C 17C 13C 26+C 27C 14C 16C 210C 210=91225; P (η=2)=C 23C 26+C 27C 24+C 17C 13C 16C 14C 210C 210=13; P (η=3)=C 23C 16C 14+C 17C 13C 24C 210C 210=22225; P (η=4)=C 23C 24C 210C 210=2225.所以η的分布列为E (η)=0×745+1×91225+2×13+3×22225+4×2225=75.数学建模——回归分析问题的求解[典例] (2018·汕头模拟)二手车经销商小王对其所经营的A 型号二手汽车的使用年数x 与销售价格y (单位:万元/辆)进行整理,得到如下数据:下面是z 关于x 的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关系数加以说明.(2)求y 关于x 的回归方程并预测某辆A 型号二手车当使用年数为9年时售价约为多少?(b ^,a ^小数点后保留两位有效数字).(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考公式:回归方程y ^=b ^x +a ^中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2.参考数据:∑i =16x i y i =187.4,∑i =16x i z i =47.64,∑i =16x 2i=139,∑i =16(x i -x )2≈4.18,∑i =16(y i -y )2≈13.96,∑i =16(z i -z )2≈1.53,ln 1.46≈0.38,ln 0.711 8≈-0.34.[解] (1)因为x =16×(2+3+4+5+6+7)=4.5,z =16×(3+2.48+2.08+1.86+1.48+1.10)=2,且 ∑i =16x i z i =47.64,∑i =16(x i -x )2≈4.18,∑i =16(z i -z )2≈1.53,所以r =∑i =16(x i -x )(z i -z )∑i =16 (x i -x )2∑i =16(z i -z )2≈47.64-6×4.5×24.18×1.53≈-0.99,所以z 与x 的相关系数大约为0.99,说明z 与x 的线性相关程度很高. (2)由已知,得b ^=∑i =16x i z i -6 x z∑i =16x 2i -6x2=47.64-6×4.5×2139-6×4.52≈-0.36,所以a ^=z -b ^x =2+0.36×4.5=3.62, 所以z 与x 的线性回归方程是z ^=-0.36x +3.62. 又z =ln y ,所以y 关于x 的回归方程是y ^=e -0.36x +3.62. 令x =9,得y ^=e -0.36×9+3.62≈1.46,即预测某辆A 型号二手车当使用年数为9年时售价约1.46万元. (3)当y ^≥0.711 8时,e -0.36x +3.62≥0.711 8=e ln 0.711 8=e -0.34, 所以-0.36x +3.62≥-0.34,解得x ≤11,因此预测在收购该型号二手车时车辆的使用年数不得超过11年. [素养通路]本题是典型的回归分析问题,在实际问题中收集数据,画散点图,可以用线性回归模型拟合变量关系,再用最小二乘法求出回归方程,进而用回归模型对实际问题进行预测,考查了数学建模这一核心素养.。
(通用版)2019版高考数学二轮复习课件+训练:第一部分专题十五统计、统计案例课件理
n
n
(2)计算xiyi,x2i ;
i=1
i=1
n
n
xi- x yi- y xiyi-n x y
i=1
i=1
(3)计算^b=
=
;
n
xi- x 2
n
x2i -n x 2
i=1
i=1
^a= y -^b x ; (4)写出线性回归方程^y=^bx+^a.
[注意] 样本点的 中心( x , y )必在回 归直线上.
解析:根据频率分布直方图,得第二小组的频率是0.04×10 =0.4,∵频数是40,∴样本容量是 04.04 =100,又成绩在80~ 100分的频率是(0.01+0.005)×10=0.15,∴成绩在80~100 分的学生人数是100×0.15=15.
答案:A
2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济 收入增加了一倍,实现翻番.为更好地了解该地区农村的经 济收入变化情况,统计了该地区新农村建设前后农村的经济 收入构成比例,得到如下饼图:则下面结论中不正确的是 ()
用
卷Ⅲ
卷Ⅲ3年4考,既有选择 题也有解答题,小题主 要考查统计图表、折线 图的识别与分析,解答 题考查线性回归方程的 应用及独立性检验.预 计2019年会以解答题的 形式考查线性回归模型 的应用,同时以选择题 的形式考查统计图表的 识别与分析
横向 把握 重点
1.统计与统计案例在选择题或填空题中的命题热点主要集中在
高中生的近视率为 50%,所以高中生的近视人数为 40×50%
=20,故选 B.
答案:B
3.从 30 个个体(编号为 00~29)中抽取 10 个样本,现给出某随机
数表的第 11 行到第 15 行(见下表),如果某人选取第 12 行的第
2019-2020年高考数学第二轮复习统计与概率教学案
019-2020年高考数学第二轮复习统计与概率教学案考纲指要:“统计”是在初中“统计初步” 基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
统计案例主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用。
对概率考察的重点为互斥事件、古典概型的概率事件的计算为主,了解随机数的意义,能运用模拟方法(包括计算器产生随机数来进行模拟)估计概率,初步体会几何概型的意义。
考点扫描:1.三种常用抽样方法:(1)简单随机抽样;(2)系统抽样;(3)分层抽样。
2.用样本的数字特征估计总体的数字特征:(1)众数、中位数;(2)平均数与方差。
3.频率分布直方图、折线图与茎叶图。
4.线性回归:回归直线方程。
5.统计案例:相关系数、卡方检验,6.随机变量:随机变量的概念,离散性随机变量的分布列,相互独立事件、独立重复试验公式,随机变量的均值和方差,几种特殊的分布列:(1)两点分布;(2)超几何分布;(3)二项分布;正态分布。
7随机事件的概念、概率;事件间的关系:(1)互斥事件;(2)对立事件;(3)包含;事件间的运算:(1)并事件(和事件)(2)交事件(积事件)8古典概型:古典概型的两大特点;古典概型的概率计算公式。
9几何概型:几何概型的概念;几何概型的概率公式;几种常见的几何概型。
考题先知:例1.为了科学地比较考试的成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为:(其中x是某位学生的考试分数,是该次考试的平均分,s是该次考试的标准差,Z称为这位学生的标准分).转化成标准分后可能出现小数和负值,因此,又常常再将Z分数作线性变换转化成其他分数.例如某次学业选拔考试采用的是T分数,线性变换公式是:T=40Z+60.已知在这次考试中某位考生的考试分数是85,这次考试的平均分是70,标准差是25,则该考生的T分数为.分析:正确理解题意,计算所求分数。
2019版二轮复习数学(理·重点生)通用版讲义:第一部分 专题十五 统计、统计案例 Word版含解析
依编号顺序平均分成 8 组,组号依次为 1,2,3,…,8.现用系统抽样方法抽取一个容量为 8
的样本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为________.
高清试卷 下载可打印
高清试卷 下载可打印
64 解析:由题知分组间隔为 =8,又第 1 组中抽取的号码为 5,所以第 6 组中抽取的号
8
码为 5×8+5=45.
答案:45
5.采用系统抽样方法从 1 000 人中抽取 50 人做问卷调查,将他们随机编号 1,2,…,1
000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为 8.若抽到的 50 人中,编号
落入区间[1,400]的人做问卷 A,编号落入区间[401,750]的人做问卷 B,其余的人做问卷 C,
卷Ⅲ3 年 4 考,既有选择题也有 解答题,小题主要考查统计图 表、折线图的识别与分析,解答 题考查线性回归方程的应用及 独立性检验.预计 2019 年会以 解答题的形式考查线性回归模 型的应用,同时以选择题的形式 考查统计图表的识别与分析
1.统计与统计案例在选择题或填空题中的命题热点主要集中在随机抽样、用样
视人数为 40×50%=20,故选
B.
3.从 30 个个体(编号为 00~29)中抽取 10 个样本,现给出某随机数表的第 11 行到第 15
行(见下表),如果某人选取第 12 行的第 6 列和第 7 列中的数作为第一个数并且由此数向右读,
则选取的前 4 个的号码分别为( )
9264 4607 2021 3920 7766 3817 3256 1640 5858 7766 3170 0500 2593 0545 5370 7814 2889 6628 6757 8231 1589 0062 0047 3815 5131 8186 3709 4521 6665 5325 5383 2702 9055 7196 2172 3207 1114 1384 4359 4488n 每组中按Fra bibliotek则抽取每个个体.
2019版高考数学二轮复习课件+训练:第一部分专题十五统计、统计案例讲义理
5131 8186 3709 4521 6665 5325 5383 2702
9055 7196 2172 3207 1114 1384 4359 4488
A.76,63,17,00
B.16,00,02,30
C.17,00,02,25
D.17,00,02,07
解析:选 D 在随机数表中,将处于 00~29 的号码选出,满足要求的前 4 个号码为
角度二 非线性回归分析 [例2] 某机构为研究某种图书每册的成本费 y(单位:元)与印刷数量 x(单位:千册)的 关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.
落入区间[1,400]的人做问卷 A,编号落入区间[401,750]的人做问卷 B,其余的人做问卷 C,
则抽到的人中,做问卷 C 的人数为________.
解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为 8,公差 d=
1 000 50 =20 的等差数列{an},∴通项公式 an=8+20(n-1)=20n-12,令 751≤20n-12≤1
A.15
B.18
C.20
D.25
解析:选 A 根据频率分布直方图,得第二小组的频率是 0.04×10=0.4,∵频数是 40,∴
40 样本容量是 =100,又成绩在 80~100 分的频率是(0.01+0.005)×10=0.15,∴成绩在
0.4 80~100 分的学生人数是 100×0.15=15.
重点 2.统计与统计案例在解答题中多出现在 18 或 19 题,多考查直方图、茎叶图及
数字特征计算、统计案例的应用.
抽样方法
[题组全练]
1.(2018·石家庄模拟)某校高一年级有男生 560 人,女生 420 人,用分层抽样的方法
2019年高考数学第二轮专项专题排列、组合、二项式定理与概率统计复习及解析湖南师大附中共11页
高考数学二轮复习专项排列、组合、二项式定理与概率统计(含详解)1. 袋里装有30个球,每个球上都记有1到30的一个号码, 设号码为n 的球的重量为344342+-n n (克). 这些球以等可能性(不受重量, 号码的影响)从袋里取出.(Ⅰ)如果任意取出1球, 求其号码是3的倍数的概率. (Ⅱ)如果任意取出1球, 求重量不大于号其码的概率; (Ⅲ)如果同时任意取出2球, 试求它们重量相同的概率.2. 从10个元件中(其中4个相同的甲品牌元件和6个相同的乙品牌元件)随机选出3个参加某种性能测试. 每个甲品牌元件能通过测试的概率均为54,每个乙品牌元件能通过测试的概率均为53.试求:(I )选出的3个元件中,至少有一个甲品牌元件的概率;(II )若选出的三个元件均为乙品牌元件,现对它们进行性能测试,求至少有两个乙品牌元件同时通过测试的概率.3. 设在12个同类型的零件中有2个次品,抽取3次进行检验,每次任取一个,并且取出不在放回,若以ξ和η分别表示取出次品和正品的个数。
(1)求ξ的分布列,期望及方差; (2)求η的分布列,期望及方差;4.(1)每天不超过20人排队结算的概率是多少?(2)一周7天中,若有三天以上(含三天)出现超过15人排队结算的概率大于0.75,商场就需要增加结算窗口,请问,该商场是否需要增加结算窗口?5. 某售货员负责在甲、乙、丙三个柜面上售货.如果在某一小时内各柜面不需要售货员照顾的概率分别为0.9,0.8,0.7.假定各个柜面是否需要照顾相互之间没有影响,求在这个小时内: (1)只有丙柜面需要售货员照顾的概率;(2)三个柜面最多有一个需要售货员照顾的概率; (3)三个柜面至少有一个需要售货员照顾的概率.6. 某同学上楼梯的习惯每步走1阶或2阶,现有一个11阶的楼梯 ,该同学从第1阶到第11阶用7步走完。
(1)求该同学恰好有连着三步都走2阶的概率;(2)记该同学连走2阶的最多步数为ζ,求随机事件ζ的分布列及其期望。
2019届高考数学二轮复习(文科)统计与统计案例课件(54张)
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:样本数据中,将数据按大小排列,位于最中间的数
据.如果数据的个数为偶数,就取中间两个数据的平均数作为
中位数.
考点一
考点二
考点三
课后训练 提升能力
首页 上页 下页 尾页
考点一 样本估计总体
(3)平均数:样本数据的算术平均数,即 x =n1(x1+x2+…+xn). (4)方差与标准差 方差:s2=n1[(x1- x )2+(x2- x )2+…+(xn- x )2]. 标准差:s= n1[x1- x 2+x2- x 2+…+xn- x 2].
考点一 样本估计总体
[学审题]
条件信息
想到方法
注意什么
信息❶中给 出频率分布 直方图
由图读出月用水量在 直方图中纵轴数据表示
各区间内的频率
频率 为组距常误认为频率
利用用水量的频率分 信息❷已知
布直方图得出用水费 条件中水费的计算方法 超出 3 立方米
用的频率分布表
考点一
考点二
考点三
课后训练 提升能力
考点一
考点二
考点三
课后训练 提升能力
首页 上页 下页 尾页
考点二 回归分析
(2018·高考全国卷Ⅱ)(12 分)下图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图.
考点一
考点二
考点三
课后训练 提升能力
首页 上页 下页 尾页
考点二 回归分析
为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时 间变量 t 的两个线性回归模型.根据 2000 年至 2016 年的数据(时 间变量 t 的值依次为 1,2,…,17)建立模型①:^y=-30.4+13.5t; 根据 2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,…, 7)建立模型②:^y=99+17.5 t (1)分别利用这两个模型,求该地区 2018 年的环境基础设
2019年高考数学二轮复习专题六第1讲统计与统计案例案文.doc
2019年高考数学二轮复习专题六第1讲统计与统计案例案文高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点,2015年,2016年和2017年在解答题中均有考查.真题感悟1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数解析刻画评估这种农作物亩产量稳定程度的指标是标准差.答案 B2.(2016·全国Ⅲ卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析根据雷达图可知全年最低气温都在0 ℃以上,故A正确;一月平均最高气温是6 ℃左右,平均最低气温2 ℃左右,七月平均最高气温22 ℃左右,平均最低气温13 ℃左右,所以七月的平均温差比一月的平均温差大,B正确;三月和十一月的平均最高气温都是10 ℃,三月和十一月的平均最高气温基本相同,C正确;平均最高气温高于20 ℃的有七月和八月,D项不正确.答案 D3.(2017·山东卷)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166D.170解析 由已知得x -=22.5,y -=160,∵回归直线方程过样本点中心(x -,y -),且b ^=4,∴160=4×22.5+a ^,解得a ^=70.∴回归直线方程为y ^=4x +70,当x =24时,y ^=166. 答案 C4.(2017·全国Ⅱ卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解 (1)由频率分布直方图知,旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,则事件A 的概率估计值为0.62. (2)列联表如下:∴K 2=100×100×104×96≈15.705>6.635,∴有99%的把握认为箱产量与养殖方法有关.(3)由箱产量的频率分布直方图可知,旧养殖法的箱产量平均值(或中位数)约在45~50 kg 之间,新养殖法的箱产量平均值(或中位数)约在50~55 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法分布集中程度高,可知新养殖法的箱产量高且稳定,从而新养殖法优于旧养殖法.考 点 整 合1.抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即x -=1n(x 1+x 2+…+x n ).(4)方差与标准差.s 2=1n[(x 1-x - )2+(x 2-x - )2+…+(x n -x -)2],s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^ =b ^ x +a ^ 经过样本点的中心点(x - ,y -),若x 取某一个值代入回归直线方程y ^ =b ^ x +a ^ 中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:则K 2=n (ad -(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 抽样方法【例1】 (1)(2015·北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90 C.180D.300(2)(2017·长沙雅礼中学质检)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析 (1)设该样本中的老年教师人数为x ,由题意及分层抽样的特点得x 900=3201 600,故x =180.(2)依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据.在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人. 答案 (1)C (2)4探究提高 1.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值. 2.在系统抽样的过程中,要注意分段间隔,需要抽取n 个个体,样本就需要分成n 个组,则分段间隔即为N n(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.【训练1】 (1)(2017·郑州模拟)为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A.13 B.19 C.20D.51(2)(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.解析 (1)由系统抽样的原理知,抽样的间隔为52÷4=13,故抽取的样本的编号分别为7,7+13, 7+13×2,7+13×3,即7号,20号,33号,46号. ∴样本中还有一位同学的编号为20号.(2)因为样本容量n =60,样本总体N =200+400+300+100=1 000,所以抽取比例为n N =601000=350. 因此应从丙种型号的产品中抽取300×350=18(件).答案 (1)C (2)18 热点二 用样本估计总体命题角度1 数字特征与茎叶图的应用【例2-1】 (2017·北京东城质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的. ①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大; ②从平均值分析,男生每天锻炼的时间比女生多;③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.其中符合茎叶图所给数据的结论是( ) A.①②③ B.②③④ C.①②④D.①③④解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.男生平均每天锻炼时间超过65分钟的概率P 1=510=12,女生平均每天锻炼时间超过65分钟的概率P 2=410=25,P 1>P 2,因此④正确.设男生、女生两组数据的平均数分别为x -甲,x -乙,标准差分别为s 甲,s 乙. 易求x - 甲=65.2,x - 乙=61.8,知x - 甲>x -乙,②正确.又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, ∴s 甲<s 乙,③错误,因此符合茎叶图所给数据的结论是①②④. 答案 C命题角度2 用样本的频率分布估计总体分布【例2-2】 (2016·四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图可知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.2.在本例2-2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0. 9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 热点三 回归分析与独立性检验【例3】 (1)某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:参考附表:(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )(2)(2016·全国Ⅲ卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014.①由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; ②建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:(1)解析 分析列联表中数据,可得K 2的一个观测值k =110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱《开门大吉》节目与否和性别有关”. 答案 99%(2)解 ①由折线图中的数据和附注中参考数据得t -=4,因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.a ^=y - -b ^t -≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得:y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解计算b ^,a ^的公式和准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.独立性检验的关键(1)根据2×2列联表准确计算K 2,若2×2列联表没有列出来,要先列出此表.(2)K 2的观测值k 越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练3】 (1)(2017·贵阳调研)某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用2×2列联表计算得K 2的观测值k ≈3.918. 附表:A.95%B.5%C.97.5%D.2.5%(2)(2017·唐山一模)某市春节期间7家超市的广告费支出x i (万元)和销售额y i (万元)数据如下:②用对数回归模型拟合y 与x 的关系,可得回归方程y ^=12ln x +22,经计算得出线性回归模型和对数模型的R 2分别约为0.75和0.97,请用R 2说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额.(1)解析 ∵k ≈3.918>3.841,且P (K 2≥k 0=3.841)=0.05,根据独立性检验思想“这种血清能起到预防感冒的作用”出错的可能性不超过5%. 答案 B因此a ^=y - -b ^x -=42-1.7×8=28.4.所以,y 关于x 的线性回归方程是y ^=1.7x +28.4. ②∵0.75<0.97,∴对数回归模型更合适.当x =8时,y ^=12ln 8+22=36ln 2+22=36×0.7+22=47.2万元. ∴广告费支出8万元时,预测A 超市销售额为47.2万元.1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.3.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律.在频率分布直方图中,可分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小. 注意:频率分布直方图的纵轴刻度是频率组距,而不是频率,每个小直方图的面积才是相应区间的频率.4.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.一、选择题1.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A.7 B.9 C.10D.15解析 抽取号码的间隔为96032=30,从而区间[451,750]包含的段数为75030-45030=10,则编号落入区间[451,750]的人数为10人,即做问卷B 的人数为10. 答案 C2.(2017·全国Ⅲ卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析 由题图可知,2014年8月到9月的月接待游客量在减少,则A 选项错误. 答案 A3.(2017·山东卷)如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5B.5,5C.3,7D.5,7解析 由茎叶图知甲组数据中位数为65,所以y =5,此时乙组平均值为66.56+65+62+74+70+x 5=66,解得x =3.答案 A4.(2017·汉中模拟)已知两个随机变量x ,y 之间的相关关系如表所示:根据上述数据得到的回归方程为y =b x +a ,则大致可以判断( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析 作出散点图,画出回归直线直观判定b ^>0,a ^<0. 答案 C5.(2017·济南调研)2016年济南地铁正式开工建设,地铁时代的到来能否缓解济南的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:附:K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )A.有95%的把握认为“对能否缓解交通拥堵的认识与性别有关”B.有95%的把握认为“对能否缓解交通拥堵的认识与性别无关”C.有99%的把握认为“对能否缓解交通拥堵的认识与性别有关”D.有99%的把握认为“对能否缓解交通拥堵的认识与性别无关” 解析 由2×2列联表,可求K 2的观测值,k =(48+30+12+20)(20×48-12×30)2(48+30)(48+12)(12+20)(30+20)≈5.288>3.841. 由统计表P (K 2≥3.841)=0.05,∴有95%的把握认为“能否缓解交通拥堵的认识与性别有关”. 答案 A 二、填空题6.(2017·石家庄质检)为比较甲、乙两地14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号正确的是________.解析 x - 甲=26+28+29+31+315=29,x - 乙=28+29+30+31+325=30,则x - 甲<x - 乙,①正确. 由茎叶图知,乙地的气温相对比较集中,甲地的气温相对比较离散. 所以甲地该月的标准差大于乙地该月的标准差,④正确. 答案 ①④7.(2017·泉州模拟)某厂在生产甲产品的过程中,产量x (吨)与生产能耗y (吨)的对应数据如表:根据最小二乘法求得回归方程为y =0.65x +a ,当产量为80吨时,预计需要生产能耗为________吨.解析 由题意,x -=45,y -=36.25,代入y ^=0.65x +a ^,得a ^=7,∴当产量为80吨时,预计需要生产能耗为0.65×80+7=59. 答案 598.(2016·山东卷改编)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是________.解析 设所求的人数为n ,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08+0.16)×2.5=0.7,∴n =0.7×200=140. 答案 140 三、解答题9.(2017·全国Ⅲ卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y (单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.解 (1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表中数据可知,最高气温低于25的频率为2+16+3690=0.6.所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6. (2)当这种酸奶一天的进货量为450瓶时,若最高气温低于20,则Y=200×6+(450-200)×2-450×4=-100;若最高气温位于区间[20,25),则Y=300×6+(450-300)×2-450×4=300;若最高气温不低于25,则Y=450×(6-4)=900,所以,利润Y的所有可能值为-100,300,900.Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为36+25+7+490=0.8.因此Y大于零的概率的估计值为0.8.10.(2017·赤峰二模)微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”?解(1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76(小时).(2)由已知得:2(0.04+a+0.14+2×0.12)=1,解得a=0.08.由题设条件得列联表∴K2=n(ad(a+b)(c+d)(a+c)(b+d)=100(38×20-30×12)250×50×68×32≈2.941>2.706.所以有90%的把握认为“微信控”与“性别”有关.11.(2017·全国Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尽寸:(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x --3s ,x -+3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. ①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x - -3s ,x -+3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)解 (1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x - =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x --3s ,x -+3s )以外. 因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为 115(16×9.97-9.22)=10.02, 这条生产线当天生产的零件尺寸的均值的估计值为10.02.i =116x 2i ≈16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115(1 591.134-9.222-15×10.022)≈0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.。
第一部分专题十五水溶液中强酸(碱)与弱酸(碱)的比较-2025届高考化学二轮复习课件
中c(HAc)(·Ac(-)OH-) =c(HAc)(·Ac(-)O·Hc(-)H+·c)(H+) =Ka(KHwA) ,从 c
点 到 d 点 , HA 的 电 离 平 衡 正 向 移 动 , 但 Kw 、 Ka(HA) 的 值 不 变 , 故
c(HA)·c(OH-) c(A-)
不变,C
项正确;相同体积
返回导航
4. (2019·天津卷,5)某温度下,HNO2 和 CH3COOH 的电离常数分别为 5.0×10-4 和 1.7×10-5。将 pH 和 体积均相同的两种酸溶液分别稀释,其 pH 随加水体 积的变化如图所示。下列叙述正确的是( )
A.曲线Ⅰ代表 HNO2 溶液 B.溶液中水的电离程度:b 点>c 点
√C.从 c 点到 d 点,溶液中c(HAc)(·Ac(-)OH-) 保持不变(其中 HA、A-
分别代表相应的酸和酸根离子) D.相同体积 a 点的两溶液分别与 NaOH 恰好中和后,溶液中 n(Na+)
相同
返回导航
C [ 根 据 HNO2 和 CH3COOH 的 电 离 常 数 可 知 , 酸 性 :
(2)常温下测 NaA 溶液的 pH
若 pH>7,则 HA 为弱酸
(3)相同条件下,测等体积、等浓度的 若 HA 溶液的导电能力比盐酸的弱,
HA 溶液和盐酸的导电能力
则 HA 为弱酸
(4)测相同 pH 的 HA 溶液与盐酸稀释 若稀释前后 HA 溶液的 pH 变化较
相同倍数前后的 pH 变化
小,则 HA 为弱酸
返回导航
2.(2021·广东卷,8)鸟嘌呤(G)是一种有机弱碱,可与盐酸反应生成盐酸 盐(用 GHCl 表示)。已知 GHCl 水溶液呈酸性,下列叙述正确的是( )
2019版高考数学二轮复习第1篇专题4统计与概率第1讲小题考法——统计、统计案例与概率课件
• 三、易错易混要明了
• 1.应用互斥事件的概率加法公式,一定要注意首先确定各事 件是否彼此互斥,然后求出各事件分别发生的概率,再求 和.
• 2.正确区别互斥事件与对立事件的关系:对立事件是互斥事 件,是互斥中的特殊情况,但互斥事件不一定是对立事件, “互斥”是“对立”的必要不充分条件.
看
观
谢
谢
• 2.抽样方法 • (1)三种抽样方法的比较
类别
共同点
各自特点
简单随机 抽样 是不放回抽
从总体中逐个抽取
系统 抽样
样,抽样过 程中,每个 个体被抽到
将总体均分成几部 分,按事先确定的规 则,在各部分抽取
分层 抽样
的机会(概率)
相等
将总体分成几层,分
层进行抽取
相互联系
在起始部分抽样 时,采用简单随 机抽样 各层抽样时,采 用简单随机抽样 或者系统抽样
2.与平均数和方差有关的 4 个结论 (1)若 x1,x2,…,xn 的平均数为-x ,那么 mx1+a,mx2+a,…,mxn+a 的平均 数为 m-x +a; (2)数据 x1,x2,…,xn 与数据 x1′=x1+a,x2′=x2+a,…,xn′=xn+a 的方 差相等,即数据经过平移后方差不变;
0.15 2.072
0.005 7.879
0.10 2.706
0.001 10.828
C.99.5%
D.95%
解析 由表中数据可得,当k>3.841时,有0.05的机率说明这两个变量之间的关
系是不可信的,即有1-0.05=0.95的机率,也就是有95%的把握认为变量之间有关
2019届高考数学二轮复习实用课件:统计与概率2.5.2
≤x≤ 5 ,区间长度为 2 π ,则对应的概率 6 3 6 2 2 P 3 . 3
3 ,所以 2
3.某工厂生产了一批颜色和外观都一样的跳舞机器人, 从这批跳舞机器人中随机抽取了8个,其中有2个是次品, 现从8个跳舞机器人中随机抽取2个分配给测验员,则测 验员拿到次品的概率是 (
n MN n M 9 1 . 18 2
2 =10种走法,每一种走法的概 (3)因为从A到3总共有 C5
5 2 1 5 率都是 ( 1 )5 ,所以珠子从出口3出来的概率是 C5 ( ) .
2
2
16
答案: 5
16
【名师点睛】 1.条件概率的求法
P(AB) (1)利用定义,分别求P(A)和P(AB),得P(B|A)= . P(A)
【典例2】(1)(2018·濮阳二模)如图,已知电路中4个 开关闭合的概率都是 1 ,且是相互独立的,则灯亮的
2
概率为
(
)
1 3 1 13 A. B. C. D. 16 16 4 16
(2)在中心为O的正六边形ABCDEF的电子游戏盘中(如 图),按下开关键后,电子弹从O点射出后最后落入正六
虑到重复性(如三棱锥C-A1AB与三棱锥A1-ABC重复),
6 4 2 可知满足是“三节棍体”的有 =24种,故所求 2 概率为P= 24 12 . 70 35 12 答案: 35
【易错警示】解答本题容易出现重复计数,导致所得
概率为 24 的错误.
35
【探究追问】把例1(2)的矩形改为矩形ABCD,其四个顶 点的坐标分别为A(0,-1),B(π ,-1),C(π ,1),D(0,1), 如图所示,
这是通用的求条件概率的方法.
第九章统计第一部分【复习课件】高一数学单元复习(人教A版2019必修第二册)
[答一答] 8.算术平均数与加权平均数有什么区别? 提示:一组数据的算术平均数与加权平均数概念是不一样的,简单的说,如果 一组数据是:70,90,那么,它的算术平均数 =(70+90)÷2=80,而加权平均数则 取决于各个数据的权(或权重). 当 70 的权重是 40%, 90 的权重是 60%时,加权平均数=70×40%+90×60% =82; 当 70 的权重是 70%, 90 的权重是 30%时,加权平均数=70×70%+90×30% =76; 当 70 的权重是 50%, 90 的权重是 50%时,加权平均数=70×50%+90×50% =80.
由此可见,一组数据的算术平均数只有一个,当数据组中的每个数据确定后,算 术平均数也确定了.而一组数据的加权平均数可能有多个,它是根据各个数据的权重 不同而发生变化的,当各个数据的权重一样时,加权平均数等于算术平均数.当各个 数据的权重不同时,加权平均数不一定等于算术平均数.
类型一 简单随机抽样的概念
(2)关于简单随机抽样的特点有以下几种说法,其中不正确的是( D ) A.要求总体中的个体数有限 B.从总体中逐个抽取 C.这是一种等可能抽样 D.每个个体被抽到的机会不一样,与先后顺序有关 [分析] 利用随机事件的概念和特点进行判断.
[解析] (1)A 中,平面直角坐标系中有无数个点,这与要求总体中的个体数有 限不相符,故错误;B 中,一次性抽取不符合简单随机抽样逐个抽取的特点,故错 误;C 中,50 名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.D 正确. 故选 D.
提示:(1)必须清楚地知道要收集的数据是什么; (2)抽取样本的目的是了解总体的情况,因此,收集的样本数据应当能够很好 地反映总体,这是从样本推断出关于总体的正确结论的前提; (3)抽样之前要将总体“充分搅拌”,使每个个体被抽中的机会均等; (4)抽样方法要尽量简单易行.
2019版高考数学(理科)二轮复习讲义(通用版):专题四第二讲小题考法——概率、统计、统计案例Word版含解析
第二讲 小题考法——概率、统计、统计案例[典例感悟][典例] (1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x1,x 2,…,x n 的中位数(2)(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 (3)(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )A.5B.7C.10 D.50[解析](1)标准差能反映一组数据的稳定程度.故选B.(2)根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A错误.由图可知,B、C、D正确.(3)根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50,故选D.[答案](1)B(2)A(3)D[方法技巧]1.样本方差、标准差的计算与含义(1)计算:计算方差或标准差首先要计算平均数,然后再按照方差或标准差的计算公式进行计算.(2)含义:方差和标准差是描述一个样本和总体的波动大小的特征数,方差和标准差大说明波动大.2.频率分布直方图中常见问题及解题策略(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可以求出其他数据.(2)已知频率分布直方图,求某个范围内的数据.可利用图形及某范围结合求解.[演练冲关]1.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A 设新农村建设前,农村的经济收入为a ,则新农村建设后,农村经济收入为2a .新农村建设前后,各项收入的对比如下表:故选A.2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示:则这20A .180,170 B .160,180 C .160,170D .180,160解析:选A 用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.3.(2018·武汉调研)从某选手的7个得分中去掉1个最高分,去掉一个最低分后,剩余5个得分的平均数为91分,如图所示是该选手得分的茎叶图,其中有一个数字模糊,无法辨认,在图中用x 表示,则剩余5个得分的方差为________.解析:去掉一个最高分99分,一个最低分87分,剩余的得分为93分,90分,(90+x )分,91分,87分,则93+90+90+x +91+875=91,解得x =4,所以这5个数的方差s 2=15[(91-93)2+(91-90)2+(91-94)2+(91-91)2+(91-87)2]=6.答案:6[典例] (1)(2018·豫东、豫北十所名校联考)根据如下样本数据:得到的回归方程为y =bx +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位(2)通过随机询问110名学生是否爱好打篮球,得到如下的列联表:附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .A .在犯错误的概率不超过0.1%的前提下,认为“爱好打篮球与性别无关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好打篮球与性别有关”C .有99%以上的把握认为“爱好打篮球与性别无关”D .有99%以上的把握认为“爱好打篮球与性别有关” [解析] (1)依题意得,a +b -25=0.9,故a +b =6.5;①又样本点的中心为(5,0.9),故0.9=5b +a ,② 联立①②,解得b =-1.4,a =7.9, 则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位.(2)因为K 2=110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过1%的前提下,即有99%以上的把握认为“爱好打篮球与性别有关”. [答案] (1)B (2)D[方法技巧]求回归直线方程的关键及实际应用(1)求回归直线方程的关键是正确理解b ^,a ^的计算公式和准确地求解.(2)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.[演练冲关]1.(2018·湖北七市(州)联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如下表(单位:万元):由上表可得回归方程为y =10.2x +a ,据此模型,预测广告费为10万元时的销售额约为( )A .101.2万元B .108.8万元C .111.2万元D .118.2万元解析:选C 根据统计数据表,可得x -=15×(2+3+4+5+6)=4,y -=15×(29+41+50+59+71)=50,而回归直线y ^=10.2x +a ^经过样本点的中心(4,50),∴50=10.2×4+a ^,解得a ^=9.2,∴回归方程为y ^=10.2x +9.2.当x =10时,y =10.2×10+9.2=111.2,故选C.2.(2019届高三·湘中名校联考)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 和Y 有关系”的可信度.如果k >3.841,那么有把握认为“X 和Y 有关系”的百分比为( )C .99.5%D .95%解析:选D 由表中数据可得,当k >3.841时,有0.05的机率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的机率,也就是有95%的把握认为变量之间有关系,故选D.[典例] (1)(2017·全国卷Ⅰ)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A.14 B.π8 C.12D.π4(2)(2017·全国卷Ⅱ)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为( )A.110B.15C.310D.25(3)(2018·全国卷Ⅰ)如图,来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p 1,p 2,p 3,则( )A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 3[解析] (1)不妨设正方形的边长为2,则正方形的面积为4,正方形的内切圆的半径为1,面积为π.由题意,得S 黑=12S 圆=π2,故此点取自黑色部分的概率P =π24=π8.(2)记两次取得卡片上的数字依次为a ,b ,则一共有25个不同的数组(a ,b ),其中满足a >b 的数组共有10个,分别为(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),(5,2),(5,3),(5,4), 因此所求的概率P =1025=25.(3)法一:∵S △ABC =12AB ·AC ,以AB 为直径的半圆的面积为12π·⎝⎛⎭⎫AB 22=π8AB 2,以AC 为直径的半圆的面积为12π·⎝⎛⎭⎫AC 22=π8AC 2,以BC 为直径的半圆的面积为12π·⎝⎛⎭⎫BC 22=π8BC 2,∴S Ⅰ=12AB ·AC ,S Ⅲ=π8BC 2-12AB ·AC ,S Ⅱ=⎝⎛⎭⎫π8AB 2+π8AC 2-⎝⎛⎭⎫π8BC 2-12AB ·AC =12AB ·AC . ∴S Ⅰ=S Ⅱ.由几何概型概率公式得p 1=S ⅠS 总,p 2=S ⅡS 总,∴p 1=p 2.故选A.法二:不妨设△ABC 为等腰直角三角形, AB =AC =2,则BC =22, 所以区域Ⅰ的面积即△ABC 的面积, 为S 1=12×2×2=2,区域Ⅱ的面积S 2=π×12-⎣⎢⎡⎦⎥⎤π×(2)22-2=2, 区域Ⅲ的面积S 3=π×(2)22-2=π-2.根据几何概型的概率计算公式, 得p 1=p 2=2π+2,p 3=π-2π+2,所以p 1≠p 3,p 2≠p 3,p 1≠p 2+p 3,故选A. [答案] (1)B (2)D (3)A[方法技巧]1.古典概型概率的求解关键及注意点(1)正确求出基本事件总数和所求事件包含的基本事件总数. (2)对于较复杂的题目条件计数时要正确分类,分类时应不重不漏. 2.几何概型的适用条件及求解关键(1)当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解.(2)求解关键是寻找构成试验的全部结果的区域和事件发生的区域,有时需要设出变量,在坐标系中表示所需要的区域.[演练冲关]1.(2019届高三·湘中名校联考)从集合A ={-2,-1,2}中随机选取一个数记为a ,从集合B ={-1,1,3}中随机选取一个数记为b ,则直线ax -y +b =0不经过第四象限的概率为( )A.29B.13C.49D.14解析:选A 从集合A ,B 中随机选取一个数后组合成的数对有(-2,-1),(-2,1),(-2,3),(-1,-1),(-1,1),(-1,3),(2,-1),(2,1),(2,3),共9对,要使直线ax -y +b =0不经过第四象限,则需a ≥0,b ≥0,共有2对满足,所以所求概率P =29,故选A.2.(2018·贵阳模拟)某公交车站每隔10分钟有一辆公交车到站,乘客到达该车站的时刻是任意的,则一个乘客候车时间大于等于7分钟的概率为( )A.15B.710C.12D.310解析:选D 由几何概型的概率计算公式可知所求概率P =10-710=310,故选D.3.(2018·福州四校联考)如图,在圆心角为90°的扇形AOB 中,以圆心O 为起点在AB 上任取一点C 作射线OC ,则使得∠AOC 和∠BOC 都不小于30°的概率是( )A.13 B.23 C.12D.16解析:选A 记事件T 是“作射线OC ,使得∠AOC 和∠BOC 都不小于30°”,如图,记AB 的三等分点为M ,N ,连接OM ,ON ,则∠AON =∠BOM =∠MON =30°,则符合条件的射线OC 应落在扇形MON 中,所以P (T )=。
全国通用版2019版高考数学一轮复习第十五单元统计与统计案例学案文
设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为 =0.85x-85.71,则下列结论中不正确的是()
定义与求法
优点与缺点
众数
一组数据中重复出现次数最多的数
众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征
中位数
把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
A. B.
C. D.2
解析:选D依题意得m=5×1-(0+1+2+3)=-1,样本方差s2= (12+02+12+22+22)=2,即所求的样本方差为2.
3.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则a,b,c的大小关系为()
平均数
如果有n个数据x1,x2,…,xn,那么这n个数的平均数 =
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
2.标准差、方差
(1)标准差:样本数据到平均数的一种平均距离,一般用s表示,s= .
(2)方差:标准差的平方s2
解析:K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题十五 ⎪⎪⎪统计、统计案例[题组全练]1.(2018·石家庄模拟)某校高一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为( )A .80B .120C .160D .240解析:选A因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该抽取男生的人数为140×44+3=80,故选A.2.(2018·南宁模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .100,20B .200,20C .200,10D .100,10解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.3.从30个个体(编号为00~29)中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取第12行的第6列和第7列中的数作为第一个数并且由此数向右读,则选取的前4个的号码分别为()9264 4607 2021 3920 7766 3817 3256 16405858 7766 3170 0500 2593 0545 5370 7814 2889 6628 6757 8231 1589 0062 0047 3815 5131 8186 3709 4521 6665 5325 5383 2702 9055 7196 2172 3207 1114 1384 4359 4488 A .76,63,17,00B .16,00,02,30C .17,00,02,25D .17,00,02,07解析:选D 在随机数表中,将处于00~29的号码选出,满足要求的前4个号码为17,00,02,07.4.(2019届高三·南昌调研)某校高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为________.解析:由题知分组间隔为648=8,又第1组中抽取的号码为5,所以第6组中抽取的号码为5×8+5=45.答案:455.采用系统抽样方法从1000人中抽取50人做问卷调查,将他们随机编号1,2,…,1000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷A ,编号落入区间[401,750]的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷C 的人数为________.解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d =1 00050=20的等差数列{a n },∴通项公式a n =8+20(n -1)=20n -12,令751≤20n -12≤1 000,得76320≤n ≤2535,又∵n ∈N *,∴39≤n ≤50,∴做问卷C 的共有12人.答案:12[系统方法]解决抽样问题应关注的两点(1)解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.(2)在系统抽样的过程中,要注意分段间隔,需要抽取n 个个体,样本就需要分成n 个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.[题组全练]1.(2019届高三·贵阳模拟)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )A .15B .18C .20D .25解析:选A根据频率分布直方图,得第二小组的频率是0.04×10=0.4,∵频数是40,∴样本容量是400.4=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,∴成绩在80~100分的学生人数是100×0.15=15. 2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A设新农村建设前,农村的经济收入为a,则新农村建设后,农村经济收入为2a.新农村建设前后,各项收入的对比如下表:故选A. 3.(2018·长春质检)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )A.95,94B.92,86C.99,86D.95,91解析:选B 由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B.4.(2018·武汉调研)从某选手的7个得分中去掉1个最高分,去掉1个最低分后,剩余5个得分的平均数为91分,如图所示是该选手得分的茎叶图,其中有一个数字模糊,无法辨认,在图中用x 表示,则剩余5个得分的方差为________.解析:去掉一个最高分99分,一个最低分87分,剩余的得分为93分,90分,(90+x )分,91分,87分,则93+90+90+x +91+875=91,解得x =4,所以这5个数的方差s 2=15[(91-93)2+(91-90)2+(91-94)2+(91-91)2+(91-87)2]=6.答案:6[系统方法]1.频率分布直方图的应用(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.2.数字特征及其特点平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.[多维例析]角度一 线性回归分析[例1](2018·陕西质检)基于移动互联网技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验.某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司2018年6月~11月六个月内的市场占有率进行了统计,结果如下表:(1)请在给出的坐标纸中作出散点图,并用相关系数说明能否用线性回归模型拟合市场占有率y 与月份代码x 之间的关系;(2)求y 关于x 的线性回归方程,并预测该公司2019年3月份的市场占有率. 参考数据:i =16(x i -x )2=17.5,i =16(x i -x )(y i -y )=35, 1 330≈36.5.参考公式:相关系数r =错误!; 回归直线方程为y ^=b ^x +a ^,其中b ^=错误!,错误!=错误!-错误!错误!.[解](1)作出散点图如下.∵y =11+13+16+15+20+216=16,∴i =16(y i -y )2=76, ∴r =错误!=错误! =351 330≈3536.5≈0.96.∴两变量之间具有较强的线性相关关系,故可用线性回归模型拟合市场占有率y 与月份代码x 之间的关系.(2)由参考数据及(1)知b ^=错误!=错误!=2,x =1+2+3+4+5+66=3.5,∴a ^=y -b ^x =16-2×3.5=9,∴y 关于x 的线性回归方程为y ^=2x +9.2019年3月的月份代码为x =10,∴y ^=2×10+9=29,∴估计该公司2019年3月份的市场占有率为29%.[类题通法]1.求线性回归方程的步骤(1)计算x ,y ; (2)计算∑i =1nx i y i ,∑i =1nx2i ;(3)计算b ^=错误!=错误!;a ^=y -b ^x ;(4)写出线性回归方程y ^=b ^x +a ^.[注意]样本点的中心(x ,y )必在回归直线上.2.相关系数r(1)当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.(2)r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.角度二 非线性回归分析[例2]某机构为研究某种图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.表中u i =1xi ,u =18∑i =18u i .(1)根据散点图判断:y =a +bx 与y =c +d x哪一个模型更适合作为该图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程(回归系数的结果精确到0.01).(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78840元?(假设能够全部售出.结果精确到1)附:对于一组数据(ω1,ν1),(ω2,ν2),…,(ωn ,νn ),其回归直线ν^=α^+β^ω的斜率和截距的最小二乘估计分别为β^=错误!,错误!=错误!-错误!错误!.[解](1)由散点图判断,y =c +dx更适合作为该图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的回归方程.(2)令u =1x,先建立y 关于u 的线性回归方程,由于d ^=错误!=错误!≈8.957≈8.96,∴c ^=y -d ^·u =3.63-8.957×0.269≈1.22, ∴y 关于u 的线性回归方程为y ^=1.22+8.96u ,∴y 关于x 的回归方程为y ^=1.22+8.96x.(3)假设印刷x 千册,依题意得10x -⎝⎛⎭⎫1.22+8.96x x ≥78.840, ∴x ≥10,∴x ≥10,∴至少印刷10 000册才能使销售利润不低于78 840元.[类题通法]解决非线性回归问题的关键是适当换元,将非线性回归分析转化为线性回归分析问题求解.[综合训练]1.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分) 2.某市春节期间7家超市的广告费支出x i (万元)和销售额y i (万元)数据如下:(1)若用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程;(2)若用二次函数回归模型拟合y 与x 的关系,可得回归方程为y^=-0.17x 2+5x +20,经计算二次函数回归模型和线性回归模型的R 2分别约为0.92和0.75,请用R 2说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为3万元时的销售额.参数数据及公式:x =8,y =42,∑i =17x i y i =2 794,∑i =17x2i =708,b ^=∑i =1nxiyi -nx y∑i =1nx2i -n x 2,a^=y -b ^x .解:(1)∵b ^=∑i =17xiyi -7x y∑i =17x2i -7x 2=2 794-7×8×42708-7×82=1.7,∴a ^=y -b ^x =42-1.7×8=28.4.∴y 关于x 的线性回归方程是y ^=1.7x +28.4.(2)∵0.75<0.92,∴二次函数回归模型更合适.当x =3万元时,y ^=-0.17×9+5×3+20=33.47,∴预测A 超市销售额为33.47万元.[由题知法][典例](2018·郑州质量预测)2018年10月份郑州市进行了高三学生的体育学业水平测试,为了考察高中学生的身体素质情况,现抽取了某校1000名(男生800名,女生200名)学生的测试成绩,根据性别按分层抽样的方法抽取100名学生的测试成绩进行分析,得到如下统计表:男生测试情况:(1)现从抽取的100名且测试等级为“优秀”的学生中随机选出2名学生,求选出的这2名学生恰好是一男一女的概率;(2)若测试等级为“良好”或“优秀”的学生为“体育达人”,其他等级(含病残免试)的学生为“非体育达人”,根据以上统计数据填写下面列联表,并回答能否在犯错误的概率不超过0.010的前提下认为“是否为‘体育达人’与性别有关?”临界值表:附:K 2=错误!,其中n =a +b +c +d.[解](1)按分层抽样的方法男生应抽取80名,女生应抽取20名,∴x =80-(5+10+15+47)=3,y =20-(2+3+10+2)=3.抽取的100名且测试等级为“优秀”的3名男生分别记为A ,B ,C,2名女生分别记为a ,b.从5名学生中任选2名,总的基本事件有(A ,B ),(A ,C ),(A ,a ),(A ,b ),(B ,C ),(B ,a ),(B ,b ),(C ,a ),(C ,b ),(a ,b ),共10个.设“选出的2名学生恰好是一男一女”为事件M ,则事件M 包含的基本事件有(A ,a ),(A ,b ),(B ,a ),(B ,b ),(C ,a ),(C ,b ),共6个,∴P (A )=610=35.(2)2×2列联表如下:则K2=错误!=错误!≈9.091.∵9.091>6.635且P(K2≥6.635)=0.010,∴能在犯错误的概率不超过0.010的前提下认为“是否为‘体育达人’与性别有关”.[类题通法]独立性检验的关键(1)根据2×2列联表准确计算K2的观测值k,若2×2列联表没有列出来,要先列出此表.(2)K2的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.[应用通关]2018年2月22日上午,山东省委、省政府在济南召开山东省全面展开新旧动能转换重大工程动员大会,会议动员各方力量,迅速全面展开新旧动能转换重大工程.某企业响应号召,对现有设备进行改造,为了分析设备改造前后的效果,现从设备改造前后生产的大量产品中各抽取了200件产品作为样本,检测一项质量指标值,若该项质量指标值落在[20,40)内的产品视为合格品,否则为不合格品.设备改造前的样本的频率分布直方图和设备改造后的样本的频数分布表如下所示.设备改造后样本的频数分布表:(1)完成下面的2×2列联表,并判断是否有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关;(2)根据上述数据,试从产品合格率的角度对改造前后设备的优劣进行比较;(3)根据市场调查,设备改造后,每生产一件合格品企业可获利180元,一件不合格品亏损100元,用频率估计概率,求生产1 000件产品企业大约能获利多少元?附:K 2=错误!,n =a +b +c +d.解:(1)根据题中图和表得到2×2列联表:将2×2列联表中的数据代入公式得K 2=错误!≈12.210. ∵12.210>6.635,∴有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.(2)由2×2列联表可知,设备改造后产品的合格率约为192200=0.96,设备改造前产品的合格率约为172200=0.86,即设备改造后产品的合格率更高,因此,设备改造后性能更好.(3)用频率估计概率,1 000件产品中大约有960件合格品,40件不合格品,则180×960-100×40=168800,∴该企业大约能获利168 800元. [专题跟踪检测](对应配套卷P200)1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A.3B.4D.6C.5解析:选B由系统抽样可知,35人分为7组,每组5人,最后一组成绩均大于151,前两组成绩均小于139,故成绩在区间[139,151]上的运动员人数为4. 2.“双色球”彩票中红色球的号码由编号为01,02,…,33的33个个体组成,一位彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为( )A.23C.02 D.17解析:选C从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.故选C.3.(2018·昆明调研)下图是1951~2016年我国年平均气温变化图.根据上图,判断下列结论正确的是( )A.1951年以来,我国年平均气温逐年增高B.1951年以来,我国年平均气温在2016年再创新高C.2000年以来,我国年平均气温都高于1981~2010年的平均值D.2000年以来,我国年平均气温的平均值高于1981~2010年的平均值解析:选D由1951~2016年我国年平均气温变化图可以看出,年平均气温有升高的也有降低的,所以选项A不正确;2016年的年平均气温不是最高的,所以选项B不正确;2012年的年平均气温低于1981~2010年的平均值,所以选项C不正确;2000年以来,只有2012年的年平均气温低于1981~2010年的平均值,所以2000年以来,我国年平均气温的平均值高于1981~2010年的平均值,故选项D正确,故选D.4.(2018·惠州模拟)某商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程y=bx +a^中的b^=-2,气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣销售量约为( )A .46件B .40件C .38件D .58件解析:选A 由题中数据,得x =10,y =38,回归直线y ^=b ^x +a ^过点(x ,y ),且b ^=-2,代入得a ^=58,则回归方程y ^=-2x +58,所以当x =6时,y =46,故选A.5.(2018·郑州质量预测)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为( )A.49 B .2 C.94D .9解析:选C 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4.由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a +4b =14(a +b )⎝⎛⎭⎫1a +4b =14⎝⎛⎭⎫1+4a b +b a +4≥14×(5+4)=94(当且仅当b =2a 时取等号).故1a+4b的最小值为94,选C. 6.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )6.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140解析:选D 由频率分布直方图可知,每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,所以每周的自习时间不少于22.5小时的人数是200×0.7=140.7.空气质量指数(AirQ ualityIndex ,简称A Q I)是定量描述空气质量状况的指数,空气质量按照A Q I 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的A Q I 记录数据中,随机抽取10个,其茎叶图记录如图所示.根据该统计数据,估计此地该年A Q I 大于100的天数约为__________.(该年为365天)解析:该样本中A Q I 大于100的频数是4,频率为25,由此估计该地全年A Q I 大于100的概率为25,估计此地该年A Q I 大于100的天数约为365×25=146.答案:1468.某学校高二年级共有女生300人,现调查她们每天的课外运动时间,发现她们的课外运动时间介于30分钟到90分钟,如图是统计结果的频率分布直方图,则她们的平均运动时间大约是________分钟.解析:由题图得平均运动时间约为35×0.1+45×0.1+55×0.5+65×0.2+75×0.05+85×0.05=56.5(分钟). 答案:56.59.如图所示的茎叶图记录了甲、乙两位射箭运动员的5次比赛成绩(单位:环),若两位运动员平均成绩相同,则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.解析:由题意知87+89+90+91+935=90,则88+89+90+91+90+x5=90,解得x =2,所以s 2甲=15×[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4,s 2乙=15×[(88-90)2+(89-90)2+(90-90)2+(91-90)2+(92-90)2]=2,所以s 2甲>s 2乙,所以成绩较为稳定(方差较小)的那位运动员成绩的方差为2.答案:210.某公司为了解广告投入对销售收益的影响,在若干地区共投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图,计算图中各小矩形的宽度;(2)试估计该公司投入4万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:由表中的数据显示,x 与y 之间存在线性相关关系,请将(2)的结果填入空白栏,并求出y 关于x 的回归直线方程.附:b ^=∑i=1nxiyi -n x y∑i=1nx2i -n x 2,a ^=y -b ^x .解:(1)设各小矩形的宽度为m ,由频率分布直方图中各小矩形的面积和为1,可知(0.08+0.10+0.14+0.12+0.04+0.02)·m =1,解得m =2,故图中各小矩形的宽度为2.(2)由(1)知各分组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],它们的中点的横坐标分别为1,3,5,7,9,11,各组对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,故可估计销售收益的平均值为1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5.(3)由(2)可知空白栏中填5,由题意可知,x =1+2+3+4+55=3,y =2+3+2+5+75=3.8,∑i=15x i y i =1×2+2×3+3×2+4×5+5×7=69,∑i=15x2i =12+22+32+42+52=55,所以b ^=69-5×3×3.855-5×32=1.2,a ^=3.8-1.2×3=0.2,故所求的回归直线方程为y ^=1.2x +0.2.11.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=错误!,解:(1)第二种生产方式的效率更高. 理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min ,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min ,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80 min ;用第二种生产方式的工人完成生产任务所需平均时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分) (2)由茎叶图知m =79+812=80.列联表如下:(3)因为K 2=错误!=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.12.在一次抽样调查中测得样本的6组数据,得到一个变量y 关于x 的回归方程模型,其对应的数值如下表:(1)请用相关系数r 说明y 与x 之间存在线性相关关系(当|r |>0.75时,说明y 与x 之间具有线性相关关系); (2)根据(1)的判断结果,建立y 关于x 的回归直线方程并预测当x =9时,对应的y^值为多少(b^精确到0.01).附:回归直线方程为y ^=b ^x +a ^,其中b ^=∑i =1nxiyi -n x ·y∑i =1nx2i -n x 2,a ^=y -b ^x ,相关系数r 的公式为r =错误!. 参考数据:∑i =16x i y i =47.64,∑i =16x2i =139,i =16(x i -x )(y i -y )=-6.36, 错误!≈4.18, 错误!≈1.53.解:(1)由题意,得x =16×(2+3+4+5+6+7)=4.5,y =16×(3.00+2.48+2.08+1.86+1.48+1.10)=2,又i =16(x i -x )(y i -y )=-6.36, 错误!≈4.18,错误!≈1.53, 所以r =错误!≈错误!≈-0.99.因为|r |>0.75,所以y 与x 之间存在线性相关关系.(2)因为b ^=∑i =16xiyi -6x y∑i =16x2i -6x 2=47.64-6×4.5×2139-6×4.52≈-0.363≈-0.36,a ^=y -b ^x =2+0.363×4.5≈3.63,所以y 关于x 的线性回归方程为y ^=-0.36x +3.63.将x =9代入回归方程得y ^=-0.36×9+3.63=0.39. 13.(2019届高三·广州调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X (单位:小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y (千克)与使用某种液体肥料的质量x (千克)之间的对应数据为如图所示的折线图.(1)依据折线图计算相关系数r (精确到0.01),并据此判断是否可用线性回归模型拟合y 与x 的关系.(若|r |>0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X 限制,并有如下关系:对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.若商家安装了3台光照控制仪,求商家在过去50周的周总利润的平均值.附:相关系数公式:r =错误!,参考数据:0.3≈0.55,0.9≈0.95.解:(1)由已知数据可得x =2+4+5+6+85=5,y =3+4+4+4+55=4.因为i =15(x i -x )(y i -y )=(-3)×(-1)+0+0+0+3×1=6,错误!=错误!=2错误!, 错误!=错误!=错误!, 所以相关系数r =错误! =625×2=0.9≈0.95.因为|r |>0.75,所以可用线性回归模型拟合y 与x 的关系.。