2018届高考数学高考复习指导大二轮专题复习课后强化训练专题7 第1讲统计与统计案例 Word版含解析
2018年高考数学总复习统计与统计案例(2021年整理)
2018年高考数学总复习统计与统计案例(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018年高考数学总复习统计与统计案例(word版可编辑修改))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018年高考数学总复习统计与统计案例(word版可编辑修改)的全部内容。
第三节统计与统计案例考纲解读1. 理解随机抽样的必要性和重要性。
2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.4. 理解样本数据标准差的意义和作用,会计算数据标准差.5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。
6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。
(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.命题趋势探究1。
本节内容是高考必考内容,以选择题、填空题为主.2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。
(1)(2)有结合趋势,考题难度中下.3。
统计案例为新课标教材新增内容,考查考生解决实际问题的能力。
高考数学二轮复习专题突破—统计与统计案例(含解析)
高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。
高考数学二轮复习 第1部分 重点强化专题 专题3 概率与统计 专题限时集训7 回归分析、独立性检验
专题限时集训(七) 回归分析、独立性检验(对应学生用书第91页)(限时:40分钟)1.(2017·某某一模)下列说法错误的是( )【导学号:07804050】A .回归直线过样本点的中心(x ,y )B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小D .在回归直线方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^就增加0.2个单位C [根据相关定义知选项A ,B ,D 均正确;选项C 中,对分类变量X 与Y ,随机变量K 2的观测值k 越大,对判断“X 与Y 有关系”的把握程度越大,故C 错误.选C.]2.(2017·某某名校联考)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 和Y 有关系”的可信度.如果k >3.841,那么有把握认为“X 和Y 有关系”的百分比为C .99.5%D .95%D [由图表中数据可得,当k >3.841时,有0.05的几率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的几率,也就是有95%的把握认为变量之间有关系,故选D.]3.(2017·某某七市联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如下表(单位:万元):广告费x 2 3 4 5 6 销售额y2941505971由上表可得回归方程为y ^=10.2x +a ^,据此模型,预测广告费为10万元时销售额约为( )【导学号:07804051】A .101.2万元B .108.8万元C .111.2万元D .118.2万元C [根据统计数据表,可得x =15×(2+3+4+5+6)=4,y =15×(29+41+50+59+71)=50,而回归直线y ^=10.2x +a ^经过样本点的中心(4,50),∴50=10.2×4+a ^,解得a ^=9.2,∴回归方程为y ^=10.2x +9.2,∴当x =10时,y ^=10.2×10+9.2=111.2,故选C.]4.(2017·某某二模)现行普通高中学生在高一升高二时面临着选文理科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如图77所示的两个等高堆积条形图.图77根据这两幅图中的信息,下列哪个统计结论是不正确的( ) A .样本中的女生数量多于男生数量B .样本中有理科意愿的学生数量多于有文科意愿的学生数量C .样本中的男生偏爱理科D .样本中的女生偏爱文科D [由图2知,样本中的女生数量多于男生数量,样本中的男生、女生均偏爱理科;由图1知,样本中有理科意愿的学生数量多于有文科意愿的学生数量,故选D.] 5.(2016·某某模拟)对四组不同数据进行统计,分别获得以下散点图,如果对它们的相关系数进行比较,下列结论中正确的是( )图78(1)图78(2)图78(3)图78(4)A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3A [由给出的四组数据的散点图可以看出,图(1)和图(3)是正相关,相关系数大于0,图(2)和图(4)是负相关,相关系数小于0,图(1)和图(2)的点相对更加集中,所以相关性要强,所有r 1接近于1,r 2接近于-1,由此可得r 2<r 4<r 3<r 1.故选A.] 6.(2017·某某一模)设某中学的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kgD .若该中学某高中女生身高为160 cm ,则可断定其体重必为50.29 kgD [因为回归直线方程y ^=0.85x -85.71中x 的系数为0.85>0,因此y 与x 具有正线性相关关系,所以选项A 正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(x ,y ),所以选项B 正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,若该中学某高中女生身高增加 1 cm ,则其体重约增加0.85 kg ,所以选项C 正确,选项D 不正确.]7.在用线性回归方程研究四组数据的拟合效果中,分别作出下列四个关于四组数据的残差图,则用线性回归模式拟合效果最佳的是( )ABCDC[当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好,对比4个残差图,易知选项C的图对应的带状区域的宽度越窄.故选C.]8.(2017·某某南城一中、高安中学第九校3月联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线合计愿生452065不愿生132235合计5842100由K2=n ad-bc2a+b c+d a+c b+d,得K2=100×45×22-20×13265×35×58×42≈9.616.参照下表,P(K2≥k)0.0500.0100.001k 3.841 6.63510.828A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”C[K2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.]二、填空题9.(2017·某某二模)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得回归直线方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.【导学号:07804052】6 [x =5=5,y =5=5,代入回归直线方程,得14+c5=0.85×5-0.25,解得c =6.]10.(2017·某某百校联盟二模)已知x 、y 的取值为:从散点图可知y 与x 呈线性相关关系,且回归直线方程为y =1.2x +a ,则当x =20时,y 的取值为________.27.6 [由表格可知x =3,y =7.2,所以这组数据的样本点的中心是(3,7.2),根据样本点的中心在回归直线上,得7.2=a ^+1.2×3,得a ^=3.6,所以这组数据对应的回归直线方程是y ^=1.2x +3.6,将x =20代入,得y =1.2×20+3.6=27.6.]11.(2017·某某某某五中一模)某小卖部销售某品牌的饮料的零售价与销量间的关系统计如下:已知x ,y 的关系符合回归方程y =b x +a ,其中b =-20.若该品牌的饮料的进价为2元,为使利润最大,零售价应定为________元. 3.75 [x =3.5,y =40,∴a ^=40-(-20)×3.5=110, ∴回归直线方程为:y ^=-20x +110,利润L =(x -2)(-20x +110)=-20x 2+150x -220, ∴x =15040=3.75元时,利润最大,故答案为3.75.]12.(2017·某某三中二模)以模型y =c e kx(e 为自然对数的底)去拟合一组数据时,为了求出回归直线方程,设z =ln y ,其变换后得到线性回归方程为z =0.4x +2,则c =________. e 2[∵y =c e kx,∴两边取对数,可得ln y =ln(c e kx )=ln c +ln e kx=ln c +kx , 令z =ln y ,可得z =ln c +kx , ∵z =0.4x +2, ∴ln c =2, ∴c =e 2.] 三、解答题13.(2017·某某一模)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如图79所示的茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.图79(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系? (2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X 的分布列及数学期望. 附:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .P (K 2≥k 0)0.025 0.010 0.005 k 05.0246.6357.879正常 偏高 合计 男性 16 4 20 女性 12 8 20 合计281240K 2=n ad -bc 2a +bc +d a +cb +d =40×16×8-4×12220×20×28×12≈1.905<6.635,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系. (2)由样本数据可知,男性正常的概率为45,女性正常的概率为35.此项血液指标为正常的人数X 的可能取值为0,1,2,3,4,P (X =0)=⎝⎛⎭⎪⎫1-452⎝ ⎛⎭⎪⎫1-352=4625, P (X =1)=C 1245⎝⎛⎭⎪⎫1-45⎝⎛⎭⎪⎫1-352+⎝ ⎛⎭⎪⎫1-452C 1235·⎝ ⎛⎭⎪⎫1-35=44625, P (X =2)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫1-352+C 1245⎝ ⎛⎭⎪⎫1-45·C 1235·⎝ ⎛⎭⎪⎫1-35+⎝ ⎛⎭⎪⎫1-452⎝ ⎛⎭⎪⎫352=169625, P (X =3)=C 1245⎝ ⎛⎭⎪⎫1-45⎝ ⎛⎭⎪⎫352+⎝ ⎛⎭⎪⎫452C 1235·⎝⎛⎭⎪⎫1-35=264625, P (X =4)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫352=144625,所以X 的分布列为X 0 1 2 3 4 P462544625169625264625144625所以E (X )=0×625+1×625+2×625+3×625+4×625=2.8.14.(2017·某某三湘名校联盟三模)为了研究一种昆虫的产卵数y 和温度x 是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:y =C 1x 2+C 2与模型②:y =e C 3x +C 4作为产卵数y 和温度x 的回归方程来建立两个变量之间的关系.温度x /℃ 20 22 24 26 28 30 32 产卵数y /个6 10 21 24 64 113 322 t =x 2 400 484 576 676 784 900 1024 z =ln y1.792.303.043.184.164.735.77xtyz26692803.57错误! 错误! 错误! 错误!1157.540.430.32 0.00012其中t i =x 2i ,t =∑ni =1t i ,z i =ln y i ,z =∑ni =1z i ,附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=β^u +α^的斜率和截距的最小二乘估计分别为:β^=∑ni =1u i -uv i -v∑ni =1u i -u2,α^=v -β^u .图710(1)在答题卡中分别画出y 关于t 的散点图、z 关于x 的散点图,根据散点图判断哪一个模型更适宜作为回归方程类型?(给出判断即可,不必说明理由).图711(2)根据表中数据,分别建立两个模型下y 关于x 的回归方程;并在两个模型下分别估计温度为30℃时的产卵数.(C 1,C 2,C 3,C 4与估计值均精确到小数点后两位)(参考数据:e 4.65≈104.58,e4.85≈127.74,e5.05≈156.02)(3)若模型①、②的相关指数计算得分分别为R 21=0.82,R 22=0.96,请根据相关指数判断哪个模型的拟合效果更好.【导学号:07804053】[解] (1)画出y 关于t 的散点图,如图1;z 关于x 的散点图,如图2.图1 图2根据散点图可判断模型②更适宜作为回归方程类型. (2)对于模型①:设t =x 2,则y =C 1x 2+C 2=C 1t +C 2,其中C ^1=∑7i =1t i -ty i -y∑7i =1t i -t2=0.43,C ^2=y -C ^1t =80-0.43×692=-217.56,所以y =0.43x 2-217.56,当x =30时,估计温度为y 1=0.43×302-217.56=169.44. 对于模型②:y =e C 3x +C 4⇒z =ln y =C 3x +C 4,word 其中C ^3=∑7i =1 z i -z x i -x∑7i =1x i -x2=0.32,C ^4=z -C ^3x =3.57-0.32×26=-4.75.所以y =e 0.32x -4.75,当x =30时,估计温度为y 2=e0.32×30-4.75=e 4.85≈127.74. (3)因为R 21<R 22,所以模型②的拟合效果更好.。
2018届高考(新课标)数学(理)大一轮复习(课件+检测)(基础梳理+热点题型+演练提升)-第十一章 统计
高考总复习·数学理科(RJ)
h
25
第十一章 统计与统计案例
跟踪训练 1 (1)四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:
①y 与 x 负相关且^y=2.347x-6.423;
②y 与 x 负相关且^y=-3.476x+5.648;
③y 与 x 正相关且^y=5.437x+8.493;
【答案】 D
高考总复习·数学理科(RJ)
h
17
第十一章 统计与统计案例
4.(2017·湖南三校联考)某产品在某零售摊位的零售价 x(单位:元)与每天的销售量y(单位:个)的统计资料如下表 所示:
x
16
17
18
19
y
50
34
41
高考总复习·数学理科(RJ)
h
31
18
第十一章 统计与统计案例
由上表可得线性回归方程^y=b^x+a^中的b^=-4,据此模型预
④y 与 x 正相关且^y=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①②
B.②③
C.③④
D.①④
高考总复习·数学理科(RJ)
h
26
第十一章 统计与统计案例
(2)变量X与Y相对应的一组数据为(10,1),(11.3,2),
(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数
【答案】 (1)D (2)①②
高考总复习·数学理科(RJ)
h
24
第十一章 统计与统计案例
【方法规律】 判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关; 点的分布从左上角到右下角,两个变量负相关. (2)相关系数:r>0 时,正相关;r<0 时,负相关. (3)线性回归方程中:b^>0 时,正相关;b^<0 时,负相关.
2018年高三最新 高考数学第二轮专题复习----概论统计专题 精品
《计数原理与概率》高考复习指导一、考试说明:1.考试内容(1)分类计数原理与分步计数原理,排列与组合.(2)等可能性事件的概率,互斥事件有一个发生的概率,相互独立事件同时发生的概率.2.考试要求(1)掌握分类计数原理与分步计数原理,并能用它们分析和解决一些简单的应用问题.(2)理解排列与组合的意义,掌握排列数与组合数的计算公式,掌握组合数的两个性质,并能用它们解决一些简单的应用问题.(3)了解等可能性事件的概率的意义,会用排列组合公式计算一些等可能性事件的概率.(4)了解互斥事件的意义,会用互斥事件的概率加法公式计算一些事件的概率.(5)了解相互独立事件的意义,会用相互独立事件的概率乘法公式计算一些事件的概率,会计算事件在n次独立重复试验中恰好发生k次的概率.二、高考试题分析排列与组合、概率与统计是高中数学的重要内容.一方面,这部分内容占用教学时数多达36课时,另一方面,这部分内容是进一步学习高等数学的基础知识,因此,它是高考数学命题的重要内容.从近三年全国高考数学(新材)试题来看,主要是考查排列与组合、概率与统计的基本概念、公式及基本技能、方法,以及分析问题和解决问题的能力.试题特点是基础和全面.题目类型有选择题、填空题、解答题,一般是两小(9分~10分)一大(12分),解答题通常是概率问题.试题难度多为低中档.为了支持高中数学课程的改革,高考数学命题对这部分将进一步重视,但题目数量、难度、题型将会保持稳定.例1.(1999年全国)在一块并排10垄的田地中,选择2垄分别种植A、B两种作物,每种作物种植一垄,为有利于作物生长,要求A、B两种作物间的间隔不小于6垄,则不同的选垄方法共有_______种(用数字作答).[解析]A种植在左边第一垄时,B有3种不同的种植方法;A种植在左边第二垄时,B有两种不同的种植方法;A种植在左边第三垄时,B只有一种种植方法.B在左边种植的情形与上述情形相同.故共有2(3+2+1)=12种不同的选垄方法.∴应填12.例2.(2018年新教材)将3种作物种植在如图所示的5块试验田里,每一块种植一种作物且相邻的试验田不能种植同一作物,不同的种植方法共有______种(以数字作答).[解析]将5块试验田从左到右依次看作甲、乙、丙、丁、戊,3种作物依次看作A、B、C,则3种作物都可以种植在甲试验田里,由于相邻的试验田不能种植同一种作物,从而可知在乙试验田里只能有两种作物.同理,在丙、丁、戊试验田里也只能有两种作物可以种植.由分步计数原理,不同的种植方法共有3×2×2×2=48种.∴应填:48例3.(2018年全国高考题)某城市中心广场建造一个花圃,花圃分为6个部分(如图),现要栽种4种不同颜色的花,每部分栽种1种且相邻部分不能栽种同样颜色的花,不同的栽法有_______种.[解析]由于第1、2、3块两两相邻,我们先安排这三块,给第1、2、3块种花时分别有4、3、2种种法,所以共有4×3×2=24种不同种法.下面给第4块种花,若第4块与第6块同色,只有一种种植方法,则第5块只有2种种法,若第4块与第2块同色时,共有2×1=2种种法.若第4块与第6块不同色,但第4块与第2块同色,则第6块有2种种植的方案,而第5块只有1种种法,共有2种不同的种植方法.若第4块与第6块不同色,但第4块与第2块不同色,则第6块有1种种法,则第5块也有一种不同种法,所以第4块与第6块不同色时,有1种种法.综上共有24×(2+2+1)=120种不同的种植方法.例4.(2018年春季考试题)某班新年联欢会原定的5个节目已排成节目单,开演前又增加了两个新节目,如果将这两个节目插入原节目单中,那么不同的插法的种数为A 、42B 、30C 、20D 、12[解析]将两个新节目插入5个固定顺序节目单有两种情况:(1)两个新节目相邻的插法种数为226A ;(2)两个节目不相邻的插法种数为26A ;由分类计数原理共有2226642A A +=种方法,选A.例5.(2018重庆)(本小题满分12分)设甲、已、丙三人每次射击命中目标的概率分别为0.7、0.6和0.5。
2018届高考理科数学二轮专题复习讲义。统计与统计案例
2018届高考理科数学二轮专题复习讲义。
统计与统计案例本文介绍了统计与统计案例中的一些考点和热点分类,以及一些跟踪演练题目的解析。
在考试中,会以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等。
同时,在概率与统计的交汇处命题,难度适中。
抽样方法有三种:简单随机抽样、系统抽样和分层抽样。
简单随机抽样适用于总体中个体数较少的情况,而系统抽样适用于个体数较多的情况。
分层抽样适用于总体由差异明显的几部分组成的情况。
对于一些具体的题目,我们可以根据题意和抽样比例计算出样本中产品的最小编号或者应该抽取的学生人数。
在随机抽样的各种方法中,每个个体被抽到的概率都是相等的。
系统抽样又称为“等距”抽样,被抽到的各个号码间隔相同。
分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例。
最后,我们来看一道跟踪演练题目。
题目要求从福利彩票“双色球”中选取红色球的6个号码,选取方法是从第1行、第9列和第10列的数字开始从左到右依次选取两个数字。
根据题意和随机数表,我们可以计算出第四个被选中的红色球号码为06.解析:1) 样本编号题目,根据系统抽样的方法,计算出样本组距为9,然后根据已知编号推算出样本中还有一个学生的编号为14,故选B。
2) 该部分内容排版混乱,需要重新排版。
频率分布直方图中,横坐标表示组距,纵坐标表示频率,频率等于组距乘以组距。
各小长方形的面积之和为1.在频率分布直方图中,最高的小长方形底边中点的横坐标即为众数。
中位数左边和右边的小长方形的面积和相等。
平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。
3) 根据题目可以列出方程,设未知数为x,平均数为a,中位数为b,众数为c,则有:(10+2+5+2+4+2+x)/7=a,中位数为2或5,众数为2,根据众数的定义可得c=2,因此有:b-a=c-b,代入已知数据可得b=3a-4,根据平均数的定义可得:(10+2+5+2+4+2+x)/7=a,解出a=5,代入b=3a-4可得b=11,因此中位数为11,根据中位数的定义可得:(10+2+5+2+4+2+x)/7=11,解出x=3,所以所有可能值之和为25+3=28,因此答案为B。
【高考数学】2018最新版本高三数学二轮专题复习课件:7.1统计与统计案例(专题拔高特训)
[答案]
D
[解析]
n 3 ∵ = ,∴n=13.故选 D. 120+80+60 60
(理)(2013· 新课标Ⅰ理, 3)为了解某地区的中小学生视力情 况,拟从该地区的中小学生中抽取部分学生进行调查,事先已 了解到该地区小学、初中、高中三个学段学生的视力情况有较 大差异,而男女生视力情况差异不大,在下面的抽样方法中, 最合理的抽样方法是( A.简单随机抽样 C.按学段分层抽样 ) B.按性别分层抽样 D.系统抽样
4.变量间的相关关系 (1) 利用散点图可以初步判断两个变量之间是否线性相 关.如果散点图中的点从整体上看大致分布在一条直线的附 近,我们说变量 x 和 y 具有线性相关关系. (2)用最小二乘法求回归直线的方程 ^x+a ^. 设线性回归方程为^ y=b ^是回归直线的斜率,a ^是截距. 其中,b
3.样本的数字特征 (1)众数 在样本数据中,频率分布最大值所对应的样本数据 (或出 现次数最多的那个数据). (2)中位数 样本数据中,将数据按大小排列,位于最中间的数据.如 果数据的个数为偶数,就取当中两个数据的平均数作为中位 数.
(3)平均数 1 - 样本数据的平均数 x =n(x1+x2+…+xn). (4)方差与标准差 方差 1 s = [(x1-- x )2+(x2-- x )2+…+(xn-- x )2]. n
2
标准差 s= 1 [x1-- x 2+x2-- x 2+…+xn-- x 2]. n
注意: (1)现实中总体所包含的个体数往往较多, 总体的平 均数与标准差、方差是不知道(或不可求)的,所以我们通常用 样本的平均数与标准差、方差来估计总体的平均数与标准差、 方差. (2)平均数反映了数据取值的平均水平, 标准差、 方差描述 了一组数据围绕平均数波动的大小.标准差、方差越大,数据 的离散程度越大,越不稳定.
名师伴你行届高考理科数学二轮复习专题突破题能专训第讲统计与统计案例公开课一等奖优质课大赛微课获奖课件
y2 b d b+d
总计 a+b c+d a+b+c+d
热点盘点
[二轮备考讲义] 第二部分 专题五 第2讲第11页 第11页
基础记忆
名师伴你行 ·高考二轮复习 ·数学(理)
构造一个随机变量 K2=a+bcn+add-ab+cc2b+d,其中 n=a
+b+c+d.
P(K2≥k) 0.100 0.050 0.025 0.010 0.001
名师伴你行 ·高考二轮复习 ·数学(理)
专项五 概率与统计
[二轮备考讲义] 第二部分 专题五 第2讲第3页 第3页
热点盘点
基础记忆
提能专训
名师伴你行 ·高考二轮复习 ·数学(理)
第二讲 统计与统计案例
[二轮备考讲义] 第二部分 专题五 第2讲第4页 第4页
热点盘点
基础记忆
提能专训
名师伴你行 ·高考二轮复习 ·数学(理)
基础记忆
名师伴你行 ·高考二轮复习 ·数学(理)
分组
频数 频率
(40,45]
n1
f1
(45,50]
n2
f2
(1)确定样本频率分布表中 n1,n2,f1 和 f2 的值;
(2)根据上述频率分布表,画出样本频率分布直方图;
提能专训
热点盘点
[二轮备考讲义] 第二部分 专题五 第2讲第18页 第18页
基础记忆
[二轮备考讲义] 第二部分 专题五 第2讲第10页 第10页
热点盘点
基础记忆
提能专训
名师伴你行 ·高考二轮复习 ·数学(理)
3.独立性检验
假设有两个分类变量 X 和 Y,它们的可能取值分别为{x1, x2}和{y1,y2},其样本频数列联表(称 2×2 列联表)为:
2018届高考数学一轮复习精选试题:统计(解答题) 含答案
统计02解答题(本大题共6个小题,共70分,解答应写出文字说明,证明过程或演算步骤)1.对某校高三年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(Ⅰ)求出表中,M p 及图中a 的值;(Ⅱ)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10, 15)内的人数;(Ⅲ)在所取样本中,从参加社区服务的次数不少于20次的学生中任选2人,求至多一人参加社区服务次数在区间[25, 30)内的概率.【答案】(Ⅰ)由分组[10,15)内的频数是10,频率是0.25知,100.25M =,所以40M =. 因为频数之和为40,所以1024240m +++=,4m =,40.1040m p M ===因为a 是对应分组[15,20)的频率与组距的商,所以240.12405a ==⨯(Ⅱ)因为该校高三学生有240人,分组[10,15)内的频率是0.25, 所以估计该校高三学生参加社区服务的次数在此区间内的人数为60人(Ⅲ)这个样本参加社区服务的次数不少于20次的学生共有26m +=人,设在区间[20,25]内的人为1224{,,,}a a a a ,在区间[25,30)内的人为12{,}b b .则任选2人共有1213141112232421(,),(,),(,),(,),(,),(,),(,),(,),a a a a a a a b a b a a a a a b 2234(,),(,)a b a a ,3132414212(,),(,),(,),(,),(,)a b a b a b a b b b 15种情况, 而两人都在[25,30)内只能是12{,}b b 一种, 所以所求概率为11411515P =-=2.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为35. (1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜爱打篮球与性别有关?说明你的理由;(3)已知喜爱打篮球的10位女生中,12345,,A A A A A ,,还喜欢打羽毛球,123B B B ,, 还喜欢打乒乓球,12C C ,还喜欢踢足球,现再从喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的女生中各选出1名进行其他方面的调查,求1B 和1C 不全被选中的概率.【答案】(1) 列联表补充如下:(2)∵2250(2015105)8.3337.87930202525K ⨯⨯-⨯=≈>⨯⨯⨯ ∴有99.5%的把握认为喜爱打篮球与性别有关.(3)从10位女生中选出喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的各1名,其一切可能的结果组成的基本事件如下:111112121()()()A B C A B C A B C ,,,,,,,,,122131()()A B C A B C ,,,,,,132(),A B C ,,211212221()()()A B C A B C A B C ,,,,,,,,,222()A B C ,,,231()A B C ,,,232()A B C ,,,311312321()()()A B C A B C A B C ,,,,,,,,,332()A B C ,,,322331()()A B C A B C ,,,,,,411412421()()()A B C A B C A B C ,,,,,,,,, 422431432()()()A B C A B C A B C ,,,,,,,,, 511512521()()()A B C A B C A B C ,,,,,,,,,522531532()()()A B C A B C A B C ,,,,,,,,,基本事件的总数为30,用M 表示“11B C ,不全被选中”这一事件,则其对立事件M 表示“11B C,全被选中”这一事件,由于M 由111211311()()()A B C A BCA B C ,,,,,,,,, 411511(,,),(,,)A B C A B C 5个基本事件组成,所以51()306P M ==,由对立事件的概率公式得15()1()166P M P M =-=-=.3.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据.(1)画出表中数据的散点图;(2)求出y 对x 的线性回归方程;(3)若广告费为9万元,则销售收入约为多少万元?【答案】 (1)散点图如图:(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以备计算a$、$b .于是5x 2=,69y 2=,代入公式得: $11223344222221234x y x y x y x y 4xy b x x x x 4x +++-=+++-25694184732255304()2-⨯⨯==-⨯, 69735ay bx 2.252=-=-⨯=-$ 故y 与x 的线性回归方程为$73yx 25=-,其中回归系数为735,它的意义是:广告支出每增加1万元,销售收入y 平均增加735万元. (3)当x=9万元时,73y 92129.45=⨯-=(万元).4.为适应新课改,切实减轻学生负担,提高学生综合素质,某市某学校高三年级文科生300人在数学选修4-4、4-5、4-7选课方面进行改革,由学生自由选择2门(不可多选或少选),选课情况如下表:(1)为了解学生情况,现采用分层抽样方法抽取了三科作业共50本,统计发现4-5有18本,试根据这一数据求出,a b 的值。
2018届高三数学文二轮新课标专题复习课件:1.7.1统计、统计案例 精品
女生 男生
高一年级 373 327
高二年级 y z
高三年级 x
340
A.14
B.15
C.16
D.17
【解析】选B.由已知得高三女生数x=2 000×0.18=360. 故高三年级总共有360+340=700(人). 而高一年级共有373+327=700(人). 所以高二年级共有2 000-700-700=600(人). 设高二年级应抽取的学生数为n,则由分层抽样的特点 知, n 6解00得,n=15.
A.56
B.60
C.120
D.140
【解题导引】利用频率乘以总体容量等于频数求解.
【规范解答】选D.由频率分布直方图可知,每周自习时 间不少于22.5小时的学生所占频率为 2.5×(0.16+0.08 +0.04)=0.7,所以每周自习时间不 少于22.5小时的学生人数为200×0.7=140.
3.重要性质及结论
(1)频率分布直方图的三个结论 ①小长方形的面积=_组__距___组 频__距 率_=频率;
②各小长方形的面积之和等于1;
频率
③小长方形的高=_组__距__,所有小长方形高的和为
1 组距
.
(2)回归直线方程:一组具有线性相关关系的数据
(x1,y1),(x2,y2),…,(xn,yn).其回归方程 y =__b_x__a_,其 过样本点中心_(_x_, y_)_.
50 2 000
【加固训练】 1.总体由编号为01,02,…,19,20的20个个体组成,利用 下面的随机数表选取5个个体,选取方法是从随机数表 第1行的第5列和第6列数字开始由左到右依次选取两个 数字,则选出来的第5个个体的编号为 ( )
2018届高考数学高考复习指导大二轮专题复习课后强化训练:专题7 第2讲计数原理与二项式定理理 含解析 精品
第一部分 专题七 第二讲A 组1.(2017·唐山市二模)将6名男生,4名女生分成两组,每组5人,参加两项不同的活动,每组3名男生和2名女生,则不同的分配方法有导学号 52134905( B )A .240种B .120种C .60种D . 180种[解析] 不同的分配方法有C 36C 24=120.2.若二项式(2x +a x )7的展开式中1x 3的系数是84,则实数a =导学号 52134906( C )A .2B .54 C .1D .24[解析] 二项式(2x +a x )7的通项公式为T r +1=C r 7(2x )7-r (a x )r =C r 727-r a r x 7-2r,令7-2r =-3,得r =5.故展开式中1x3的系数是C 5722a 5=84,解得a =1. 3.(2016·四川卷)用数字1,2,3,4,5组成没有重复数字的五位数,其中奇数的个数为导学号 52134907( D )A .24B .48C .60D .72[解析] 由题意,可知个位可以从1,3,5中任选一个,有A 13种方法,其他数位上的数可以从剩下的4个数字中任选,进行全排列,有A 44种方法,所以奇数的个数为A 13A 44=3×4×3×2×1=72,故选D .4.12名同学合影,站成了前排4人后排8人,现摄影师要从后排8人中抽2人调整到前排,其他人的相对顺序不变,则不同调整方法的种数是导学号 52134908( C )A .C 28A 23 B .C 28A 66 C .C 28A 26D .C 28A 25[解析] 要完成这件事,可分两步走:第一步可先从后排8人中选2人共有C 28种;第二步可认为前排放6个座位,先选出2个座位让后排的2人坐,由于其他人的顺序不变,所以有A 26种坐法.综上,由分步乘法计数原理知不同调整方法种数为C 28A 26种.5.由数字0、1、2、3、4、5组成且没有重复数字的六位数,其中个位数字小于十位数字的共有导学号 52134909( B )A .210个B .300个C .464个D .600个[解析] 由于组成没有重复数字的六位数,个位小于十位的与个位大于十位的一样多,故有C 15A 552=300(个).6.(3x -2x )8二项展开式中的常数项为导学号 52134910( B )A .56B .112C .-56D .-112[解析] T r +1=C r 8(3x )8-r (-2x )r =(-1)r 2r C r 8·x 8-4r 3,令8-4r =0,∴r =2,∴常数项为(-1)2×22×C 28=112.7.(2017·广东测试)在(x 2-12x )6的展开式中,常数项等于导学号 52134911( D )A .-54B .54C .-1516D .1516[解析] 本题考查二项式定理,二项式(x 2-12x )6的展开式的通项公式为C r 6(x 2)6-r(-12x )2=(-12)r C r 6x 12-3r,令12-3r =0得r =4,则二项式(x 2-12x )6的展开式中的常数项为(-12)4C 46=1516.故选D . 8.(2017·福建质检)四位男生和两位女生排成一排,男生有且只有两位相邻,则不同排法的种数是导学号 52134912( C )A .72B .96C .144D .240[解析] 本题考查排列组合,先在4位男生中选出2位,易知他们是可以交换位置的,则共有A 24种取法,然后再将2位女生全排列,共有A 22种排法,最后将3组男生插空全排列,共有A 33种排法,综上所述,共有A 24A 22A 33=144种不同的排法,故选C .9.从一个正方体的8个顶点中任取3个,则以这个3个点为顶点构成直角三角形的概率为导学号 52134913( A )A .67B .57C .47D .23[解析] 由于每个面上有直角三角形C 34=4(个),每对相对棱形成的对角面上有直角三角形C 34=4(个),因此直角三角形共有6×4+6×4=48(个),故所求概率P =48C 38=67. 10.有5名同学参加唱歌、跳舞、下棋三项比赛,每项比赛至少有一人参加,其中甲同学不能参加跳舞比赛,则参赛方案的种数为导学号 52134914( B )A .112B .100C .92D .76[解析] 甲同学有2种参赛方案,其余四名同学,若只参加甲参赛后剩余的两项比赛,则将四名同学先分为两组,分组方案有C 14·C 33+C 24C 22A 22=7,再将其分到两项比赛中去,共有分配方案数为7×A 22=14;若剩下的四名同学参加三项比赛,则将其分成三组,分组方法数是C 24,分到三项比赛上去的分配方法数是A 33,故共有方案数C 24A 33=36.根据两个基本原理共有方法数2×(14+36)=100(种).11.(2017·武汉调研)(x 2-x +1)5的展开式中x 3的系数为导学号 52134915( A ) A .-30 B .-24 C .-20D .20[解析] 本题考查二项式定理.[1+(x 2-x )]5展开式的第r +1项T r +1=C r 5(x 2-x )r,r =0,1,2,3,4,5,T r +1展开式的第k +1项为C r 5C k r ·(x 2)r -k (-x )k =C r 5C k r (-1)k ·x 2r -k,r =0,1,2,3,4,5,k =0,1,…,r ,当2r -k =3,即⎩⎪⎨⎪⎧ r =2,k =1或⎩⎪⎨⎪⎧r =3,k =3时是含x 3的项,所以含x 3项的系数为C 25C 12(-1)+C 35C 33(-1)3=-20-10=-30.故选A .12.(2017·云南统考)(-x +1x )10的展开式中x 2的系数等于导学号 52134916( A )A .45B .20C .-30D .-90[解析] ∵T r +1=(-1)r C r 10x 12rx -10+r =(-1)r C r 10x -10+32r ,令-10+32r =2,得r =8,∴展开式中x 2的系数为(-1)8C 810=45.13.有大小、形状完全相同的3个红色小球和5个白色小球,排成一排,共有__56__种不同的排列方法?导学号 52134917[解析] 从8个位置中选3个放红球,有C 38=56种不同方法.14.(2017·郑州高中第一次质量预测)二项式(x -2x)6的展开式中,x 2的系数是__60__.导学号 52135101[解析] 由二项展开式的通项公式得T r +1=C r 6x 6-r (-2x)r =C r 6x 6-2r(-2)r ,令6-2r =2,得r =2,所以x 2的系数为C 26(-2)2=60.15.在(2+x )5的展开式中,x 3的系数为__40__.(用数字作答)导学号 52134918[解析] 利用通项公式,T r +1=C r 525-r ·x r,令r =3,得出x 3的系数为C 35·22=40. 16.若对于任意实数x ,有x 5=a 0+a 1(x -2)+…+a 5(x -2)5,则a 1+a 3+a 5-a 0=__89__.导学号 52134919[解析] 令x =3得a 0+a 1+…+a 5=35,令x =1得a 0-a 1+…-a 5=1,两式相减得a 1+a 3+a 5=35-12=121,令x =2得a 0=25=32,故a 1+a 3+a 5-a 0=121-32=89.B 组1.安排6名歌手演出顺序时,要求歌手乙、丙均排在歌手甲的前面或者后面,则不同排法的种数是导学号 52134920( D )A .180B .240C .360D .480[解析] 将6个位置依次编号为1、2、3、…、6号,当甲排在1号或6号位时,不同排法种数为2A 55种;当甲排在2号或5号位时,不同排法种数为2A 13·A 44种;当甲排在3号或4号位置时,不同排法种数有2(A 22A 33+A 23A 33)种,∴共有不同排法种数,2A 55+2A 13A 44+2(A 22A 33+A 23A 33)=480种,故选D .2.(2017·潍坊模拟)如图,M 、N 、P 、Q 为海上四个小岛,现要建造三座桥,将这四个小岛连接起来,则不同的建桥方法有导学号 52134921( C )A .8种B .12种C .16种D .20种[解析] 把四个小岛看作四个点,可以两两之间连成6条线段,任选3条,共有C 36种情形,但有4种情形不满足题意,∴不同的建桥方法有C 36-4=16种,故选C .3.(2017·北京一模)设(1+x +x 2)n =a 0+a 1x +…+a 2n x 2n ,则a 2+a 4+…+a 2n 的值为导学号 52134922( B )A .3n +12B .3n -12[解析] (赋值法)令x =1,得a 0+a 1+a 2+…+a 2n -1+a 2n =3n .① 再令x =-1得,a 0-a 1+a 2+…-a 2n -1+a 2n =1.② 令x =0得a 0=1.则①+②得2(a 0+a 2+…+a 2n )=3n +1, ∴a 0+a 2+…+a 2n =3n +12,∴a 2+a 4+…+a 2n =3n +12-a 0=3n +12-1=3n -12.4.用数字0,1,2,3,4,5组成没有重复数字的五位数,其中比40 000大的偶数共有导学号 52134923( B )A .144个B .120个C .96个D .72个[解析] 据题意,万位上只能排4,5.若万位上排4,则有2×A 34个;若万位上排5,则有3×A 34个.所以共有2×A 34+3×A 34=5×24=120(个).故选B .5.将标号为1、2、3、4、5、6的6个小球放入3个不同的盒子中.若每个盒子放2个,其中标号为1,2的小球放入同一盒子中,则不同的方法共有导学号 52134924( C )A .12种B .16种C .18种D .36种[解析] 先将标号为1、2的小球放入一个盒子中有C 13种方法,再将其余4个小球中选取2个放入一个盒子中,有C 24种方法,余下的2个小球放入剩下的一个盒子中,∴共有C 13C 24=18种方法.6.(2017·临汾二模)已知(1+x )10=a 0+a 1(1-x )+a 2(1-x )2+…+a 10(1-x )10,则a 8等于导学号 52134925( D )A .-5B .5C .90D .180[解析] 因为(1+x )10=(-2+1-x )10,所以a 8等于C 810(-2)2=45×4=180.故选D .7.(2017·太原模拟)用5,6,7,8,9组成没有重复数字的五位数,其中有且仅有一个奇数夹在两个偶数之间的五位数的个数为导学号 52134926( A )A .36B .48[解析] 第一步,将3个奇数全排列有A 33种方法;第二步,将2个偶数插入,使它们之间只有一个奇数,共3种方法;第三步,将2个偶数全排列有A 22种方法,所以,所有的方法数是3A 33A 22=36.8.(2017·漳州二模)已知(2x -1)10=a 0+a 1x +a 2x 2+…+a 9x 9+a 10x 10,则a 2+a 3+…+a 9+a 10的值为导学号 52134927( D )A .-20B .0C .1D .20[解析] 令x =1得a 0+a 1+a 2+…+a 9+a 10=1,再令x =0,得a 0=1,所以a 1+a 2+…+a 9+a 10=0,又易知a 1=C 910×21×(-1)9=-20,所以a 2+a 3+…+a 9+a 10=20.9.(2017·昆明二模)在(ax 6+bx )4的二项展开式中,如果x 3的系数为20,那么ab 3=导学号 52134928( D )A .20B .15C .10D .5[解析] T r +1=C r 4·(ax 6)4-r ·(b x )r =C r 4a 4-r b r x 24-7r,令24-7r =3,得r =3,则4ab 3=20,∴ab 3=5.10.(2017·滨州一模)某校选定甲、乙、丙、丁、戊共5名教师到3个边远地区支教,每地至少1人,其中甲和乙一定不去同一地区,甲和丙必须去同一地区,则不同的选派方案共有导学号 52134929( B )A .27种B .30种C .33种D .36种[解析] 因为甲和丙同地,甲和乙不同地,所以有2,2,1和3,1,1两种分配方案, ①2,2,1方案:甲、丙为一组,从余下3人选出2人组成一组,然后排列,共有C 23×A 33=18种;②3,1,1方案:在丁、戊中选出1人,与甲丙组成一组,然后排列,共有C 12×A 33=12种.所以选派方案共有18+12=30种.故选B .11.若将函数f (x )=x 5表示为f (x )=a 0+a 1(1+x )+a 2(1+x )2+…+a 5(1+x )5,其中a 0,a 1,a 2,…,a 5为实数,则a 3=导学号 52134930( C )A . 15B .5C .10D .20[解析] f (x )=x 5=[(x +1)-1]5=(x +1)5-C 15(x +1)4+C 25(x +1)3-C 35(x +1)2+C 45(x +1)-C 55,∴a 3=C 25=10.12.(2017·淄博一模)某次联欢会要安排3个歌舞类节目,2个小品类节目和1个相声类节目的演出顺序,则同类节目不相邻的排法种数是导学号 52134931( B )A .72B .120C .144D .168[解析] 分2步进行分析:第1步,先将3个歌舞类节目全排列,有A 33=6种情况,排好后,有4个空位, 第2步,因为3个歌舞类节目不能相邻,则中间2个空位必须安排2个节目, 分2种情况讨论:①将中间2个空位安排1个小品类节目和1个相声类节目,有C 12A 22=4种情况,排好后,最后1个小品类节目放在两端,有2种情况, 此时同类节目不相邻的排法种数是6×4×2=48种;②将中间2个空位安排2个小品类节目,有A 22=2种情况,排好后,有6个空位,相声类节目有6个空位可选,即有6种情况,此时同类节目不相邻的排法种数是6×2×6=72种. 则同类节目不相邻的排法种数是48+72=120,故选B .13.(2017·济宁一模)若(x +2x )n 的展开式中各项的系数之和为81,且常数项为a ,则直线y =a 6x 与曲线y =x 2所围成的封闭区域面积为__323__.导学号 52134932[解析] ∵(x +2x )n 的展开式中各项的系数之和为81,∴3n =81,解得n =4,(x +2x )4的展开式的通项公式为:T r +1=C r 4·2r ·x 4-2r , 令4-2r =0,解得r =2,∴展开式中常数项为a =C 24·22=24, ∴直线y =4x 与曲线y =x 2所围成的封闭区域面积为S =⎠⎛04(4x -x 2)d x =(2x 2-13x 3)|40=323. 14.(2017·湖南东部六校联考)如果(3x -13x 2)n 的展开式中各项系数之和为128,则展开式中1x3的系数是__21__.导学号 52134933[解析] (3x -13x 2)n 的展开式的各项系数之和为(3×1-1312)n =2n =128,所以n =7,所以(3x -13x 2)n =(3x -13x 2)7,其展开式的通项为T r +1=C r 7(3x )7-r(-13x 2)r =C r 7·37-r ·x 7-r ·(-x -23)r =(-1)r C r 737-rx 7-53r ,由7-53r =-3,得r =6,所以1x3的系数是C r 7·(-1)6·3=21. 15.(2017·潍坊一模)将编号1,2,3,4的四个小球放入3个不同的盒子中,每个盒子里至少放1个,则恰有1个盒子放有2个连号小球的所有不同放法有__18__种.(用数字作答)导学号 52134934[解析] 先把4个小球分为(2,1,1)一组,其中2个连号小球的种类有(1,2,),(2,3),(3,4)为一组,分组后分配到三个不同的盒子里,共有C 13A 33=18种.16.(2017·广东八市联考)现有16张不同的卡片,其中红色、黄色、蓝色、绿色卡片各4张,从中任取3张,要求取出的这些卡片不能是同一种颜色,且红色卡片至多1张,不同取法的种数为__472__.导学号 52134935[解析] 由题意,不考虑特殊情况,共有C 316种取法,其中每一种卡片各取三张,有4C 34种取法,两种红色卡片,共有C 24C 112种取法,故所求的取法共有C 316-4C 34-C 24C 112=560-16-72=472.。
2018届高三数学一轮复习: 重点强化课5 统计与统计案例
重点强化课(五) 统计与统计案例[复习导读] 本章是新课程改革增加内容,是命题的热点,以程序框图、回归分析、统计图表为重点,以客观题为主.命题注重背景新颖、角度灵活.但近几年统计与统计案例、统计与概率交汇,加大了考查力度.2015年、2016年全国卷均以解答题的形式呈现,强化统计思想方法和创新应用意识的考查,复习过程中应引起注意,多变换角度,注重新背景、新材料题目的训练.重点1 程序框图及应用☞角度1 程序框图与数列交汇执行如图1的程序框图,如果输入的N =100,则输出的X =( )A .0.95B.0.98C.0.99D.1.00图1C [由程序框图知,输出的X 表示数列⎩⎪⎨⎪⎧⎭⎪⎬⎪⎫1n (n +1)的前99项和,∴X =11×2+12×3+…+199×100=⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫12-13+…+⎝ ⎛⎭⎪⎫199-1100=99100.] ☞角度2 程序框图与统计的渗透(2017·合肥模拟)随机抽取某中学甲、乙两个班各10名同学,测量他们的身高获得身高数据的茎叶图如图2,在样本的20人中,记身高在[150,160),[160,170),[170,180),[180,190)的人数依次为A 1,A 2,A 3,A 4.如图3是统计样本中身高在一定范围内的人数的算法框图.若图中输出的S=18,则判断框应填________.【导学号:01772372】图2图3i<5?或i≤4?[由于i从2开始,也就是统计大于或等于160的所有人数,于是就要计算A2+A3+A4,因此,判断框应填i<5?或i≤4?.]☞角度3程序框图与函数交汇渗透如图4所示的程序框图的输入值x∈[-1,3],则输出值y的取值范围为()【导学号:01772373】图4A.[1,2] B.[0,2]C.[0,1]D.[-1,2]B[当0≤x≤3时,1≤x+1≤4,所以,0≤log2(x+1)≤2.当-1≤x<0时,0<-x≤1⇒1<2-x≤2,所以,0<2-x-1≤1.因此输出值y的取值范围为[0,2].][规律方法] 1.完善程序框图:结合初始条件和输出结果,分析控制循环的变量应满足的条件或累加、累乘的变量的表达式.2.求解该类问题,关键是准确理解程序框图的结构,明确程序框图的功能,按照程序框图中的条件进行程序.重点2用样本估计总体(2015·全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图①图5B地区用户满意度评分的频数分布表比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图②图5(2)根据用户满意度评分,将用户的满意度分为三个等级:[解](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.5分(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.12分[规律方法] 1.利用统计图表解决实际问题的关键在于从统计图表中提炼准确的数据信息.2.本例通过画频率分布直方图考查对数据的处理能力和数形结合的思想方法,通过求概率考查运算求解能力和实际应用意识.[对点训练1]为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图6所示.图6(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.[解] (1)设甲校高三年级学生总人数为n .由题意知30n =0.05,解得n =600.2分样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为⎝ ⎛⎭⎪⎫1-530×100%≈83%.5分 (2)设甲、乙两校样本平均数分别为x ′1,x ′2,根据样本茎叶图可知30(x ′1-x ′2)=30x ′1-30x ′2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15,因此x ′1-x ′2=0.5,故x 1-x 2的估计值为0.5分.12分重点3 统计的应用(2016·全国卷Ⅰ)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:图7记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.(1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?[解] (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700,所以y 与x 的函数解析式为y =⎩⎨⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ).4分 (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.8分(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4300×20+4 800×10)=4 000.10分若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.12分[规律方法] 1.本题将分段函数、频率分布、样本的数字特征交汇命题,体现了统计思想的意识和应用.2.本题易错点有两处:一是混淆频率分布直方图与柱状图致误;二是审题不清或不懂题意,导致解题无从入手.避免此类错误,需认真审题,读懂题意,并认真观察频率分布直方图与柱状图的区别,纵轴表示的意义.[对点训练2] 某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市民,得到数据如下表:(1)点与年龄有关?(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取6人作进一步调查,将这6位市民作为一个样本,从中任选2人,求恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率.下面的临界值表供参考:(参考公式:K 2=⎝ ⎛⎭⎪⎫(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d ) [解] (1)K 2=55(20×20-10×5)230×25×25×30≈11.978>7.879, 所以在犯错误的概率不超过0.5%的前提下认为喜欢“人文景观”景点与年龄有关.5分(2)设所抽样本中有m 个“大于40岁”市民,则m 20=630,得m =4,所以样本中有4个“大于40岁”的市民,2个“20岁至40岁”的市民,分别记作B1,B2,B3,B4,C1,C2.从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,C1),(B1,C2),(B2,B3),(B2,B4),(B2,C1),(B2,C2),(B3,B4),(B3,C1),(B3,C2),(B4,C1),(B4,C2),(C1,C2),共15个.10分其中恰有1名“大于40岁”和1名“20岁至40岁”的市民的事件有(B1,C1),(B1,C2),(B2,C1),(B2,C2),(B3,C1),(B3,C2),(B4,C1),(B4,C2),共8个.所以恰有1名“大于40岁”的市民和1名“20岁至40岁”的市民的概率为P=815.12分。
2018年高考数学二轮复习第1部分重点强化专题专题3概率与统计突破点7用样本估计总体学案文
打破点 7 用样本预计整体[ 中心知识提炼]提炼 1 频次散布直方图频次频次.(1) 频次散布直方图中横坐标表示组距,纵坐标表示组距,频次=组距×组距(2) 频次散布直方图中各小长方形的面积之和为 1.(3)利用频次散布直方图预计众数、中位数与均匀数.在频次散布直方图中:① 最高的小长方形底边中点的横坐标即是众数;②中位数左侧和右侧的小长方形的面积和是相等的;③均匀数是频次散布直方图的“重心”,等于频次散布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.提炼 2 样本的数字特点(1)众数、中位数.1(2)样本均匀数 x =n( x1+ x2++ x n).2122 2(3) 样本方差s =n[( x1- x )+( x2- x )++( x n- x ) ].(4) 样本标准差122 2s=n[x1-x+x2- x++x n- x] .[ 高考真题回访]回访 1统计图表1.(2017 ·全国卷Ⅲ) 某城市为认识旅客人数的变化规律,提升旅行服务质量,采集并整理了 2014 年 1 月至 2016 年 12 月时期月招待旅客量( 单位:万人 ) 的数据,绘制了下边的折线图.图 7-1( )依据该折线图,以下结论错误的选项是A.月招待旅客量逐月增添B.年招待旅客量逐年增添C.各年的月招待旅客量顶峰期大概在7,8 月D.各年 1 月至 6 月的月招待旅客量相关于 7 月至 12 月,颠簸性更小,变化比较安稳 A [ 关于选项 A,由图易知月招待旅客量每年 7,8 月份明显高于 12 月份,故 A 错;关于选项 B,察看折线图的变化趋向可知年招待旅客量逐年增添,故 B 正确;关于选项 C, D,由图可知明显正确.应选 A.]2.(2016 ·全国卷Ⅲ) 某旅行城市为向旅客介绍当地的气温状况,绘制了一年中各月均匀最15 ℃,B高气平和均匀最低气温的雷达图.图7-2 中 A点表示十月的均匀最高气温约为( )点表示四月的均匀最低气温约为 5 ℃. 下边表达不正确的选项是图 7-2A.各月的均匀最低气温都在0 ℃以上B.七月的均匀温差比一月的均匀温差大C.三月和十一月的均匀最高气温基真同样D.均匀最高气温高于20 ℃的月份有 5 个D [ 关于选项A,由图易知各月的均匀最低气温都在0 ℃以上, A 正确;关于选项B,七月的均匀最高气温点与均匀最低气温点间的距离大于一月的均匀最高气温点与平均最低气温点间的距离,所以七月的均匀温差比一月的均匀温差大, B 正确;关于选项 C,三月和十一月的均匀最高气温均为10 ℃,所以 C 正确;关于选项D,均匀最高气温高于20 ℃的月份有七月、八月,共 2 个月份,故 D 错误.]3.(2015 ·全国卷Ⅱ) 某企业为认识用户对其产品的满意度,从 A,B 两地域分别随机检查了40 个用户,依据用户对产品的满意度评分,获取 A 地域用户满意度评分的频次散布直方图和B地域用户满意度评分的频数散布表.A地域用户满意度评分的频次散布直方图图 7-3①B地域用户满意度评分的频数散布表满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100] 频数 2 8 14 10 6 (1)在图②中作出 B 地域用户满意度评分的频次散布直方图,并经过直方图比较两地区满意度评分的均匀值及分别程度( 不要求计算出详细值,给出结论即可) ;B地域用户满意度评分的频次散布直方图图 7-3②(2)依据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于 70分70分到 89分满意度等级不满意满意预计哪个地域用户的满意度等级为不满意的概率大?说明原因.[ 解 ] (1) 以下图.不低于 90 分特别满意3 分经过两地域用户满意度评分的频次散布直方图能够看出, B 地域用户满意度评分的平均值高于 A 地域用户满意度评分的均匀值; B 地域用户满意度评分比较集中,而 A 地区用户满意度评分比较分别. 6 分(2)A 地域用户的满意度等级为不满意的概率大.8 分记C A表示事件:“A 地域用户的满意度等级为不满意”;C B表示事件:“B 地域用户的满意度等级为不满意”.由直方图得 P( C A)的预计值为++×10=,10分P( C B)的预计值为+×10=.所以 A 地域用户的满意度等级为不满意的概率大.12 分回访 2 样本的数字特点4.(2017 ·全国卷Ⅰ) 为评估一种农作物的栽种成效,选了n 块地作试验田.这n 块地的亩产量 ( 单位: kg) 分别为x1,x2,,x n,下边给出的指标中能够用来评估这类农作物亩产量稳固程度的是()A.x1,x2,,x n的均匀数B.x1,x2,,x n的标准差C.x1,x2,,x n的最大值D.x1,x2,,x n的中位数B[ 由于能够用极差、方差或标准差来描绘数据的失散程度,所以要评估亩产量稳固程度,应当用样本数据的极差、方差或标准差.应选B.]5.(2013 ·全国卷Ⅰ) 为了比较两种治疗失眠症的药( 分别称为 A 药, B 药 ) 的疗效,随机地选用 20 位患者服用 A 药, 20 位患者服用 B 药,这 40 位患者在服用一段时间后,记录他们日均匀增添的睡眠时间 ( 单位: h) .试验的观察结果以下:服用 A 药的 20 位患者日均匀增添的睡眠时间:0. 63. 52. 3服用 B 药的 20 位患者日均匀增添的睡眠时间:3. 21. 42. 7(1)分别计算两组数据的均匀数,从计算结果看,哪一种药的疗效更好?(2)依据两组数据达成下边茎叶图,从茎叶图看,哪一种药的疗效更好?图 7-4[ 解 ] (1) 设 A 药观察数据的均匀数为x ,B药观察数据的均匀数为y .由观察结果可得1x =20+++++++++++++++++++=, 2 分1y =20+++++++++++++++++++=. 4 分由以上计算结果可得x > y ,所以可看出A药的疗效更好. 6 分(2)由观察结果可绘制茎叶图如图:9 分7从以上茎叶图能够看出, A 药疗效的试验结果有10的叶集中在茎“2. ”,“ 3. ”上,7而 B 药疗效的试验结果有10的叶集中在茎“0. ”,“ 1. ”上,由此可看出 A 药的疗效更好.12分热门题型1频次散布直方图和数字特点题型剖析:频次散布直方图多以生活中的实质问题为背景,考察学生运用已知数据分析问题的能力,难度中等.【例 1】 (2017 ·黄山二模 ) 全球愈来愈关注环境保护问题,某监测站点于2016年8月某日起连续 n 天监测空气质量指数(AQI) ,数据统计以下表:空气质量指数 ( μg/m 3) [0,50] (50,100] (100,150] (150,200] (200,250] 空气质量等级优良轻度污染中度污染重度污染天数20 40 m 10 5(1)依据所给统计表和频次散布直方图中的信息求出 n, m的值,并达成频次散布直方图;图 7-5(2) 由频次散布直方图,求该组数据的均匀数与中位数;(3) 在空气质量指数分别为 (50,100] 和 (150,200] 的监测数据中,用分层抽样的方法抽取 5 天,从中随意选用2 天,求事件A “两天空气质量等级都为良”发生的概率.20 [ 解] (1) ∵× 50=n ,∴ n = 100,∵ 20+40+ m + 10+ 5= 100,∴ m =25.40 =; 25 =; 10 =; 5 =.2 分100×50 100×50 100×50 100×50由此达成频次散布直方图,如图:4 分(2) 由频次散布直方图得该组数据的均匀数为25×× 50+75×× 50+125×× 50+175×× 50+225×× 50= 95,6 分∵ [0,50] 的频次为× 50=, (50,100) 的频次为× 50=,∴中位数为 50+错误 ! ×50=.8 分(3) 由题意知在空气质量指数为 (50,100] 和(150,200] 的监测天数中分别抽取4天和 1 天,9 分在所抽取的 5 天中,将空气质量指数为(50,100] 的 4 天赋别记为 a , b ,c , d ;将空气质量指数为 (150,200] 的 1 天记为 e ,从中任取 2 天的基本领件为 ( a ,b ) , ( a ,c ) , ( a ,d ) ,( a ,e ) ,( b ,c ) ,( b ,d ) ,( b ,e) , ( ,),(, ),( , ),共 10个,10 分cd ce d e此中事件 A “两天空气质量等级都为良”包括的基本领件为 ( a ,b ) ,( a ,c ) ,( a ,d ) ,( b , c ) , ( b , d ) , ( c , d ) ,共 6 个,11 分6 3所以 P ( A ) = 10= 5. 12 分[ 方法指津 ]解决该类问题的要点是正确理解已知数据的含义,掌握图表中各个量的意义,经过图表对已知数据进行剖析.频次提示: (1) 小长方形的面积表示频次,其纵轴是,而不是频次.组距(2)各组数据频次之比等于对应小长方形的高度之比.[ 变式训练1] 某电子商务企业随机抽取 1 000 名网络购物者进行检查.这 1 000 名购物者某年网上购物金额( 单位:万元 ) 均在区间[,] 内,样安分组为:[, ,[ ,,[, ,[, ,[, ,[,] ,购物金额的频次散布直方图以下:图 7-6电子商务企业决定给购物者发放优惠券,其金额( 单位:元 ) 与购物金额关系以下:购物金额分组[,[,[,[,]发放金额50100150200(1)求这 1 000 名购物者获取优惠券金额的均匀数;(2)以这 1 000 名购物者购物金额落在相应区间的频次作为概率,求一个购物者获取优惠券金额许多于150 元的概率.[ 解 ] (1) 购物者的购物金额x 与获取优惠券金额y 的频次散布以下表:x ≤ x< ≤ x< ≤x< ≤ x≤y 50 100 150 200频次所以这 1 000 名购物者获取优惠券金额的均匀数为:50×400+ 100×300+150×280+200×204 分1 000 =96.(2) 由获取优惠券金额 y 与购物金额 x 的对应关系,有P( y=150)= P≤x<=(2+×=,( =200) =≤≤=×=,10 分P y P x进而,获取优惠券金额许多于150 元的概率为P( y≥150)= P( y=150)+P( y=200)=+=.12 分热门题型 2茎叶图和数字特点题型剖析:联合样本数据和茎叶图对整体作出预计是高考命题的热门,应惹起足够的重视,难度中等.【例 2】(2017 ·武汉二模 ) 在某小学体育素质达标运动会上,对10 名男生和10 名女生在一分钟内跳绳的次数进行统计,得以下茎叶图:图 7-7(1) 已知男生组数据的中位数为125,女生组数据的均匀数为124,求x,y的值;(2)从一分钟内跳绳次数不低于 110 次且不高于 120 次的学生中任取两名,求两名学生中起码有一名男生的概率.7+x[ 解] (1) ∵120+2=125, 2 分∴ x=3. 3 分1∵10 (100 +110×3+120×3+130×2+ 140 + 9+y+ 5 + 8 + 4 + 5+ 6+ 3+ 5+ 1) =124 , 5 分∴ y = 4. 6 分(2) 不低于 110 且不高于120 的男生有两名,记为 A ,A ,不低于110且不高于120 的1 2女生有三名,记为B,B,B,1 2 3从这 5 名学生中任取两名学生共有{ A1,A2} , { A1,B1} , { A1,B2} , { A1,B3} , { A2,B1} ,{ A2,B2} ,{ A2,B3} , { B1,B2} , { B1,B3} ,{ B2,B3} ,共 10 种情况.若两名学生中一男一女有 { A1,B1} ,{ A1,B2} ,{ A1,B3} ,{ A2,B1} ,{ A2,B2} ,{ A2,B3} ,共 6种情况. 9 分若两名学生均为男生只有 { 1,2} 一种情况,A A则切合题意的共有 m=6+1=7种.10 分m 7故用古典概型公式可得切合条件的概率P=n=10 .12 分[ 方法指津 ]作茎叶图时先要弄清“茎”和“叶”分别代表什么,依据茎叶图,能够获取数据的众数、中位数,也可从图中直接预计出两组数据的均匀数大小与稳固性.[ 变式训练2] ( 名师押题 ) 某车间 20 名工人年纪数据以下表:图 7-8(1)求这 20 名工人年纪的众数与极差;(2)以十位数为茎,个位数为叶,作出这20 名工人年纪的茎叶图;(3) 求这 20 名工人年纪的方差 .[ 解 ] (1) 由题表中的数据易知,这20 名工人年纪的众数是30,极差为40- 19= 21.2 分(2)这 20 名工人年纪的茎叶图以下:6 分1(3)这 20 名工人年纪的均匀数x=20(19 ×1+28×3+29×3+30×5+31×4+32×3+40×1) = 30,8 分2 1 2 2 2 2故方差s =20[1×(19-30) +3×(28 - 30) +3×(29 - 30) +5×(30 - 30) +4×(3 12 2 2 1- 30) +3×(32 - 30) +1×(40 - 30) ] =20×(121 + 12+ 3+0+ 4+ 12+ 100) =.。
2018届高考(新课标)数学(文)大一轮复习(课件+检测)(基础梳理+热点题型+演练提升)-第十章 统计与
§10.2 用样本估计总体 [考纲要求] 1.了解分布的意义和作用,会列频率分布表,会 画频率分布直方图、频率折线图、茎叶图,理解它们各自的特 点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3. 能从样本数据中提取基本的数字特征(平均数、标准差),并给出 合理解释.4.会用样本的频率分布估计总体的分布,会用样本的 基本数字特征估计总体的基本数字特征,理解用样本估计总体 的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决 一些简单的实际问题.
高考总复习·数学文科(RJ)
h
28
第十章 统计与统计案例
【方法规律】 (1)明确频率分布直方图的意义,即图中 的每一个小矩形的面积是数据落在该区间上的频率,所有 小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从 中提炼有用的信息和数据.
高考总复习·数学文科(RJ)
h
29
第十章 统计与统计案例
h
10
6
23
第十章 统计与统计案例
(1)在图②中作出B地区用户满意度评分的频率分布直方 图,并通过直方图比较两地区满意度评分的平均值及分散 程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
高考总复习·数学文科(RJ)
h
24
第十章 统计与统计案例 (2)根据用户满意度评分,将用户的满意度分为三个等级
是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两
种形式,前者准确,后者直观.
高考总复习·数学文科(RJ)
h
8
第十章 统计与统计案例
6.平均数、方差的公式推广 (1)若数据x1,x2,…,xn的平均数为x,那么mx1+a, mx2+a,mx3+a,…,mxn+a的平均数是mx+a. (2)数据x1,x2,…,xn的方差为s2. ①数据x1+a,x2+a,…,xn+a的方差也为s2; ②数据ax1,ax2,…,axn的方差为a2s2.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一部分专题七第一讲
组
.(·山东卷,)为了研究某班学生的脚长(单位:)和身高(单位:)的关系,从该班随机抽取名学生,根据测量数据的散点图可以看出与之间有线性相关关系.设其回归直线方程为=+.已知=,=,=.该班某学生的脚长为,据此估计其身高为( )
..
..
[解析]∵=,∴==.
∵=,∴==.
又=,∴=-=-×=.
∴回归直线方程为=+.
将=代入上式得=×+=.
故选.
.某中学初中部共有名教师,高中部共有名教师,其性别比例如图所示,则该校女教师的人数为( )
.
.
.
.
[解析]由图可知该校女教师的人数为×+×(-)=+=,故选..(文)(·豫东、豫北十所名校联考)某厂生产、、三种型号的产品,产品数量之比为∶∶,现用分层抽样的方法抽取一个样本容量为的样本,则样本中型号的产品的数量为
( )
.
.
.
.
[解析]由分层抽样的定义知,型号产品应抽取×=件.(理)(·济南模拟)某全日制大学共有学生人,其中专科生有人,本科生有人,研究生人
,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为人,则
应在专科生,本科生与研究生这三类学生中分别抽取( )
.人,人,人
.人,人,人
.人,人,人
.人,人,人
[解析]=,×=×=,故选..(文)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{}.已知=,且样本容量为,则小长方形面积最大的一组的频数为( )
.
.
.
.
[解析]设公差为,则+=,∴=,∴++++=,∴=,∴面积最大的一组的频率等于
×=.
∴小长方形面积最大的一组的频数为×=. (理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了名观众进行调查
,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:[),[),[),[),[),[].将日均收看该类体育节目时间不低于分钟的观众称为“体育迷”,则图中的值为( )
.
.
.
.
[解析]由题设可知(+++++)×=,解得=,选..等差数列,,,…,的公差为,若以上述数据,,,…,为样本,则此样本的方差
为( )
.
.
.
.
[解析]令等差数列为…,则样本的平均值=,∴=[(-)+(-)+…+(-)]==..(文)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进
行试销,得到如下数据:
由表中数据,求得线性回归方程为
=-+.若在这些样本点中任取一点,则它在回归直线左下方的概率为( )
.
.
.
.
[解析]==,
==,。