【人教版】2020版高考数学二轮复习 专题六 统计 专题突破练19 统计与概率 文
(新高考)2020版高考数学二轮复习专题过关检测(十九)概率与统计文(最新整理)
专题过关检测(十九)概率与统计1.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频率分布表。
y的分组[-0。
20,0)[0,0。
20)[0.20,0.40)[0。
40,0.60)[0。
60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0。
01)附:错误!≈8.602.解:(1)根据产值增长率频率分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为错误!=0.21,产值负增长的企业频率为错误!=0.02,用样本频率分布估计总体分布,得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)错误!=错误!×(-0.10×2+0。
10×24+0.30×53+0。
50×14+0。
70×7)=0.30,s2=错误!×[(-0.40)2×2+(-0.20)2×24+02×53+0。
202×14+0。
402×7]=0。
029 6,s=0.029 6=0。
02×错误!≈0.17。
所以这类企业产值增长率的平均数与标准差的估计值分别为0。
30,0.17.2.某工厂有两台不同的机器A和B,生产同一种产品各10万件,现从各自生产的产品中分别随机抽取20件,进行质量鉴定,鉴定成绩的茎叶图如图所示.该产品的质量评价标准规定:鉴定成绩在[90,100)内的产品,质量等级为优秀;鉴定成绩在[80,90)内的产品,质量等级为良好;鉴定成绩在[60,80)内的产品,质量等级为合格.将频率视为概率.(1)完成下列2×2列联表,以产品质量等级是否达到良好以上(含良好)为判断依据,判断能不能在误差不超过0。
2020届高考文数二轮复习常考题型大通关(全国卷):第19题+统计概率+Word版含答案
常考题型大通关:第19题统计概率1、2018年10月17日是我国第5个扶贫日,也是第26个国际消除贫困日。
射洪某企业员工共500人参加“精准扶贫”活动,按年龄分组:第一组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)下表是年龄的频数分布表,求正整数a,b的值;(2)根据频率分布直方图,估算该企业员工的平均年龄及年龄的中位数;(3)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.2、某高校在2014年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下左图所示.(1)请先求出频率分布表中①、②、③、④位置相应的数据,再在答题纸上完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?3、随着生活水平的提高,人们对空气质量的要求越来越高,某机构为了解公众对“车辆限行”的态度,随机抽查40人,并将调查情况进行整理后制成下表:年龄(岁) [15,25) [25,35) [35,45) [45,55) [55,60]频数 5 10 10 5 10赞成人数 4 6 8 4 91.完成被调查人员年龄的频率分布直方图,并求被调查人员中持赞成态度人员的平均年龄约为多少岁?15,25,45,55的被调查人员中各随机选取1人进行调查.请写出所有的基2.若从年龄在[)[)本亊件,并求选取2人中恰有1人持不赞成态度的概率.4、某中学为弘扬优良传统,展示80年来的办学成果,特举办“建校80周年教育成果展示月”活动。
现在需要招募活动开幕式的志愿者,在众多候选人中选取100名志愿者,为了在志愿者.组号分组频数频率160,165 5 0.05第1组[)第2组[165,170)0.35第3组[170,175)第4组[175,180)20 0.20第5组[180,185)10合计100 1.001.请补充频率分布表中空白位置相应数据,再完成下列频率分布直方图;2.为选拔出主持人,决定在第3、4、5组中用分层抽样抽取6人上台,求第3、4、5组每组各抽取多少人?3.在2的前提下,主持人会在上台的6人中随机抽取2人表演诗歌朗诵,求第3组至少有一人被抽取的概率?5、某中学组织了一次高三学生数学学业水平模拟测试,学校从测试合格的男、女生中各随机抽取100人的成绩进行统计分析,分别制成了如图所示的男生和女生数学成绩的频率分布直方图.1.若所得分数大于等于80分认定为优秀,求男、女生优秀人数各有多少人?2.在1中的优秀学生中用分层抽样的方法抽取5人,从这5人中任意选取2人,求至少有一名男生的概率.6、某乡镇根据中央文件精神,在2014年通过精准识别确定建档立卡的贫困户共有473户,结合当地实际情况采取多项精准扶贫措施,从2015年至2018年该乡镇每年脱贫户数见下表:年份2015 2016 2017 2018 年份代码x 1 2 3 4脱贫户数y55 69 71 85(1)根据2015-2018年的数据,求出y关于x的线性回归方程$$y bx a=+$;(2)利用(1)中求出的线性回归方程,试判断到2020年底该乡镇的473户贫困户能否全部脱贫.附:$$1221,ni iiniix y nxyb a y bxx nx==-==--∑∑$$7、某农科所对冬季昼夜温差大小与某反季节大豆新品种种子发芽数之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天昼夜温差大小与实验室每天每100颗种子中的发芽数,得到如下数据:该农科所确定的研究方案是:先从这5组数据中随机选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验。
2020高考数学二轮复习概率与统计.docx
2020 高考数学二轮复习 概率与统计概率内容的新概念 多,相近概念容易混淆,本 就学生易犯 作如下 :型一 “非等可能 ”与 “等可能 ”混同 例 1 两枚骰子,求所得的点数之和 6 的概率.解两枚骰子出 的点数之和2, 3, 4, ⋯ ,12 共 11 种基本事件,所以概率P=111剖析以上 11 种基本事件不是等可能的,如点数和 2 只有 (1, 1),而点数之和6 有 (1, 5)、(2, 4)、 (3, 3)、 (4,2)、 (5, 1)共 5 种.事 上, 两枚骰子共有 36 种基本事件,且是等可能的,所以“所得点数之和6”的概率 P= 5.36型二 “互斥 ”与 “ 立 ”混同例 2把 、黑、白、4 牌随机地分 甲、乙、丙、丁4 个人,每个人分得1 ,事件“甲分得 牌”与“乙分得 牌”是()A . 立事件B .不可能事件C .互斥但不 立事件D .以上均不解A剖析 本 的原因在于把 “互斥 ”与 “ 立”混同,二者的 系与区 主要体 在 :(1)两事件 立,必定互斥,但互斥未必 立; (2) 互斥概念适用于多个事件,但 立概念只适用于两个事件; (3) 两个事件互斥只表明 两个事件不能同 生,即至多只能 生其中一个,但可以都不 生;而两事件 立 表示它 有且 有一个 生.事件 “甲分得 牌 ”与 “乙分得 牌 ”是不能同 生的两个事件,两个事件可能恰有一个 生,一个不 生,可能两个都不 生,所以 C .型三 例 3解“互斥 ”与 “独立 ”混同甲投 命中率 O .8,乙投 命中率 0.7,每人投 3 次,两人恰好都命中 2 次的概率是多少 ?“甲恰好投中两次” 事件 A , “乙恰好投中两次” 事件B , 两人都恰好投中两次事件A+B , P(A+B)=P(A)+P(B): c 32 0.820.2 c 32 0.720.3 0.825剖析本 的原因是把相互独立同 生的事件当成互斥事件来考 , 将两人都恰好投中2 次理解 “甲恰好投中两次”与 “乙恰好投中两次 ”的和.互斥事件是指两个事件不可能同 生;两事件相互独立是指一个事件的 生与否 另一个事件 生与否没有影响,它 然都描 了两个事件 的关系,但所描 的关系是根本不同.解:“甲恰好投中两次 ” 事件 A ,“乙恰好投中两次” 事件 B ,且 A , B 相互独立,两人都恰好投中两次 事件A ·B ,于是 P(A ·B)=P(A) ×P(B)= 0.169类型四例 4错解“条件概率 P(B / A)”与“积事件的概率P(A·B)”混同袋中有 6 个黄色、 4 个白色的乒乓球,作不放回抽样,每次任取一球,取 2 次,求第二次才取到黄色球的概率.记“第一次取到白球”为事件A,“第二次取到黄球”为事件B,”第二次才取到黄球”为事件62C,所以 P(C)=P(B/A)=.93剖析本题错误在于 P(A B)与 P(B/A) 的含义没有弄清 , P(A B) 表示在样本空间S 中 ,A 与 B 同时发生的概率;而P( B/A )表示在缩减的样本空间S A中,作为条件的 A 已经发生的条件下事件 B 发生的概率。
2020版高考数学二轮复习 专题六 统计 专题突破练18 统计与统计案例 文
专题突破练18 统计与统计案例1.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.2.(2018全国卷2,文18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①;=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.3.(2018河北唐山一模,文18)某水产品经销商销售某种鲜鱼,售价为每千克20元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价处理完,平均每千克损失3元.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.(1)根据频率分布直方图计算该种鲜鱼日需求量的平均数(同一组中的数据用该组区间中点值代表);(2)该经销商某天购进了300千克这种鲜鱼,假设当天的需求量为x千克(0≤x≤500),利润为Y元.求Y关于x的函数关系式,并结合频率分布直方图估计利润Y不小于700元的概率.4.某单位N名员工参加“我爱阅读”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)求正整数a,b,N的值;(2)现要从年龄低于40岁的员工中用分层抽样的方法抽取42人,则年龄在第1,2,3组的员工人数分别抽取多少?(3)为了估计该单位员工的阅读倾向,现对该单位所有员工中按性别比例抽查的40人是否喜欢阅读国学类书籍进行了调查,调查结果如下所示:(单位:人)喜欢阅读国学类不喜欢阅读国学类合计男14 4 18女8 14 22合计22 18 40下面是年龄的分布表:区间[25,30) [30,35) [35,40) [40,45) [45,50]人数28 a b根据表中数据,我们能否有99%的把握认为该单位员工是否喜欢阅读国学类书籍和性别有关系?附:K2=,其中n=a+b+c+d.P(K2≥k0) 0.05 0.025 0.010 0.005 0.001k03.841 5.024 6.635 7.879 10.8285.(2018百校联盟四月联考,文18)每年的寒冷天气都会带热“御寒经济”,以餐饮业为例,当外面太冷时,不少人都会选择叫外卖上门,外卖商家的订单就会增加,下表是某餐饮店从外卖数据中抽取的5天的日平均气温与外卖订单数日平均气温(℃) -2 -4 -6 -8 -10外卖订单数(份) 50 85 115 140 160(1)经过数据分析,一天内平均气温x(℃)与该店外卖订单数y(份)成线性相关关系,试建立y 关于x的回归方程,并预测气温为-12 ℃时该店的外卖订单数(结果四舍五入保留整数); (2)天气预报预测未来一周内(七天),有3天日平均气温不高于-10 ℃,若把这7天的预测数据当成真实数据,则从这7天任意选取2天,求恰有1天外卖订单数不低于160份的概率.附注:回归方程x+中斜率和截距的最小二乘估计公式分别为:.6.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg 箱产量≥50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:,K2=.7.某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在30分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.分数段[40,50) [50,60) [60,70) [70,80) [80,90) [90,100]男 3 9 18 15 6 9女 6 4 5 10 13 2(1)估计男、女生各自的成绩平均分(同一组数据用该组区间中点值作代表),从计算结果看,判断数学成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否在犯错误的概率不超过0.1的前提下认为“数学成绩与性别有关”.优分非优分合计男生女生合计100附表及公式P(K2≥k0) 0.100 0.050 0.010 0.001k02.706 3.841 6.635 10.828K2=,其中n=a+b+c+d.8.(2018全国百强校最后一卷,文19)下表为2014年至2017年某百货零售企业的线下销售额(单位:万元),其中年份代码x=年份-2 013.年份代码x 1 2 3 4线下销售额y95 165 230 310(1)已知y与x具有线性相关关系,求y关于x的线性回归方程,并预测2018年该百货零售企业的线下销售额;(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调査平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?参考公式及数据:,K2=,n=a+b+c+d.P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005k02.072 2.706 3.841 5.024 6.635 7.879参考答案专题突破练18统计与统计案例1.解 (1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.=13,=13,×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.2.解(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分)3.解(1)=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.0025×100+450×0.001 5×100=265.(2)当日需求量不低于300千克时,利润Y=(20-15)×300=1 500(元);当日需求量不足300千克时,利润Y=(20-15)x-(300-x)×3=8x-900(元);故Y=由Y≥700得,200≤x≤500,所以P(Y≥700)=P(200≤x≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7.4.解(1)总人数N==280,a=28,第3组的频率是1-5×(0.02+0.02+0.06+0.02)=0.4,所以b=280×0.4=112.(2)因为年龄低于40岁的员工在第1,2,3组,共有28+28+112=168(人),利用分层抽样在168人中抽取42人,每组抽取的人数分别为:第1组抽取的人数为28×=7(人),第2组抽取的人数为28×=7(人),第3组抽取的人数为112×=28(人),所以第1,2,3组分别抽7人、7人、28人.(3)假设H0:“是否喜欢阅读国学类书籍和性别无关”,根据表中数据,求得K2的观测值k=≈6.860 5>6.635,查表得P(K2≥6.635)=0.01,从而能有99%的把握认为该单位员工是否喜欢阅读国学类书籍和性别有关系.5.解 (1)由题意可知=-6,=110,(x i-)2=42+22+02+(-2)2+(-4)2=40,(x i-)(y i-)=4×(-60)+2×(-25)+0×5+(-2)×30+(-4)×50=-550, 所以=-13.75,=110+13.75×(-6)=27.5,所以y关于x的回归方程为=-13.75x+27.5,当x=-12时,=-13.75x+27.5=-13.75×(-12)+27.5=192.5≈193.所以可预测当平均气温为-12 ℃时,该店的外卖订单数为193份.(2)外卖订单数不低于160份的概率就是日平均气温不高于-10 ℃的概率,由题意,设日平均气温不高于-10 ℃的3天分别记作A,B,C,另外4天记作a,b,c,d, 从这7天中任取2天结果有:(A,B),(A,C),(A,a),(A,b),(A,c),(A,d),(B,C),(B,a),(B,b),(B,c),(B,d),(C,a),(C,b ),(C,c),(C,d),(a,b),(a,c),(a,d),(b,c),(b,d),(c,d)共21种,恰有1天平均气温不高于-10 ℃的结果有:(A,a),(A,b),(A,c),(A,d),(B,a),(B,b),(B,c),(B,d),(C,a),(C,b),(C,c),(C,d)共12种,所以所求概率P=.6.解 (1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.箱产量<50 kg 箱产量≥50 kg旧养殖法62 38新养殖法34 66K2=≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.7.解 (1)=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5.=45×0.15+55×0.10+65×0.125+75×0.25+85×0.325+95×0.05=71.5.从男、女生各自的成绩平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知,在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:优分非优分合计男生15 45 60女生15 25 40合计30 70 100可得K2=≈1.79.∵1.79<2.706,∴在犯错误的概率不超过0.1的前提下不能认为“数学成绩与性别有关”.8.解(1)由题意得=2.5,=200,=30,x i y i=2 355,所以=71,所以=200-71×2.5=22.5,所以y关于x的线性回归方程为=71x+22.5.由于2 018-2 013=5,所以当x=5时,=71×5+22.5=377.5,所以预测2018年该百货零售企业的线下销售额为377.5万元.持乐观态度持不乐观态度总计男顾客10 45 55女顾客20 30 50总计30 75 105故K2的观测值K2=≈6.109,由于6.109>5.024,所以可以在犯错误的概率不超过0.025 的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关.11。
高考数学第二轮专题复习----概论统计专题
《计数原理与概率》高考复习指导一、考试说明:1.考试内容(1)分类计数原理与分步计数原理,排列与组合.(2)等可能性事件的概率,互斥事件有一个发生的概率,相互独立事件同时发生的概率.2.考试要求(1)掌握分类计数原理与分步计数原理,并能用它们分析和解决一些简单的应用问题.(2)理解排列与组合的意义,掌握排列数与组合数的计算公式,掌握组合数的两个性质,并能用它们解决一些简单的应用问题.(3)了解等可能性事件的概率的意义,会用排列组合公式计算一些等可能性事件的概率.(4)了解互斥事件的意义,会用互斥事件的概率加法公式计算一些事件的概率.(5)了解相互独立事件的意义,会用相互独立事件的概率乘法公式计算一些事件的概率,会计算事件在n次独立重复试验中恰好发生k次的概率.二、高考试题分析排列与组合、概率与统计是高中数学的重要内容.一方面,这部分内容占用教学时数多达36课时,另一方面,这部分内容是进一步学习高等数学的基础知识,因此,它是高考数学命题的重要内容.从近三年全国高考数学(新材)试题来看,主要是考查排列与组合、概率与统计的基本概念、公式及基本技能、方法,以及分析问题和解决问题的能力.试题特点是基础和全面.题目类型有选择题、填空题、解答题,一般是两小(9分~10分)一大(12分),解答题通常是概率问题.试题难度多为低中档.为了支持高中数学课程的改革,高考数学命题对这部分将进一步重视,但题目数量、难度、题型将会保持稳定.例1.(1999年全国)在一块并排10垄的田地中,选择2垄分别种植A、B两种作物,每种作物种植一垄,为有利于作物生长,要求A、B两种作物间的间隔不小于6垄,则不同的选垄方法共有_______种(用数字作答).[解析]A种植在左边第一垄时,B有3种不同的种植方法;A种植在左边第二垄时,B有两种不同的种植方法;A种植在左边第三垄时,B只有一种种植方法.B在左边种植的情形与上述情形相同.故共有2(3+2+1)=12种不同的选垄方法.∴应填12.例2.(2003年新教材)将3种作物种植在如图所示的5块试验田里,每一块种植一种作物且相邻的试验田不能种植同一作物,不同的种植方法共有______种(以数字作答).[解析]将5块试验田从左到右依次看作甲、乙、丙、丁、戊,3种作物依次看作A、B、C,则3种作物都可以种植在甲试验田里,由于相邻的试验田不能种植同一种作物,从而可知在乙试验田里只能有两种作物.同理,在丙、丁、戊试验田里也只能有两种作物可以种植.由分步计数原理,不同的种植方法共有3×2×2×2=48种.∴应填:48例3.(2003年全国高考题)某城市中心广场建造一个花圃,花圃分为6个部分(如图),现要栽种4种不同颜色的花,每部分栽种1种且相邻部分不能栽种同样颜色的花,不同的栽法有_______种.[解析]由于第1、2、3块两两相邻,我们先安排这三块,给第1、2、3块种花时分别有4、3、2种种法,所以共有4×3×2=24种不同种法.下面给第4块种花,若第4块与第6块同色,只有一种种植方法,则第5块只有2种种法,若第4块与第2块同色时,共有2×1=2种种法.若第4块与第6块不同色,但第4块与第2块同色,则第6块有2种种植的方案,而第5块只有1种种法,共有2种不同的种植方法.若第4块与第6块不同色,但第4块与第2块不同色,则第6块有1种种法,则第5块也有一种不同种法,所以第4块与第6块不同色时,有1种种法.综上共有24×(2+2+1)=120种不同的种植方法.例4.(2003年春季考试题)某班新年联欢会原定的5个节目已排成节目单,开演前又增加了两个新节目,如果将这两个节目插入原节目单中,那么不同的插法的种数为A 、42B 、30C 、20D 、12[解析]将两个新节目插入5个固定顺序节目单有两种情况:(1)两个新节目相邻的插法种数为226A ;(2)两个节目不相邻的插法种数为26A ;由分类计数原理共有2226642A A +=种方法,选A.例5.(2004重庆)(本小题满分12分)设甲、已、丙三人每次射击命中目标的概率分别为0.7、0.6和0.5。
高考数学二轮复习专题突破—统计与统计案例(含解析)
高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。
(通用版)2020版高考数学大二轮复习专题六统计与概率6.3.1统计与统计案例课件理
(通用版)2020版高考数学大二轮复习专题六统计与概率6.3.1统计与统计案例课件理6.3统计与概率大题,-2-,-3-,-4-,-5-,-6-,-7-,1.变量间的相关关系1如果散点图中的点从整体上看大致分布在一条直线的附近,那么我们说变量x和y具有线性相关关系.2线性回归方程若变量x与y具有线性相关关系,有n个样本数据xi,yii1,2,,n,则回归方程为,-8-,2.独立性检验对于取值分别是x1,x2和y1,y2的分类变量X和Y,其样本频数列联表是,-9-,3.超几何分布在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则PXk,k0,1,2,,m,其中mminM,n,且nN,MN,n,M,NN*.4.二项分布一般地,在n次独立重复试验中,事件A发生的次数为X,设每次试验中事件A发生的概率为p,则PXkpkqn-k,其中0p1,pq1,k0,1,2,,n,称X服从参数为n,p的二项分布,记作XBn,p,且EXnp,DXnp1-p.,-10-,5.正态分布一般地,如果对于任意实数ab,随机变量X满足PaXb,xdx,则称X的分布为正态分布.正态分布完全由参数和确定,因此正态分布常记作N,2.如果随机变量X服从正态分布,则记为XN,2.满足正态分布的三个基本概率的值是P-X0.6826;P-2X20.9544;P-3X30.9974.,-11-,6.离散型随机变量的分布列.期望.方差1设离散型随机变量X 可能取的不同值为x1,x2,,xi,,xn,X取每一个值xii1,2,,n的概率PXxipi,则称下表为离散型随机变量X的分布列.2EXx1p1x2p2xipixnpn为X的均值或数学期望.3DXx1-EX2p1x2-EX2p2xi-EX2pixn-EX2pn叫做随机变量X的方差.4均值与方差的性质EaXbaEXb;EEE;DaXba2DX.,6.3.1统计与统计案例,-13-,考向一,考向二,考向三,考向四,样本的数字特征的应用例1xx全国卷2,文19某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.1分别估计这类企业中产值增长率不低于40的企业比例.产值负增长的企业比例;2求这类企业产值增长率的平均数与标准差的估计值同一组中的数据用该组区间的中点值为代表.精确到0.01,-14-,考向一,考向二,考向三,考向四,-15-,考向一,考向二,考向三,考向四,解题心得1在预测总体数据的平均值时,常用样本数据的平均值估计,从而做出合理的判断.2平均数反映了数据取值的平均水平,标准差.方差描述了一组数据围绕平均数波动的大小.标准差.方差越大,数据的离散程度越大,越不稳定.,-16-,考向一,考向二,考向三,考向四,对点训练1为迎接即将举行的集体跳绳比赛,高一年级对甲.乙两个代表队各进行了6轮测试,测试成绩单位次/分钟如下表1补全茎叶图,并指出乙队测试成绩的中位数和众数;2试用统计学中的平均数.方差知识对甲.乙两个代表队的测试成绩进行分析.,-17-,考向一,考向二,考向三,考向四,-18-,考向一,考向二,考向三,考向四,利用回归方程进行回归分析例2xx新疆乌鲁木齐二模,理19某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x单位万元和收益y单位万元的数据如表他们分别用两种模型ybxa,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值,-19-,考向一,考向二,考向三,考向四,-20-,考向一,考向二,考向三,考向四,1根据残差图,比较模型,的拟合效果,应选择哪个模型并说明理由;2残差绝对值大于2的数据被认为是异常数据,需要剔除剔除异常数据后求出1中所选模型的回归方程;若广告投入量x18时,该模型收益的预报值是多少,-21-,考向一,考向二,考向三,考向四,-22-,考向一,考向二,考向三,考向四,解题心得在求两变量的回归方程时,由于的公式比较复杂,求它的值计算量比较大,为了计算准确,可将这个量分成几个部分分别计算,最后再合成,这样等同于分散难点,各个攻破,提高了计算的准确度.,-23-,考向一,考向二,考向三,考向四,对点训练2xx山东德州一模,理20改革开放以来,我国经济持续高速增长.如图给出了我国2003年至xx年第二产业增加值与第一产业增加值的差值以下简称为产业差值的折线图,记产业差值为y单位万亿元.1求出y关于年份代码t的线性回归方程;2利用1中的回归方程,分析2003年至xx年我国产业差值的变化情况,并预测我国产业差值在哪一年约为34亿元;3结合折线图,试求出除去xx年产业差值后剩余的9年产业差值的平均值及方差结果精确到0.1.,-24-,考向一,考向二,考向三,考向四,-25-,考向一,考向二,考向三,考向四,-26-,考向一,考向二,考向三,考向四,-27-,考向一,考向二,考向三,考向四,样本的相关系数的应用例3xx四川宜宾二模,理18艾滋病是一种危害性极大的传染病,由感染艾滋病病毒HIV病毒引起,它把人体免疫系统中最重要的CD4T淋巴细胞作为主要攻击目标,使人体丧失免疫功能.下表是近八年来我国艾滋病病毒感染人数统计表,-28-,考向一,考向二,考向三,考向四,1请根据该统计表,画出这八年我国艾滋病病毒感染人数的折线图;2请用相关系数说明能用线性回归模型拟合y 与x的关系;,-29-,考向一,考向二,考向三,考向四,3建立y关于x的回归方程系数精确到0.01,预测xx年我国艾滋病病毒感染人数.,-30-,考向一,考向二,考向三,考向四,解1我国艾滋病病毒感染人数的折线图如图所示.,-31-,考向一,考向二,考向三,考向四,-32-,考向一,考向二,考向三,考向四,-33-,考向一,考向二,考向三,考向四,解题心得对于样本的相关系数的应用的题目,题目一般都给出样本xi,yii1,2,,n的相关系数r的表达式,以及有关的数据,解决这类题的关键是在有关的数据中选择题目需要的数据代入公式即可.,-34-,考向一,考向二,考向三,考向四,对点训练3下图是我国xx年至xx年生活垃圾无害化处理量单位亿吨的折线图.1由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;2建立y关于t的回归方程系数精确到0.01,预测xx年我国生活垃圾无害化处理量.,-35-,考向一,考向二,考向三,考向四,-36-,考向一,考向二,考向三,考向四,-37-,考向一,考向二,考向三,考向四,-38-,考向一,考向二,考向三,考向四,统计图表与独立性检验的综合例4某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间单位min绘制了如下茎叶图,-39-,考向一,考向二,考向三,考向四,1根据茎叶图判断哪种生产方式的效率更高并说明理由;2求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表3根据2中的列联表,能否有99的把握认为两种生产方式的效率有差异,-40-,考向一,考向二,考向三,考向四,解1第二种生产方式的效率更高.理由如下由茎叶图可知用第一种生产方式的工人中,有75的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.由茎叶图可知用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.由茎叶图可知用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.,-41-,考向一,考向二,考向三,考向四,由茎叶图可知用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,学生答出其中任意一种或其他合理理由均可,-42-,考向一,考向二,考向三,考向四,解题心得有关独立性检验的问题解题步骤1作出22列联表;2计算随机变量K2的值;3查临界值,检验作答.,-43-,考向一,考向二,考向三,考向四,对点训练4“共享单车”的出现,为我们提供了一种新型的交通方式.某机构为了调查人们对此种交通方式的满意度,从交通拥堵不严重的A城市和交通拥堵严重的B城市分别随机调查了20个用户,得到了一个用户满意度评分的样本,并绘制出如图茎叶图.1根据茎叶图,比较两城市满意度评分的平均值的大小及方差的大小不要求计算出具体值,给出结论即可;,-44-,考向一,考向二,考向三,考向四,2若得分不低于80分,则认为该用户对此种交通方式“认可”,否则认为该用户对此种交通方式“不认可”,请根据此样本完成下面22列联表,并据此样本分析是否有95的把握认为城市拥堵与认可共享单车有关;3若从此样本中的A城市和B城市各抽取1人,则在此2人中恰有1人认可的条件下,此人来自B城市的概率是多少,-45-,考向一,考向二,考向三,考向四,解1A 城市评分的平均值小于B城市评分的平均值;A城市评分的方差大于B城市评分的方差.222列联表如下.,。
2020年高考数学第二轮复习 统计与概率教学案 精品
2020年高考第二轮专题复习(教学案):统计与概率考纲指要:“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
统计案例主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用。
对概率考察的重点为互斥事件、古典概型的概率事件的计算为主,了解随机数的意义,能运用模拟方法(包括计算器产生随机数来进行模拟)估计概率,初步体会几何概型的意义。
考点扫描:1.三种常用抽样方法:(1)简单随机抽样;(2)系统抽样;(3)分层抽样。
2.用样本的数字特征估计总体的数字特征: (1)众数、中位数;(2)平均数与方差。
3.频率分布直方图、折线图与茎叶图。
4.线性回归:回归直线方程。
5.统计案例:相关系数、卡方检验,6.随机变量:随机变量的概念,离散性随机变量的分布列,相互独立事件、独立重复试验公式,随机变量的均值和方差,几种特殊的分布列:(1)两点分布;(2)超几何分布;(3)二项分布;正态分布。
7随机事件的概念、概率;事件间的关系:(1)互斥事件;(2)对立事件;(3)包含; 事件间的运算:(1)并事件(和事件)(2)交事件(积事件)8古典概型:古典概型的两大特点;古典概型的概率计算公式。
9几何概型:几何概型的概念;几何概型的概率公式;几种常见的几何概型。
考题先知:例1.为了科学地比较考试的成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为:sxx Z -=(其中x 是某位学生的考试分数,x 是该次考试的平均分,s 是该次 考试的标准差,Z 称为这位学生的标准分).转化成标准分后可能出现小数和负值,因此, 又常常再将Z 分数作线性变换转化成其他分数. 例如某次学业选拔考试采用的是T 分数,线性变换公式是:T=40Z+60. 已知在这次考试中某位考生的考试分数是85,这次考试的平均分是70,标准差是25,则该考生的T 分数为 . 分析:正确理解题意,计算所求分数。
2020版高考数学二轮复习教程第二编专题六概率与统计第2讲统计、统计案例练习理
第2讲统计、统计案例「考情研析」 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等. 2.概率与统计的交汇问题是高考的热点,以解答题形式出现,难度中等.核心知识回顾1.三种抽样方法的特点简单随机抽样:操作简便、适当,总体个数较少.分层抽样:按比例抽样.系统抽样:等距抽样.2.必记公式数据x1,x2,x3,…,x n的数字特征公式:(1)平均数:错误!=错误!错误!。
(2)方差:s2=错误!错误![(x1-错误!)2+(x2-错误!)2+…+(x n-错误!)2].(3)标准差:s=错误!错误!。
3.重要性质及结论(1)频率分布直方图的三个结论①小长方形的面积=错误!组距×错误!=频率;②各小长方形的面积之和等于1;③小长方形的高=错误!错误!,所有小长方形高的和为错误!.(2)回归直线方程:一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n)其回归方程错误!=错误!错误!x+错误!,其过样本点中心错误!(错误!,错误!)错误!.(3)独立性检验K2=错误!(其中n=a+b+c+d为样本容量).热点考向探究考向1 抽样方法例1 (1)从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480 B.481C.482 D.483答案C解析∵样本中编号最小的两个编号分别为007,032,∴样本数据组距为32-7=25,则样本容量为错误!=20,则对应的号码数x=7+25(n-1),当n=20时,x取得最大值,此时x=7+25×19=482.故选C.(2)(2019·广州普通高中高三综合测试)某公司生产A,B,C 三种不同型号的轿车,产量之比依次为2∶3∶4,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n的样本,若样本中A种型号的轿车比B种型号的轿车少8辆,则n=( )A.96 B.72C.48 D.36答案B解析由题意,得错误!n-错误!n=-8,∴n=72.选B。
统计与统计案例小题突破练-高三数学二轮专题复习
冲刺高考二轮统计与统计案例小题突破练(原卷+答案)一、单项选择题1.已知某地区中小学生人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本容量和该地区的高中生近视人数分别为() A.200,25 B.200,2 500C.8 000,25 D.8 000,25002.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差3.国外新冠肺炎疫情形势严峻,国内疫情传播风险加大,为了更好地抗击疫情,国内进一步加大新冠疫苗的接种力度.某制药企业对某种新冠疫苗开展临床接种试验,若使用该疫苗后的抗体呈阳性,则认为该新冠疫苗有效.该企业对参与试验的1 000名受试者的年龄和抗体情况进行统计,结果如下图表所示:年龄频率[20,30)0.20[30,40)0.30[40,50)0.10[50,60)0.20[60,70)0.10[70,80]0.10则下列结论正确的是( )A .在受试者中,50岁以下的人数为700B .在受试者中,抗体呈阳性的人数为800C .受试者的平均年龄为45岁D .受试者的疫苗有效率为80%4.下图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,则由直方图得到的25%分位数为( )A .66.5B .67C .67.5D .685.已知一组数据:x 1,x 2,x 3的平均数是5,方差是4,则由2x 1+1,2x 2+1,2x 3+1和11 这四个数据组成的新数据组的方差是( )A .16B .14C .12D .116.某新能源汽车销售公司统计了某款汽车行驶里程x (单位:万千米)对应维修保养费用y (单位:万元)的四组数据,这四组数据如下表:行驶里程x /万千米 1 2 4 5 维修保养费用y /万元 0.50 0.90 2.30 2.70若用最小二乘法求得回归直线方程为y ^ =0.58x +a ^,则估计该款汽车行驶里程为6万千米时的维修保养费是( )A .3.34万元B .3.62万元C .3.82万元D .4.02万元7.通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:已知χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),P (χ2≥10.828)=0.001,根据小概率值α=0.001的χ2独立性检验,以下结论正确的为( )A .爱好跳绳与性别有关B .爱好跳绳与性别有关,这个结论犯错误的概率不超过0.001C .爱好跳绳与性别无关D .爱好跳绳与性别无关,这个结论犯错误的概率不超过0.0018.为研究变量x ,y 的相关关系,收集得到下面五个样本点(x ,y ):x 5 6.5 7 8 8.5 y 9 8 6 4 3若由最小二乘法求得y 关于x 的回归直线方程为y ^ =-1.8x +a ^,则据此计算残差为0的样本点是( )A .(5,9)B .(6.5,8)C .(7,6)D .(8,4)二、多项选择题9.下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A .样本x 1,x 2,…,x n 的标准差 B .样本x 1,x 2,…,x n 的中位数 C .样本x 1,x 2,…,x n 的极差 D .样本x 1,x 2,…,x n 的平均数10.有一组样本数据x 1,x 2,…,x n ,由这组数据得到新样本数据y 1,y 2,…,y n ,其中y i =x i +c (i =1,2,…,n ),c 为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同11.某车间加工某种机器的零件数x 与加工这些零件所花费的时间y 之间的对应数据如下表所示:x /个 10 20 30 40 50 y /min 62 68 75 81 89由表中的数据可得回归直线方程y ^ =b ^x +54.9,则以下结论正确的有( ) A .相关系数r >0B .b ^=0.67C .零件数10,20,30,40,50的中位数是30D .若加工60个零件,则加工时间一定是95.1 min12.小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )A .骑车时间的中位数的估计值是22分钟B .骑车时间的众数的估计值是21分钟C .坐公交车时间的中位数的估计值是20分钟D .坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值 三、填空题13.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为________.14.为了解某社区居民的2021年家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元) 6.2 7.5 8.0 t 9.8根据上表可得回归直线方程y ^=0.76x +0.4,则t =________.15.定义一个同学数学成绩优秀的标准为“连续5次数学考试成绩均不低于120分(满分150分)”.现有甲、乙、丙三位同学连续5次数学考试成绩的数据(数据都是正整数)的描述:①甲同学的5个数据的中位数为125,总体均值为128; ②乙同学的5个数据的中位数为127,众数为121;③丙同学的5个数据的众数为125,极差为10,总体均值为125. 则数学成绩一定优秀的同学是________.16.在对某中学高一年级学生每周体育锻炼时间的调查中,采用随机数法,抽取了男生30人,女生20人. 已知男同学每周锻炼时间的平均数为17小时,方差为11;女同学每周锻炼时间的平均数为12小时,方差为16. 依据样本数据,估计本校高一年级学生每周体育锻炼时间的方差为________.参考答案1.解析:由扇形分布图结合分层抽样知识易知样本容量为8040% =200,则样本中高中生的人数为200×25%=50,易知总体的容量为501%=5 000,结合近视率条形图得该地区高中生近视人数为5 000×50%=2 500. 故选B. 答案:B 2.解析:由统计图可知,讲座前这10位社区居民问卷答题的正确率分别为65%,60%,70%,60%,65%,75%,90%,85%,80%,95%.对于A 项,将这10个数据从小到大排列为60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,因此这10个数据的中位数是第5个与第6个数的平均数,为70%+75%2=72.5%>70%,A 错误.对于B 项,由统计图可知,讲座后这10位社区居民问卷答题的正确率分别为90%,85%,80%,90%,85%,85%,95%,100%,85%,100%,所以讲座后这10位社区居民问卷答题的正确率的平均数为110×(90%+85%+80%+90%+85%+85%+95%+100%+85%+100%)=89.5%>85%,B 正确.对于C 项,讲座后这10位社区居民问卷答题的正确率的方差s 2后 =110×[(90%-89.5%)2+(85%-89.5%)2+…+(85%-89.5%)2+(100%-89.5%)2]=42.2510 000 ,所以标准差s 后=6.5%.讲座前这10位社区居民问卷答题的正确率的平均数为110×(60%+60%+65%+65%+70%+75%+80%+85%+90%+95%)=74.5%,所以讲座前这10位社区居民问卷答题的正确率的方差为s 2前 =110×[(60%-74.5%)2+(60%-74.5%)2+…+(90%-74.5%)2+(95%-74.5%)2]=142.2510 000,所以标准差s 前≈11.93%.所以s 前>s 后,C 错误.对于D 项,讲座前问卷答题的正确率的极差为95%-60%=35%,讲座后问卷答题的正确率的极差为100%-80%=20%,D 错误.故选B.答案:B3.解析:50岁以下1 000×(0.2+0.3+0.1)=600人,A 选项错误.在受试者中,抗体呈阳性的人数为600×0.9+400×0.85=880,B 选项错误.受试者的平均年龄为25×0.2+35×0.3+45×0.1+55×0.2+65×0.1+75×0.1=45,C 选项正确.受试者的疫苗有效率为8801 000×100%=88%,D 选项错误.故选C. 答案:C4.解析:第一组的频率为0.010×10=0.1,前两组的频率之和为(0.010+0.020)×10=0.3,知25%分位数在第二组[60,70)内,故25%分位数为60+10×0.25-0.10.2=67.5.故选C. 答案:C5.解析:由已知得x 1+x 2+x 3=15,(x 1-5)2+(x 2-5)2+(x 3-5)2=12,则新数据的平均数为14 (2x 1+1+2x 2+1+2x 3+1+11)=2(x 1+x 2+x 3)+3+114=11,所以方差为14[(2x 1+1-11)2+(2x 2+1-11)2+(2x 3+1-11)2+(11-11)2],=14 [4(x 1-5)2+4(x 2-5)2+4(x 3-5)2]=(x 1-5)2+(x 2-5)2+(x 3-5)2=12, 故选C. 答案:C6.解析:由已知x - =1+2+4+54 =3,y - =0.5+0.9+2.3+2.74=1.6,所以1.6=0.58×3+a ^ ,a ^ =-0.14,即y ^=0.58x -0.14,x =6时,y ^=0.58×6-0.14=3.34, 故选A. 答案:A7.解析:a +b =40+20=60,c +d =20+30=50,a +c =40+20=60, b +d =20+30=50,ad -bc =40×30-20×20=800,n =110,χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ) =110×800260×50×60×50 ≈7.822<10.828,故爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001, 故选D. 答案:D8.解析:由题意可知,x - =5+6.5+7+8.5+85 =7,y - =9+8+6+4+35=6,所以回归方程的样本中心点为(7,6),因此有6=-1.8×7+a ^ ⇒a ^=18.6,所以y ^=-1.8x +18.6,在收集的5个样本点中,(7,6)一点在y ^=-1.8x +18.6上,故计算残差为0的样本点是(7,6).故选C. 答案:C9.解析:由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度; 由平均数的定义可知,平均数考查的是数据的集中趋势. 答案:AC10.解析:A :E (y )=E (x +c )=E (x )+c 且c ≠0,故平均数不相同,错误;B :若第一组中位数为x i ,则第二组的中位数为y i =x i +c ,显然不相同,错误;C :D (y )=D (x )+D (c )=D (x ),故方差相同,正确; D :由极差的定义知:若第一组的极差为x max -x min ,则第二组的极差为y max -y min =(x max+c )-(x min +c )=x max -x min ,故极差相同,正确.答案:CD11.解析:由表中的数据,得x - =10+20+30+40+505=30,y -=62+68+75+81+895 =75,将x - ,y - 代入y ^ =b ^ x +54.9,得b ^=0.67,选项A ,B 均正确, 10,20,30,40,50的中位数是30,选项C 正确;当x =60时,y ^=0.67×60+54.9=95.1,所以加工时间约是95.1 min ,而非一定是95.1min ,选项D 错误.故选ABC. 答案:ABC12.解析:在骑车时间频率分布直方图中,设骑车时间的中位数为a 1, 所以有0.1×2+0.2×(a 1-20)=0.5⇒a 1=21.5,因此选项A 不正确; 骑车时间的众数的估计值为21分钟,因此选项B 正确; 设骑车时间的平均数为b 1,b 1=(19×0.1+21×0.2+23×0.15+25×0.05)×2=21.6;在坐公交车时间频率分布直方图中,设坐公交车时间的中位数为a 2,因为(0.025+0.05+0.075+0.1)×2=0.5,所以a 2=20,因此选项C 正确; 设坐公交车时间的平均数为b 2,b 2=(13×0.025+15×0.05+17×0.075+19×0.1+21×0.1+23×0.075+25×0.05+27×0.025)×2=20,因为b 1>b 2,所以选项D 正确, 故选BCD. 答案:BCD13.解析:根据等高条形图可知: 喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层抽样的方法抽取23人,则抽取的男生人数为300460×23=15人.答案:1514.解析:分别求出收入和支出的平均数,可得:x - =8.2+8.6+10.0+11.3+11.95=10,y - =6.2+7.5+8.0+9.8+t 5 =31.5+t 5,代入y ^=0.76x +0.4可得:31.5+t 5=0.76×10+0.4,解得:t =8.5. 答案:8.515.解析:在①中,甲同学的5个数据的中位数为125,总体均值为128,可以找到很多反例,如118,119,125,128,150,故甲同学的数学成绩不一定优秀; 在②中,乙同学的5个数据的中位数为127,众数为121,所以前三个数为121,121,127,则后两个数肯定大于127,故乙同学的数学成绩一定优秀;在③中,丙同学的5个数据的众数为125,极差为10,总体均值为125,最大值与最小值的差为10,若最大值为129,则最小值为119.即119,125,125,127,129,故丙同学的数学成绩不一定优秀.综上,数学成绩一定优秀的同学只有乙. 答案:乙16.解析:根据平均数的计算公式,全班的平均数为z - =17×30+12×2030+20=15,设男同学为x 1,x 2,…,x 30,女同学为y 1,y 2,…,y 20,答案:19。
高考数学二轮复习 专题六 统计 专题突破练19 统计与概率 文
学习资料专题专题突破练19 统计与概率1.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.2.(2018河南六市联考一,文18)高三一班、二班各有6名学生参加学校组织的高中数学竞赛选拔考试,成绩如茎叶图所示.(1)若一班、二班6名学生的平均分相同,求x值;(2)若将竞赛成绩在[60,75),[75,85),[85,100]内的学生在学校推优时,分别赋1分,2分,3分,现在一班的6名参赛学生中取两名,求推优时这两名学生赋分的和为4分的概率.3.近年来,我国许多省市雾霾天气频发,为增强市民的环境保护意识,某市面向全市征召n名义务宣传志愿者,成立环境保护宣传组织.现把该组织的成员按年龄分成5组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示,已知第2组有35人.(1)求该组织的人数;(2)若在第3,4,5组中用分层抽样的方法抽取6名志愿者参加某社区的宣传活动,应从第3,4,5组各抽取多少名志愿者?(3)在(2)的条件下,该组织决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,求第3组至少有1名志愿者被抽中的概率.4.(2018山东潍坊一模,文19)某公司共有10条产品生产线,不超过5条生产线正常工作时,每条生产线每天纯利润为1 100元,超过5条生产线正常工作时,超过的生产线每条纯利润为800元,原生产线利润保持不变.未开工的生产线每条每天的保养等各种费用共100元.用x 表示每天正常工作的生产线条数,用y表示公司每天的纯利润.(1)写出y关于x的函数关系式,并求出纯利润为7 700元时工作的生产线条数.(2)为保证新开的生产线正常工作,需对新开的生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数=14,标准差s=2,绘制如图所示的频率分布直方图,以频率值作为概率估计值.为检测该生产线生产状况,现从加工的产品中任意抽取一件,记其数据为X,依据以下不等式评判(P表示对应事件的概率)①P(-s<X<+s)≥0.682 6②P(-2s<X<+2s)≥0.954 4③P(-3s<X<+3s)≥0.997 4评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线.试判断该生产线是否需要检修.5.某市电视台为了宣传举办问答活动,随机对该市15~65岁的人群抽取了n人,回答问题统计结果如图表所示.(1)分别求出a,b,x,y的值;(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,则第2,3,4组每组应各抽取多少人?(3)在(2)的前提下,电视台决定在所抽取的6人中随机抽取2人颁发幸运奖,求所抽取的人中第2组至少有1人获得幸运奖的概率.6.(2018北京卷,文17)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化,假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)7.为了解人们对于国家新颁布的“生育二胎放开”政策的热度,现在某市进行调查,随机抽查了50人,他们年龄的频数分布及支持“生育二胎放开”人数如下表:(1)由以上统计数据填写下面的2×2列联表,并问能否在犯错误的概率不超过0.01的前提下(2)若对年龄在[5,15)的被调查人中随机选取两人进行调查,恰好这两人都支持“生育二胎放开”政策的概率是多少?参考数据:K2=,其中n=a+b+c+d.8.(2018湖南衡阳一模,文19)空气质量主要受污染物排放量及大气扩散等因素的影响,某市环保监测站2018年1月连续10天(从左到右对应1号至10号)采集该市某地平均风速及空气中污染物的日均浓度数据,制成散点图如下图所示.(1)同学甲从这10天中随机抽取连续5天的一组数据,计算回归直线方程,试求连续5天的一组数据中恰好同时包含污染物日均浓度最大与最小值的概率;(2)现有30名学生,每人任取5天数据,并已对应计算出30个不同的回归直线方程,且30组数据中包含污染物日均浓度最值的有15组,现采用这30个回归方程对某一天平均风速下的污染物日均浓度进行预测,若预测值与实测值差的绝对值小于2,则称之为“拟合效果好”,否则为“拟合效果不好”,学生通过检验已经获得了下列2×2列联表的部分信息,请你进一步补充完善2×2列联表,并分析是否有95%以上的把握认为拟合效果与选取数据是否包含污参考数据:K2=(其中n=a+b+c+d).参考答案专题突破练19统计与概率1.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.2.解 (1)由93+90+x+81+73+77+61=90+94+84+72+76+63,得x=4.(2)由题意知一班赋3,2,1分的学生各有2名,设赋3分的学生为A1,A2,赋2分的学生为B1,B2,赋1分的学生为C1,C2,则从6人中抽取两人的基本事件为A1A2,A1B1,A1B2,A1C1,A1C2,A2B1,A2B2,A2C1,A2C2,B1B2,B1C1,B1C2,B2C1,B2C2,C1C2共15种,其中赋分的和为4分的有5种,∴这两名学生赋分的和为4的概率为P=.3.解 (1)由题意,得第2组的人数为35=5×0.07×n,得到n=100,故该组织有100人.(2)第3组的人数为0.06×5×100=30,第4组的人数为0.04×5×100=20,第5组的人数为0.02×5×100=10,所以第3,4,5组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,每组抽取的人数分别为:第3组×6=3;第4组×6=2;第5组×6=1.所以应从第3,4,5组中分别抽取3人,2人,1人.(3)记第3组的3名志愿者为A1,A2,A3,第4组的2名志愿者为B1,B2,第5组的1名志愿者为C1,则从6名志愿者中抽取2名志愿者有(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,C1),(A2,A3),(A2,B1),(A2,B2),(A2,C1),(A3,B1),(A3,B2),( A3,C1),(B1,B2),(B1,C1),(B2,C1),共有15种.其中第3组的3名志愿者A1,A2,A3至少有一名志愿者被抽中的有(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,C1),(A2,A3),(A2,B1),(A2,B2),(A2,C1),(A3,B1),(A3,B2),( A3,C1),共有12种.则第3组至少有1名志愿者被抽中的概率为.4.解 (1)由题意知:当x≤5时,y=1 100x-100×(10-x)=1 200x-1 000,当5<x≤10时,y=1 100×5+800×(x-5)-100×(10-x)=900x+500,∴y=当y=7 700时,由900x+500=7 700,得x=8,即8条生产线正常工作.(2)μ=14,σ=2,由频率分布直方图得:∴P(12<X<16)=(0.29+0.11)×2=0.8>0.682 6,P(10<X<18)=0.8+(0.04+0.03)×2=0.94<0.954 4,P(8<X<20)=0.94+(0.015+0.005)×2=0.98<0.997 4,∵不满足至少两个不等式,∴该生产线需检修.5.解 (1)第1组人数为5÷0.5=10,所以n=10÷0.1=100;第2组人数为100×0.2=20,所以a=20×0.9=18;第3组人数为100×0.3=30,所以x=27÷30=0.9;第4组人数为100×0.25=25,所以b=25×0.36=9;第5组人数为100×0.15=15,所以y=3÷15=0.2.(2)第2,3,4组回答正确的人数比为18∶27∶9=2∶3∶1,所以第2,3,4组每组应各依次抽取2人、3人、1人.(3)记抽取的6人中,第2组的记为a1,a2,第3组的记为b1,b2,b3,第4组的记为c,则从6人中随机抽取2人的所有可能的情况有15种,它们是(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a1,c),(a2,b1),(a2,b2),(a2,b3),(a2,c),(b1,b2),(b1,b3),(b1 ,c),(b2,b3),(b2,c),(b3,c),其中第2组至少有1人的情况有9种,它们是(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a1,c),(a2,b1),(a2,b2),(a2,b3),(a2,c).故所求概率P=.6.解 (1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2 000.第四类电影中获得好评的电影部数是200×0.25=50,故所求概率为=0.025.(2)(方法一)由题意知,样本中获得好评的电影部数是140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1=56+10+45+50+160+51=372.故估计所求概率为1-=0.814.(方法二)设“随机选取1部电影,这部电影没有获得好评”为事件B.没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1 628(部).由古典概型概率公式,得P(B)==0.814.(3)第五类电影的好评率增加0.1,第二类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大.点睛本题主要考查概率与统计知识,属于易得分题,应用古典概型求某事件的步骤:第一步,判断本试验的结果是否为等可能事件,设出事件A;第二步,分别求出基本事件的总数n与所求事件A中所包含的基本事件个数m;第三步,利用公式P(A)=求出事件A的概率.7.解 (1)2×2列联表如下:K2=≈6.27<6.635,所以在犯错误的概率不超过0.01的前提下不能认为以45岁为分界点对“生育二胎放开”政策的支持度有差异.(2)设年龄在[5,15)中支持“生育二胎放开”政策的4人分别为a,b,c,d,不支持“生育二胎放开”政策的1人记为M,则从年龄在[5,15)的被调查人中随机选取两人所有可能的结果有(a,b),(a,c),(a,d),(a,M),(b,c),(b,d),(b,M),(c,d),(c,M),(d,M),共10种.设“恰好这两人都支持‘生育二胎放开’政策”为事件A,则事件A所有可能的结果有(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共6种,故P(A)=.所以对年龄在[5,15)的被调查人中随机选取两人进行调查时,恰好这两人都支持“生育二胎放开”政策的概率为.8.解 (1)记第i天监测数据为A i(i=1,2,…,10),由图象易知A4的日均浓度最大,A5的日均浓度最小.从这10天中随机抽取一组连续5天的数据包含的基本事件有:(A1,A2,A3,A4,A5),(A2,A3,A4,A5,A6),(A3,A4,A5,A6,A7),(A4,A5,A6,A7,A8),(A5,A6,A7,A8,A9),(A6 ,A7,A8,A9,A10),共6种.记事件A“数据中恰好同时包含污染物日均浓度最大与最小值”,包含的基本事件有:(A1,A2,A3,A4,A5),(A2,A3,A4,A5,A6),(A3,A4,A5,A6,A7),(A4,A5,A6,A7,A8),共4种.故连续5天的数据中恰好同时包含污染物日均浓度最值的概率P(A)=.(2)依题意,完成2×2列联表如下所示.由公式K2=,计算得K2=≈4.821.由参考数据可知,4.821>3.841,故有95%以上的把握说拟合效果与选取数据是否包含污染物日均浓度最值有关.。
高考数学-热点专题专练-专题六-算法、统计、概率、复数测试题-理精品
专题六算法、统计、概率、复数测试题(时间:120分钟满分:150分)一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.已知复数z的共轭复数为,若|=4,则z·=( )A.4 B.2C.16 D.±2解析设z=a+,则z·=(a+)(a-)=a2+b2.又|=4,得=4,所以z·=16.故选C.答案C2.(2011·湖北)如图,用K、A1、A2三类不同的元件连接成一个系统,当K 正常工作且A1、A2至少有一个正常工作时,系统正常工作,已知K、A1、A2正常工作的概率依次是0.9、0.8、0.8,则系统正常工作的概率为( )A.0.960 B.0.864C.0.720 D.0.576解析K正常工作,概率P(A)=0.9A1A2正常工作,概率P(B)=1-P(1)P(2)=1-0.2×0.2=0.96∴系统正常工作概率P=0.9×0.96=0.864.答案B3.(2011·课标)有3个爱好小组,甲、乙两位同学各自参与其中一个小组,每位同学参与各个小组的可能性相同,则这两位同学参与同一个爱好小组的概率为( )解析古典概型,总的状况共3×3=9种,满意题意的有3种,故所求概率为P==.答案A4.对变量x,y有观测数据(,)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(,)(i=1,2,…,10),得散点图2.由这两个散点图可以推断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析夹在带状区域内的点,总体呈上升趋势的属于正相关;反之,总体呈下降趋势的属于负相关.明显选C.答案C5.某个容量为100的样本的频率分布直方图如图所示,则在区间[4,5)上的数据的频数为( )A.15 B.20C.25 D.30解析在区间[4,5)的频率/组距的数值为0.3,而样本容量为100,所以频数为30.故选D.答案D6.(2011·辽宁丹东模拟)甲、乙两名同学在五次测试中的成果用茎叶图表示如图,若甲、乙两人的平均成果分别是x甲、x乙,则下列结论正确的是( )A.x甲>x乙;乙比甲成果稳定B.x甲>x乙;甲比乙成果稳定C.x甲<x乙;甲比乙成果稳定D.x甲<x乙;乙比甲成果稳定解析由题意得,x甲=×(68+69+70+71+72)=×350=70,x乙=×(63+68+69+69+71)=×340=68,所以x甲>x乙.又=×(22+12+02+12+22)=×10=2,=×(52+02+12+12+32)=×36=7.2,所以甲比乙成果稳定.故选B.答案B7.(2012·福建)如图所示,在边长为1的正方形中任取一点P,则点P恰好取自阴影部分的概率是( )解析由图示可得,图中阴影部分的面积S=(-x)=错误!错误!=错误!-错误!=,由此可得点P恰好取自阴影部分的概率P==.答案C8.如图所示的流程图,最终输出的n的值是( )A.3 B.4C.5 D.6解析当n=2时,22>22不成立;当n=3时,23>32不成立;当n=4时,24>42不成立;当n=5时,25>52成立.所以n=5.故选C.答案C9.正四面体的四个表面上分别写有数字1,2,3,4,将3个这样的四面体同时投掷于桌面上,与桌面接触的三个面上的数字的乘积能被3整除的概率为( )解析将正四面体投掷于桌面上时,与桌面接触的面上的数字是1,2,3,4的概率是相等的,都等于.若与桌面接触的三个面上的数字的乘积能被3整除,则三个数字中至少应有一个为3,其对立事务为“与桌面接触的三个面上的数字都不是3”,其概率是3=,故所求概率为1-=.答案C10.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号依次平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是( ) A.5 B.6C.7 D.8解析设第1组抽出的号码为x,则第16组应抽出的号码是8×15+x=126,∴x=6.故选B.答案B11.(2011·杭州市第一次教学质量检测)体育课的排球发球项目考试的规则是:每位学生最多可发球3次,一旦发球成功,则停止发球,否则始终发到3次为止.设学生一次发球成功的概率为p(p≠0),发球次数为X,若X的数学期望E(X)>1.75,则p的取值范围是( )解析发球次数X的分布列如下表,所以期望解得p>(舍去)或p<,又p>0,故选C . 答案 C12.(2012·济宁一中高三模拟)某计算机程序每运行一次都随机出现一个五位的二进制数A =,其中A 的各位数中,a 1=1,(k 可取2,3,4,5)出现0的概率为,出现1的概率为.记ξ=a 1+a 2+a 3+a 4+a 5,当程序运行一次时,ξ的数学期望E(ξ)=( )解析 ξ=1,P 1=40=, ξ=2时,P 2=3·=, ξ=3时,P 3=·2·2=, ξ=4时,P 4=·3=, ξ=5时,P 5=4=,E(ξ)=1×+2×+3×+4×+5×=. 答案 C二、填空题:本大题共4小题,每小题4分,共16分,将答案填在题中的横线上.13.(2012·广东湛江十中模拟)在可行域内任取一点,规则如流程图所示,则能输出数对(x ,y)的概率为.解析如图所示,给出的可行域即为正方形与其内部.而所求事务所在区域为一个圆,两面积相比即得概率为.答案14.(2012·山东潍坊模拟)给出下列命题:(1)若z∈C,则z2≥0;(2)若a,b∈R,且a>b,则a+i>b+i;(3)若a∈R,则(a+1)i是纯虚数;(4)若z=,则z3+1对应的点在复平面内的第一象限.其中正确的命题是.解析由复数的概念与性质知,(1)错误;(2)错误;(3)错误,若a=-1,(a+1)i=0;(4)正确,z3+1=(-i)3+1=i+1.答案(4)15.(2011·上海)随机抽取的9位同学中,至少有2位同学在同一月份诞生的概率为.(默认每个月的天数相同,结果精确到0.001)解析P=1-≈0.985.答案0.98516.若某程序框图如图所示,则该程序运行后输出的y等于.解析由图中程序框图可知,所求的y是一个“累加的运算”,即第一步是3;其次步是7;第三步是15;第四步是31;第五步是63.答案63三、解答题:本大题共6小题,共74分.解答应写出文字说明、证明过程或演算步骤.17.(本小题满分12分)某班主任对全班50名学生学习主动性和对待班级工作的看法进行了调查,统计数据如下表所示:是多少?抽到不太主动参与班级工作且学习主动性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习主动性与对待班级工作的看法是否有关系?并说明理由.(参考下表)主动参与班级工作且学习主动性一般的学生有19人,概率为.(2)K2==≈11.5,∵K2>10.828,∴有99.9%的把握说学生的学习主动性与对待班级工作的看法有关系.18.(本小题满分12分)在1996年美国亚特兰大奥运会上,中国香港风帆选手李丽珊以惊人的耐力和斗志,勇夺金牌,为香港体育史揭开了“突破零”的新一页.在风帆竞赛中,成果以低分为优胜.竞赛共11场,并以最佳的9场成果计算最终的名次.前7场竞赛结束后,排名前5位的选手积分如表一所示:表一此时让你预料谁将获得最终的成功,你会怎么看?解由表一,我们可以分别计算5位选手前7场竞赛积分的平均数和标准差,分别作为衡量各选手竞赛的成果与稳定状况,如表二所示.表二就是说,在前7场竞赛过程中,她的成果最为优异,而且表现也最为稳定.尽管此时还有4场竞赛没有进行,但这里我们可以假定每位运动员在各自的11场竞赛中发挥的水平大致相同(实际状况也的确如此),因此可以把前7场竞赛的成果看做是总体的一个样本,并由此估计每位运动员最终的竞赛的成果.从已经结束的7场竞赛的积分来看,李丽珊的成果最为优异,而且表现最为稳定,因此在后面的4场竞赛中,我们有足够的理由信任她会接着保持优异而稳定的成果,获得最终的冠军.19.(本小题满分12分)(2012·苏州五中模拟)设不等式组错误!表示的区域为A,不等式组错误!表示的区域为B,在区域A中随意取一点P(x,y).(1)求点P落在区域B中的概率;(2)若x、y分别表示甲、乙两人各掷一次正方体骰子所得的点数,求点P落在区域B中的概率.解(1)设区域A中随意一点P(x,y)∈B为事务M.因为区域A的面积为S1=36,区域B在区域A中的面积为S2=18.故P(M)==.(2)设点P(x,y)落在区域B中为事务N,甲、乙两人各掷一次骰子所得的点P(x,y)的个数为36,其中在区域B中的点P(x,y)有21个.故P(N)==.20.(本小题满分12分)某中学部分学生参与全国中学数学竞赛,取得了优异成果,指导老师统计了全部参赛同学的成果(成果都为整数,试题满分120分),并且绘制了“频率分布直方图”(如图),请回答:(1)该中学参与本次数学竞赛的有多少人?(2)假如90分以上(含90分)获奖,则获奖率是多少?(3)这次竞赛成果的中位数落在哪段内?(4)上图还供应了其他信息,请再写出两条.解(1)由直方图(如图)可知:4+6+8+7+5+2=32(人);(2)90分以上的人数为7+5+2=14(人),∴×100%=43.75%.(3)参赛同学共有32人,按成果排序后,第16个、第17个是最中间两个,而第16个和第17个都落在80~90之间.∴这次竞赛成果的中位数落在80~90之间.(4)①落在80~90段内的人数最多,有8人;②参赛同学的成果均不低于60分.21.(本小题满分12分)(2012·天津)现有4个人去参与某消遣活动,该活动有甲、乙两个嬉戏可供参与者选择.为增加趣味性,约定:每个人通过掷一枚质地匀称的骰子确定自己去参与哪个嬉戏,掷出点数为1或2的人去参与甲嬉戏,掷出点数大于2的人去参与乙嬉戏.(1)求这4个人中恰有2人去参与甲嬉戏的概率;(2)求这4个人中去参与甲嬉戏的人数大于去参与乙嬉戏的人数的概率;(3)用X,Y分别表示这4个人中去参与甲、乙嬉戏的人数,记ξ=-,求随机变量ξ的分布列与数学期望Eξ.解依题意,这4个人中,每个人去参与甲嬉戏的概率为,去参与乙嬉戏的概率为.设“这4个人中恰有i人去参与甲嬉戏\”为事务(i=0,1,2,3,4),则P()=4-i.(1)设4个人中恰有2人去参与甲嬉戏的概率为P(A2)P(A2)=22=.(2)设“这4个人中去参与甲嬉戏的人数大于去参与乙嬉戏的人数”为事务B,则B=A3∪A4,由于A3和A4互斥,故P(B)=P(A3)+P(A4)=3+4=.所以,这4个人中去参与甲嬉戏的人数大于去参与乙嬉戏的人数的概率为.(3)ξ的全部可能取值为0,2,4.由于A1与A3互斥,A0和A4互斥,故P(ξ=0)=P(A2)=,P(ξ=2)=P(A1)+P(A3)=,P(ξ=4)=P(A0)+P(A4)=.所以ξ的分布列是随机变量ξ22.(本小题满分14分)(2012·福建)受轿车在保修期内修理费等因素的影响,企业生产每辆轿车的利润与该轿车首次出现故障的时间有关.某轿车制造厂生产甲、乙两种品牌轿车,保修期均为2年.现从该厂已售出的两种品牌轿车中各随机抽取50辆,统计数据如下:(1)从该厂生产的甲品牌轿车中随机抽取一辆,求其首次出现故障发生在保障期内的概率;(2)若该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为X1,生产一辆乙品牌轿车的利润为X2,分别求X1,X2的分布列;(3)该厂预料今后这两种品牌轿车销量相当,由于资金限制,只能生产其中一种品牌的轿车.若从经济效益的角度考虑,你认为应生产哪种品牌的轿车?说明理由.解(1)设“甲品牌轿车首次出现故障发生在保修期内”为事务A.则P(A)==.(2)依题意得,X1的分布列为X2的分布列为(3)由(2)得,E(X1)=1×+2×+3×==2.86(万元),E(X2)=1.8×+2.9×=2.79(万元).因为E(X1)>E(X2),所以应生产甲品牌轿车.。
二轮复习高考大题专项(六)概率与统计课件(81张)
提升,甚至放在后两道解答题位置,综合性较强.但实施新高考后,因为文理
同卷,难度又回到中等.
【典例剖析】
题型一
相关关系的判断及回归分析
【例1】 某基地蔬菜大棚采用无土栽培方式种
植各类蔬菜.根据过去50周的资料显示,该基地
周光照量X(单位:小时)都在30小时以上,其中不
6
=
C 24
P(ξ=0)= 2
C6
=
6
15
=
2
C 12 C 14
,P(ξ=1)= 2
5
C6
1
,
15
故 ξ 的分布列为
ξ
0
1
2
P(ξ)
2
5
8
15
1
15
=
8
,
15
^
^
^
(2)由散点图可知 = bz+更适合于此模型.其中
6
^
∑ -6
= =16
2
∑ 2 -6
=
^
-1.07
参考数据:
α
xα
0.05
3.841
0.01
6.635
2
(
-
)
参考公式:χ2=
.
(+)(+)(+)(+)
0.005
7.879
0.001
10.828
解 (1)由统计表可得,低于45岁人数为70人,不低于45岁人数为30人,
可得列联表如下
是否使用手机支付
年龄低于45岁
使用
60
不使用
X>70时,只有1台光照控制仪运行,此时周总利润
2020新高考数学二轮冲刺概率与统计全归纳(基础中档拔高题全解析)
统计与统计案例
一、考纲解读
1. 理解随机抽样的必要性和重要性。 2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。 3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折 线图、茎叶图,理解它们各自的特点。 4. 理解样本数据标准差的意义和作用,会计算数据标准差。 5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本 数字特征,理解用样本估计总体的思想。 6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。 7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。 8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归 方程。 9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。 (1)独立性检验 了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用。 (2)回归分析 了解回归分析的基本思想、方法及其简单应用。
个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为
A. 1 3
B. 1 2
C. 2 3
D. 3 4
答案:
1.D【解析】将 2 名男同学分别记为 x , y ,3 名女同学分别记为 a ,b ,c .设 “选中的 2 人都是女同学”为事件 A ,则从 5 名同学中任选 2 人参加社区服务的所 有可能情况有 (x, y) ,(x, a) ,(x,b) ,(x, c) ,( y, a) ,( y,b) ,( y, c) ,(a,b) ,(a, c) , (b, c) 共 19 种,其中事件 A 包含的可能情况有 (a,b) , (a, c) , (b, c) 共 3 种,故 P(A) 3 0.3,故选 D.
2019-2020年高三数学第二轮专题复习概率与统计问题的题型与方法人教版
2019-2020年高三数学第二轮专题复习概率与统计问题的题型与方法人教版1.了解典型分布列:0~1分布,二项分布,几何分布。
2.了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。
3.在实际中经常用期望来比较两个类似事件的水平,当水平相近时,再用方差比较两个类似事件的稳定程度。
4.了解正态分布的意义,能借助正态曲线的图像理解正态曲线的性质。
5.了解标准正态分布的意义和性质,掌握正态总体转化为标准正态总体N(0,1)的公式及其应用。
6.通过生产过程的质量控制图,了解假设检验的基本思想。
7.了解相关关系、回归分析、散点图等概念,会求回归直线方程。
8.了解相关系数的计算公式及其意义,会用相关系数公式进行计算。
了解相关性检验的方法与步骤,会用相关性检验方法进行检验。
二.考试要求:⑴了解随机变量、离散型随机变量的意义,会求出某些简单的离散型随机变量的分布列。
⑵了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。
⑶会用抽机抽样,系统抽样,分层抽样等常用的抽样方法从总体中抽取样本。
⑷会用样本频率分布去估计总体分布。
⑸了解正态分布的意义及主要性质。
⑹了解假设检验的基本思想。
⑺会根据样本的特征数估计总体。
⑻了解线性回归的方法。
三.教学过程:(Ⅰ)基础知识详析㈠随机事件和统计的知识结构:㈡随机事件和统计的内容提要1.主要内容是离散型随机变量的分布列、期望与方差,抽样方法,总体分布的估计,正态分布和线性回归。
2.随机变量的概率分布(1)离散型随机变量的分布列:ε……P ……两条基本性质①…);②P1+P2+ (1)(2)连续型随机变量概率分布:由频率分布直方图,估计总体分布密度曲线y=f(x);总体分布密度函数的两条基本性质: ①f(x) ≥0(x ∈R);②由曲线y=f(x)与x 轴围成面积为1。
3.随机变量的数学期望和方差 (1)离散型随机变量的数学期望: …;反映随机变量取值的平均水平。
2020届高考数学大二轮复习 层级二 专题六 概率与统计 第1讲 统计、统计案例教学案
第1讲统计、统计案例[考情考向·高考导航]1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小.2.注重知识的交汇渗透,统计与概率,统计案例与概率是近年命题的热点,以解答题中档难度出现.[真题体验]1.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:A [设新农村建设前经济收入为x,则新农村建设后经济收入为2x,对于A,新农村建设前,种植收入为错误!,新农村建设后,种植收入为错误!=74x100,种植收入增加,故A不正确;对于B,新农村建设前其他收入为错误!,建设后其他收入为错误!,故B正确;对于C,新农村建设前,养殖收入为错误!,建设后养殖收入为60x100,故C正确;对于D,新农村建设后,养殖收入与第三产业收入的总和占经济收入的28%+30%=58%,超过了一半,故D正确.] 2.(2019·全国Ⅱ卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁一列车中,有10个车次的正点率为0.97,有20个车次的正点率为0。
98,有10个车次的正点率为0。
99,则经停该站高铁列车所有车次的平均正点率的估计值为____________.解析:平均正点率的估计值为错误!=0.98。
答案:0.983.(理)(2017·全国Ⅱ卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg",估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3(精确到0.01)附:K2=错误!。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题突破练19 统计与概率1.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.2.(2018河南六市联考一,文18)高三一班、二班各有6名学生参加学校组织的高中数学竞赛选拔考试,成绩如茎叶图所示.(1)若一班、二班6名学生的平均分相同,求x值;(2)若将竞赛成绩在[60,75),[75,85),[85,100]内的学生在学校推优时,分别赋1分,2分,3分,现在一班的6名参赛学生中取两名,求推优时这两名学生赋分的和为4分的概率.3.近年来,我国许多省市雾霾天气频发,为增强市民的环境保护意识,某市面向全市征召n名义务宣传志愿者,成立环境保护宣传组织.现把该组织的成员按年龄分成5组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示,已知第2组有35人.(1)求该组织的人数;(2)若在第3,4,5组中用分层抽样的方法抽取6名志愿者参加某社区的宣传活动,应从第3,4,5组各抽取多少名志愿者?(3)在(2)的条件下,该组织决定在这6名志愿者中随机抽取2名志愿者介绍宣传经验,求第3组至少有1名志愿者被抽中的概率.4.(2018山东潍坊一模,文19)某公司共有10条产品生产线,不超过5条生产线正常工作时,每条生产线每天纯利润为1 100元,超过5条生产线正常工作时,超过的生产线每条纯利润为800元,原生产线利润保持不变.未开工的生产线每条每天的保养等各种费用共100元.用x表示每天正常工作的生产线条数,用y表示公司每天的纯利润.(1)写出y关于x的函数关系式,并求出纯利润为7 700元时工作的生产线条数.(2)为保证新开的生产线正常工作,需对新开的生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数=14,标准差s=2,绘制如图所示的频率分布直方图,以频率值作为概率估计值.为检测该生产线生产状况,现从加工的产品中任意抽取一件,记其数据为X,依据以下不等式评判(P表示对应事件的概率)①P(-s<X<+s)≥0.682 6②P(-2s<X<+2s)≥0.954 4③P(-3s<X<+3s)≥0.997 4评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线.试判断该生产线是否需要检修.5.某市电视台为了宣传举办问答活动,随机对该市15~65岁的人群抽取了n人,回答问题统计结果如图表所示.(1)分别求出a,b,x,y的值;(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,则第2,3,4组每组应各抽取多少人?(3)在(2)的前提下,电视台决定在所抽取的6人中随机抽取2人颁发幸运奖,求所抽取的人中第2组至少有1人获得幸运奖的概率.6.(2018北京卷,文17)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化,假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)7.为了解人们对于国家新颁布的“生育二胎放开”政策的热度,现在某市进行调查,随机抽查了50人,他们年龄的频数分布及支持“生育二胎放开”人数如下表:(1)由以上统计数据填写下面的2×2列联表,并问能否在犯错误的概率不超过0.01的前提下认为以45岁为分界点对“生育二胎放开”政策的支持度有差异?合计(2)若对年龄在[5,15)的被调查人中随机选取两人进行调查,恰好这两人都支持“生育二胎放开”政策的概率是多少?参考数据:K2=,其中n=a+b+c+d.8.(2018湖南衡阳一模,文19)空气质量主要受污染物排放量及大气扩散等因素的影响,某市环保监测站2018年1月连续10天(从左到右对应1号至10号)采集该市某地平均风速及空气中污染物的日均浓度数据,制成散点图如下图所示.(1)同学甲从这10天中随机抽取连续5天的一组数据,计算回归直线方程,试求连续5天的一组数据中恰好同时包含污染物日均浓度最大与最小值的概率;(2)现有30名学生,每人任取5天数据,并已对应计算出30个不同的回归直线方程,且30组数据中包含污染物日均浓度最值的有15组,现采用这30个回归方程对某一天平均风速下的污染物日均浓度进行预测,若预测值与实测值差的绝对值小于2,则称之为“拟合效果好”,否则为“拟合效果不好”,学生通过检验已经获得了下列2×2列联表的部分信息,请你进一步补充完善2×2列联表,并分析是否有95%以上的把握认为拟合效果与选取数据是否包含污染物日均浓度最值有关.K2=(其中n=a+b+c+d).参考答案专题突破练19统计与概率1.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.2.解 (1)由93+90+x+81+73+77+61=90+94+84+72+76+63,得x=4.(2)由题意知一班赋3,2,1分的学生各有2名,设赋3分的学生为A1,A2,赋2分的学生为B1,B2,赋1分的学生为C1,C2,则从6人中抽取两人的基本事件为A1A2,A1B1,A1B2,A1C1,A1C2,A2B1,A2B2,A2C1,A2C2,B1B2,B1C1,B1C2,B2C1,B2C2,C1C2共15种,其中赋分的和为4分的有5种,∴这两名学生赋分的和为4的概率为P=.3.解 (1)由题意,得第2组的人数为35=5×0.07×n,得到n=100,故该组织有100人.(2)第3组的人数为0.06×5×100=30,第4组的人数为0.04×5×100=20,第5组的人数为0.02×5×100=10,所以第3,4,5组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,每组抽取的人数分别为:第3组×6=3;第4组×6=2;第5组×6=1.所以应从第3,4,5组中分别抽取3人,2人,1人.(3)记第3组的3名志愿者为A1,A2,A3,第4组的2名志愿者为B1,B2,第5组的1名志愿者为C1,则从6名志愿者中抽取2名志愿者有(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,C1),(A2,A3),(A2,B1),(A2,B2),(A2,C1),(A3,B1),(A3,B2),(A3,C1),(B1,B2),(B1,C1), (B2,C1),共有15种.其中第3组的3名志愿者A1,A2,A3至少有一名志愿者被抽中的有(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,C1),(A2,A3),(A2,B1),(A2,B2),(A2,C1),(A3,B1),(A3,B2),(A3,C1),共有12种.则第3组至少有1名志愿者被抽中的概率为.4.解 (1)由题意知:当x≤5时,y=1 100x-100×(10-x)=1 200x-1 000,当5<x≤10时,y=1 100×5+800×(x-5)-100×(10-x)=900x+500,∴y=当y=7 700时,由900x+500=7 700,得x=8,即8条生产线正常工作.(2)μ=14,σ=2,由频率分布直方图得:∴P(12<X<16)=(0.29+0.11)×2=0.8>0.682 6,P(10<X<18)=0.8+(0.04+0.03)×2=0.94<0.954 4,P(8<X<20)=0.94+(0.015+0.005)×2=0.98<0.997 4,∵不满足至少两个不等式,∴该生产线需检修.5.解 (1)第1组人数为5÷0.5=10,所以n=10÷0.1=100;第2组人数为100×0.2=20,所以a=20×0.9=18;第3组人数为100×0.3=30,所以x=27÷30=0.9;第4组人数为100×0.25=25,所以b=25×0.36=9;第5组人数为100×0.15=15,所以y=3÷15=0.2.(2)第2,3,4组回答正确的人数比为18∶27∶9=2∶3∶1,所以第2,3,4组每组应各依次抽取2人、3人、1人.(3)记抽取的6人中,第2组的记为a1,a2,第3组的记为b1,b2,b3,第4组的记为c,则从6人中随机抽取2人的所有可能的情况有15种,它们是(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a1,c),(a2,b1),(a2,b2),(a2,b3),(a2,c),(b1,b2),(b1,b3),(b1,c),(b2,b3),(b2,c),(b3 ,c),其中第2组至少有1人的情况有9种,它们是(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a1,c),(a2,b1),(a2,b2),(a2,b3),(a2,c).故所求概率P=.6.解 (1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2 000.第四类电影中获得好评的电影部数是200×0.25=50,故所求概率为=0.025.(2)(方法一)由题意知,样本中获得好评的电影部数是140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1=56+10+45+50+160+51=372.故估计所求概率为1-=0.814.(方法二)设“随机选取1部电影,这部电影没有获得好评”为事件B.没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1 628(部).由古典概型概率公式,得P(B)==0.814.(3)第五类电影的好评率增加0.1,第二类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大.点睛本题主要考查概率与统计知识,属于易得分题,应用古典概型求某事件的步骤:第一步,判断本试验的结果是否为等可能事件,设出事件A;第二步,分别求出基本事件的总数n与所求事件A中所包含的基本事件个数m;第三步,利用公式P(A)=求出事件A的概率.7.解 (1)2×K2=≈6.27<6.635,所以在犯错误的概率不超过0.01的前提下不能认为以45岁为分界点对“生育二胎放开”政策的支持度有差异.(2)设年龄在[5,15)中支持“生育二胎放开”政策的4人分别为a,b,c,d,不支持“生育二胎放开”政策的1人记为M,则从年龄在[5,15)的被调查人中随机选取两人所有可能的结果有(a,b),(a,c),(a,d),(a,M),(b,c),(b,d),(b,M),(c,d),(c,M),(d,M),共10种.设“恰好这两人都支持‘生育二胎放开’政策”为事件A,则事件A所有可能的结果有(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共6种,故P(A)=.所以对年龄在[5,15)的被调查人中随机选取两人进行调查时,恰好这两人都支持“生育二胎放开”政策的概率为.8.解 (1)记第i天监测数据为A i(i=1,2,…,10),由图象易知A4的日均浓度最大,A5的日均浓度最小.从这10天中随机抽取一组连续5天的数据包含的基本事件有:(A1,A2,A3,A4,A5),(A2,A3,A4,A5,A6),(A3,A4,A5,A6,A7),(A4,A5,A6,A7,A8),(A5,A6,A7,A8,A9),(A6,A7,A8,A9,A10),共6种.记事件A“数据中恰好同时包含污染物日均浓度最大与最小值”,包含的基本事件有:(A1,A2,A3,A4,A5),(A2,A3,A4,A5,A6),(A3,A4,A5,A6,A7),(A4,A5,A6,A7,A8),共4种.故连续5天的数据中恰好同时包含污染物日均浓度最值的概率P(A)=.(2)依题意,完成2×2列联表如下所示.由公式K2=,计算得K2=≈4.821.由参考数据可知,4.821>3.841,故有95%以上的把握说拟合效果与选取数据是否包含污染物日均浓度最值有关.。