2020年高考文科数学《概率与统计》题型归纳与训练

合集下载

高考文科数学概率与统计题型归纳与训练

高考文科数学概率与统计题型归纳与训练

高考文科数学概率与统计题型归纳与训练高考文科数学概率与统计题型归纳与训练近年来,随着高考评价重点的转变,我国高考数学概率与统计所占的比重越来越大,也极大地影响了学生的试题解答,特别是对文科类学生而言。

因此,归纳与训练概率与统计的题型对提升高考成绩非常有效。

一、高考概率与统计试题类型1、概率题:(1)概率概念题:要求判断某事件的可能性大小、求概率大小、比较概率大小,以及用中文描述概率大小等概念性问题。

(2)条件概率及贝叶斯公式:求两事件同时发生的条件概率,用贝叶斯公式求解概率问题。

(3)随机变量和概率分布:讨论正态分布、泊松分布等随机变量的概率分布。

2、统计学题:(1)数据的勘误析:把调查所得原始数据准确地归类编单,以便找出这些数据中蕴含的结论。

(2)图表分析:分析调查对象之间的关系,从折线图、饼形图、柱形图等图表中获取相应的数据。

二、概率与统计的训练方法1、理论思考训练:多看有关概率、统计的权威论文和教材,把基本概念牢牢掌握,把常见的概率公式及统计公式及推导式脱口而出。

2、示范练习:对常考的知识点补充示范练习,可以通过复现例题和大量习题来熟悉该知识点,从而深入理解,提高解题能力。

3、联系模拟考试:利用模拟考试把学过的知识点和技巧联系起来,在试题中能够驾轻就熟地掌握各试题技巧,大大提升实力。

4、强化记忆:记忆知识点、公式要选择相应的方法,通过反复记忆和熟习,把重点内容融会贯通,熟练记忆几个重点的式子和结论有助于考试的取得好成绩。

总之,学习概率与统计,除了要用心去理解之外,还需要不断的训练,把一些重点的知识点、公式强化记忆,加深理解,才能在考试中取得较好的成绩。

2020年高考数学(文)一轮复习精品特训专题十:概率与统计

2020年高考数学(文)一轮复习精品特训专题十:概率与统计

1
1
1
2
A.
B.
C.
D.
10
4
3
3
4、袋中装有大小相同的四个球,四个球上分別标有数字“
2”“ 0”“ 1”“ 8”,现从中随
机选取三个球,则所选的三个球上的数字能构成等差数列的概率是
()
A. 2
B. 1
C. 1
D. 1
3
2
3
4
5、一次数学考试中, 4 位同学各自在第 22 题和第 23 题中任选—题作答, 则第 22 题和第 23
2020 年高考数学(文)一轮复习精品特训
专题十:概率与统计
概率与统计( 1)事件与概率
1、齐王与田忌赛马 , 田忌的上等马优于齐王的中等马 , 劣于齐王的上等马 , 田忌的中等马优于
齐王的下等马 , 劣于齐王的中等马 , 田忌的下等马劣于齐王的下等马 , 现从双方的马匹中随机
选一匹进行一场比赛 , 则田忌马获胜的概率为 ( )
2020 年高考数学(文)一轮复习精品特训
概率与统计( 2)古典概型
1、某商场举行有奖促销活动 , 抽奖规则如下 : 箱子中有编号为 1,2,3,4,5 的五个形状、大小
完全相同的小球 , 从中任取两球 , 若摸出的两球号码的乘积为奇数则中奖 ; 否则不中奖则中奖
的概率为 (
)
A. 1 B. 1 C. 3 D. 2
A. 1
B. 1
C. 1
D. 1
3
4
5
6
2、若 A, B 是互斥事件 , 则(
)
A. P A B <1
B. P A B 1
C. P A B >1
D. P A B 1

2020高考数学压轴题——概率与统计高考常见题型解题思路及知识点总结

2020高考数学压轴题——概率与统计高考常见题型解题思路及知识点总结

6.其他离散型随机变量分布列问题(频率估计概率,方案选择,随机变量取值意义,与其他知识结合)
解题思路及步骤
注意事项
写出随机变量可能取值
这类题重点考查是否理解随机变量取每一个值的意义
求出随机变量取每个值的概率 注意对随机变量所取的值表示多种的情况,多数情况由频率估计估计概率
写出分布列 求数学期望
检验所有概率之和是否等于 1 通过数学期望进行决策
PX
k
C2k
C 2k 8
C120
, (k
0,1,2) EX

3 2 10
0.6
(2)Y 的可能取值为 0,1,2,3,根据题意 Y~B(3,0.2),所以 Y 分布列为:
PY k C3k 0.2k 1 0.23k , (k 0,1,2,3) , EY 3 0.2 0.6
3
(3)Z 的可能取值为 0,1,2,3,根据题意 Z~B(3,0.2),所以 Z 分布列为:
,且各件产品是否为不合格品相互独立. (1)记 20 件产品中恰有 2 件不合格品的概率为 ,求 的最大值点 . (2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的 作为 的值.已知每件产品 的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每件不合格品支付 25 元的赔偿费用. (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求 ; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
法,故概率为
,选 C.
典例 3: (2014 全国 2 卷理科 5)某地区空气质量监测资料表明,一天的空气质量为优良的概率是 0.75,连续
两天为优良的概率是 0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是 ( )

2020年高考数学(文数)解答题强化专练——概率与统计解析版

2020年高考数学(文数)解答题强化专练——概率与统计解析版

(文数)解答题强化专练——概率与统计一、解答题(本大题共10小题,共120.0分)1.党中央、国务院历来高度重视青少年的健康成长.“少年强则国强”,青少年身心健康、体魄强健、意志坚强、充满活力,是一个民族旺盛生命力的体现,是社会文明进步的标志,是国家综合实力的重要方面.全面实施《国家学生体质健康标准》,把健康素质作为评价学生全面健康发展的重要指标,是新时代的要求.《国家学生体质健康标准》有一项指标是学生体质指数(BMI),其计算公式为:,当BMI>23.5时认为“超重”,应加强锻炼以改善BMI.某高中高一、高二年级学生共2000人,人数分布如表(a).为了解这2000名学生的BMI指数情况,从中随机抽取容量为160的一个样本.性别男生女生合计年级高一年级5506501200高二年级425375800合计97510252000表(a)(1)为了使抽取的160个学生更具代表性,宜采取分层抽样,试给出一个合理的分层抽样方案,并确定每层应抽取出的学生人数;(2)分析这160个学生的BMI值,统计出“超重”的学生人数分布如表(b).性别男生女生年级高一年级46高二年级24表(b)(i)试估计这2000名学生中“超重”的学生数;(ii)对于该校的2000名学生,应用独立性检验的知识,可分析出性别变量比年级变量与“是否超重”关联性更强.应用卡方检验,可依次得到K2的观察值k1,k2,是判断k1和k2的大小关系.(只需写出结论)2.“公平正义”是社会主义和谐社会的重要特征,是社会主义法治理念的价值追求.“考试”作为一种公平公正选拔人才的有效途径,正被广泛采用.每次考试过后,考生最关心的问题是:自己的考试名次是多少?自已能否被录取?能获得什么样的职位?某单位准备通过考试(按照高分优先录取的原则)录用300名,其中275个高薪职位和25个普薪职位.实际报名人数为2000名,考试满分为400分.考试后对部分考生考试成绩进行抽样分析,得到频率分布直方图如下:试结合此频率分布直方图估计:(1)此次考试的中位数是多少分(保留为整数)?(2)若考生甲的成绩为280分,能否被录取?若能被录取,能否获得高薪职位?(分数精确到个位,概率精确到千分位)3.纪念币是一个国家为纪念国际或本国的政治、历史,文化等方面的重大事件、杰出人物、名胜古迹、珍稀动植物、体育赛事等而发行的法定货币.我国在1984年首次发行纪念币,目前已发行了115套纪念币,这些纪念币深受邮币爱好者的喜爱与收藏.2019年发行的第115套纪念币“双遗产之泰山币”是目前为止发行的第一套异形币,因为这套纪念币的多种特质,更加受到爱好者追捧.某机构为调查我国公民对纪念币的喜爱态度,随机选了某城市某小区的50位居民调查,调查结果统计如下:喜爱不喜爱合计年龄不大于40岁24年龄大于40岁20合计2250(Ⅰ)根据已有数据,把表格数据填写完整,判断能否在犯错误的概率不超过1%的前提下认为不同年龄与纪念币的喜爱无关?(Ⅱ)已知在被调查的年龄不大于40岁的喜爱者中有5名男性,其中3位是学生,现从这5名男性中随机抽取2人,求至多有1位学生的概率.附:,n=a+b+c+d.P(K2≥k)0.1000.0500.0250.010k 2.706 3.841 5.024 6.6354.某市一水电站的年发电量y(单位:亿千瓦时)与该市的年降雨量x(单位:毫米)有如下统计数据:2013年2014年2015年2016年2017年降雨量x (毫米) 1 500 1 400 1 900 1 600 2 100发电量y (亿千瓦7.4 7.0 9.2 7.9 10.0时)(1)若从统计的5年中任取2年,求这2年的发电量都高于7.5 亿千瓦时的概率;(2)由表中数据求得线性回归方程为=0.004x+,该水电站计划2019年的发电量不低于8.6 亿千瓦时,现由气象部门获悉2019年的降雨量约为1 800 毫米,请你预测2019年能否完成发电任务?5.2019年2月13日《烟台市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数和中位数a(a的值精确到0.01);(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7,5),[7.5,8.5)的学生中抽取9名参加座谈会.(i)你认为9个名额应该怎么分配?并说明理由;(ii)座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?阅读时间不足8.5小时阅读时间超过8.5小时理工类专业4060非理工类专业附:.临界值表:P(K2≥k0)0.150.100.050.0250.0100.0050.001k0 2.072 2.706 3.841 5.024 6.6357.87910.8286.2017年3月郑州市被国务院确定为全国46个生活垃圾分类处理试点城市之一,此后由郑州市城市管理局起草公开征求意见,经专家论证,多次组织修改完善,数易其稿,最终形成《郑州市城市生活垃圾分类管理办法》(以下简称《办法》).《办法》已于2019年9月26日被郑州市人民政府第35次常务会议审议通过,并于2019年12月1日开始施行.《办法》中将郑州市生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾4类为了获悉高中学生对垃圾分类的了解情况,某中学设计了一份调查问卷,500名学生参加测试,从中随机抽取了100名学生问卷,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图频率分布直方图:(Ⅰ)从总体的500名学生中随机抽取一人,估计其分数不低于60的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的学生人数;(Ⅲ)学校环保志愿者协会决定组织同学们利用课余时间分批参加“垃圾分类,我在实践”活动,以增强学生的环保意识.首次活动从样本中问卷成绩低于40分的学生中随机抽取2人参加,已知样本中分数小于40的5名学生中,男生3人,女生2人,求抽取的2人中男女同学各1人的概率是多少?7.某汽车公司生产新能源汽车,2019年3-9月份销售量(单位:万辆)数据如表所示:月份x3456789销售量y(万辆) 3.008 2.401 2.189 2.656 1.665 1.672 1.368(1)某企业响应国家号召,购买了6辆该公司生产的新能源汽车,其中四月份生产的4辆,五月份生产的2辆,6辆汽车随机地分配给A,B两个部门使用,其中A 部门用车4辆,B部门用车2辆.现了解该汽车公司今年四月份生产的所有新能源汽车均存在安全隐患,需要召回.求该企业B部门2辆车中至多有1辆车被召回的概率;(2)经分析可知,上述数据近似分布在一条直线附近.设y关于x的线性回归方程为,根据表中数据可计算出,试求出的值,并估计该厂10月份的销售量.8.某商家在某一天统计前5名顾客扫微信红包所得金额分别为5.9元,5.7元,4.7元,3.3元,2.1元,商家从这5名顾客中随机抽取3人赠送礼品.(Ⅰ)求获得礼品的3人中恰好有2人的红包超过5元的概率;(Ⅱ)商家统计一周内每天使用微信支付的人数x与每天的净利润y(单位:元),得到如表:x12162225262930y60100210240150270330根据表中数据用最小二乘法求y与x的回归方程=(,的计算结果精确到小数点后第二位)并估计使用微信支付的人数增加到36人时,商家当天的净利润为多少(计算结果精确到小数点后第二位)?参考数据及公式:①=22.86,=194.29;=268.86;=3484.29,②回归方程:=(其中=,=-)9.某医学院欲研究昼夜温差大小与患感冒人数多少之间的关系,该院派出研究小组分别到气象局与某医院,抄录了1到6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到数据资料见表:月份123456昼夜温差(℃)1011131286就诊人数(个)232630271713该研究小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻的两个月的概率;(2)已知选取的是1月与6月的两组数据.(i)请根据2到5月份的数据,求就诊人数y关于昼夜温差x的线性回归方程:(ii)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该研究小组所得的线性回归方程是否理想?(参考公式==,=-)10.某学校有40名高中生参加足球特长生初选,第一轮测身高和体重,第二轮足球基础知识问答,测试员把成绩(单位:分)分组如下:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100),得到频率分布直方图如图所示.(1)根据频率分布直方图估计成绩的平均值(同一组中的数据用该组区间的中点值作代表);(2)用分层抽样的方法从成绩在第3,4,5组的高中生中6名组成一个小组,若6人中随2人担任小组负责人,求这2人来自3,4组各1人的概率.答案和解析1.【答案】解:(1)考虑到BMI应与年龄或性别均有关,最合理的分层应为以下四层:高一男生、高一女生、高二男生、高二女生;则高一男生抽取×160=44(人),高一女生抽取×160=52(人),高二男生抽取×160=34(人),高二女生抽取×160=30(人);(2)(i)160人中,“超重”人数为4+6+2+4=16(人),“超重”发生的频率为0.1,用样本的频率估计总体的频率,估计这2000名学生中“超重”的学生数为2000×0.1=200(人);(ii)应用独立性检验的知识,分析出性别变量与年级变量哪一个与“是否超重”的关联性更强,得出K2的观察值k1,k2,则k1和k2的大小关系为k1>k2.【解析】(1)考虑到BMI与年龄或性别均有关,最合理的分层为高一男生、女生,高二男生、女生;分别求出每层所抽取的人数即可;(2)(i)计算样本中“超重”的人数和频率,用样本的频率估计总体的频率,计算即可;(ii)应用独立性检验的知识分析出性别变量与年级变量哪一个与“是否超重”的关联性更强,得出K2的观察值k1应大于k2.本题考查了分层抽样原理与独立性检验的问题,也考查了用样本估计总体的问题,是基础题.2.【答案】解:(1)设(0.002+0.0029+x)×100=0.5,解得:x=0.0001.∴可得其中位数为:200+×(300-200)≈202.(2)300~400分的人数为:0.001×100×2000=200.280~300分的人数为:0.0041×100×2000×=164.而164+200>300.∴考生甲的成绩为280分,不能被录取.【解析】(1)设(0.002+0.0029+x)×100=0.5,解得:x.可得其中位数.(2)300~400分的人数为:0.001×100×2000=200.280~300分的人数为:0.0041×100×2000×=164.进而判断出结论.本题考查了频率分布直方图的性质及其应用,考查了推理能力与计算能力,属于中档题.3.【答案】解:(1)根据题意,设表中数据为喜爱不喜爱合计年龄不大于40岁a b24年龄大于40岁20c d 合计e2250则有e+22=50,则e=28;24+d=50,则d=26,a+20=e=28,则a=8,a+b=24,则b=16,b+c=22,则c=6;故列联表为:喜爱不喜爱合计年龄不大于40岁81624年龄大于40岁20626合计282250则有≈9.623>6.635.故能在犯错误的概率不超过1%的条件下认为不同年龄与纪念币的喜爱无关.(2)根据题意,记不大于40岁的5位喜爱者中的3位学生记为a,b,c,非学生记为A,B,则从5人中任取2人,共有(a,b),(a,c),(a,A),(a,B),(b,c),(b,A),(b,B),(c,A),(c,B),(A,B)10种结果.其中至多有1位学生的有7种,∴至多有1位学生的概率.【解析】(1)根据题意,由列联表的结构分析可得其他数据,即可完善列联表,进而计算K2的值,据此分析可得答案;(2)根据题意,记不大于40岁的5位喜爱者中的3位学生记为a,b,c,非学生记为A,B;由列举法分析“从这5名男性中随机抽取2人”和“至多有1位学生”的情况数目,由古典概型公式计算可得答案.本题考查独立性检验的应用,涉及古典概型的计算,属于基础题.4.【答案】解:(1)从统计的5年发电量中任取2年,基本事件为:(7.4,7.0},{7.4,9.2},{7.4,7.9},{7.4,10.0},{7.0,9.2},{7.0,7.9},{7.0,10.0},{9.2,7.9},{9.2,10.0},{7.9,10.0},共10个;其中这2年的发电量都高于7.5亿千瓦时的基本事件为:{9.2,7.9},{9.2,10.0},{7.9,10.0},共3个.所以这2年的发电量都高于7.5亿千瓦时的概率为.(2)因为.,又直线过点,所以,解得,所以.当x=1800时,.所以预测该水电站2019年能完成发电任务.【解析】本题考查回归直线方程,概率中的基本事件,属于中档题.(1)确定从统计的5年发电量中任取2年的基本事件、2年发电量都低于8.0(亿千瓦时)的基本事件,即可求出这2年的发电量都低于8.0(亿千瓦时)的概率;(2)先求出线性回归方程,再令x=1800,即可得出结论.5.【答案】解:(1)该组数据的平均数因为0.03+0.1+0.2+0.35=0.68>0.5,所以中位数a∈[8.5,9.5),由0.03+0.1+0.2+(a-8.5)×0.35=0.5,解得;(2)(i)每周阅读时间为[6,5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6,5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配.(ii)由频率分布直方图可知,阅读时间不足8.5小时的学生共有200×(0.03+0.1+0.2)=66人,超过8.5小时的共有200-66=134人.于是列联表为:阅读时间不足8.5小时阅读时间超过8.5小时理工类专业4060非理工类专业2674K2的观测值,所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【解析】本题主要考查独立性检验的应用,根据数据计算出K2的观测值是解决本题的关键.考查学生的计算能力.(1)根据平均数,中位数的定义进行求解即可,(2)完成列联表,计算K2的观测值,结合独立性检验的性质进行判断即可.6.【答案】解:(Ⅰ)根据频率分布直方图可知,样本中分数高于60的频率为:(0.02+0.04+0.02)×10=0.8,所以样本中分数高于60的概率为0.8.故从总体的500名学生中随机抽取一人,其分数高于60的概率估计为0.8.(Ⅱ)根据题意,样本中分数不小于50的频率为:(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5,所以总体中分数在区间[40,50)内的人数估计为500×=25,(Ⅲ)设3名男生分别为A,B,C,2名女生分别为1,2,则从这5名同学中选取2人的结果为:{A,B},{A,C},{A,1},{A,2},{B,C},{B,1},{B,2},{C,1},{C,2},{1,2}共10种情况.其中2人中男女同学各1人包含结果为:{A,1},{A,2},{B,1},{B,2},{C,1},{C,2},共6种,设事件A={抽取的2人中男女同学各1人},则P(A)=,所以,抽取的2人中男女同学各1人的概率是.【解析】(1)由直方图求出分数高于60的频率,计算出分数高于60的概率,(2)先计算出分数不小于50的频率,再算出分数在区间[40,50)内的人数,再估算出总体中分数在区间[40,50)内的人数.(3)先计算出从这5名同学中选取2人的事件,再算出抽取的2人中男女同学各1人的事件,再求抽取的2人中男女同学各1人的概率.本题考查频率直方图,通过频率估算整体,以及求频率,属于基础题.7.【答案】解:(1)设某企业购买的6辆新能源汽车,4月份生产的4辆车为C1,C2,C3,C4;5月份生产的2辆车为D1,D2,6辆汽车随机地分配给A,B两个部门.B部门2辆车可能为(C1,C2),(C1,C3),(C1,C4),(C1,D1),(C1,D2),(C2,C3),(C2,C4),(C2,D1),(C2,D2),(C3,C4),(C3,D1),(C3,D2),(C4,D1,(C4,D2),(D1,D2)共15种情况;其中,至多有1辆车是四月份生产的情况有:(C1,D1),(C1,D2),(C2,D1),(C2,D2),(C3,D1),(C3,D2),(C4,D1),(C4,D2),(D1,D2)共9种,所以该企业B部门2辆车中至多有1辆车被召回的概率为;(2)由题意得,.因为线性回归方程过样本中心点,所以,解得.当x=10时,,即该厂10月份销售量估计为1.151万辆.【解析】(1)用列举法,求出个数,根据概率公式求出即可;(2)求出线性回归方程过样本中心点,代入求出a,再代入x=10即可.考查古典概型求概率,线性回归方程的性质及其应用,中档题.8.【答案】解:(Ⅰ)记“5名顾客扫微信红包所得金额超过5元的2人”为A1,A2,“不超过5元的3人”为B1,B2,B3,“获得礼品的3人中恰好有2人的红包超过5元”为事件M,则所有的基本事件有:A1A2B1,A1A2B2,A1A2B3,A1B1B2,A1B1B3,A1B2B3,A2B1B2,A2B1B3,A2B2B3,B1B2B3共10种,其中事件M包含的基本事件有共3种,为A1A2B1,A1A2B2,A1A2B3,∴P(M)=;(Ⅱ)∵==,∴=-=194.29-12.9622.86=-101.98.∴y与x的回归方程为=12.96x-101.98,当x=36时,.故估计使用微信支付的人数增加到36人时,商家当天的净利润约为364.58元.【解析】(Ⅰ)利用古典概型的概率公式求获得礼品的3人中恰好有2人的红包超过5元的概率;(Ⅱ)利用最小二乘法求y与x的回归方程为=12.96x-101.98,把x=36代入方程,即可得解.本题考查古典概型的概率的计算,考查线性回归方程的求法,考查利用回归方程进行预测,意在考查学生对这些知识的理解掌握水平和分析推理计算能力,是中档题.9.【答案】解:(1)设选取的2组数据恰好是相邻两个月为事件A,因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中选取的2组数据恰好是相邻两个月的情况有5种,所以P(A)=,(2)=(11+13+12+8)=11,=(26+30+27+17)=25,===,=-=25-=,得到y关于x的回归直线方程为y=(2)当x=10时,y=同样,当x=6时,y=,估计数据与所选出的检验数据的误差均不超过2人,∴该小组所得线性回归方程是理想的.【解析】(1)本题是一个古典概型,试验发生包含的事件是从6组数据中选取2组数据共有15种情况,满足条件的事件是抽到相邻两个月的数据的情况有5种,根据古典概型的概率公式得到结果.(2)根据所给的数据,求出x,y的平均数,根据求线性回归方程系数的方法,求出系数a,b,写出线性回归方程;(3)将x的值代入回归方程检验即可.考查古典概型求概率,求线性回归方程和应用,考查运算能力,中档题.10.【答案】解:(1)因为(0.01+0.07+0.06+x+0.02)×5=1,所以x=0.04,所以成绩的平均值为+0.10×=87.25;(2)第3组学生人数为0.06×5×40=12,第4 组学生人数为0.04×5×40=8,第5组学生人数为0.02×5×40=4,所以抽取的6人中第3,4,5组的人数分别为3,2,1.第3组的3人分别记为A1,A2,A3,第4 组的2人分别记为B1,B2,第5 组的1 人记为C,则从中选出2人的基本事件为共15个,记“从这6人中随机选出2人担任小组负责人,这2人来自第3,4组各1人”为事件M ,则事件M包含的基本事件为(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),共6个,所以P(M)=.【解析】(1)根据频率分布直方图求出x的值,再利用同一组中的数据用该组区间的中点值作代表估计平均数即可;(2)先求出抽取的6人中第3,4,5组的人数,再利用古典概型的概率公式求解即可.本题考查由频数分布直方图,以及古典概型,属于基础题.。

概率与统计(选择题、填空题)—高考真题文科数学分项汇编(解析版)

概率与统计(选择题、填空题)—高考真题文科数学分项汇编(解析版)

其中恰有 2只做过测试的取法有{a,b, A},{a,b,B},{a,c, A},{a,c,B}, {b,c, A},{b,c,B},共 6种, 所以恰有 2只做过测试的概率为 6 3,故选 B.
10 5
【名师点睛】本题主要考查古典概率的求解,题目较易,注重了基础知识、基本计算能力的考查.应用 列举法写出所有基本事件过程中易于出现遗漏或重复,将兔子标注字母,利用“树图法”,可最大限度
1 【答案】 9 【解析】根据题意可得基本事件数总为66 36个.
5
点数和为 5的基本事件有1,4,4,1,2,3,3,2共
4个.
∴出现向上的点数和为
5的概率为
P
4 36
1求法,考查古典概型、列举法等基础知识,考查运算求解能力,是基础题.
12.【2020年高考天津】从一批零件中抽取 80个,测量其直径(单位:mm),将所得数据分为 9组:
则n 61,符合题意;若815 610n,则n 80.9,不合题意.故选 C.
7.【2019年高考全国Ⅱ卷文数】生物实验室有 5只兔子,其中只有 3只测量过某项指标,若从这 5只兔子
中随机取出 3只,则恰有 2只测量过该指标的概率为
2 A. 3
3 B. 5
3
2 C. 5
【答案】B
1 D. 5
【分析】首先用列举法写出所有基本事件,从中确定符合条件的基本事件数,应用古典概率的计算公式
即可求解.
【解析】设其中做过测试的 3只兔子为a,b,c,剩余的 2只为 A,B, 则从这 5只中任取 3只的所有取法有{a,b,c},{a,b, A},{a,b,B},{a,c, A},{a,c,B},{a, A,B},{b,c, A},
{b,c,B},{b, A,B},{c, A,B},共 10种.

2020年高考数学(文)热点专练10 概率与统计(解析版)

2020年高考数学(文)热点专练10 概率与统计(解析版)

热点10 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【考查题型】选择,填空,解答题【限时检测】(建议用时:45分钟)1.(2018·黑龙江哈尔滨三中高考模拟(文))从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图所示.根据茎叶图,下列描述正确的是( )A.甲种树苗的高度的中位数大于乙种树苗高度的中位数,且甲种树苗比乙种树苗长得整齐B.甲种树苗的高度的中位数大于乙种树苗高度的中位数,但乙种树苗比甲种树苗长得整齐C.乙种树苗的高度的中位数大于甲种树苗高度的中位数,且乙种树苗比甲种树苗长得整齐D.乙种树苗的高度的中位数大于甲种树苗高度的中位数,但甲种树苗比乙种树苗长得整齐【答案】D【解析】从茎叶图的数据可以看出甲种树苗的平均高度为27,乙种树苗的平均高度为30,因此乙种树苗的平均高度大于甲种树苗的平均高度.又从茎叶图分析知道,甲种树苗的高度集中在20到30之间,因此长势更集中.2.(2019·辽宁高考模拟(文))《九章算术》中有如下问题:“今有勾五步,股一十二步,问勾中容圆,径几何?”其大意:“已知直角三角形两直角边长分别为5步和12步,问其内切圆的直径为多少步?”现若向此三角形内随机投一粒豆子,则豆子落在其内切圆外的概率是( )A .215π B .320π C .2115π-D .3120π-【答案】C 【解析】 【分析】本题首先可以根据直角三角形的三边长求出三角形的内切圆半径,然后分别计算出内切圆和三角形的面积,最后通过几何概型的概率计算公式即可得出答案. 【详解】13=, 设内切圆的半径为r ,则51213r r -+-=,解得2r =. 所以内切圆的面积为24r ππ=,所以豆子落在内切圆外部的概率42P 111155122ππ=-=-⨯⨯,故选C.【名师点睛】本题主要考查“面积型”的几何概型,属于中档题. 解决几何概型问题常见类型有:长度型、角度型、面积型、体积型,求与面积有关的几何概型问题关鍵是计算问题的总面积以及事件的面积;几何概型问题还有以下几点容易造成失分,在备考时要高度关注:(1)不能正确判断事件是古典概型还是几何概型导致错误;(2)基本事件对应的区域测度把握不准导致错误 ;(3)利用几何概型的概率公式时 , 忽视验证事件是否等可能性导致错误. 3.(2019·安徽合肥一中高考模拟(文))甲、乙两名同学在 6 次数学考试中,所得成绩 用茎叶图表示如下,若甲、乙两人这 6 次考试的平均成绩分别用,x x 乙甲 表示,则下列结论正确的是( )A .x x >乙甲 ,且甲成绩比乙成绩稳定B .x x >乙甲 ,且乙成绩比甲成绩稳定C .x x <乙甲 ,且甲成绩比乙成绩稳定D .x x <乙甲,且乙成绩比甲成绩稳定【答案】C 【解析】 【分析】从茎叶图提取两个人的成绩,分别求出两个人的平均分,得到甲的平均数比乙的平均数要低,但甲数据比较集中,所以成绩比较稳定. 【详解】757782838590826x +++++==甲,727681869192836x +++++==乙,所以x x <乙甲,因为甲数据比较集中,所以成绩比较稳定. 【名师点睛】茎叶图保留了原始数据,所以可通过计算平均数来比较大小,再通过数据的集中与离散程度判断稳定性.4.(2018·天津南开中学高考模拟(文))在长为12cm 的线段AB 上任取一点C .现作一矩形,邻边长分别等于线段AC ,CB 的长,则该矩形面积大于20cm 2的概率为 A .16B .13C .23D .45【答案】C 【解析】试题分析:设AC=x ,则BC=12-x (0<x <12) 矩形的面积S=x (12-x )>20 ∴x 2-12x+20<0 ∴2<x <10由几何概率的求解公式可得,矩形面积大于20cm 2的概率10221203p -==-考点:几何概型5.(2019·新疆高考模拟(文))《史记》中讲述了田忌与齐王赛马的故事.“田忌的上等马优于齐王的中等马,劣于齐王的上等马;田忌的中等马优于齐王的下等马,劣于齐王的中等马;田忌的下等马劣于齐王的下等马.”双方从各自的马匹中随机选一匹进行一场比赛,则田忌的马获胜的概率为A .31 B .41 C .51 D .61 【答案】A 【解析】分析:由题意结合古典概型计算公式即可求得最终结果.详解:记田忌的上等马、中等马、下等马分别为a ,b ,c ,齐王的上等马、中等马、下等马分别为A ,B ,C ,由题意可知,可能的比赛为:Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,Ca ,Cb ,Cc ,共有9种,其中田忌可以获胜的事件为:Ba ,Ca ,Cb ,共有3种,则田忌马获胜的概率为p =39=13.本题选择A 选项.【名师点睛】:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.6.(2017·天津耀华中学高考模拟(文))某工厂甲,乙,丙三个车间生产了同一种产品,数量分别为600件,400件,300件,用分层抽样方法抽取容量为n 的样本,若从丙车间抽取6件,则n 的值为( ) A .18 B .20C .24D .26【答案】D 【解析】由分层抽样的定义可得:6300600400300n =++,解得:26n =. 本题选择D 选项.7.(2017·辽宁高考模拟(文))设样本数据1210,,,x x x L 的均值和方差分别为1和4,若(i i y x a a =+为非零常数,1,2,,10)i =L ,则1210,,,y y y L 的均值和方差分别为( )A .1,4a +B .1,4a a ++C .1,4D .1,4a +【答案】A 【解析】试题分析:因为样本数据1210,,,x x x L 的平均数是1,所以1210,,...y y y 的平均数是121012101210 (1101010)y y y x a x a x a x x x a a ++++++++++++==+=+;根据i i y x a =+(a 为非零常数,1,2,,10i =L ),以及数据1210,,,x x x L 的方差为4可知数据1210,,,y y y L 的方差为2144⨯=,综上故选A. 考点:样本数据的方差和平均数.8.(2017·陕西高考模拟(文))已知函数2()log ,[1,8]f x x x =∈,则不等式1()2f x ≤≤ 成立的概率是( ) A .17B .27C .37D .47【答案】B 【解析】由()12f x ≤≤,可知21log 2x ≤≤,解得24x ≤≤,由几何概型可知27P =,选B 二、填空题9.(2017·河南高考模拟(文))已知()0,0O ,()2,1A ,()1,2B -,31,55C ⎛⎫- ⎪⎝⎭,动点(),P x y 满足02OP OA ≤⋅≤u u u r u u u r 且02OP OB u u u r u u u r≤⋅≤,则点P 到点C 的距离大于14的概率为______.【答案】5164π- 【解析】由题意得,因为()()()310,0,2,1,1,2,,55O A B C ⎛⎫-- ⎪⎝⎭,所以动点(,)P x y 满足02OP OA ≤⋅≤u u u r u u u r 且02OP OB u u u r u u u r≤⋅≤,所以022{022x y x y ≤+≤≤-≤ ,则点P 到点C 的距离为22311()()5516z x y =-++≥ ,作出不等式组对应的平面区域,如图所示, 因为点P 到点C 的距离大于14,所以14PC >,则对应的部分为阴影部分,由2042,2055x y x y x y -==⎧⇒=+=⎨⎩ ,即点42(,)55E,则OE ==,所以正方形OEFG 的面积为45, 则阴影部分的面积为41516π- ,所以根据几何概型的概率公式可知所求的概率为41551614645ππ-=-.【名师点睛】:本题主要考查了几何概型及其概率的计算问题,其中解答中涉及到向量的数量积的运算,二元一次不等式组所表示的平面区域,简单的线性规划的应用,几何概型及其概率的计算公式等知识点的综合应用,着重考查了学生分析问题和解答问题的能力,以及推理与运算能力,本题的解答中利用向量的数量积的运算,转化为简单的线性规划求解是解答的关键.9.(2018·河南高考模拟(文))某班共有56名学生,现将所有学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知12号、26号、54号同学在样本中,则样本中还 有一名同学的编号是__________. 【答案】40【解析】【分析】先求出组距,然后根据已知的第二个样本的编号,求得第三个样本的编号.【详解】从56名学生中抽取4名,组距为56414÷=,由于抽取到第二个编号为26号,故第三个样本的编号为261440+=号.【名师点睛】本小题主要考查系统抽样的知识,先求得系统抽样的组距,然后根据已知来求得未知的样本编号,属于基础题.11.(2019·浠水县实验高级中学高三月考(文))设AB=6,在线段AB上任取两点(端点A,B除外),将线段AB分成了三条线段,若分成的三条线段长度均为正整数,则这三条线段可以构成三角形的概率是____________;若分成的三条线段的长度均为正实数,则这三条线段可以构成三角形的概率是_________.【答案】11014【解析】【分析】若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为:1,1,4;1,2,3;2,2,2共3种情况,其中只有三条线段为2,2,2时能构成三角形,由古典概型的概念,得到概率.三条线段的长度均为正实数时,则是几何概型,设出变量,写出全部结果所构成的区域,和满足条件的事件对应的区域,注意整理三条线段能组成三角形的条件,求出面积,作比值得到概率.【详解】若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为:1,1,4;1,2,3;1,3,2;1,4,1;2,1,3;2,2,2;2,3,1;3,1,2;3,2,1;4,1,1共10种情况,其中只有三条线段为2,2,2时能构成三角形则构成三角形的概率p1 10 =.(2)由题意知本题是一个几何概型设其中两条线段长度分别为x,y,则第三条线段长度为6﹣x﹣y,则全部结果所构成的区域为:0<x<6,0<y<6,0<6﹣x﹣y<6,即为0<x<6,0<y<6,0<x+y<6所表示的平面区域为三角形OAB;若三条线段x,y,6﹣x﹣y,能构成三角形,则还要满足666x y x yx x y yy x y x+--⎧⎪+--⎨⎪+--⎩>>>,即为333x yyx+⎧⎪⎨⎪⎩><<,所表示的平面区域为三角形DEF,由几何概型知所求的概率为:P14DEFAOBSS==VV【名师点睛】本题考查古典概型,考查几何概型,对于几何概型的问题,一般要通过把试验发生包含的事件同集合结合起来,根据集合对应的图形做出面积,用面积的比值得到结果. 三、解答题12.(2019·天津高考模拟(文))为预防H 1N 1病毒爆发,某生物技术公司研制出一种新流感疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),公司选定2000个流感样本分成三组,测试结果如下表:已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. (∴)求x 的值;(∴)现用分层抽样的方法在全体样本中抽取360个测试结果,问应在C 组抽取多少个? (∴)已知y ≥465,z ≥30,求不能通过测试的概率.【答案】(1)660;(2)90;(3)112.【解析】 【分析】(1)由古典概型概率公式列方程求解即可;(2)先求出C 组样本个数,再根据分层抽样方法可得结果;(3)利用列举法可得基本事件空间包含的基本事件有11个,测试不能通过事件包含基本事件2个,利用古典概型概率公式可得结果. 【详解】(1)∵在全体样本中随机抽取1个,抽到B 组疫苗有效的概率约为其频率 即x 2000=0.33, ∴ x =660;(2)C 组样本个数为y +z =2000-(673+77+660+90)=500,现用分层抽样的方法在全体样本中抽取360个测试结果,应在C 组抽取个数为3602000×500=90;(3)设测试不能通过事件为A,C 组疫苗有效与无效的可能的情况记为(y,z )由(2)知500=y+z ,且y,z ∈N ,基本事件空间包含的基本事件有:(465,35)、(466,34)、(467,33)、……(475,25)共11个 若测试不能通过,则77+90+z>200,即z>33事件A 包含的基本事件有:(465,35)、(466,34)共2个 ∴ P(A)=211故不能通过测试的概率为211.【名师点睛】本题主要考查分层抽样以及古典概型概率公式的应用,属于难题,利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有 (1)枚举法:适合给定的基本事件个数较少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺序逐个写出:先(A 1,B 1),(A 1,B 2)….(A1,B n),再(A2,B1),(A2,B2)…..(A2,B n)依次(A3,B1)(A3,B2)….(A3,B n)… 这样才能避免多写、漏写现象的发生.13.(2019·山东高考模拟(文))2019年2月13日《烟台市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X(单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数x和中位数a(a的值精确到0.01);(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i)你认为9个名额应该怎么分配?并说明理由;(ii)座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:【答案】(1)平均数9,中位数8.99;(2)(i )按照1:2进行名额分配;理由见详解; (ii )有. 【解析】 【分析】(1)根据平均数,中位数的定义进行求解即可(2)完成列联表,计算2K 的观测值,结合独立性检验的性质进行判断即可. 【详解】(1)该组数据的平均数60.0370.180.290.35100.19x =⨯+⨯+⨯+⨯+⨯110.09120.049+⨯+⨯=,因为0.030.10.20.350.680.5+++=>,所以中位数[8.5,9.5)a ∈,由0.030.10.2(8.5)0.350.5a +++-⨯=,解得0.50.338.58.990.35a -=+≈;(2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配.(ii)由频率分布直方图可知,阅读时间不足8.5小时的学生共有200(0.030.10.2)66⨯++=人,超过8.5小时的共有20066134-=人.于是列联表为:2K的观测值2200(40742660)4.432 3.84166134100100k⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【名师点睛】本题主要考查独立性检验的应用,根据数据计算出K2的观测值是解决本题的关键.考查学生的计算能力.14.(2019·江西高考模拟(文))某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区试点,得到试点地区加盟店个数分别为1,2,3,4,5时,单店日平均营业额y(万元)的数据如下:(1)求单店日平均营业额y(万元)与所在地区加盟店个数x(个)的线性回归方程;(2)根据试点调研结果,为保证规模和效益,在其他5个地区,该公司要求同一地区所有加盟店的日平均营业额预计值总和不低于35万元,求一个地区开设加盟店个数m 的所有可能取值;(3)小赵与小王都准备加入该公司的加盟店,根据公司规定,他们只能分别从其他五个地区(加盟店都不少于2个)中随机选一个地区加入,求他们选取的地区相同的概率.(参考数据及公式:51125i ii x y==∑,52155i i x ==∑,线性回归方程ˆybx a =+,其中1221ni ii nii x y nxyb xnx ==-=-∑∑,a y bx =-.)【答案】(1) ˆ12yx =-+ (2) 5,6,7 (3) 15P = 【解析】 【分析】(1)利用最小二乘法求线性回归方程;(2)解不等式()1235m m -≥得一个地区开设加盟店个数m 的所有可能取值;(3)利用古典概型的概率求选取的地区相同的概率. 【详解】(1)由题可得,3x =,9y =,设所求线性回归方程为ˆybx a =+, 则5152215125135155455i i i ii x y xy b x x ==--===---∑∑,将3x =,9y =代入,得()9312a =--=,故所求线性回归方程为ˆ12yx =-+. (2)根据题意,()1235m m -≥,解得:57m ≤≤,又m Z +∈,所以m 的所有可能取值为5,6,7.(3)设其他5个地区分别为,,,,A B C D E ,他们选择结果共有25种,具体如下:AA ,AB ,AC ,AD ,AE ,BA ,BB ,BC ,BD ,BE ,CA ,CB ,CC ,CD ,CE ,DA ,DB ,DC ,DD ,DE ,EA ,EB ,EC ,ED ,EE ,其中他们在同一个地区的有5种,所以他们选取的地区相同的概率51255P ==. 【名师点睛】本题主要考查线性回归方程的求法,考查古典概型的概率的计算,意在考查学生对这些知识的理解掌握水平和分析推理能力.15.(2018·天津南开中学高考模拟(文))某校从高一年级学生中随机抽取40名学生,将 他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,后得到如图的频率分布直方图.(1)求图中实数a 的值;(2)若该校高一年级共有学生640人,试估计该校高一年级 期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两名学生,求这两名学生的数学成绩之差的绝对值不大于10的概率.【答案】(1)0.03a =. (2)544人. (3)()715P M =. 【解析】试题分析:(1)由于图中所有小矩形的面积之和等于1, 所以10(0.0050.010.02⨯++0.0250.01)1a +++=. ……2分解得0.03a =. ……3分(2)根据频率分布直方图,成绩不低于60分的频率 为110(0.0050.01)-⨯+0.85=. ……5分由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级数学成绩不低于60分的人数约为6400.85544⨯=人. ……6分 (3)成绩在[)40,50分数段内的人数为400.052⨯=人,分别记为A ,B . ……7分成绩在[]90,100分数段内的人数为400.14⨯=人,分别记为C ,D ,E ,F . ……8分若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两名学生, 则所有的基本事件有:(),A B ,(),A C ,(),A D ,(),A E ,(),A F ,(),B C ,(),B D ,(),B E ,(),B F ,(),C D ,(),C E ,(),C F ,(),D E ,(),D F , (),E F 共15种. ……10分如果两名学生的数学成绩都在[)40,50分数段内或都在[]90,100分数段内,那么这两名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[)40,50分数段内,另一个成绩在[]90,100分数段内,那么这两名学生的数学成绩之差的绝对值一定大于10. 记“这两名学生的数学成绩之差的绝对值不大于10”为事件M ,则事件M 包含的基本事件有:(),A B ,(),C D ,(),C E ,(),C F ,(),D E ,(),D F ,(),E F 共7种. ……11分所以所求概率为()715P M =. ……12分 考点:本小题主要考查频率分布直方图的应用和古典概型概率的求解,考查学生识图、用图的能力和运算求解能力.【名师点睛】:解决与频率分布直方图有关的题目时,要注意到频率分布直方图中纵轴表示的是频率/组距,不是频率,图中小矩形的面积才表示频率.16.(2019·江西高考模拟(文))某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:万元)对年销售量y (单位:吨)和年利润z (单位:万元)的影响.对近六年的年宣传费i x 和年销售量i y (1,2,3,4,5,6i =)的数据作了初步统计,得到如下数据:经电脑模拟,发现年宣传费x (万元)与年销售量y (吨)之间近似满足关系式b y a x =⋅(,0a b >).对上述数据作了初步处理,得到相关的值如表:(1)根据所给数据,求y 关于x 的回归方程; (2)已知这种产品的年利润z 与x ,y 的关系为e14zx =-若想在2019年达到年利润最大,请预测2019年的宣传费用是多少万元?附:对于一组数据()1,l u v ,()22,u v ,…,(),n n u v ,其回归直线v u a β=⋅+中的斜率和截距的最小二乘估计分别为()1221()()ni i i nii u v n uv un u β==-=-∑∑,v u αβ=-⋅【答案】(1)y e =(2)当2018年的宣传费用为98万元时,年利润有最大值. 【解析】 【分析】(1)转化方程by a x =⋅,结合线性回归方程参数计算公式,计算,即可.(2)将z 函数转化为二次函数,计算最值,即可. 【详解】(1)对by a x =⋅,(0a >,0b >),两边取对数得ln ln ln y a b x =+,令ln i i u x =,ln i i v y =,得ln v a b u =+⋅,由题目中的数据,计算24.6 4.16u ==,18.33.056v ==, 且()()6611ln ln i iiii i u v x y ====∑∑ 75.3,()6622111n 101.4ii i i u x ====∑∑; 则()6162216ˆ6i i i i i u v u v b u u ==-⋅=-⋅∑∑ 275.36 4.1 3.05101.46 4.1-⨯⨯=-⨯ 0.2710.542==, 1ln ln 3.05 4.112a v u =-=-⨯=, 得出ˆae =, 所以y 关于x的回归方程是ˆye = (2)由题意知这种产品的年利润z 的预测值为14ˆe z x e =-=1414e e x -=-(14e x -=-27e +,=98x =时,ˆz 取得最大值,即当2019年的年宣传费用是98万元时,年利润有最大值.【名师点睛】考查了线性回归方程求解,考查了二次函数计算最值问题,关键结合题意,得到回归方程,第二问关键转化为二次函数问题,难度中等.。

2020高考数学(文)专项复习《概率统计》含答案解析

2020高考数学(文)专项复习《概率统计》含答案解析

概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型等内容,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§10-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.【例题分析】例1 国家射击队的某队员射击一次,命中7-10环的概率如下表:求该队员射击一次,(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)}由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P (Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例4 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }. 所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.练习10-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题4.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.5.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.三、解答题6.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.§10-2 统 计【知识要点】1.随机抽样总体、个体、样本:把所考察对象的某一个数值指标的全体构成的集合看成总体,构成总体的每一个元素称为个体,从总体中抽出若干个体所组成的集合叫做样本.随机抽样:抽样时,保证每一个个体都可能被抽到,且每个个体被抽到的机会均等,满足这样条件的抽样为随机抽样.简单随机抽样:从元素个数为N 的总体中,不放回的抽取容量为n 的样本,如果每一次抽样时,总体中的各个个体有相同的可能性被抽到,这种抽样方法叫简单随机抽样.系统抽样:当总体个数很大时,可将总体分成均匀的若干部分,然后按照预先制定的规则从每一部分抽取一个个体得到所需要的样本,这种抽样的方式叫做系统抽样.分层抽样:当总体由有明显差异的几部分组成时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.三种抽样方法的比较常用频率分布表、频率分布直方图、频率分布折线图、茎叶图等统计图表来表示样本数据,观察样本数据的特征,从而估计总体的分布情况.频率分布(表)直方图的画法步骤:(1)计算极差(用样本数据的最大值减去最小值)(2)决定组数与组距(组数×组距=极差)(3)决定分点(4)列频率分布表(5)绘制频率分布直方图易见直方图中各个小长方形面积等于相应各组的频率,所有小长方形面积之和等于1. 频率分布折线图:连结频率分布直方图各个长方形上边的中点,就得到频率分布折线图. 总体密度曲线:随着样本容量的增加,分组的组距不断缩小,相应的频率分布折线图就会越来越接近于一条光滑曲线,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.茎叶图:茎指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少时,茎叶图表示数据的效果较好.它的突出优点是:统计图中没有原始数据的损失,所有的数据信息都可以从茎叶图中得到;茎叶图可随时记录,方便表示.3.用样本的数字特征估计总体的数字特征样本数据的平均数:如果有n 个数x 1,x 2,…,x n ,那么nx x x x n +++=Λ21叫做这n 个数的平均数.标准差:样本数据到平均数的一种平均距离,一般用s 表示,其中nx x x x x x s n 22221)()()(-++-+-=Λ.方差:标准差的平方s 2叫做方差.⋅-++-+-=n x x xx x x s Zn )()()(22212¬Λ 4.两个变量间的关系散点图:两个变量的关系可通过它们所对应的点在平面上表现出来,这些点对应的图形叫做散点图.线性相关:若两个变量的散点图中所有点看上去都在一条直线附近波动,则这两个变量可近似看成具有线性相关关系.回归直线方程:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心一条直线附近,则这条直线叫做这些数据点的回归直线方程,记作yˆ=bx +a ,其中b 叫回归系数.最小二乘法:假设我们已经得到两个具有线性相关关系的变量的一组数组),(11y x ,),(22y x ,…,),(33y x ,求得,)()()(ˆ2211211x n x y x n y x x x y y x x b in i i i n i ini i in i --=---=∑∑∑∑====⋅⋅⋅ x b y a ˆˆ-=,这时离差211)(2i i bx a y n Q --==最小,所求回归直线方程是a x b y ˆˆˆ+=.这种求回归直线的方法称为最小二乘法.【复习要求】1.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.3.理解样本数据标准差的意义和作用,会计算样本数据平均数、标准差,并给出合理解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.【例题分析】例1 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是______,若用分层抽样方法,则40岁以下年龄段应抽取______人.【分析】由已知系统抽样的组距为5,所以相邻组间的号码相差5;由饼形图可知200名职工中,50岁以上人数:40-50岁人数:40岁以下人数=2∶3∶5,总样本为40人,分层抽样抽取每层人数比例为2∶3∶5.解:37;20【评析】系统抽样的特征是等距,也就是只要在一组内选定号码,其余各组的号码随之选定,所选相邻号码的间隔为组距.分层抽样的特征是按比例抽取,也就是每一层所选人数占总选出人数的比例与每层人数占总人数的比例相等.抽样是统计分析的重要部分,最常用的抽样方法是简单随机抽样、系统抽样和分层抽样,抽样时每个个体被抽到的可能性相等.简单随机抽样常用抽签法和随机数表法.例2 对某电子元件进行寿命追踪调查,情况如下:寿命(h) [100,200) [200,300) [300,400) [400,500) [500,600)个数(个) 20 30 80 40 30(2)画出频率分布直方图;(3)估计电子元件寿命在[100,400)以内的概率;(4)估计电子元件寿命在400h以上的概率.【分析】按要求列表、绘图,并用样本的分布估计总体的分布.解:(1)频率分布表(2)(画图);(3)P=0.10+0.15+0.40=0.65;(4)P=1-0.65=0.35.寿命(h) 频数频率[100,200) 20 0.10[200,300) 30 0.15[300,400) 80 0.40[400,500) 40 0.20[500,600) 30 0.15合计200 1.00【评析】频率分布表和频率分布直方图是用统计的方法对样本数据加以概括和总结.列频数分布表时,要区分频数和频率的意义,画频率分布直方图时要注意横、纵坐标代表的意义和单位.频率分布指的是一个样本数据在各拿小范围内所占比例的大小,常用样本数据落在某个范围的频率估计总体落在这个范围的概率.频率分布直方图中众数是最高矩形中点的横坐标,中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.例3 (海南)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①___________________________________________________________________________________________________________________________________________________;②___________________________________________________________________________________________________________________________________________________.【分析】抽样数据比较分散,很难观察数据的分布特征,通过茎叶图展现了样本数据的分布.通过茎叶图可观察出平均数、众数、中位数,数据分布的对称性等等,由于茎叶图保留了原始数据,还可计算平均数、方差、标准差.解:(可任选两个作答)(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度;(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中);(3)甲品种棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度的中位数为318mm;(4)乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近),甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀;【评析】茎叶图是统计图表的一种,它具有统计图表的一般功能:通过样本的数据分布推断总体的分布,通过样本的数字特征估计总体的数字特征.本题中的统计结论,是指用样本的特征估计总体特征得到的结论.例4图1是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2是统计图1中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是______.图1 图2【分析】条形图的横坐标是身高,纵坐标为每个身高区间内的人数.条形图没有提供具体的数据信息.程序框图的算法含义是统计[160,180)内学生人数,即求A 4+A 5+A 6+A 7的和.解:i <8或i ≤7.【评析】设计算法利用计算机完成数据的统计工作,是实际统计工作中经常应用的.除了可以完成计数工作外,还可排序、求最值,利用公式进行各种计算等等.将算法和统计一起考查是新课程的一个特色.例5 甲乙两位运动员在相同的条件下分别射击10次,记录各次命中环数如下: 甲:8,8,6,8,6,5,9,10,7,4乙:9,5,7,8,7,6,8,6,8,7(1)分别计算他们射击环数的平均数及标准差;(2)判断他们设计水平谁高,谁的射击情况更稳定?【分析】平均数、标准差分别反映了两个选手的射击水平和稳定程度,平均数越高说明选手射击水平越高,标准差越小说明选手发挥越稳定.解:(1)甲的平均数为7.1,标准差为1.758;乙的平均数为7.1,标准差为1.136;(2)从平均值上看,两人的水平相当;从标准差上看,乙的情况更稳定.【评析】平均数反映的是平均水平的高低,方差和标准差反映的是数据的离散程度.如果样本数据中每个数都增加数a ,则它的平均数也增加a ,但是它的标准差不变,因为数据的离散程度没有变化.由于方差与原始数据的单位不同,而且可能夸大了偏离程度,实际解决问题中常采用标准差.例6 假定关于某设备的使用年限x 和所支出费用y (万元),有如下的统计资料 使用年限x2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0(1)请画出上表数据的散点图;(2)根据上表数据,用最小二乘法求出线性回归方程a x by ˆˆ+=; (3)估计使用10年时,维修费用是多少?【分析】利用描点法画出散点图,用公式x by axn x yx n yx bi n i ii ni ˆˆ,ˆ2211=-=--=∑∑=⋅⋅求得回归直线方程,取x =10求得结果. 解:(1)散点图如图(2)y =0.08+1.23x (3)12.38【评析】判断两个变量有无相关关系时,散点图直观简便,这是一道应用问题,通过回归直线方程分析使用年限和维修费用的关系.例7 某工厂有工人1000名,其中250名工人参加过短期培训(称为A 类工人),另外750名工人参加过长期培训(称为B 类工人),现用分层抽样方法(按A 类、B 类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(Ⅰ)求甲、乙两工人都被抽到的概率,其中甲为A 类工人,乙为B 类工人; (Ⅱ)从A 类工人中的抽查结果和从B 类工人中的抽查结果分别如下表1和表2. 生产能力分组 [100,110) [110,120) [120,130) [130,140) [140,150)人数 48x 5 3表2生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y3618(i )先确定x ,y ,再在答题纸上完成下列频率分布直方图.就生产能力而言,A 类工人中个体间的差异程度与B 类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图(ii )分别估计A 类工人和B 类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).【分析】(1)相互独立事件同时发生的概率用乘法公式(2)画出直方图,从图中分析数据信息.解:(Ⅰ)甲乙被抽到的概率都是101,而且事件“甲工人被抽到”与“乙工人被抽到”相互独立,所以甲、乙两工人都被抽到的概率⋅=⨯=1001101101pA 类工人中和B 类工人中分别抽查25名和75名.(Ⅱ)(i)由4+8+x +5+3=25,得x =5;6+y +36+18=75,得y =15.频率分布直方图如下图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.,123145253135255125255115258105254)ii (=⨯+⨯+⨯⋅+⨯+⨯=A x ,8.133145751813575361257515115756=⨯+⨯+⨯+⨯=B x1.1318.1331007512310025=⨯+⨯=x . A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.【评析】本题是一道综合应用题,通过语言叙述和图表给出信息.频率分布直方图反映了数据分布的情况,数据的差异大小及数据的方差大小.练习10-3一、选择题1.(08重庆)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( ) A .简单随机抽样法 B .抽签法 C .随机数表法 D .分层抽样法2.从容量为N 的总体中抽取容量为n 的样本,若采用系统抽样法,则抽样间隔为( ) A .nN B .n C .][nN D .1][+nN3.(08山东)下图是根据《山东统计年整2007》中的资料做成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( )A .304.6B .303.6C .302.6D .301.6 4.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表甲的成绩乙的成绩丙的成绩环数 7 8 9 10 环数 7 8 9 10 环数 7 8 9 10 频数 55 5 5频数 6446频数 46641,2,3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ) A .s 3>s 1>s 2 B .s 2>s 1>s 3 C .s 1>s 2>s 3 D .s 2>s 3>s 1二、填空题 5.要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,将它们编号为001,002,……800,利用随机数表抽取样本,从第7行第1个数开始,依次向右,再到下一行,继续从左到右.请问选出的第七袋牛奶的标号是______. (为了便于说明,下面摘取了随机数表的第6行至第10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28。

【人教A版】2020年高考数学文科二轮《概率与统计》讲义案及中档题型精讲卷

【人教A版】2020年高考数学文科二轮《概率与统计》讲义案及中档题型精讲卷

2020年高考数学文科二轮《概率与统计》讲义案及中档题型精讲卷一、考纲解读1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。

2.了解两个互斥事件的概率的加法公式。

3.掌握古典概型及其概率计算公式。

4.了解随机数的意义,能运用模拟方法估计概率。

5.了解几何概型的意义。

二、命题趋势探究1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。

2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下.三、知识点精讲(一).必然事件、不可能事件、随机事件在一定条件下:①必然要发生的事件叫必然事件;②一定不发生的事件叫不可能事件;③可能发生也可能不发生的事件叫随机事件。

(二).概率在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。

对于必然事件A ,;对于不可能事件A ,=0(三).两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件2、每个基本事件发生的可能性相同()(A)=()A card P A card =Ω包含基本事件数基本事件总数2、几何概型条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为A μ.()P A =AμμΩ。

(四).互斥事件1、互斥事件在一次实验中不能同时发生的事件称为互斥事件。

事件A 与事件B 互斥,则()()()P A B P A P B =+ 。

2、对立事件事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。

()()1P A p A =-。

3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。

四、解答题总结1.某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为.2.从6男2女共8名学生中选出队长1人,副队长1人,普通队员2人组成4人服务队,要求服务队中至少有1名女生,共有种不同的选法.(用数字作答)3.记函数()f x =的定义域为D .在区间[4,5]-上随机取一个数x ,则x D ∈的概率是.4.有三张卡片,分别写有1和2,1和3,2和3.甲,乙,丙三人各取走一张卡片,甲看了乙的卡片后说:“我与乙的卡片上相同的数字不是2”,乙看了丙的卡片后说:“我与丙的卡片上相同的数字不是1”,丙说:“我的卡片上的数字之和不是5”,则甲的卡片上的数字是________________.5.将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____.6.甲、已两名运动员各自等可能地从红、白、蓝3种颜色的运动服中选择1种,则他们选择相同颜色运动服的概率为_______.7.在3张奖券中有一、二等奖各1张,另1张无奖,甲、乙两人各抽取1张,两人都中奖的概率是__________;8.在区间[2,4]-上随机地取一个数x ,若x 满足||x m ≤的概率为56,则m =.9.从1,2,3,4这四个数中一次随机取两个数,则其中一个数是另一个的两倍的概率为______答案:1.310【解析】记2名男生分别为A ,B ,3名女生分别为a ,b ,c ,则从中任选2名学生有AB ,Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,ab ,ac ,bc ,共10种情况,其中恰好选中2名女生有ab ,ac ,bc ,共3种情况,故所求概率为310.2.660【解析】由题意可得:总的选择方法为:411843C C C ⨯⨯种方法,其中不满足题意的选法有411643C C C ⨯⨯种方法,则满足题意的选法有:411411843643660C C C C C C ⨯⨯-⨯⨯=种.3.59【解析】由260x x +-≥,解得23x -≤≤,根据几何概型的计算公式得概率为3(2)55(4)9--=--.4.1和3【解析】为方便说明,不妨将分别写有1和2,1和3,2和3的卡片记为A ,B ,C 从丙出发,由于丙的卡片上的数字之和不是5,则丙只可能是卡片A 或B ,无论是哪一张,均含有数字1,再由乙与丙的卡片上相同的数字不是1可知,乙所拿的卡片必然是C ,最后由甲与乙的卡片上相同的数字不是2,知甲所拿的卡片为B ,此时丙所拿的卡片为A .5.23【解析】设2本数学书分别为A 、B ,语文书为G ,则所有的排放顺序有ABC 、ACB 、BAC 、BCA 、CAB 、CBA ,共6种情况,其中数学书相邻的有ABC 、BAC 、CAB 、CBA ,共4种情况,故2本数学书相邻的概率4263P ==.6.13【解析】甲、乙两名运动员各自等可能地从红、白、蓝3种颜色的运动服中选择1种的所有可能情况为(红,白),(白,红),(红,蓝),(蓝,红),(白,蓝),(蓝,白),(红,红),(白,白),(蓝,蓝),共9种,他们选择相同颜色运动服的所有可能情况为(红,红),(白,白),(蓝,蓝),共3种.故所求概率为13P =.7.13【解析】设3张奖券中一等奖、二等奖和无奖分别为,,a b c ,甲、乙两人各抽取一张的所有情况有,,,,,ab ac ba bc ca cb 共六种,其中两人都中奖的情况有,ab ba 共2种,所以概率为138.3【解析】由几何概型,得(2)54(2)6m --=--,解得3m =.9.13【解析】从1,2,3,4这四个数中一次随机取两个数,基本事件为:{1,2},{1,3},{1,4},{2,3},{2,4},{3,4},共6个,符合“一个数是另一个数的两倍”的基本事件为{1,2},{2,4}共2个,所以概率为13.统计与统计案例一、考纲解读1.理解随机抽样的必要性和重要性。

2020年高考文科数学一轮复习大题篇----概率统计

2020年高考文科数学一轮复习大题篇----概率统计

2020年高考文科数学一轮复习大题篇----概率统计题型一 概率与统计的综合应用【例】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? 【解】 (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700. 所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ). (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000;若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.【思维升华】概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.【训练】某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图.(1)求图中实数a的值;(2)若该校高一年级共有640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.【解】(1)由已知,得10×(0.005+0.010+0.020+a+0.025+0.010)=1,解得a=0.030. (2)根据频率分布直方图,可知成绩不低于60分的频率为1-10×(0.005+0.010)=0.85.由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级期中考试数学成绩不低于60分的人数为640×0.85=544.(3)易知成绩在[40,50)分数段内的人数为40×0.05=2,这2人分别记为A,B;成绩在[90,100]分数段内的人数为40×0.1=4,这4人分别记为C,D,E,F.若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,则所有的基本事件有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15个.如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[40,50)分数段内,另一个成绩在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定大于10.记“这2名学生的数学成绩之差的绝对值不大于10”为事件M ,则事件M 包含的基本事件有(A ,B ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F ),共7个,故所求概率P (M )=715.题型二 概率与统计案例的综合应用【例】某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2.【解】 (1)将2×2列联表中数据代入公式计算,得 χ2=100×60×10-20×10270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)设这5名数学系的学生喜欢甜品的为a 1,a 2,不喜欢甜品的为b 1,b 2,b 3,从5名数学系的学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,b 3),(a 1,b 1,b 2),(a 1,b 2,b 3),(a 1,b 1,b 3),(a 2,b 1,b 2),(a 2,b 2,b 3),(a 2,b 1,b 3),(b 1,b 2,b 3)}. Ω由10个基本事件组成,且这些基本事件出现是等可能的.用A 表示“3人中至多有1人喜欢甜品”这一事件,则A ={(a 1,b 1,b 2),(a 1,b 2,b 3),(a 1,b 1,b 3),(a 2,b 1,b 2),(a 2,b 2,b 3),(a 2,b 1,b 3),(b 1,b 2,b 3)},A 由7个基本事件组成,因而P (A )=710.【思维升华】 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.【训练】某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.(1)分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;(2)根据抽取的180名学生的调查结果,完成以下2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,其中n =a +b +c +d .【解】 (1)由条件知,抽取的男生有105人,女生有180-105=75(人).男生选择社会科学类的频率为45105=37,女生选择社会科学类的频率为4575=35.由题意,知男生总数为1 200×105180=700,女生总数为1 200×75180=500,所以估计选择社会科学类的人数为 700×37+500×35=600.(2)根据统计数据,可得列联表如下:则χ2=180×60×45-30×452105×75×90×90=367≈5.142 9>5.024, 所以在犯错误的概率不超过0.025的前提下能认为科类的选择与性别有关.专题突破训练1.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80的为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=nn 11n 22-n 12n 212n 1+n 2+n +1n +2.【解】 (1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.所以样本中日平均生产件数不足60的工人中,25周岁以上(含25周岁)组工人有60×0.005×10=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.005×10=2(人),记为B 1,B 2. 从中随机抽取2名工人,所有的可能结果共有10种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有60×(0.02+0.005)×10=15(人),“25周岁以下组”中的生产能手有40×(0.032 5+0.005)×10=15(人),据此可得2×2列联表如下:所以得χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2=100×15×25-15×45260×40×30×70=2514≈1.79. 因为1.79<2.706.所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.2.某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东、西部各5个城市,得到观看该节目的人数的统计数据(单位:千人),并画出如下茎叶图,其中一个数字被污损.(1)求东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数的概率;(2)该节目的播出极大地激发了观众对成语知识学习积累的热情,现从观看节目的观众中随机统计了4位观众学习成语知识的周均时间(单位:小时)与年龄(单位:岁),并绘制了如下对照表:根据表中数据,试求回归直线方程y ^=b ^x +a ^,并预测年龄为55岁的观众周均学习成语知识的时间.参考公式:b ^=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2,a ^ =y -b ^x .【解】 (1)设被污损的数字为a ,则a 有10种情况. 由88+89+90+91+92>83+83+87+90+a +99, 得a <8,∴有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数, 所求概率为810=45.(2)由表中数据,计算得x =35,y =3.5,b ^=∑4i =1x i y i -4x y∑4i =1x 2i -4x 2=525-4×35×3.55 400-4×352=0.07,a ^=y -b ^x =3.5-0.07×35=1.05.∴y ^=0.07x +1.05.当x =55时,y ^=4.9.即预测年龄为55岁的观众周均学习成语知识的时间为4.9小时.3.长沙某购物中心在开业之后,为了解消费者购物金额的分布情况,在当月的电脑消费小票中随机抽取n 张进行统计,将结果分成6组,分别是[0,100),[100,200),[200,300),[300,400),[400,500),[500,600],制成如图所示的频率分布直方图(假设消费金额均在[0,600]元的区间内). (1)若按分层抽样的方法在消费金额为[400,600]元区间内抽取6张电脑小票,再从中任选2张,求这2张小票均来自[400,500)元区间的概率;(2)为做好五一劳动节期间的商场促销活动,策划人员设计了两种不同的促销方案. 方案一:全场商品打八折.方案二:全场购物满100元减20元,满300元减80元,满500元减120元,以上减免只取最高优惠,不重复减免,利用直方图的信息分析:哪种方案优惠力度更大,并说明理由(直方图中每个小组取中间值作为该组数据的替代值).【解】 (1)由题意知,在[400,500)元区间内抽4张,分别记为a ,b ,c ,d ,在[500,600]元区间内抽2张,分别记为E ,F ,设“2张小票均来自[400,500)元区间”为事件A ,从中任选2张,有以下选法:ab ,ac ,ad ,aE ,aF ,bc ,bd ,bE ,bF ,cd ,cE ,cF ,dE ,dF ,EF ,共15种.其中,2张小票均来自[400,500)元区间的有ab ,ac ,ad ,bc ,bd ,cd ,共6种, ∴P (A )=25.(2)方法一 由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05.方案一:购物的平均费用为0.8×(50×0.1+150×0.2+250×0.25+350×0.3+450×0.1+550×0.05)=0.8×275=220(元).方案二:购物的平均费用为50×0.1+130×0.2+230×0.25+270×0.3+370×0.1+430×0.05=228(元).∵220<228,∴方案一的优惠力度更大.方法二由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05,方案一:平均优惠金额为0.2×(50×0.1+150×0.2+250×0.25+350×0.3+450×0.1+550×0.05)=0.2×275=55(元).方案二:平均优惠金额为20×(0.2+0.25)+80×(0.3+0.1)+120×0.05=47(元).∵55>47,∴方案一的优惠力度更大.4.某校高三期中考试后,数学教师对本次全部数学成绩按1∶30进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:(1)求表中a,b的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]内为及格);(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出两个样本数字之差的绝对值大于10的概率.【解】(1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,∴a=0.1,b=3.成绩在[70,90)内的样本数为0.25×20=5.∴成绩在[90,110)内的样本数为20-2-5-5=8.估计这次考试全校高三学生数学成绩的及格率为P=1-0.1-0.25=0.65.(2)所有可能的结果为(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,取出的两个样本中数字之差的绝对值大于10的结果为(100,116),(100,118),(100,128),(102,116),(102,118),(102,128),(106,118),(106,128),(106,118),(106,128),(116,128),共11个,∴P(A)=1121.。

2020届高考文数复习常考题型大通关(全国卷): 统计概率

2020届高考文数复习常考题型大通关(全国卷): 统计概率

常考题型大通关:第19题统计概率1、2018年10月17日是我国第5个扶贫日,也是第26个国际消除贫困日。

射洪某企业员工共500人参加“精准扶贫”活动,按年龄分组:第一组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)下表是年龄的频数分布表,求正整数a,b的值;(2)根据频率分布直方图,估算该企业员工的平均年龄及年龄的中位数;(3)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.2、某高校在2014年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下左图所示.(1)请先求出频率分布表中①、②、③、④位置相应的数据,再在答题纸上完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?3、随着生活水平的提高,人们对空气质量的要求越来越高,某机构为了解公众对“车辆限行”的态度,随机抽查40人,并将调查情况进行整理后制成下表:年龄(岁) [15,25) [25,35) [35,45) [45,55) [55,60]频数 5 10 10 5 10赞成人数 4 6 8 4 91.完成被调查人员年龄的频率分布直方图,并求被调查人员中持赞成态度人员的平均年龄约为多少岁?15,25,45,55的被调查人员中各随机选取1人进行调查.请写出所有的基2.若从年龄在[)[)本亊件,并求选取2人中恰有1人持不赞成态度的概率.4、某中学为弘扬优良传统,展示80年来的办学成果,特举办“建校80周年教育成果展示月”活动。

现在需要招募活动开幕式的志愿者,在众多候选人中选取100名志愿者,为了在志愿者.组号分组频数频率160,165 5 0.05第1组[)第2组[165,170)0.35第3组[170,175)第4组[175,180)20 0.20第5组[180,185)10合计100 1.001.请补充频率分布表中空白位置相应数据,再完成下列频率分布直方图;2.为选拔出主持人,决定在第3、4、5组中用分层抽样抽取6人上台,求第3、4、5组每组各抽取多少人?3.在2的前提下,主持人会在上台的6人中随机抽取2人表演诗歌朗诵,求第3组至少有一人被抽取的概率?5、某中学组织了一次高三学生数学学业水平模拟测试,学校从测试合格的男、女生中各随机抽取100人的成绩进行统计分析,分别制成了如图所示的男生和女生数学成绩的频率分布直方图.1.若所得分数大于等于80分认定为优秀,求男、女生优秀人数各有多少人?2.在1中的优秀学生中用分层抽样的方法抽取5人,从这5人中任意选取2人,求至少有一名男生的概率.6、某乡镇根据中央文件精神,在2014年通过精准识别确定建档立卡的贫困户共有473户,结合当地实际情况采取多项精准扶贫措施,从2015年至2018年该乡镇每年脱贫户数见下表:年份2015 2016 2017 2018 年份代码x 1 2 3 4脱贫户数y55 69 71 85(1)根据2015-2018年的数据,求出y关于x的线性回归方程$$y bx a=+$;(2)利用(1)中求出的线性回归方程,试判断到2020年底该乡镇的473户贫困户能否全部脱贫.附:$$1221,ni iiniix y nxyb a y bxx nx==-==--∑∑$$7、某农科所对冬季昼夜温差大小与某反季节大豆新品种种子发芽数之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天昼夜温差大小与实验室每天每100颗种子中的发芽数,得到如下数据:该农科所确定的研究方案是:先从这5组数据中随机选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验。

2020高考数学考点题型归类解析---11 统计和概率

2020高考数学考点题型归类解析---11 统计和概率

2020高考数学考点题型归类解析11 统计和概率1.(2020•北京卷)在52)的展开式中,2x的系数为().A. 5-B. 5C. 10- D. 10【答案】C【解析】首先写出展开式的通项公式,然后结合通项公式确定2x的系数即可.【详解】)52展开式的通项公式为:()()55215522rr r rr rrT C C x--+=-=-,令522r-=可得:1r=,则2x的系数为:()()11522510C-=-⨯=-.故选:C.【点睛】二项式定理的核心是通项公式,求解此类问题可以分两步完成:第一步根据所给出的条件(特定项)和通项公式,建立方程来确定指数(求解时要注意二项式系数中n和r的隐含条件,即n,r均为非负整数,且n≥r,如常数项指数为零、有理项指数为整数等);第二步是根据所求的指数,再求所求解的项.2.(2020•北京卷)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p,试比较0p与1p的大小.(结论不要求证明)【答案】(Ⅰ)该校男生支持方案一的概率为13,该校女生支持方案一的概率为34;(Ⅱ)1336,(Ⅲ)01p p<【解析】(Ⅰ)根据频率估计概率,即得结果;(Ⅱ)先分类,再根据独立事件概率乘法公式以及分类计数加法公式求结果;(Ⅲ)先求0p,再根据频率估计概率1p,即得大小.【详解】(Ⅰ)该校男生支持方案一的概率为2001 200+4003=,该校女生支持方案一的概率为3003 300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313()(1)()(1)3433436C -+-=; (Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题.3.(2020•全国1卷)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( )A. y a bx =+B. 2y a bx =+C. e x y a b =+D. ln y a b x =+【答案】D【解析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+.故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.4.(2020•全国1卷)25()()x x y xy ++的展开式中x 3y 3的系数为( )A. 5B. 10C. 15D. 20【答案】C【解析】求得5()x y +展开式的通项公式为515r rr r T C xy -+=(r N ∈且5r ≤),即可求得2y x x ⎛⎫+ ⎪⎝⎭与5()x y +展开式的乘积为65r r r C x y -或425r r r C x y -+形式,对r 分别赋值为3,1即可求得33x y 的系数,问题得解.【详解】5()x y +展开式的通项公式为515r rr r T C xy -+=(r N ∈且5r ≤)所以2y x x ⎛⎫+ ⎪⎝⎭的各项与5()x y +展开式的通项的乘积可表示为:56155r rrr rrr xT xC xy C xy --+==和22542155r r rr r r r T C x y xC y y y x x --++==在615r rr r xT C xy -+=中,令3r =,可得:33345xT C x y =,该项中33x y 的系数为10,在42152r r r r T C x x y y -++=中,令1r =,可得:521332T C y x xy =,该项中33x y 的系数为5所以33x y 的系数为10515+=.故选:C【点睛】本题主要考查了二项式定理及其展开式的通项公式,还考查了赋值法、转化能力及分析能力,属于中档题.5.(2020•全国1卷)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12, (1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率.【答案】(1)116;(2)34;(3)716.【解析】(1)根据独立事件的概率乘法公式可求得事件“甲连胜四场”的概率; (2)计算出四局以内结束比赛的概率,然后利用对立事件的概率公式可求得所求事件的概率;(3)列举出甲赢的基本事件,结合独立事件的概率乘法公式计算出甲赢的概率,由对称性可知乙赢的概率和甲赢的概率相等,再利用对立事件的概率可求得丙赢的概率.【详解】(1)记事件:M 甲连胜四场,则()411216P M ⎛⎫== ⎪⎝⎭;(2)记事件A 为甲输,事件B 为乙输,事件C 为丙输, 则四局内结束比赛的概率为()()()()411424P P ABAB P ACAC P BCBC P BABA ⎛⎫'=+++=⨯= ⎪⎝⎭,所以,需要进行第五场比赛的概率为314P P '=-=; (3)记事件A 为甲输,事件B 为乙输,事件C 为丙输,记事件:M 甲赢,记事件:N 丙赢,则甲赢的基本事件包括:BCBC 、ABCBC 、ACBCB 、BABCC 、BACBC 、BCACB 、BCABC 、BCBAC ,所以,甲赢概率为()4511972232P M ⎛⎫⎛⎫=+⨯= ⎪ ⎪⎝⎭⎝⎭.由对称性可知,乙赢的概率和甲赢的概率相等,所以丙赢的概率为()97123216P N =-⨯=. 【点睛】本题考查独立事件概率的计算,解答的关键就是列举出符合条件的基本事件,考查计算能力,属于中等题.6.(2020•全国2卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完的成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( )A. 10名B. 18名C. 24名D. 32名【答案】B【解析】算出第二天订单数,除以志愿者每天能完成的订单配货数即可.【详解】由题意,第二天新增订单数为50016001200900+-=,设需要志愿者x 名,500.95900x≥,17.1x ≥,故需要志愿者18名.故选:B 【点晴】本题主要考查函数模型的简单应用,属于基础题.7.(2020•全国2卷)4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学,则不同的安排方法共有__________种.【答案】36【解析】根据题意,有且只有2名同学在同一个小区,利用先选后排的思想,结合排列组合和乘法计数原理得解.【详解】4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学∴先取2名同学看作一组,选法有:246C =现在可看成是3组同学分配到3个小区,分法有:336A =根据分步乘法原理,可得不同的安排方法6636⨯=种 故答案为:36.【点睛】本题主要考查了计数原理的综合应用,解题关键是掌握分步乘法原理和捆绑法的使用,考查了分析能力和计算能力,属于中档题.8.(2020•全国2卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i i x ==∑,2011200i i y ==∑,2021)80i i x x =-=∑(,2021)9000i i y y =-=∑(,201))800ii ix y x y =--=∑((. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =12211))))ni iiiin ni i x y x x y y y x ===----∑∑∑((((,≈1.414.【答案】(1)12000;(2)0.94;(3)详见解析【解析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;(2)利用公式20()()iix x y y r --=∑计算即可;(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.【详解】(1)样区野生动物平均数为201111200602020i i y ==⨯=∑, 地块数为200,该地区这种野生动物的估计值为2006012000⨯= (2)样本(,)i i x y (i =1,2,…,20)的相关系数为20()()0.943iix x y y r --===≈∑(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.9.(2020•全国3卷)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( )A. 14230.1,0.4p p p p ====B. 14230.4,0.1p p p p ====C. 14230.2,0.3p p p p ====D. 14230.3,0.2p p p p ====【答案】B【解析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.【详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65As =-⨯+-⨯+-⨯+-⨯=; 对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85Bs =-⨯+-⨯+-⨯+-⨯=; 对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05Cs =-⨯+-⨯+-⨯+-⨯=; 对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45Ds =-⨯+-⨯+-⨯+-⨯=. 因此,B 选项这一组标准差最大.故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.10.(2020•全国3卷)262()x x+的展开式中常数项是__________(用数字作答). 【答案】240【解析】写出622x x ⎛⎫+ ⎪⎝⎭二项式展开通项,即可求得常数项.【详解】622x x ⎛⎫+ ⎪⎝⎭其二项式展开通项:()62612rrrr C x x T -+⎛⎫⋅⋅ ⎪⎝⎭=1226(2)r rr r xC x --⋅=⋅1236(2)r r r C x -=⋅ 当1230r -=,解得4r =∴622x x ⎛⎫+ ⎪⎝⎭的展开式中常数项是:664422161516240C C ⋅=⋅=⨯=.故答案为:240. 【点睛】本题考查二项式定理,利用通项公式求二项展开式中的指定项,解题关键是掌握()na b +的展开通项公式1C rn rr r n T ab -+=,考查了分析能力和计算能力,属于基础题.11.(2020•全国3卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,【答案】(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【解析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率;(2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论.【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.12.(2020•江苏卷)已知一组数据4,2,3,5,6a a -的平均数为4,则a 的值是_____. 【答案】2【解析】根据平均数的公式进行求解即可.【详解】∵数据4,2,3,5,6a a -的平均数为4∴4235620a a ++-++=,即2a =.故答案为:2.【点睛】本题主要考查平均数的计算和应用,比较基础.13.(2020•江苏卷)将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是_____.【答案】19【解析】分别求出基本事件总数,点数和为5的种数,再根据概率公式解答即可.【详解】根据题意可得基本事件数总为6636⨯=个.点数和为5的基本事件有()1,4,()4,1,()2,3,()3,2共4个.∴出现向上的点数和为5的概率为41369P ==.故答案为:19.【点睛】本题考查概率的求法,考查古典概型、列举法等基础知识,考查运算求解能力,是基础题.14.(2020•新全国1山东)6名同学到甲、乙、丙三个场馆做志愿者,每名同学只去1个场馆,甲场馆安排1名,乙场馆安排2名,丙场馆安排3名,则不同的安排方法共有()A. 120种B. 90种C. 60种D. 30种【答案】C【解析】分别安排各场馆的志愿者,利用组合计数和乘法计数原理求解.【详解】首先从6名同学中选1名去甲场馆,方法数有16C;然后从其余5名同学中选2名去乙场馆,方法数有25C;最后剩下的3名同学去丙场馆.故不同的安排方法共有126561060C C⋅=⨯=种.故选:C【点睛】本小题主要考查分步计数原理和组合数的计算,属于基础题.15.(2020•新全国1山东)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A. 62%B. 56%C. 46%D. 42%【答案】C【解析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,然后根据积事件的概率公式()P A B ⋅=()()()P A P B P A B +-+可得结果.【详解】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-=所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.16.(2020•新全国1山东)信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑.( )A. 若n =1,则H (X )=0B. 若n =2,则H (X )随着1p 的增大而增大C. 若1(1,2,,)i p i n n==,则H (X )随着n 的增大而增大 D. 若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,则H (X )≤H (Y )【答案】AC【解析】对于A 选项,求得()H X ,由此判断出A 选项的正确性;对于B 选项,利用特殊值法进行排除;对于C 选项,计算出()H X ,利用对数函数的性质可判断出C 选项的正确性;对于D 选项,计算出()(),H X H Y ,利用基本不等式和对数函数的性质判断出D 选项的正确性.【详解】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确.对于B 选项,若2n =,则1,2i =,211p p =-, 所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦,当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭, 当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误.对于C 选项,若()11,2,,i p i n n==,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m j P Y j p p +-==+(1,2,,j m =).()2222111log log m mi i i i i iH X p p p p ===-⋅=⋅∑∑122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅. ()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅++⋅+++⋅+++12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++由于()01,2,,2i p i m >=,所以2111i i m i p p p +->+,所以222111log log i i m ip p p +->+, 所以222111log log i i i i m ip p p p p +-⋅>⋅+,所以()()H X H Y >,所以D 选项错误.故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.17.(2020•新全国1山东)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO浓度有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,2 () P K k≥0.050 0.010 0.001k3841 6.63510.828【答案】(1)0.64;(2)答案见解析;(3)有.【解析】(1)根据表格中数据以及古典概型的概率公式可求得结果; (2)根据表格中数据可得22⨯列联表; (3)计算出2K ,结合临界值表可得结论.【详解】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:(3)根据22⨯列联表中的数据可得.222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关.【点睛】本题考查了古典概型的概率公式,考查了完善22⨯列联表,考查了独立性检验,属于中档题.18.(2020•天津卷)从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47],[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A. 10B. 18C. 20D. 36【答案】B 【解析】根据直方图确定直径落在区间[)5.43,5.47之间的零件频率,然后结合样本总数计算其个数即可.【详解】根据直方图,直径落在区间[)5.43,5.47之间的零件频率为:()6.25 5.000.020.225+⨯=,则区间[)5.43,5.47内零件的个数为:800.22518⨯=.故选:B.【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题.19.(2020•天津卷)在522x x ⎛⎫+ ⎪⎝⎭的展开式中,2x 的系数是_________. 【答案】10【解析】写出二项展开式的通项公式,整理后令x 的指数为2,即可求出. 【详解】因为522x x ⎛⎫+ ⎪⎝⎭的展开式的通项公式为()5531552220,1,2,3,4,5r r r r r r r T C xC x r x --+⎛⎫==⋅⋅= ⎪⎝⎭,令532r -=,解得1r =.所以2x 的系数为15210C ⨯=.故答案为:10.【点睛】本题主要考查二项展开式的通项公式的应用,属于基础题.20.(2020•天津卷)已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.【答案】 (1). 16 (2). 23【解析】根据相互独立事件同时发生的概率关系,即可求出两球都落入盒子的概率;同理可求两球都不落入盒子的概率,进而求出至少一球落入盒子的概率. 【详解】甲、乙两球落入盒子的概率分别为11,23,且两球是否落入盒子互不影响, 所以甲、乙都落入盒子概率为111236⨯=,甲、乙两球都不落入盒子的概率为111(1)(1)233-⨯-=, 所以甲、乙两球至少有一个落入盒子的概率为23.故答案为:16;23. 【点睛】本题主要考查独立事件同时发生的概率,以及利用对立事件求概率,属于基础题.21.(2020•浙江卷)设()2345125345612 x a a x a x a x a x a x +=+++++,则a 5=________;a 1+a 2 + a 3=________.【答案】 (1). 80(2). 122【解析】利用二项式展开式的通项公式计算即可.【详解】5(12)x +的通项为155(2)2r r r r r r T C x C x +==,令4r =,则444455280T C x x ==,故580a =;113355135555222122a a a C C C ++=++=.故答案为:80;122 【点晴】本题主要考查利用二项式定理求指定项的系数问题,考查学生的数学运算能力,是一道基础题.22.(2020•浙江卷)一个盒子里有1个红1个绿2个黄四个相同的球,每次拿一个,不放回,拿出红球即停,设拿出黄球的个数为ξ,则(0)P ξ==_______;()E ξ=______.【答案】 (1). 13(2). 1 【解析】先确定0ξ=对应事件,再求对应概率得结果;第二空,先确定随机变量,再求对应概率,最后根据数学期望公式求结果.【详解】因为0ξ=对应事件为第一次拿红球或第一次拿绿球,第二次拿红球, 所以1111(0)4433P ξ==+⨯=,随机变量0,1,2ξ=,212111211(1)434324323P ξ==⨯+⨯⨯+⨯⨯=, 111(2)1333P ξ==--=,所以111()0121333E ξ=⨯+⨯+⨯=.故答案为:1;13. 【点睛】本题考查古典概型概率、互斥事件概率加法公式、数学期望,考查基本分析求解能力,属基础题.23.(2020•上海卷)从6人中挑选4人去值班,每人值班1天,第一天需要1人,第二天需要1人,第三天需要2人,则有种排法。

2020年高考文科数学《概率与统计》题型归纳与训练

2020年高考文科数学《概率与统计》题型归纳与训练

一次随机摸出 2 只球,则这 2 只球颜色不同的概率为

【答案】 P 5
6
【解析】 1只白球设为 a ,1只红球设为 b , 2 只黄球设为 c , d ,
则摸球的所有情况为 a,b , a, c , a,d , b,c , b,d , c,d ,共 6 件, 满足题意的事件为 a,b , a,c , a,d , b, c , b,d ,共 5 件,故概率为 P 5 .
【解析】 不超过 30 的素数有 2、3、5、7、11、13、17、19、23、29,共 10 个,
随机选取两数有 45 (种)情况,其中两数相加和为 30 的有 7 和 23,11 和 19,
31
P
13 和 17,共 3 种情况,根据古典概型得
45 15 .故选 C .
3.袋中有形状、大小都相同的 4 只球,其中 1只白球, 1只红球, 2 只黄球,从中
5
【易错点】 没有读懂题意 ,计算错误 .不会用函数思想处理问题 【思维点拨】 根据题意分情况写出函数解析式; 2 牵涉到策略问题 ,一般可以转化 为比较两个指标的大小 . 题型四 回归与分析 例 1 下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线 图

生 1.80 活
2.89
0.99 .
i1
i1
0.55 2 2.646
因为 y 与 t 的相关系数近似为 0.99 ,说明 y 与 t 的线性相关程度相当高,从而可以 用线性回归模型拟合 y 与 t 的关系 .
(1)变量 y 与 t 的相关系数 r
7
(ti t )( yi y)
i1
7
7
(ti t )2 ( yi y)2 7

高考文科数学概率与统计题型归纳与训练

高考文科数学概率与统计题型归纳与训练

高考文科数学概率与统计题型归纳与训练2020年高考文科数学《概率与统计》题型归纳与训练题型归纳古典概型例1:从甲、乙等5名学生中随机选出2人,则甲被选中的概率为()。

A。

55.B。

25.C。

9.D。

128解析:可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有:甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有10种选法,其中只有前4种是甲被选中,所以所求概率为4/10=2/5.故选B。

例2:将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________。

解析:根据题意显然这是一个古典概型,其基本事件有:数1,数2,语;数1,语,数2;数2,数1,语;数2,语,数1;语,数2,数1;语,数1,数2共有6种,其中2本数学书相邻的有4种,则其概率为:p=4/6=2/3.易错点:列举不全面或重复,就是不准确。

思维点拨:直接列举,找出符合要求的事件个数。

几何概型例1:如图所示,正方形ABCD内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称。

在正方形内随机取一点,则此点取自黑色部分的概率是()。

解析:不妨设正方形边长为a,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半。

由几何概型概率的计算公式得,所求概率为1/2πa^2=π/4a^2.故选B。

例2:在区间[0,5]上随机地选择一个数p,则方程x^2+2px-3p^2=0有两个负根的概率为________。

解析:方程x^2+2px-3p^2=0有两个负根的充要条件是Δ=4p^2-4(3p-2)x<0,即3p^2-x^2<2.因为x^2<p,所以3p^2-p^2<2,即p∈(0,1]∪[2,5],又因为p∈[0,5],所以使方程x^2+2px-3p^2=0有两个负根的p的取值范围为(√3,1]∪[2,5],故所求的概率为(5-√3)/5.220度,中位数是235度。

2020年高考文数二轮专题复习:题型1第15讲概率与统计含解析

2020年高考文数二轮专题复习:题型1第15讲概率与统计含解析

第15讲概率与统计[考情分析]统计的主要内容包括随机抽样、用样本估计总体、变量的相关关 系;概率部分以考查古典(几何)概型、互斥事件、对立事件等为主,主要以选择或 填空的方式呈现,多为低、中档题目. 热点题型分析热点1抽样方法与用样本估计总体方法结论---------------- V --------------1•抽样方法2 •样本的数字特征(1) 众数:在样本数据中,出现次数最多的那个数据;(2) 中位数:样本数据中,将数据按大小排列,位于最中间的一个或两个数据 的平均数,是样本数据的“中心点”;—1⑶平均数:样本数据的算术平均数,即 7二/X 1+ X 2+…+ X n ),是样本数据的 平均水平;(4)方差与标准差:是样本数据到平均数的一种平均距离,表示样本数据的离 散程度,标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离 散程度越小.2 1 — 2 , — 2 — 2方差:S =孑&1— X) + (X 2 — X) +…+ (X n — X)];类别 简单随机抽样 共同点系统抽样 (1》抽样过屮毎个个 体被抽到的 概率相等. 分层 抽样均为G⑵每次抽 个休后不 将它放 冋即不放 样标准差:s=p1^X1 - X $ + (X2- X $+•••+(X n- x J.3 •直方图的两个结论率(1)小长方形的面积=组距x组距=频率;⑵各小长方形的面积之和等于1.4.直方图与众数、中位数和平均数的关系(1) 众数:是直方图中最高矩形的底边中点横坐标;(2) 中位数:是直方图中平分所有矩形面积和,且垂直于横轴的直线与横轴交点的横坐标;⑶平均数:是每个小矩形的面积乘以小矩形底边中点的横坐标之和.【题型分析】I1. (2019东三省三校一模)如图是某居民小区年龄在20岁到45岁的居民上网情况的频率分布直方图,现已知年龄在[30,35), [35,40), [40,45]的上网人数呈现递减的等差数列,且年龄在[30,35)的频率为0.3,则由此频率分布直方图估计该小区在20岁到45岁的居民上网年龄的()A .平均数为32.5B .众数为32.25C.中位数为95 D .在[40,45]的频率为0.15答案C解析由题意可知[20,25), [25,30), [30,35)的频率分别为0.05,0.35,03设[35,40), [40,45]的频率分别为a, b.因为已知年龄在[30,35), [35,40), [40,45]的上网人数呈现递减的等差数列,所以他们的频率也成递减的等差数列,则有a+b=0.3且2a= b+ 0.3,解得a = 0.2, b= 0.1,故选项D不正确;居民上网年龄的平均数为22.5X 0.05+ 27.5X 0.35+ 32.5X 0.3+ 37.5X 0.2 + 42.5X 0.1 = 32.25,所以A 不正确;根据众数和直方图的关系,可得上网年龄的众数为27.5,故B不正确;由前面计算可知中位数在[30,35)组中,设中位数为x,则X-530= %,解得x= 95, 故选C.2•—个总体中的100个个体的号码分别为0,1,2,…,99,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为m,那么依次错位地得到后面各组的号码,即第k组(k= 1,2,…,9)中抽取的号码个位数字为m+ k或m+ k—10(如果m+ k> 10),当m=5时,第8组抽取的号码为___________________________ .答案83解析因为m= 5, k= 8,则m+ k= 13,则第8组中抽取号码的个位数字为m + k—10= 3,所以第8组抽取的号码为83.3. (2019江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是 _________ .5答案3解析这组数据的平均数为8,故方差为s2= j x [(6 —8)2+ (7 —8)2+ (8 —8)2+ (8 —8)2+ (9 —8)2+ (10 —8)2] = 3.I【误区警示】1. 对于以统计图为载体的概率与统计问题,认真观察图表,从中提取有用信息和数据是解题关键•特别是利用频率直方图解题时,常把直方图的高误认为是频率而导致错误•因此,应注意每个小矩形的面积为频率,所有面积和为 1.对于第1题这类,利用直方图考查众数、中位数和平均数的问题,关键在于相应的计算公式是否掌握,特别是中位数问题,找准中位数所在的区间是解题关键;2•对于抽样方法的问题,要明确总体的基本特征符合哪种抽样特点•对于系统抽样通常是等距抽样,但也有例外情况,如第2题给出的规则即为每组号码错后一位,如果还按照等距原则计算,就会出现错解85.因此解决系统抽样的问题时,要认真审题,分析题目给出的抽取规则,按照规则进行抽样;3.对于样本的数字特征的一系列问题(如第3题),解题关键在于计算公式的准确使用和计算准确,应掌握简便运算的方法,减小计算量,提高准确率.热点2统计案例方法结论71.线性回归方程A A A方程y= bx+ a称为线性回归方程,利用最小二乘法估计公式斜率和截距分别为' X i — xy i — y ' X i y i — nx yi = 1i = 1心,且回归直线恒过该点.2 •相关系数ni =1xi -— yi -—表明变量x 与y 负相关.若|r|€ [0.75,1]时,相关性很强;|r|€ [0.3,0.75)时,相关性 般;|r|€ [0,0.25]时,相关性较弱. 3.残差分析n八2瓦(y — yi )i =1 n 人R 2= 1— ,当R 2越大时,残差平方和v (y i — y i )2越小,拟合效果越n― 2 i =1 送(w — y )i = 1好;当R 2越小时,残差平方和越大,拟合效果越差.4 .独立性检验则有95%的把握说两个事件有关;当 K 2>6.635时,则有99%的把握说两个事件有关.【题型分析】IA1. (2019衡水中学调研)已知变量x,y 之间的线性回归方程为y = — 0.7x + 10.3, 且变量x , y 之间的一组相关数据如下表所示,则下列说法错误的是 ()x6 8 10 12 y6 m 3 2b =n v - — 2三(Xi — X ) i = 1n、、2 — 2vx i — n x x ,其中(x , V )是样本点的中 当r>0时,表明变量x 与y 正相关, r<0 时,随机变量K 2= i 「a + b + c + d i ad — be ] 2 a +b c + d a + c b + d (K也可以表示为 X ),当 K 2>3.841 时,A .变量x, y之间呈负相关关系AB .可以预测,当x= 20时,y= —3.7C. m= 4D •该回归直线必过点(9,4) 答案 C解析 由题意得,由一0.7<0,得变量x , y 之间呈负相关,故A 正确;当x = A— 120时,则y = — 0.7X 20+ 10.3= — 3.7,故B 正确;由数据表格可知 x = 4X (6+ 8 + 10+ 12)= 9, V = 4X (6 + m + 3+ 2) = ,则 11+0.7X 9+ 10.3,解得 m = 5,故C 错误;由数据表易知,样本点中心为(9,4),故D 正确•故选C .2•为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学如图所示2X 2列联表: 生,得到有95%的把握认为选修文科与性别有关.I 【误区警示】I1.线性回归分析是对有相关关系的两个变量进行统计分析的方法,只有在散 点图大致呈线性时,求出的线性回归方程才有实际意义;同时,根据回归方程预 测仅是一个预测值,而不是真实发生的值.2•独立检验得出的结论是带有概率性质的,只能说结论成立的概率有多大, 而不能完全肯定一个结论,因此才出现了临界值表•在分析问题时一定要注意不 可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.热点3古典概型、几何概型方法结论71 •古典概型有天.答案 95%解析2由题意,K 2=23X 27X 20X 30 ■"4.844,因为 4.844>3.841,所以测值k = 4.844,贝U 有________ 的把握认为选修文科与性别已知 P (K 2>3.841)"0.05, P (K 2》5.024)"0.025.根据表中数据,得到 K 2的观 250X 13X 20— 10X 723 X 27X 20 X 30_事件A所包含的基本事件数P(A)= 基本事件总数2 •几何概型构成事件A 的区域长度(面积或体积)P (A )—试验的全部结果所构成的区域长度 面积或体积.【题型分析】I1. (2019全国卷川)两位男同学和两位女同学随机排成一列,则两位女同学相 邻的概率是()1 1 C . 3 D . 2答案 D解析 设两位男同学分别为A , B ,两位女同学分别为a , b ,则用“树形图 表示四位同学排成一列所有可能的结果如图所示.由图知,共有24种等可能的结果,其中两位女同学相邻的结果(画“ ”的情 12 1 况)共有12种,故所求概率为24=夕故选D . g, 0<X V 1,2. (2019西安调研)若函数f(x) = Jn x + e , 1 <x < e, 一个实数x ,则f (x )的值不小于常数e 的概率是( )C . 答案 B解析 当0w x<1时,恒有f(x) = e x <e ,不满足题意.当 K x < e 时,f(x) = In x e 一 1TVA —a a —A 4 H J在区间[0, e ]上随机取.4ii —b h —iW B —bb —fi A — b b~AA —2ii —A x/13—a1+ e.由ln x+ e>e,得1 <x<e;.所求事件的概率P= = 1 —-.e e【误区警示】31.运用古典概型和几何概型计算公式的前提,是当所述试验的所有基本事件是等可能的.2•几何概型的考查重点是几何测度的选择,通常为长度、面积、体积、弧长、夹角等.真题自检感悟1. (2018全国卷I )右图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC的斜边BC,直角边AB, AC. △ ABC的三边所围成的区域记为I,黑色部分记为U,其余部分记为川.在整个图形中随机取一点,此点取自I, n, m的概率分别记为p i,p2,p3,则()a cA . p i = P2B . p i= P3C. P2= P3 D . p i= P2+ P3答案A解析不妨取AB= AC= 2,则BC = 2 2,所以区域I的面积为S^ABC = 2;区域m的面积为n—2;区域n的面积为n- (n-2)= 2,所以根据几何概型的概率公式,易得p i = p2,故选A .2. (2018全国卷n )我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30= 7 + 23•在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是()1 1A.徨B.和小丄1C. 15D. 18答案C解析不超过30的素数有2,3,5,7,11,13,17,19,23,29共10个,随机选取两个不同的数,共有45种方法,因为7+ 23= 11+ 19= 13+ 17= 30,所以随机选取两3 1个不同的数,其和等于30的有3种方法,故概率为45=15,选C.3. (2019全国卷n )生物实验室有5只兔子,其中只有3只测量过某项指标.若从这5只兔子中随机取出3只,贝『恰有2只测量过该指标的概率为()c.答案B解析设5只兔子中测量过某项指标的3只为a i, a2, a3,未测量过这项指标的2只为b i, b2,则从5只兔子中随机取出3只的所有可能情况为(a i, a2, a3), (a i,a2,b i),(a i, a2, b2), (a i, a3, b i), (a i, a3, b2), (a i, b i, b2), (a2, a3, b i), (a2, a3, b2), (a2, b i, b2), @, b i, b2),共iO种可能.其中恰有2只测量过该指标的情况为(a i, a2, b i), (a i, a2, b2), (a i, a3, b i), (a i , a3 , b2), (a2 , a3 , b i) , (a2 , a3 , b2),共6种可能.故恰有2只测量过该指标的概率为!0= 3.故选B.4. (20i9江苏高考)从3名男同学和2名女同学中任选2名同学参加志愿者服务,则选出的2名同学中至少有i名女同学的概率是 ______________ .答案io解析解法一:设3名男同学分别为A , B , C,2名女同学分别为a , b,则所有等可能事件分别为AB , AC , A a , Ab , BC , B a , Bb , Ca , Cb ,ab ,共iO个,选出的2名同学中至少有i名女同学包含的基本事件分别为Aa , Ab , Ba , Bb , Ca , Cb , ab ,共7个,故所求概率为i0.解法二:同解法一,得所有等可能事件共iO个,选出的2名同学中没有女同3 7学包含的基本事件分别为AB , AC , BC ,共3个,故所求概率为i-—=专题作业、选择题i. (20i9银川二模)某对夫妇计划生育3个孩子,则这个家庭中有2个女孩和i个男孩的概率是()C.答案B解析分别用i,2来表示男孩与女孩,用(i,i,i)表示三个小孩均为男孩,则所有的基本事件有(i,i,i) , (i,i,2) , (i,2,i) , (i,2,2) , (2,i,i) , (2,i,2) , (2,2,i) , (2,2,2), 共8个,而有2个女孩和i个男孩的基本事件有(i,2,2) , (2,i,2) , (2,2,i),共3个, 所以所求的概率为p=3.故选B .22. (20i9宣城模拟)一支田径队共有运动员98 人,其中女运动员42人,用分层抽样的方法抽取一个样本,每名运动员被抽到的概率都是7,则男运动员应抽取()A . 18 人B . 16 人C. 14 人 D . 12 人答案B解析•••田径队共有运动员98人,其中女运动员有42人,.••男运动员有56一 2 一2人,•••每名运动员被抽到的概率都是7,二男运动员应抽取56X~2= 16(人),故选B .3. 右面茎叶图记录了甲、乙两组各五名同学在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x和y的值分别为()甲组乙粗909x 2L 5 丁*7 424A . 2,5B . 5,5C . 5,8D . 8,8答案C解析由茎叶图及甲组数据的中位数为15,得x= 5,又乙组的平均数为16.8,所以9+ 15+ 10;y+ 18+ 24二16.8,解得y= 8,故选 C .4 . (2019新乡模拟)从区间[0 , n内任取一个实数x,则sinx+ 3cosx>1的概率为()1 1A. 3 B . 2答案B解析由sinx+ , 3cosx>1,得sin x+7 >7,因为x€ [0,冗]所以sinx+ , 3cosx>1n—n 2 1的解集为o,扌丿,由几何概型可知所求概率p二丁2故选B .5 . 2021年某省新高考将实行“ 3+ 1 + 2”模式,即语文、数学、外语必选,物理、历史二选一,政治、地理、化学、生物四选二,共有12种选课模式.某同学已选了物理,记事件A: “他选择政治和地理”,事件B: “他选择化学和地理”,则事件A与事件B()A •是互斥事件,不是对立事件B •是对立事件,不是互斥事件C .既是互斥事件,也是对立事件D •既不是互斥事件也不是对立事件 答案 A 解析 事件A 与事件B 不能同时发生,是互斥事件,该同学还可以有其他选 择,例如他还可以选择化学和政治,所以事件 A 与事件B 不是对立事件.故选A . 6•如图所示的茎叶图表示的是甲、乙两人在 5次综合测评中的成绩,其中一 个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是( )T710 _9 10 答案 C_ 1 _ 1解析 设被污损的数字为 x ,则M 甲=-x (88+ 89+ 90 + 91 + 92)= 90,x 乙55x (83 + 83 + 87+ 99 + 90 + x ),若 x 甲=x 乙,贝U x = 8.若 x 甲 乙,贝U x 可以为 ” 8 40,1,2,3,4,5,6,7,故 P =石二5.7. (2019兰州实战考试)采用系统抽样的方法从1000人中抽取50人做问卷调 查,将他们随机编号1,2,…,1000.适当分组后在第一组采用简单随机抽样的方法 抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷A ,编号落入 区间[401,750]的人做问卷B ,其余的人做问卷C,则抽到的人中做问卷C 的人数为 ()A . 12B . 13C . 14 答案 A解析根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差 d =晋0= 20 的等差数列{a n },所以 a n = 8+ 20(n - 1)= 20n - 12,令 751 <20n -12< 1000,解得763< n < 讐,又n € N *,所以39< n W 50,则做问卷C 的共有 12人,故选A .8. (2019兰州一模)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:C .D . 15万元)之间有如下对应数据:x 2 4 5 6 8 y304050m70根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y = 6.5x + 17.5,则表中m 的值为()A . 45B . 50C . 55D . 60答案 D解析 由回归直线恒过(乂 , V ),可得三二2+ 4 5+ 丁6 7+ 8二5, 7二解析 设固定弦的一个端点为 A,则另一个端点在圆周上且在 BC 劣弧上随机2n31选取,即可满足题意,则P (A )=2n= 1,故选B .10. (2017全国卷U )从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回 后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为10=38 + 学,即卩 38+ 6.5X 5+ 17.5,解得 m5 59. 法国学者贝特朗发现,在研究事件A “在半径为1的圆内随机地取一条弦, 其长度超过圆内接等边三角形的边长 .3”的概念的过程中,基于对“随机地取一 条弦”的含义的不同理解,事件A 的概率P (A )存在不同的答案,该问题被称为“贝 特朗悖论”.现给出一种解释:若固定弦的一个端点,另一个端点在圆周上随机 选取,则P (A ) =( )C . 答案 B30+ 40+ 50+ m + 70 560,故选D .C .島D . 2答案 D 解析 从5张卡片中随机抽取1张,放回后再随机抽取1张的情况如图:2345第二张 1234 5 1 23 4 5 123 4 5 1 23 4 5 123 4 5基本事件总数为25,第一张卡片上的数大于第二张卡片上的数的事件数为 10,10 2 所以所求概率p =2°=5•故选D .11. 已知正三棱锥S -ABC 的底面边长为4,高为3,在正三棱锥内任取一点1P ,使得V P -ABe vqV s-ABC 的概率是()1c . 1答案 AV s- ABC ,1 1 1又 V 锥 S - A ' B ' C ' = 2X4V锥 s — ABC= 8 锥 S -ABC .1二事件 “ V P - ABC <2V S - ABC ” 的概率V 台体A B 'C ' -ABC V B S -ABC - V 锥S — A ' B ' C ' P =填空题2治=1的离心率e> .5的概率是1答案6第一张解析 由题 1A 'B 'C '以下时,满足V p -ABC <2V 锥 S -ABC V 锥S-ABC 12.某同学同时掷两颗质地均匀的骰子, 2得到的点数分别为a, b ,则双曲线拿解析由题意得e= , 1 + ;2> .5,即b>2a.同时抛掷两颗骰子,得到的点数a, b满足b>2a的情况有:当a= 1时,b = 3,4,5,6,共4种情况;当a= 2时,b=5,6,共2种情况,所以满足题意的情况共有6种,又同时掷两颗骰子有36种情况,6 1•••所求概率为盘=^.13. 从2,3,4,5,8,9这6个数中一次取出两个数分别作为对数的底数和真数,则得到的对数是整数的概率为__________ .1答案5解析设取得的第一个数为对数的底数,第二个数为对数的真数,则从2,3,4,5,8,9这六个数中一次取出两个数的基本事件有(2,3), (2,4), (2,5), (2,8), (2,9), (3,4), (3,5), (3,8), (3,9), (4,5), (4,8), (4,9), (5,8), (5,9), (8,9),共15 个,其中3 1得到的对数是整数的有(2,4), (2,8), (3,9),共3个,故所求事件概率为石=亏14. 按文献记载,《百家姓》成文于北宋初年,表1记录了《百家姓》开头的24大姓氏.表1表2记录了2018年中国人口最多的前10大姓氏.表2从《百家姓》开头的24大姓氏中随机选取1个姓氏,则这个姓氏是2018年中国人口最多的前10大姓氏的概率为_________ .1答案3解析2018年中国人口最多的前10大姓氏也是《百家姓》的前24大姓氏的是赵、李、周、吴、王、陈、杨、张,共8个,故所求概率为24=1x+ y —4< 0,15. 在平面区域x>0, 内随机取一点(a, b),贝U 函数f(x) = ax2—4bxy>0+ 1在区间[1 ,+x)上是增函数的概率为__________ .1答案3P -4\ 云X+y-4=0解析不等式组表示的平面区域为如图所示的△ AOB的内部及边界AB(不包1 2括边界OA, OB),贝U S SOB=2X4X 4= 8.函数f(x)= ax2—4bx+ 1 在区间[1 ,)4b a>0,上是增函数,则应满足a>0,且x=4b^ 1,即满足,可得对应的平面区域2a,a> 2b,a= 2b,如图中阴影部分(包括边界OC, BC,不包括边界OB),由' 解得a,a+ b—4= 0,8 4 一8 4 1 4 8=3, b=3,即点C坐标为i§, 3,所以S^COB = q X 4X3 = 3.根据几何概型的概率83 1计算公式,可知所求的概率为8= y。

2020年高考文数二轮专题复习:题型2第5讲概率与统计含解析

2020年高考文数二轮专题复习:题型2第5讲概率与统计含解析

第5讲概率与统计[考情分析]概率与统计通过统计图、古典概型、几何概型、线性相关与线性回归方程等知识考查数据处理能力•题目设置比较注重数学与生活的结合,属于中档题,难度适中.热点题型分析热点1统计图方法结论V1•一表二图(1) 频率分布表——数据详实;(2) 频率分布直方图--- 分布直观;(3) 频率分布折线图一一便于观察总体分布趋势.2 •茎叶图(1) 茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众数等;(2) 个位数为叶,十位数(或百位与十位)为茎,相同的数据重复写.3•条形图条形图是用条形的长度表示各类别频数(或频率)的多少,其宽度(表示类别)则是固定的.【题型分析】某城市100户居民的月平均用电量(单位:度),以[160,180), [180,200), [200,220), [220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.频率J纽更(1) 求直方图中x的值;⑵求月平均用电量的众数和中位数.解(1)由(0.002+ 0.0095+ 0.011+ 0.0125+ x+ 0.005+ 0.0025)X 20= 1 得x= 0.0075,•••直方图中x的值为0.0075.••• (0.002 + 0.0095+ 0.011)x 20= 0.45<0.5,•••月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002 + 0.0095+ 0.011)X 20+ 0.0125X (a - 220)= 0.5, 解得a = 224,即中位数为224.【通法指导】1.频率分布直方图中需要注意的几点 率;条形图的纵坐标为频数或频率;⑵各组频率之和为1,即所有小矩形的面积和为1; ⑶直方图中各小矩形的高度比=各组频率比=各组频数比. 2.与频率分布直方图相关问题的解题模板 第一步:根据频率分布直方图计算出相应的频率; 第二步:运用样本频率估计总体的频率; 第三步:得出结论.3•解决与茎叶图相关问题时,一要弄清茎叶图中茎与叶的含义,不要混淆; 二要注意看清所有的样本数据,弄清图中的数字特点,不要漏掉数据.[针对训练】随着新课程改革和高考综合改革的实施,高中教学以发展学生学科核心素养 为导向,学习评价更关注学科核心素养的形成和发展.为此,某市于2018年举行第一届高中数学学科素养竞赛,竞赛结束后,为了评估该市高中学生的数学学科 素养,从所有参赛学生中随机抽取 1000名学生的成绩(单位:分)作为样本进行估 计,将抽取的成绩整理后分成五组,依次记为 [50,60), [60,70), [70,80), [80,90), [90,100],并绘制成如图所示的频率分布直方图.(1) 请补全频率分布直方图,并估计这(2)月平均用电量的众数是 220+2402 =230. (1)直方图与条形图不同,直方图中的纵坐标是 频率组距,每个小矩形的面积为频0.04111000名学生成绩的平均数(同一组数据用该组区间的中点值作代表);(2) 该市决定对本次竞赛成绩排在前180名的学生给予表彰,授予“数学学科素养优秀标兵”称号,一名学生本次竞赛成绩为 79分,请你判断该学生能否被授 予“数学学科素养优秀标兵”称号.解 ⑴成绩在[60,70)的频率为1 — (0.30+ 0.15+ 0.10+ 0.05)= 0.40,补全的频率分布直方图如图:样本的平均数 —=55X 0.30 +65X 0.40+ 75 X 0.15+ 85X 0.10+ 95X 0.05 = 67. 所以由频率分布直方图可以估计获得 “数学学科素养优秀标兵”称号学生的因为79>78,所以该同学能被授予“数学学科素养优秀标”称号.热点2概率统计方法结论V1 •古典概型_事件A 所包含的基本事件数 P (A )= 基本事件总数 2 •几何概型构成事件A 的区域长度(面积或体积) P(A)=试验的全部结果所构成的区域长度 面积或体积*3 •当事件A 与B 互斥时,满足加法公式:P(A U B)= P(A) + P(B).4 •若事件A 与B 为对立事件,则P(A)= 1 — P(B),即PCA) = 1 — P(A).【题型分析】(2019四川省成都模拟)某学校为担任班主任的教师办理手机语音月卡套餐, 为了解通话时长,采用随机抽样的方法,得到该校100位班主任每人的月平均通话时长T(单位:分钟)的数据,其频率分布直方图如图所示,将频率视为概率.(2)因为 1801000=0.18, 最低成绩为80— 0.18— 0.05—0.100.015 oo4n ........ 「0.030 [).020 0.01()0.005(1) 求图中m 的值;(2) 估计该校担任班主任的教师月平均通话时长的中位数;(3) 在[450,500), [500,550]这两组中采用分层抽样的方法抽取 6人,再从这 6 人中随机抽取2人,求抽取的2人恰在同一组的概率.解(1)依题意,根据频率分布直方图的性质,可得:50X (m + 0.0040+ 0.0050+ 0.0066+ 0.0016+ 0.0008)= 1,解得 m = 0.0020. (2)设该校担任班主任的教师月平均通话时长的中位数为t.因为前2组的频率之和为(0.0020+ 0.0040)X 50 = 0.3<0.5, 前 3 组的频率之和为(0.0020+ 0.0040+ 0.0050) X 50= 0.55>0.5, 所以 350<t<400,由 0.3+ 0.0050X (t - 350)= 0.5,得 t = 390. 所以该校担任班主任的教师月平均通话时长的中位数为 390.(3)由题意,可得在[450,500)内抽取 小 0.0016 , t 八口「…斗 , 6X = 4人,分别记为a , b ,0.0016+ 0.0008 为 e , f ,则6人中抽取2人的取法有:{a , b}, {a , {b , c} , {b , d}, {b , e}, {b , f}, {c , d} , {c , f},共15种等可能的取法.其中抽取的2人恰在同一组的有{a , b}, {a , c}, {a , d} , {b , c}, {b , d}, {c , d} , {e , f},共7种取法,所以从这6人中随机抽取的2人恰在同一组的概率 7 P=— P15.【通法指导】求解概率与统计综合题的两点注意:(1) 明确频率与概率的关系,频率可近似替代概率;(2) 此类问题中的概率模型多是古典概型, 在求解时,要明确基本事件的构成, 并c ,d ,在[500,550]内抽取2人,记c , },{a ,d},{a ,e},{a ,f}, e},{c ,f},{d ,e},{d ,f},{e .判断所述试验的所有基本事件是否为等可能的.【针对训练】(2019西南名校联盟联考)某种产品的质量按照其质量指标值M进行等级划分,具体如下表:质量指标值M M<8080 < M<110M > 110等级三等品二等品一等品现从某企业生产的这种产品中随机抽取了100件作为样本,对其质量指标值M进行统计分析,得到如图所示的频率分布直方图.(1) 记A表示事件“一件这种产品为二等品或一等品”,试估计事件A的概率;(2) 已知该企业的这种产品每件一等品、二等品、三等品的利润分别为10元、6元、2元,试估计该企业销售10000件该产品的利润;(3) 根据该产品质量指标值M的频率分布直方图,求质量指标值M的中位数的估计值(精确到0.01).解(1)记B表示事件“一件这种产品为二等品”,C表示事件“一件这种产品为一等品”,则事件B,C互斥,且由频率分布直方图估计P(B) = 0.2+ 0.3+ 0.15= 0.65, P(C) = 0.1 + 0.09= 0.19,又P(A)= P(B+ C)= P(B) + P(C) = 0.84,所以事件A的概率估计为0.84.⑵由(1)知,任取一件产品是一等品、二等品的概率估计值分别为0.19,0.65,故任取一件产品是三等品的概率估计值为0.16,从而10000件产品估计有一等品、二等品、三等品分别为1900,6500,1600件, 故利润估计为1900 X 10+ 6500X 6+ 1600 X 2 = 61200 元.(3) 因为在产品质量指标值M的频率分布直方图中,质量指标值M<90的频率为0.06+ 0.1 + 0.2= 0.36<0.5,质量指标值M<100 的频率为0.06+ 0.1 + 0.2+ 0.3= 0.66>0.5,C A C故质量指标值M 的中位数估计值为90+ . ~03 94.67.热点3线性回归分析与独立性检验方法结论V1.线性回归方程AAA方程y =b x + a 称为线性回归方程,利用最小二乘法估计公式中的斜率和截距n AKx i y i— n xy A _ A ___分别为b 」一n, a = y — b —X ,其中(x , V)是样本点的中心,且回归直S2 — 2X i — n x线恒过该点.2.独立性检验根据2 X 2列联表,计算随机变量 K 2=2詈芝++詈+—+d (K 2也可以表示为気,当厶诃1时,则有95%的把握说两个事件有关;当K 2>6.635时,则有99%的把握说两个事件有关.具体参考 数据如下表:【题型分析】1. 某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五 年的储蓄存款(年底余额),如下表1:表1为了研究计算的方便,工作人员将上表的数据进行了处理, t 二x — 2012, z = y—5得到下表2:(1)求z关于t的线性回归方程;⑵通过⑴中的方程,求出y关于x的回归方程;⑶用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?A A A(附:对于线性回归方程y = b x + a ,n人着x i y i — nxy 人 _ 人_其中 b = -------- — , a =_y — b _X)占x f — n _X 2__55解 (1) t = 3, z = 2.2, ^t i z = 45,若t f = 55,AAa = z —b 7 = 2.2— 3X 1.2=— 1.4,A所以 z = 1.2t — 1.4.A(2) 将 t =x — 2012, z = y — 5,代入z = 1.2t — 1.4,A得 y — 5= 1.2(x — 2012)— 1.4,即y = 1.2x — 2410.8.A(3) 因为 y = 1.2 X 2022 — 2410.8= 15.6,所以预测到2022年年底,该地储蓄存款额可达15.6千亿元. 2. (2019全国卷I )某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1) 分别估计男、女顾客对该商场服务满意的概率;(2) 能否有95%的把握认为男、女顾客对该商场服务的评价有差异?2附:K 2=——nad 二匹5 -----------------(a + b '(c + d [a + c(b + d jP(K !>A O )①050 6 010 0+ 0013・ 841& 63510. 828解(1)由调查数据,男顾客中对该商场服务满意的比率为 50=0.8,因此男顾客对该商场服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为 |0= 0.6,因此女顾客对该商场服务满意45 — 5X 3X 2.2 55— 5X 9 1.2,的概率的估计值为062⑵K2的观测值k=100X(40X20 —30X 10)〜450X 50X 70 X 30 &4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差日异・【通法指导】I1・线性回归模型是回归模型中的核心问题,判断两个变量是否线性相关及相关程度通常有两种方法:一是根据散点图直观判断;二是将相关数据代入相关系数公式求出r,然后根据r的大小进行判断.A A2•求线性回归直线的关键:一是根据公式准确计算出b, a的值;二是抓住样本点的中心(—,—)必在回归直线上.3•求解独立性检验问题时要注意:一是2X2列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到K1 2之后的结论,即K2的观测值k越大, 对应假设事件H。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2020年高考文科数学《概率与统计》题型归纳与训练【题型归纳】题型一古典概型例1 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为().A. 15B. 25C. 825D.925【答案】B【解析】可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有:(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有10种选法,其中只有前4种是甲被选中,所以所求概率为42105=.故选B.例2 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________.【答案】23【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语; 数1,语,数2;数2,数1,语; 数2,语,数1;语,数2,数1; 语,数1,数2共有6种,其中2本数学书相邻的有4种,则其概率为:4263p==.【易错点】列举不全面或重复,就是不准确【思维点拨】直接列举,找出符合要求的事件个数. 题型二 几何概型例 1 如图所示,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( ).A.14 B. π8 C. 12 D. π4【答案】B【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为822122ππ=⎪⎭⎫⎝⎛⨯⨯a a .故选B.例2 在区间[0,5]上随机地选择一个数p ,则方程22320x px p 有两个负根的概率为________. 【答案】32【解析】方程22320x px p 有两个负根的充要条件是2121244(32)020320p p x x p x x p ⎧∆=--≥⎪+=-<⎨⎪=->⎩即21,3p <≤或2p ≥,又因为[0,5]p ∈,所以使方程22320x px p 有两个负根的p 的取值范围为2(,1][2,5]3,故所求的概率2(1)(52)23503-+-=-,故填:32.D【易错点】“有两个负根”这个条件不会转化.【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参数p 的范围.在利用几何概型的计算公式计算即可. 题型三 抽样与样本数据特征例1 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 ________件.【答案】18【解析】按照分层抽样的概念应从丙种型号的产品中抽取60300181000⨯=(件). 例2 已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】 因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,又样本数据121x +,221x +,⋅⋅⋅,21n x +的和为()122n x x x n ++++,所以样本数据的均值为21x +=11.例3 某电子商务公司对10000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.30.9],内,其频率分布直方图如图所示. (1)直方图中的a = .(2)在这些购物者中,消费金额在区间[0.50.9],内的购物者的人数为 .a/万元【答案】3⨯=a=人数为0.6100006000【解析】由频率分布直方图及频率和等于1,可得a=.⨯+⨯+⨯+⨯+⨯+⨯=,解之得30.20.10.80.1 1.50.120.1 2.50.10.11a于是消费金额在区间[]⨯+⨯+⨯+⨯=,0.50.9,内频率为0.20.10.80.120.130.10.6所以消费金额在区间[]⨯=.0.50.9,内的购物者的人数为0.6100006000例4 某城市100户居民的月平均用电量(单位:度),以[)180,200,160,180,[) [)280,300分组的频率分布直方图如图260,280,[]200,220,[)220,240,[)240,260,[)所示./度(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[)220,240的用户中应抽取多少户? 【答案】见解析【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 得0.0075x =.(2)由图可知,月平均用电量的众数是2202402302+=. 因为()0.0020.00950.011200.450.5++⨯=<, 又()0.0020.00950.0110.0125200.70.5+++⨯=>, 所以月平均用电量的中位数在[)220,240内.设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=, 得224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=(户); 月平均用电量为[)240,260的用户有0.00752010015⨯⨯=(户); 月平均用电量为[)260,280的用户有0.0052010010⨯⨯=(户);月平均用电量为[]280,300的用户有0.0025201005⨯⨯=(户). 抽取比例为11125151055=+++,所以从月平均用电量在[)220,240的用户中应抽取12555⨯=(户). 【易错点】没有读懂题意,计算错误.不会用函数思想处理问题【思维点拨】根据题意分情况写出函数解析式;2牵涉到策略问题,一般可以转化为比较两个指标的大小. 题型四 回归与分析例1下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图y年生活垃圾无害化处理量年份代码t(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:719.32i i y ==∑,7140.17i i i t y ==∑0.55= 2.646≈.参考公式:相关系数()()niit t y y r --=∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,=.a y bt -【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得4t =,()27128i i t t =-=∑,0.55=,()()77711140.1749.32 2.89iii iii i i t t y y t y t y===--=-=-⨯=∑∑∑, 2.890.990.552 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(1)变量y 与t 的相关系数7777()()7iii i i it t y y t y t y r ---⋅==∑∑∑∑,又7128i i t ==∑,719.32i i y ==∑,7140.17i i i t y ==∑5.292==0.55=,所以740.17289.320.997 5.2920.55r ⨯-⨯=≈⨯⨯ ,故可用线性回归模型拟合变量y 与t 的关系.(2)4t=,y =7117i i y =∑,所以7172211740.17749.327ˆ0.10287i ii ii t y t yb tt ==-⋅-⨯⨯⨯===-∑∑, 1ˆˆ9.320.1040.937ay bx =-=⨯-⨯≈,所以线性回归方程为ˆ0.10.93y t =+. 当9t =时,ˆ0.190.93 1.83y=⨯+=.因此,我们可以预测2016年我国生活垃圾无害化处理1.83亿吨.【易错点】没有读懂题意,计算错误.【思维点拨】将题目的已知条件分析透彻,利用好题目中给的公式与数据. 题型五 独立性检验例1 甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A 、B 两变量更强的线性相关性?( )A .甲B .乙C .丙D .丁 【答案】D【解析】 D 因为r>0且丁最接近1,残差平方和最小,所以丁相关性最高【易错点】不理解相关系数和残差平方和与相关性的关系【思维点拨】相关系数r的绝对值越趋向于1,相关性越强.残差平方和m越小相关性越强【巩固训练】题型一古典概型1.将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是.【答案】56【解析】将先后两次点数记为(),x y,则基本事件共有6636⨯=(个),其中点数之和大于等于10有()()()()()()4,6,5,5,5,6,6,4,6,5,6,6,共6种,则点数之和小于10共有30种,所以概率为305366=.2.我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是().A.112B.114C.115D.118【答案】C【解析】不超过30的素数有2、3、5、7、11、13、17、19、23、29,共10个,随机选取两数有45(种)情况,其中两数相加和为30的有7和23,11和19,13和17,共3种情况,根据古典概型得314515P==.故选C.3.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为 . 【答案】56P =【解析】1只白球设为a ,1只红球设为b ,2只黄球设为c ,d , 则摸球的所有情况为(),a b ,(),a c ,(),a d ,(),b c ,(),b d ,(),c d ,共6件, 满足题意的事件为(),a b ,(),a c ,(),a d ,(),b c ,(),b d ,共5件,故概率为56P =.题型二 几何概型1.某公司的班车在7:00,8:00,8:30发车,学.小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( ).A .13B .12C .23D .34【答案】B【解析】 如图所示,画出时间轴.D C A小明到达的时间会随机的落在图中线段AB 中,而当他的到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10分钟.根据几何概型,所求概率10101402P +==.故选B .2. 从区间[]0,1随机抽取2n 个数1x ,2x ,…,n x ,1y ,2y ,…,n y ,构成n 个数对()11,x y ,()22,x y ,…,(),n n x y ,其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为( ).A .4n mB .2n mC .4m nD .2m n【答案】C【解析】由题意得:()()12i i x y i n =⋅⋅⋅,,,,在如图所示方格中,而平方和小于1的点均在如图所示的阴影中,由几何概型概率计算公式知π41m n=,所以4πmn =.故选C .3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC ,ABC △的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为1p ,2p ,3p ,则 A .12p p = B .13p p = C .23p p = D .123p p p =+【答案】A【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可.设直角三角形ABC 的三个角A ,B ,C 所对的边长分别为a ,b ,c ,则区域Ⅰ的面积为112S ab =,区域Ⅱ的面积为222211111111πππ22222222S c b ab a ab ⎛⎫⎛⎫⎛⎫=++-= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭, 区域Ⅲ的面积为22231111111πππ2222282S c b ab a ab ⎛⎫⎛⎫=+-=- ⎪ ⎪⎝⎭⎝⎭. 显然12p p =.故选A .题型三 抽样与样本的数据特征1.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为 . 【答案】10【解析】平均数()146587666x =+++++=.2.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (Ⅰ)直方图中的a =_________;(Ⅱ)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为_________.【答案】3;6000【解析】频率和等于1可得0.20.10.80.1 1.50.120.1 2.50.10.11a ⨯+⨯+⨯+⨯+⨯+⨯=,解之得3⨯+⨯+⨯+⨯=,a=.于是消费金额在区间[0.5,0.9]内频率为0.20.10.80.120.130.10.6所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6100006000⨯=,故应填3;6000.3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨)、一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)4,4.5分成9组,制成了如图所示的频率分布直方图.0.5,1,⋅⋅⋅,[)0,0.5,[)(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,请说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.【答案】见解析⨯=,【解析】(1)由频率分布直方图知,月均用水量在[),中的频率为0.080.50.0400.5同理,在[),,[),中的频率分别为0.08,33.544.53.54,,[),,[)0.5,1,[)1.5,2,[)22.50.20,0.26,0.06,0.04,0.02.a=.由0.04+0.08+0.50.200.260.50.060.040.021⨯+++⨯+++=,解得0.30a a(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为3000000.1236000⨯=.(3)因为前6组的频率之和为0.040.080.150.200.260.15=0.880.85----->, 而前5组的频率之和为0.04+0.08+0.150.200.26=0.730.85--<,所以2.5 3.x < 由()0.3 2.50.850.73x ⨯-=-,解得 2.9x =. 题型四 回归与分析1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元 【答案】B【解析】由已知得8.28.610.011.311.9105x ++++==(万元),6.27.58.08.59.885y ++++==(万元),故ˆ80.76100.4a =-⨯=, 所以回归直线方程为ˆ0.760.4y x =+.当社区一户收入为15万元,家庭年支出为 ˆ0.7615y=⨯+0.411.8=(万元).故选B .2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为( ).A . 160B . 163C . 166D .170 【答案】C 【解析】 22.5x =,160y =,所以160422.570a =-⨯=,24x =时,42470166y =⨯+=.故选C .3.某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋅⋅⋅数据作了初步处理,得到下面的散点图及一些统计量的值.年宣传费/千元表中i w =8118i i w w ==∑,(1)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)? (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系式为0.2z y x =-,根据(2)的结果回答下列问题:(ⅰ)年宣传费49x =时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()11,u v ()22,u v ,⋅⋅⋅,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 【答案】见解析【解析】(1)由散点图变化情况可知选择y c =+较为适宜.(2)由题意知()()()81821108.8681.6iii ii w w y y d w w ==--===-∑∑.又y c =+一定过点(),y ω,所以c y d ω=-=56368 6.8100.6-⨯=, 所以y 与x的回归方程为100.6y =+(3)(ⅰ)由(2)知,当49x =时,()100.668576.6t y =+=, 0.2576.649z =⨯-=66.32(千元), 所以当年宣传费为49x =时,年销售量为()576.6t ,利润预估为66.32千元. (ⅱ)由(2)知,(0.20.2100.6z y x x =-=+-=x +20.12=)226.8 6.820.12-++6.8时,年利润的预估值最大,即26.846.24x ==(千元). 题型五 独立性检验1.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H :“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的K 2≈3.918,则下列表述中正确的是( )A .有95℅的把握认为“这种血清能起到预防感冒的作用”B .若有人未使用该血清,那么他一年中有95℅的可能性得感冒C .这种血清预防感冒的有效率为95℅D .这种血清预防感冒的有效率为5℅ 【答案】A【解析】由题可知,在假设H 成立情况下,)841.3(2≥K P 的概率约为0.05,即在犯错的概率不错过0.05的前提下认为“血清起预防感冒的作用”,即有95℅的把握认为“这种血清能起到预防感冒的作用”.这里的95℅是我们判断H 不成立的概率量度而非预测血清与感冒的几率的量度,故B 错误.C ,D 也犯有B 中的错误.故选A 2.观察下面频率等高条形图,其中两个分类变量x y ,之间关系最强的是( )A .B .C .D . 【答案】D【解析】在频率等高条形图中,a ab +与cc d+相差很大时,我们认为两个分类变量有关系,四个选项中,即等高的条形图中12,x x 所占比例相差越大,则分类变量,x y 关系越强,故选D .3.淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg )的频率分布直方图如图所示.频率频率组距箱产量/kg新养殖法旧养殖法箱产量/kg(1)设两种养殖方法的箱产量相互独立,记A 表示事件:旧养殖法的箱产量低于50kg , 新养殖法的箱产量不低于50kg ,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n ad bc K a b c d a c b d -=++++ .【答案】见解析【解析】(1)记:“旧养殖法的箱产量低于50kg ” 为事件B ,“新养殖法的箱产量不低于50kg ”为事件C ,由题图并以频率作为概率得()0.04050.03450.02450.01450.0125P B =⨯+⨯+⨯+⨯+⨯0.62=,()0.06850.04650.01050.0085P C =⨯+⨯+⨯+⨯0.66=,()()()0.4092P A P B P C ==.(2)由计算可得2K 的观测值为()222006266383415.70510010096104k⨯⨯-⨯==⨯⨯⨯,因为15.705 6.635>,所以()2 6.6350.001P K ≈≥,从而有99%以上的把握认为箱产量与养殖方法有关.(3)150.2÷=,()0.10.0040.0200.0440.032-++=,80.0320.06817÷=,85 2.3517⨯≈,50 2.3552.35+=,所以中位数为52.35.。

相关文档
最新文档