2020年高考——概率与统计函数主题的典型考题分析与考前复习方略
概率与统计高考常见题型解题思路及知识点总结
概率与统计高考常见题型解题思路及知识点总结一、解题思路(一)解题思路思维导图(二)常见题型及解题思路1.正确读取统计图表的信息典例1:(2017全国3卷理科3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图,根据该折线图,下列结论错误的是().A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月份D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 【解析】由题图可知,2014年8月到9月的月接待游客量在减少,则A 选项错误,选A.2.古典概型概率问题 典例2:(全国卷理科)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是 A.B.C.D.解:不超过30的素数有2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有种方法,因为,所以随机选取两个不同的数,其和等于30的有3种方法,故概率为,选C.典例3: (2014全国2卷理科5)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是 ( ) A. 0.8 B. 0.75 C. 0.6D. 0.45解:设某天空气质量优良,则随后一天空气质量也优良的概率为p,则据条件概率公式得p =0.60.75=0.8,故选A.3.几何概型问题典例4:(2016全国1卷理科4)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是 ( ) A.13 B.12C.23 D.34解:如图所示,画出时间轴:小明到达的时间会随机地落在图中线段AB 中,而当他到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10分钟,根据几何概型,所求概率P=101040+=12.选B.4.类似超几何分布的离散型随机变量分布列问题(古典概型求概率)5.类似二项分布的离散型随机变量分布列问题(频率估计概率,相互独立事件概率计算)典例5(超几何分布与二项分布辨析):某工厂为检验其所生产的产品的质量,从所生产的产品中随机抽取10件进行抽样检验,检测出有两件次品.(1)从这10件产品中随机抽取3件,其中次品件数为X ,求X 分布列和期望;(2)用频率估计概率,若所生产的产品按每箱100件装箱,从一箱产品中随机抽取3件,其中次品件数为Y ,求Y 分布列和期望;(3)用频率估计概率,从所生产的产品中随机抽取3件,其中次品件数为Z ,求Z 分布列和期望.分析:第(1)问中,抽取产品的总体N=10,所含次品件数M=2,都是明确的,所以该随机变量的分布为超几何分布。
2020高考数学压轴题——概率与统计高考常见题型解题思路及知识点总结
6.其他离散型随机变量分布列问题(频率估计概率,方案选择,随机变量取值意义,与其他知识结合)
解题思路及步骤
注意事项
写出随机变量可能取值
这类题重点考查是否理解随机变量取每一个值的意义
求出随机变量取每个值的概率 注意对随机变量所取的值表示多种的情况,多数情况由频率估计估计概率
写出分布列 求数学期望
检验所有概率之和是否等于 1 通过数学期望进行决策
PX
k
C2k
C 2k 8
C120
, (k
0,1,2) EX
,
3 2 10
0.6
(2)Y 的可能取值为 0,1,2,3,根据题意 Y~B(3,0.2),所以 Y 分布列为:
PY k C3k 0.2k 1 0.23k , (k 0,1,2,3) , EY 3 0.2 0.6
3
(3)Z 的可能取值为 0,1,2,3,根据题意 Z~B(3,0.2),所以 Z 分布列为:
,且各件产品是否为不合格品相互独立. (1)记 20 件产品中恰有 2 件不合格品的概率为 ,求 的最大值点 . (2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的 作为 的值.已知每件产品 的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每件不合格品支付 25 元的赔偿费用. (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求 ; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
法,故概率为
,选 C.
典例 3: (2014 全国 2 卷理科 5)某地区空气质量监测资料表明,一天的空气质量为优良的概率是 0.75,连续
两天为优良的概率是 0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是 ( )
2020高考数学(理)专项复习《概率统计》含答案解析
概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型,学习某些离散型随机变量分布列及其期望、方差等内容,初步学会利用离散型随机变量思想描述和分析某些随机现象的方法,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§11-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.6.条件概率与事件的独立性条件概率:一般的,设A 、B 为两个事件,且P (A )>0,称P (B |A )=)()(A P B A P I 为在事件A 发生的条件下,事件B 发生的概率.一般把P (B |A )读作“A 发生的条件下B 发生的概率”.在古典概型中,用n (A )表示事件A 中基本事件的个数,则有P (B |A )=)()(A n B A n I .事件的独立性:设A 、B 为两个事件,如果P (B |A )=P (B ),则称事件A 与事件B 相互独立,并称事件A 、B 为相互独立事件.若A 、B 为两个相互独立事件,则A 与A 、A 与B 、A 与B 也都相互独立.若事件A 与事件B 相互独立,则P (A ∩B )=P (A )·P (B ).【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.5.在具体情境中,了解条件概率,了解两个事件相互独立的概念及独立事件的概率乘法公式,并能解决一些简单的实际问题.【例题分析】例1(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)} 由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P(Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 一个口袋中装有大小相同的2个红球,3个黑球和4个白球,从口袋中一次摸出一个球,摸出的球不再放回.(1)连续摸球2次,求第一次摸出黑球,第二次摸出白球的概率;(2)连续摸球2次,在第一次摸到黑球的条件下,求第二次摸到白球的概率;(3)如果摸出红球,则停止摸球,求摸球次数不超过3次的概率.【分析】本题是一个古典概型问题,因为基本事件空间中所含基本事件的个数较多,宜用排列组合公式计算,当然也可利用两个计数原理计数.本题第二问是条件概率问题.做第三问时,要分为三个事件:“第一次摸到红球”,“第一次摸到不是红球,第二次摸到红球”,“前两次摸到不是红球,第三次摸到红球”,显然三个事件是互斥事件.解:(1)从袋中依次摸出2个球共有29A 种结果,第一次摸出黑球、第二次摸出白球有3×4=12种结果,则所求概率6112291==A P (或6184931=⨯=P ). (2)设“第一次摸到黑球”为事件A ,“第二次摸到白球”为事件B ,则“第一次摸到黑球,且第二次摸到白球”为事件A ∩B ,又31)(=A P ,P (A ∩B )61=,所以或⋅==213161)|(A B P (或2184)|(==A B P ). (3)第一次摸出红球的概率为1912A A ,第二次摸出红球的概率为291217A A A ,第三次摸出红球的概率为391227A A A ,则摸球次数不超过3次的概率为⋅=++=12739122729121719122A A A A A A A A P 【评析】利用古典概型求解时,求基本事件的个数和事件发生的总数时求法要一致,若无序则都无序,若有序则都有序,分子和分母的标准要相同.在求事件个数时常用列举法(画树状图、列表、坐标系法),有时也与排列组合联系紧密,计算时灵活多变,但要注意分类讨论,做到不重不漏.要正确识别条件概率问题,理解P (A),P (A ∩B ),P (B |A )的含义.例4 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例5 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }.所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.例6 如图,用A 、B 、C 三类不同的元件连结成两个系统N 1、N 2,当元件A 、B 、C 都正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,已知元件A 、B 、C 正常工作的概率为0.80、0.90、0.90,分别求系统N 1、N 2正常工作的概率.【分析】三个元件能否正常工作相互独立.当元件A 、B 、C 同时正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,而B 、C 至少有一个正常工作的概率可通过其对立事件计算.解:设元件A 、B 、C 正常工作为事件A 、B 、C ,则P (A )=0.8,P (B)=0.9,P (C)=0.9,且事件A 、B 、C 相互独立.(1)系统N 1正常工作的概率为p 1=P (A ·B ·C )=P (A )·P (B )·P (C )=0.80×0.90×0.90=0.648.(2)元件B 、C 至少有一个正常工作的概率为1-P (B ·C )=1-P (B )·P (C )=1-0.1×0.1=0.99,所以系统N 2正常工作的概率为p 2=P (A )·(1-P (B ·C ))=0.80×0.99=0.792.【评析】本题以串、并联为背景,重点在正确理解题意.在计算几个事件同时发生的概率时,要先判断各个事件之间是否相互独立.独立事件、互斥事件、对立事件的概率各有要求,要依据题目特点,巧妙地选用相关方法.例7 每次抛掷一枚质地均匀的骰子(六个面上分别标以数字1,2,3,4,5,6).(1)连续抛掷3次,求向上的点数之和为3的倍数的概率;(2)连续抛掷6次,求向上的点数为奇数且恰好出现4次的概率.【分析】向上点数之和为3的倍数共有6种情况,计数时要不重不漏;向上点数为奇数的概率为21,连续抛掷6次是独立重复试验. 解:(1)向上的点数之和为3的结果有1种情况,为6的结果共10种情况,为9的结果共25种情况,为12的结果共25种情况,为15的结果共10种情况,为18的结果共1种情况.所以⋅=⨯⨯+++++=3166611025251012P(2)因为每次抛掷骰子,向上的点数为奇数的概率为P =21, 根据独立重复试验概率公式有⋅==⋅⋅6415)21()21(24463C P 【评析】独立重复试验是一类重要的概率问题,要善于分析模型的特点,正确合理的解题.例8 某学校进行交通安全教育,设计了如下游戏,如图,一辆车模要直行通过十字路口,此时前方交通灯为红灯,且该车模前面已有4辆车模依次在同一车道上排队等候(该车道只可以直行或左转行驶).已知每辆车模直行的概率是53,左转行驶的概率是52,该路口红绿灯转换间隔时间均为1分钟.假设该车道上一辆直行去东向的车模驶出停车线需要10秒钟,一辆左转去北向的车模驶出停车线需要20秒钟,求:(1)前4辆车模中恰有2辆车左转行驶的概率;(2)该车模在第一次绿灯亮起时的1分钟内通过该路口的概率(汽车驶出停车线就算通过路口).【分析】该车模1分钟内通过路口包含2种情况:4辆车都直行,3辆车直行1辆车左转.解:(1)设前4辆车模中恰有2辆左转行驶为事件A ,则⋅=⨯=625216)52()53()(2224C A P (2)设该车在第一次绿灯亮起时的1分钟内通过该路口为事件B ,其中4辆车模均 直行通过路口为事件B 1,3辆直行1辆左转为事件B 2,则事件B 1、B 2互斥.=+=+=)()()()(2121B B P B B P B P ⋅=⨯+62529752)53()53(334444C C 【评析】善于从复杂的背景中发现线索,体会其实质.善于转化问题的叙述,恰当的分类.练习11-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.独立工作的两套报警系统遇危险报警的概率均为0.4,则遇危险时至少有一套报警系统报警的概率是( )A .0.16B .0.36C .0.48D .0.644.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题5.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.6.设每门高射炮命中飞机的概率都是0.6.今有一敌机来犯,要有99%的把握击中敌机,至少需要______门高射炮.7.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.8.一个口袋中有4个白球,2个黑球.有放回的取出3个球,如果第一次取出的是白球,则第三次取出的是黑球的概率为______;不放回的取出3个球,在第一次取出的是白球的条件下,第二次取出的是黑球的概率为______.三、解答题9.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.10.某个高中研究性学习小组共有9名学生,其中有3名男生和6名女生.在研究学习过程中,要进行两次汇报活动(即开题汇报和结题汇报),每次汇报都从这9名学生中随机选1人作为代表发言.设每人每次被选中与否均互不影响;(1)求两次汇报活动都是由小组成员甲发言的概率;(2)求男生发言次数不少于女生发言次数的概率.11.3名志愿者在10月1日至10月5日期间参加社区服务工作,若每名志愿者在这5天中任选两天参加社区服务工作,且各名志愿者的选择互不影响.求(1)这3名志愿者中在10月1日都参加社区服务工作的概率;(2)这3名志愿者中在10月1日至多有1人参加社区服务工作的概率.§11-2 概率(二)【知识要点】1.离散型随机变量及其分布列随机变量:如果随机试验的可能结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化的,我们把这样的变量X 叫做一个随机变量.如果随机变量X 的所有可能的取值都能一一列举出来,则称X 为离散型随机变量.离散型随机变量的分布列:设离散型随机变量X 的可能取值为x 1,x 2,…,x n ,X 取到i i ii 12+…+p n =1.离散型随机变量在某个范围取值的概率等于它取这个范围内各个值的概率和.其中0<p <1,q =1-,则称离散型随机变量服从参数为p 的二点分布.二项分布:一般的,在相同条件下重复地做n 次试验,各次试验的结果相互独立,称为n 次独立重复试验.在n 次独立重复试验中,事件A 恰好发生k 次的概率为==)(k X P k n k k n q p C -(其中p 为在一次试验中事件A 发生的概率,q =1-p ,k =0,1,…,n ).若将n次独立重复试验中事件A 发生的次数设为X ,则X 的分布列为超几何分布:一般的,设有总数为N 件的两类物品,其中一类有M 件,从所有物品中任取n 件(n ≤N ),这n 件中所含这类物品件数X 是一个离散型随机变量,它取值为m 时的概率为m C C C m X P n Nm n M N m M ≤==--0()(≤l ,其中l 为n 和M中较小的一个).我们称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X 服从参数为N 、M 、n 的超几何分布.2.随机变量的数字特征及正态分布1122i i n n 了离散型随机变量的平均取值水平.称i i n i p X E xX D ⋅-=∑=21))(()(为随机变量X 的方差,它反映了离散型随机变量X 相对于期望的平均波动大小(或说离散程度),其算数平方根)(X D 为随机变量X 的标准差,记作σ (X ),方差(或标准差)越小表明X 的取值相对于期望越集中,否则越分散.均值与方差的性质:①E (aX +b )=aE (X )+b ②D (aX +b )=a 2D (X )若X 服从两点分布,则E (X )=p ,D (X )=pq ;若X ~B (n ,p ),则E (X )=np ,D (X )=npq . 正态曲线:函数),((21)(222)(+∞∝-∈=--x e x x σμσπϕ,其中μ ∈R ,σ >0)的图象为正态分布密度曲线,简称正态曲线.其特点有:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,关于x =μ 对称;③曲线在x =μ 处达到峰值σ2π1;④曲线与x 轴之间的面积为1;⑤当σ 一定时,曲线随着μ 的变化而沿x 轴平移;⑥当μ 一定时,曲线的形状由σ 决定.σ 越小,曲线越“瘦高”,表示总体的分布越集中;σ 越大,曲线越“矮胖”,表示总体的分布越分散.正态分布:如果对于任意实数a <b ,随机变量X 满足=≤<)(b X a P dx x ba )(ϕ⎰,则称X 的分布为正态分布;随机变量X 服从参数μ 、σ 的正态分布,记作N ~(μ ,σ 2).正态分布的三个常用数据:①P (μ -σ <X <μ +σ )=68.3%;②P (μ -2σ <X <μ +2σ )=95.4%;③P (μ -3σ <X <μ +3σ )=99.7%.【复习要求】①在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性.②通过实例,理解超几何分布及其导出过程,并能进行简单的应用.③通过实例,理解n 次独立重复试验的模型及二项分布,并能解决一些简单的实际问题. ④通过实例,理解取有限值的离散型随机变量期望、方差的概念,能计算简单离散型随机变量的期望、方差,并能解决一些实际问题.⑤通过实际问题,认识正态分布曲线的特点及曲线所表示的意义.【例题分析】例1 一袋中装有编号为1、2、3、4、5、6的6个大小相同的小球,现从中随机取出3个球,以X 表示取出球的最大号码,(1)求X 的分布列;(2)求X >4的概率;(3)求E (X ).【分析】随机变量X 可能取的值为3、4、5、6,应用古典概型求得X 取每一个值的概率,就可以写出分布列.解:(1)随机变量X 可能取的值为3、4、5、6,且,203)4(,2011)3(362336======C C X P C X P 3624)5(C C X P ==103206==,212010)6(3625====C C X P ,所求X 的分布列为(2)==+==>)6()5()4(X P X P X P ⋅54 (3).25.5216103520342013)(=⨯+⨯+⨯+⨯=X E 【评析】离散型随机变量的分布列反映了一次试验的所有可能结果(X 的所有可能取值),以及取得每个结果(X 的每一个值)的概率.书写分布列首先要根据具体情况正确分析X 可取的所有值,然后利用排列组合及概率的有关知识求得每个x i 所对应的概率p i ,最后列成表格.要注意不同的X 值所对应的事件之间是互斥的,求离散型随机变量在某一范围的概率等于它取这个范围内各个值的概率和.例2 袋中装有大小相同的5个红球、5个白球,现从中任取4个球,其中所含红球的个数为X ,写出X 的分布列,并求X 的期望.【分析】袋中共有10个球,从中任取4个,所含红球的个数为0、1、2、3、4,每个事件的概率可以利用古典概型求解.解:随机变量X 可取的值有0、1、2、3、4,)0(=X P =,42121054104505==⋅C C C )1(=X P =215210504103515==⋅C C C ,)2(=X P 21102101004102525===⋅C C C ,===⋅4101535)3(C C C X P 21050 215=,4212105)4(4100545==⋅==C C C X P , 分布列为2424213212211420)(=⨯+⨯-+⨯+⨯+⨯=X E 【评析】本题的随机变量X 服从参数为N ,M ,n 的超几何分布,其中N =10,M =5,n =4.例3 某人练习射击,每次击中目标的概率为31. (1)用X 表示击中目标的次数.①若射击1次,求X 的分布列和期望;②若射击6次,求X 的分布列和期望;(2)若他连续射击6次,设ξ为他第一次击中目标前没有击中目标的次数,求ξ的分布列;(3)他一共只有6发子弹,若击中目标,则不再射击,否则子弹打完为止,求他射击次数η 的分布列.【分析】射击问题常被看做是独立重复试验.ξ的取值为0到6,η 的取值为1到6. 解:(1)①X 服从二点分布⋅=31)(X E ②X 服从二项分布)6,,1,0()2()1()(),1,6(~66Λ===-k C k X P B k k k ,分布列为.236)(=⨯=X E (2)ξ的取值为0到6,ξ=k (k =0,1,…,5)表示第k +1次击中目标,前k 次都没击中目标,则P (ξ=k )=)5,,1,0(31)32(.Λ=k k ,ξ=6表示射击6次都未击中目标,==)6(ξP6)2(.ξ的分布列为(3)η 的取值为1到6.η =k (k =1,2,…,5)表示第k 次时第一次击中目标,==)(k P η 6;1)2(.1=-ηk 表示前5次都没有击中目标,5)2()6(==ξP .η 的分布列为“X =k ”.在计算满足二点分布和二项分布的随机变量的期望和方差时,可直接应用公式计算.例4 甲乙两名射手在一次射击中的得分为两个相互独立的随机变量X 和Y ,且X 和Y 的分布列为计算X 和Y 【分析】先由分布列所提供的数据用期望和方差公式计算,再根据实际意义作出分析. 解:E (X )=8.85,D (X )=2.2275;E (Y )=5.6,D (Y )=10.24.由于E (X )>E (Y ),说明甲射击的平均水平比乙高;由于D (X )<D (Y ),说明甲射击的环数比较集中,发挥比较稳定,乙射击的环数比较分散,技术波动较大,不稳定,由此可以看出甲比乙的技术好.【评析】正确记忆期望和方差的公式,在分布列中,期望是每个变量乘以它所对应的概率再相加,求方差要先求期望,再作差、平方、乘以相应概率再相加.科学对待计算结果,正确分析数据所表达的实际意义.例5 设b 和c 分别是先后抛掷一枚骰子得到的点数,用随机变量ξ表示方程x 2+bx +c =0实根的个数(重根按一个计).(1)求方程x 2+bx +c =0有实根的概率;(2)求在先后两次出现的点数中有5的条件下,方程x 2+bx +c =0有实根的概率;(3)若η =2ξ+1,求ξ、η 的数学期望和方差;【分析】本题概率问题是古典概型,要分别求出事件中所含元素的个数,第一问事件“二次方程有实根”等价于“∆=b 2-4c ≥0”,b 、c 的值都取自{1,2,3,4,5,6};第二问是条件概率问题;第三问先求ξ的期望和方差,再由公式求η 的期望和方差.解:(1)由题意知:设基本事件空间为Ω,记“方程x 2+bx +c =0没有实根”为事件A ,“方程x 2+bx +c =0有且仅有一个实根”为事件B ,“方程x 2+bx +c =0有两个相异实数”为事件C ,Ω中基本事件总数为36个,A 中的基本事件总数为17个,B 中的基本事件总数为2个,C 中的基本事件总数为17个.又因为B ,C 是互斥事件,故所求概率⋅=+=+=36193617362)()(C B B P P (2)记“先后两次出现的点数中有5”为事件D ,“方程x 2+bx +c =0有实数”为事件E ,由上面分析得D P D P (,3611)(=∩367)=E ,∴⋅==117)()()|(D P E D P D E P I (Ⅱ)由题意ξ的可能取值为0,1,2,则,3617}2{,181}1{,3617}0{======&ξξξP P P 故ξ的分布列为:所以.18173617·)12(181·)11(3617·(0-0-,136172181136170222=-+-+==⨯+⨯+⨯=ξξD E 9342)12(,312)12(2==+==+=+=ξξξξηηD D D E E E 【评析】本题是一道概率的综合题,由07山东卷改编而得.在古典概型中解决条件概率问题时,概率公式是=)|(A B P )()()()(A n B A n A P B A P I I =.具有线性关系的两个随机变量的期望和方差之间的关系是b X aE b aX E +=+)()(,)()(2X D a b aX D =+.例6 (1)设两个正态分布N (μ 1,21σ)(σ 1>0)和N (μ 2,22σ)(σ 2>0)的密度函数图象如图所示.则有( )。
【高考冲刺】2020年高考数学(理数) 概率与统计 大题(含答案解析)
【高考复习】2020年高考数学(理数) 概率与统计大题1.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机下单和支付.出门不带现金的人数正在迅速增加.中国人民大学和法国调查公司益普索(Ipsos)合作,调查了腾讯服务的6 000名用户,从中随机抽取了60名,统计他们出门随身携带的现金(单位:元)如茎叶图所示,规定:随身携带的现金在100元以下的为“淡定族”,其他为“非淡定族”.(1)根据上述样本数据,列出2×2列联表,判断是否有75%的把握认为“淡定族”与“性别”有关?(2)用样本估计总体,若从腾讯服务的用户中随机抽取3人,设这3人中“淡定族”的人数为随机变量ξ,求随机变量ξ的概率分布列及数学期望.参考公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.参考数据:2.第四届世界互联网大会在浙江乌镇隆重召开,人工智能技术深受全世界人民的关注,不同年龄段的人群关注人工智能技术应用与发展的侧重点有明显的不同,某中等发达城市的市场咨询与投资民调机构在该市对市民关注人工智能技术应用与发展的侧重方向进行调查,随机抽取1 000名市民,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],并绘制了如图所示的频率分布直方图.(1)求这 1 000名市民年龄的平均数和中位数(同一组中的数据用该组区间的中点值作代表);(2)调查发现年龄在[20,40)的市民侧重关注人工智能技术在学习与工作方面的应用与发展,其中关注智能办公的共有100人,将样本的频率视为总体的频率,从该市年龄在[20,40)的市民中随机抽取300人,请估计这300人中关注智能办公的人数;(3)用样本的频率代替概率,现从该市随机抽取20名市民调查关注人工智能技术在养老服务方面的应用与发展的情况,其中有k名市民的年龄在[60,80]的概率为P(X=k),其中k=0,1,2,…,20,当P(X=k)最大时,求k的值.3.某校高三年级有500名学生,一次考试的英语成绩服从正态分布N(100,17.52),数学成绩的频率分布直方图如下:(1)如果成绩高于135分的为特别优秀,则本次考试英语、数学成绩特别优秀的学生大约各多少人?(2)试问本次考试英语和数学的平均成绩哪个较高,并说明理由;(3)如果英语和数学两科成绩都特别优秀的共有6人,从(1)中的这些学生中随机抽取3人,设3人中两科成绩都特别优秀的有ξ人,求ξ的分布列和数学期望.参考公式及数据:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.68,P(μ-2σ<X≤μ+2σ)=0.96,P(μ-3σ<X≤μ+3σ)=0.99.4.已知具有相关关系的两个变量x ,y 的几组数据如下表所示:(1)请根据上表数据在网格纸中绘制散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^,并估计当x=20时y 的值;(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y-4=0右下方的点的个数为ξ,求ξ的分布列以及期望.参考公式:b ^=∑i=1nx i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.5.某知名品牌汽车深受消费者喜爱,但价格昂贵.某汽车经销商推出A,B,C三种分期付款方式销售该品牌汽车,并对近期100位采用上述分期付款方式付款的客户进行统计分析,得到柱状图如图所示.已知从A,B,C三种分期付款销售中,该经销商每销售此品牌汽车1辆所获得的利润分别是1万元、2万元、3万元.现甲、乙两人从该汽车经销商处,采用上述分期付款方式各购买此品牌汽车一辆.以这100位客户所采用的分期付款方式的频率估计1位客户采用相应分期付款方式的概率.(1)求甲、乙两人采用不同分期付款方式的概率;(2)记X(单位:万元)为该汽车经销商从甲、乙两人购车中所获得的利润,求X的分布列与期望.6.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万元)的数据如下:(1)若用线性回归模型拟合y 与x 的关系,求出y 关于x 的线性回归方程;(2)若用y=c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别约为0.75和0.88,请用R 2说明选择哪个回归模型更好;(3)已知利润z 与x ,y 的关系为z=200y-x.根据(2)的结果回答下列问题:①广告费x=20时,销售量及利润的预报值是多少?②广告费x 为何值时,利润的预报值最大?(精确到0.01)参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b ^=∑i=1n x i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.参考数据:5≈2.24.7.通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:(1)将题中的2×2列联表补充完整;(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由;(3)如果按性别进行分层抽样,从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派3人参加某项校际挑战赛,记选出3人中的女大学生人数为X,求X的分布列和数学期望.附:K2=n ad-bc2a+b c+d a+c b+d.8.甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率;(2)若将频率视为概率,回答下列两个问题:①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.9.近年来“双十一”已成为中国电子商务行业的年度盛事,并且逐渐影响到国际电子商务行业.某商家为了准备2018年“双十一”的广告策略,随机调查了1 000名客户在2017年“双十一”前后10天内网购所花时间T(单位:时),并将调查结果绘制成如图所示的频率分布直方图.由频率分布直方图可以认为,这10天网购所花的时间T近似服从N(μ,σ2),其中μ用样本平均值代替,σ2=0.24.(1)计算μ,并利用该正态分布求P(1.51<T<2.49).(2)利用由样本统计获得的正态分布估计整体,将这10天网购所花时间在(2,2.98)小时内的人定义为目标客户,对目标客户发送广告提醒.现若随机抽取10 000名客户,记X为这10 000人中目标客户的人数.(ⅰ)求EX;(ⅱ)问:10 000人中目标客户的人数X为何值的概率最大?附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4,P(μ-3σ<Z<μ+3σ)=0.997 4.0.24≈0.49.10.某学校为了丰富学生的课余生活,以班级为单位组织学生开展古诗词背诵比赛,随机抽取一首,背诵正确加10分,背诵错误减10分,且背诵结果只有“正确”和“错误”两种.其中某班级学生背诵正确的概率p=23,记该班级完成n 首背诵后的总得分为S n . (1)求S 6=20且S i ≥0(i =1,2,3)的概率;(2)记ξ=|S 5|,求ξ的分布列及数学期望.答案解析1.解:(1)依题意可得2×2列联表如下:K 2=60×10×12-30×8218×42×40×20≈1.429>1.323,故有75%的把握认为“淡定族”与“性别”有关.(2)用样本估计总体,用户中为“淡定族”的概率为1860=310,ξ的可能取值为0,1,2,3,由题意,得到ξ~B ⎝ ⎛⎭⎪⎫3,310, P(ξ=k)=C k 3⎝ ⎛⎭⎪⎫310k ⎝ ⎛⎭⎪⎫7103-k,k=0,1,2,3,随机变量ξ的分布列为故随机变量ξ的数学期望E(ξ)=0×3431 000+1×4411 000+2×1891 000+3×271 000=9001 000=910.2.解:(1)由频率分布直方图可知,抽取的1 000名市民年龄的平均数 x -=25×0.05+35×0.1+45×0.2+55×0.3+65×0.25+75×0.1=54(岁). 设1 000名市民年龄的中位数为x ,则0.05+0.1+0.2+0.03×(x -50)=0.5,解得x=55, 所以这1 000名市民年龄的平均数为54,中位数为55.(2)由频率分布直方图可知,这1 000名市民中年龄在[20,40)的市民共有 (0.05+0.10)×1 000=150人,所以关注智能办公的频率为100150=23,则从该市年龄在[20,40)的市民中随机抽取300人,这300人中关注智能办公的人数为300×23=200.故估计这300人中关注智能办公的人数为200.(3)设在抽取的20名市民中,年龄在[60,80]的人数为X ,X 服从二项分布, 由频率分布直方图可知,年龄在[60,80]的频率为(0.025+0.010)×10=0.35,所以X ~B(20,0.35),所以P(X=k)=C k 200.35k (1-0.35)20-k,k=0,1,2, (20)设t=P X =k P X =k -1=C k 200.35k 0.6520-kC k -1200.35k -10.6521-k =721-k 13k ,k=1,2,…,20. 若t>1,则k<7.35,P(X=k-1)<P(X=k); 若t<1,则k>7.35,P(X=k-1)>P(X=k). 所以当k=7时,P(X=k)最大, 即当P(X=k)最大时,k 的值为7.3.解:(1)因为英语成绩服从正态分布N(100,17.52),所以英语成绩特别优秀的概率P 1=P(X≥135)=(1-0.96)×12=0.02,由频率估计概率,得数学成绩特别优秀的概率P 2=0.001 6×20×34=0.024,所以英语成绩特别优秀的学生大约有500×0.02=10(人), 数学成绩特别优秀的学生大约有500×0.024=12(人). (2)本次考试英语的平均成绩为100分,数学的平均成绩为60×0.16+80×0.168+100×0.48+120×0.16+140×0.032=94.72(分),因为94.72<100,所以本次考试英语的平均成绩较高.(3)英语和数学成绩都特别优秀的有6人,则单科成绩特别优秀的有10人, ξ可取的值有0,1,2,3,所以P(ξ=0)=C 310C 316=314,P(ξ=1)=C 210C 16C 316=2756,P(ξ=2)=C 110C 26C 316=1556,P(ξ=3)=C 36C 316=128,故ξ的分布列为E(ξ)=0×314+1×2756+2×1556+3×128=98.4.解:(1)散点图如图所示:(2)依题意,x -=15×(2+4+6+8+10)=6,y -=15×(3+6+7+10+12)=7.6,∑i =15x 2i=4+16+36+64+100=220,∑i =15x i y i =6+24+42+80+120=272,b ^=∑i=15x i y i -5x-y-∑i =15x 2i -5x -2=272-5×6×7.6220-5×62=4440=1.1,∴a ^=7.6-1.1×6=1, ∴线性回归方程为y ^=1.1x +1,故当x=20时,y=23.(3)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),故ξ的所有可能取值为1,2,3,P(ξ=1)=C22C13C35=310,P(ξ=2)=C12C23C35=610=35,P(ξ=3)=C33C35=110,故ξ的分布列为故E(ξ)=1×310+2×35+3×110=1810=95.5.解:(1)设“采用A种分期付款方式购车”为事件A,“采用B种分期付款方式购车”为事件B,“采用C种分期付款方式购车”为事件C,由柱状图得,P(A)=35100=0.35,P(B)=45100=0.45,P(C)=20100=0.2,∴甲、乙两人采用不同分期付款方式的概率P=1-(P(A)·P(A)+P(B)·P(B)+P(C)·P(C))=0.635.(2)由题意知,X的所有可能取值为2,3,4,5,6,P(X=2)=P(A)P(A)=0.35×0.35=0.122 5,P(X=3)=P(A)P(B)+P(B)P(A)=0.35×0.45+0.45×0.35=0.315,P(X=4)=P(A)P(C)+P(B)P(B)+P(C)P(A)=0.35×0.2+0.45×0.45+0.2×0.35=0.342 5,P(X=5)=P(B)P(C)+P(C)P(B)=0.45×0.2+0.2×0.45=0.18,P(X=6)=P(C)P(C)=0.2×0.2=0.04.∴X的分布列为E(X)=0.122 5×2+0.315×3+0.342 5×4+0.18×5+0.04×6=3.7.6.解:(1)∵x-=8,y-=4.2,∑i=17x i y i=279.4,∑i=17x2i=708,∴b^=∑i=17x i y i-7x-y-∑i=17x2i-7x-2=279.4-7×8×4.2708-7×82=0.17,a^=y--b^x-=4.2-0.17×8=2.84,∴y关于x的线性回归方程为y^=0.17x+2.84.(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,∴选用y^=1.63+0.99x更好.(3)由(2)知,①当x=20时,销售量的预报值y^=1.63+0.9920≈6.07(万台),利润的预报值z=200×6.07-20≈1 194(万元).②z=200(1.63+0.99x)-x=-x+198x+326=-(x)2+198x+326=-(x-99)2+10 127,∴当x=99,即x=9 801时,利润的预报值最大,故广告费为9 801万元时,利润的预报值最大.7.解:(1)题中的2×2列联表补充如下:(2)K 2=100×40×25-20×15255×45×60×40≈8.25>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.(3)由题意,抽取6人中包括男生4名,女生2名,X 的取值为0,1,2,则P(X=0)=C 34C 36=15,P(X=1)=C 24C 12C 36=35,P(X=2)=C 14C 22C 36=15,故X 的分布列为E(X)=0×15+1×35+2×15=1.8.解:(1)记抽取的3天送餐单数都不小于40为事件M ,则P(M)=C 325C 350=23196.(2)①设乙公司送餐员的送餐单数为a , 当a=38时,X=38×6=228, 当a=39时,X=39×6=234, 当a=40时,X=40×6=240,当a=41时,X=40×6+1×7=247, 当a=42时,X=40×6+2×7=254.所以X 的所有可能取值为228,234,240,247,254. 故X 的分布列为所以E(X)=228×110+234×15+240×15+247×25+254×110=241.8.②依题意,甲公司送餐员的日平均送餐单数为38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,所以甲公司送餐员的日平均工资为80+4×39.7=238.8元. 由①得乙公司送餐员的日平均工资为241.8元. 因为238.8<241.8,所以推荐小王去乙公司应聘. 9.解:(1)μ=0.4×(0.050×0.8+0.225×1.2+0.550×1.6+0.825×2.0+0.600×2.4+0.200×2.8+0.050×3.2)=2,从而T 服从N(2,0.24),又σ=0.24≈0.49,从而P(1.51<T <2.49)=P(μ-σ<T <μ+σ)=0.682 6. (2)(ⅰ)任意抽取1名客户,该客户是目标客户的概率为P(2<T <2.98)=P(μ<T <μ+2σ) =12P(μ-2σ<T <μ+2σ)=12×0.954 4=0.477 2. 由题意知X 服从B(10 000,0.477 2),所以EX=10 000×0.477 2=4 772. (ⅱ)X 服从B(10 000,0.477 2),P(X=k)=C k 10 0000.477 2k (1-0.477 2)10 000-k =C k 10 0000.477 2k ·0.522 810 000-k(k=0,1,2,…,10 000). 设当X=k(k≥1,k ∈N)时概率最大,则有⎩⎪⎨⎪⎧P X =k >P X =k +1,PX =k >P X =k -1,得⎩⎪⎨⎪⎧0.522 8C k 10 000>0.477 2C k +110 000,0.477 2C k 10 000>0.522 8C k -110 000,解得k=4 772.故10 000人中目标客户的人数为4 772的概率最大. 10.解:(1)当S 6=20时,即背诵6首后,正确的有4首,错误的有2首.由S i ≥0(i =1,2,3)可知,若第一首和第二首背诵正确,则其余4首可任意背诵正确2首; 若第一首背诵正确,第二首背诵错误,第三首背诵正确,则其余3首可任意背诵正确2首.则所求的概率P=⎝ ⎛⎭⎪⎫232×C 24⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫132+23×13×23×C 23⎝ ⎛⎭⎪⎫232×13=1681.(2)由题意知ξ=|S 5|的所有可能的取值为10,30,50,又p=23,∴P(ξ=10)=C 35⎝ ⎛⎭⎪⎫233×⎝ ⎛⎭⎪⎫132+C 25⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫133=4081,P(ξ=30)=C 45⎝ ⎛⎭⎪⎫234×⎝ ⎛⎭⎪⎫131+C 15⎝ ⎛⎭⎪⎫231×⎝ ⎛⎭⎪⎫134=3081,P(ξ=50)=C 55⎝ ⎛⎭⎪⎫235×⎝ ⎛⎭⎪⎫130+C 05⎝ ⎛⎭⎪⎫230×⎝ ⎛⎭⎪⎫135=1181,∴ξ的分布列为∴E(ξ)=10×4081+30×3081+50×1181=1 85081.。
2020版高考数学二轮复习第2部分专题3概率与统计解密高考3概率与统计问题重在“辨”——辨析、辨型课件理
参考公式: 对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线^v =
n
a^+β^u的斜率和截距的最小二乘估计公式分别为:β^=∑ i=1nuivi-n u v , ∑ i=1u2i -n u 2
a^= v -β^u^.
[解](1)根据散点图判断,y=c·dx适宜作为扫码支付的人次y关于
的分布列、数列的递推 的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只
关系及等比数列的证明 数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以
等知识,学生的信息提 甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1
取、转化化归等能力, 分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,
第二部分 讲练篇
专题三 概率与统计 解密高考③ 概率与统计问题重在
“辨”——辨析、辨型
————[思维导图]————
————[技法指津]————
概率与统计问题辨析、辨型的策略 (1)准确弄清问题所涉及的事件有什么特点,事件之间有什么关 系,如互斥、对立、相互独立等; (2)理清事件以什么形式发生,如同时发生、至少有几个发生、 至多有几个发生、恰有几个发生等;
————[技法指津]———— (3)明确抽取方式,如放回还是不放回、抽取有无顺序等; (4)准确选择排列组合的方法来计算基本事件发生数和事件总 数,或根据概率计算公式和性质来计算事件的概率; (5)确定随机变量取值并求其对应的概率,写出分布列后再求期 望、方差; (6)会套用求b^、K2 的公式,再作进一步求值与分析.
(3)推广期结束后,车队对乘客的支付方式进行统计,结果如表 2所示
表2 支付方式 比例
现金 10%
2020高考数学解答题核心素养题型《专题11 概率与统计综合问题》+答题指导)(解析版)
专题11 概率与统计综合问题【题型解读】几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】 (2018·天津卷)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16,现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查. ①用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望;②设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率. 【答案】见解析【解析】(1)由题意得,甲、乙、丙三个部门的员工人数之比为3∶2∶2.由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人、2人、2人. (2)①随机变量X 的所有可能取值为0,1,2,3. P (X =k )=C k 4C 3-k3C 37(k =0,1,2,3).所以随机变量X 的分布列为随机变量X 的数学期望E (X )=0×35+1×35+2×35+3×35=7.②设事件B 为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C 为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A =B ∪C ,且B 与C 互斥. 由①知,P (B )=P (X =2),P (C )=P (X =1), 故P (A )=P (B ∪C )=P (X =2)+P (X =1)=67.所以事件A 发生的概率为67.【素养解读】本题考查分层抽样、离散型随机变量的分布列与数学期望、互斥事件的概率加法公式,考查分析问题和解决问题的能力,体现了数学运算和数据分析等核心素养.试题难度:中.【突破训练1】 (2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为12,13,14.(1)记X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 【答案】见解析【解析】(1)随机变量X 的所有可能取值为0,1,2,3.P (X =0)=⎝⎛⎭⎪⎫1-12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-14=14,P (X =1)=12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-14+⎝ ⎛⎭⎪⎫1-12×13×⎝⎛⎭⎪⎫1-14+⎝⎛⎭⎪⎫1-12×⎝⎛⎭⎪⎫1-13×14=1124,P (X =2)=⎝⎛⎭⎪⎫1-12×13×14+12×⎝ ⎛⎭⎪⎫1-13×14+12×13×⎝ ⎛⎭⎪⎫1-14=14,P (X =3)=12×13×14=124.所以随机变量X 的分布列为所以E (X )=0×4+1×24+2×4+3×24=12.(2)设Y 表示第一辆车遇到红灯的个数,Z 表示第二辆车遇到红灯的个数,则所求事件的概率为P (Y +Z =1)=P (Y =0,Z =1)+P (Y =1,Z =0)=P (Y =0)P (Z =1)+P (Y =1)P (Z =0) =14×1124+1124×14=1148. 所以这2辆车共遇到了1个红灯的概率为1148.▶▶题型二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练.【例2】 (2018·北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk =1”表示第k 类电影得到人们喜欢,“ξk =0”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系.【答案】见解析【解析】 (1)设“从电影公司收集的电影中随机选取1部,这部电影是获得好评的第四类电影”为事件A . 因为第四类电影中获得好评的电影有200×0.25=50(部), 所以P (A )=50140+50+300+200+800+510=502 000=0.025.(2)设“从第四类电影和第五类电影中各随机选取1部,恰有1部获得好评”为事件B ,则P (B )=0.25×(1-0.2)+(1-0.25)×0.2=0.35.(3)由题意可知,定义随机变量如下:ξk =⎩⎪⎨⎪⎧0,第k 类电影没有得到人们喜欢,1,第k 类电影得到人们喜欢,则ξk 显然服从两点分布,故Dξ1=0.4×(1-0.4)=0.24,Dξ2=0.2×(1-0.2)=0.16, Dξ3=0.15×(1-0.15)=0.127 5,Dξ4=0.25×(1-0.25)=0.187 5, Dξ5=0.2×(1-0.2)=0.16, Dξ6=0.1×(1-0.1)=0.09.综上所述,Dξ1>Dξ4>Dξ2=Dξ5>Dξ3>Dξ6.【素养解读】本题考查统计中的概率计算、随机变量的方差计算,考查运算求解能力,体现了数据分析、数学运算等核心素养.试题难度:中.【突破训练2】 (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)求六月份这种酸奶一天的需求量X (单位:瓶)的分布列.(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量n (单位:瓶)为多少时,Y 的数学期望达到最大值? 【答案】见解析【解析】(1)由题意知,X 所有可能取值为200,300,500, 由表格数据知P (X =200)=2+1690=0.2,P (X =300)=3690=0.4, P (X =500)=25+7+490=0.4, 因此X 的分布列为当300≤n ≤500时,若最高气温不低于25,Y =6n -4n =2n ; 若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n,因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.当200≤n<300时,若最高气温不低于20,则Y=6n-4n=2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.所以当n=300时,Y的数学期望达到最大值,最大值为520元.▶▶题型三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;附:K 2=(a +b)(c +d)(a +c)(b +d).【答案】见解析【解析】(1)记B 表示事件“旧养殖法的箱产量低于50 kg”,C 表示事件“新养殖法的箱产量不低于50 kg”. 由题意知P (A )=P (BC )=P (B )P (C ). 旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得如下列联表.K 2=100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).【素养解读】本题考查频率分布直方图、独立性检验、中位数、相互独立事件的概率,考查学生的阅读理解能力、数据处理能力.主要体现了数据分析,数学运算等核心素养.【突破训练3】 (2017·北京卷)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x 和y 的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y 的值小于60的概率;(2)从图中A ,B ,C ,D 四人中随机选出两人,记ξ为选出的两人中指标x 的值大于1.7的人数,求ξ的分布列和数学期望E (ξ);(3)试判断这100名患者中服药者指标y 数据的方差与未服药者指标y 数据的方差的大小(只需写出结论). 【答案】见解析【解析】(1)由题图知,在服药的50名患者中,指标y 的值小于60的有15人. 所以从服药的50名患者中随机选出一人,此人指标y 的值小于60的概率为1550=0.3.(2)由题图知,A ,B ,C ,D 四人中,指标x 的值大于1.7的有2人:A 和C . 所以ξ的所有可能取值为0,1,2.P (ξ=0)=C 22C 24=16,P (ξ=1)=C 12C 12C 24=23,P (ξ=2)=C 22C 24=16.所以ξ的分布列为故ξ的期望E (ξ)=0×6+1×3+2×6=1.(3)在这100名患者中,服药者指标y 数据的方差大于未服药者指标y 数据方差. 题型四 统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差等)的考查,解答题中也有所考查.【例4】 (2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t . (1)分析利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?请说明理由. 【答案】见解析【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施资源额的预测值为y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势,2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年的数据建立基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. (以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.)【素养解读】本题以统计图为背景,考查线性回归方程,考查运算求解能力和数形结合思想,体现了数学运算的核心素养.【突破训练4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y)2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y)2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17(y i -y -)2=0.55,∑i =17(t i -t -)(y i -y -)=∑i =17t i y i -t -∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17(t i -t -)(y i -y -)∑i =17(t i -t -)2=2.8928≈0.103,a ^=y --b ^t -=1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2019年对应的t =9代入回归方程,得y ^=0.92+0.10×9=1.82.所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.。
【高考冲刺】2020年高考数学(理数) 概率与统计 大题(含答案解析)
【高考复习】2020年高考数学(理数) 概率与统计大题1.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机下单和支付.出门不带现金的人数正在迅速增加.中国人民大学和法国调查公司益普索(Ipsos)合作,调查了腾讯服务的6 000名用户,从中随机抽取了60名,统计他们出门随身携带的现金(单位:元)如茎叶图所示,规定:随身携带的现金在100元以下的为“淡定族”,其他为“非淡定族”.(1)根据上述样本数据,列出2×2列联表,判断是否有75%的把握认为“淡定族”与“性别”有关?(2)用样本估计总体,若从腾讯服务的用户中随机抽取3人,设这3人中“淡定族”的人数为随机变量ξ,求随机变量ξ的概率分布列及数学期望.参考公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.参考数据:2.第四届世界互联网大会在浙江乌镇隆重召开,人工智能技术深受全世界人民的关注,不同年龄段的人群关注人工智能技术应用与发展的侧重点有明显的不同,某中等发达城市的市场咨询与投资民调机构在该市对市民关注人工智能技术应用与发展的侧重方向进行调查,随机抽取1 000名市民,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],并绘制了如图所示的频率分布直方图.(1)求这 1 000名市民年龄的平均数和中位数(同一组中的数据用该组区间的中点值作代表);(2)调查发现年龄在[20,40)的市民侧重关注人工智能技术在学习与工作方面的应用与发展,其中关注智能办公的共有100人,将样本的频率视为总体的频率,从该市年龄在[20,40)的市民中随机抽取300人,请估计这300人中关注智能办公的人数;(3)用样本的频率代替概率,现从该市随机抽取20名市民调查关注人工智能技术在养老服务方面的应用与发展的情况,其中有k名市民的年龄在[60,80]的概率为P(X=k),其中k=0,1,2,…,20,当P(X=k)最大时,求k的值.3.某校高三年级有500名学生,一次考试的英语成绩服从正态分布N(100,17.52),数学成绩的频率分布直方图如下:(1)如果成绩高于135分的为特别优秀,则本次考试英语、数学成绩特别优秀的学生大约各多少人?(2)试问本次考试英语和数学的平均成绩哪个较高,并说明理由;(3)如果英语和数学两科成绩都特别优秀的共有6人,从(1)中的这些学生中随机抽取3人,设3人中两科成绩都特别优秀的有ξ人,求ξ的分布列和数学期望.参考公式及数据:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.68,P(μ-2σ<X≤μ+2σ)=0.96,P(μ-3σ<X≤μ+3σ)=0.99.4.已知具有相关关系的两个变量x ,y 的几组数据如下表所示:(1)请根据上表数据在网格纸中绘制散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^,并估计当x=20时y 的值;(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y-4=0右下方的点的个数为ξ,求ξ的分布列以及期望.参考公式:b ^=∑i=1nx i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.5.某知名品牌汽车深受消费者喜爱,但价格昂贵.某汽车经销商推出A,B,C三种分期付款方式销售该品牌汽车,并对近期100位采用上述分期付款方式付款的客户进行统计分析,得到柱状图如图所示.已知从A,B,C三种分期付款销售中,该经销商每销售此品牌汽车1辆所获得的利润分别是1万元、2万元、3万元.现甲、乙两人从该汽车经销商处,采用上述分期付款方式各购买此品牌汽车一辆.以这100位客户所采用的分期付款方式的频率估计1位客户采用相应分期付款方式的概率.(1)求甲、乙两人采用不同分期付款方式的概率;(2)记X(单位:万元)为该汽车经销商从甲、乙两人购车中所获得的利润,求X的分布列与期望.6.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万元)的数据如下:(1)若用线性回归模型拟合y 与x 的关系,求出y 关于x 的线性回归方程;(2)若用y=c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别约为0.75和0.88,请用R 2说明选择哪个回归模型更好;(3)已知利润z 与x ,y 的关系为z=200y-x.根据(2)的结果回答下列问题:①广告费x=20时,销售量及利润的预报值是多少?②广告费x 为何值时,利润的预报值最大?(精确到0.01)参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b ^=∑i=1n x i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.参考数据:5≈2.24.7.通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:(1)将题中的2×2列联表补充完整;(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由;(3)如果按性别进行分层抽样,从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派3人参加某项校际挑战赛,记选出3人中的女大学生人数为X,求X的分布列和数学期望.附:K2=n ad-bc2a+b c+d a+c b+d.8.甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率;(2)若将频率视为概率,回答下列两个问题:①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.9.近年来“双十一”已成为中国电子商务行业的年度盛事,并且逐渐影响到国际电子商务行业.某商家为了准备2018年“双十一”的广告策略,随机调查了1 000名客户在2017年“双十一”前后10天内网购所花时间T(单位:时),并将调查结果绘制成如图所示的频率分布直方图.由频率分布直方图可以认为,这10天网购所花的时间T近似服从N(μ,σ2),其中μ用样本平均值代替,σ2=0.24.(1)计算μ,并利用该正态分布求P(1.51<T<2.49).(2)利用由样本统计获得的正态分布估计整体,将这10天网购所花时间在(2,2.98)小时内的人定义为目标客户,对目标客户发送广告提醒.现若随机抽取10 000名客户,记X为这10 000人中目标客户的人数.(ⅰ)求EX;(ⅱ)问:10 000人中目标客户的人数X为何值的概率最大?附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4,P(μ-3σ<Z<μ+3σ)=0.997 4.0.24≈0.49.10.某学校为了丰富学生的课余生活,以班级为单位组织学生开展古诗词背诵比赛,随机抽取一首,背诵正确加10分,背诵错误减10分,且背诵结果只有“正确”和“错误”两种.其中某班级学生背诵正确的概率p=23,记该班级完成n 首背诵后的总得分为S n . (1)求S 6=20且S i ≥0(i =1,2,3)的概率;(2)记ξ=|S 5|,求ξ的分布列及数学期望.答案解析1.解:(1)依题意可得2×2列联表如下:K 2=60×10×12-30×8218×42×40×20≈1.429>1.323,故有75%的把握认为“淡定族”与“性别”有关.(2)用样本估计总体,用户中为“淡定族”的概率为1860=310,ξ的可能取值为0,1,2,3,由题意,得到ξ~B ⎝ ⎛⎭⎪⎫3,310, P(ξ=k)=C k 3⎝ ⎛⎭⎪⎫310k ⎝ ⎛⎭⎪⎫7103-k,k=0,1,2,3,随机变量ξ的分布列为故随机变量ξ的数学期望E(ξ)=0×3431 000+1×4411 000+2×1891 000+3×271 000=9001 000=910.2.解:(1)由频率分布直方图可知,抽取的1 000名市民年龄的平均数 x -=25×0.05+35×0.1+45×0.2+55×0.3+65×0.25+75×0.1=54(岁). 设1 000名市民年龄的中位数为x ,则0.05+0.1+0.2+0.03×(x -50)=0.5,解得x=55, 所以这1 000名市民年龄的平均数为54,中位数为55.(2)由频率分布直方图可知,这1 000名市民中年龄在[20,40)的市民共有 (0.05+0.10)×1 000=150人,所以关注智能办公的频率为100150=23,则从该市年龄在[20,40)的市民中随机抽取300人,这300人中关注智能办公的人数为300×23=200.故估计这300人中关注智能办公的人数为200.(3)设在抽取的20名市民中,年龄在[60,80]的人数为X ,X 服从二项分布, 由频率分布直方图可知,年龄在[60,80]的频率为(0.025+0.010)×10=0.35,所以X ~B(20,0.35),所以P(X=k)=C k 200.35k (1-0.35)20-k,k=0,1,2, (20)设t=P X =k P X =k -1=C k 200.35k 0.6520-kC k -1200.35k -10.6521-k =721-k 13k ,k=1,2,…,20. 若t>1,则k<7.35,P(X=k-1)<P(X=k); 若t<1,则k>7.35,P(X=k-1)>P(X=k). 所以当k=7时,P(X=k)最大, 即当P(X=k)最大时,k 的值为7.3.解:(1)因为英语成绩服从正态分布N(100,17.52),所以英语成绩特别优秀的概率P 1=P(X≥135)=(1-0.96)×12=0.02,由频率估计概率,得数学成绩特别优秀的概率P 2=0.001 6×20×34=0.024,所以英语成绩特别优秀的学生大约有500×0.02=10(人), 数学成绩特别优秀的学生大约有500×0.024=12(人). (2)本次考试英语的平均成绩为100分,数学的平均成绩为60×0.16+80×0.168+100×0.48+120×0.16+140×0.032=94.72(分),因为94.72<100,所以本次考试英语的平均成绩较高.(3)英语和数学成绩都特别优秀的有6人,则单科成绩特别优秀的有10人, ξ可取的值有0,1,2,3,所以P(ξ=0)=C 310C 316=314,P(ξ=1)=C 210C 16C 316=2756,P(ξ=2)=C 110C 26C 316=1556,P(ξ=3)=C 36C 316=128,故ξ的分布列为E(ξ)=0×314+1×2756+2×1556+3×128=98.4.解:(1)散点图如图所示:(2)依题意,x -=15×(2+4+6+8+10)=6,y -=15×(3+6+7+10+12)=7.6,∑i =15x 2i=4+16+36+64+100=220,∑i =15x i y i =6+24+42+80+120=272,b ^=∑i=15x i y i -5x-y-∑i =15x 2i -5x -2=272-5×6×7.6220-5×62=4440=1.1,∴a ^=7.6-1.1×6=1, ∴线性回归方程为y ^=1.1x +1,故当x=20时,y=23.(3)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),故ξ的所有可能取值为1,2,3,P(ξ=1)=C22C13C35=310,P(ξ=2)=C12C23C35=610=35,P(ξ=3)=C33C35=110,故ξ的分布列为故E(ξ)=1×310+2×35+3×110=1810=95.5.解:(1)设“采用A种分期付款方式购车”为事件A,“采用B种分期付款方式购车”为事件B,“采用C种分期付款方式购车”为事件C,由柱状图得,P(A)=35100=0.35,P(B)=45100=0.45,P(C)=20100=0.2,∴甲、乙两人采用不同分期付款方式的概率P=1-(P(A)·P(A)+P(B)·P(B)+P(C)·P(C))=0.635.(2)由题意知,X的所有可能取值为2,3,4,5,6,P(X=2)=P(A)P(A)=0.35×0.35=0.122 5,P(X=3)=P(A)P(B)+P(B)P(A)=0.35×0.45+0.45×0.35=0.315,P(X=4)=P(A)P(C)+P(B)P(B)+P(C)P(A)=0.35×0.2+0.45×0.45+0.2×0.35=0.342 5,P(X=5)=P(B)P(C)+P(C)P(B)=0.45×0.2+0.2×0.45=0.18,P(X=6)=P(C)P(C)=0.2×0.2=0.04.∴X的分布列为E(X)=0.122 5×2+0.315×3+0.342 5×4+0.18×5+0.04×6=3.7.6.解:(1)∵x-=8,y-=4.2,∑i=17x i y i=279.4,∑i=17x2i=708,∴b^=∑i=17x i y i-7x-y-∑i=17x2i-7x-2=279.4-7×8×4.2708-7×82=0.17,a^=y--b^x-=4.2-0.17×8=2.84,∴y关于x的线性回归方程为y^=0.17x+2.84.(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,∴选用y^=1.63+0.99x更好.(3)由(2)知,①当x=20时,销售量的预报值y^=1.63+0.9920≈6.07(万台),利润的预报值z=200×6.07-20≈1 194(万元).②z=200(1.63+0.99x)-x=-x+198x+326=-(x)2+198x+326=-(x-99)2+10 127,∴当x=99,即x=9 801时,利润的预报值最大,故广告费为9 801万元时,利润的预报值最大.7.解:(1)题中的2×2列联表补充如下:(2)K 2=100×40×25-20×15255×45×60×40≈8.25>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.(3)由题意,抽取6人中包括男生4名,女生2名,X 的取值为0,1,2,则P(X=0)=C 34C 36=15,P(X=1)=C 24C 12C 36=35,P(X=2)=C 14C 22C 36=15,故X 的分布列为E(X)=0×15+1×35+2×15=1.8.解:(1)记抽取的3天送餐单数都不小于40为事件M ,则P(M)=C 325C 350=23196.(2)①设乙公司送餐员的送餐单数为a , 当a=38时,X=38×6=228, 当a=39时,X=39×6=234, 当a=40时,X=40×6=240,当a=41时,X=40×6+1×7=247, 当a=42时,X=40×6+2×7=254.所以X 的所有可能取值为228,234,240,247,254. 故X 的分布列为所以E(X)=228×110+234×15+240×15+247×25+254×110=241.8.②依题意,甲公司送餐员的日平均送餐单数为38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,所以甲公司送餐员的日平均工资为80+4×39.7=238.8元. 由①得乙公司送餐员的日平均工资为241.8元. 因为238.8<241.8,所以推荐小王去乙公司应聘. 9.解:(1)μ=0.4×(0.050×0.8+0.225×1.2+0.550×1.6+0.825×2.0+0.600×2.4+0.200×2.8+0.050×3.2)=2,从而T 服从N(2,0.24),又σ=0.24≈0.49,从而P(1.51<T <2.49)=P(μ-σ<T <μ+σ)=0.682 6. (2)(ⅰ)任意抽取1名客户,该客户是目标客户的概率为P(2<T <2.98)=P(μ<T <μ+2σ) =12P(μ-2σ<T <μ+2σ)=12×0.954 4=0.477 2. 由题意知X 服从B(10 000,0.477 2),所以EX=10 000×0.477 2=4 772. (ⅱ)X 服从B(10 000,0.477 2),P(X=k)=C k 10 0000.477 2k (1-0.477 2)10 000-k =C k 10 0000.477 2k ·0.522 810 000-k(k=0,1,2,…,10 000). 设当X=k(k≥1,k ∈N)时概率最大,则有⎩⎪⎨⎪⎧P X =k >P X =k +1,PX =k >P X =k -1,得⎩⎪⎨⎪⎧0.522 8C k 10 000>0.477 2C k +110 000,0.477 2C k 10 000>0.522 8C k -110 000,解得k=4 772.故10 000人中目标客户的人数为4 772的概率最大. 10.解:(1)当S 6=20时,即背诵6首后,正确的有4首,错误的有2首.由S i ≥0(i =1,2,3)可知,若第一首和第二首背诵正确,则其余4首可任意背诵正确2首; 若第一首背诵正确,第二首背诵错误,第三首背诵正确,则其余3首可任意背诵正确2首.则所求的概率P=⎝ ⎛⎭⎪⎫232×C 24⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫132+23×13×23×C 23⎝ ⎛⎭⎪⎫232×13=1681.(2)由题意知ξ=|S 5|的所有可能的取值为10,30,50,又p=23,∴P(ξ=10)=C 35⎝ ⎛⎭⎪⎫233×⎝ ⎛⎭⎪⎫132+C 25⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫133=4081,P(ξ=30)=C 45⎝ ⎛⎭⎪⎫234×⎝ ⎛⎭⎪⎫131+C 15⎝ ⎛⎭⎪⎫231×⎝ ⎛⎭⎪⎫134=3081,P(ξ=50)=C 55⎝ ⎛⎭⎪⎫235×⎝ ⎛⎭⎪⎫130+C 05⎝ ⎛⎭⎪⎫230×⎝ ⎛⎭⎪⎫135=1181,∴ξ的分布列为∴E(ξ)=10×4081+30×3081+50×1181=1 85081.。
2020年高考数学二轮复习重点专题冲刺复习指导 专题3 统计与概率
2020年高考数学二轮复习重点专题冲刺复习指导 专题3 统计与概率【高考考场实情】统计与概率在高考考查中一般有一道选择题或填空题、一道解答题,共2道题,分值为17分.高考对这一部分的考查难度相对稳定,选择、填空题为容易题, 解答题为中等难度题.选择题在前六题的位置,填空题在前二题的位置,解答题在前三题的位置.选择、填空题常考古典概型、几何概型(理科时而考查对立事件、相互独立事件概率及独立重复试验的概率)。
【考查重点难点】解答题以频率分布表、频率分布直方图、柱形图、折线图、茎叶图等五个样本频率分布图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.下面对学生存在的主要问题进行剖析,并提出相应的教学对策.【存在问题分析】1.概念理解不透【指点迷津】本专题中,概念理解不到位的有事件、模型的判断等;容易混淆的概念有互斥事件与对立事件、超几何分布与二项分布、二项展开式的通项公式1y n r r r n T C a b -+=与n 次独立重复试验中事件A 发生k 次的概率()(1)k k n k n nP k C p p -=-等. 【例1】已知5只动物中有1只患有某种疾病,需要通过化验血液来确定患病的动物.血液化验结果呈阳性的即为患病动物,呈阴性的即没患病.下面是两种化验方案:方案甲:逐个化验,直到能确定患病动物为止.方案乙:先任取3只,将它们的血液混在一起化验.若结果呈阳性则表明患病动物为这3只中的1只,然后再逐个化验,直到能确定患病动物为止;若结果呈阴性,则在另外2只中任取l 只化验.(Ⅰ)求依方案甲所需化验次数不少于依方案乙所需化验次数的概率;(Ⅱ)ξ表示依方案乙所需化验次数,求ξ的期望.【解析】(Ⅰ)设1ξ、2ξ已分别表示依方案甲和依方案乙需化验的次数,P 表示对应的概率,则方案甲中1ξ的分布列为方案乙中2ξ的分布列为若甲化验的次数不少于乙化验的次数,则[][]1212212221(1)(1)(2)(1)(2)(3)(1)(2)(3)(4)P P P P P P P P P P P ξξξξξξξξξξ==⨯=+=⨯=+=+==+=+=+=131322=0+(0)(0)0.72555555⨯++⨯+++=. (Ⅱ)3212()1023 2.4555E ξ=⨯+⨯+⨯==. 【名师点睛】本题易错的主要原因是对事件不清.对于方案甲,患有疾病的一只动物在每一次化验时出现的概率是等可能的,学生对事件不清,易误认为化验次数的可能取值是1,2,3,4,5,且1(1)(2)(3)(4)(5)2P P P P P ξξξξξ==========.事实上,若前4次化验为阴性,第5次不需再化验即知最后一只是患病动物,所以化验次数只能取l ,2,3,4.类似地,对于方案乙,第一次化验呈阳性,再化验3只中的前2只呈阴性后也不需再化验,或第一次化验呈阴性,再化验另外2只中的第l 只呈阴性或阳性后也不需再化验,即ξ只能取2,3.在解决问题时,要理清事件,求随机变量的分布列时,要弄清随机变量可能取到的每一个值以及取每一个值时所表示的意义,然后再利用所学的概率知识求出随机变量取每一个值时的概率,从而求出分布列.2.审题析题不到位【指点迷津】审题析题不清是本专题解答错误的主要原因,主要包括题意不清,茫然作答;阅读肤浅,丢失信息;条件欠缺,鲁莽下笔;图形不准,缺乏严密;方向不明,目标模糊等情况.审题不清的最主要原因在于学生的阅读理解能力欠缺.【例2】(2017年全国卷Ⅰ理19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布2(,)N μσ.(Ⅰ)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(3,3)μσμσ-+之外的零件数,求(1)P X ≥及X 的数学期望;(Ⅱ)一天内抽检零件中,如果出现了尺寸在(3,3)μσμσ-+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得16119.9716i i x x ===∑,161622221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布2(,)N μσ,则(33)0.997 4P Z μσμσ-<<+=, 160.997 40.959 2=0.0080.09≈.【解析】(Ⅰ)抽取的一个零件的尺寸在(3,3)μσμσ-+之内的概率为0.9974,从而零件的尺寸在(3,3)μσμσ-+之外的概率为0.0026,故()16,0.0026X B -,因此()()1611010.99740.0408P X P X ≥=-==-≈,X 的数学期望为160.00260.0416EX =⨯=(Ⅱ)(i )如果生产状态正常,一个零件尺寸在(3,3)μσμσ-+之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(3,3)μσμσ-+之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.(ii )由9.97,0.212x s =≈,得μ的估计值为ˆ9.97,μσ=的估计值为ˆ0.212σ=,由样本数据可以看出有一个零件的尺寸在ˆˆˆˆ(3,3)μσμσ-+之外,因此需对当天的生产过程进行检查. 剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的平均数为1(169.979.22)10.0215⨯-= 因此μ的估计值为10.02.162221160.212169.971591.134i i x==⨯+⨯≈∑,剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的样本方差为 221(1591.1349.221510.02)0.00815--⨯≈,因此σ的估计值为0.0080.09≈. 【名师点睛】面对试题中冗长的文字表述,学生方寸大乱,不知所措,从而失去读题、解题信心;没有形成通读全题的习惯,未能发现试题所附相关公式;未能根据试题提供的相关公式,提取零件的尺寸在(3,3)μσμσ-+之外的概率为0.0026;未能准确把握较长问句“生产线在这一天的生产过程可能出现了异常情况”的关键词等,导致回答问题含混不清、词不达意.3.读图识图能力弱【指点迷津】学生面对一堆数据无从下手,主要原因是对数据、图表的直观印象和积累储备的知识经验不够;没有形成“用数据说话”的统计观念;对抽象数据的数字特征理解不到位.【例3】(2016年全国卷Ⅲ理4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15C ︒,B 点表示四月的平均最低气温约为5C ︒.下面叙述不正确的是( )(A)各月的平均最低气温都在0C ︒以上 (B)七月的平均温差比一月的平均温差大(C)三月和十一月的平均最高气温基本相同 (D)平均最高气温高于20C ︒的月份有5个【解析】由图可知0C ︒均在虚线框内,所以各月的平均最低气温都在0C ︒以上,A 正确;由图可知七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,B 正确;由图可知三月和十一月的平均最高气温都大约在10C ︒,基本相同,C 正确;由图可知平均气温高于20C ︒的月份只有7、8两个月,D 错误.【名师点睛】解答本题错误主要是读图识图能力弱,对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;其次,不会从图表中读取有用数据并进行判断;第三,估计平均温差时易出现错误,错选B .4.解题规范性较差【指点迷津】涉及本专题内容的考查,学生失误和失分最多的是会而不对、对而不全和全而不准,如不能用字母表示事件,导致在利用简单事件表示复杂事件书写混乱;解答过程缺失关键步骤,丢三落四,导致丢分等.【例4】端午节吃粽子是我国的传统习俗,设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同,从中任意选取3个.(Ⅰ)求三种粽子各取到1个的概率;(Ⅱ)设X 表示取到的豆沙粽个数,求X 的分布列与数学期望.【解析】(Ⅰ)设A 表示事件“三种粽子各取到1个”,则由古典概型的计算公式有()11123531014C C C P A C ==. (Ⅱ)X 的所有可能取值为0,1,2则()383107015C P X C ===,()12283107115C C P X C ===,()21283101215C C P X C === 所以X 的分布列为 X 1 2 3 P715 715 115 故()0121515155E X =⨯+⨯+⨯=个. 【名师点睛】从解题规范方面看,学生常出现错误有,没有用字母表示事件,即缺少“设A 表示事件‘三种粽子各取到l 个’”这一步骤;直接写出1()4P A =,过程没写出来,应写为1112353101()4C C C P A C ==,一但答案错误,就失去过程分数;忽视“X 的所有可能值为0,1,2”,导致丢分等.5. 运算能力弱【指点迷津】运算求解能力主要是指会根据法则、公式进行正确运算、变形和数据处理,能根据问题的条件寻找与设计合理、简捷的运算途径,能根据要求对数据进行估计和近似计算.本专题中,学生运算能力弱主要体现在不能根据问题的条件寻找与设计合理、简捷的运算途径,不能根据要求对数据进行估计和近似计算.【例5】(2017年全国卷Ⅰ文19)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 12 3 4 5 6 7 8 9 10 11 12 13 14 15 16零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得16119.9716i i x x ===∑,16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,1621(8.5)18.439i i =-≈∑,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(Ⅰ)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(Ⅱ)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数12211()()()()n i ii n n i i i i x x y y r x x y y ===--=--∑∑∑.0.0080.09≈. 【解析】(Ⅰ)由样本数据得(,)(1,2,...,16)i x i i =的相关系数为16116162211()(8.5)0.180.2121618.439()(8.5)ii ii i x x i r x x i ===--==≈-⨯⨯--∑∑∑. 由于||0.25r <,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(Ⅱ)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查.(ii )剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.92)10.0215⨯-=,这条生产线当天生产的零件尺寸的均值的估计值为10.02,162221160.212169.971591.134i i x ==⨯+⨯≈∑,剔除第13个数据,剩下数据的样本方差为221(1591.1349.221510.02)0.00815--⨯≈.[来源:学+科+网] 这条生产线当天生产的零件尺寸的标准差的估计值为0.0080.09≈.【名师点睛】从运算方面看,学生不懂从16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑中解出 16221()160.212i i x x =-=⨯∑;不会计算0.2121618.439r =⨯⨯的值,不懂根据保留小数点后两位的要求,实施近似处理以简化运算;不懂直接由0.2121618.439r =⨯⨯采用放缩方法判断是否满足||0.25r <;不会由9.97x =和0.212s ≈计算出区间(3,3)x s x s -+的端点值9.334,10.606;计算151115i i x x ==∑时,不懂得先做相反数相消处理或各项统一分离10后转化为15'111015i i x x ==+∑计算;计算15'1115iix x==∑时,不懂得转化为1613115iix xx=-=∑,再利用16119.9716iix x===∑简化运算;计算222222221[0.070.10.060.060.010.10.0415s=++++++22220.020.240.110.11+++++222200.020.030.07]++++0.008130.008=≈,不懂得各项统一提取20.01的技巧;计算222221[160.212169.979.221510.02]15s=⨯+⨯--⨯时,不懂得在保证精确度要求的前提下作近似处理以简化运算.【解决问题对策】1.关注统计图表的教学【指点迷津】高考试卷的解答题往往以频率分布表、频率分布直方图、柱形图、折线图、茎叶图五个样本频率分布图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.复习过程中,应充分利用五个样本频率分布图表,让学生会从图表中读取有用数据,或根据问题需要选择合适图表,依据统计学中的方法对数据进行分析,作出合理的决策.【例6】【2015年全国卷Ⅱ文、理3】根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【答案】A2.关注样本数字特征的含义【指点迷津】在复习中,应关注众数、中位数、平均数(期望)、方差与标准差有的含义,并能根据解决问题的需要选择合理的数字特征说明问题.【例7】【2014年课标卷Ⅱ文19】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(Ⅰ)分别估计该市的市民对甲、乙部门评分的中位数;(Ⅱ)分别估计该市的市民对甲、乙部门的评分高于90的概率;(Ⅲ)根据茎叶图分析该市的市民对甲、乙两部门的评价.【答案】(Ⅰ)67;(Ⅱ)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为50.150=,80.1650=,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(Ⅲ)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分)3. 厘清事件及其概率【指点迷津】复习过程中,应厘清事件间的关系,准确计算相关事件的概率.特别要求学生能将复杂事件进行分解,先分解为互斥事件,每个互斥事件又分解为两个相互独立事件的积事件.【例8】(2013年全国卷Ⅰ理19)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果3n=,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果4n=,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为12,且各件产品是否为优质品相互独立.(Ⅰ)求这批产品通过检验的概率;(Ⅱ)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.【解析】(Ⅰ)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,第二次取出的4件产品都是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,这批产品通过检验为事件A,依题意有A=(A1B1)∪(A2B2),且A1B1与A2B2互斥,所以P(A)=P(A1B1)+P(A2B2)=P(A1)P(B1|A1)+P(A2)P(B2|A2)=41113 161616264⨯+⨯=.(Ⅱ)X可能的取值为400,500,800,并且P(X=400)=41111161616--=,P(X=500)=116,P(X=800)=14,所以X的分布列为EX=1111400+500+80016164⨯⨯⨯=506.25.4.关注概率模型的识别与应用【指点迷津】复习过程中,应关注概率模型的识别与应用,一定要注意弄清题意,找出题中的关键字词,厘清各种概率模型及适用范围.如超几何分布和二项分布是教材中两个重要概率分布,二项分布与超几何分布的区别为,二项分布是有放回的抽样,每做一次事件,事件A 发生的概率是相同的;超几何分布是不放回的抽样,每做一次事件,事件A发生的概率是不相同的.【例9】某食品厂为了检查一条自动包装流水线的生产情况,从该流水线上随机抽取40件产品作为样本,测得它们的重量(单位:克),将重量按如下区间分组:(490,495],(495,500],(500,505],(505,510],(510,515],得到样本的频率分布直方图(如图所示).若规定重量超过495克但不超过510克的产品为合格产品,且视频率为概率,回答下列问题:(Ⅰ)在上述抽取的40件产品中任取2件,设X 为合格产品的数量,求X 的分布列和数学期望()E X ;(Ⅱ)若从流水线上任取3件产品,求恰有2件合格产品的概率.【解析】(Ⅰ)由样本的频率分布直方图得,合格产品的频率为0.0450.0750.0550.8⨯+⨯+⨯=. 所以抽取的40件产品中,合格产品的数量为400.832⨯=. 则X 可能的取值为0,1,2,所以()2824070195C P X C ===;()11832240641195C C P X C ===;()2322401242195C P X C ===, 因此X 的分布列为 X0 1 2 P 7195 64195 124195 故X 数学期望7641243128()0121951951951955E X =⨯+⨯+⨯==. (Ⅱ)因为从流水线上任取1件产品合格的概率为40.85=, 所以从流水线上任取3件产品,恰有2件合格产品的概率为223144855125P C ⎛⎫⎛⎫== ⎪⎪⎝⎭⎝⎭.学1科·网 5.关注用样本估计总体的思想分析解决问题【指点迷津】复习过程中,应让学生掌握,为了考察一个总体的情况,在统计中通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类:用样本的频率分布估计总体的分布、用样本的数字特征估计总体的数字特征.其次,“预测与决策”与人们的生活休戚相关.随着社会的不断进步,人们对许多实际问题会有多种解决方案,但哪种方案最有利于解决问题,需要进行科学的决策.而通过期望、方差等的计算,并进行大小比较,就是其中的一种科学预测与决策的手段.【例10】【2016年课标Ⅰ理19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数. (Ⅰ)求X的分布列;(Ⅱ)若要求()0.5≤≥,确定n的最小值;P X n(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在19n=之中选其一,应选用哪n=与20个?【答案】(Ⅰ)由柱状图并一频率代替概率知,一台机器在三年内需要更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而P X==⨯=;(16)0.20.20.04P X==⨯⨯=;(17)20.20.40.16(18)20.20.20.40.40.24P X==⨯⨯+⨯=;P X==⨯⨯+⨯⨯=;(19)20.20.220.40.20.24P X==⨯⨯+⨯=;(20)20.20.20.20.20.2P X==⨯⨯=;(21)20.20.20.08P X==⨯=(22)0.20.20.04所以X的分布列为X 16 17 18 19 20 2122P 04.0 16.0 24.0 24.0 2.0 08.0 04.0(Ⅱ)由(Ⅰ)知44.0)18(=≤X P ,68.0)19(=≤X P ,故n 的最小值为19.(Ⅲ)记Y 表示2台机器在购买易损零件上所需的费用(单位:元).当19=n 时,08.0)500220019(2.0)50020019(68.020019⨯⨯+⨯+⨯+⨯+⨯⨯=EY 404004.0)500320019(=⨯⨯+⨯+. 当20=n 时,04.0)500220020(08.0)50020020(88.020020⨯⨯+⨯+⨯+⨯+⨯⨯=EY 4080=. 可知当19=n 时所需费用的期望值小于20=n 时所需费用的期望值,故应选19=n .6.关注“冷门”知识的复习【指点迷津】高考是对高中阶段学习结果的大检阅,统计与概率的考查,在突出核心知识考查的同时,也关注知识点的覆盖面.因此,在复习教学中,要全面检索高中阶段的所有知识,特别是不能忽视对所谓的“冷门知识”的复习,如正态分布、条件概率、相关系数、残差图、拟合效果等.【例11】【2015年课标Ⅰ理18】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (1,2,,8i =⋅⋅⋅)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w 281(x )ii x =-∑ 281()i i w w =-∑ 81()(y )i i i x x y =--∑ 81()()i i i w w y y =--∑46.6 56.3 6.8 289.8 1.6 1469 108.8表中i i w x =,8118i i w w ==∑ (Ⅰ)根据散点图判断,y a bx =+y 与y c b x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)以知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题: (i )年宣传费49x =时,年销售量及年利润的预报值是多少?(ii)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,),,u v ⋅⋅⋅(,)n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为µ121()()()n i i i n i i u u v v uu β==--=-∑∑,µµv u αβ=-. 【解析】(Ⅰ)100.668y x =+(Ⅲ) (i )由(Ⅱ)知,当49x =时,年销售量y 的预报值$100.66849576.6y =+=,年利润的预报值0.2576.64966.32z=⨯-=$. ②根据(Ⅱ)的结果知,年利润z 的预报值0.2(100.668)13.620.12zx x x x =+-=-++$, 所以当13.6 6.82x ==,即46.24x =时,z 取得最大值. 7.加强阅读理解能力培养与训练【指点迷津】统计与概率进一步强化应用意识的考查,已成高考命题改革的必然趋势,试卷试题文字阅读量的逐年增加,或成高考试卷的发展趋势.复习中,应规范教学的阅读指导.应该呈现读题提取关键信息、析题形成解题思路、解题示范规范表达、反思积淀解题经验的“四步曲”完整过程,才能充分发挥解题教学的效益.其次,加强平时的阅读训练.需要适当增加平时作业习题的阅读量,尤其是应用性试题的读题训练,提高学生的阅读理解能力及应试心态.【例12】【2014年课标Ⅰ理18】从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(Ⅰ)求这500件产品质量指标值的样本平均数x 和样本方差2s (同一组数据用该区间的中点值作代表);(Ⅱ)由频率分布直方图可以认为,这种产品的质量指标值Z 服从正态分布2(,)N μδ,其中μ近似为样本平均数x ,2δ近似为样本方差2s .(i )利用该正态分布,求(187.8212.2)P Z <<;(ii )某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i )的结果,求EX .12.2.若Z ~2(,)N μδ,则()P Z μδμδ-<<+=0.6826,(22)P Z μδμδ-<<+=0.9544.【解析】(Ⅰ) 2200,150x s ==(Ⅱ)(ⅰ)由(Ⅰ)知Z ~(200,150)N ,从而(187.8212.2)P Z <<=(20012.220012.2)0.6826P Z -<<+=,(ⅱ)由(ⅰ)知,一件产品中质量指标值为于区间(187.8,212.2)的概率为0.6826, 依题意知(100,0.6826)X B :,所以1000.682668.26EX =⨯=.8.规范答题表达形式【指点迷津】规范答题,一方面,思考问题要规范.也就是从知识的源头出发,弄清知识的来龙去脉.知识是怎么要求的,就怎么想、怎么用、怎么写,不能模棱两可,要会运用知识进行思考;另一方面,书写要规范.书写规范是一个重要的高考增分点,这一点应引起足够重视.如解题中应注意用字母表示事件,注意作答等.【例13】(2015年全国卷Ⅱ理18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:记时间C :“A 地区用户的满意度等级高于B 地区用户的满意度等级” .假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率.【解析】(Ⅰ)略;(Ⅱ)记1A C 表示事件:“A 地区用户满意度等级为满意或者非常满意”;记2A C 表示事件:“A 地区用户满意度等级为非常满意”;记1B C 表示事件:“A 地区用户满意度等级为不满意”;记2B C 表示事件:“A 地区用户满意度等级为满意”;则1A C 与1B C 独立,2A C 与2B C 独立,1B C 与2B C 互斥,1122()()B A B A C C C C C =U ,1122()(()())B A B A P C P C C C C =U 1122()()B A B A P C C P C C =+1122()()()()B A B A P C P C P C P C =+, 由所给数据得1212,,,A A B B C C C C 发生的频率分别为164108,,,20202020,故1212164108(),(),(),()20202020A A B B P C P C P C P C ====,所以164108()0.4820202020P C =⨯⨯⨯=.。
2020年高考数学解答题核心:概率与统计综合问题(答题指导)(学生版)
专题11 概率与统计综合问题(答题指导)【题型解读】几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】(2018·天津卷)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16,现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.①用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;②设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.【素养解读】本题考查分层抽样、离散型随机变量的分布列与数学期望、互斥事件的概率加法公式,考查分析问题和解决问题的能力,体现了数学运算和数据分析等核心素养.试题难度:中.【突破训练1】 (2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为12,13,14.(1)记X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率.▶▶题型二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练.【例2】(2018·北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk=1”表示第k类电影得到人们喜欢,“ξk=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系.【素养解读】本题考查统计中的概率计算、随机变量的方差计算,考查运算求解能力,体现了数据分析、数学运算等核心素养.试题难度:中.【突破训练2】(2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列.(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?▶▶题型三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;附:K2=.(a+b)(c+d)(a+c)(b+d)【素养解读】本题考查频率分布直方图、独立性检验、中位数、相互独立事件的概率,考查学生的阅读理解能力、数据处理能力.主要体现了数据分析,数学运算等核心素养.【突破训练3】(2017·北京卷)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x和y的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率;(2)从图中A,B,C,D四人中随机选出两人,记ξ为选出的两人中指标x的值大于1.7的人数,求ξ的分布列和数学期望E(ξ);(3)试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小(只需写出结论).【例4】 (2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t . (1)分析利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?请说明理由.【素养解读】本题以统计图为背景,考查线性回归方程,考查运算求解能力和数形结合思想,体现了数学运算的核心素养.【突破训练4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y)2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2∑i =1n (y i -y)2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .。
2020年高考理科数学《概率与统计》题型归纳与训练及答案解析
2020年高考理科数学《概率与统计》题型归纳与训练【题型归纳】题型一 古典概型与几何概型例1、某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为 . 【答案】【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为. 例2、市政府为调查市民对本市某项调控措施的态度,随机抽取了100名市民,统计了他们的月收入频率分布和对该项措施的赞成人数,统计结果如下表所示:(1)用样本估计总体的思想比较该市月收入低于20(百元)和不低于30(百元)的两类人群在该项措施的态度上有何不同;(2)现从样本中月收入在)20,10[和)70,60[的市民中各随机抽取一个人进行跟踪调查,求抽取的两个人恰好对该措施一个赞成一个不赞成的概率. 【答案】(1)详见解析;(2)2011. 【解析】(1)由表知,样本中月收入低于20(百元)的共有5人,其中持赞成态度的共有2人,故赞成人数的频率为52,月收入不低于30(百元)的共有75人,其中持赞成态度的共有64人,故赞成人数的频率为7564, ∵527564>,∴根据样本估计总体的思想可知月收入不低于30(百元)的人群对该措施持赞成态度的比月收入低于20(百元)的人群持赞成态度的比例要高.(2) 将月收入在)20,10[内,不赞成的3人记为321,,a a a ,赞成的2人记为54,a a ,将月收入在)70,60[内,不赞成的1人记为1b ,赞成的3人记为,,,432b b b 从月收入在)20,10[和)70,60[内的人中各随机抽取1人,基本事件总数20=n ,其中事件“抽取的两个人恰好对该措施一个赞成一个不赞成”包含的基本事件有5840155408-=),(),,(),,(),,(),,(),,(),,(),,(),,(),,(),,(1514433323423222413121b a b a b a b a b a b a b a b a b a b a b a 共11个,∴抽取的两个人恰好对该措施一个赞成一个不赞成的概率2011=P . 【易错点】求解古典概型问题的关键:先求出基本事件的总数,再确定所求目标事件包含基本事件的个数,结合古典概型概率公式求解.一般涉及“至多”“至少”等事件的概率计算问题时,可以考虑其对立事件的概率,从而简化运算. 【思维点拨】1. 求复杂互斥事件概率的方法一是直接法,将所求事件的概率分解为一些彼此互斥事件概率的和,运用互斥事件的求和公式计算;二是间接法,先求此事件的对立事件的概率,再用公式()()1P A P A =-,即运用逆向思维的方法(正难则反)求解,应用此公式时,一定要分清事件的对立事件到底是什么事件,不能重复或遗漏.特别是对于含“至多”“至少”等字眼的题目,用第二种方法往往显得比较简便.2.求古典概型的概率的基本步骤:算出所有基本事件的个数;求出事件A 包含的基本事件个数;代入公式,求出()P A ;几何概型的概率是几何度量之比,主要使用面积、体积之比与长度之比. 题型二 统计与统计案例例1、某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:],90,80[,),40,30[),30,20[Λ并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间)50,40[内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(Ⅰ)4.0;(Ⅱ)20;(Ⅲ)2:3.【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为6.010)04.002.0(=⨯+,所以样本中分数小于70的频率为4.06.01=-.(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.所以总体中分数在区间内的人数估计为. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为6010010)04.002.0(=⨯⨯+,所以样本中分数不小于70的男生人数为302160=⨯.所以样本中的男生人数为60230=⨯,女生人数为4060100=-,男生和女生人数的比例为2:340:60=,所以根据分层抽样的原理,总体中男生和女生人数的比例估计为2:3. 【易错点】求解统计图表问题,重要的是认真观察图表,发现有用信息和数据.对于频率分布直方图,应注意图中的每一个小矩形的面积是落在该区间上的频率,所有小矩形的面积和为1,当小矩形等高时,说明频率相等,计算时不要漏掉其中一个. 【思维点拨】1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 4.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.求回归直线方程的关键①正确理解计算^^,a b 的公式和准确的计算.②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关(0.010.020.040.02)100.9+++⨯=[40,50)1001000.955-⨯-=[40,50)540020100⨯=系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 6.独立性检验的关键①根据22⨯列联表准确计算2K ,若22⨯列联表没有列出来,要先列出此表. ②2K 的观测值k 越大,对应假设事件0H 成立的概率越小,0H 不成立的概率越大. 题型三 概率、随机变量及其分布例1、“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕, 市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值服从正态分布,利用该正态分布,求落在内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为,求的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为; ②若,则, .【答案】(1) (2) (3)的分布列为;.【解析】(1)所抽取的100包速冻水饺该项质量指标值的样本平均数为A x Z ()2,N μσZ ()14.55,38.45()10,30X X 11.95σ=≈()2~,Z N μσ()0.6826P Z μσμσ-<≤+=(22)0.9544P Z μσμσ-<≤+=26.5x =0.6826X ()2E X =x.(2)①∵服从正态分布,且, ,∴, ∴落在内的概率是. ②根据题意得, ; ; ; ; . ∴的分布列为∴. 50.1150.2250.3350.25450.1526.5x =⨯+⨯+⨯+⨯+⨯=Z ()2,N μσ26.5μ=11.95σ≈(14.5538.45)(26.511.9526.511.95)0.6826P Z P Z <<=-<<+=Z ()14.55,38.450.68261~4,2X B ⎛⎫ ⎪⎝⎭()404110216P X C ⎛⎫=== ⎪⎝⎭()41411124P X C ⎛⎫=== ⎪⎝⎭()42413228P X C ⎛⎫=== ⎪⎝⎭()43411324P X C ⎛⎫=== ⎪⎝⎭()444114216P X C ⎛⎫=== ⎪⎝⎭X ()1422E X =⨯=【思维点拨】1.条件概率的两种求解方法: (2)基本事件法,借助古典概型概率公式,先求事件A 包含的基本事件数)(A n ,再求事件AB 所包含的基本事件数()AB n ,得)()()|(A n AB n A B P =. 2.判断相互独立事件的三种常用方法:(1)利用定义,事件B A ,相互独立⇔)()()(B P A P AB P ⋅=.(2)利用性质,A 与B 相互独立,则A 与A B ,与B ,B A 与也都相互独立. (3)具体背景下,①有放回地摸球,每次摸球的结果是相互独立的. ②当产品数量很大时,不放回抽样也可近似看作独立重复试验.3. 求离散型随机变量的分布列,首先要根据具体情况确定X 的取值情况,然后利用排列、组合与概率知识求出X 取各个值的概率.4. 利用独立重复试验概率公式可以简化求概率的过程,但需要注意检验该概率模型是否满足公式k n k k n p p C k X P --==)1()(的三个条件:(1)在一次试验中某事件A 发生的概率是一个常数p ;(2)n 次试验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n 次试验中事件A 恰好发生了k 次的概率.5. 求离散型随机变量的均值与方差的基本方法有:(1)已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;(2)已知随机变量X 的均值、方差,求X 的线性函数b aX Y +=的均值、方差,可直接用均值、方差的性质求解,即b X aE b aX E +=+)()(,)()(2X D a b aX D =+(b a ,为常数).(3)如能分析所给随机变量服从常用的分布,可直接利用它们的均值、方差公式求解,即若X 服从两点分布,则p X E =)(,)1()(p p X D -=;若),(~p n B X ,则np X E =)(,)1()(p np X D -=.【巩固训练】题型一 古典概型与几何概型1.已知,,则函数在区间上为增函数的概率是( )A .B .C .D . {}0 1 2a ∈,,{}1 1 3 5b ∈-,,,()22f x ax bx =-()1 +∞,512131416【答案】A【解析】①当时,,情况为符合要求的只有一种; ②当时,则讨论二次函数的对称轴要满足题意则产生的情况表示: ,8种情况满足的只有4种; 综上所述得:使得函数在区间为增函数的概率为:1251214=+=P .2.在区间上任取一数,则的概率是( )A .B .C .D . 【答案】C【解析】由题设可得,即;所以,则由几何概型的概率公式.故应选C .(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.【答案】(1) 0.4;(2) 45;(3)74. 【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为0a =()2f x bx =- 1 1 3 5b =-,,,1b =-0a ≠22b b x a a -=-=1ba≤() a b ,()()()1 1 1 1 1 3-,,,,,()()()()()1 5 2 1 2 1 2 3 2 5-,,,,,,,,,()22f x ax bx =-()1 +∞,()0,4x 1224x -<<12131434211<-<x 32<<x 4,1==D d 41=P考向二 统计与统计案例1.为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只, (Ⅰ)求列联表中的数据,,,的值; (Ⅱ)绘制发病率的条形统计图,并判断疫苗是否有效? (Ⅲ)能够有多大把握认为疫苗有效?22⨯x y A B【答案】(Ⅰ),,,;(Ⅱ)详见解析;(Ⅲ)至少有%9.99的把握认为疫苗有效.【解析】(Ⅰ)设“从所有试验动物中任取一只,取到“注射疫苗”动物”为事件A, 由已知得,所以,,,.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率.10y =40B =40x =60A =302()1005y P A +==10y =40B =40x =60A =未注射 注射. 所以至少有%9.99的把握认为疫苗有效.2.在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在市的区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记表示在各区开设分店的个数, 表示这个分店的年收入之和.(Ⅰ)该公司已经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程; (Ⅱ)假设该公司在区获得的总年利润(单位:百万元)与之间的关系为,请结合(Ⅰ)中的线性回归方程,估算该公司应在区开设多少个分店,才能使区平均每个分店的年利润最大? 参考公式:, , .【答案】(1);(2)公司应在区开设4个分店,才能使区平均每个分店的年利润最大.【解析】(1)10085)())(()(,4,42112121^=---=--===∑∑∑∑====x x y yx x x n xyx n yx b y x ni ini iini ini iiΘ,6.0^^=-=x b y a , ∴y 关于x 的线性回归方程6.085.0+=x y .(2) ,区平均每个分店的年利润 ,∴时, 取得最大值,故该公司应在区开设4个分店,才能使区平均每个分店的年利润最大.10000005016.6710.8285020603=≈>⨯⨯S A x y x y x y x A z ,x y 20.05 1.4z y x =--A A y b x a ∧∧∧=+1221ni i i nii x y nxyb x nx ∧==-==-∑∑()()()121niii n ii x x y y x x ==---∑∑a y b x ∧∧=-0.850.6y x =+A A 20.05 1.4z y x =--=20.050.850.8x x -+-A 0.80.050.85z t x x x ==--+800.0150.85x x ⎛⎫=-++ ⎪⎝⎭4x =t A A3. 某商场对商品30天的日销售量y (件)与时间t (天)的销售情况进行整理,得到如下数据,经统计分析,日销售量y (件)与时间t (天)之间具有线性相关关系.(1)请根据表中提供的数据,用最小二乘法求出y 关于t 的线性回归方程a t b y +=. (2)已知商品30天内的销售价格z (元)与时间t(天)的关系为,),200(,20),3020(,100⎩⎨⎧∈<<+∈≤≤+-=N t t t N t t t z 根据(1)中求出的线性回归方程,预测t 为何值时,商品的日销售额最大.参考公式:2121^)(t n tyt n yt b ni ini ii--=∑∑==,t b y a ^^-=.【答案】(1)40^+-=t y ;(2)预测当20=t 时,商品的日销售额最大,最大值为1600元. 【解析】(1)根据题意,6)108642(51=++++⨯=t ,34)3033323738(51=++++⨯=y , 980301033832637438251=⨯+⨯+⨯+⨯+⨯=∑=i i i y t ,22010864222222512=++++=∑=i i t ,所以回归系数为1652203465980)(22121^-=⨯-⨯⨯-=--=∑∑==t n tyt n yt b ni ini ii,406)1(34^^=⨯--=-=t b y a ,故所求的线性回归方程为40^+-=t y . (2)由题意得日销售额为,,3020),40)(100(,200),40)(20(⎩⎨⎧∈≤≤+-+-∈<<+-+=Nt t t t Nt t t t L当N t t ∈<<,200时,900)10(80020)40)(20(22+--=++-=+-+=t t t t t L , 所以当;90010max ==L t 时,当N t t ∈≤≤,3020时,900)70(4000140)40)(100(22--=+-=+-+-=t t t t t L , 所以当.160020max ==L t 时,综上所述,预测当20=t 时,A 商品的日销售额最大,最大值为1600元. 题型三 概率、随机变量及其分布A A A A1.在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者654321,,,,,A A A A A A 和4名女志愿者4321,,,B B B B ,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.(I )求接受甲种心理暗示的志愿者中包含1A 但不包含的频率。
(完整版)2020年高考文科数学《概率与统计》题型归纳与训练,推荐文档
1 52 5258 259 2020 年高考文科数学《概率与统计》题型归纳与训练【题型归纳】 题型一 古典概型 例 1从甲、乙等5 名学生中随机选出2 人,则甲被选中的概率为().A.B.C.D.【答案】 【解析】 法有:可设这 5 名学生分别是甲、乙、丙、丁、戊,从中随机选出 2 人的方(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊), (丙,丁),(丙,戊),(丁,戊),共有10 种选法,其中只有前 4 种是甲被选中,所以所求概率为 42.故选 B.10 5例 2 将 2 本不同的数学书和 1 本语文书在书架上随机排成一行,则 2 本数学书相邻的概率为 .【答案】 【解析】根据题意显然这是一个古典概型,其基本事件有:数 1,数 2,语; 数 1,语,数 2;数 2,数 1,语; 数 2,语,数 1;语,数 2,数 1; 语,数 1,数 2 共B2314π 81 2⎧⎪∆ = 4 p 2 - 4(3 p - 2) ≥ 0⎨ x + x = -2 p < 0 1 2 ⎩ ⎪ x x= 3 p - 2 > 0 1 2有 6 种,其中 2 本数学书相邻的有 4 种,则其概率为:.【易错点】列举不全面或重复,就是不准确 【思维点拨】直接列举,找出符合要求的事件个数. 题型二 几何概型 例 1如图所示,正方形ABCD 内的图形来自中国古代的太极 AD图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概BC率是( ).A.B.C.D.【答案】【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为.故选 B.例 2 在区间[0, 5] 上随机地选择一个数的概率为.,则方程 x 2 +2 px +3 p - 2 = 0 有两个负根【答案】【解析】方程 x 2+2 px +3 p - 2 = 0 有两个负根的充要条件是 即Bπ 4p 23p = 4 = 6 2 31 ⎛ a ⎫2 ⨯⨯ ⎪2⎝ 2 ⎭ = 8a 2400或 p ≥ 2 ,又因为 p ∈[0, 5] ,所以使方程 x 2 +2 px +3 p - 2 = 0 有两个负根的 p【易错点】“有两个负根”这个条件不会转化.【思维点拨】“有两个负根”转化为函数图像与 x 轴负半轴有两个交点.从而得到参数 p 的范围.在利用几何概型的计算公式计算即可. 题型三 抽样与样本数据特征 例 1某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200 ,, 300 ,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60 件进行检验,则应从丙种型号的产品中抽取件.【答案】18【解析】按照分层抽样的概念应从丙种型号的产品中抽取300 ⨯ 60 1000= 18 (件).例 2已知样本数据x 1 , x 2 , ⋅⋅⋅ , x n 的均值 x = 5 ,则样本数据2x 1 +1 , 2x 2 +1 , ⋅⋅⋅ , 2x n +1 的均值为 .【答案】11 【解析】因为样本数据x 1 , x 2 , ⋅⋅⋅ , x n 的均值x = 5 ,又样本数据2x 1 +1 ,2x 2 +1, ⋅⋅⋅ , 2x n +1的和为2(x 1 + x 2 + + x n )+ n ,所以样本数据的均值为2x +1 =11.例 3 某电子商务公司对10000 名网络购物者 2018 年度的消费情况进行统计,3 2.发现消费金额(单位:万元)都在区间[0.3,0.9] 内,其频率分布直方图如图所示. (1)直方图中的a = .(2)在这些购物者中,消费金额在区间[0.5,0.9] 内的购物者的人数为.a/万万【答案】a = 3 人数为0.6 ⨯10000 = 6000【解析】由频率分布直方图及频率和等于1,可得0.2 ⨯ 0.1+ 0.8⨯ 0.1+1.5⨯ 0.1+ 2 ⨯ 0.1+ 2.5⨯ 0.1+a ⨯ 0.1 = 1 ,解之得a = 3 .于是消费金额在区间[0.5,0.9]内频率为0.2 ⨯0.1+ 0.8⨯0.1+ 2 ⨯0.1+ 3⨯0.1 = 0.6 ,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6⨯10000=6000.例4 某城市100户居民的月平均用电量(单位:度),以[160,180),[180, 200),[200, 220),[220, 240),[240, 260),[260, 280),[280, 300]分组的频率分布直方图如图所示.2220 + 240 = 230得 x = 0.0075 .又(0.002 + 0.0095 + 0.011+ 0.0125)⨯ 20 = 0.7 > 0.5 ,160 180 200 220 240 260 280 300 万万万万万万/万(1) 求直方图中 x 的值;(2) 求月平均用电量的众数和中位数;(3)在月平均用电量为[220, 240), [240, 260), [260, 280), [280, 300]的四组用户中, 用分层抽样的方法抽取11户居民,则从月平均用电量在[220, 240)的用户中应抽 取多少户?【答案】见解析【解析】(1)由(0.002 + 0.0095 + 0.011+ 0.0125 + x + 0.005 + 0.0025)⨯ 20 = 1 ,(2)由图可知,月平均用电量的众数是.因为(0.002 + 0.0095 + 0.011)⨯ 20 = 0.45 < 0.5 ,所以月平均用电量的中位数在[220, 240)内.设中位数为a ,由(0.002 +0.0095 +0.011)⨯20 +0.0125⨯(a -220)=0.5 ,得a = 224 ,所以月平均用电量的中位数是224 .(3)月平均用电量为[220,240)的用户有0.0125⨯ 20 ⨯100 = 25 (户);月平均用电量为[240,260)的用户有0.0075⨯20⨯100=15(户);月平均用电量为[260,280)的用户有0.005⨯20⨯100=10(户);月平均用电量为[280, 300]的用户有0.0025⨯ 20 ⨯100 = 5 (户).所以从月平均用电量在[220,240)的用户中应抽取25⨯1 = 5 (户).5【易错点】没有读懂题意,计算错误.不会用函数思想处理问题【思维点拨】根据题意分情况写出函数解析式;2 牵涉到策略问题,一般可以转化为比较两个指标的大小.题型四回归与分析例1 下图是我国2008 年至2014 年生活垃圾无害化处理量(单位:亿吨)的折线图∑ i =1nn(t - t ) (y - y)2 ∑ 2i ii =1∑ i =17( y - y )2i nn万万 1.80 万万 1.60 万万万 1.40 万万 1.20 万万1.00y0.80234567年份代码t(1) 由折线图看出,可用线性回归模型拟合 y 与t 的关系,请用相关系数加以说明(2) 建立 y 关于t 的回归方程(系数精确到0.01 ),预测2016 年我国生活垃圾无害化处理量.参考数据: 7 y = 9.32 , 7 t y = 40.17 ,= 0.55 , ≈ 2.646 .∑ii =1∑i ii =1n∑(t i - t )( y i - y )参考公式:相关系数r =i =1回归方程 y = a+ b t 中斜率和截距的最小二乘估计公式分别为:∑(t i - t )( y i - y )b= i =1 a = y - bt .∑(ti- t )2i =1【答案】见解析72【解析】(1)由折线图中数据和附注中参考数据得t = 4 , ∑(t i - t ) = 28 ,i =1 7∑ i =17 7(t - t ) ⋅ ( y - y )2∑ 2iii =1 ∑ i =17 (t - t ) 2ii =1 ∑ i =17( y - y )2i7 ∑ 7(t - t ) 2 i i =1i= 0.55 ,∑7(t - t )(y - y )= ∑7t y - t ∑7y = 40.17 - 4 ⨯ 9.32 = 2.89 ≈2.89≈ . , r0.99 i ii ii0.55⨯ 2 ⨯ 2.646i =1i =1i =1因为 y 与t 的相关系数近似为0.99 ,说明 y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与t 的关系.7777 ∑(t i - t )( y i - y )7∑t i y i - ∑t i ⋅∑ y i(1)变量 y 与t 的相关系数r =i =1=i =1i =1,7 ⨯⋅777又∑t i = 28 , ∑ y i = 9.32 , ∑t i y i = 40.17 2= 5.292 ,i =1i =1i =1= 0.55 ,所以r = 7 ⨯ 40.17 - 28⨯ 9.32 ≈ 0.997 ⨯ 5.292 ⨯ 0.55,故可用线性回归模型拟合变量 y 与t 的关系.t y - 7t ⋅ y117∑7i i40.17 - 7 ⨯ 4 ⨯ 7 ⨯ 9.32(2) t = 4 , y =∑y ,所以b ˆ= i =1 == 0.10 ,7 i =1 i∑7 i =1t 2 -7t 2 28a ˆ = y -b ˆx = 1⨯ 9.32 - 0.10 ⨯ 4 ≈ 0.93 ,所以线性回归方程为 y ˆ = 0.1t + 0.93 .7当t = 9 时, y ˆ= 0.1⨯ 9 + 0.93 = 1.83 .因此,我们可以预测 2016 年我国生活垃圾无害化处理1.83 亿吨.【易错点】没有读懂题意,计算错误.∑(72y - y i) i =1∑ i =17( y - y )2i【思维点拨】将题目的已知条件分析透彻,利用好题目中给的公式与数据.题型五独立性检验例1 甲、乙、丙、丁四位同学各自对A、B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A、B 两变量更强的线性相关性?( ) A.甲B.乙C.丙D.丁【答案】D【解析】D 因为r>0 且丁最接近1,残差平方和最小,所以丁相关性最高【易错点】不理解相关系数和残差平方和与相关性的关系【思维点拨】相关系数r 的绝对值越趋向于1,相关性越强.残差平方和m 越小相关性越强【巩固训练】题型一古典概型151 141 1211. 将一颗质地均匀的骰子(一种各个面上分别标有1,2, 3, 4,5, 6 个点的正方体玩具)先后抛掷2 次,则出现向上的点数之和小于10 的概率是 .【答案】 56【解析】将先后两次点数记为(x , y ),则基本事件共有6 ⨯ 6 = 36 (个), 其中点数之和大于等于10有(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6 种, 则点数之和小于10 共有30 种,所以概率为30 = 5. 36 62. 我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于 2 的偶数可以表示为两个素数的和”,如30 = 7 + 23 .在不超过30 的素数中,随机选取两个不同的数,其和等于 30 的概率是( ).A.B .C .D .【答案】C【解析】不超过 30 的素数有 2、3、5、7、11、13、17、19、23、29,共 10 个, 随机选取两数有45 (种)情况,其中两数相加和为 30 的有 7 和 23,11 和19,13 和 17,共 3 故选C .3. 袋中有形状、大小都相同的 4 只球,其中1 只白球,1 只红球, 2 只黄球,从中一次随机摸出【答案】 只球,则这 2 只球颜色不同的概率为 .【解析】1 只白球设为 a ,1 只红球设为 b , 2 只黄球设c 为 , d ,2 P = 56181则摸球的所有情况为(a,b),(a, c),(a, d ),(b,c),(b,d ),(c, d ),共6 件,满足题意的事件为(a,b),(a, c),(a, d ),(b,c),(b,d ),共5.题型二几何概型1.某公司的班车在7:00,8:00,8:30 发车,学.小明在7:50 至8:30 之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10 分钟的概率是().A.F(1) 13B. 12F(1)C.F(2) 23D. 34【答案】B【解析】如图所示,画出时间轴.7:30 7:40 7:50 8:00 8:10 8:20 8:30B小明到达的时间会随机的落在图中线段AB 中,而当他的到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10 分钟.根据几何概型,所求概率P =10 +10 =1 .故选B.40 22.从区间[0,1]随机抽取2n 个数x1,x2 ,…,x n ,y1 ,y2 ,…,y n ,构成n 个数对(x1, y1),(x2 , y2),…,(xn ,yn),其中两数的平方和小于1 的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为().p 2 =p3p 1 =p3p 1 =p2AB4n 2n 4mA.mB. mC.2mnn D. 【答案】C【解析】由题意得:(x i△△△△y i)(i =1 2 ⋅⋅⋅n)在如图所示方格中,而平方和小于1 的π4 =m π =4m点均在如图所示的阴影中,由几何概型概率计算公式知1 n ,所以C.n .故选3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边,A C ,的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,,p3,则A.B.C.D.【答案】A【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可.设直角三角形ABC 的三个角 A ,B ,C 所对的边长分别为a ,b ,c ,则区域Ⅰ的面积为S1=1ab ,2p 2p 1 =p2+p3△ABC⎝ ⎭ ⎝ ⎭ ⎝ ⎭2区域Ⅱ的面积为 1 ⎛ 1 ⎫2 1 ⎛ 1 ⎫2 1 1 ⎛ 1 ⎫21S 2 = 2 π 2 c ⎪ + 2 π 2 b ⎪ + 2 ab - 2 π 2 a ⎪ = 2 ab ,2 区域Ⅲ的面积为 S = 1 π⎛ 1 c ⎫ + 1 π⎛ 1 b ⎫ - 1 ab = 1 πa 2 - 1 ab .3 2 2⎪ 2 2 ⎪ 28 2 ⎝ ⎭ ⎝ ⎭显然 p 1 = p 2 .故选 A .题型三 抽样与样本的数据特征1. 已知一组数据4 ,6 , 5 , 8 ,7 , 6 ,那么这组数据的平均数为 .【答案】10【解析】平均数x = 1 (4 + 6 + 5 + 8 + 7 + 6)= 6 . 62. 某电子商务公司对 10000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3, 0.9] 内,其频率分布直方图如图所示.(Ⅰ)直方图中的a =;(Ⅱ)在这些购物者中,消费金额在区间[0.5, 0.9] 内的购物者的人数为.【答案】3;6000【解析】频率和等于 1 可得0.2 ⨯ 0.1 + 0.8 ⨯ 0.1 + 1.5 ⨯ 0.1 + 2 ⨯ 0.1 + 2.5 ⨯ 0.1 + a ⨯ 0.1 = 1 , 解之得a = 3 .于是消费金额在区间[0.5, 0.9] 内频率为0.2 ⨯ 0.1 + 0.8 ⨯ 0.1 + 2 ⨯ 0.1 + 3 ⨯ 0.1 = 0.6 , 所以消费金额在区间[0.5, 0.9] 内的购物者的人数为: 0.6 ⨯10000 = 6000 ,故应填3;6000.3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨)、一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100 位居民每人的月均用水量(单位:吨),将数据按照[0, 0.5),[0.5,1),⋅⋅⋅,[4, 4.5)分成9 组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30 万居民,估计全市居民中月均用水量不低于3 吨的人数,请说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.【答案】见解析【解析】(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08⨯0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08 ,0.20 ,0.26 ,0.06 ,0.04 ,0.02 .由0.04+0.08+0.5⨯a + 0.20 + 0.26 + 0.5⨯a + 0.06 + 0.04 + 0.02 = 1 ,解得 a = 0.30 .(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30 万居民中月均用水量不低于 3 吨的人数为300000⨯ 0.12 = 36000 .(3)因为前 6 组的频率之和为0.04 - 0.08 - 0.15 - 0.20 - 0.26 - 0.15=0.88 > 0.85 ,而前5 组的频率之和为0.04+0.08+0.15 -0.20 -0.26=0.73 < 0.85 ,所以2.5 …x < 3.由0.3⨯(x - 2.5)= 0.85 - 0.73 ,解得x = 2.9 .题型四回归与分析1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5 户家庭,得到如下统计数据表:区一户收入为15 万元家庭年支出为()A.11.4 万元B.11.8 万元C.12.0 万元D.12.2 万元【答案】B所以回归直线方程为yˆ=0.76x+0.4.当社区一户收入为15 万元,家庭年支出为(万元).故选B.0.4 = 11.8yˆ=0.76⨯15+y ∑2. 为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10 名学生,根据测量数据的散点图可以看出 与x 之间有线性相关关系,设其回归直线方程为 y ˆ= b ˆx + a ˆ.已知∑x i i =110= 225 , y i = 1600 , b ˆ= 4 .该i =1班某学生的脚长为 24,据此估计其身高为( ).A . 160B . 163C . 166D .170【答案】C 【解析】 故选 C .x = 22.5 , y = 160 ,所以a= 160 - 4⨯ 22.5 = 70 , x = 24 时, y = 4 ⨯ 24 + 70 = 166 .3. 某公司为确定下一年投入某种产品的宣传费,需了解年宣传费 x (单位:千元)对年销售量 y (单位: )和年利润 z (单位:千元)的影响,对近 8 年的年宣传费x i和年销售量计量的值.y i (i = 1, 2,⋅⋅⋅,8)数据作了初步处理,得到下面的散点图及一些统万万万万/万万10 t(u 2,v 2 ) (u 1,v 1 ) y = c + d x x = 49表中,,(1) 根据散点图判断, y = a + bx 与y = c + d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)?(2) 根据(1)的判断结果及表中数据,建立 y 关于x 的回归方程;(3) 已知这种产品的年利润z 与x , y 的关系式为 z = 0.2y - x,根据(2)的结果回答下列问题:(ⅰ)年宣传费 时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据 ,⋅ ⋅ ⋅ , (u n , v n ),其回归直线v =+ u 的斜率,和截距的最小二乘估计分别为【答案】见解析【解析】(1)由散点图变化情况可知选择 较为适宜.w i = x iˆ =i =1∑(u i - u )(v i - v ) n∑ i =1n(u - u )2i.x yw∑( )2x- x ii =1∑( )( - ) w - w y y i ii =1∑8( )2w- w ii =1 ∑( - )( -) 8x x y yiii =146.6563 6.8289.8 1.6 1469 108.81 8w = ∑w i8 i =1563 - 68⨯ 6.8 = 100.6 c = y - d = ∑(w - w1.6)∑8(w - w )(y - yii) 108.8(2)由题意知d =i =1= = 68 .又82i一定过点(, y ),i =1所以 ,所以 y 与x 的回归方程为 y = 100.6 + 68 x .(3)(ⅰ)由(2)知,当 x = 49 时,y = 100.6 + 68⨯ 49 = 576.6(t ),(千元),所以当年宣传费为 x = 49 时,年销售量为576.6(t ),利润预估为66.32 千元.(ⅱ)由(2)知, z = 0.2 y - x = 0.2 (100.6 + 68 x )- x =-(x - 6.8)2+ 6.82 + 20.12 ,所以当 x = 6.8 时,年利润的预估值最大,即 x = 6.82 = 46.24 (千元). 题型五 独立性检验1. 某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H :“这种血清不能起到预防感冒的作用”,利用 2×2 列联表计算的 K 2≈3.918,则下列表述中正确的是( )A. 有 95℅的把握认为“这种血清能起到预防感冒的作用”B. 若有人未使用该血清,那么他一年中有 95℅的可能性得感冒y = c + d x 66.32 z = 0.2 ⨯ 576.6 - 49 = 20.12 = 13.6 x - x +a a +bc c + dkg C. 这种血清预防感冒的有效率为 95℅D. 这种血清预防感冒的有效率为 5℅【答案】A【解析】由题可知,在假设成立情况下,P (K 2≥ 3.841) 的概率约为 0.05,即在 犯错的概率不错过 0.05 的前提下认为“血清起预防感冒的作用”,即有 95℅的把握认为“这种血清能起到预防感冒的作用”.这里的 95℅是我们判断 不成立的概率量度而非预测血清与感冒的几率的量度,故 B 错误.C ,D 也犯有 B 中的错误.故选 A2. 观察下面频率等高条形图,其中两个分类变量x ,y 之间关系最强的是( )A .B .C .D .【答案】D【解析】在频率等高条形图中, 与 相差很大时,我们认为两个分类变量有关系,四个选项中,即等高的条形图中 x 1, x 2 所占比例相差越大,则分类变量 x , y 关系越强,故选D .3. 淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位: )的频率分布直方图如图所示.H H万万万万万万万万万万/k g万万万万(1)设两种养殖方法的箱产量相互独立,记 A 表示事件:旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ,估计 A 的概率;(2)填写下面列联表,并根据列联表判断是否有99% 的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01 ).附:21. 【答案】见解析【解析】(1)记:“旧养殖法的箱产量低于50kg ” 为事件B ,“新养殖法的箱产量不低于50kg ”为事件C ,由题图并以频率作为概率得,, P (A )= P (B )P (C )= 0.4092 .(2)由计算可得 的观测值为 k 2 = 200 ⨯ (62 ⨯ 66 - 38 ⨯ 34)2100 ⨯100 ⨯ 96 ⨯104 = 15.705 ,因为15.705 > 6.635 ,所以P (K 2 ≥ 6.635)≈ 0.001 ,从而有99% 以上的把握认为箱产量与养殖方法有关.(3)1 ÷ 5 = 0.2 , 0.1 - (0.004 + 0.020 + 0.044)= 0.032 , 50 + 2.35 = 52.35 ,所以中位数为52.35 .0.032 ÷ 0.068 = 8 17 , 8 ⨯ 5 ≈ 2.35 , = 0.66 P (C )= 0.068 ⨯ 5 + 0.046 ⨯ 5 + 0.010 ⨯ 5 + 0.008 ⨯ 5K 2 = 0.62 P (B )= 0.040 ⨯ 5 + 0.034 ⨯ 5 + 0.024 ⨯ 5 + 0.014 ⨯ 5 + 0.012 ⨯ 5 17K 2= n (ad - bc )2 (a + b )(c + d )(a + c )(b + d )22“”“”At the end, Xiao Bian gives you a passage. Minand once said, "people who learn to learn are very happy people.". In every wonderful life, learning is an eternal theme. As a professional clerical and teaching position, I understand the importance of continuous learning, "life is diligent, nothing can be gained", only continuous learning can achieve better self. Only by constantly learning and mastering the latest relevant knowledge, can employees from all walks of life keep up with the pace of enterprise development and innovate to meet the needs of the market. This document is also edited by my studio professionals, there may be errors in the document, if there are errors, please correct, thank you!。
2020大二轮高考总复习文数文档:解答题3 概率与统计 Word版含解析.doc
第一单元高考中档大题突破解答题03:概率与统计基本考点——古典概型、互斥与对立事件的概率、统计、统计案例考向01:古典概型、互斥与对立事件的概率1.古典概型的概率P (A )=m n =A 中所含的基本事件数基本事件总数.2.互斥事件的概率加法公式(1)如果事件A 与B 互斥,那么P (A ∪B )=P (A )+P (B );(2)一般地,如果事件A 1,A 2,…,A n 彼此互斥,那么P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).3.对立事件及其概率公式若事件B 与事件A 互为对立事件,则P (A )+P (B )=1,即P (A )=1-P (B ). [提醒] (1)两个事件互斥未必对立,但对立一定互斥.(2)只有事件A ,B 互斥时,才有公式P (A ∪B )=P (A )+P (B ),否则公式不成立.1.有编号为1,2,3的三个白球,编号为4,5,6的三个黑球,这六个球除编号和颜色外完全相同,现从中任意取出两个球.(1)求取得的两个球颜色相同的概率; (2)求取得的两个球颜色不相同的概率.解:从六个球中取出两个球的基本事件:(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共计15个基本事件.(1)记事件A 为取出的两个球是白球,则这个事件包含的基本事件的是(1,2),(1,3),(2,3),共计3个基本事件,故P (A )=315=15.记取出的两个球是黑球为事件B ,同理可得P (B )=15.记事件C 为取出的两个球的颜色相同,则C =A +B ,且A ,B 互斥,根据互斥事件的概率加法公式,得P (C )=P (A +B )=P (A )+P (B )=25.(2)记事件D 为取出的两个球的颜色不相同,则事件C ,D 是对立事件,根据对立事件概率之间的关系,得P (D )=1-P (C )=1-25=35.2.(2016·山东卷)某儿童乐园在“六一”儿童节推出了一项趣味活动,参加活动的儿童需转动如图所示的转盘两次,每次转动后,待转盘停止转动时,记录指针所指区域中的数,设两次记录的数分别为x ,y .奖励规则如下:①若xy ≤3,则奖励玩具一个; ②若xy ≥8,则奖励水杯一个; ③其余情况奖励饮料一瓶.假设转盘质地均匀,四个区域分布均匀,小亮准备参加此项活动. (1)求小亮获得玩具的概率;(2)请比较小亮获得水杯与获得饮料的概率的大小,并说明理由.解:用数对(x ,y )表示儿童参加活动先后记录的数,则基本事件空间Ω与点集S ={(x ,y )|x ∈N ,y ∈N,1≤x ≤4,1≤y ≤4}一一对应.因为S 中元素的个数是4×4=16,所以基本事件总数n =16.(1)记“xy ≤3”为事情A ,则事件A 包含的基本事件数共5个,即(1,1),(1,2),(1,3),(2,1),(3,1),所以P (A )=516,即小亮获得玩具的概率为516.(2)记“xy ≥8”为事件B ,“3<xy <8”为事件C , 则事件B 包含的基本事件数共6个, 即(2,4),(3,3),(3,4),(4,2),(4,3),(4,4), 所以P (B )=616=38.事件C 包含的基本事件数共5个,即(1,4),(2,2),(2,3),(3,2),(4,1). 所以P (C )=516,因为38>516,所以小亮获得水杯的概率大于获得饮料的概率. 考向02:统计1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1.3.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.1.(2016·北京卷)某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解:(1)如题图所示,用水量在[0.5,3)的频率的和为:(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为:(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即该市居民该月的人均水费估计为10.5元.2.(2017·合肥模拟)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y -,由观测结果可得 x -=120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y -=120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x ->y -,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2.,3.上,而B 药疗效的试验结果有710的叶集中在茎0.,1.上,由此可看出A 药的疗效更好.考向03:统计案例1.回归分析方程y ^=b ^x +a ^称为线性回归方程,其中b ^=Σni =1x i y i -n x -y -Σni =1x 2i -n x -2,a ^=y --b ^x -;(x -,y -)称为样本点的中心. 2.独立性检验K 2=(a +b +c +d )(ad -bc )2(a +b )(c +d )(a +c )(b +d ),若k 0>3.841,则有95%的把握认为两个事件有关; 若k 0>6.635,则有99%的把握认为两个事件有关.1.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y =b x +a ; (2)利用(1)中所求出的回归直线方程预测该地2018年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:对预处理后的数据,容易算得,x =0,y =3. 2,b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2(-4)2+(-2)2+22+42-5×02=26040=6.5,a ^=y --b ^x -=3.2. 由上述计算结果知,所求回归直线方程为 y ^-257=b ^(x -2 012)+a ^=6.5(x -2 012)+3.2, 即y ^=6.5×(x -2 012)+260.2.(2)利用(1)中所求回归直线方程,可预测2018年的粮食需求量为6.5×(2 018-2 012)+260.2=6.5×6+260.2=299.2(万吨).2.(2017·九江模拟)某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生的成绩分为6组,得到如下所示的频数分布表.数学成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.附表及公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).解:(1)x -男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5, x -女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5, 从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知,在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:可得K 2=100×(15×25-15×45)60×40×30×70≈1.79,因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”.常考热点——统计与概率的交汇问题概率与统计题已经发展成为高考解答题的“盘中菜”,难度一般为中档. 概率与统计的交汇题常以生活中的问题为背景,命题重点有以下两种类型:一是“双图(频率分布直方图、茎叶图)”与古典概型的相交汇;二是统计与独立性检验的交汇问题.(2017·晋城一模)某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)用分层抽样的方法在分数段为[60,80)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[70,80)的概率.【解】(1)分数在[70,80)内的频率为1-(0.01+0.015+0.015+0.025+0.005)×10=0.3,故分数在[70,80)上的频率是0.3,频率分布直方图如图.(2)由题意,[60,70)分数段的人数为0.15×60=9,[70,80)分数段的人数为0.3×60=18.∵分层抽样在分数段为[60,80)的学生中抽取一个容量为6的样本,∴[60,70)分数段抽取2人,分别记为m,n;[70,80)分数段抽取4人,分别记为a,b,c,d.设从中任取2人,至多有1人在分数段[70,80)为事件A,则基本事件空间包含的基本事件有(m,n),(m,a),(m,b),(m,c),(m,d),…,(c,d),共15种,则基本事件A包含的基本事件有(m,n),(m,a),(m,b),(m,c),(m,d),(n,a),(n,b),(n,c),(n,d),共9种,∴P(A)=915=35.破解频率分布直方图与古典概型相交汇问题的关键:一是观图得数据,会利用频率分布直方图,求出相应区间的频率与频数;二是会用公式,即会利用古典概型的概率计算公式,要特别注意利用列表法、画图法、列举法、列式计算等方法求基本事件的个数.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)附:,K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).【解】(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表K 2的观测值=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.破解此类问题的关键:一是会应用公式作出统计推断,把所给数据代入独立性检验公式求出K 2的观测值K ,并与临界值进行对比,进而作出统计推断;二是利用古典概型的概率公式求概率.1.(2017·济宁二模)某地政府拟在该地一水库上建造一座水电站,用泄流水量发电.图是根据该水库历年的日泄流量的水文资料画成的日泄流量X (单位:万立方米)的频率分布直方图(不完整),已知X ∈[0,120],历年中日泄流量在区间[30,60)的年平均天数为156,一年按364天计.(1)请把频率分布直方图补充完整;(2)已知一台小型发电机,需30万立方米以上的日泄流量才能运行,运行一天可获利润为4000元,若不运行,则每天亏损500元;一台中型发电机,需60万立方米以上的日泄流量才能运行,运行一天可获利10000元,若不运行,则每天亏损800元;根据历年日泄流量的水文资料,水电站决定安装一台发电机,为使一年的日均利润值最大,应安装哪种发电机?解:(1)在区间[30,60)的频率为156364=37,频率组距=37×30=170,设在区间[0,30)上,频率组距=a ,则⎝⎛⎭⎫a +170+1105+1210×30=1,解得a =1210, 补充频率分布直方图如下图:(2)当日泄流量X ≥30(万立方米)时,小型发电机可以运行,则一年中一台小型发电机可运行的天数为:364-1210×30×364=312(天);当日泄流量X ≥60(万立方米)时,中型发电机可以运行,则一年中一台中型发电机可运行的天数为:⎝⎛⎭⎫1105+1210×30×364=156(天); ①若运行一台小型发电机,则一年的日均利润值为: 1364×(312×4000-52×500)=335717(或235007)(元) ②若运行一台中型发电机,则一年的日均利润值为: 1364×(156×10000-208×800)=382847(或268007)(元) 因为382847>335717,故为使水电站一年的日均利润值最大,应安装中型发电机.2.(2017·上饶二模)据统计,2015年“双11”天猫总成交金额突破912亿元.某购物网站为优化营销策略,对11月11日当天在该网站进行网购消费且消费金额不超过1000元的1000名网购者(其中有女性800名,男性200名)进行抽样分析.采用根据性别分层抽样的方法从这1000名网购者中抽取100名进行分析,得到下表:(消费金额单位:元)女性消费情况:选出两名发放网购红包,求选出的两名网购者恰好是一男一女的概率;(2)若消费金额不低于600元的网购者为“网购达人”,低于600元的网购者为“非网购达人”,根据以上统计数据填写2×2列联表,并回答能否在犯错误的概率不超过0.010的前提下认为“是否为‘网购达人’与性别有关?”附:(K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)解:(1)依题意,女性应抽取80名,男性应抽取20名,∴x=80-(5+10+15+47)=3,y=20-(2+3+10+2)=3.设抽出的100名且消费金额在[800,1000)(单位:元)的网购者中有三位女性记为A、B、C;两位男性记为a、b,从5人中任选2人的基本事件有:(A,B),(A,C),(A,a),(A,b),(B,C),(B,a),(B,b),(C,a),(C,b),(a,b)共10个;设“选出的两名网购者恰好是一男一女”为事件M,事件M包含的基本事件有:(A,a),(A,b),(B,a),(B,b),(C,a),(C,b)共6件,∴P(M)=610=35;(2)根据题意,填写2×2列联表如下表所示:则K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)=100×(50×15-30×5)280×20×55×45≈9.091,因为9.091>6.635,所以能在犯错误的概率不超过0.010的前提下认为“是否为‘网购达人’与性别有关”.1.(2016·全国甲卷)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:(1)记A )的估计值; (2)记B 为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求P (B )的估计值;(3)求续保人本年度的平均保费的估计值.解:(1)事件A 发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为60+50200=0.55.故P (A )的估计值为0.55.(2)事件B 发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为30+30200=0.3. 故P (B )的估计值为0.3. (3)由所给数据得调查的0.85a ×0. 30+a ×0.25+1.25a ×0.15+1.5a ×0.15+1.75a ×0.10+2a ×0.05=1.192 5a . 因此,续保人本年度平均保费的估计值为1.192 5a .2.(2017·山西四校联考)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A 配方的频数分布表(1)分别估计用A 配方,B 配方生产的产品的优质品率;(2)已知用B 配方生产的一件产品的利润y (单位:元)与其质量指标值t 的关系式为y =⎩⎪⎨⎪⎧-2,t <94,2,94≤t <102,4,t ≥102.估计用B 配方生产的一件产品的利润大于0的概率,并求用B 配方生产的上述100件产品平均一件的利润.解:(1)由试验结果知,用A 配方生产的新产品中优质品的频率为22+8100=0.3,所以用A配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B 配方生产的产品中优质品的频率为32+10100=0.42,所以用B 配方生产的产品的优质品率的估计值为0.42.(2)由条件知,用B 配方生产的一件产品的利润大于0当且仅当其质量指标值t ≥94,由试验结果知,质量指标值t ≥94的频率为12+42+32+10100=0.96,所以用B 配方生产的一件产品的利润大于0的概率估计值为0.96.用B 配方生产的产品平均一件的利润为 1100×[4×(-2)+54×2+42×4]=2.68(元). 3.(2017·玉林、贵港联考)某市地铁即将于2018年8月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);(2)由以上统计数据填写下面的2×2列联表分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=n (ad-bc )(a +b )(c +d )(a +c )(b +d ).解:(1)“赞成定价者x -1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x -2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x -1-x -2=50.56-38.75=11.81(百元).(2)根据条件可得2×2列联表如下:K 2=50×(7×29-3×11)10×40×18×32≈6.27<6.635,∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”. 4.(2017·开封模拟)甲、乙两人参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图所示,乙的成绩中有一个数的个位数字模糊,在茎叶图中用c 表示.(1)假设c =5,现要从甲、乙两人中选派一人参加数学竞赛,从统计学的角度,你认为派哪位学生参加比较合适?(2)假设数字c 的取值是随机的,求乙的平均分高于甲的平均分的概率.(把频率当作概率)解:(1)若c =5,则派甲参加比较合适,理由如下:x -甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x -乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2乙=18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.∵x -甲=x -乙,s 2甲<s 2乙,∴两人的平均成绩相等,但甲的成绩比较稳定,派甲参加比较合适. (2)由(1)知若x -乙>x -甲,则c >5,∴c =6,7,8,9, 又c 的所有可能取值为0,1,2,3,4,5,6,7,8,9, ∴乙的平均分高于甲的平均分的概率为25.(2017·唐山模拟)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d).解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)=100×(15×25-15×45)260×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.6.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:∑i =116(i -8.5)2≈18.439,∑i =116(x i -x -)(i -8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x --3s ,x -+3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(x --3s ,x -+3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i =1,2,…,n )的相关系数r =∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2∑i =1n(y i -y -)2,0.008≈0.09.解:(1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数r =∑i =116(x i -x -)(i -8.5)∑i =116(x i -x -)2∑i =116(i -8.5)2≈-2.780.212×16×18.439≈-0.18.由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(ⅰ)由于x -=9.97,s ≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(x --3s ,x -+3s )以外,因此需对当天的生产过程进行检查.(ⅱ)剔除离群值,即第13个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑i =116x 2i ≈16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115(1 591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.。
2020新高考数学二轮冲刺概率与统计全归纳(基础中档拔高题全解析)
统计与统计案例
一、考纲解读
1. 理解随机抽样的必要性和重要性。 2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。 3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折 线图、茎叶图,理解它们各自的特点。 4. 理解样本数据标准差的意义和作用,会计算数据标准差。 5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本 数字特征,理解用样本估计总体的思想。 6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。 7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。 8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归 方程。 9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。 (1)独立性检验 了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用。 (2)回归分析 了解回归分析的基本思想、方法及其简单应用。
个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为
A. 1 3
B. 1 2
C. 2 3
D. 3 4
答案:
1.D【解析】将 2 名男同学分别记为 x , y ,3 名女同学分别记为 a ,b ,c .设 “选中的 2 人都是女同学”为事件 A ,则从 5 名同学中任选 2 人参加社区服务的所 有可能情况有 (x, y) ,(x, a) ,(x,b) ,(x, c) ,( y, a) ,( y,b) ,( y, c) ,(a,b) ,(a, c) , (b, c) 共 19 种,其中事件 A 包含的可能情况有 (a,b) , (a, c) , (b, c) 共 3 种,故 P(A) 3 0.3,故选 D.
专题09 概率与统计——2020年高考真题与模拟题理科数学分类汇编(含解析).docx
专题09概率与统计1.[2020年高考全国I卷理数】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据3,yJ(i = l,2, ,20)得到下面的散点图:由此散点图,在1(TC至4(TC之间,下面四个回归方程类型中最适宜作为发芽率y和温度X的回归方程类型的是A.y = a + bxB. y^a + bx1D. y = a + b\nxC. y-a+be*2.[2020年高考全国II卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200 份订单的配货,由于订单量大幅增加,导致订单积压•为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者A.10 名B. 18名C. 24 名D. 32名43.[2020年高考全国III卷理数】在一组样本数据中,1,2,3, 4出现的频率分别为-且工P,T,i=l 则下面四种情形中,对应样本的标准差最大的一组是4.[2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是A.62%B. 56%C. 46%D. 42%5.[2020年高考山东】信息爛是信息论中的一个重要概念.设随机变量X所有可能的取值为1,2, / ,且P(X= i) = Pi > 0(z = 1,2, ,n),£pi=l,定义X 的信息爛H(X) = -£p,log2P,.1=1 i=lA.若〃=1,则H(X)=0B・若兀二2,则H(X)随着p的增大而增大C.若Pi =l(z = l,2, 则H(X)随着"的增大而增大nD.若n=2m,随机变量Y所有可能的取值为1,2, ,m ,且P(Y = j) = p j += 1,2, ,in),则6.【2020年高考江苏】已知一组数据4,2a,3 —a,5,6的平均数为4,则a的值是▲.7.[2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是____ .&【2020年高考天津】从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为频率组距A.10B. 18C. 20D. 369.[2020年高考天津】已知甲、乙两球落入盒子的概率分别为寺和丄.假定两球是否落入盒子互不影响,23则甲、乙两球都落入盒子的概率为__________ ;甲、乙两球至少有一个落入盒子的概率为 _________ •10.【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为则卩@毛= ______________ , £忆)= ________ 11.【2020年高考全国I卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为丄,2(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.12.[2020年高考全国I卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(帀刃(匸1, 2, 20),其中*i和%分别表示第i个样区20 20的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得工兀=60,工x =1200,z=l i=l20 20 20工(兀-元)2=80,工(x-刃2 =9000,工(兀-元)(必-刃= 800.z=l i=l i=l(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(竝,刃)(=1, 2, 20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.J(x,. -x)(X--刃附:相关系数了= 儿曰”,血Q I.414.(兀f吃(y厂才V Z=1 Z=113.[2020年高考全国III卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次(1)分别估计该市一天的空气质量等级为1, 2, 3, 4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2x2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?14. 【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 100天空气中的 PM2.5和SO?浓度(单位:(ig/m 3),得下表:(1) 估计事件“该市一天空气中PM2.5浓度不超过75,且SO?浓度不超过150”的概率; (2) 根据所给数据,完成下面的2x2列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO?浓度有关?n^ad-bcf(a + b)(c+d)(a + c)(b + d)P(K 2 > k)0.050 0.010 0.001 k3.8416.63510.82818.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:附:&n(ad - be)- (a+ b)c + d)(a + c)(b + d)3.8416.63510.828P (K0.050 0.010 0.001支持不支持 支持 不支持 方案一 200人 400人 300人 100人 方案二350人250人150人250人假设所有学生对活动方案是否支持相互独立.(I)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(II )从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一 的概率;(III )将该校学生支持方案的概率估计值记为Po,假设该校年级有500名男生和300名女生,除一年 级外其他年级学生支持方案二的概率估计值记为A ,试比较p 0与卩的大小.(结论不要求证明)1. C2020-广东省高三二模】高二某班共有45人,学号依次为1、2、3 ............... 45,现按学号用系统抽样的办 法抽取一个容量为5的样本,已知学号为6、24、33的同学在样本中,那么样本中还有两个同学的学号 应为 A. 15,43 D. 14,42 x 2 + y 2= 4的内部随机选取一点P,则P 取自Q 的概率为 5 7 A.— B.—24 24 11 17 C.— D.—24243. [2020-河南省高三三模】“二进制”来源于我国古代的《易经》,该书中有两类最基本的符号:“一”和“--”, 其中“一”在二进制中记作T”,在二进制中记作“0”.如符号“三”对应的二进制数011⑵化为十进制 的计算如下:011⑵二0X 22+1X 21+1X 2°=3 <I 0).若从两类符号中任取2个符号进行排列,则得到的二进 制数所对应的十进制数大于2的概率为2. [2020-黑龙江省大庆实验中学高三月考(理)】设不等式组< x+y>0 x-yj^y < 0表示的平面区域为Q,若从圆C :B. 15,42C. 14,431 B. —3 1 D.-44. [2020-河南省高三三模】随着2022年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速上 升,冰雪运动市场需求得到释放,将引领户外用品行业市场增长.下面是2012年至2018年中国雪场滑 雪人次(万人次)与同比增长率的统计图,则下面结论中不正确的是A. 2013年至2018年,中国雪场滑雪人次逐年增加B. 2013年至2015年,中国雪场滑雪人次和同比增长率均逐年增加C. 2018年与2013年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等D. 2018年与2016年相比,中国雪场滑雪人次增长率约为30.5%5. [2020-山东省邹城市第一中学高三其他】2020年初,新型冠状病毒(COVTO-19)引起的肺炎疫情爆 发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方 法后,每周治愈的患者人数如下表所示:周数(X ) 1 2 3 4 5治愈人数0)217 36 93 142由表格可得V 关于x 的二次回归方程为y = 6x 2+a ,则此回归模型第4周的残差(实际值与预报值之差) 为 A. 5 B. 4D. 06. [2020-四川省绵阳南山中学高三一模】从标号分别为1、2、3、4、5的5张标签中随机抽取一张,放回后再随机抽取一张,则抽得的第一张标签的标号与第二张标签的标号恰好相差1的概率为1 A.-2 2 C.—3C. 14 A.-54 C.—25【2020•四川省闻中中学高三其他】中国古代十进制的算筹计数法,在数学史上是一个伟大的创造,算筹 实际上是一根根同长短的小木棍.如图,是利用算筹表示数1—9的一种方法.例如:3可表示为“三”, 26可表示为“=丄”,现有6根算筹,据此表示方法,若算筹不能剩余,则可以用1—9这9个数字表示两 位数中,能被3整除的概率是三三丄丄A 士4567 8 9【2020•山西省高三月考】勒洛三角形是具有类似圆的“定宽性”的曲线,它是由德国机械工程专家、机构 运动学家勒洛首先发现,其作法是:以等边三角形每个顶点为圆心,以边长为半径,在另两个顶点间作 一段弧,三段弧围成的曲边三角形就是勒洛三角形.如图中的两个勒洛三角形,它们所对应的等边三角 形的边长比为1:3,若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率是1 A.-31 C. —9【2020•山东省邹城市第一中学高三其他】下列命题中假命题是A.若随机变量§服从正态分布N (1Q J, P (^<4)= 0.79,则P (^<-2)= 0.21;8 D.—257. 5A.—187C.—16 B.D. 718 5 16 2(TT +VD.厂B.已知直线/丄平面a,直线加//平面0,贝iJ“a//0”是“/丄加”的必要不充分条件;C.若亦lb,则a在b方向上的正射影的数量为RD.命题p:3x<0,e x -x> 1 的否定—ip:X/x>O,e x-x<l10.【2020•上海高三二模】某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选 _________ 户.11.[2020-辽河油田第三高级中学高三三模】楹子是客家传统农具,南方农民犁开田地后,仍有大的土块.农人便用六片叶齿组成槻轴,两侧装上木板,人跨开两脚站立,既能掌握平衡,又能增加重量,让牛拉动辐轴前进,压碎土块,以利于耕种.这六片叶齿又对应着菩萨六度,即布施、持戒、忍辱、精进、禅定与般若.若甲、乙每人依次有放回地从这六片叶齿中随机取一片,则这两人选的叶齿对应的“度”相同的概率为_________ .12.[2020-辽宁省沈阳二中高三其他】为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核•记X表示学生的考核成绩,并规定X>85为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:3I 0 I I 640 1 3 3 4 5 871 23677788I 1 2 4 5 990 0 12 3、(I )从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核优秀的概率;(II)从图中考核成绩满足X G[80,89]的学生中任取2人,求至少有一人考核优秀的概率;(III)记P(a<X<b)表示学生的考核成绩在区间[a,b]的概率,根据以往培训数据,规定当厂兀—85 、P —<1 >0.5时培训有效.请根据图中数据,判断此次中学生冰雪培训活动是否有效,并说明I 丿理由.13.[2020-重庆高三月考】某市积极贯彻落实国务院《“十三五”节能减排综合工作方案》,空气质量明显改善•该市生态环境局统计了某月(30天)空气质量指数,绘制成如下频率分布直方图.已知空气质量等级与空气质量指数对照如下表:(1)(2)根据体质检查情况,医生建议:当空气质量指数高于90时,市民甲不宜进行户外体育运动;当 空气质量指数高于70时,市民乙不宜进行户外体育运动(两人是否进行户外体育运动互不影响).① 从这30天中随机选取2天,记乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数为X, 求X的分布列和数学期望;② 以该月空气质量指数分布的频率作为以后每天空气质量指数分布的概率(假定每天空气质量指数互 不影响),甲、乙两人后面分别随机选择3天和2天进行户外体育运动,求甲恰有2天,且乙恰有1天 不宜进行户外体育运动的概率.14. 【2020•东莞市光明中学高三月考】某土特产超市为预估2020年元旦期间游客购买土特产的情况,对2019(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为P (每 次抽奖互不影响,且P 的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2 次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数X (元)的分布 列并求其数学期望.附表:15. [2020-山东省邹城市第一中学高三其他】为了提高生产线的运行效率,工厂对生产线的设备进行了技术 改造.为了对比技术改造后的效果,采集了生产线的技术改造前后各20次连续正常运行的时间长度(单 位:天)数据,并绘制了如下茎叶图:改造前改造后9 8 6 5 5 1 886654322102 2 6 7 95 4 4 1 3 23345677894 112 2 3(I )(1)设所采集的40个连续正常运行时间的中位数加,并将连续正常运行时间超过加和不超过加 的次数填入下面的列联表:附:参考公式和数据:K 2= n(ad _ bc)~(a + b)(c + d)(a + c)(b + d) n=a+b+c+d.试写出a, b, c, d的值;(2)根据(1)中的列联表,能否有99%的把握认为生产线技术改造前后的连续正常运行时间有差异?n(ad - be)"附:K2 =(a + b)(c + d)(a + c)(b + d)(II)工厂的生产线的运行需要进行维护.工厂对生产线的生产维护费用包括正常维护费、保障维护费两种对生产线设定维护周期为T天(即从开工运行到第天(kwN*)进行维护•生产线在一个生产周期内设置几个维护周期,每个维护周期相互独立•在一个维护周期内,若生产线能连续运行,则不会产生保障维护费;若生产线不能连续运行,则产生保障维护费.经测算,正常维护费为0.5万元/次;保障维护费第一次为0.2万元/周期,此后每增加一次则保障维护费增加0.2万元.现制定生产线一个生产周期(以120天计)内的维护方案:7 = 30, k = l, 2, 3, 4.以生产线在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及期望值.16.[2020-四川省绵阳南山中学高三一模】为调查某地区被隔离者是否需要社区非医护人员提供帮助,用简单随机抽样方法从该地区调查了500位被隔离者,结果如下:1 估计该地区被隔离者中,需要社区非医护人员提供帮助的被隔离者的比例;2能否有99%的把握认为该地区的被隔离者是否需要社区非医护人员提供帮助与性别有关?17. [2020-四川省阎中中学高三其他】共享单车进驻城市,绿色出行引领时尚.某市有统计数据显示,2020 年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示.若 将共享单车用户按照年龄分为“年轻人”(20岁一39岁)和“非年轻人”(19岁及以下或者40岁及以上) 两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5 次的称为“不常使用单车用户”.已知在“经常使用单车用户”中有丄是“年轻人”.50.0% 40.0% 30.0% 20.0% 10.0% 0.0%(1)现对该市市民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容 量为200的样本,请你根据图表中的数据,补全下列2x2列联表,并根据列联表的独立性检验,判 断是否有85%的把握认为经常使用共享单车与年龄有关?使用共享单车情况与年龄列联表年轻人非年轻人合计 经常使用单车用户120不常使用单车用户80 合计16040200(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人” 人数为随机变量X,求X 的分布列与期望. 参考数据:独立性检验界值表P (K 2>k 0) 0.150.100.0500.0250.010ko2.0722.7063.841 5.024 6.635图1共享单车用户年龄等级分布图2共享单车使用频率分布45 ;5%n(ad_bc)2其中,K2n=a+b+c+d(a + b)(c + d)(a + c)(b + d)18.[2020-山西省高三月考】在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.(1)一研究团队统计了某地区1000名患者的相关信息,得到如下表格,进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关(2)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,其中潜伏期超过6天的人数最有可能(即概率最大)是多少?附:下面的临界值表仅供参考.n(ad-bc)2(参考公式:K2 -(a+b)(c + d)(a + c)(b + d)其中n-a + b + c + d专题09概率与统计1. [2020年高考全国I 卷理数】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据3,yJ(i = l,2,,20)得到下面的散点由此散点图,在l (rc 至40弋之间,下面四个回归方程类型中最适宜作为发芽率y 和温度X 的回归方 程类型的是 B. y — a + bx 2 D. y = a + b\nx【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率丁和温度x 的回归方程类型的是y^a + blnx. 故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2. [2020年高考全国II 卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200 份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已 知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每 天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需 要志愿者温度/°cA. y = a + bx C. y-a+be xC.24 名D. 32 名【答案】B【解析】由题意,第二天新增订单数为500 + 1600-1200 = 900,设需要志愿者x名,50x丽10.95, x>17.1,故需要志愿者18名.故选:B【点晴】本题主要考查函数模型的简单应用,属于基础题.43.[2020年高考全国III卷理数】在一组样本数据中,1,2,3,4出现的频率分别为P1,P2,P3,P4 ,且工必=1 ,i=l 则下面四种情形中,对应样本的标准差最大的一组是A. = °丄卩2 =卩3 = °・4B. 口= ”4 = 04 卩2 =卩3 = 0・1C. Pi = P4 = 0.2, P? — P3 = 0.3D. Pi = P4 = 0.3, P2 = P3 = 0.2【答案】B【解析】对于A选项,该组数据的平均数为^=(1+4)X0.1+(2+3)X0.4=2.5,方差为s; = (1 — 2.5)2 x0.1 +(2 — 2.5『x0.4 +(3-2.5『x0.4 +(4-2.5『x0.1 = 0.65 ;对于B选项,该组数据的平均数为込=(1 + 4)X0.4+(2 + 3)x 0.1 = 2.5,方差为s; =(1 —2.5『x0.4 +(2 —2.5『x0.1 +(3 —2.5『x0.1 +(4 —2.5『x0.4 = 1.85;对于C选项,该组数据的平均数为^=(1+4)X0.2+(2+3)X0.3=2.5,方差为$: = (1 — 2.5『x0.2 +(2-2.5『x0.3 +(3-2.5『x0.3 +(4-2.5『x0.2 = 1.05 :对于D选项,该组数据的平均数为^=(1+4)X0.3+(2+3)X0.2=2.5,方差为5^=(1-2.5)2 x0.3 +(2-2.5)2 x0.2 +(3-2.5『x0.2 +(4-2.5『x0.3 = 1.45.因此,B选项这一组标准差最大.故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.4.【2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是【答案】C【解析】记“该中学学生喜欢足球”为事件A, “该中学学生喜欢游泳”为事件B,贝F该中学学生喜欢足球或游泳”为事件A + B,“该中学学生既喜欢足球又喜欢游泳”为事件A B,则P(A) = 0.6, P(B) = 0.82, P( A+B) = 0.96,所以P(4) + P(B) — P(4 + B) =0.6 + 0.82 —0.96 = 0.46所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.5.[2020年高考山东】信息嫡是信息论中的一个重要概念.设随机变量X所有可能的取值为1,2,,”,且P(X=i) =P, >0(i = l,2, = 定义X 的信息爛H(X) = -£p,log2P,.1=1 Z=1A.若”=1,则H(X)=0B.若”=2,则H(X)随着必的增大而增大C.若Pi =-(i = l,2, ,n),则H(X)随着"的增大而增大nD.若n=2m,随机变量Y所有可能的取值为1,2, ,m ,且P(Y = j) = + p2tn+i_j(j = 1,2, ,m),则H(X)<H(Y)【答案】AC【解析】对于A选项,若〃=1,贝畀=1,卩1=1,所以H(X)= -(lxlog21) = 0,所以A选项正确.对于 B 选项,若〃 =2 ,贝0 Z = 1,2 , 2 = 1 — Pi,所以H(X)= -[pi -log2 p+(l-pj.log2(l-pj],当A 时’H(X)= -]右呢2占+扌•log?』’3(3 3 1 ] \半Pl =才时,H(x) =-打dog2 二+ 了1082才]两者相等,所以B选项错误.对于C选项,若卩:=丄(7 = 1,2, ,“),贝I]nH(X )二一 -*log 2- xn = -log 2- = log 2n,\n nJ n则H(X )随着"的增大而增大,所以C 选项正确.对于D 选项,若n = 2m,随机变量Y 的所有可能的取值为1,2, ,m ,且P (Y = j^ = p.+ p 2m+l _j1H (X )=-工门・log2B =工门 Jog? —i=li=lPi+ A m -1 • l°g2 + 02”, * l°g2丄•Plm-1 Plm门>0(心1,2, ,2同,所以[乔匕,所以腺亍匕 , 1 1 1所以 A-log 2 — > A ■ log? -------------------- ,Pi Pi + 卩2,”+一 所以H (X )>H (Y ),所以D 选项错误. 故选:AC【点睛】本小题主要考查对新定义“信息嫡”的理解和运用,考查分析、思考和解决问题的能力,涉及对 数运算和对数函数及不等式的基本性质的运用,属于难题. 6.【2020年高考江苏】已知一组数据4,2a,3-a,5,6的平均数为4,则a 的值是 ▲.【答案】2【解析】•••数据4,2a, 3 —a, 5,6的平均数为4 4+2a+3—Q +5+6 = 20,即 a = 2. 故答案为:2.【点睛】本题主要考查平均数的计算和应用,比较基础.7. [2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概【解析】根据题意可得基本事件数总为6x6 = 36个.诃1喝法++ (% + Pn+)lOg2]Pm +Pm+1喝由于点数和为5的基本事件有(1,4),(4,1),(2,3),(3,2)共4个.•••出现向上的点数和为5的概率为P = — = ~.36 9故答案为:_•【点睛】本题考查概率的求法,考查古典概型、列举法等基础知识,考查运算求解能力,是基础题.8.【2020年高考天津】从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),[5.45,5.47),[5.47,5.49]-并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间C. 20D. 36【答案】B【解析】根据直方图,直径落在区间[5.43,5.47)之间的零件频率为:(6.25 + 5.00)x0.02 = 0.225,则区间[5.43,5.47)内零件的个数为:80x0.225 = 18.故选:B.【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题.9.[2020年高考天津】已知甲、乙两球落入盒子的概率分别为寺和丄.假定两球是否落入盒子互不影响,23则甲、乙两球都落入盒子的概率为_________ ;甲、乙两球至少有一个落入盒子的概率为__________ .【答案】| |6 3【解析】甲、乙两球落入盒子的概率分别为2 3且两球是否落入盒子互不影响,所以甲、乙都落入盒子概率为2 3 6甲、乙两球都不落入盒子的概率为(l-|)x(l-|) = |,2所以甲、乙两球至少有一个落入盒子的概率为亍.故答案为:7;6 3【点睛】本题主要考查独立事件同时发生的概率,以及利用对立事件求概率,属于基础题.10.[2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1个,不放回,直到取出红球为止•设此过程中取到黄球的个数为歹,则电= ______________ ,陀)= _________ 【答案】1【解析】因为^ = 0对应事件为第一次拿红球或第一次拿绿球,第二次拿红球,所以P(^ = 0) = - + -x- = -,随机变量£ = 0,1,2,^=1)=2X1+2X1X1+1X2X1=1;43432432 3所以E(^)^0x^ + lx~ + 2x^l.故答案为:亍;1.【点睛】本题考查古典概型概率、互斥事件概率加法公式、数学期望,考查基本分析求解能力,属基础题.11.【2020年高考全国I卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为二,2(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为2 •16(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为丄16乙连胜四场的概率为2;16丙上场后连胜三场的概率为二O1113所以需要进行第五场比赛的概率为1 ---—--=4.16 16 8 4(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为补.O比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为2,16 8 8因此丙最终获胜的概率为1+2+1+1=丄.8 16 8 8 1612.[2020年高考全国I卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(盼yi)(i=l,2,…,20),其中益和必分别表示第i个样区。
概率与统计高考题分析与考前复习建议
试验方案合理.
➢作统计推断与解释
03 解决概率统计问题的思维模式
➢概率问题的过程与基本思维模式
古典概型 几何概型 超几何分布 二项分布 正态分布
概率的意义
构建 概率 模型 计算
结果 科学 分析 计数
概率性质 条件概率 独立事件
计数原理 枚举法
➢统计问题的过程与基本思维模式
确定 总体
提取 样本
|| 表现:用数学的眼光观察世界,
用数学的思维分析世界,
用数学的语言表达现实世界 。
二、近五年全国高考概率统计题分布
2020年全国 ⅠⅡ Ⅲ 小题 5 3 3
2019全国 Ⅰ ⅡⅢ
6 53 14 13
2018年全国 2017年全国 2016年全国 Ⅰ Ⅱ ⅢⅠ Ⅱ ⅢⅠⅡ Ⅲ
3 8 8 2 13 3 4 10 4 10
➢超几何分布与二项分布
相同点:N个产品中有M个次品不放回抽取,每次抽到次品的概率和 有放回抽取抽到次品的概率是相同的(因为抽签与顺序无关).
不同点:每次抽取,二项分布是相互独立的,超几何分布不是.
至于在解决实际问题中,当N很大时,明明是不放回的情形我 们也常用二项分布去做.因为它们都只是一个数学模型.二项分布计 算要简单的多.
➢ 题还能怎么出?
看待问题不盲目、不套用——素养
基 整理数据有策略
于 考
说明问题是核心
试 拥有观点是素养
请各位老师指正!
概率模型
古典概型
随机
(必修)
几何概型
现象
离散型随机变
二项式分布
概 率
量(选择性必修)
超几何分布
随机抽样
统
收集数据
分层抽样
2020版高考理科数学考前猜押致胜高考必须掌握的20个热点4概率与统计答案解析(2页)
2020版高考理科数学考前猜押致胜高考必须掌握的20个热点4概率与统计1.C 由已知将1 000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列,公差d=10,所以a n=10n-4(n∈N*),若8=10n-4,解得n=1.2,不合题意;若200=10n-4,解得n=20.4,不合题意;若616=10n-4,则n=62,符合题意;若815=10n-4,则n=81.9,不合题意.2.D 抛掷三枚古钱币出现的基本事件有:正正正,正正反,正反正,反正正,正反反,反正反,反反正,反反反,共8种,其中出现两正一反的共有3种,故所求概率为.3.A 由茎叶图可知A的平均成绩为=92.B的平均成绩为=98.从茎叶图上可以看出B的数据比A的数据集中,B的成绩比A的成绩稳定.4.A 因为中位数为12,所以x+y=4,数据的平均数为×(2+2+3+4+x+y+20+19+19+20+21)=11.4,要使该总体的标准差最小,即方差最小,所以(10+x-11.4)2 +(10+y-11.4)2=(x-1.4)2+(y-1.4)2≥2=0.72,当且仅当x-1.4=y-1.4,即x=y=2时取等号,此时总体标准差最小,4x+2y=12,故选A.5.B 7天假期的楼房认购量为:91、100、105、107、112、223、276;成交量为:8、13、16、26、32、38、166.对于①,日成交量的中位数是26,故错;对于②,日平均成交量为:≈42.7,有1天日成交量超过日平均成交量,故错; 对于③,根据图形可得认购量与日期不是正相关,故错;对于④,10月7日认购量的增幅大于10月7日成交量的增幅,正确.故选B.6.C 如图,直角三角形的斜边长为=13,设内切圆的半径为r,则5-r+12-r=13,解得r=2,所以内切圆的面积为πr2=4π,所以豆子落在其内切圆外部的概率是P=1-=1-.。
2020届高三理科数学概率与统计解题方法规律技巧详细总结版
全国课标卷概率统计必有一道解答题,而且题型相对固定,一般是第 19 题,有时也在第 18 题,难度中等,课标
I 比课标 II、课标 III 难度略大.概率统计解答题主要涉及生产活动的如质检(一等品、二等品次数期望等)、检 验费用、疾病治疗和实验等 ;电路的通断概率;体育竞技赛事胜负概率问题(包括球类、棋类等);保险费用问 题;样本估计总体(常利用频率分布直方图、频率、频数表、茎叶图、条形图、扇形图等)问题;线性回归方程
在 n 次独立重复试验中,用 X 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为 p,则 P(X=k)=Cknpk(1 -p)n-k(k=0,1,2,…,n),此时称随机变量 X 服从二项分布,记作 X~B(n,p),并称 p 为成功概率.
2020 届高三理科数学概率与统计解题方法规律技巧详细总结版
(1)利用定义,分别求 P(A)和 P(AB),得
,这是求条件概率的通法.
(2)借助古典概型概率公式,先求事件 A 包含的基本事件数 n(A),再求事件 A 与事件 B 的交事件中包含的基本事件
数 n(AB),得
.
4. 求相互独立事件同时发生的概率的主要方法
(1)利用相互独立事件的概率乘法公式直接求解.
的求解及应用其进行预报(偏重数据处理能力,2015 年那题也可以说是非线性);独立性检验问题;以及考查互
斥事件、对立事件、独立事件等概率及条件概率(较少涉及)的问题;n 次独立重 复试验的分布列和数学期望、
超几何分布的分布列和数学期望等等。这些考题充分体现了概率统计是研究随机现象统计规律的重要特征,为相 关部门的决策提供帮助和技术支持。当然这些知识点也常常与函数(包括分段函数)的最值问题、不等式(特别 是基本不等式)有机结合.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率模型
古典概型
随机
(必修)
几何概型
现象
离散型随机变
二项式分布
概 率
量(选择性必修)
超几何分布
随机抽样
统
收集数据
分层抽样
计
统计的
整理数据 统计图表
全过程
分析数据 均值,方差,分布
数据处理 的能力
从数据中提取信息
统计 案例
回归分析 独立性检验
用样本反映总体的规律体现了归纳的思维方式,这是 数据分析的关键。
➢选择合适的模型进行分析
(2010年长春市高中毕业班第二次调研测试)从某高中入校新生中随机抽取 100名学生,测得他们的身高情况如下表所示.
(1)请在频率分布表中的①、②位置填上相应的数据,并在所给的坐标系中补 全频率分布直方图(如上图),再根据频率分布直方图估计众数的值; (2)按身高分层抽样,现已抽取20人参加某项活动,其中有3名学生担任迎宾工 作,记这3名学生中“身高低于170 cm”的人数为ξ,求ξ的分布列及期望.
概率与统计主题 典型考题分析与考前复习方略
目录
01 02 03
核心素养与基本框架 典型题目分析 新高考方案带来的变化
01 核心素养与基本框架
➢ 数据分析
均匀抽样 随机思想
作出统计 推断和解释
选择合适的模型 进行分析
对数据的分析处理 样本估计总体
➢数学运算
统计量 的计算
统计量 的估计
概率计算
计数原理 的应用
➢选择恰当的模型进行分析
(2018北京)电影公司随机收集了电影的有关数据,经分类整理得到下表:
电影类型
第一类
第二类
第三类
第四类
第五类
第六类
电影部数
140
50
300
200
800Leabharlann 510好评率0.4
0.2
0.15
0.25
0.2
0.1
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.
假设所有电影是否获得好评相互独立.
=P(A)(1–P(B))+(1–P(A))P(B). 由题意知:P(A)估计为0.25,P(B)估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (3)D1 > D4 > D2 = D5 > D3 > D6 .
➢选择恰当的模型(与函数结合)
(2018全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交 付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时, 先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品 作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合 格品相互独立. (1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0. (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的 值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要 对每件不合格品支付25元的赔偿费用. ①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 X,求EX; ②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产 品作检验?
k=1,2,3,4,5,6).写出方差D1,D2 ,D3 ,D4 ,D5,D6的大小关系.
( 1 )样本中电影的总部数:140+50+300+200+800+510=2000, 第四类电影中获得好评的电影部数:200×0.25=50, 故所求概率为 50 0.025 .
2000
(2)设事件A为“从第四类电影中随机选出的电影获得好评”,事件B为“从第 五类电影中随机选出的电影获得好评”. 故所求概率为:P( AB AB )=P( AB )+P(AB )
➢对数据进行分析,用样本估计总体
(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入 增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化 情况,统计了该地区新农村建设前后农村的经济收入构成比例,得 到如下饼图:
建设前经济收入构成比例
建设后经济收入构成比例
则下面结论中不正确的是( A ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
➢统计问题的过程与基本思维模式
确定 总体
提取 样本
估计 总体
➢概率问题的过程与基本思维模式
计数原理 枚举法
科学 概率 计数 分布
随机观念
随机 构建 事件 模型
概率性质 条件概率 独立事件
古典概型 几何概型 超几何分布 二项分布 正态分布
02 典型题目分析
1.对数据进行分析,用样本估计总体 2.如何选用恰当概率模型 3.作出统计推断与解释 4.二轮复习仍要明晰概念
(1)20件产品中恰有2件不合格品的概率为f(p)=C202p2·(1-p)18. 因此f′(p)=C202[2p(1-p)18-18p2(1-p)17]=2C202p(1-p)17(1-10p). 令f′(p)=0,得p=0.1. 当p∈(0,0.1)时,f′(p)>0; 当p∈(0.1,1)时,f′(p)<0. 所以f(p)的最大值点为p0=0.1. (2)由(1)知,p=0.1. ①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1), X=20×2+25Y,即X=40+25Y. 所以EX=E(40+25Y)=40+25EY=490. ②若对余下的产品作检验,则这一箱产品所需要的检验费用为400元. 由于EX>400,故应该对余下的产品作检验.
➢对数据进行分析,用样本估计总体
(2017-2018东城区一模)从高一年级随机选取100名学生,对他们 期 中考试的数学和语文成绩进行分析,成绩如图所示.
(Ⅰ)从这100名学生中随机选取一人,求该生数 学和语文成绩均低于60分的概率; (Ⅱ)从语文成绩大于80分的学生中随机选取两 人,记这两人中数学成绩高于80分的人数为 ξ , 求 ξ 的分布列和数学期望; (Ⅲ)试判断这100名学生数学成绩的方差a与语 文成绩的方差b的大小.(只需写出结论)
(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影 的概率;
(2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率; (3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“k 1 ”表示第k类电影得到人们喜欢,“k 0 ”表示第k类电影没有得到人们喜欢(