2020年高考数学(理)热点题型:概率与统计(含答案)
2020年高考数学(理)名师提分专题: 概率与统计(全国版含解析)
【答案】C 【解析】必然事件的概率为 1,不可能事件的概率为 0,不确定事件的概率在 [0,1] .故 A,B 错误;概 率为 0 的事件可能是随机事件,如在任意实数中任取一个数,恰好为 2,概率为 0,可能发生,是随机 事件;又如在圆上任取一点,恰好为圆心,概率是 0,可能发生,是随机事件,故 D 错误.故选 C.
6.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90 后从事互 联网行业者岗位分布条形图,则下列结论中不一定正确的是
1
(3)树状图法:树状图是进行列举的一种常用方法,适用于有顺序的问题及较复杂问题中基本事件数 的探求. (4)运用排列组合知识计算.
2.将一根长为 6m 的绳子剪为二段,则其中一段大于另一段 2 倍的概率为( )
A.1
3
B.2
3
C.2
5
D.3
5
【答案】B
【解答】:绳子的长度为 6m,折成两段后,设其中一段长度为 x,则另一段长度 6﹣x,
提分专题:概率与统计
1.从分别写有 1,2,3 的 3 张卡片中随机抽取 1 张.放回后再随机抽取 1 张.则抽得的第一张卡片上的数
不小于第二张卡片上的数的概率为( )
A.2
3
【答案】B
B.1
3
C.5
9
D.4
9
【解答】:从分别写有 1,2,3 的 3 张卡片中随机抽取 1 张.放回后再随机抽取 1 张.
P(X=0)=(1)2(1)2= 1 ,
2
3
2020年高考数学试题分类汇编专题概率理精品
2020年高考试题数学(理科)概率、选择题1.(2020年高考浙江卷理科9)有5本不同的书,其中语文书2本,数学书2本,物理书1本.若将其随机的并排摆放到书架的同一层上,则同一科目的书都不相邻的概率(A) 1(B) 2(C) 3(D )45 5 5 5【答案】B一2A2 AnA^ A^A^A: 2【解析】由古典概型的概率公式得P 1 A3A2 A22.A55 52.(2020年高考辽宁卷理科5)从1, 2, 3, 4, 5中任取2各不同的数,事件A= "取到的2 个数之和为偶数”,事件B= "取到的2个数均为偶数”,则P (Bl A)=(A) 1 (B) 1 (C) 2(D) 18 4 5 2Ci 2 cl 1 u , 1解析:由题意nP(A)= —―5―, P(AB) = —= 一P(B I At=--------- =—.耳5 弓10 , PA 4小组,每位同学参加各个小组的可能性相则这两位同学参加同一个兴趣小组的概率为同,(A) 1(B) 1(C) - (D)-3 2 3 4解析:因为甲乙两位同学参加同一个小组有3种方法,两位同学个参加一个小组共有3 13 3 9种方法;所以,甲乙两位同学参加同一个小组的概率为- -9 3点评:本题考查排列组合、概率的概念及其运算和分析问题、解决问题的能力。
4.(2011年高考广东卷理科6)甲、乙两队断排球决赛.现在的憧&是甲队只要再忘一局就获冠军,乙队初再高两局才能得国军.若两队胜每扃的概率相同.则甲队获谆冠军的概率为()金太阳新课标资源网【解析】D.由题得甲队获得冠军有两种情况,第一局胜或第一局输第二局胜,所以甲队获 (1113)3 (2020年高考全国新课标卷理科4)有3个兴趣小组,甲、乙两位同学各自参加其中一个得冠军的概率p ————.所以选D.2 2 2 45.(2020年高考湖北卷理科7)如图,用K、A、A2三类不同的元件连成一个系统 .当K正常工作且A i 、A 2至少有一个正常工作时,系统正常工作 .已知K 、A 、A 2正常工作的概率依次为0.9、0.8、0.8 ,则系统正常工作的概率为B.0.864C.0.720D.0.576[-S]~~-in ———---- j L -----答案:B解析:系统正常工作概率为 C 2 0.9 0.8 (1 0.8) 0.9 0.8 0.8 0.864 ,所以选B.6. (2020年高考陕西卷理科 10)甲乙两人一起去“ 2020西安世园会”,他们约定,各自独立 地从1到6号景点中任选4个进行游览,每个景点参观1小时,则最后一小时他们同在一个景点的概率是(A) — (B) 1 (Q 9(D) 1369 36 6【答案】D1到6号景点中任选4个进行游览有C 6c 6c 5c 5c 4c 4c 1c 3种,且等可能,最后一小时他们同在一个景点有 C 6c 5c 5c 4c 4c 30种,则最后一小时他们同在一个7. (2020年高考四川卷理科 12)在集合1,2,3,4,5中任取一个偶数a 和一个奇数b 构成以原点为起点的向量 a= (a,b ).从所有得到的以原点为起点的向量中任取两个向量为邻边作 平行四边形.记所有作成的平行四边形的个数为 n ,其中面积不超过.4的平行四边形的个数为m ,则m () n(A) —(B) 1(C) 2(D)-15 3 5 3答案:B2解析:基本事件:从(2,1),(2,3),(2,5),(4,1),(4,5),(4,3)选取 2个,n C 6 3 5 15 .其中面积为2的平行四边形的个数(2,3)(4,5);(2,1)(4,3);(2,1)(4,1);其中面积为4的平行四 边形的为(2,3)(2,5);(2,1)(2,3) ; m=3+2=5 故 m — 1.n 15 3A.0.960【解析】:各自独立地从 景点的概率是p1111111C111111101C6 C6c5c5 C4c4c3c38. (2020年高考福建卷理科 4)如图,矩形 ABCN,点E 为边CD 的中点,若在矩形 ABCD内部随机取一个点 Q,则点Q 取自△ ABE 内部的概率等于8.12D.—3二、填空题:1 .(2020年高考浙江卷理科15)某毕业生参加人才招聘会,分别向甲、乙、丙三个公司投递2 .....................................、,了个人简历,假定该毕业生得到甲公司面试的概率为 上,得到乙、丙两公司面试的概率为3〜 C 、 1 J 、口…… P ( 0) 一,则随机变量的数学期望12 5【答案】53 2 . (2020年高考江西卷理科 12)小波通过做游戏的方式来确定周末活动,他随机地往单位圆内投掷一点,若此点到圆心白^距离大于。
2020高考数学(理)专项复习《概率统计》含答案解析
概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型,学习某些离散型随机变量分布列及其期望、方差等内容,初步学会利用离散型随机变量思想描述和分析某些随机现象的方法,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§11-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.6.条件概率与事件的独立性条件概率:一般的,设A 、B 为两个事件,且P (A )>0,称P (B |A )=)()(A P B A P I 为在事件A 发生的条件下,事件B 发生的概率.一般把P (B |A )读作“A 发生的条件下B 发生的概率”.在古典概型中,用n (A )表示事件A 中基本事件的个数,则有P (B |A )=)()(A n B A n I .事件的独立性:设A 、B 为两个事件,如果P (B |A )=P (B ),则称事件A 与事件B 相互独立,并称事件A 、B 为相互独立事件.若A 、B 为两个相互独立事件,则A 与A 、A 与B 、A 与B 也都相互独立.若事件A 与事件B 相互独立,则P (A ∩B )=P (A )·P (B ).【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.5.在具体情境中,了解条件概率,了解两个事件相互独立的概念及独立事件的概率乘法公式,并能解决一些简单的实际问题.【例题分析】例1(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)} 由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P(Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 一个口袋中装有大小相同的2个红球,3个黑球和4个白球,从口袋中一次摸出一个球,摸出的球不再放回.(1)连续摸球2次,求第一次摸出黑球,第二次摸出白球的概率;(2)连续摸球2次,在第一次摸到黑球的条件下,求第二次摸到白球的概率;(3)如果摸出红球,则停止摸球,求摸球次数不超过3次的概率.【分析】本题是一个古典概型问题,因为基本事件空间中所含基本事件的个数较多,宜用排列组合公式计算,当然也可利用两个计数原理计数.本题第二问是条件概率问题.做第三问时,要分为三个事件:“第一次摸到红球”,“第一次摸到不是红球,第二次摸到红球”,“前两次摸到不是红球,第三次摸到红球”,显然三个事件是互斥事件.解:(1)从袋中依次摸出2个球共有29A 种结果,第一次摸出黑球、第二次摸出白球有3×4=12种结果,则所求概率6112291==A P (或6184931=⨯=P ). (2)设“第一次摸到黑球”为事件A ,“第二次摸到白球”为事件B ,则“第一次摸到黑球,且第二次摸到白球”为事件A ∩B ,又31)(=A P ,P (A ∩B )61=,所以或⋅==213161)|(A B P (或2184)|(==A B P ). (3)第一次摸出红球的概率为1912A A ,第二次摸出红球的概率为291217A A A ,第三次摸出红球的概率为391227A A A ,则摸球次数不超过3次的概率为⋅=++=12739122729121719122A A A A A A A A P 【评析】利用古典概型求解时,求基本事件的个数和事件发生的总数时求法要一致,若无序则都无序,若有序则都有序,分子和分母的标准要相同.在求事件个数时常用列举法(画树状图、列表、坐标系法),有时也与排列组合联系紧密,计算时灵活多变,但要注意分类讨论,做到不重不漏.要正确识别条件概率问题,理解P (A),P (A ∩B ),P (B |A )的含义.例4 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例5 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }.所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.例6 如图,用A 、B 、C 三类不同的元件连结成两个系统N 1、N 2,当元件A 、B 、C 都正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,已知元件A 、B 、C 正常工作的概率为0.80、0.90、0.90,分别求系统N 1、N 2正常工作的概率.【分析】三个元件能否正常工作相互独立.当元件A 、B 、C 同时正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,而B 、C 至少有一个正常工作的概率可通过其对立事件计算.解:设元件A 、B 、C 正常工作为事件A 、B 、C ,则P (A )=0.8,P (B)=0.9,P (C)=0.9,且事件A 、B 、C 相互独立.(1)系统N 1正常工作的概率为p 1=P (A ·B ·C )=P (A )·P (B )·P (C )=0.80×0.90×0.90=0.648.(2)元件B 、C 至少有一个正常工作的概率为1-P (B ·C )=1-P (B )·P (C )=1-0.1×0.1=0.99,所以系统N 2正常工作的概率为p 2=P (A )·(1-P (B ·C ))=0.80×0.99=0.792.【评析】本题以串、并联为背景,重点在正确理解题意.在计算几个事件同时发生的概率时,要先判断各个事件之间是否相互独立.独立事件、互斥事件、对立事件的概率各有要求,要依据题目特点,巧妙地选用相关方法.例7 每次抛掷一枚质地均匀的骰子(六个面上分别标以数字1,2,3,4,5,6).(1)连续抛掷3次,求向上的点数之和为3的倍数的概率;(2)连续抛掷6次,求向上的点数为奇数且恰好出现4次的概率.【分析】向上点数之和为3的倍数共有6种情况,计数时要不重不漏;向上点数为奇数的概率为21,连续抛掷6次是独立重复试验. 解:(1)向上的点数之和为3的结果有1种情况,为6的结果共10种情况,为9的结果共25种情况,为12的结果共25种情况,为15的结果共10种情况,为18的结果共1种情况.所以⋅=⨯⨯+++++=3166611025251012P(2)因为每次抛掷骰子,向上的点数为奇数的概率为P =21, 根据独立重复试验概率公式有⋅==⋅⋅6415)21()21(24463C P 【评析】独立重复试验是一类重要的概率问题,要善于分析模型的特点,正确合理的解题.例8 某学校进行交通安全教育,设计了如下游戏,如图,一辆车模要直行通过十字路口,此时前方交通灯为红灯,且该车模前面已有4辆车模依次在同一车道上排队等候(该车道只可以直行或左转行驶).已知每辆车模直行的概率是53,左转行驶的概率是52,该路口红绿灯转换间隔时间均为1分钟.假设该车道上一辆直行去东向的车模驶出停车线需要10秒钟,一辆左转去北向的车模驶出停车线需要20秒钟,求:(1)前4辆车模中恰有2辆车左转行驶的概率;(2)该车模在第一次绿灯亮起时的1分钟内通过该路口的概率(汽车驶出停车线就算通过路口).【分析】该车模1分钟内通过路口包含2种情况:4辆车都直行,3辆车直行1辆车左转.解:(1)设前4辆车模中恰有2辆左转行驶为事件A ,则⋅=⨯=625216)52()53()(2224C A P (2)设该车在第一次绿灯亮起时的1分钟内通过该路口为事件B ,其中4辆车模均 直行通过路口为事件B 1,3辆直行1辆左转为事件B 2,则事件B 1、B 2互斥.=+=+=)()()()(2121B B P B B P B P ⋅=⨯+62529752)53()53(334444C C 【评析】善于从复杂的背景中发现线索,体会其实质.善于转化问题的叙述,恰当的分类.练习11-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.独立工作的两套报警系统遇危险报警的概率均为0.4,则遇危险时至少有一套报警系统报警的概率是( )A .0.16B .0.36C .0.48D .0.644.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题5.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.6.设每门高射炮命中飞机的概率都是0.6.今有一敌机来犯,要有99%的把握击中敌机,至少需要______门高射炮.7.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.8.一个口袋中有4个白球,2个黑球.有放回的取出3个球,如果第一次取出的是白球,则第三次取出的是黑球的概率为______;不放回的取出3个球,在第一次取出的是白球的条件下,第二次取出的是黑球的概率为______.三、解答题9.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.10.某个高中研究性学习小组共有9名学生,其中有3名男生和6名女生.在研究学习过程中,要进行两次汇报活动(即开题汇报和结题汇报),每次汇报都从这9名学生中随机选1人作为代表发言.设每人每次被选中与否均互不影响;(1)求两次汇报活动都是由小组成员甲发言的概率;(2)求男生发言次数不少于女生发言次数的概率.11.3名志愿者在10月1日至10月5日期间参加社区服务工作,若每名志愿者在这5天中任选两天参加社区服务工作,且各名志愿者的选择互不影响.求(1)这3名志愿者中在10月1日都参加社区服务工作的概率;(2)这3名志愿者中在10月1日至多有1人参加社区服务工作的概率.§11-2 概率(二)【知识要点】1.离散型随机变量及其分布列随机变量:如果随机试验的可能结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化的,我们把这样的变量X 叫做一个随机变量.如果随机变量X 的所有可能的取值都能一一列举出来,则称X 为离散型随机变量.离散型随机变量的分布列:设离散型随机变量X 的可能取值为x 1,x 2,…,x n ,X 取到i i ii 12+…+p n =1.离散型随机变量在某个范围取值的概率等于它取这个范围内各个值的概率和.其中0<p <1,q =1-,则称离散型随机变量服从参数为p 的二点分布.二项分布:一般的,在相同条件下重复地做n 次试验,各次试验的结果相互独立,称为n 次独立重复试验.在n 次独立重复试验中,事件A 恰好发生k 次的概率为==)(k X P k n k k n q p C -(其中p 为在一次试验中事件A 发生的概率,q =1-p ,k =0,1,…,n ).若将n次独立重复试验中事件A 发生的次数设为X ,则X 的分布列为超几何分布:一般的,设有总数为N 件的两类物品,其中一类有M 件,从所有物品中任取n 件(n ≤N ),这n 件中所含这类物品件数X 是一个离散型随机变量,它取值为m 时的概率为m C C C m X P n Nm n M N m M ≤==--0()(≤l ,其中l 为n 和M中较小的一个).我们称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X 服从参数为N 、M 、n 的超几何分布.2.随机变量的数字特征及正态分布1122i i n n 了离散型随机变量的平均取值水平.称i i n i p X E xX D ⋅-=∑=21))(()(为随机变量X 的方差,它反映了离散型随机变量X 相对于期望的平均波动大小(或说离散程度),其算数平方根)(X D 为随机变量X 的标准差,记作σ (X ),方差(或标准差)越小表明X 的取值相对于期望越集中,否则越分散.均值与方差的性质:①E (aX +b )=aE (X )+b ②D (aX +b )=a 2D (X )若X 服从两点分布,则E (X )=p ,D (X )=pq ;若X ~B (n ,p ),则E (X )=np ,D (X )=npq . 正态曲线:函数),((21)(222)(+∞∝-∈=--x e x x σμσπϕ,其中μ ∈R ,σ >0)的图象为正态分布密度曲线,简称正态曲线.其特点有:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,关于x =μ 对称;③曲线在x =μ 处达到峰值σ2π1;④曲线与x 轴之间的面积为1;⑤当σ 一定时,曲线随着μ 的变化而沿x 轴平移;⑥当μ 一定时,曲线的形状由σ 决定.σ 越小,曲线越“瘦高”,表示总体的分布越集中;σ 越大,曲线越“矮胖”,表示总体的分布越分散.正态分布:如果对于任意实数a <b ,随机变量X 满足=≤<)(b X a P dx x ba )(ϕ⎰,则称X 的分布为正态分布;随机变量X 服从参数μ 、σ 的正态分布,记作N ~(μ ,σ 2).正态分布的三个常用数据:①P (μ -σ <X <μ +σ )=68.3%;②P (μ -2σ <X <μ +2σ )=95.4%;③P (μ -3σ <X <μ +3σ )=99.7%.【复习要求】①在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性.②通过实例,理解超几何分布及其导出过程,并能进行简单的应用.③通过实例,理解n 次独立重复试验的模型及二项分布,并能解决一些简单的实际问题. ④通过实例,理解取有限值的离散型随机变量期望、方差的概念,能计算简单离散型随机变量的期望、方差,并能解决一些实际问题.⑤通过实际问题,认识正态分布曲线的特点及曲线所表示的意义.【例题分析】例1 一袋中装有编号为1、2、3、4、5、6的6个大小相同的小球,现从中随机取出3个球,以X 表示取出球的最大号码,(1)求X 的分布列;(2)求X >4的概率;(3)求E (X ).【分析】随机变量X 可能取的值为3、4、5、6,应用古典概型求得X 取每一个值的概率,就可以写出分布列.解:(1)随机变量X 可能取的值为3、4、5、6,且,203)4(,2011)3(362336======C C X P C X P 3624)5(C C X P ==103206==,212010)6(3625====C C X P ,所求X 的分布列为(2)==+==>)6()5()4(X P X P X P ⋅54 (3).25.5216103520342013)(=⨯+⨯+⨯+⨯=X E 【评析】离散型随机变量的分布列反映了一次试验的所有可能结果(X 的所有可能取值),以及取得每个结果(X 的每一个值)的概率.书写分布列首先要根据具体情况正确分析X 可取的所有值,然后利用排列组合及概率的有关知识求得每个x i 所对应的概率p i ,最后列成表格.要注意不同的X 值所对应的事件之间是互斥的,求离散型随机变量在某一范围的概率等于它取这个范围内各个值的概率和.例2 袋中装有大小相同的5个红球、5个白球,现从中任取4个球,其中所含红球的个数为X ,写出X 的分布列,并求X 的期望.【分析】袋中共有10个球,从中任取4个,所含红球的个数为0、1、2、3、4,每个事件的概率可以利用古典概型求解.解:随机变量X 可取的值有0、1、2、3、4,)0(=X P =,42121054104505==⋅C C C )1(=X P =215210504103515==⋅C C C ,)2(=X P 21102101004102525===⋅C C C ,===⋅4101535)3(C C C X P 21050 215=,4212105)4(4100545==⋅==C C C X P , 分布列为2424213212211420)(=⨯+⨯-+⨯+⨯+⨯=X E 【评析】本题的随机变量X 服从参数为N ,M ,n 的超几何分布,其中N =10,M =5,n =4.例3 某人练习射击,每次击中目标的概率为31. (1)用X 表示击中目标的次数.①若射击1次,求X 的分布列和期望;②若射击6次,求X 的分布列和期望;(2)若他连续射击6次,设ξ为他第一次击中目标前没有击中目标的次数,求ξ的分布列;(3)他一共只有6发子弹,若击中目标,则不再射击,否则子弹打完为止,求他射击次数η 的分布列.【分析】射击问题常被看做是独立重复试验.ξ的取值为0到6,η 的取值为1到6. 解:(1)①X 服从二点分布⋅=31)(X E ②X 服从二项分布)6,,1,0()2()1()(),1,6(~66Λ===-k C k X P B k k k ,分布列为.236)(=⨯=X E (2)ξ的取值为0到6,ξ=k (k =0,1,…,5)表示第k +1次击中目标,前k 次都没击中目标,则P (ξ=k )=)5,,1,0(31)32(.Λ=k k ,ξ=6表示射击6次都未击中目标,==)6(ξP6)2(.ξ的分布列为(3)η 的取值为1到6.η =k (k =1,2,…,5)表示第k 次时第一次击中目标,==)(k P η 6;1)2(.1=-ηk 表示前5次都没有击中目标,5)2()6(==ξP .η 的分布列为“X =k ”.在计算满足二点分布和二项分布的随机变量的期望和方差时,可直接应用公式计算.例4 甲乙两名射手在一次射击中的得分为两个相互独立的随机变量X 和Y ,且X 和Y 的分布列为计算X 和Y 【分析】先由分布列所提供的数据用期望和方差公式计算,再根据实际意义作出分析. 解:E (X )=8.85,D (X )=2.2275;E (Y )=5.6,D (Y )=10.24.由于E (X )>E (Y ),说明甲射击的平均水平比乙高;由于D (X )<D (Y ),说明甲射击的环数比较集中,发挥比较稳定,乙射击的环数比较分散,技术波动较大,不稳定,由此可以看出甲比乙的技术好.【评析】正确记忆期望和方差的公式,在分布列中,期望是每个变量乘以它所对应的概率再相加,求方差要先求期望,再作差、平方、乘以相应概率再相加.科学对待计算结果,正确分析数据所表达的实际意义.例5 设b 和c 分别是先后抛掷一枚骰子得到的点数,用随机变量ξ表示方程x 2+bx +c =0实根的个数(重根按一个计).(1)求方程x 2+bx +c =0有实根的概率;(2)求在先后两次出现的点数中有5的条件下,方程x 2+bx +c =0有实根的概率;(3)若η =2ξ+1,求ξ、η 的数学期望和方差;【分析】本题概率问题是古典概型,要分别求出事件中所含元素的个数,第一问事件“二次方程有实根”等价于“∆=b 2-4c ≥0”,b 、c 的值都取自{1,2,3,4,5,6};第二问是条件概率问题;第三问先求ξ的期望和方差,再由公式求η 的期望和方差.解:(1)由题意知:设基本事件空间为Ω,记“方程x 2+bx +c =0没有实根”为事件A ,“方程x 2+bx +c =0有且仅有一个实根”为事件B ,“方程x 2+bx +c =0有两个相异实数”为事件C ,Ω中基本事件总数为36个,A 中的基本事件总数为17个,B 中的基本事件总数为2个,C 中的基本事件总数为17个.又因为B ,C 是互斥事件,故所求概率⋅=+=+=36193617362)()(C B B P P (2)记“先后两次出现的点数中有5”为事件D ,“方程x 2+bx +c =0有实数”为事件E ,由上面分析得D P D P (,3611)(=∩367)=E ,∴⋅==117)()()|(D P E D P D E P I (Ⅱ)由题意ξ的可能取值为0,1,2,则,3617}2{,181}1{,3617}0{======&ξξξP P P 故ξ的分布列为:所以.18173617·)12(181·)11(3617·(0-0-,136172181136170222=-+-+==⨯+⨯+⨯=ξξD E 9342)12(,312)12(2==+==+=+=ξξξξηηD D D E E E 【评析】本题是一道概率的综合题,由07山东卷改编而得.在古典概型中解决条件概率问题时,概率公式是=)|(A B P )()()()(A n B A n A P B A P I I =.具有线性关系的两个随机变量的期望和方差之间的关系是b X aE b aX E +=+)()(,)()(2X D a b aX D =+.例6 (1)设两个正态分布N (μ 1,21σ)(σ 1>0)和N (μ 2,22σ)(σ 2>0)的密度函数图象如图所示.则有( )。
2020年高考数学(理)专题训练附解答: 概率与统计
(2020江西省上饶市一模)在贯彻中共中央、国务院关于精准扶贫政策的过程中,某单位在某市定点帮扶某村100户贫困户.为了做到精准帮扶,工作组对这100户村民的年收入情况、危旧房情况、患病情况等进行调查,并把调查结果转化为各户的贫困指标x .将指标x 按照[)0,0.2,[)0.2,0.4,[)0.4,0.6,[)0.6,0.8,[]0.8,1.0分成五组,得到如图所示的频率分布直方图.规定若00.6x ≤<,则认定该户为“绝对贫困户”,否则认定该户为“相对贫困户”;当00.2x ≤<时,认定该户为“亟待帮住户”.工作组又对这100户家庭的受教育水平进行评测,家庭受教育水平记为“良好”与“不好”两种.(1)完成下面的列联表,并判断是否有95%的把握认为绝对贫困户数与受教育水平不好有关:受教育水平良好受教育水平不好 总计 绝对贫困户 2相对贫困户 52总计100(2)上级部门为了调查这个村的特困户分布情况,在贫困指标处于[)00.4,的贫困户中,随机选取两户,用X 表示所选两户中“亟待帮助户”的户数,求X 的分布列和数学期望()E X .附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.15 0.10 0.05 0.025 0k2.072 2.7063.8415.024专题 概率与统计大题肢解一统计案例与数学期望【肢解1】完成下面的列联表,并判断是否有95%的把握认为绝对贫困户数与受教育水平不好有关:受教育水平良好受教育水平不好 总计 绝对贫困户 2相对贫困户 52总计100【肢解2】上级部门为了调查这个村的特困户分布情况,在贫困指标处于[)00.4,的贫困户中,随机选取两户,用X 表示所选两户中“亟待帮助户”的户数,求X 的分布列和数学期望()E X .【解析】(1)由题意可知,绝对贫困户有()0.250.500.75++0.210030⨯⨯=(户),可得出如列联表:受教育水平良好受教育水平不好总计绝对贫困户 2 28 30 相对贫困户 18 5270总计2080 100()22100182825230702080K ⨯⨯-⨯=⨯⨯⨯ 4.762 3.841≈>. 故有95%的把握认为绝对贫困户数与受教育水平不好有关.(2)贫困指标在[)00.4,的贫困户共有()0.250.50.210015+⨯⨯=(户), “亟待帮助户”共有0. 250.21005⨯⨯=(户), 依题意X 的可能值为0,1,2,()210215307C P X C ===,()1110521510121C C P X C ===,()252152221C P X C ===, 则X 的分布列为X0 12P371021221故31022()012721213E X =⨯+⨯+⨯=.1.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表; (2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算K 2的值;(3)查表比较K 2与临界值的大小关系,作统计判断. 2.求离散型随机变量ξ的均值与方差的方法:(1)理解ξ的意义,写出ξ可能取的全部值; (2)求ξ取每个值的概率; (3)写出ξ的分布列; (4)由均值的定义求E (ξ); (5)由方差的定义求D (ξ).【拓展1】(2020届辽宁省沈阳市东北育才学校高三上学期第三次模拟)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄频率分布表和使用手机支付的人数如下所示:(年龄单位:岁)年龄段[15,25) [25,35) [35,45) [45,55) [55,65) [65,75]频率 0.1 0.32 0.28 0.22 0.05 0.03 使用人数828241221若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关?年龄低于45岁 年龄不低于45岁 使用手机支付 不使用手机支付参考数据:)(02k K P ≥ 0.0250.010 0.005 0.0010k3.841 6.635 7.879 10.828参考公式:()()()()22()n ad bc K a b c d a c b d -=++++.【解析】(1)由统计表可得,低于45岁人数为70人,不低于45岁人数为30人, 可得列联表如下:年龄低于45岁 年龄不低于45岁 使用手机支付 60 15 不使用手机支付1015于是有K2的观测值2100(60151510)14.28610.82875257030k ⨯⨯-⨯=≈⨯⨯⨯>. 故可以在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关.【拓展2】(2020届辽宁省沈阳市东北育才学校高三上学期第三次模拟)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄频率分布表和使用手机支付的人数如下所示:(年龄单位:岁)年龄段 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75] 频率 0.1 0.32 0.28 0.22 0.05 0.03 使用人数828241221(1)若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关?年龄低于45岁 年龄不低于45岁 使用手机支付 不使用手机支付(2)若从年龄在[55,65),[65,75]的样本中各随机选取2人进行座谈,记选中的4人中“使用手机支付”的人数为X ,求随机变量X 的分布列和数学期望.【解析】由题意可知,X 的所有可能取值为0,1,2,3,相应的概率为:()223222531010C C P X C C ===,()112213223222225353215C C C C C P X C C C C ==+=,()11122322222222535313230C C C C C P X C C C C ==+=,()212222531315C C P X C C ===, 于是X 的分布列为:X 0 1 2 3P110 25 1330 115所以1213122()0123105301515E X =⨯+⨯+⨯+⨯=.1.(2019年湖北模拟)通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:男女总计爱好402060不爱好152540总计5545100(1)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由.(2)利用分层抽样的方法从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派2人参加某项校际挑战赛,求选出的2人中恰有1名女大学生的概率.附:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.【解析】(1)因为K2=100×(40×25-20×15)255×45×60×40≈8.249>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.(2)由题意,抽取的6人中,有男生4名,分别记为a,b,c,d;女生2名,分别记为m,n.则抽取的结果共有15种:(a,b),(a,c),(a,d),(a,m),(a,n),(b,c),(b,d),(b,m),(b,n),(c,d),(c,m),(c,n),(d,m),(d,n),(m,n),设“选出的2人中恰有1名女大学生”为事件A,事件A所包含的基本事件有8种:(a,m),(a,n),(b,m),(b,n),(c,m),(c,n),(d,m),(d,n).则P(A)=815.故选出的2人中恰有1名女大学生的概率为815.2.(2019年湖北省宜昌模拟)某公司招收大学毕业生,经过综合测试录用了14名男生和6名女生,这20名毕业生的测试成绩如茎叶图所示(单位:分).公司规定:成绩在180分以上者到甲部门工作,在180分以下者到乙部门工作,另外只有成绩高于180分的男生才能担任助理工作.变式训练一(1)现用分层抽样的方法从甲、乙两部门中选取8人.若从这8人中再选3人,求至少有一人来自甲部门的概率;(2)若从甲部门中随机选取3人,用X表示所选人员中能担任助理工作的人数,求X的分布列及数学期望.【解析】(1)根据茎叶图可知,甲、乙两部门各有10人,用分层抽样的方法,应从甲、乙两部门中各选取21045⨯=人.记“至少有一人来自甲部门”为事件A,则()3 4 3 813114CP AC=-=.故至少有一人来自甲部门的概率为1314.(2)由题意可知,X的可能取值为0,1,2,3.()()()()03122130646464643333101010101311 0,1,2,3301026C C C C C C C CP X P X P X P XC C C C============,所以X的分布列为X0 1 2 3P1303101216所以()1311901233010265E X=⨯+⨯+⨯+⨯=.(2019河南洛阳市模拟)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM 2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A、B、C三个城市进行治霾落实情况抽查.(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为12,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.大题肢解二二项分布【肢解1】若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;【肢解2】每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为12,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.【解析】(1)随机选取,共有34=81种不同方法,恰有一个城市没有专家组选取的有C13(C14A22+C24)=42种不同方法,故恰有一个城市没有专家组选取的概率为4281=1427.(2)设事件A:“一个城市需复检”,则P(A)=1-4)21(=1516,X的所有可能取值为0,1,2,3,P(X=0)=C03·3)161(=14 096,P(X=1)=C13·3)161(·1)1615(=454 096,P(X=2)=C23·1)161(·2)1615(=6754 096,P(X=3)=C33·3)1615(=3 3754 096.所以X的分布列为X 0123P14 096454 0966754 0963 3754 096由题意知X~B)1615,3(,所以E(X)=3×1516=4516.二项分布的期望与方差如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量.1.(2019四川成都诊断)某部门为了解一企业在生产过程中的用水量情况,对其每天的用水量做了记录,得到了大量该企业的日用水量的统计数据,从这些统计数据中随机抽取12天的数据作为样本,得到变式训练二如图所示的茎叶图(单位:吨).若用水量不低于95吨,则称这一天的用水量超标.(1)从这12天的数据中随机抽取3个,求至多有1天的 用水量超标的概率;(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X 为未来这3天中用水量超标的天数,求X 的分布列、数学期望和方差. 【解析】(1)记“从这12天的数据中随机抽取3个,至多有1天的用水量超标”为事件A ,则P (A )=C 14C 28C 312+C 38C 312=168220=4255.(2)以这12天的样本数据中用水量超标的频率作为概率,易知用水量超标的概率为31. X 的所有可能取值为0,1,2,3, 易知X ~B )31,3(,P (X =k )=C k 3kk-⋅⋅3)32()31(,k =0,1,2,3,则P (X =0)=827,P (X =1)=49,P (X =2)=29,P (X =3)=127.所以随机变量X 的分布列为X 0 1 2 3 P8274929127所以数学期望E (X )=3×13=1,D (X )=3×13×)311(-=23.2.(2020湖南师范大学附属中学高三上学期第二次月考)某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表:从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(1)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定?(2)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X近似满足~(218,140)X N,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?【解析】(1)根据抽样调查数据,一、二等品所占比例的估计值为0.2000.3000.2600.0900.0250.875++++=,由于该估计值小于0.92,故不能认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定.(2)由频率分布直方图知,一、二、三等品的频率分别为0.375、0.5、0.125,故在样本中用分层抽样方法抽取的8件产品中,一等品3件,二等品4件,三等品1件,再从这8件产品中随机抽取4件,一、二、三等品都有的情况有2种:①一等品2件,二等品1件,三等品1件;②一等品1件,二等品2件,三等品1件,故所求的概率211121 3413414837C C C C C CPC+==.(3)“质量提升月”活动前,该企业这种产品的质量指标值的均值约为1700.0251800.11900.22000.32100.262200.092300.025⨯+⨯+⨯+⨯+⨯+⨯+⨯200.4=“质量提升月”活动后,产品质量指标值X近似满足()~218,140X N,则()218E X=. 所以,“质量提升月”活动后的质量指标值的均值比活动前大约提升了17.6.1.(2019云南省高考模拟)一个口袋中装有大小形状完全相同的红色球1个、黄色球2个、蓝色球*()n n N ∈个,现进行从口袋中摸球的游戏:摸到红球得1分、摸到黄球得2分、摸到蓝球得3分.若从这个口袋中随机的摸出2个球,恰有一个是黄色球的概率是158. (1)求n 的值;(2)从口袋中随机摸出2个球,设ξ表示所摸2球的得分之和,求ξ的分布列和数学期望()E ξ.【解析】(1)由题意有158231211=++n n C C C ,即03522=--n n ,解得3=n ; (2)ξ取值为3,4,5,6.则1112262(3)15C C P C ξ===,11213222664(4)15C C C P C C ξ==+=, 1123262(5)5C C P C ξ===,23261(6)5C P C ξ===, ξ的分布列为:ξ 34 5 6P215 415 25 15故242114()34561515553E ξ=⨯+⨯+⨯+⨯=. 2.(2020福建省厦门外国语学校高三上学期12月月考)自由购是通过自助结算方式购物的一种形式.某大型超市为调查顾客使用自由购的情况,随机抽取了100人,统计结果整理如下:20以下 [20,30) [30,40) [40,50) [50,60) [60,70] 70以上 使用人数312 17 6 4 2 0 未使用人数 0314363(1)现随机抽取1名顾客,试估计该顾客年龄在[30,50)且未使用自由购的概率;(2)从被抽取的年龄在BF 使用自由购的顾客中,随机抽取3人进一步了解情况,用X 表示这3人中年龄在[50,60)的人数,求随机变量X 的分布列及数学期望;(3)为鼓励顾客使用自由购,该超市拟对使用自由购的顾客赠送1个环保购物袋.若某日该超市预计有5000人购物,试估计该超市当天至少应准备多少个环保购物袋. 【解析】(1)在随机抽取的100名顾客中, 年龄在[30,50)且未使用自由购的共有3+14=17人,所以,随机抽取1名顾客,估计该顾客年龄在[30,50)且未使用自由购的概率为17100P =. (2)X 所有的可能取值为1,2,3,()124236115C C P X C ===,()214236325C C P X C ===,()304236135C C P X C ===. 所以X 的分布列为X1 2 3P1553 15所以X 的数学期望为131()1232555E X =⨯+⨯+⨯=. (3)在随机抽取的100名顾客中,使用自由购的共有3121764244+++++=人, 所以该超市当天至少应准备环保购物袋的个数估计为4450002200100⨯=.3.(2020广东省惠州市高三第三次调研)为发挥体育核心素养的独特育人价值,越来越多的中学将某些体育项目纳入到学生的必修课程.惠州市某中学计划在高一年级开设游泳课程,为了解学生对游泳的兴趣,某数学研究学习小组随机从该校高一年级学生中抽取了100人进行调查.(1)已知在被抽取的学生中高一(1)班学生有6名,其中3名对游泳感兴趣,现在从这6名学生中随机抽取3人,求至少有2人对游泳感兴趣的概率;(2)该研究性学习小组在调查中发现,对游泳感兴趣的学生中有部分曾在市级或市级以上游泳比赛中获奖,具体获奖人数如下表所示.若从高一(8)班和高一(9)班获奖学生中随机各抽取2人进行跟踪调查,记选中的4人中市级以上游泳比赛获奖的人数为ξ,求随机变量ξ的分布列及数学期望.班级一)1(一)2( 一)3( 一)4( 一)5( 一)6( 一)7( 一(8) 一(9) 一(10)⋯市级2233443342⋯比赛获奖人数 市级以上比赛获奖人数22 1 0 23 3 2 1 2⋯【解析】(1)记事件i A {=从6名学生抽取的3人中恰好有i 人有兴趣,i 0=,1,2,3}; 则2A 与3A 互斥,故所求概率为()()()()2323P 2P A A P A P A =+=+至少人感兴趣 213033333366C C C C C C ⋅⋅=+101202==; (2)由题意知,随机变量ξ的所有可能取值有0,1,2,3;()22342255C C 9P ξ0C C 50⋅===⋅,()11221234342255C C C C C 12P ξ1C C 25⋅⋅+⋅===⋅,()22111243242255C C C C C 3P ξ2C C 10⋅+⋅⋅===⋅ ()21242255C C 1P ξ3C C 25⋅===⋅. 则ξ的分布列为:ξ0 1 2 3p950 1225 310 125数学期望为()9241526E ξ0123505050505=⨯+⨯+⨯+⨯=. 4.(2019·河北高考模拟)某次招聘分为笔试和面试两个环节,且只有笔试过关者方可进入面试环节,笔试与面试都过关才会被录用.笔试需考完全部三科,且至少有两科优秀才算笔试过关,面试需考完全部两科且两科均为优秀才算面试过关.假设某考生笔试三科每科优秀的概率均为23,面试两科每科优秀的概率均为34. (1)求该考生被录用的概率;(2)设该考生在此次招聘活动中考试的科目总数为ξ,求ξ的分布列与数学期望. 【解析】(1)该考生被录用,说明该考生笔试与面试均得以过关.所以=P 3223221335[()+()]=3334412C ⨯⨯⨯. (2)易得ξ的可能取值为3 ,5 ,所以(=3)=1P ξ-3223221207[()+()]=1-=3332727C ⨯, 或(=3)=P ξ31231127()+()=33327C ⨯ ,所以20(=5)=1-(=3)=27P P ξξ,或(=5)=P ξ322322120()+()=33327C ⨯ ,ξ的分布列为:ξ3 5P727 2027所以720121()=3+5=272727E ξ⨯⨯. 5.(2019江西省新八校联考)某种水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:等级 标准果 优质果 精品果 礼品果 个数10304020(1)若将频率是为概率,从这100个水果中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率;(结果用分数表示)(2)用样本估计总体,果园老板提出两种购销方案给采购商参考, 方案1:不分类卖出,单价为20元/kg . 方案2:分类卖出,分类后的水果售价如下:等级标准果优质果 精品果 礼品果 售价(元/kg ) 16182224从采购单的角度考虑,应该采用哪种方案?(3)用分层抽样的方法从这100个水果中抽取10个,再从抽取的10个水果中随机抽取3个,X 表示抽取的是精品果的数量,求X 的分布列及数学期望()E X .【解析】(1)设从100个水果中随机抽取一个,抽到礼品果的事件为A ,则201()1005P A ==, 现有放回地随机抽取4个,设抽到礼品果的个数为X ,则1~(4,)5X B ,所以恰好抽到2个礼品果的概率为22244196(2)C ()()55625P X ===, (2)设方案2的单价为ξ,则单价的期望值为134216548848()1618222420.61010101010E ξ+++=⨯+⨯+⨯+⨯==, 因为()20E ξ>,所以从采购商的角度考虑,应该采用第一种方案. (3)用分层抽样的方法从100个水果中抽取10个,则其中精品果4个,非精品果6个, 现从中抽取3个,则精品果的数量X 服从超几何分布,所有可能的取值为0,1,2,3,则36310C 1(0)C 6P X ===;2164310C C 1(1)C 2P X ===; 1264310C C 3(2)C 10P X ===;34310C 1(3)C 30P X ===, 所以X 的分布列如下:X0 1 2 3P1612 310 130所以11316()01236210305E X =⨯+⨯+⨯+⨯=.6.(2020山西省晋城市高三第一次模拟)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:年份2014 20152016 2017 2018 销量(万台) 810132524某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:购置传统燃油车购置新能源车总计男性车主 6 24 女性车主 2 总计30(1)求新能源乘用车的销量y 关于年份x 的线性相关系数r ,并判断y 与x 是否线性相关; (2)请将上述22⨯列联表补充完整,并判断是否有90%的把握认为购车车主是否购置新能源乘用车与性别有关;(3)若以这30名购车车主中购置新能源乘用车的车主性别比例作为该地区购置新能源乘用车的车主性别比例,从该地区购置新能源乘用车的车主中随机选取50人,记选到女性车主的人数为X,求X 的数学期望与方差.参考公式:12211()()()()niii n niii i x x y y r x x y y ===--=--∑∑∑,22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++.63525≈,若0.9r >,则可判断y 与x 线性相关. 附表:20()P K k ≥0.10 0.05 0.025 0.010 0.001k2.7063.841 5.024 6.635 10.828【解析】(1)依题意,2014201520162017201820165x ++++==,810132524165y ++++==,故51()()(2)(8)(1)(6)192847iii x x y y =--=-⨯-+-⨯-+⨯+⨯=∑,521()411410ii x x =-=+++=∑,521()643698164254i i y y =-=++++=∑,则51552211()()47470.940.9102542635()()iii iii i x x y y r x x y y ===--===≈>⨯--∑∑∑故y 与x 线性相关.(2)依题意,完善表格如下:购置传统燃油车 购置新能源车 总计 男性车主 18 6 24 女性车主 2 4 6 总计2010302230(18426)15 3.75 2.70620102464K ⨯⨯-⨯===>⨯⨯⨯故有90%的把握认为购车车主是否购置新能源乘用车与性别有关. (3)依题意,该地区购置新能源车的车主中女性车主的概率为42105=, 则2(50,)5X B :, 所以2()50205E X =⨯=,22()50(1)1255D X =⨯⨯-=. 7.(2020云南省昆明市第一中学高三一轮检测)某城市为鼓励人们乘坐地铁出行,地铁公司决定按照乘客经过地铁站的数量实施分段优惠政策,不超过30站的地铁票价如下表:乘坐站数x 100≤<x2010≤<x2030x <≤票价(元)369现有甲、乙两位乘客同时从起点乘坐同一辆地铁,已知他们乘坐地铁都不超过30站,甲、乙乘坐不超过10站的概率分别为14,13;甲、乙乘坐超过20站的概率分别为12,13. (1)求甲、乙两人付费相同的概率;(2)设甲、乙两人所付费用之和为随机变量X ,求X 的分布列和数学期望. 【解析】(1)由题意知甲乘坐超过10站且不超过20站的概率为1111424--=,乙乘坐超过10站且不超过20站的概率为1111333--=, 设“甲、乙两人付费相同”为事件A ,则()11114343P A =⨯+⨯ 111233+⨯=,所以甲、乙两人付费相同的概率是13.(2)由题意可知X 的所有可能取值为:6,9,12,15,18.()11164312P X ==⨯=,()11943P X ==⨯ 111436+⨯=,()11112432P X ==⨯+ 11113433⨯+⨯=,()11112432P X ==⨯+ 1134⨯=,()11118236P X ==⨯=.因此X 的分布列如下:X6912 1518P11216131416所以X 的数学期望()1169126E X =⨯+⨯ 11121534+⨯+⨯ 1511864+⨯=. 8.(2020东北三省三校联合模拟)“移动支付、高铁、网购、共享单车”被称为中国的“新四大发明”.为了帮助50岁以上的中老年人更快地适应“移动支付”,某机构通过网络组织50岁以上的中老年人学习移动支付相关知识.学习结束后,每人都进行限时答卷,得分都在[]50,100内.在这些答卷(有大量答卷)中,随机抽出200份,统计得分绘出频率分布直方图如图.(1)求出图中a 的值,并求样本中,答卷成绩在[)80,90上的人数;(2)以样本的频率为概率,从参加这次答卷的人群中,随机抽取4名,记成绩在80分以上(含80分)的人数为X ,求X 的分布列和期望.【解析】(1)依题意,()2 376 2101,a a a a a ⨯++++=故0.005a =, 故成绩在[)80,90上的频率为600.3,a = 答卷成绩在[)80,90上的人数为2000.360; ⨯=(2)由样本的频率分布直方图知成绩在80分以上(含80分)的频率为2805a =, 依题意,24,5X B ⎛⎫- ⎪⎝⎭,故()04042381055625P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()31423216155625P X C ⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭, ()()22423442321623962,35562555625P X C P X C ⎛⎫⎛⎫⎛⎫⎛⎫====== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭, ()4442316455625P X C α⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, 所以X 的分布列为X0 1 2 34P816252166252166259662516625所以X 的数学期望为()28455E X =⨯=.。
2020年高考数学试题分类汇编 专题概率 理 精品
2020年高考试题数学(理科)概率一、选择题:1.(2020年高考浙江卷理科9)有5本不同的书,其中语文书2本,数学书2本,物理书1本.若将其随机的并排摆放到书架的同一层上,则同一科目的书都不相邻的概率(A)15(B)25(C)35(D )45【答案】B【解析】由古典概型的概率公式得522155222233232222=+-=AAAAAAAP.2. (2020年高考辽宁卷理科5)从1,2,3,4,5中任取2各不同的数,事件A=“取到的2个数之和为偶数”,事件B=“取到的2个数均为偶数”,则P(B︱A)=(A)18(B)14(C)25(D)123. (2020年高考全国新课标卷理科4)有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为(A)13(B)12(C)23(D)34解析:因为甲乙两位同学参加同一个小组有3种方法,两位同学个参加一个小组共有933=⨯种方法;所以,甲乙两位同学参加同一个小组的概率为3193=点评:本题考查排列组合、概率的概念及其运算和分析问题、解决问题的能力。
【解析】D.由题得甲队获得冠军有两种情况,第一局胜或第一局输第二局胜,所以甲队获得冠军的概率.43212121=⨯+=P所以选D.5.(2020年高考湖北卷理科7)如图,用K、A1、A2三类不同的元件连成一个系统.当K正常工作且A1、A2至少有一个正常工作时,系统正常工作.已知K、A1、A2正常工作的概率依次为0.9、0.8、0.8,则系统正常工作的概率为A.0.960B.0.864C.0.720D.0.576答案:B解析:系统正常工作概率为120.90.8(10.8)0.90.80.80.864C⨯⨯⨯-+⨯⨯=,所以选B. 6.(2020年高考陕西卷理科10)甲乙两人一起去“2020西安世园会”,他们约定,各自独立地从1到6号景点中任选4个进行游览,每个景点参观1小时,则最后一小时他们同在一个景点的概率是(A)136(B)19(C)536(D)16【答案】D【解析】:各自独立地从1到6号景点中任选4个进行游览有1111111166554433C C C C C C C C种,且等可能,最后一小时他们同在一个景点有11111116554433C C C C C C C种,则最后一小时他们同在一个景点的概率是11111116554433111111116655443316C C C C C C CpC C C C C C C C==,故选D7. (2020年高考四川卷理科12)在集合{}1,2,3,4,5中任取一个偶数a和一个奇数b构成以原点为起点的向量a=(a,b).从所有得到的以原点为起点的向量中任取两个向量为邻边作平行四边形.记所有作成的平行四边形的个数为n,其中面积不超过...4的平行四边形的个数为m,则mn=( )(A)415(B)13(C)25(D)23答案:B解析:基本事件:26(2,1),(2,3),(2,5),(4,1),(4,5),(4,3)23515n C==⨯=从选取个,.其中面积为2的平行四边形的个数(2,3)(4,5);(2,1)(4,3);(2,1)(4,1);其中面积为4的平行四边形的为(2,3)(2,5);(2,1)(2,3); m=3+2=5故51153mn==.8.(2020年高考福建卷理科4)如图,矩形ABCD 中,点E 为边CD 的中点,若在矩形ABCD内部随机取一个点Q ,则点Q 取自△ABE 内部的概率等于 A .14 B .13C .12D .23【答案】C 二、填空题:1.(2020年高考浙江卷理科15)某毕业生参加人才招聘会,分别向甲、乙、丙三个公司投递了个人简历,假定该毕业生得到甲公司面试的概率为23,得到乙、丙两公司面试的概率为p ,且三个公司是否让其面试是相互独立的。
2020高考数学解答题核心素养题型《专题11 概率与统计综合问题》+答题指导)(解析版)
专题11 概率与统计综合问题【题型解读】几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】 (2018·天津卷)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16,现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查. ①用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望;②设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率. 【答案】见解析【解析】(1)由题意得,甲、乙、丙三个部门的员工人数之比为3∶2∶2.由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人、2人、2人. (2)①随机变量X 的所有可能取值为0,1,2,3. P (X =k )=C k 4C 3-k3C 37(k =0,1,2,3).所以随机变量X 的分布列为随机变量X 的数学期望E (X )=0×35+1×35+2×35+3×35=7.②设事件B 为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C 为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A =B ∪C ,且B 与C 互斥. 由①知,P (B )=P (X =2),P (C )=P (X =1), 故P (A )=P (B ∪C )=P (X =2)+P (X =1)=67.所以事件A 发生的概率为67.【素养解读】本题考查分层抽样、离散型随机变量的分布列与数学期望、互斥事件的概率加法公式,考查分析问题和解决问题的能力,体现了数学运算和数据分析等核心素养.试题难度:中.【突破训练1】 (2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为12,13,14.(1)记X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 【答案】见解析【解析】(1)随机变量X 的所有可能取值为0,1,2,3.P (X =0)=⎝⎛⎭⎪⎫1-12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-14=14,P (X =1)=12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-14+⎝ ⎛⎭⎪⎫1-12×13×⎝⎛⎭⎪⎫1-14+⎝⎛⎭⎪⎫1-12×⎝⎛⎭⎪⎫1-13×14=1124,P (X =2)=⎝⎛⎭⎪⎫1-12×13×14+12×⎝ ⎛⎭⎪⎫1-13×14+12×13×⎝ ⎛⎭⎪⎫1-14=14,P (X =3)=12×13×14=124.所以随机变量X 的分布列为所以E (X )=0×4+1×24+2×4+3×24=12.(2)设Y 表示第一辆车遇到红灯的个数,Z 表示第二辆车遇到红灯的个数,则所求事件的概率为P (Y +Z =1)=P (Y =0,Z =1)+P (Y =1,Z =0)=P (Y =0)P (Z =1)+P (Y =1)P (Z =0) =14×1124+1124×14=1148. 所以这2辆车共遇到了1个红灯的概率为1148.▶▶题型二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练.【例2】 (2018·北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk =1”表示第k 类电影得到人们喜欢,“ξk =0”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系.【答案】见解析【解析】 (1)设“从电影公司收集的电影中随机选取1部,这部电影是获得好评的第四类电影”为事件A . 因为第四类电影中获得好评的电影有200×0.25=50(部), 所以P (A )=50140+50+300+200+800+510=502 000=0.025.(2)设“从第四类电影和第五类电影中各随机选取1部,恰有1部获得好评”为事件B ,则P (B )=0.25×(1-0.2)+(1-0.25)×0.2=0.35.(3)由题意可知,定义随机变量如下:ξk =⎩⎪⎨⎪⎧0,第k 类电影没有得到人们喜欢,1,第k 类电影得到人们喜欢,则ξk 显然服从两点分布,故Dξ1=0.4×(1-0.4)=0.24,Dξ2=0.2×(1-0.2)=0.16, Dξ3=0.15×(1-0.15)=0.127 5,Dξ4=0.25×(1-0.25)=0.187 5, Dξ5=0.2×(1-0.2)=0.16, Dξ6=0.1×(1-0.1)=0.09.综上所述,Dξ1>Dξ4>Dξ2=Dξ5>Dξ3>Dξ6.【素养解读】本题考查统计中的概率计算、随机变量的方差计算,考查运算求解能力,体现了数据分析、数学运算等核心素养.试题难度:中.【突破训练2】 (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)求六月份这种酸奶一天的需求量X (单位:瓶)的分布列.(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量n (单位:瓶)为多少时,Y 的数学期望达到最大值? 【答案】见解析【解析】(1)由题意知,X 所有可能取值为200,300,500, 由表格数据知P (X =200)=2+1690=0.2,P (X =300)=3690=0.4, P (X =500)=25+7+490=0.4, 因此X 的分布列为当300≤n ≤500时,若最高气温不低于25,Y =6n -4n =2n ; 若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n,因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.当200≤n<300时,若最高气温不低于20,则Y=6n-4n=2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.所以当n=300时,Y的数学期望达到最大值,最大值为520元.▶▶题型三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;附:K 2=(a +b)(c +d)(a +c)(b +d).【答案】见解析【解析】(1)记B 表示事件“旧养殖法的箱产量低于50 kg”,C 表示事件“新养殖法的箱产量不低于50 kg”. 由题意知P (A )=P (BC )=P (B )P (C ). 旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得如下列联表.K 2=100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).【素养解读】本题考查频率分布直方图、独立性检验、中位数、相互独立事件的概率,考查学生的阅读理解能力、数据处理能力.主要体现了数据分析,数学运算等核心素养.【突破训练3】 (2017·北京卷)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x 和y 的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y 的值小于60的概率;(2)从图中A ,B ,C ,D 四人中随机选出两人,记ξ为选出的两人中指标x 的值大于1.7的人数,求ξ的分布列和数学期望E (ξ);(3)试判断这100名患者中服药者指标y 数据的方差与未服药者指标y 数据的方差的大小(只需写出结论). 【答案】见解析【解析】(1)由题图知,在服药的50名患者中,指标y 的值小于60的有15人. 所以从服药的50名患者中随机选出一人,此人指标y 的值小于60的概率为1550=0.3.(2)由题图知,A ,B ,C ,D 四人中,指标x 的值大于1.7的有2人:A 和C . 所以ξ的所有可能取值为0,1,2.P (ξ=0)=C 22C 24=16,P (ξ=1)=C 12C 12C 24=23,P (ξ=2)=C 22C 24=16.所以ξ的分布列为故ξ的期望E (ξ)=0×6+1×3+2×6=1.(3)在这100名患者中,服药者指标y 数据的方差大于未服药者指标y 数据方差. 题型四 统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差等)的考查,解答题中也有所考查.【例4】 (2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t . (1)分析利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?请说明理由. 【答案】见解析【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施资源额的预测值为y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势,2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年的数据建立基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. (以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.)【素养解读】本题以统计图为背景,考查线性回归方程,考查运算求解能力和数形结合思想,体现了数学运算的核心素养.【突破训练4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y)2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y)2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17(y i -y -)2=0.55,∑i =17(t i -t -)(y i -y -)=∑i =17t i y i -t -∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17(t i -t -)(y i -y -)∑i =17(t i -t -)2=2.8928≈0.103,a ^=y --b ^t -=1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2019年对应的t =9代入回归方程,得y ^=0.92+0.10×9=1.82.所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.。
【高考冲刺】2020年高考数学(理数) 概率与统计 大题(含答案解析)
【高考复习】2020年高考数学(理数) 概率与统计大题1.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机下单和支付.出门不带现金的人数正在迅速增加.中国人民大学和法国调查公司益普索(Ipsos)合作,调查了腾讯服务的6 000名用户,从中随机抽取了60名,统计他们出门随身携带的现金(单位:元)如茎叶图所示,规定:随身携带的现金在100元以下的为“淡定族”,其他为“非淡定族”.(1)根据上述样本数据,列出2×2列联表,判断是否有75%的把握认为“淡定族”与“性别”有关?(2)用样本估计总体,若从腾讯服务的用户中随机抽取3人,设这3人中“淡定族”的人数为随机变量ξ,求随机变量ξ的概率分布列及数学期望.参考公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.参考数据:2.第四届世界互联网大会在浙江乌镇隆重召开,人工智能技术深受全世界人民的关注,不同年龄段的人群关注人工智能技术应用与发展的侧重点有明显的不同,某中等发达城市的市场咨询与投资民调机构在该市对市民关注人工智能技术应用与发展的侧重方向进行调查,随机抽取1 000名市民,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],并绘制了如图所示的频率分布直方图.(1)求这 1 000名市民年龄的平均数和中位数(同一组中的数据用该组区间的中点值作代表);(2)调查发现年龄在[20,40)的市民侧重关注人工智能技术在学习与工作方面的应用与发展,其中关注智能办公的共有100人,将样本的频率视为总体的频率,从该市年龄在[20,40)的市民中随机抽取300人,请估计这300人中关注智能办公的人数;(3)用样本的频率代替概率,现从该市随机抽取20名市民调查关注人工智能技术在养老服务方面的应用与发展的情况,其中有k名市民的年龄在[60,80]的概率为P(X=k),其中k=0,1,2,…,20,当P(X=k)最大时,求k的值.3.某校高三年级有500名学生,一次考试的英语成绩服从正态分布N(100,17.52),数学成绩的频率分布直方图如下:(1)如果成绩高于135分的为特别优秀,则本次考试英语、数学成绩特别优秀的学生大约各多少人?(2)试问本次考试英语和数学的平均成绩哪个较高,并说明理由;(3)如果英语和数学两科成绩都特别优秀的共有6人,从(1)中的这些学生中随机抽取3人,设3人中两科成绩都特别优秀的有ξ人,求ξ的分布列和数学期望.参考公式及数据:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.68,P(μ-2σ<X≤μ+2σ)=0.96,P(μ-3σ<X≤μ+3σ)=0.99.4.已知具有相关关系的两个变量x ,y 的几组数据如下表所示:(1)请根据上表数据在网格纸中绘制散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^,并估计当x=20时y 的值;(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y-4=0右下方的点的个数为ξ,求ξ的分布列以及期望.参考公式:b ^=∑i=1nx i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.5.某知名品牌汽车深受消费者喜爱,但价格昂贵.某汽车经销商推出A,B,C三种分期付款方式销售该品牌汽车,并对近期100位采用上述分期付款方式付款的客户进行统计分析,得到柱状图如图所示.已知从A,B,C三种分期付款销售中,该经销商每销售此品牌汽车1辆所获得的利润分别是1万元、2万元、3万元.现甲、乙两人从该汽车经销商处,采用上述分期付款方式各购买此品牌汽车一辆.以这100位客户所采用的分期付款方式的频率估计1位客户采用相应分期付款方式的概率.(1)求甲、乙两人采用不同分期付款方式的概率;(2)记X(单位:万元)为该汽车经销商从甲、乙两人购车中所获得的利润,求X的分布列与期望.6.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万元)的数据如下:(1)若用线性回归模型拟合y 与x 的关系,求出y 关于x 的线性回归方程;(2)若用y=c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别约为0.75和0.88,请用R 2说明选择哪个回归模型更好;(3)已知利润z 与x ,y 的关系为z=200y-x.根据(2)的结果回答下列问题:①广告费x=20时,销售量及利润的预报值是多少?②广告费x 为何值时,利润的预报值最大?(精确到0.01)参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b ^=∑i=1n x i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.参考数据:5≈2.24.7.通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:(1)将题中的2×2列联表补充完整;(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由;(3)如果按性别进行分层抽样,从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派3人参加某项校际挑战赛,记选出3人中的女大学生人数为X,求X的分布列和数学期望.附:K2=n ad-bc2a+b c+d a+c b+d.8.甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率;(2)若将频率视为概率,回答下列两个问题:①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.9.近年来“双十一”已成为中国电子商务行业的年度盛事,并且逐渐影响到国际电子商务行业.某商家为了准备2018年“双十一”的广告策略,随机调查了1 000名客户在2017年“双十一”前后10天内网购所花时间T(单位:时),并将调查结果绘制成如图所示的频率分布直方图.由频率分布直方图可以认为,这10天网购所花的时间T近似服从N(μ,σ2),其中μ用样本平均值代替,σ2=0.24.(1)计算μ,并利用该正态分布求P(1.51<T<2.49).(2)利用由样本统计获得的正态分布估计整体,将这10天网购所花时间在(2,2.98)小时内的人定义为目标客户,对目标客户发送广告提醒.现若随机抽取10 000名客户,记X为这10 000人中目标客户的人数.(ⅰ)求EX;(ⅱ)问:10 000人中目标客户的人数X为何值的概率最大?附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4,P(μ-3σ<Z<μ+3σ)=0.997 4.0.24≈0.49.10.某学校为了丰富学生的课余生活,以班级为单位组织学生开展古诗词背诵比赛,随机抽取一首,背诵正确加10分,背诵错误减10分,且背诵结果只有“正确”和“错误”两种.其中某班级学生背诵正确的概率p=23,记该班级完成n 首背诵后的总得分为S n . (1)求S 6=20且S i ≥0(i =1,2,3)的概率;(2)记ξ=|S 5|,求ξ的分布列及数学期望.答案解析1.解:(1)依题意可得2×2列联表如下:K 2=60×10×12-30×8218×42×40×20≈1.429>1.323,故有75%的把握认为“淡定族”与“性别”有关.(2)用样本估计总体,用户中为“淡定族”的概率为1860=310,ξ的可能取值为0,1,2,3,由题意,得到ξ~B ⎝ ⎛⎭⎪⎫3,310, P(ξ=k)=C k 3⎝ ⎛⎭⎪⎫310k ⎝ ⎛⎭⎪⎫7103-k,k=0,1,2,3,随机变量ξ的分布列为故随机变量ξ的数学期望E(ξ)=0×3431 000+1×4411 000+2×1891 000+3×271 000=9001 000=910.2.解:(1)由频率分布直方图可知,抽取的1 000名市民年龄的平均数 x -=25×0.05+35×0.1+45×0.2+55×0.3+65×0.25+75×0.1=54(岁). 设1 000名市民年龄的中位数为x ,则0.05+0.1+0.2+0.03×(x -50)=0.5,解得x=55, 所以这1 000名市民年龄的平均数为54,中位数为55.(2)由频率分布直方图可知,这1 000名市民中年龄在[20,40)的市民共有 (0.05+0.10)×1 000=150人,所以关注智能办公的频率为100150=23,则从该市年龄在[20,40)的市民中随机抽取300人,这300人中关注智能办公的人数为300×23=200.故估计这300人中关注智能办公的人数为200.(3)设在抽取的20名市民中,年龄在[60,80]的人数为X ,X 服从二项分布, 由频率分布直方图可知,年龄在[60,80]的频率为(0.025+0.010)×10=0.35,所以X ~B(20,0.35),所以P(X=k)=C k 200.35k (1-0.35)20-k,k=0,1,2, (20)设t=P X =k P X =k -1=C k 200.35k 0.6520-kC k -1200.35k -10.6521-k =721-k 13k ,k=1,2,…,20. 若t>1,则k<7.35,P(X=k-1)<P(X=k); 若t<1,则k>7.35,P(X=k-1)>P(X=k). 所以当k=7时,P(X=k)最大, 即当P(X=k)最大时,k 的值为7.3.解:(1)因为英语成绩服从正态分布N(100,17.52),所以英语成绩特别优秀的概率P 1=P(X≥135)=(1-0.96)×12=0.02,由频率估计概率,得数学成绩特别优秀的概率P 2=0.001 6×20×34=0.024,所以英语成绩特别优秀的学生大约有500×0.02=10(人), 数学成绩特别优秀的学生大约有500×0.024=12(人). (2)本次考试英语的平均成绩为100分,数学的平均成绩为60×0.16+80×0.168+100×0.48+120×0.16+140×0.032=94.72(分),因为94.72<100,所以本次考试英语的平均成绩较高.(3)英语和数学成绩都特别优秀的有6人,则单科成绩特别优秀的有10人, ξ可取的值有0,1,2,3,所以P(ξ=0)=C 310C 316=314,P(ξ=1)=C 210C 16C 316=2756,P(ξ=2)=C 110C 26C 316=1556,P(ξ=3)=C 36C 316=128,故ξ的分布列为E(ξ)=0×314+1×2756+2×1556+3×128=98.4.解:(1)散点图如图所示:(2)依题意,x -=15×(2+4+6+8+10)=6,y -=15×(3+6+7+10+12)=7.6,∑i =15x 2i=4+16+36+64+100=220,∑i =15x i y i =6+24+42+80+120=272,b ^=∑i=15x i y i -5x-y-∑i =15x 2i -5x -2=272-5×6×7.6220-5×62=4440=1.1,∴a ^=7.6-1.1×6=1, ∴线性回归方程为y ^=1.1x +1,故当x=20时,y=23.(3)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),故ξ的所有可能取值为1,2,3,P(ξ=1)=C22C13C35=310,P(ξ=2)=C12C23C35=610=35,P(ξ=3)=C33C35=110,故ξ的分布列为故E(ξ)=1×310+2×35+3×110=1810=95.5.解:(1)设“采用A种分期付款方式购车”为事件A,“采用B种分期付款方式购车”为事件B,“采用C种分期付款方式购车”为事件C,由柱状图得,P(A)=35100=0.35,P(B)=45100=0.45,P(C)=20100=0.2,∴甲、乙两人采用不同分期付款方式的概率P=1-(P(A)·P(A)+P(B)·P(B)+P(C)·P(C))=0.635.(2)由题意知,X的所有可能取值为2,3,4,5,6,P(X=2)=P(A)P(A)=0.35×0.35=0.122 5,P(X=3)=P(A)P(B)+P(B)P(A)=0.35×0.45+0.45×0.35=0.315,P(X=4)=P(A)P(C)+P(B)P(B)+P(C)P(A)=0.35×0.2+0.45×0.45+0.2×0.35=0.342 5,P(X=5)=P(B)P(C)+P(C)P(B)=0.45×0.2+0.2×0.45=0.18,P(X=6)=P(C)P(C)=0.2×0.2=0.04.∴X的分布列为E(X)=0.122 5×2+0.315×3+0.342 5×4+0.18×5+0.04×6=3.7.6.解:(1)∵x-=8,y-=4.2,∑i=17x i y i=279.4,∑i=17x2i=708,∴b^=∑i=17x i y i-7x-y-∑i=17x2i-7x-2=279.4-7×8×4.2708-7×82=0.17,a^=y--b^x-=4.2-0.17×8=2.84,∴y关于x的线性回归方程为y^=0.17x+2.84.(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,∴选用y^=1.63+0.99x更好.(3)由(2)知,①当x=20时,销售量的预报值y^=1.63+0.9920≈6.07(万台),利润的预报值z=200×6.07-20≈1 194(万元).②z=200(1.63+0.99x)-x=-x+198x+326=-(x)2+198x+326=-(x-99)2+10 127,∴当x=99,即x=9 801时,利润的预报值最大,故广告费为9 801万元时,利润的预报值最大.7.解:(1)题中的2×2列联表补充如下:(2)K 2=100×40×25-20×15255×45×60×40≈8.25>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.(3)由题意,抽取6人中包括男生4名,女生2名,X 的取值为0,1,2,则P(X=0)=C 34C 36=15,P(X=1)=C 24C 12C 36=35,P(X=2)=C 14C 22C 36=15,故X 的分布列为E(X)=0×15+1×35+2×15=1.8.解:(1)记抽取的3天送餐单数都不小于40为事件M ,则P(M)=C 325C 350=23196.(2)①设乙公司送餐员的送餐单数为a , 当a=38时,X=38×6=228, 当a=39时,X=39×6=234, 当a=40时,X=40×6=240,当a=41时,X=40×6+1×7=247, 当a=42时,X=40×6+2×7=254.所以X 的所有可能取值为228,234,240,247,254. 故X 的分布列为所以E(X)=228×110+234×15+240×15+247×25+254×110=241.8.②依题意,甲公司送餐员的日平均送餐单数为38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,所以甲公司送餐员的日平均工资为80+4×39.7=238.8元. 由①得乙公司送餐员的日平均工资为241.8元. 因为238.8<241.8,所以推荐小王去乙公司应聘. 9.解:(1)μ=0.4×(0.050×0.8+0.225×1.2+0.550×1.6+0.825×2.0+0.600×2.4+0.200×2.8+0.050×3.2)=2,从而T 服从N(2,0.24),又σ=0.24≈0.49,从而P(1.51<T <2.49)=P(μ-σ<T <μ+σ)=0.682 6. (2)(ⅰ)任意抽取1名客户,该客户是目标客户的概率为P(2<T <2.98)=P(μ<T <μ+2σ) =12P(μ-2σ<T <μ+2σ)=12×0.954 4=0.477 2. 由题意知X 服从B(10 000,0.477 2),所以EX=10 000×0.477 2=4 772. (ⅱ)X 服从B(10 000,0.477 2),P(X=k)=C k 10 0000.477 2k (1-0.477 2)10 000-k =C k 10 0000.477 2k ·0.522 810 000-k(k=0,1,2,…,10 000). 设当X=k(k≥1,k ∈N)时概率最大,则有⎩⎪⎨⎪⎧P X =k >P X =k +1,PX =k >P X =k -1,得⎩⎪⎨⎪⎧0.522 8C k 10 000>0.477 2C k +110 000,0.477 2C k 10 000>0.522 8C k -110 000,解得k=4 772.故10 000人中目标客户的人数为4 772的概率最大. 10.解:(1)当S 6=20时,即背诵6首后,正确的有4首,错误的有2首.由S i ≥0(i =1,2,3)可知,若第一首和第二首背诵正确,则其余4首可任意背诵正确2首; 若第一首背诵正确,第二首背诵错误,第三首背诵正确,则其余3首可任意背诵正确2首.则所求的概率P=⎝ ⎛⎭⎪⎫232×C 24⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫132+23×13×23×C 23⎝ ⎛⎭⎪⎫232×13=1681.(2)由题意知ξ=|S 5|的所有可能的取值为10,30,50,又p=23,∴P(ξ=10)=C 35⎝ ⎛⎭⎪⎫233×⎝ ⎛⎭⎪⎫132+C 25⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫133=4081,P(ξ=30)=C 45⎝ ⎛⎭⎪⎫234×⎝ ⎛⎭⎪⎫131+C 15⎝ ⎛⎭⎪⎫231×⎝ ⎛⎭⎪⎫134=3081,P(ξ=50)=C 55⎝ ⎛⎭⎪⎫235×⎝ ⎛⎭⎪⎫130+C 05⎝ ⎛⎭⎪⎫230×⎝ ⎛⎭⎪⎫135=1181,∴ξ的分布列为∴E(ξ)=10×4081+30×3081+50×1181=1 85081.。
高考理数真题训练15 概率与统计(解答题)(解析版)
专题15 概率与统计(解答题)1.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为116.(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为116;丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684 ---=.(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18.因此丙最终获胜的概率为11117 8168816+++=.2.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i,y i)(i=1,2,…,20),其中x i和y i分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160iix ==∑,2011200iiy ==∑,2021)8(0ii x x =-=∑,2021)9000(i i y y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i ) (i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)()(iinx y r x y --=∑1.414≈.【解析】(1)由已知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200=12000. (2)样本(,)i i x y (1,2,,20)i =的相关系数20)()0.943(iix y y x r --===≈∑.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.3.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K 2【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 4.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=. (2)根据抽查数据,可得22⨯列联表:(3)根据(2)的列联表得2100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯.由于7.484 6.635>,故有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关.5.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明) 【解析】(Ⅰ)该校男生支持方案一的概率为2001200+4003=,该校女生支持方案一的概率为3003300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313()(1)()(1)3433436C -+-=; (Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题. 6.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)a=0.35,b=0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.7.【2019年高考全国Ⅱ卷理数】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.【答案】(1)0.5;(2)0.1.【解析】(1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1–0.5)×(1–0.4)=0.5.(2)X=4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1–0.4)+(1–0.5)×0.4]×0.5×0.4=0.1.8.【2019年高考天津卷理数】设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X 表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X 的分布列和数学期望; (2)设M 为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M 发生的概率. 【答案】(1)分布列见解析,()2E X =;(2)20243. 【分析】本小题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.【解析】(1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,故2~(3,)3X B ,从而3321()C ()(),0,1,2,333kkkP X k k -===.所以,随机变量X 的分布列为随机变量X 的数学期望()323E X =⨯=.(2)设乙同学上学期间的三天中7:30之前到校的天数为Y , 则2~(3,)3Y B ,且{3,1}{2,0}M X Y X Y =====. 由题意知事件{3,1}X Y ==与{2,0}X Y ==互斥,且事件{3}X =与{1}Y =,事件{2}X =与{0}Y =均相互独立, 从而由(1)知()({3,1}{2,0})P M P X Y X Y =====(3,1)(2,0)P X Y P X Y ===+== (3)(1)(2)(0)P X P Y P X P Y ===+== 824120279927243=⨯+⨯=. 9.【2019年高考北京卷理数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1000元的人数,求X 的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(1)0.4;(2)分布列见解析,E (X )=1;(3)见解析.【解析】(1)由题意知,样本中仅使用A 的学生有18+9+3=30人,仅使用B 的学生有10+14+1=25人,A ,B 两种支付方式都不使用的学生有5人.故样本中A ,B 两种支付方式都使用的学生有100−30−25−5=40人.所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率估计为400.4100=. (2)X 的所有可能值为0,1,2.记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”. 由题设知,事件C ,D 相互独立,且93141()0.4,()0.63025P C P D ++====. 所以(2)()()()0.24P X P CD P C P D ====,(1)()P X P CD CD == ()()()()P C P D P C P D =+0.4(10.6)(10.4)0.6=⨯-+-⨯0.52=,(0)()()()0.24P X P CD P C P D ====.所以X 的分布列为故X 的数学期望()00.2410.5220.241E X =⨯+⨯+⨯=.(3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额都大于2000元”. 假设样本仅使用A 的学生中,本月支付金额大于2000元的人数没有变化, 则由上个月的样本数据得33011()C 4060P E ==. 答案示例1:可以认为有变化. 理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2000元的人数发生了变化,所以可以认为有变化. 答案示例2:无法确定有没有变化.理由如下: 事件E 是随机事件,P (E )比较小,一般不容易发生, 但还是有可能发生的,所以无法确定有没有变化.10.【2019年高考全国Ⅰ卷理数】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i =表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i =,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.(i)证明:1{}i i p p +-(0,1,2,,7)i =为等比数列;(ii)求4p ,并根据4p 的值解释这种试验方案的合理性.【答案】(1)分布列见解析;(2)(i)证明见解析,(ii)45 127p =,解释见解析. 【解析】X 的所有可能取值为1,0,1-.(1)(1)P X αβ=-=-,(0)(1)(1)P X αβαβ==+--, (1)(1)P X αβ==-,所以X 的分布列为(2)(i )由(1)得0.4,0.5,0.1a b c ===.因此110.40.5 0.1i i i i p p p p -+=++,故110.1()0.4()i i i i p p p p +--=-, 即114()i i i i p p p p +--=-. 又因为1010p p p -=≠, 所以1{}(0,1,2,,7)i i p p i +-=为公比为4,首项为1p 的等比数列.(ii )由(i )可得88776100p p p p p p p p =-+-++-+877610()()()p p p p p p =-+-++-81413p -=.由于8=1p ,故18341p =-, 所以44433221101( 411()327)(5())p p p p p p p p p p -=-+-+-+=-=. 4p 表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时, 认为甲药更有效的概率为410.0039257p =≈, 此时得出错误结论的概率非常小,说明这种试验方案合理.11.【2018年高考全国Ⅰ卷理数】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为)10(<<p p ,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为)(p f ,求)(p f 的最大值点0p . (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ; (ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 【答案】(1)0.1;(2)(i )490,(ii )应该对余下的产品作检验.【解析】(1)20件产品中恰有2件不合格品的概率为221820()C (1)f p p p =-. 因此2182172172020()C [2(1)18(1)]2C (1)(110)f p p p p p p p p '=---=--.令()0f p '=,得0.1p =,当(0,0.1)p ∈时,()0f p '>;当(0.1,1)p ∈时,()0f p '<. 所以()f p 的最大值点为00.1p =. (2)由(1)知,0.1p =.(i )令Y 表示余下的180件产品中的不合格品件数, 依题意知(180,0.1)YB ,20225X Y =⨯+,即4025X Y =+.所以(4025)4025490EX E Y EY =+=+=.(ii )如果对余下的产品作检验,则这一箱产品所需要的检验费为400元. 由于400EX >,故应该对余下的产品作检验.12.【2018年高考全国Ⅱ卷理数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】(1)模型①:226.1亿元,模型②:256.5亿元;(2)利用模型②得到的预测值更可靠,理由见解析.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(Ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(Ⅰ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.13.【2018年高考全国Ⅲ卷理数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (iii )由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知7981802m +==. 列联表如下:(3)由于2240(151555)10 6.63520202020K ⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异. 14.【2018年高考北京卷理数】电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系.【答案】(1)0.025;(2)0.35;(3)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ.【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000, 第四类电影中获得好评的电影部数是200×0.25=50. 故所求概率为500.0252000=. (2)设事件A 为“从第四类电影中随机选出的电影获得好评”, 事件B 为“从第五类电影中随机选出的电影获得好评”. 故所求概率为P (AB AB +)=P (AB )+P (AB ) =P (A )(1–P (B ))+(1–P (A ))P (B ). 由题意知:P (A )估计为0.25,P (B )估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (3)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ.15.【2018年高考天津卷理数】已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查. (1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i )用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望;(ii )设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率.【答案】(1)分别抽取3人,2人,2人;(2)(i )分布列见解析,12()7E X =,(ii )67. 【解析】(1)由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2, 由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人. (2)(i )随机变量X 的所有可能取值为0,1,2,3.P (X =k )=34337C C C k k-⋅(k =0,1,2,3).所以,随机变量X 的分布列为随机变量X的数学期望11218412 ()0123353535357E X=⨯+⨯+⨯+⨯=.(ii)设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥,由(i)知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=67.所以,事件A发生的概率为67.。
【高考研究】2020版高考理数审题答题(六)概率与统计热点问题课件(含答案)
热点一 统计与统计案例(教材VS高考) [训练 1] (2017·全国Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min
从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次 抽取的 16 个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8 零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
7
7
-t =4,∑ (ti--t )2=28, ∑ (yi--y)2=0.55.
i=1
i=1
7
7
7
∑ (ti--t )(yi--y)= ∑ tiyi--t ∑ yi
7
∑ (ti--t )(yi--y) b^=i=1 7
∑ (ti--t )2
i=1
=������.������������ ≈0.103
3
热点一 统计与统计案例(教材VS高考)
以统计图表或文字叙述的实际问题为载体,通过对相关数据的统计分析、抽象概 括,作出估计、判断.常与抽样方法、茎叶图、频率分布直方图、概率等知识交 汇考查,考查学生的数据处理能力与运算能力及应用意识.
4
Hale Waihona Puke [例 1热] (20点16·全一国Ⅲ卷统)如图计是我与国统2008计年至案20例14 年(生教活材垃圾V无S害高化处考理量) (单位:亿吨)
线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. ①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
【600分考点-700分考法】2020版高考数学(理科):专题(12)概率与统计课件(附答案)
17
考点一 随机事件的概率、古典概型和几何概型
例3经统计,在某储蓄所一个营业窗口等候的人数及相应的概率如下表.
排队人数
0
1
2 3 4 5人及5人以上
概率
0.1 0.16 0.3 0.3 0.1
0.04
求:(1)至多2人排队等候的概率; (2)至少3人排队等候的概率.
方法二:记“至少3人排队等候”为事件H,则其对立事件为事件G,所以P(H)= 1-P(G)=0.44.
核心方法 重点突破
方法1 概率与频率关系的应用
随机事件的频率与概率的常见题型及解题策略 (1)补全或列出频率分布表:可直接依据已知条件,逐一计 数,写出频率. (2)由频率估计概率:先根据已知条件计算所求事件发生的 频数,再计算事件发生的频率,最后根据频率与概率的关 系,由频率直接估计概率. (3)由频率估计某部分的数值:可由频率估计概率,再由概 率估算某部分的数值.
【解析】在A中,至少有1件次品与至多有1件正品能同时发生,不是互斥事件,故A错误; 在B中,恰有1件次品与恰有2件正品不能同时发生,但能同时不发生,是互斥而不对立 的两个事件,故B正确; 在C中,至少有1件次品与至少有1件正品能同时发生,不是互斥事件,故C错误; 在D中,至少有1件次品与都是正品是对立事件,故D错误. 【答案】B
下列三类试验不是古典概型:(1)基本事件个数有限,但非等可能;(2)基 本事件个数无限,但等可能;(3)基本事件个数无限,也非等可能.
9
考点一 随机事件的概率、古典概型和几何概型
(4)古典概型的概率公式
①在基本事件总数为n的古典概型中,每个基本事件发生的 概率都是相等的,即每个基本事件发生的概率都是n(1). ②如果随机事件A包含的基本事件数为m,由互斥事件的概 率加法公式可得P(A)=n(m). 对于古典概型,随机事件A的概率为
专题09 2020版概率与统计(解析版)
专题09 概率与统计1.【2020年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是 A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.【2020年高考全国II 卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者 A .10名 B .18名C .24名D .32名【答案】B【解析】由题意,第二天新增订单数为50016001200900+-=,设需要志愿者x 名,500.95900x≥,17.1x ≥,故需要志愿者18名. 故选:B【点晴】本题主要考查函数模型的简单应用,属于基础题.3.【2020年高考全国III 卷理数】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是 A .14230.1,0.4p p p p ==== B .14230.4,0.1p p p p ==== C .14230.2,0.3p p p p ==== D .14230.3,0.2p p p p ====【答案】B【解析】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65A s =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85B s =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05C s =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45D s =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组标准差最大. 故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.4.【2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是 A .62% B .56% C .46%D .42%【答案】C【解析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅, 则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-= 所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%. 故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.5.【2020年高考山东】信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑.A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n==,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,则H (X )≤H (Y ) 【答案】AC【解析】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确. 对于B 选项,若2n =,则1,2i =,211p p =-, 所以()()()121121log 1log 1H X p p p p =-⋅+-⋅-⎡⎤⎣⎦, 当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误. 对于C 选项,若()11,2,,i p i n n==,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m jP Y j p p +-==+(1,2,,j m =).()2222111log log mmi i i i i iH X p p p p ===-⋅=⋅∑∑ 122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅. ()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅++⋅+++⋅+++12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++由于()01,2,,2i p i m >=,所以2111i i m i p p p +->+,所以222111log log i i m ip p p +->+, 所以222111log log i i i i m ip p p p p +-⋅>⋅+, 所以()()H X H Y >,所以D 选项错误. 故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.6.【2020年高考江苏】已知一组数据4,2,3,5,6a a -的平均数为4,则a 的值是 ▲ . 【答案】2【解析】∵数据4,2,3,5,6a a -的平均数为4 ∴4235620a a ++-++=,即2a =. 故答案为:2.【点睛】本题主要考查平均数的计算和应用,比较基础.7.【2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是_____. 【答案】19【解析】根据题意可得基本事件数总为6636⨯=个.点数和为5的基本事件有()1,4,()4,1,()2,3,()3,2共4个. ∴出现向上的点数和为5的概率为41369P ==. 故答案为:19. 【点睛】本题考查概率的求法,考查古典概型、列举法等基础知识,考查运算求解能力,是基础题. 8.【2020年高考天津】从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为A .10B .18C .20D .36【答案】B【解析】根据直方图,直径落在区间[)5.43,5.47之间的零件频率为:()6.25 5.000.020.225+⨯=, 则区间[)5.43,5.47内零件的个数为:800.22518⨯=. 故选:B.【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题. 9.【2020年高考天津】已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________. 【答案】16 23【解析】甲、乙两球落入盒子的概率分别为11,23, 且两球是否落入盒子互不影响, 所以甲、乙都落入盒子概率为111236⨯=, 甲、乙两球都不落入盒子的概率为111(1)(1)233-⨯-=, 所以甲、乙两球至少有一个落入盒子的概率为23. 故答案为:16;23. 【点睛】本题主要考查独立事件同时发生的概率,以及利用对立事件求概率,属于基础题.10.【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为ξ,则(0)P ξ==_______,()E ξ=_______. 【答案】13,1 【解析】因为0ξ=对应事件为第一次拿红球或第一次拿绿球,第二次拿红球, 所以1111(0)4433P ξ==+⨯=, 随机变量0,1,2ξ=,212111211(1)434324323P ξ==⨯+⨯⨯+⨯⨯=,111(2)1333P ξ==--=,所以111()0121333E ξ=⨯+⨯+⨯=.故答案为:1;13.【点睛】本题考查古典概型概率、互斥事件概率加法公式、数学期望,考查基本分析求解能力,属基础题.的11.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12, (1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率. 【解析】(1)甲连胜四场的概率为116. (2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛. 比赛四场结束,共有三种情况: 甲连胜四场的概率为116; 乙连胜四场的概率为116; 丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684---=. (3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18. 因此丙最终获胜的概率为111178168816+++=.12.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i i y ==∑,2021)8(0ii x x =-=∑,2021)9000(i i y y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i ) (i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)()(iinx y r x y --=∑1.414≈.【解析】(1)由已知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200=12000. (2)样本(,)i i x y (1,2,,20)i =的相关系数20)()0.943(iix y y x r --===≈∑.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.13.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K 2【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 14.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=. (2)根据抽查数据,可得22⨯列联表:(3)根据(2)的列联表得22100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯. 由于7.484 6.635>,故有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关.15.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明) 【解析】(Ⅰ)该校男生支持方案一的概率为2001200+4003=,该校女生支持方案一的概率为3003300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313()(1)()(1)3433436C -+-=; (Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题.2020模拟篇1.【2020·广东省高三二模】高二某班共有45人,学号依次为1、2、3、…、45,现按学号用系统抽样的办法抽取一个容量为5的样本,已知学号为6、24、33的同学在样本中,那么样本中还有两个同学的学号应为 A .15,43 B .15,42C .14,43D .14,42【答案】B【解析】由题可知,该班共有45人,按学号用系统抽样的办法抽取一个容量为5的样本, 则抽到的每个同学的学号之间的间隔为:4595=, 而已知学号为6、24、33的同学在样本中,即抽到的第一个学号为6,则第二个学号为:6+9=15, 第三个学号为:15+9=24,则第四个学号为:24+9=33, 第五个学号为:33+9=42,所以样本中还有两个同学的学号应为:15,42. 故选:B.2.【2020·黑龙江省大庆实验中学高三月考(理)】设不等式组00x y x +≥⎧⎪⎨-≤⎪⎩表示的平面区域为Ω,若从圆C :224x y +=的内部随机选取一点P ,则P 取自Ω的概率为A .524B .724C .1124D .1724【答案】B【解析】作出Ω中在圆C 内部的区域,如图所示,因为直线0x y +=,0x -=的倾斜角分别为34π,6π, 所以由图可得P 取自Ω的概率为3746224πππ-=.故选:B【点睛】本小题主要考查几何概型的计算,考查线性可行域的画法,属于基础题.3.【2020·河南省高三三模】“二进制”来源于我国古代的《易经》,该书中有两类最基本的符号:“─”和“﹣﹣”,其中“─”在二进制中记作“1”,“﹣﹣”在二进制中记作“0”.如符号“☱”对应的二进制数011(2)化为十进制的计算如下:011(2)=0×22+1×21+1×20=3(10).若从两类符号中任取2个符号进行排列,则得到的二进制数所对应的十进制数大于2的概率为A .12 B .13C .23D .14【答案】D【解析】根据题意,不同符号可分为三类:第一类:由两个“─”组成,其二进制为:11(2)=3(10); 第二类:由两个“﹣﹣“组成,其二进制为:00(2)=0(10);第三类:由一个“─”和一个“﹣﹣”组成,其二进制为:10(2)=2(10),01(2)=1(10), 所以从两类符号中任取2个符号排列,则组成不同的十进制数为0,1,2,3, 则得到的二进制数所对应的十进制数大于2的概率P 14=. 故选:D .【点睛】本题主要考查了古典概型及其概率的计算,以及转化的应用,意在考查学生的计算能力和应用能力,属于中档试题.4.【2020·河南省高三三模】随着2022年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领户外用品行业市场增长.下面是2012年至2018年中国雪场滑雪人次(万人次)与同比增长率的统计图,则下面结论中不正确的是A .2013年至2018年,中国雪场滑雪人次逐年增加B .2013年至2015年,中国雪场滑雪人次和同比增长率均逐年增加C .2018年与2013年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等D .2018年与2016年相比,中国雪场滑雪人次增长率约为30.5% 【答案】C【解析】由2012年至2018年中国雪场滑雪人次(万人次)与同比增长率的统计图,得:对于A ,2013年至2018年,中国雪场滑雪人次逐年增加,故A 正确;对于B ,2013年至2015年,中国雪场滑雪人次和同比增长率均逐年增加,故B 正确; 对于C ,2018年与2013年相比,中国雪场滑雪人次的同比增长率近似相等, 但是同比增长人数也不相等,2018年比2013年增长人数多,故C 错误; 对于D ,2018年与2016年相比,中国雪场滑雪人次增长率约为:19701510100%30.5%1510-⨯≈.故D 正确.故选:C .【点睛】本题考查统计图表的应用,考查学生的数据分析能力,属于基础题.5.【2020·山东省邹城市第一中学高三其他】2020年初,新型冠状病毒(19COVID -)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:由表格可得y 关于x 的二次回归方程为2ˆ6y x a =+,则此回归模型第4周的残差(实际值与预报值之差)为 A .5 B .4C .1D .0【答案】A【解析】设2t x =,则()11491625115t =++++=,()12173693142585y =++++= 586118a =-⨯=-,所以2ˆ68yx =-.令4x =,得2444936485ˆe y y =-=-⨯+=. 故选:A6.【2020·四川省绵阳南山中学高三一模】从标号分别为1、2、3、4、5的5张标签中随机抽取一张,放回后再随机抽取一张,则抽得的第一张标签的标号与第二张标签的标号恰好相差1的概率为 A .45 B .25C .425D .825【答案】D【解析】从标号分别为1、2、3、4、5的5张标签中随机抽取一张,放回后再随机抽取一张, 所有的基本事件数为2525=,其中,事件“抽得的第一张标签的标号与第二张标签的标号恰好相差1”所包含的基本事件有:()1,2、()2,1、()2,3、()3,2、()3,4、()4,3、()4,5、()5,4,共8种情况,因此,所求事件的概率为825P =. 故选:D.【点睛】本题考查利用古典概型的概率公式求事件的概率,一般利用列举法列举出基本事件,考查计算能力,属于基础题.7.【2020·四川省阆中中学高三其他】中国古代十进制的算筹计数法,在数学史上是一个伟大的创造,算筹实际上是一根根同长短的小木棍.如图,是利用算筹表示数1-9的一种方法.例如:3可表示为“≡”,26可表示为“=⊥”,现有6根算筹,据此表示方法,若算筹不能剩余,则可以用1-9这9个数字表示两位数中,能被3整除的概率是A .518B .718C .716D .516【答案】D【解析】1根算筹只能表示1,2根根算筹可以表示2和6,3根算筹可以表示3和7,4根算筹可以表示4和8,5根算筹可以表示5和9,因此6根算筹表示的两位数有15,19,51,91,24,28,64,68,42,82,46,86,37,33,73,77共16个,其中15,51,24,42,33共5个可以被3整除, 所以所求概率为516P =. 故选:D .【点睛】本题考查古典概型,考查中国古代数学文化,解题关键是用列举法写出6根算筹所能表示的两位数.8.【2020·山西省高三月考】勒洛三角形是具有类似圆的“定宽性”的曲线,它是由德国机械工程专家、机构运动学家勒洛首先发现,其作法是:以等边三角形每个顶点为圆心,以边长为半径,在另两个顶点间作一段弧,三段弧围成的曲边三角形就是勒洛三角形.如图中的两个勒洛三角形,它们所对应的等边三角形的边长比为1:3,若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率是A .13BC .19D 【答案】C【解析】设图中的小的勒洛三角形所对应的等边三角形的边长为a ,则小勒洛三角形的面积2221(32642a a S a ππ=⨯-⨯=, 因为大小两个勒洛三角形,它们所对应的等边三角形的边长比为1:3,所以在勒洛三角形的面积为2S ==若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率为1219S S P ==, 故选:C【点睛】此题考查概率与几何概型、平面图形等知识,考查阅读能力和数学计算能力,属于中档题. 9.【2020·山东省邹城市第一中学高三其他】下列命题中假命题是 A .若随机变量ξ服从正态分布()21,N σ,()40.79P ξ≤=,则()20.21P ξ≤-=;B .已知直线l ⊥平面α,直线//m 平面β,则“//αβ”是“l m ⊥”的必要不充分条件;C .若//a b ,则a 在b 方向上的正射影的数量为aD .命题:0,1∃<->x p x e x 的否定:0,1⌝∀≥-≤x p x e x 【答案】BCD【解析】对于A ,随机变量ξ服从正态分布()21,N σ,所以图像关于1x =对称,根据()40.79P ξ≤=, 可得()()4140.21p p ξξ≥=-≤=,所以()()240.21P p ξξ≤-=≥=,故A 正确; 对于B ,直线l ⊥平面α,直线//m 平面β,若//αβ,则l m ⊥是真命题;若l m ⊥,则//αβ是假命题, 所以“//αβ”是“l m ⊥”的充分不必要条件,故B 错误;对于C ,若//a b ,则a 在b 方向上的正射影的数量为a 或a -,故C 错误; 对于D ,命题:0,1∃<->xp x e x 的否定:0,1xp x e x ⌝∀<-≤,故D 错误; 故选:BCD【点睛】本题主要考查了正态分布概率的性质、充分性与必要性的定义、向量数量积的几何意义、特称命题的否定变换原则,属于基础题.10.【2020·上海高三二模】某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.【答案】56【解析】该社区共有14028080500++=户,利用分层抽样的方法, 中等收入家庭应选28010056 500⨯=户,故答案为:56.【点睛】本题考查分层抽样,注意抽取比例是解决问题的关键,属于基础题.11.【2020·辽河油田第三高级中学高三三模】辊子是客家传统农具,南方农民犁开田地后,仍有大的土块.农人便用六片叶齿组成辊轴,两侧装上木板,人跨开两脚站立,既能掌握平衡,又能增加重量,让牛拉动辊轴前进,压碎土块,以利于耕种.这六片叶齿又对应着菩萨六度,即布施、持戒、忍辱、精进、禅定与般若.若甲、乙每人依次有放回地从这六片叶齿中随机取一片,则这两人选的叶齿对应的“度”相同的概率为______.【答案】1 6【解析】记布施,持戒,忍辱,精进,禅定,般若分别为a,b,c,d,e,f,则基本事件有(),a a,(),a b,(),a c,(),a d,(),a e,(),a f,(),b a,(),b b,(),b c,(),b d,(),b e,(),b f,(),c a,(),c b,(),c c,(),c d,(),c e,(),c f,(),d a,(),d b,(),d c,(),d d,(),d e,(),d f,(),e a,(),e b,(),e c,(),e d,(),e e,(),e f,(),f a,(),f b,(),f c,(),f d,(),f e,(),f f,共36个,其中符合条件的有6个,故所求概率61366P==.故答案为1 6 .12.【2020·辽宁省沈阳二中高三其他】为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核.记X 表示学生的考核成绩,并规定85X ≥为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:(Ⅰ)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核优秀的概率; (Ⅰ)从图中考核成绩满足[]80,89X ∈的学生中任取2人,求至少有一人考核优秀的概率; (Ⅰ)记()P a X b ≤≤表示学生的考核成绩在区间[],a b 的概率,根据以往培训数据,规定当8510.510x P ⎛-⎫≤≥ ⎪⎝⎭时培训有效.请根据图中数据,判断此次中学生冰雪培训活动是否有效,并说明理由. 【答案】(Ⅰ)730(Ⅰ)35(Ⅰ)见解析【解析】(Ⅰ)设这名学生考核优秀为事件A ,由茎叶图中的数据可以知道,30名同学中,有7名同学考核优秀, 所以所求概率()P A 约为730(Ⅰ)设从图中考核成绩满足[]80,89X ∈的学生中任取2人, 至少有一人考核成绩优秀为事件B ,因为表中成绩在[]80,89的6人中有2个人考核为优,所以基本事件空间Ω包含15个基本事件,事件B 包含9个基本事件, 所以93()155P B == (Ⅰ)根据表格中的数据,满足85110x -≤的成绩有16个, 所以8516810.5103015x P ⎛-⎫≤==>⎪⎝⎭所以可以认为此次冰雪培训活动有效.13.【2020·重庆高三月考】某市积极贯彻落实国务院《“十三五”节能减排综合工作方案》,空气质量明显改善.该市生态环境局统计了某月(30天)空气质量指数,绘制成如下频率分布直方图.已知空气质量等级与空气质量指数对照如下表:(1)根据频率分布直方图估计,在这30天中,空气质量等级为优或良的天数;(2)根据体质检查情况,医生建议:当空气质量指数高于90时,市民甲不宜进行户外体育运动;当空气质量指数高于70时,市民乙不宜进行户外体育运动(两人是否进行户外体育运动互不影响).①从这30天中随机选取2天,记乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数为X,求X的分布列和数学期望;②以该月空气质量指数分布的频率作为以后每天空气质量指数分布的概率(假定每天空气质量指数互不影响),甲、乙两人后面分别随机选择3天和2天进行户外体育运动,求甲恰有2天,且乙恰有1天不宜进行户外体育运动的概率.【答案】(1)28天;(2)①分布列见解析,25;②56750000.【解析】(1)由频率分布直方图可得,空气质量指数在(]90,110的天数为2天,所以估计空气质量指数在(]90,100的天数为1天,故在这30天中空气质量等级属于优或良的天数为28天.(2)①在这30天中,乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数共6天,∴()224230920145C P X C ===,()11624230481145C C P X C ⋅===,()262301229C P X C ===, ∴X 的分布列为∴9248()012145145295E X =⨯+⨯+⨯=. ②甲不宜进行户外体育运动的概率为110,乙不宜进行户外体育运动的概率为310,∴2223219375671010101050000P C C ⎛⎫=⋅⋅⋅⋅⋅=⎪⎝⎭. 【点睛】此题考查离散型随机变量的分布列及期望的求法,频率分布表的应用,属于中档题.14.【2020·东莞市光明中学高三月考】某土特产超市为预估2020年元旦期间游客购买土特产的情况,对2019年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.(1)根据以上数据完成22⨯列联表,并判断是否有95%的把握认为购买金额是否少于60元与性别有关.(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为p (每次抽奖互不影响,且p 的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数X (元)的分布列并求其数学期望.附:参考公式和数据:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.附表:【答案】(1)见解析,有95%的把握认为购买金额是否少于60元与性别有关.(2)分布列见解析,数学期望75【解析】(1)22⨯列联表如下:()22901220401814405 3.84130605238247K ⨯⨯-⨯==>>⨯⨯⨯,因此有95%的把握认为购买金额是否少于60元与性别有关. (2)X 可能取值为65,70,75,80,且10201903p +==. ()3331165327P X C ⎛⎫=== ⎪⎝⎭,()22312270339P X C ⎛⎫==⨯= ⎪⎝⎭, ()21312475339P X C ⎛⎫==⨯⨯= ⎪⎝⎭,()3032880327P X C ⎛⎫=== ⎪⎝⎭, 所以X 的分布列为6570758075279927EX =⨯+⨯+⨯+⨯=. 15.【2020·山东省邹城市第一中学高三其他】为了提高生产线的运行效率,工厂对生产线的设备进行了技术。
2020年高考理科数学《概率与统计》题型归纳与训练及答案解析
2020年高考理科数学《概率与统计》题型归纳与训练【题型归纳】题型一 古典概型与几何概型例1、某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为 . 【答案】【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为. 例2、市政府为调查市民对本市某项调控措施的态度,随机抽取了100名市民,统计了他们的月收入频率分布和对该项措施的赞成人数,统计结果如下表所示:(1)用样本估计总体的思想比较该市月收入低于20(百元)和不低于30(百元)的两类人群在该项措施的态度上有何不同;(2)现从样本中月收入在)20,10[和)70,60[的市民中各随机抽取一个人进行跟踪调查,求抽取的两个人恰好对该措施一个赞成一个不赞成的概率. 【答案】(1)详见解析;(2)2011. 【解析】(1)由表知,样本中月收入低于20(百元)的共有5人,其中持赞成态度的共有2人,故赞成人数的频率为52,月收入不低于30(百元)的共有75人,其中持赞成态度的共有64人,故赞成人数的频率为7564, ∵527564>,∴根据样本估计总体的思想可知月收入不低于30(百元)的人群对该措施持赞成态度的比月收入低于20(百元)的人群持赞成态度的比例要高.(2) 将月收入在)20,10[内,不赞成的3人记为321,,a a a ,赞成的2人记为54,a a ,将月收入在)70,60[内,不赞成的1人记为1b ,赞成的3人记为,,,432b b b 从月收入在)20,10[和)70,60[内的人中各随机抽取1人,基本事件总数20=n ,其中事件“抽取的两个人恰好对该措施一个赞成一个不赞成”包含的基本事件有5840155408-=),(),,(),,(),,(),,(),,(),,(),,(),,(),,(),,(1514433323423222413121b a b a b a b a b a b a b a b a b a b a b a 共11个,∴抽取的两个人恰好对该措施一个赞成一个不赞成的概率2011=P . 【易错点】求解古典概型问题的关键:先求出基本事件的总数,再确定所求目标事件包含基本事件的个数,结合古典概型概率公式求解.一般涉及“至多”“至少”等事件的概率计算问题时,可以考虑其对立事件的概率,从而简化运算. 【思维点拨】1. 求复杂互斥事件概率的方法一是直接法,将所求事件的概率分解为一些彼此互斥事件概率的和,运用互斥事件的求和公式计算;二是间接法,先求此事件的对立事件的概率,再用公式()()1P A P A =-,即运用逆向思维的方法(正难则反)求解,应用此公式时,一定要分清事件的对立事件到底是什么事件,不能重复或遗漏.特别是对于含“至多”“至少”等字眼的题目,用第二种方法往往显得比较简便.2.求古典概型的概率的基本步骤:算出所有基本事件的个数;求出事件A 包含的基本事件个数;代入公式,求出()P A ;几何概型的概率是几何度量之比,主要使用面积、体积之比与长度之比. 题型二 统计与统计案例例1、某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:],90,80[,),40,30[),30,20[Λ并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间)50,40[内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(Ⅰ)4.0;(Ⅱ)20;(Ⅲ)2:3.【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为6.010)04.002.0(=⨯+,所以样本中分数小于70的频率为4.06.01=-.(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.所以总体中分数在区间内的人数估计为. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为6010010)04.002.0(=⨯⨯+,所以样本中分数不小于70的男生人数为302160=⨯.所以样本中的男生人数为60230=⨯,女生人数为4060100=-,男生和女生人数的比例为2:340:60=,所以根据分层抽样的原理,总体中男生和女生人数的比例估计为2:3. 【易错点】求解统计图表问题,重要的是认真观察图表,发现有用信息和数据.对于频率分布直方图,应注意图中的每一个小矩形的面积是落在该区间上的频率,所有小矩形的面积和为1,当小矩形等高时,说明频率相等,计算时不要漏掉其中一个. 【思维点拨】1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 4.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.求回归直线方程的关键①正确理解计算^^,a b 的公式和准确的计算.②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关(0.010.020.040.02)100.9+++⨯=[40,50)1001000.955-⨯-=[40,50)540020100⨯=系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 6.独立性检验的关键①根据22⨯列联表准确计算2K ,若22⨯列联表没有列出来,要先列出此表. ②2K 的观测值k 越大,对应假设事件0H 成立的概率越小,0H 不成立的概率越大. 题型三 概率、随机变量及其分布例1、“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕, 市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值服从正态分布,利用该正态分布,求落在内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为,求的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为; ②若,则, .【答案】(1) (2) (3)的分布列为;.【解析】(1)所抽取的100包速冻水饺该项质量指标值的样本平均数为A x Z ()2,N μσZ ()14.55,38.45()10,30X X 11.95σ=≈()2~,Z N μσ()0.6826P Z μσμσ-<≤+=(22)0.9544P Z μσμσ-<≤+=26.5x =0.6826X ()2E X =x.(2)①∵服从正态分布,且, ,∴, ∴落在内的概率是. ②根据题意得, ; ; ; ; . ∴的分布列为∴. 50.1150.2250.3350.25450.1526.5x =⨯+⨯+⨯+⨯+⨯=Z ()2,N μσ26.5μ=11.95σ≈(14.5538.45)(26.511.9526.511.95)0.6826P Z P Z <<=-<<+=Z ()14.55,38.450.68261~4,2X B ⎛⎫ ⎪⎝⎭()404110216P X C ⎛⎫=== ⎪⎝⎭()41411124P X C ⎛⎫=== ⎪⎝⎭()42413228P X C ⎛⎫=== ⎪⎝⎭()43411324P X C ⎛⎫=== ⎪⎝⎭()444114216P X C ⎛⎫=== ⎪⎝⎭X ()1422E X =⨯=【思维点拨】1.条件概率的两种求解方法: (2)基本事件法,借助古典概型概率公式,先求事件A 包含的基本事件数)(A n ,再求事件AB 所包含的基本事件数()AB n ,得)()()|(A n AB n A B P =. 2.判断相互独立事件的三种常用方法:(1)利用定义,事件B A ,相互独立⇔)()()(B P A P AB P ⋅=.(2)利用性质,A 与B 相互独立,则A 与A B ,与B ,B A 与也都相互独立. (3)具体背景下,①有放回地摸球,每次摸球的结果是相互独立的. ②当产品数量很大时,不放回抽样也可近似看作独立重复试验.3. 求离散型随机变量的分布列,首先要根据具体情况确定X 的取值情况,然后利用排列、组合与概率知识求出X 取各个值的概率.4. 利用独立重复试验概率公式可以简化求概率的过程,但需要注意检验该概率模型是否满足公式k n k k n p p C k X P --==)1()(的三个条件:(1)在一次试验中某事件A 发生的概率是一个常数p ;(2)n 次试验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n 次试验中事件A 恰好发生了k 次的概率.5. 求离散型随机变量的均值与方差的基本方法有:(1)已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;(2)已知随机变量X 的均值、方差,求X 的线性函数b aX Y +=的均值、方差,可直接用均值、方差的性质求解,即b X aE b aX E +=+)()(,)()(2X D a b aX D =+(b a ,为常数).(3)如能分析所给随机变量服从常用的分布,可直接利用它们的均值、方差公式求解,即若X 服从两点分布,则p X E =)(,)1()(p p X D -=;若),(~p n B X ,则np X E =)(,)1()(p np X D -=.【巩固训练】题型一 古典概型与几何概型1.已知,,则函数在区间上为增函数的概率是( )A .B .C .D . {}0 1 2a ∈,,{}1 1 3 5b ∈-,,,()22f x ax bx =-()1 +∞,512131416【答案】A【解析】①当时,,情况为符合要求的只有一种; ②当时,则讨论二次函数的对称轴要满足题意则产生的情况表示: ,8种情况满足的只有4种; 综上所述得:使得函数在区间为增函数的概率为:1251214=+=P .2.在区间上任取一数,则的概率是( )A .B .C .D . 【答案】C【解析】由题设可得,即;所以,则由几何概型的概率公式.故应选C .(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.【答案】(1) 0.4;(2) 45;(3)74. 【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为0a =()2f x bx =- 1 1 3 5b =-,,,1b =-0a ≠22b b x a a -=-=1ba≤() a b ,()()()1 1 1 1 1 3-,,,,,()()()()()1 5 2 1 2 1 2 3 2 5-,,,,,,,,,()22f x ax bx =-()1 +∞,()0,4x 1224x -<<12131434211<-<x 32<<x 4,1==D d 41=P考向二 统计与统计案例1.为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只, (Ⅰ)求列联表中的数据,,,的值; (Ⅱ)绘制发病率的条形统计图,并判断疫苗是否有效? (Ⅲ)能够有多大把握认为疫苗有效?22⨯x y A B【答案】(Ⅰ),,,;(Ⅱ)详见解析;(Ⅲ)至少有%9.99的把握认为疫苗有效.【解析】(Ⅰ)设“从所有试验动物中任取一只,取到“注射疫苗”动物”为事件A, 由已知得,所以,,,.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率.10y =40B =40x =60A =302()1005y P A +==10y =40B =40x =60A =未注射 注射. 所以至少有%9.99的把握认为疫苗有效.2.在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在市的区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记表示在各区开设分店的个数, 表示这个分店的年收入之和.(Ⅰ)该公司已经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程; (Ⅱ)假设该公司在区获得的总年利润(单位:百万元)与之间的关系为,请结合(Ⅰ)中的线性回归方程,估算该公司应在区开设多少个分店,才能使区平均每个分店的年利润最大? 参考公式:, , .【答案】(1);(2)公司应在区开设4个分店,才能使区平均每个分店的年利润最大.【解析】(1)10085)())(()(,4,42112121^=---=--===∑∑∑∑====x x y yx x x n xyx n yx b y x ni ini iini ini iiΘ,6.0^^=-=x b y a , ∴y 关于x 的线性回归方程6.085.0+=x y .(2) ,区平均每个分店的年利润 ,∴时, 取得最大值,故该公司应在区开设4个分店,才能使区平均每个分店的年利润最大.10000005016.6710.8285020603=≈>⨯⨯S A x y x y x y x A z ,x y 20.05 1.4z y x =--A A y b x a ∧∧∧=+1221ni i i nii x y nxyb x nx ∧==-==-∑∑()()()121niii n ii x x y y x x ==---∑∑a y b x ∧∧=-0.850.6y x =+A A 20.05 1.4z y x =--=20.050.850.8x x -+-A 0.80.050.85z t x x x ==--+800.0150.85x x ⎛⎫=-++ ⎪⎝⎭4x =t A A3. 某商场对商品30天的日销售量y (件)与时间t (天)的销售情况进行整理,得到如下数据,经统计分析,日销售量y (件)与时间t (天)之间具有线性相关关系.(1)请根据表中提供的数据,用最小二乘法求出y 关于t 的线性回归方程a t b y +=. (2)已知商品30天内的销售价格z (元)与时间t(天)的关系为,),200(,20),3020(,100⎩⎨⎧∈<<+∈≤≤+-=N t t t N t t t z 根据(1)中求出的线性回归方程,预测t 为何值时,商品的日销售额最大.参考公式:2121^)(t n tyt n yt b ni ini ii--=∑∑==,t b y a ^^-=.【答案】(1)40^+-=t y ;(2)预测当20=t 时,商品的日销售额最大,最大值为1600元. 【解析】(1)根据题意,6)108642(51=++++⨯=t ,34)3033323738(51=++++⨯=y , 980301033832637438251=⨯+⨯+⨯+⨯+⨯=∑=i i i y t ,22010864222222512=++++=∑=i i t ,所以回归系数为1652203465980)(22121^-=⨯-⨯⨯-=--=∑∑==t n tyt n yt b ni ini ii,406)1(34^^=⨯--=-=t b y a ,故所求的线性回归方程为40^+-=t y . (2)由题意得日销售额为,,3020),40)(100(,200),40)(20(⎩⎨⎧∈≤≤+-+-∈<<+-+=Nt t t t Nt t t t L当N t t ∈<<,200时,900)10(80020)40)(20(22+--=++-=+-+=t t t t t L , 所以当;90010max ==L t 时,当N t t ∈≤≤,3020时,900)70(4000140)40)(100(22--=+-=+-+-=t t t t t L , 所以当.160020max ==L t 时,综上所述,预测当20=t 时,A 商品的日销售额最大,最大值为1600元. 题型三 概率、随机变量及其分布A A A A1.在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者654321,,,,,A A A A A A 和4名女志愿者4321,,,B B B B ,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.(I )求接受甲种心理暗示的志愿者中包含1A 但不包含的频率。
2020年高考数学(理)重难点专练05 概率与统计(解析版)
重难点05 概率与统计【高考考试趋势】统计主要考查抽样的统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算.试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,几何概型解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差.概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活.取代了传统意义上的应用题,成为高考中的亮点.解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注【知识点分析以及满分技巧】1抽样方法是统计学的基础,在复习时要抓住各种抽样方法的概念以及它们之间的区别与联系.茎叶图也成为高考的热点内容,应重点掌握.明确变量间的相关关系,体会最小二乘法和线性回归方法是解决两个变量线性相关的基本方法,就能适应高考的要求.2.求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因.(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.3.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.【常见题型限时检测】(建议用时:35分钟)一、单选题1.(2019·广西高考模拟(理))中国古代的五经是指:《诗经》、《尚书》、《礼记》、《周易》、《春秋》,甲、乙、丙、丁、戊5名同学分别选取了其中一本不同的书作为课外兴趣研读,若甲乙都没有选《诗经》,乙也没选《春秋》,则5名同学所有可能的选择有()A.18种B.24种C.36种D.54种【答案】D【分析】分两类求解:(1)甲选《春秋》;(2)甲不选《春秋》;分别求出可能的选择情况,再求和即可得出结果.【详解】(1)若甲选《春秋》,则有133318C A=种情况;(2)若甲不选《春秋》,则有233336A A=种情况;+=种情况.所以5名同学所有可能的选择有183654故选D【点睛】本题主要考查计数原理,熟记排列组合的概念等即可,属于常考题型. 2.(2020·重庆巴蜀中学高三月考(理))新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩将计入高考总成绩,即“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为A、B、C、D、E五个等级.某试点高中2018年参加“选择考”总人数是2016年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2016年和2018年“选择考”成绩等级结果,得到如下图表:针对该校“选择考”情况,2018年与2016年比较,下列说法正确的是()A.获得A等级的人数减少了B.获得B等级的人数增加了1.5倍C.获得D等级的人数减少了一半D.获得E等级的人数相同【答案】B【分析】设出两年参加考试的人数,然后根据图表计算两年等级为A,B,C,D,E的人数,由此判断出正确选项.【详解】设2016年参加考试x人,则2018年参加考试2x人,根据图表得出两年各个等级的人数如下图所示:由图可知A,C,D 选项错误,B 选项正确,故本小题选B. 【点睛】本小题主要考查图表分析,考查数据分析与处理能力,属于基础题.3.(2019·广东高考模拟(理))己知某产品的销售额y 与广告费用x 之间的关系如下表:若求得其线性回归方程为 6.5ˆyx a =+,则预计当广告费用为6万元时的销售额为 A .42万元 B .45万元C .48万元D .51万元【答案】C 【分析】根据上表中的数据,求得样本点中心(),x y ,代入回归直线的方程,求得a 的值,得到回归直线的方程,即可求解. 【详解】由题意,根据上表中的数据,可得2x =,22y =,即回归方程经过样本点中心(),x y ,又由线性回归方程为 6.5ˆyx a =+,所以22 6.52a =⨯+,解得9a =, 所以 6.59ˆyx =+,当6x =时,ˆ48y =,故选C. 【点睛】本题主要考查了回归直线方程的应用问题,其中解答中熟记回归直线方程的性质,求得归直线的方程是解答的关键,着重考查了运算与求解能力,属于基础题.4.(2019·横峰中学高考模拟(理))已知(1)n x λ+展开式中第三项的二项式系数与第四项的二项式系数相同,且01(1)n x a a x λ+=++22nn a x a x +⋯+,若12242n a a a ++⋯+=,则4()x xλ+展开式中常数项( )A .32B .24C .4D .8【答案】B 【分析】先由二项展开式中第三项的二项式系数与第四项的二项式系数相同,求出n ;再由2012(1)n n n x a a x a x a x λ+=+++⋯+求出λ,由二项展开式的通项公式,即可求出结果.【详解】因为(1)nx λ+展开式中第三项的二项式系数与第四项的二项式系数相同, 所以23n n C C =,因此5n =,又5205125(1)x a a x a x a x λ+=+++⋯+,所以01a =, 令1x =,则01525(1)a a a a λ+=+++⋯+,又125242a a a ++⋯+=,所以55(3)3124λ+==,因此2λ=, 所以42()x x +展开式的通项公式为44214422k k k k k k k k T C x x C x ---+==,由420k -=得2k =,因此42()x x+展开式中常数项为2234224T C ==.故选B【点睛】本题主要考查求指定项的系数,熟记二项式定理即可,属于常考题型. 5.(2019·山东高三月考)2521(2)(1)x x+-的展开式的常数项是( ) A .3- B .2-C .2D .3【答案】D 【详解】的展开式通项为:,由2100r -=得=5r ,所以的常数项系数为;由2102r -=-得4r =,所以的 项系数为,所以的展开式的常数项是,故选D.6.(2019·安徽高考模拟(理))2019年5月22日具有“国家战略”意义的“长三角一体化”会议在芜湖举行;长三角城市群包括:上海市以及江苏省、浙江省、安徽省三省部分城市,简称“三省一市”. 现有4 名高三学生准备高考后到上海市、江苏省、浙江省、安徽省四个地方旅游,假设每名同学均从这四个地方中任意选取一个去旅游, 则恰有一个地方未被选中的概率为()A.2764B.916C.81256D.716【答案】B【分析】根据排列组合的知识分别求解出恰有一个地方未被选中的情况和所有情况,利用古典概型计算可得结果.【详解】4名同学去旅游的所有情况有:44256=种恰有一个地方未被选中共有:2113424322144C CC AA⋅⋅=种情况∴恰有一个地方未被选中的概率:144925616 p==本题正确选项:B【点睛】本题考查古典概型计算概率的问题、排列组合中的分组分配问题;关键是能够利用排列组合的知识准确求解出恰有一个地方未被选中的情况种数;易错点是忽略了分组分配中的平均分配问题.二、解答题7.(2020·四川高三期末(理))随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人)(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;①将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为X ,求随机变量X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(①)详见解析;(①)①4960;①数学期望为6,方差为2.4. 【分析】(1)完成列联表,由列联表,得2258.333 6.6353K =≈>,由此能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关.(2)① 由题意所抽取的10名女市民中,经常网购的有70107100⨯=人,偶尔或不用网购的有30103100⨯=人,由此能选取的3人中至少有2人经常网购的概率. ① 由22⨯列联表可知,抽到经常网购的市民的频率为:1200.6200=,由题意100.6X B :(,),由此能求出随机变量X 的数学期望()E X 和方差()D X . 【详解】解:(1)完成列联表(单位:人):由列联表,得: ()2220050305070258.333 6.635120801001003K ⨯⨯-⨯==≈>⨯⨯⨯, ①能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关. (2)①由题意所抽取的10名女市民中,经常网购的有70107100⨯=人, 偶尔或不用网购的有30103100⨯=人, ①选取的3人中至少有2人经常网购的概率为:2137373104960c c c P c +==. ① 由22⨯列联表可知,抽到经常网购的市民的频率为:1200.6200=, 将频率视为概率,①从我市市民中任意抽取一人,恰好抽到经常网购市民的概率为0.6, 由题意()100.6X B :,, ①随机变量X 的数学期望()100.66E X =⨯=, 方差D (X )=()100.60.4 2.4D X =⨯⨯=. 【点睛】本题考查独立检验的应用,考查概率、离散型随机变量的分布列、数学期望、方差的求法,考查古典概型、二项分布等基础知识,考查运算求解能力,是中档题.8.(2020·四川高三期末(理))某市教育部门为了了解全市高一学生的身高发育情况,从本市全体高一学生中随机抽取了100人的身高数据进行统计分析.经数据处理后,得到了如下图1所示的频事分布直方图,并发现这100名学生中,身不低于1.69米的学生只有16 名,其身高茎叶图如下图2所示,用样本的身高频率估计该市高一学生的身高概率.(I)求该市高一学生身高高于1.70米的概率,并求图1中a b c 、、的值.(II)若从该市高一学生中随机选取3名学生,记ξ为身高在(]1.501.70,的学生人数,求ξ 的分布列和数学期望;(①)若变量S 满足-<+)>0.6826PS (μσμσ≤且22)0.9544P S μσμσ-≤+(,则称变量S 满足近似于正态分布2(,)N μσ的概率分布.如果该市高一学生的身高满足近似于正态分布(1.6,0.01)N 的概率分布,则认为该市高一学生的身高发育总体是正常的.试判断该市高一学生的身高发育总体是否正常,并说明理由. 【答案】(I) 见解析;(①)见解析;(①) 见解析. 【解析】分析: (I)先求出身高高于1.70米的人数,再利用概率公式求这批学生的身高高于1.70 的概率.分别利用面积相等求出a 、b 、c 的值. (II)先求出从这批学生中随机选取1名,身高在[]1.501.70,的概率,再利用二项分布写出ξ的分布列和数学期望. (①)先分别计算出-<X +P μσμσ≤()和22)PS μσμσ-<≤+(,再看是否满足-<+)>0.6826P S μσμσ≤(且22)0.9544P S μσμσ-<≤+>(,给出判断.详解: (I)由图2 可知,100名样本学生中身高高于1.70米共有15 名,以样本的频率估计总体的概率,可得这批学生的身高高于1.70 的概率为0.15. 记X 为学生的身高,结合图1可得:2(1.30 1.40)(1.80 1.90)0.02100f X f X <≤=<≤==, 13(1.40 1.50)(1.70 1.80)0.13100f X f X <≤=<≤==,1(1.50 1.60)(1.60 1.70)(120.0220.13)0.352f X f X <≤=<≤=-⨯-⨯=,又由于组距为0.1,所以0.2a =, 1.3 3.5b c ==, (①)以样本的频率估计总体的概率,可得: 从这批学生中随机选取1名,身高在[]1.501.70,的概率 (1.50 1.70)(1.50 1.60)+(1.60 1.70)0.7P X f X f X <≤=<≤<≤=.因为从这批学生中随机选取3 名,相当于三次重复独立试验, 所以随机变量ξ服从二项分布(3,0.7)B ,故ξ的分布列为:()3()?0.3?0.70,1,2,33n nn P n C n ξ-====00.027+10.189+20.441+30.343=2.1E ξ⨯⨯⨯⨯()(或=30.7=2.1E ())ξ⨯(①)由 1.60.01N (,),取=1.60=0.1μσ, 由(①)可知,-<X += 1.50 1.70)0.70.6826PP X μσμσ≤<≤=>()(, 又结合(I),可得:-2<X +2= 1.40 1.80)PP X μσμσ≤<≤()( =2 1.70<X 1.80 1.50 1.70)0.960.544f P X ⨯≤+<≤=>()(,所以这批学生的身高满足近似于正态分布(1.60.01N ,)的概率分布,应该认为该市高一学生的身高发育总体是正常的.【点睛】:(1)本题不难,但是题目的设计比较新颖,有的同学可能不能适应. 遇到这样的问题,首先是认真审题,理解题意,再解答就容易了. (2)在本题的解答过程中,要灵活利用频率分布图计算概率.9.(2019·陕西西北工业大学附属中学高考模拟(理))2017年3月智能共享单车项目正式登陆某市,两种车型(“小绿车”、“小黄车”)采用分时段计费的方式,“小绿车”每30分钟收费0.5元(不足30分钟的部分按30分钟计算);“小黄车”每30分钟收费1元(不足30分钟的部分按30分钟计算).有甲、乙、丙三人相互独立的到租车点租车骑行(各租一车一次).设甲、乙、丙不超过30分钟还车的概率分别为34,23,12,三人租车时间都不会超过60分钟.甲、乙均租用“小绿车”,丙租用“小黄车”.()1求甲、乙两人所付的费用之和等于丙所付的费用的概率;(2)设甲、乙、丙三人所付的费用之和为随机变量ξ,求ξ的分布列和数学期望.【答案】(1)724;(2)见解析.【解析】【分析】(1)利用相互独立事件的概率公式,分两种情况计算概率即可;(2)根据相互独立事件的概率公式求出各种情况下的概率,得出分布列,利用公式求解数学期望.【详解】(I)由题意得,甲乙丙在30分钟以上且不超过60分钟还车的概率分别为.记甲、乙两人所付的费用之和等于丙所付的费用为事件A.则,答:甲、乙两人所付的费用之和等于丙所付的费用的概率为,(①)ξ可能取值有2,2.5,3,3.5,4,①;;;,.甲、乙、丙三人所付的租车费用之和ξ的分布列为:①.【点睛】本题主要考查了相互对立事件的概率的计算,以及离散型随机变量的分布列、数学期望的求解,其中正确理解题意,利用相互独立事件的概率计算公式求解相应的概率是解答的关键,着重考查了分析问题和解答问题的能力,能很好的考查考生数学应用意识、基本运算求解能力等.10.(2019·江西高三月考(理))据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:(1)已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05,现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数ξ的分布列和数学期望.【答案】(1)72;(2)2 .【解析】【分析】(1)由题意得持“应该保留”态度的人为120x+,占总人数3600的0.05,列出对应的概率等式即可算得60x=,再利用分层抽样的方法求解在持“无所谓”态度的人中抽取多少人即可.(2)由分层抽样可求得在校学生为4人,社会人士为2人,再利用超几何分布的方法列出分布列求解期望即可.【详解】(1)因为抽到持“应该保留”态度的人的概率为0.05,所以1200.053600x+=,所以60x=.所以持“无所谓”态度的人数共有3600210012060060720----=,所以应在“无所谓”态度抽取360720723600⨯=人. (2)解:由(①)知持“应该保留”态度的一共有180人, 所以在所抽取的6人中,在校学生为12064180⨯=人, 社会人士为6062180⨯=人, 则第一组在校学生人数1,2,3ξ=1242361(1)5C C P C ξ===,2142363(2)5C C P C ξ===,3042361(3)5C C P C ξ===, 即ξ的分布列为:所以1311232555E ξ=⨯+⨯+⨯=. 【点睛】本题主要考查分层抽样的一般方法与超几何分布的一般方法.同时也考查了分布列与数学期望的方法,属于中等题型.11.(2019·深圳市高级中学高考模拟(理))某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:该景点为了预测2021年的旅游人数,建立了y 与x 的两个回归模型:模型①:由最小二乘法公式求得y 与x 的线性回归方程$50.8169.7y x =+;模型①:由散点图的样本点分布,可以认为样本点集中在曲线bxy ae =的附近.(1)根据表中数据,求模型①的回归方程$bx y ae =.(a 精确到个位,b 精确到0.01). (2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).参考公式、参考数据及说明:①对于一组数据()()()1122,,,,,,n n v w v w v w L ,其回归直线µµµwv αβ=+的斜率和截距的最小二乘法估计分别为µµµ121()(),()niii nii w w v v w v v v βαβ==--==--∑∑. ①刻画回归效果的相关指数µ22121()1()nii i n ii yy R yy ==-=--∑∑ .①参考数据: 5.46235e ≈, 1.43 4.2e ≈.表中1011ln ,10i i i i u y u u ===∑. 【答案】(1) $0.11235x y e = (2)见解析 【解析】 【分析】(1)对bxy ae =取对数,得ln ln y bx a =+, 设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,进而可得结果;(2)由表格中的数据, 30407>14607,可得101022113040714607()()iii i y y y y ==>--∑∑,从而得2212R R < ,进而可得结果.【详解】(1)对bxy ae =取对数,得ln ln y bx a =+,设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,()()()10110219.000.10883iii ii x x u u bx x ==--==≈-∑∑$, 6.050.108 5.5 5.456 5.46cu bx =-≈-⨯=≈$$ $ 5.46235c a e e =≈≈$∴模型①的回归方程为$0.11235x y e =(2)由表格中的数据,有30407>14607,即101022113040714607()()iii i y y y y ==>--∑∑,即10102211304071460711()()iii i y y y y ==-<---∑∑,2212R R <模型①的相关指数21R 小于模型①的22R ,说明回归模型①的拟合效果更好.2021年时,13x =,预测旅游人数为$0.1113 1.43235235235 4.2987y e e ⨯==≈⨯=(万人) 【点睛】本题考查了非线性拟合及非线性回归方程的求解与应用,是源于课本的试题类型,解答非线性拟合问题,先作出散点图,再根据散点图选择合适的函数类型,设出回归方程,利用换元法将非线性回归方程化为线性回归方程,求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.12.(2019·湖南高考模拟(理))在全国第五个“扶贫日”到来之前,某省开展“精准扶贫,携手同行”的主题活动,某贫困县调查基层干部走访贫困户数量.A 镇有基层干部60人,B 镇有基层干部60人,C 镇有基层干部80人,每人都走访了若干贫困户,按照分层抽样,从,,A B C 三镇共选40名基层干部,统计他们走访贫困户的数量,并将走访数量分成5组,[)[)[)[)[]5,15,15,25,25,35,35,45,45,55,绘制成如图所示的频率分布直方图.(1) 求这40人中有多少人来自C 镇,并估计,,A B C 三镇的基层干部平均每人走访多少 贫困户;(同一组中的数据用该组区间的中点值作代表)(2)如果把走访贫困户达到或超过25户视为工作出色,以频率估计概率,从,,A B C 三镇的所有基层干部中随机选取3人,记这3人中工作出色的人数为X ,求X 的分布列及数学期望.【答案】(1)40人中有16人来自C 镇,28.5户(2)见解析 【分析】(1)先确定抽样比,再由C 镇有基层干部80人即可求出结果;求平均数时,只需每组的中间值乘以该组的频率再求和即可;(2)先确定从三镇的所有基层干部中随机选出1人,其工作出色的概率,由题意可知X 服从二项分布,进而可求出结果. 【详解】解:(1)因为,,A B C 三镇分别有基层干部60人,60人,80人,共200人, 利用分层抽样的方法选40人,则C 镇应选取408016200⨯=(人), 所以这40人中有16人来自C 镇因为100.15200.25300.3x =⨯+⨯+⨯ 400.2500.128.5+⨯+⨯=, 所以三镇基层干部平均每人走访贫困户28.5户(2)由直方图得,从三镇的所有基层干部中随机选出1人,其工作出色的概率为35显然X 可取0,1,2,3,且33,5X B ⎛⎫~ ⎪⎝⎭,则()32805125P X ⎛⎫=== ⎪⎝⎭, ()12133236155125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()21233254255125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()332735125P X ⎛⎫=== ⎪⎝⎭ 所以X 的分布列为所以数学期望()8365427901231251251251255E X =⨯+⨯+⨯+⨯= 【点睛】本题主要考查频率分布直方图,以及二项分布,由频率分布直方图求平均数,只需每组的中间值乘以该组频率再求和即可,对于二项分布的问题,熟记二项分布即可求解,属于常考题型.。
(完整版)2020年高考文科数学《概率与统计》题型归纳与训练,推荐文档
1 52 5258 259 2020 年高考文科数学《概率与统计》题型归纳与训练【题型归纳】 题型一 古典概型 例 1从甲、乙等5 名学生中随机选出2 人,则甲被选中的概率为().A.B.C.D.【答案】 【解析】 法有:可设这 5 名学生分别是甲、乙、丙、丁、戊,从中随机选出 2 人的方(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊), (丙,丁),(丙,戊),(丁,戊),共有10 种选法,其中只有前 4 种是甲被选中,所以所求概率为 42.故选 B.10 5例 2 将 2 本不同的数学书和 1 本语文书在书架上随机排成一行,则 2 本数学书相邻的概率为 .【答案】 【解析】根据题意显然这是一个古典概型,其基本事件有:数 1,数 2,语; 数 1,语,数 2;数 2,数 1,语; 数 2,语,数 1;语,数 2,数 1; 语,数 1,数 2 共B2314π 81 2⎧⎪∆ = 4 p 2 - 4(3 p - 2) ≥ 0⎨ x + x = -2 p < 0 1 2 ⎩ ⎪ x x= 3 p - 2 > 0 1 2有 6 种,其中 2 本数学书相邻的有 4 种,则其概率为:.【易错点】列举不全面或重复,就是不准确 【思维点拨】直接列举,找出符合要求的事件个数. 题型二 几何概型 例 1如图所示,正方形ABCD 内的图形来自中国古代的太极 AD图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概BC率是( ).A.B.C.D.【答案】【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为.故选 B.例 2 在区间[0, 5] 上随机地选择一个数的概率为.,则方程 x 2 +2 px +3 p - 2 = 0 有两个负根【答案】【解析】方程 x 2+2 px +3 p - 2 = 0 有两个负根的充要条件是 即Bπ 4p 23p = 4 = 6 2 31 ⎛ a ⎫2 ⨯⨯ ⎪2⎝ 2 ⎭ = 8a 2400或 p ≥ 2 ,又因为 p ∈[0, 5] ,所以使方程 x 2 +2 px +3 p - 2 = 0 有两个负根的 p【易错点】“有两个负根”这个条件不会转化.【思维点拨】“有两个负根”转化为函数图像与 x 轴负半轴有两个交点.从而得到参数 p 的范围.在利用几何概型的计算公式计算即可. 题型三 抽样与样本数据特征 例 1某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200 ,, 300 ,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60 件进行检验,则应从丙种型号的产品中抽取件.【答案】18【解析】按照分层抽样的概念应从丙种型号的产品中抽取300 ⨯ 60 1000= 18 (件).例 2已知样本数据x 1 , x 2 , ⋅⋅⋅ , x n 的均值 x = 5 ,则样本数据2x 1 +1 , 2x 2 +1 , ⋅⋅⋅ , 2x n +1 的均值为 .【答案】11 【解析】因为样本数据x 1 , x 2 , ⋅⋅⋅ , x n 的均值x = 5 ,又样本数据2x 1 +1 ,2x 2 +1, ⋅⋅⋅ , 2x n +1的和为2(x 1 + x 2 + + x n )+ n ,所以样本数据的均值为2x +1 =11.例 3 某电子商务公司对10000 名网络购物者 2018 年度的消费情况进行统计,3 2.发现消费金额(单位:万元)都在区间[0.3,0.9] 内,其频率分布直方图如图所示. (1)直方图中的a = .(2)在这些购物者中,消费金额在区间[0.5,0.9] 内的购物者的人数为.a/万万【答案】a = 3 人数为0.6 ⨯10000 = 6000【解析】由频率分布直方图及频率和等于1,可得0.2 ⨯ 0.1+ 0.8⨯ 0.1+1.5⨯ 0.1+ 2 ⨯ 0.1+ 2.5⨯ 0.1+a ⨯ 0.1 = 1 ,解之得a = 3 .于是消费金额在区间[0.5,0.9]内频率为0.2 ⨯0.1+ 0.8⨯0.1+ 2 ⨯0.1+ 3⨯0.1 = 0.6 ,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6⨯10000=6000.例4 某城市100户居民的月平均用电量(单位:度),以[160,180),[180, 200),[200, 220),[220, 240),[240, 260),[260, 280),[280, 300]分组的频率分布直方图如图所示.2220 + 240 = 230得 x = 0.0075 .又(0.002 + 0.0095 + 0.011+ 0.0125)⨯ 20 = 0.7 > 0.5 ,160 180 200 220 240 260 280 300 万万万万万万/万(1) 求直方图中 x 的值;(2) 求月平均用电量的众数和中位数;(3)在月平均用电量为[220, 240), [240, 260), [260, 280), [280, 300]的四组用户中, 用分层抽样的方法抽取11户居民,则从月平均用电量在[220, 240)的用户中应抽 取多少户?【答案】见解析【解析】(1)由(0.002 + 0.0095 + 0.011+ 0.0125 + x + 0.005 + 0.0025)⨯ 20 = 1 ,(2)由图可知,月平均用电量的众数是.因为(0.002 + 0.0095 + 0.011)⨯ 20 = 0.45 < 0.5 ,所以月平均用电量的中位数在[220, 240)内.设中位数为a ,由(0.002 +0.0095 +0.011)⨯20 +0.0125⨯(a -220)=0.5 ,得a = 224 ,所以月平均用电量的中位数是224 .(3)月平均用电量为[220,240)的用户有0.0125⨯ 20 ⨯100 = 25 (户);月平均用电量为[240,260)的用户有0.0075⨯20⨯100=15(户);月平均用电量为[260,280)的用户有0.005⨯20⨯100=10(户);月平均用电量为[280, 300]的用户有0.0025⨯ 20 ⨯100 = 5 (户).所以从月平均用电量在[220,240)的用户中应抽取25⨯1 = 5 (户).5【易错点】没有读懂题意,计算错误.不会用函数思想处理问题【思维点拨】根据题意分情况写出函数解析式;2 牵涉到策略问题,一般可以转化为比较两个指标的大小.题型四回归与分析例1 下图是我国2008 年至2014 年生活垃圾无害化处理量(单位:亿吨)的折线图∑ i =1nn(t - t ) (y - y)2 ∑ 2i ii =1∑ i =17( y - y )2i nn万万 1.80 万万 1.60 万万万 1.40 万万 1.20 万万1.00y0.80234567年份代码t(1) 由折线图看出,可用线性回归模型拟合 y 与t 的关系,请用相关系数加以说明(2) 建立 y 关于t 的回归方程(系数精确到0.01 ),预测2016 年我国生活垃圾无害化处理量.参考数据: 7 y = 9.32 , 7 t y = 40.17 ,= 0.55 , ≈ 2.646 .∑ii =1∑i ii =1n∑(t i - t )( y i - y )参考公式:相关系数r =i =1回归方程 y = a+ b t 中斜率和截距的最小二乘估计公式分别为:∑(t i - t )( y i - y )b= i =1 a = y - bt .∑(ti- t )2i =1【答案】见解析72【解析】(1)由折线图中数据和附注中参考数据得t = 4 , ∑(t i - t ) = 28 ,i =1 7∑ i =17 7(t - t ) ⋅ ( y - y )2∑ 2iii =1 ∑ i =17 (t - t ) 2ii =1 ∑ i =17( y - y )2i7 ∑ 7(t - t ) 2 i i =1i= 0.55 ,∑7(t - t )(y - y )= ∑7t y - t ∑7y = 40.17 - 4 ⨯ 9.32 = 2.89 ≈2.89≈ . , r0.99 i ii ii0.55⨯ 2 ⨯ 2.646i =1i =1i =1因为 y 与t 的相关系数近似为0.99 ,说明 y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与t 的关系.7777 ∑(t i - t )( y i - y )7∑t i y i - ∑t i ⋅∑ y i(1)变量 y 与t 的相关系数r =i =1=i =1i =1,7 ⨯⋅777又∑t i = 28 , ∑ y i = 9.32 , ∑t i y i = 40.17 2= 5.292 ,i =1i =1i =1= 0.55 ,所以r = 7 ⨯ 40.17 - 28⨯ 9.32 ≈ 0.997 ⨯ 5.292 ⨯ 0.55,故可用线性回归模型拟合变量 y 与t 的关系.t y - 7t ⋅ y117∑7i i40.17 - 7 ⨯ 4 ⨯ 7 ⨯ 9.32(2) t = 4 , y =∑y ,所以b ˆ= i =1 == 0.10 ,7 i =1 i∑7 i =1t 2 -7t 2 28a ˆ = y -b ˆx = 1⨯ 9.32 - 0.10 ⨯ 4 ≈ 0.93 ,所以线性回归方程为 y ˆ = 0.1t + 0.93 .7当t = 9 时, y ˆ= 0.1⨯ 9 + 0.93 = 1.83 .因此,我们可以预测 2016 年我国生活垃圾无害化处理1.83 亿吨.【易错点】没有读懂题意,计算错误.∑(72y - y i) i =1∑ i =17( y - y )2i【思维点拨】将题目的已知条件分析透彻,利用好题目中给的公式与数据.题型五独立性检验例1 甲、乙、丙、丁四位同学各自对A、B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A、B 两变量更强的线性相关性?( ) A.甲B.乙C.丙D.丁【答案】D【解析】D 因为r>0 且丁最接近1,残差平方和最小,所以丁相关性最高【易错点】不理解相关系数和残差平方和与相关性的关系【思维点拨】相关系数r 的绝对值越趋向于1,相关性越强.残差平方和m 越小相关性越强【巩固训练】题型一古典概型151 141 1211. 将一颗质地均匀的骰子(一种各个面上分别标有1,2, 3, 4,5, 6 个点的正方体玩具)先后抛掷2 次,则出现向上的点数之和小于10 的概率是 .【答案】 56【解析】将先后两次点数记为(x , y ),则基本事件共有6 ⨯ 6 = 36 (个), 其中点数之和大于等于10有(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6 种, 则点数之和小于10 共有30 种,所以概率为30 = 5. 36 62. 我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于 2 的偶数可以表示为两个素数的和”,如30 = 7 + 23 .在不超过30 的素数中,随机选取两个不同的数,其和等于 30 的概率是( ).A.B .C .D .【答案】C【解析】不超过 30 的素数有 2、3、5、7、11、13、17、19、23、29,共 10 个, 随机选取两数有45 (种)情况,其中两数相加和为 30 的有 7 和 23,11 和19,13 和 17,共 3 故选C .3. 袋中有形状、大小都相同的 4 只球,其中1 只白球,1 只红球, 2 只黄球,从中一次随机摸出【答案】 只球,则这 2 只球颜色不同的概率为 .【解析】1 只白球设为 a ,1 只红球设为 b , 2 只黄球设c 为 , d ,2 P = 56181则摸球的所有情况为(a,b),(a, c),(a, d ),(b,c),(b,d ),(c, d ),共6 件,满足题意的事件为(a,b),(a, c),(a, d ),(b,c),(b,d ),共5.题型二几何概型1.某公司的班车在7:00,8:00,8:30 发车,学.小明在7:50 至8:30 之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10 分钟的概率是().A.F(1) 13B. 12F(1)C.F(2) 23D. 34【答案】B【解析】如图所示,画出时间轴.7:30 7:40 7:50 8:00 8:10 8:20 8:30B小明到达的时间会随机的落在图中线段AB 中,而当他的到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10 分钟.根据几何概型,所求概率P =10 +10 =1 .故选B.40 22.从区间[0,1]随机抽取2n 个数x1,x2 ,…,x n ,y1 ,y2 ,…,y n ,构成n 个数对(x1, y1),(x2 , y2),…,(xn ,yn),其中两数的平方和小于1 的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为().p 2 =p3p 1 =p3p 1 =p2AB4n 2n 4mA.mB. mC.2mnn D. 【答案】C【解析】由题意得:(x i△△△△y i)(i =1 2 ⋅⋅⋅n)在如图所示方格中,而平方和小于1 的π4 =m π =4m点均在如图所示的阴影中,由几何概型概率计算公式知1 n ,所以C.n .故选3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边,A C ,的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,,p3,则A.B.C.D.【答案】A【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可.设直角三角形ABC 的三个角 A ,B ,C 所对的边长分别为a ,b ,c ,则区域Ⅰ的面积为S1=1ab ,2p 2p 1 =p2+p3△ABC⎝ ⎭ ⎝ ⎭ ⎝ ⎭2区域Ⅱ的面积为 1 ⎛ 1 ⎫2 1 ⎛ 1 ⎫2 1 1 ⎛ 1 ⎫21S 2 = 2 π 2 c ⎪ + 2 π 2 b ⎪ + 2 ab - 2 π 2 a ⎪ = 2 ab ,2 区域Ⅲ的面积为 S = 1 π⎛ 1 c ⎫ + 1 π⎛ 1 b ⎫ - 1 ab = 1 πa 2 - 1 ab .3 2 2⎪ 2 2 ⎪ 28 2 ⎝ ⎭ ⎝ ⎭显然 p 1 = p 2 .故选 A .题型三 抽样与样本的数据特征1. 已知一组数据4 ,6 , 5 , 8 ,7 , 6 ,那么这组数据的平均数为 .【答案】10【解析】平均数x = 1 (4 + 6 + 5 + 8 + 7 + 6)= 6 . 62. 某电子商务公司对 10000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3, 0.9] 内,其频率分布直方图如图所示.(Ⅰ)直方图中的a =;(Ⅱ)在这些购物者中,消费金额在区间[0.5, 0.9] 内的购物者的人数为.【答案】3;6000【解析】频率和等于 1 可得0.2 ⨯ 0.1 + 0.8 ⨯ 0.1 + 1.5 ⨯ 0.1 + 2 ⨯ 0.1 + 2.5 ⨯ 0.1 + a ⨯ 0.1 = 1 , 解之得a = 3 .于是消费金额在区间[0.5, 0.9] 内频率为0.2 ⨯ 0.1 + 0.8 ⨯ 0.1 + 2 ⨯ 0.1 + 3 ⨯ 0.1 = 0.6 , 所以消费金额在区间[0.5, 0.9] 内的购物者的人数为: 0.6 ⨯10000 = 6000 ,故应填3;6000.3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨)、一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100 位居民每人的月均用水量(单位:吨),将数据按照[0, 0.5),[0.5,1),⋅⋅⋅,[4, 4.5)分成9 组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30 万居民,估计全市居民中月均用水量不低于3 吨的人数,请说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.【答案】见解析【解析】(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08⨯0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08 ,0.20 ,0.26 ,0.06 ,0.04 ,0.02 .由0.04+0.08+0.5⨯a + 0.20 + 0.26 + 0.5⨯a + 0.06 + 0.04 + 0.02 = 1 ,解得 a = 0.30 .(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30 万居民中月均用水量不低于 3 吨的人数为300000⨯ 0.12 = 36000 .(3)因为前 6 组的频率之和为0.04 - 0.08 - 0.15 - 0.20 - 0.26 - 0.15=0.88 > 0.85 ,而前5 组的频率之和为0.04+0.08+0.15 -0.20 -0.26=0.73 < 0.85 ,所以2.5 …x < 3.由0.3⨯(x - 2.5)= 0.85 - 0.73 ,解得x = 2.9 .题型四回归与分析1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5 户家庭,得到如下统计数据表:区一户收入为15 万元家庭年支出为()A.11.4 万元B.11.8 万元C.12.0 万元D.12.2 万元【答案】B所以回归直线方程为yˆ=0.76x+0.4.当社区一户收入为15 万元,家庭年支出为(万元).故选B.0.4 = 11.8yˆ=0.76⨯15+y ∑2. 为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10 名学生,根据测量数据的散点图可以看出 与x 之间有线性相关关系,设其回归直线方程为 y ˆ= b ˆx + a ˆ.已知∑x i i =110= 225 , y i = 1600 , b ˆ= 4 .该i =1班某学生的脚长为 24,据此估计其身高为( ).A . 160B . 163C . 166D .170【答案】C 【解析】 故选 C .x = 22.5 , y = 160 ,所以a= 160 - 4⨯ 22.5 = 70 , x = 24 时, y = 4 ⨯ 24 + 70 = 166 .3. 某公司为确定下一年投入某种产品的宣传费,需了解年宣传费 x (单位:千元)对年销售量 y (单位: )和年利润 z (单位:千元)的影响,对近 8 年的年宣传费x i和年销售量计量的值.y i (i = 1, 2,⋅⋅⋅,8)数据作了初步处理,得到下面的散点图及一些统万万万万/万万10 t(u 2,v 2 ) (u 1,v 1 ) y = c + d x x = 49表中,,(1) 根据散点图判断, y = a + bx 与y = c + d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)?(2) 根据(1)的判断结果及表中数据,建立 y 关于x 的回归方程;(3) 已知这种产品的年利润z 与x , y 的关系式为 z = 0.2y - x,根据(2)的结果回答下列问题:(ⅰ)年宣传费 时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据 ,⋅ ⋅ ⋅ , (u n , v n ),其回归直线v =+ u 的斜率,和截距的最小二乘估计分别为【答案】见解析【解析】(1)由散点图变化情况可知选择 较为适宜.w i = x iˆ =i =1∑(u i - u )(v i - v ) n∑ i =1n(u - u )2i.x yw∑( )2x- x ii =1∑( )( - ) w - w y y i ii =1∑8( )2w- w ii =1 ∑( - )( -) 8x x y yiii =146.6563 6.8289.8 1.6 1469 108.81 8w = ∑w i8 i =1563 - 68⨯ 6.8 = 100.6 c = y - d = ∑(w - w1.6)∑8(w - w )(y - yii) 108.8(2)由题意知d =i =1= = 68 .又82i一定过点(, y ),i =1所以 ,所以 y 与x 的回归方程为 y = 100.6 + 68 x .(3)(ⅰ)由(2)知,当 x = 49 时,y = 100.6 + 68⨯ 49 = 576.6(t ),(千元),所以当年宣传费为 x = 49 时,年销售量为576.6(t ),利润预估为66.32 千元.(ⅱ)由(2)知, z = 0.2 y - x = 0.2 (100.6 + 68 x )- x =-(x - 6.8)2+ 6.82 + 20.12 ,所以当 x = 6.8 时,年利润的预估值最大,即 x = 6.82 = 46.24 (千元). 题型五 独立性检验1. 某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H :“这种血清不能起到预防感冒的作用”,利用 2×2 列联表计算的 K 2≈3.918,则下列表述中正确的是( )A. 有 95℅的把握认为“这种血清能起到预防感冒的作用”B. 若有人未使用该血清,那么他一年中有 95℅的可能性得感冒y = c + d x 66.32 z = 0.2 ⨯ 576.6 - 49 = 20.12 = 13.6 x - x +a a +bc c + dkg C. 这种血清预防感冒的有效率为 95℅D. 这种血清预防感冒的有效率为 5℅【答案】A【解析】由题可知,在假设成立情况下,P (K 2≥ 3.841) 的概率约为 0.05,即在 犯错的概率不错过 0.05 的前提下认为“血清起预防感冒的作用”,即有 95℅的把握认为“这种血清能起到预防感冒的作用”.这里的 95℅是我们判断 不成立的概率量度而非预测血清与感冒的几率的量度,故 B 错误.C ,D 也犯有 B 中的错误.故选 A2. 观察下面频率等高条形图,其中两个分类变量x ,y 之间关系最强的是( )A .B .C .D .【答案】D【解析】在频率等高条形图中, 与 相差很大时,我们认为两个分类变量有关系,四个选项中,即等高的条形图中 x 1, x 2 所占比例相差越大,则分类变量 x , y 关系越强,故选D .3. 淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位: )的频率分布直方图如图所示.H H万万万万万万万万万万/k g万万万万(1)设两种养殖方法的箱产量相互独立,记 A 表示事件:旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ,估计 A 的概率;(2)填写下面列联表,并根据列联表判断是否有99% 的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01 ).附:21. 【答案】见解析【解析】(1)记:“旧养殖法的箱产量低于50kg ” 为事件B ,“新养殖法的箱产量不低于50kg ”为事件C ,由题图并以频率作为概率得,, P (A )= P (B )P (C )= 0.4092 .(2)由计算可得 的观测值为 k 2 = 200 ⨯ (62 ⨯ 66 - 38 ⨯ 34)2100 ⨯100 ⨯ 96 ⨯104 = 15.705 ,因为15.705 > 6.635 ,所以P (K 2 ≥ 6.635)≈ 0.001 ,从而有99% 以上的把握认为箱产量与养殖方法有关.(3)1 ÷ 5 = 0.2 , 0.1 - (0.004 + 0.020 + 0.044)= 0.032 , 50 + 2.35 = 52.35 ,所以中位数为52.35 .0.032 ÷ 0.068 = 8 17 , 8 ⨯ 5 ≈ 2.35 , = 0.66 P (C )= 0.068 ⨯ 5 + 0.046 ⨯ 5 + 0.010 ⨯ 5 + 0.008 ⨯ 5K 2 = 0.62 P (B )= 0.040 ⨯ 5 + 0.034 ⨯ 5 + 0.024 ⨯ 5 + 0.014 ⨯ 5 + 0.012 ⨯ 5 17K 2= n (ad - bc )2 (a + b )(c + d )(a + c )(b + d )22“”“”At the end, Xiao Bian gives you a passage. Minand once said, "people who learn to learn are very happy people.". In every wonderful life, learning is an eternal theme. As a professional clerical and teaching position, I understand the importance of continuous learning, "life is diligent, nothing can be gained", only continuous learning can achieve better self. Only by constantly learning and mastering the latest relevant knowledge, can employees from all walks of life keep up with the pace of enterprise development and innovate to meet the needs of the market. This document is also edited by my studio professionals, there may be errors in the document, if there are errors, please correct, thank you!。
2020年高考数学(理)二轮专项复习专题11 概率统计(含答案)
2020年高考数学(理)二轮专项复习专题11 概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法.统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型,学习某些离散型随机变量分布列及其期望、方差等内容,初步学会利用离散型随机变量思想描述和分析某些随机现象的方法,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§11-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.n m n m3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作,满足P ()=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=,即 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量. 随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力. A A ⋅=nA P i 1)(试验的基本事件总数包含的基本事件数事件A ⋅=)()()(Ωn A n A P ΩA A P μμ=)(6.条件概率与事件的独立性条件概率:一般的,设A 、B 为两个事件,且P (A )>0,称P (B |A )=为在事件A 发生的条件下,事件B 发生的概率.一般把P (B |A )读作“A 发生的条件下B 发生的概率”.在古典概型中,用n (A )表示事件A 中基本事件的个数,则有P (B |A )=.事件的独立性:设A 、B 为两个事件,如果P (B |A )=P (B ),则称事件A 与事件B 相互独立,并称事件A 、B 为相互独立事件.若A 、B 为两个相互独立事件,则A 与、与B 、与也都相互独立.若事件A 与事件B 相互独立,则P (A ∩B )=P (A )·P (B ).【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.5.在具体情境中,了解条件概率,了解两个事件相互独立的概念及独立事件的概率乘法公式,并能解决一些简单的实际问题.【例题分析】例1 国家射击队的某队员射击一次,命中7-10环的概率如下表:求该队员射击一次,(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于)()(A P B A P )()(A n B A n A A A B射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P ()求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P ()=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)}由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的. 用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1), A B )()()(Ωn A n A P =(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而 (Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件表示“B 1,C 1全被选中”这一事件,由于={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件由3个基本事件组成,所以,由对立事件的概率公式得 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为例3 一个口袋中装有大小相同的2个红球,3个黑球和4个白球,从口袋中一次摸出一个球,摸出的球不再放回.(1)连续摸球2次,求第一次摸出黑球,第二次摸出白球的概率;(2)连续摸球2次,在第一次摸到黑球的条件下,求第二次摸到白球的概率;(3)如果摸出红球,则停止摸球,求摸球次数不超过3次的概率.【分析】本题是一个古典概型问题,因为基本事件空间中所含基本事件的个数较多,宜用排列组合公式计算,当然也可利用两个计数原理计数.本题第二问是条件概率问题.做第三问时,要分为三个事件:“第一次摸到红球”,“第一次摸到不是红球,第二次摸到红球”,“前两次摸到不是红球,第三次摸到红球”,显然三个事件是互斥事件.解:(1)从袋中依次摸出2个球共有种结果,第一次摸出黑球、第二次摸出白球有3×4=12种结果,则所求概率(或). (2)设“第一次摸到黑球”为事件A ,“第二次摸到白球”为事件B ,则“第一次摸到黑球,且第二次摸到白球”为事件A ∩B ,又,P (A ∩B ),所以或 ⋅==31186)(M P N N N 61183)(==N P ⋅=-=-=65611)(1)(N P N P ⋅3129A 6112291==A P 6184931=⨯=P 31)(=A P 61=⋅==213161)|(A B P(或). (3)第一次摸出红球的概率为,第二次摸出红球的概率为,第三次摸出红球的概率为,则摸球次数不超过3次的概率为 【评析】利用古典概型求解时,求基本事件的个数和事件发生的总数时求法要一致,若无序则都无序,若有序则都有序,分子和分母的标准要相同.在求事件个数时常用列举法(画树状图、列表、坐标系法),有时也与排列组合联系紧密,计算时灵活多变,但要注意分类讨论,做到不重不漏.要正确识别条件概率问题,理解P (A),P (A ∩B ),P (B |A )的含义.例4 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?”易求得 (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”,解得 (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之2184)|(==A B P 1912A A 291217A A A 391227A A A ⋅=++=12739122729121719122A A A A A A A AP ⋅=31P ⋅=167)(A P ⋅=6πP对应的区域A ;利用概率公式计算.常用的几何度量包括:长度、面积、体积. 例5 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解. 解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为 (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }. 所以所求的概率为 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.例6 如图,用A 、B 、C 三类不同的元件连结成两个系统N 1、N 2,当元件A 、B 、C 都正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,已知元件A 、B 、C 正常工作的概率为0.80、0.90、0.90,分别求系统N 1、N 2正常工作的概率.【分析】三个元件能否正常工作相互独立.当元件A 、B 、C 同时正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,而B 、C 至少有一个正常工作的概率可通过其对立事件计算.解:设元件A 、B 、C 正常工作为事件A 、B 、C ,则P (A )=0.8,P (B)=0.9,P (C)=0.9,且事件A 、B 、C 相互独立.)()()(ΩA A P μμ=⋅==43129)(A P ⋅=⨯⨯-⨯=3223221232(1)系统N 1正常工作的概率为p 1=P (A ·B ·C )=P (A )·P (B )·P (C )=0.80×0.90×0.90=0.648.(2)元件B 、C 至少有一个正常工作的概率为1-P (·)=1-P ()·P ()=1-0.1×0.1=0.99,所以系统N 2正常工作的概率为p 2=P (A )·(1-P (·))=0.80×0.99=0.792.【评析】本题以串、并联为背景,重点在正确理解题意.在计算几个事件同时发生的概率时,要先判断各个事件之间是否相互独立.独立事件、互斥事件、对立事件的概率各有要求,要依据题目特点,巧妙地选用相关方法.例7 每次抛掷一枚质地均匀的骰子(六个面上分别标以数字1,2,3,4,5,6).(1)连续抛掷3次,求向上的点数之和为3的倍数的概率;(2)连续抛掷6次,求向上的点数为奇数且恰好出现4次的概率.【分析】向上点数之和为3的倍数共有6种情况,计数时要不重不漏;向上点数为奇数的概率为,连续抛掷6次是独立重复试验.解:(1)向上的点数之和为3的结果有1种情况,为6的结果共10种情况,为9的结果共25种情况,为12的结果共25种情况,为15的结果共10种情况,为18的结果共1种情况.所以 (2)因为每次抛掷骰子,向上的点数为奇数的概率为P =, 根据独立重复试验概率公式有 【评析】独立重复试验是一类重要的概率问题,要善于分析模型的特点,正确合理的解题.例8 某学校进行交通安全教育,设计了如下游戏,如图,一辆车模要直行通过十字路口,此时前方交通灯为红灯,且该车模前面已有4辆车模依次在同一车道上排队等候(该车道只可以直行或左转行驶).已知每辆车模直行的概率是,左转行驶的概率是,该路口红绿灯转换间隔时间均为1分钟.假设该车道上一辆直行去东向的车模驶出停车线需要10秒钟,一辆左转去北向的车模驶出停车线需要20秒钟,求: B C B C B C 21⋅=⨯⨯+++++=3166611025251012P 21⋅==⋅⋅6415)21()21(24463C P 5352(1)前4辆车模中恰有2辆车左转行驶的概率;(2)该车模在第一次绿灯亮起时的1分钟内通过该路口的概率(汽车驶出停车线就算通过路口).【分析】该车模1分钟内通过路口包含2种情况:4辆车都直行,3辆车直行1辆车左转.解:(1)设前4辆车模中恰有2辆左转行驶为事件A ,则(2)设该车在第一次绿灯亮起时的1分钟内通过该路口为事件B ,其中4辆车模均直行通过路口为事件B 1,3辆直行1辆左转为事件B 2,则事件B 1、B 2互斥.【评析】善于从复杂的背景中发现线索,体会其实质.善于转化问题的叙述,恰当的分类.练习11-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球⋅=⨯=625216)52()53()(2224C A P =+=+=)()()()(2121B B P B B P B P ⋅=⨯+62529752)53()53(334444C C3.独立工作的两套报警系统遇危险报警的概率均为0.4,则遇危险时至少有一套报警系统报警的概率是( )A .0.16B .0.36C .0.48D .0.644.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .B .C .D . 二、填空题5.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.6.设每门高射炮命中飞机的概率都是0.6.今有一敌机来犯,要有99%的把握击中敌机,至少需要______门高射炮.7.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.8.一个口袋中有4个白球,2个黑球.有放回的取出3个球,如果第一次取出的是白球,则第三次取出的是黑球的概率为______;不放回的取出3个球,在第一次取出的是白球的条件下,第二次取出的是黑球的概率为______.三、解答题9.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域上的概率.10.某个高中研究性学习小组共有9名学生,其中有3名男生和6名女生.在研究学习过程中,要进行两次汇报活动(即开题汇报和结题汇报),每次汇报都从这9名学生中随机选1人作为代表发言.设每人每次被选中与否均互不影响;(1)求两次汇报活动都是由小组成员甲发言的概率;(2)求男生发言次数不少于女生发言次数的概率.751752753754⎪⎩⎪⎨⎧>>>-+0008y x y x11.3名志愿者在10月1日至10月5日期间参加社区服务工作,若每名志愿者在这5天中任选两天参加社区服务工作,且各名志愿者的选择互不影响.求(1)这3名志愿者中在10月1日都参加社区服务工作的概率; (2)这3名志愿者中在10月1日至多有1人参加社区服务工作的概率.§11-2 概率(二)【知识要点】1.离散型随机变量及其分布列随机变量:如果随机试验的可能结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化的,我们把这样的变量X 叫做一个随机变量.如果随机变量X 的所有可能的取值都能一一列举出来,则称X 为离散型随机变量.离散型随机变量的分布列:设离散型随机变量X 的可能取值为x 1,x 2,…,x n ,X 取到每一个值x i (i =1,2,…,n )的概率为P (X =x i )=p i ,则称表为离散型随机变量X 的分布列.具有性质:①p i ≥0,i =1,2,3,…,n ;②p 1+p 2+…+p n =1. 离散型随机变量在某个范围取值的概率等于它取这个范围内各个值的概率和. 二点分布:如果随机变量的分布列为其中0<p <1,q =1-p ,则称离散型随机变量X 服从参数为p 的二点分布.二项分布:一般的,在相同条件下重复地做n 次试验,各次试验的结果相互独立,称为n 次独立重复试验.在n次独立重复试验中,事件A恰好发生k次的概率为==)(k X P(其中p 为在一次试验中事件A 发生的概率,q =1-p ,k =0,1,…,n ).若将n 次独立重复试验中事件A 发生的次数设为X ,则X 的分布列为称这样的离散型随机变量X 服从参数为n 、p 的二项分布,记作X ~B (n ,p ).超几何分布:一般的,设有总数为N 件的两类物品,其中一类有M 件,从所有物品中任取n 件(n ≤N ),这n件中所含这类物品件数X 是一个离散型随机变量,它取值为m 时的概率为≤l ,其中l 为n 和M 中较小的一个).我们称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X 服从参数为N 、M 、n 的超几何分布.2.随机变量的数字特征及正态分布离散型随机变量的数学期望(均值)与方差:若离散型随机变量X 的分布列为则称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量X 的数学期望(或均值),它反映了离散型随机变量的平均取值水平.称为随机变量X 的方差,它反映了离散型随机变量X 相对于期望的平均波动大小(或说离散程度),其算数平方根为随机变量X 的标准差,记作σ (X ),方差(或标准差)越小表明X 的取值相对于期望越集中,否则越分散.均值与方差的性质:①E (aX +b )=aE (X )+b ②D (aX +b )=a 2D (X ) 若X 服从两点分布,则E (X )=p ,D (X )=pq ; 若X ~B (n ,p ),则E (X )=np ,D (X )=npq .正态曲线:函数,其中μ ∈R ,σ >0)的图象为正态分布密度曲线,简称正态曲线.其特点有:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,关于x =μ 对称;③曲线在x =μ 处达到峰值;④曲线与x 轴之间的面积为1;⑤当σ 一定时,曲线随着μ 的变化而沿x 轴平移;⑥当μ 一定k n k k n q p C -m C C C m X P n Nmn MN m M ≤==--0()(i ini p X E xX D ⋅-=∑=21))(()()(X D ),((21)(222)(+∞∝-∈=--x e x x σμσπϕσ2π1时,曲线的形状由σ 决定.σ 越小,曲线越“瘦高”,表示总体的分布越集中;σ 越大,曲线越“矮胖”,表示总体的分布越分散.正态分布:如果对于任意实数a <b ,随机变量X 满足,则称X 的分布为正态分布;随机变量X 服从参数μ 、σ 的正态分布,记作N ~(μ ,σ 2).正态分布的三个常用数据:①P (μ -σ <X <μ +σ )=68.3%;②P (μ -2σ <X <μ +2σ )=95.4%;③P (μ -3σ <X <μ +3σ )=99.7%. 【复习要求】①在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性.②通过实例,理解超几何分布及其导出过程,并能进行简单的应用.③通过实例,理解n 次独立重复试验的模型及二项分布,并能解决一些简单的实际问题.④通过实例,理解取有限值的离散型随机变量期望、方差的概念,能计算简单离散型随机变量的期望、方差,并能解决一些实际问题.⑤通过实际问题,认识正态分布曲线的特点及曲线所表示的意义. 【例题分析】例1 一袋中装有编号为1、2、3、4、5、6的6个大小相同的小球,现从中随机取出3个球,以X 表示取出球的最大号码,(1)求X 的分布列;(2)求X >4的概率;(3)求E (X ).【分析】随机变量X 可能取的值为3、4、5、6,应用古典概型求得X 取每一个值的概率,就可以写出分布列.解:(1)随机变量X 可能取的值为3、4、5、6,且 ,,所求X 的分布列为=≤<)(b X a P dx x ba)(ϕ⎰,203)4(,2011)3(362336======C C X P C X P 3624)5(C C X P ==103206==212010)6(3625====C C X P(2) (3) 【评析】离散型随机变量的分布列反映了一次试验的所有可能结果(X 的所有可能取值),以及取得每个结果(X 的每一个值)的概率.书写分布列首先要根据具体情况正确分析X 可取的所有值,然后利用排列组合及概率的有关知识求得每个x i 所对应的概率p i ,最后列成表格.要注意不同的X 值所对应的事件之间是互斥的,求离散型随机变量在某一范围的概率等于它取这个范围内各个值的概率和.例2 袋中装有大小相同的5个红球、5个白球,现从中任取4个球,其中所含红球的个数为X ,写出X 的分布列,并求X 的期望.【分析】袋中共有10个球,从中任取4个,所含红球的个数为0、1、2、3、4,每个事件的概率可以利用古典概型求解.解:随机变量X 可取的值有0、1、2、3、4,==,,,, 分布列为【评析】本题的随机变量X 服从参数为N ,M ,n 的超几何分布,其中N =10,M =5,n =4. 例3 某人练习射击,每次击中目标的概率为. (1)用X 表示击中目标的次数.①若射击1次,求X 的分布列和期望; ②若射击6次,求X 的分布列和期望;(2)若他连续射击6次,设ξ为他第一次击中目标前没有击中目标的次数,求ξ的分布列;==+==>)6()5()4(X P X P X P ⋅54.25.5216103520342013)(=⨯+⨯+⨯+⨯=X E )0(=X P ,42121054104505==⋅C C C )1(=X P 215210504103515==⋅C C C )2(=X P 21102101004102525===⋅C C C ===⋅4101535)3(C C C X P 21050215=4212105)4(4100545==⋅==C C C X P 2424213212211420)(=⨯+⨯-+⨯+⨯+⨯=X E 31(3)他一共只有6发子弹,若击中目标,则不再射击,否则子弹打完为止,求他射击次数η 的分布列. 【分析】射击问题常被看做是独立重复试验.ξ的取值为0到6,η 的取值为1到6. 解:(1)①X 服从二点分布②X 服从二项分布,分布列为(2)ξ的取值为0到6,ξ=k (k =0,1,…,5)表示第k +1次击中目标,前k 次都没击中目标,则P (ξ=k )=,ξ=6表示射击6次都未击中目标, .ξ的分布列为 (3)η 的取值为1到6.η =k (k =1,2,…,5)表示第k 次时第一次击中目标,表示前5次都没有击中目标,.η 的分布列为 【评析】要书写分布列,必须先弄清随机变量X 的含义以及取值情况,并准确定义事件“X =k ”.在计算满足⋅=31)(X E )6,,1,0()32()31()(),31,6(~66 ===-k C k X P B kkk.236)(=⨯=X E )5,,1,0(31)32(. =k k ==)6(ξP 6)32(==)(k P η6;31)32(.1=-ηk 5)32()6(==ξP二点分布和二项分布的随机变量的期望和方差时,可直接应用公式计算.例4 甲乙两名射手在一次射击中的得分为两个相互独立的随机变量X 和Y ,且X 和Y 的分布列为计算X 和Y 的期望和方差,并以此为依据分析两人的技术水平.【分析】先由分布列所提供的数据用期望和方差公式计算,再根据实际意义作出分析.解:E (X )=8.85,D (X )=2.2275;E (Y )=5.6,D (Y )=10.24.由于E (X )>E (Y ),说明甲射击的平均水平比乙高;由于D (X )<D (Y ),说明甲射击的环数比较集中,发挥比较稳定,乙射击的环数比较分散,技术波动较大,不稳定,由此可以看出甲比乙的技术好.【评析】正确记忆期望和方差的公式,在分布列中,期望是每个变量乘以它所对应的概率再相加,求方差要先求期望,再作差、平方、乘以相应概率再相加.科学对待计算结果,正确分析数据所表达的实际意义.例5 设b 和c 分别是先后抛掷一枚骰子得到的点数,用随机变量ξ表示方程x 2+bx +c =0实根的个数(重根按一个计).(1)求方程x 2+bx +c =0有实根的概率;(2)求在先后两次出现的点数中有5的条件下,方程x 2+bx +c =0有实根的概率; (3)若η =2ξ+1,求ξ、η 的数学期望和方差;【分析】本题概率问题是古典概型,要分别求出事件中所含元素的个数,第一问事件“二次方程有实根”等价于“∆=b 2-4c ≥0”,b 、c 的值都取自{1,2,3,4,5,6};第二问是条件概率问题;第三问先求ξ的期望和方差,再由公式求η 的期望和方差.解:(1)由题意知:设基本事件空间为Ω,记“方程x 2+bx +c =0没有实根”为事件A ,“方程x 2+bx +c =0有且仅有一个实根”为事件B ,“方程x 2+bx +c =0有两个相异实数”为事件C ,Ω中基本事件总数为36个,A 中的基本事件总数为17个,B 中的基本事件总数为2个,C 中的基本事件总数为17个.又因为B ,C 是互斥事件,故所求概率 (2)记“先后两次出现的点数中有5”为事件D ,“方程x 2+bx +c =0有实数”为事件E ,由上面分析得⋅=+=+=36193617362)()(C B B P P。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率与统计热点一 常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率; (3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列.解 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23.设“这4个人中恰有i 人去参加甲游戏”为事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i . (1)这4个人中恰有2人去参加甲游戏的概率 P (A 2)=C 24⎝⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4,且A 3与A 4互斥,∴P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝ ⎛⎭⎪⎫133×23+C 44⎝ ⎛⎭⎪⎫134=19.(3)依题设,ξ的所有可能取值为0,2,4. 且A 1与A 3互斥,A 0与A 4互斥.则P (ξ=0)=P (A 2)=827,P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3) =C 14⎝⎛⎭⎪⎫131·⎝ ⎛⎭⎪⎫233+C 34⎝ ⎛⎭⎪⎫133×23=4081,P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4) =C 04⎝⎛⎭⎪⎫234+C 44⎝ ⎛⎭⎪⎫134=1781.所以ξ的分布列是【类题通法】(1)本题4个人中参加甲游戏的人数服从二项分布,由独立重复试验,4人中恰有i 人参加甲游戏的概率P =C i 4⎝⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i ,这是本题求解的关键. (2)解题中常见的错误是不能分清事件间的关系,选错概率模型,特别是在第(3)问中,不能把ξ=0,2,4的事件转化为相应的互斥事件A i 的概率和.【对点训练】甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为34,23,12,乙队每人答对的概率都是23,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分. (1)求ξ=2的概率;(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率. 解 (1)ξ=2,则甲队有两人答对,一人答错,故P (ξ=2)=34×23×⎝ ⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1124;(2)设甲队和乙队得分之和为4为事件A ,甲队比乙队得分高为事件B .设乙队得分为η,则η~B ⎝ ⎛⎭⎪⎫3,23.P (ξ=1)=34×⎝ ⎛⎭⎪⎫1-23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-23×12=14,P (ξ=3)=34×23×12=14, P (η=1)=C 13·23·⎝⎛⎭⎪⎫132=29,P (η=2)=C 23·⎝ ⎛⎭⎪⎫232·13=49,P (η=3)=C 33⎝⎛⎭⎪⎫233=827,∴P (A )=P (ξ=1)P (η=3)+P (ξ=2)P (η=2)+P (ξ=3)·P (η=1) =14×827+1124×49+14×29=13, P (AB )=P (ξ=3)·P (η=1)=14×29=118, ∴所求概率为P (B|A )=P (AB )P (A )=11813=16.热点二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中强化解答题的规范性训练.【例2】甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立. (1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和均值(数学期望).解 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5. (1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4) =P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)· P (A 3)P (A 4)=⎝ ⎛⎭⎪⎫232+13×⎝ ⎛⎭⎪⎫232+23×13×⎝ ⎛⎭⎪⎫232=5681. (2)X 的可能取值为2,3,4,5.P (X =2)=P (A 1A 2)+P (B 1B 2)=P (A 1)P (A 2)+P (B 1)·P (B 2)=59, P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29, P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081, P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881. 故X 的分布列为E (X )=2×59+3×29+4×1081+5×881=22481.【类题通法】求离散型随机变量的均值和方差问题的一般步骤 第一步:确定随机变量的所有可能值; 第二步:求每一个可能值所对应的概率; 第三步:列出离散型随机变量的分布列; 第四步:求均值和方差;第五步:反思回顾.查看关键点、易错点和答题规范.【对点训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求:①顾客所获的奖励额为60元的概率;②顾客所获的奖励额的分布列及数学期望;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.解(1)设顾客所获的奖励额为X.①依题意,得P(X=60)=C11C13C24=12,即顾客所获的奖励额为60元的概率为1 2.②依题意,得X的所有可能取值为20,60.P(X=60)=12,P(X=20)=C23C24=12,即X的分布列为所以顾客所获的奖励额的数学期望为E(X)=20×12+60×12=40(元).(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为X1的数学期望为E(X1)=20×16+60×23+100×16=60(元),X1的方差为D(X1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为X2的数学期望为E(X2)=40×16+60×23+80×16=60(元),X2的方差为D(X2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003.由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.热点三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示:(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.解(1)由频率分布直方图知:第3组的人数为5×0.06×40=12.第4组的人数为5×0.04×40=8.第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.①设“甲或乙进入第二轮面试”为事件A,则P(A)=1-C310C312=511,所以甲或乙进入第二轮面试的概率为5 11.②X的所有可能取值为0,1,2,P(X=0)=C24C26=25,P(X=1)=C12C14C26=815,P(X=2)=C22C26=115.所以X的分布列为X 012P 25815115E(X)=0×25+1×815+2×115=1015=23.【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X服从超几何分布.【对点训练】某公司为了解用户对某产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散. (2)记C A 1表示事件:“A 地区用户的满意度等级为满意或非常满意”; C A 2表示事件:“A 地区用户的满意度等级为非常满意”; C B 1表示事件:“B 地区用户的满意度等级为不满意”; C B 2表示事件:“B 地区用户的满意度等级为满意”, 则C A 1与C B 1独立,C A 2与C B 2独立,C B 1与C B 2互斥, C =C B 1C A 1∪C B 2C A 2. P (C )=P (C B 1C A 1∪C B 2C A 2) =P (C B 1C A 1)+P (C B 2C A 2) =P (C B 1)P (C A 1)+P (C B 2)P (C A 2).由所给数据得C A 1,C A 2,C B 1,C B 2发生的频率分别为1620,420,1020,820,即P (C A 1)=1620,P (C A 2)=420,P (C B 1)=1020,P (C B 2)=820,故P (C )=1020×1620+820×420=0.48. 热点四 统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例4】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i=720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b^x +a ^;(2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=,a ^=y -b ^ x ,其中x ,y 为样本平均值.解 (1)由题意知n =10,x =1n ∑n i =1x i =8010=8, y =1n ∑n i =1y i =2010=2,又l xx =∑ni =1x 2i -n x 2=720-10×82=80, l xy =∑ni =1x i y i -n x y =184-10×8×2=24, 由此得b^=l xy l xx=2480=0.3, a^=y -b ^x =2-0.3×8=-0.4,故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元). 【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r 来确定,r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两变量线性相关性越弱.(2)求线性回归方程的关键是正确运用b^,a ^的公式进行准确的计算. 【对点训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,低于60分钟的学生称为“非读书迷”.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?非读书迷 读书迷总计 男 15 女 45 总计(2)1人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X .若每次抽取的结果是相互独立的,求X 的分布列、期望E (X )和方差D (X ). 解 (1)完成2×2列联表如下:非读书迷 读书迷 总计 男 40 15 55 女 20 25 45 总计6040100K 2=100×(40×25-15×20)60×40×55×45≈8.249>6.635,故有99%的把握认为“读书迷”与性别有关.(2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P =25. 由题意可知X ~B ⎝ ⎛⎭⎪⎫3,25,P (X =i )=C i 3⎝ ⎛⎭⎪⎫25i ⎝ ⎛⎭⎪⎫353-i (i =0,1,2,3). X 的分布列为X123均值E(X)=np=3×25=65,方差D(X)=np(1-p)=3×25×⎝⎛⎭⎪⎫1-25=1825.。