7.4 二项分布与超几何分布(精讲)(解析版)
超几何分布和二项分布
超几何分布和二项分布超几何分布和二项分布是概率论中两种重要的离散型概率分布。
它们都在描述了离散型随机变量的分布规律,但在具体的描述和应用上有一定的区别。
本文将分别介绍超几何分布和二项分布的定义、特点、性质和应用,并对两者之间的关系和区别进行详细的比较分析。
一、超几何分布的定义、特点和性质超几何分布是描述了一种从有限个物件中抽出样本不放回地抽取成功次数的概率分布。
具体来说,超几何分布描述了在总体中有M个成功物件和N-M个失败物件时,从总体中抽取n个物件,其中成功物件的个数X的分布概率。
其概率质量函数为:P(X=k) = (M choose k) * (N-M choose n-k) / (N choose n),其中(M choose k)表示从M个物件中抽取k个物件的组合数。
超几何分布的特点有以下几点:1.超几何分布是离散型概率分布,其取值只能是非负整数。
2.超几何分布的期望值和方差分别为E(X) = n * M/N, Var(X) =n * M/N * (N-M)/N * (N-n)/(N-1)。
3.超几何分布的分布形状随着总体大小和成功物件的比例而改变,当总体很大时,超几何分布近似于二项分布。
超几何分布在实际应用中有着广泛的应用。
例如在质量抽样、抽样调查、生物统计学等领域,常常需要进行不放回地从总体中抽取物件的情况,而超几何分布恰好可以描述这类情况下随机变量的分布规律。
二、二项分布的定义、特点和性质二项分布是描述了n次独立重复的伯努利试验中成功次数的概率分布。
具体来说,二项分布描述了n次重复试验中成功的次数X的概率分布。
其概率质量函数为:P(X=k) = (n choose k) * p^k * (1-p)^(n-k),其中(n choose k)表示从n次试验中成功k次的组合数。
二项分布的特点有以下几点:1.二项分布是离散型概率分布,其取值只能是非负整数。
2.二项分布的期望值和方差分别为E(X) = np, Var(X) = np(1-p)。
7.4二项分布与超几何分布- 人教A版(2019)高中数学选择性必修第三册讲义
1.伯努利实验把只包含两个可能结果的试验叫做伯努利实验2.n 重伯努利实验我们将一个伯努利试验独立地重复进行n 次所组成的随机试验称为n 重伯努利实验,显然,n 重伯努利实验具有如下共同特征: ①同一个伯努利试验重复做n 次 ②各次试验的结果相互独立3. 二项分布一般地,在n 重伯努利试验中,设每次试验中事件A 发生的概率为p (0<P <1),用X 表示事件A 发生的次数,则X 的分布列为,()()1n kk kn P X k C p p -==-0,1,2,,k n =如果随机变量X 的分布列具有上式的形式,则称随机变量X 服从二项分布,记作(),X B n p注意:二项分布的均值与方差(1)二项分布的均值:在n 次独立重复试验中,若X~B(n,p),则E(X )=np.(2)二项分布的方差:若离散型随机变量X 从二项分布,即X~B(n,p),则D(X)=np(1-p).1.超几何分布一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为()k n kM N MnNC CP X kC --==,k=m,m+1,m+2,…,r其中n,N,M*N∈,M N≤,n N≤,{}max0,m n N M=-+,{}min,r n M=,如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布2.超几何分布的均值设随机变量X服从超几何分布,则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取n件产品中的次品数.令p=MN, 则p是N件产品的次品率,而是抽取的n件产品的次品率,则E(Xn)=p,即E(X)=np.例题1.某篮球队对队员进行考核,规则是:①每人进行3个轮次的投篮;②每个轮次每人投篮2次,若至少投中1次,则本轮通过,否则不通过,已知队员甲投篮1次投中的概率为23,如果甲各次投篮投中与否注意:超几何分布需要知道总体的容量,二项分布不需要知道总体容量但需要知道“成功率”;超几何分布中的概率计算实质是古典概型问题;二项分布中的概率计算实质是相互独立事件的概率问题.互不影响,那么甲3个轮次通过的次数 X 期望是( )A. 3B. 83C. 2D. 53【答案】 B【解析】在一轮投篮中,甲通过的概率为 P =13×23+23=89 ,通不过的概率为 p̅=19 , 由题意可知,甲3个轮次通过的次数 X 的取值分别为 0,1,2,3 , 则 P(X =0)=(19)3=1729 ;P(X =1)=C 31×89×(19)2=24729 ; P(X =2)=C 32×(89)2×19=193729; P(X =3)=(23)3=827(89)3=512729,数学期望 E(X)=0×1729+1×24729+2×192729+3×512729=83,或由二项分布的期望公式可得 E(X)=3×89=83, 故答案为:B .例题2.已知随机变量与满足分布列 ξ~B(3,p) ,当 p ∈(12,23) 且不断增大时,( ) A. P(ξ=2) 的值增大,且 D(ξ) 减小 B. P(ξ=2) 的值增大,且 D(ξ) 增大 C. P(ξ=2) 的值减小,且 D(ξ) 增大 D. P(ξ=2) 的值减小,且 D(ξ) 减小【答案】 A【解析】依题意得 P(ξ=2)=C 32p 2(1−p) =−3p 3+3p 2 , 令 f(p)=−3p 3+3p 2 ,则 f ′(p)=−9p 2+6p =−9(p −13)2+1 ,当 p ∈(12,23) 时, f ′(p) 为递减函数,所以 f ′(p)>f ′(23)=−9(23−13)2+1=0 ,所以 f(p) 在 (12,23) 上为单调递增函数,即当 p ∈(12,23) 且不断增大时, P(ξ=2) 的值增大.D(ξ)=3p(1−p)=−3(p −12)2+34 在 (12,23) 上为单调递减函数,即当 p ∈(12,23) 且不断增大时, D(ξ) 减小.故答案为:A.例题3.已知袋中装有除颜色外完全相同的5个球,其中红球2个,白球3个,现从中任取1球,记下颜色后放回,连续摸取3次,设 ξ 为取得红球的次数,则 P(ξ=2)= ( ) A. 425 B.36125C. 925D.54125【答案】 B【解析】由题意知, ξ~B(3,15) ,由二项分布的概率计算公式得 P(ξ=2)=C 32⋅(25)2⋅35=36125 ,故答案为:B 。
人教版高中数学选修三7.4 二项分布与超几何分布(精练)(详细解析版)
7.4 二项分布与超几何分布(精练)【题组一 二项分布】1.(2021·北京房山区·高二期末)已知某种药物对某种疾病的治愈率为34,现有3位患有该病的患者服用了这种药物,3位患者是否会被治愈是相互独立的,则恰有1位患者被治愈的概率为( ) A .2764B .964C .364D .34【答案】B【详细解析】由已知3位患者被治愈是相互独立的,每位患者被治愈的概率为34,则不被治愈的概率为14所以3位患者中恰有1为患者被治愈的概率为12133194464P C ⎛⎫⎛⎫=⨯⨯=⎪ ⎪⎝⎭⎝⎭故选:B 2.(2020·北京高二期末)已知随机变量X 服从二项分布,即(),X B n p ,且()2E X =,() 1.6D X =,则二项分布的参数n ,p 的值为( ) A .4n =,12p = B .6n =,13p =C .8n =,14p =D .10n =,15p =【答案】D【详细解析】随机变量X 服从二项分布,即(),XB n p ,且()2E X =,() 1.6D X =,可得2np =,()1 1.6np p -=,解得0.2p =,10n =,故选:D.3.(2020·山西晋中市)某同学参加学校篮球选修课的期末考试,老师规定每个同学罚篮20次,每罚进一球得5分,不进记0分,已知该同学罚球命中率为60%,则该同学得分的数学期望和方差分别为( ). A .60,24 B .80,120C .80,24D .60,120【答案】D【详细解析】设该同学20次罚篮,命中次数为X ,则320,5XB ⎛⎫ ⎪⎝⎭,所以()320125E X =⨯=,()3324201555D X ⎛⎫=⨯⨯-= ⎪⎝⎭,所以该同学得分5X 的期望为()551260E X =⨯=,方差为()224551205D X =⨯=.故选:D 4.(2020·营口市第二高级中学高二期末)从装有除颜色外完全相同的3个白球和m 个黑球的布袋中随机摸取一球,有放回地摸取6次,设摸得黑球的个数为X ,已知()3E X =,则m 等于( ) A .2 B .1 C .3 D .5【答案】C【详细解析】根据题意可得出63()()()33kk m k m P X k C m m-==++ ,即3(6,)3X B m ~+ 所以()36333E X m m=⨯=⇒=+故选C 5.(多选)(2020·全国高二单元测试)若随机变量ξ~B 1(5,)3,则P (ξ=k )最大时,k 的值为( ) A .1 B .2 C .3 D .4【答案】AB【详细解析】依题意5512()33kkk P k C ξ-⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭,k=0,1,2,3,4,5.可以求得P (ξ=0)=32243,P (ξ=1)=80243,P (ξ=2)=80243,P (ξ=3)=40243,P (ξ=4)=10243,P (ξ=5)=1243.故当k=2或1时,P (ξ=k )最大.故选:AB ..6.(2021·广东东莞)为迎接8月8日的“全民健身日”,某大学学生会从全体男生中随机抽取16名男生参加1500米中长跑测试,经测试得到每个男生的跑步所用时间的茎叶图(小数点前一位数字为茎,小数点的后一位数字为叶),如图,若跑步时间不高于5.6秒,则称为“好体能”.(1)写出这组数据的众数和中位数;(2)要从这16人中随机选取3人,求至少有2人是“好体能”的概率;(3)以这16人的样本数据来估计整个学校男生的总体数据,若从该校男生(人数众多)任取3人,记X 表示抽到“好体能”学生的人数,求X 的分布列 【答案】(1)众数和中位数分别是5.8,5.8;(2)19140;(3)分布列见详细解析;【详细解析】(1)这组数据的众数和中位数分别是5.8,5.8;(2)设至少有2人是“好体能”的事件为A ,则事件A 包含得基本事件个数为;2134124C C C +总的基本事件个数为316C ,213412431619()140C C C P A C +== (3)X 的可能取值为0,1,2,3,由于该校男生人数众多,故X 近似服从二项分布1(3,)4B3327(0)()464P x ===,1231327(1)()4464P x C ===, 223139(2)()4464P x C ===, 311(3)()464P x ===X 的分布列为:7.(2021·山东德州市·高三期末)某研究院为了调查学生的身体发育情况,从某校随机抽频率组距测120名学生检测他们的身高(单位:米),按数据分成[1.2,1.3],(1.3,1.4],,(1.7,1.8]这6组,得到如图所示的频率分布直方图,其中身高大于或等于1.59米的学生有20人,其身高分别为1.59,1.59,1.61,1.61,1.62,1.63,1.63,1.64,1.65,1.65,1.65,1.65,1.66,1.67,,1.68,1.69,1.69,1.71,1.72,1.74,以这120名学生身高在各组的身高的频率估计整个学校的学生在各组身高的概率.(1)求该校学生身高大于1.60米的频率,并求频率分布直方图中m 、n 、t 的值;(2)若从该校中随机选取3名学生(学生数量足够大),记X 为抽取学生的身高在(1.4,1.6]的人数求X 的分布列和数学期望.【答案】(1)0.25m = , 1.25n =, 3.5t =;(2)分布列见详解;2.1.【详细解析】(1)由题意可知120名学生中身高大于1.60米的有18人,所以该校学生身高大于1.60米的频率为180.15120= 记δ为学生身高,则()()31.2 1.3 1.7 1.80.025120p p δδ≤≤=<≤== ()()151.3 1.4 1.6 1.70.125120p p δδ<≤=<≤==()()()11.4 1.5 1.5 1.6120.02520.1250.352p p δδ<≤=<≤=-⨯-⨯=所以0.0250.250.1m == ,0.125 1.250.1n ==,0.353.50.1t ==; (2)由(1)知学生身高在[]1.41.6, 的概率20.350.7p =⨯= 随机变量X 服从二项分布()~3,0.7X B则()()33010.70.027p x C ==⨯-= ()()213110.70.70.189p x C ==⨯-⨯=()()1223210.70.70.441p x C ==⨯-⨯=()33330.70.343p x C ==⨯=所以X 的分布列为30.7 2.1EX =⨯=8.(2020·湖北随州市·高二期末)疫情过后,为促进居民消费,某超市准备举办一次有奖促销活动,若顾客一次消费达到500元则可参加一轮抽奖活动,超市设计了两种抽奖方案.在一个不透明的盒子中装有6个质地均匀且大小相同的小球,其中2个红球,4个白球,搅拌均匀.方案一:顾客从盒子中随机抽取一个球,若抽到红球则顾客获得50元的返金券,若抽到白球则获得30元的返金券,可以有放回地抽取3次,最终获得的返金券金额累加.方案二:顾客从盒子中随机抽取一个球,若抽到红球则顾客获得100元的返金券,若抽到白球则不获得返金券,可以有放回地抽取3次,最终获得的返金券金额累加.(1)方案一中,设顾客抽取3次后最终可能获得的返金券的金额为X ,求X 的分布列;(2)若某顾客获得抽奖机会,试分别计算他选择两种抽奖方案最终获得返金券的数学期望,并以此判断应该选择哪种抽奖方案更合适.【答案】(1)答案见详细解析;(2)方案一数学期望为110(元),方案二数学期望为100(元);方案一. 【详细解析】(1)由题意易知,方案一和方案二中单次抽到红球的概率为13,抽到白球的概率为23, 依题意,X 的取值可能为90,110,130,150.且30328(90)327P X C ⎛⎫==⋅= ⎪⎝⎭,1213124(110)339P X C ⎛⎫⎛⎫==⋅⋅= ⎪⎪⎝⎭⎝⎭ 223122(130)339P X C ⎛⎫⎛⎫==⋅⋅= ⎪⎪⎝⎭⎝⎭,33311(150)327P X C ⎛⎫==⋅=⎪⎝⎭ 其分布列为(2)由(1)知选择方案一时最终获得返金券金额的数学期望为8421()90110130150110279927E X =⨯+⨯+⨯+⨯=(元), 选择方案二时,设摸到红球的次数为Y ,最终可能获得返金券金额为Z 元,由题意可知,1~3,3Y B ⎛⎫ ⎪⎝⎭,得1()313E Y =⨯= ()(100)100()100E Z E Y E Y ===由()()E X E Z >可知,该顾客应该选择方案一抽奖. 【题组二 超几何分布】1.(2020·辽宁沈阳市)在箱子中有10个小球,其中有3个红球,3个白球,4个黑球.从这10个球中任取3个.求:(1)取出的3个球中红球的个数为X ,求X 的数学期望; (2)取出的3个球中红球个数多于白球个数的概率. 【答案】(1)910;(2)13.【详细解析】(1)取出的3个球中红球的个数为X ,可能取值为:0,1,2,3, 所以()37310350120p X C C===, ()2731016331120p X C C C===, ()1731022132120p X C C C===,()3103313120p X C C===. 所以X 的数学期望()35632119012312012012012010E X =⨯+⨯+⨯+⨯=. (2)设“取出的3个球中红球个数多于白球个数”为事件A ,“恰好取出1个红球和2个黑球”为事件1A ,“恰好取出2个红球”为事件2A ,“恰好取出3个红球”为事件3A ,而()12341310320C C P A C ==, ()()21372310217212040C C P A P X C =====,()()3037331013120C C P A P X C ⋅====, 所以取出的3个球中红球个数多于白球个数的概率为:()()()()123371120401203P A P A P A P A =++=++=. 2.(2021·山东德州市)在全面抗击新冠肺炎疫情这一特殊时期,某大型企业组织员工进行爱心捐款活动.原则上以自愿为基础,每人捐款不超过300元,捐款活动负责人统计全体员工数据后,随机抽取的10名员工的捐款数额如下表:(1)若从这10名员工中随机选取2人,则选取的人中捐款恰有一人高于200元,一人低于200元的概率; (2)若从这10名员工中任意选取4人,记选到的4人中捐款数额大于200元的人数为X ,求X 的分布列和数学期望. 【答案】(1)25;(2)分布列见详细解析,65. 【详细解析】(1)10名员工中捐款数额大于200元的有3人,低于200元的有6人 故选取的人中捐款恰有一人高于200元,一人低于200元的概率为:1136210182455C C P C ===(2)由题知,10名员工中捐款数额大于200元的有3人, 则随机变量X 的所有可能取值为0,1,2,3()4741035102106C P X C ====,()133********12102C C P X C ====,()2237410623221010C C P X C ====()313741071321020C C P X C ====则X 的分布列为()1131601236210305E X =⨯+⨯+⨯+⨯=;(用超几何分布公式()366105nM E X N ⨯===计算同样得分) 3.(2020·河北省盐山中学高二期末)在某城市气象部门的数据库中,随机抽取30天的空气质量指数的监测数据,整理得如下表格:空气质量指数为优或良好,规定为Ⅰ级,轻度或中度污染,规定为Ⅱ级,重度污染规定为Ⅲ级.若按等级用分层抽样的方法从中抽取10天的数据,则空气质量为Ⅰ级的恰好有5天. (1)求a ,b 的值;(2)若以这30天的空气质量指数来估计一年的空气质量情况,试问一年(按366天计算)中大约有多少天的空气质量指数为优?(3)若从抽取的10天的数据中再随机抽取4天的数据进行深入研究,记其中空气质量为Ⅰ级的天数为X ,求X 的分布列及数学期望.【答案】(1)10a =,3b =.(2)61天(3)见详细解析【详细解析】(1)由题意知从中抽取10天的数据,则空气质量为Ⅰ级的恰好有5天,所以空气质量为Ⅰ级的天数为总天数的12,所以5+a=15,8+4+b=15,可得10a =,950. (2)依题意可知,一年中每天空气质量指数为优的概率为51306P ==, 则一年中空气质量指数为优的天数约为1366616⨯=. (3)由题可知抽取的10天的数据中,Ⅰ级的天数为5,Ⅱ级和Ⅲ级的天数之和为5, 满足超几何分布,所以X 的可能取值为0,1,2,3,4,4541051(0)21042C P X C ====,135510505(1)21021C C P X C ====,225541010010(2)21021C C P X C ====,3551410505(3)21021C C P X C ====,4541051(4)21042C P X C ====,X 的分布列为故151051()0123424221212142E X =⨯+⨯+⨯+⨯+⨯=.4.(2020·延安市第一中学)在一个袋中,装有大小、形状完全相同的3个红球、2个黄球.现从中任取2个球,设随机变量ξ为取得红球的个数. (1)求ξ的分布列;(2)求ξ的数学期望()E ξ和方差()D ξ. 【答案】(1)详见详细解析(2)6()5E ξ=,9()25D ξ= 【详细解析】(1)ξ的取值为0,1,2.()0232251010C C P C ξ===, ()113225631105C C P C ξ====,()2032253210C C P C ξ===, 则ξ的分布列为:(2)()012105105E ξ=⨯+⨯+⨯=,2226163639()0125105551025D ξ⎛⎫⎛⎫⎛⎫=-⨯+-⨯+-⨯= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭. 5.(2020·西藏拉萨市)港珠澳大桥是一座具有划时代意义的大桥.它连通了珠海香港澳门三地,大大缩短了三地的时空距离,盘活了珠江三角洲的经济,被誉为新的世界七大奇迹.截至2019年10月23日8点,珠海公路口岸共验放出入境旅客超过1400万人次,日均客流量已经达到4万人次,验放出入境车辆超过70万辆次,2019年春节期间,客流再次大幅增长,日均客流达8万人次,单日客流量更是创下11.3万人次的最高纪录.2019年从五月一日开始的连续100天客流量频率分布直方图如下(1)①同一组数据用该区间的中点值代替,根据频率分布直方图.估计客流量的平均数. ②求客流量的中位数.(2)设这100天中客流量超过5万人次的有n 天,从这n 天中任取两天,设X 为这两天中客流量超过7万人的天数.求X 的分布列和期望.【答案】(1)①4.15,②4.125;(2)分布列见详细解析,()23E X = 【详细解析】(1)①平均值为()2.50.2 3.50.25 4.50.4 5.50.05 6.50.057.50.051 4.15⨯+⨯+⨯+⨯+⨯+⨯⨯=②设中位数为x ,则()0.200.250.4040.5x ++-= 解得中位数为 4.125x =(2)可知15n =其中超过7万人次的有5天()2010521545301057C C P X C ==== ()111052155010110521C C P X C ====()02105215102210521C C P X C ====所以()012721213E X =⨯+⨯+⨯= 6.(2021·福建莆田市)已知甲盒内有大小相同的1个红球和3个黑球,乙盒内有大小相同的2个红球和4个黑球.现从甲、乙两个盒内各任取2个球. (1)求取出的4个球中恰有1个红球的概率;(2)设ξ为取出的4个球中红球的个数,求ξ的分布列和数学期望. 【答案】(1)715;(2)见详细解析. 【详细解析】(1)记事件:A 取出的4个球中恰有1个红球,事件1:A 取出的4个球中唯一的红球取自于甲盒,事件2:A 取出的4个球中唯一的红球取自于乙盒, 则12A A A =,且事件1A 与2A 互斥,由互斥事件的概率公式可得()()()1221134324122246715C C C C C P A P A P A C C +=+==, 因此,取出的4个球中恰有1个红球的概率为715; (2)由题意知随机变量ξ的可能取值为0、1、2、3,()22342246105C C P C C ξ===,()7115P ξ==,()111223243222463210C C C C C P C C ξ+===,()123222461330C C P C C ξ===. 所以,随机变量ξ的分布列如下表所示:因此,随机变量ξ的数学期望为012351510306E ξ=⨯+⨯+⨯+⨯=.7.(2020·福建省南安市侨光中学高二月考)某单位组织“学习强国”知识竞赛,选手从6道备选题中随机抽取3道题.规定至少答对其中的2道题才能晋级.甲选手只能答对其中的4道题. (1)求甲选手能晋级的概率; (2)若乙选手每题能答对的概率都是34,且每题答对与否互不影响,用数学期望分析比较甲、乙两选手的答题水平. 【答案】(1)45;(2)乙选手比甲选手的答题水平高 【详细解析】解法一:(1)记“甲选手答对i 道题”为事件i A ,1,2,3i =,“甲选手能晋级”为事件A ,则23A A A =.()()()()2134242323336645C C C P A P A A P A P A C C =⋃=+=+=;(2)设乙选手答对的题目数量为X ,则3~3,4X B ⎛⎫ ⎪⎝⎭,故()39344E X =⨯=, 设甲选手答对的数量为Y ,则Y 的可能取值为1,2,3,()124236115C C P Y C ===,()214236325C C P Y C ===,()3436135C P Y C ===, 故随机变量Y 的分布列为所以,()1311232555E Y =⨯+⨯+⨯=,则()()E X E Y >, 所以,乙选手比甲选手的答题水平高;解法二:(1)记“甲选手能晋级”为事件A ,则()124236141155C C P A C =-=-=; (2)同解法二.8.(2020·全国高二课时练习)某大学在一次公益活动中聘用了10名志愿者,他们分别来自于A 、B 、C 三个不同的专业,其中A 专业2人,B 专业3人,C 专业5人,现从这10人中任意选取3人参加一个访谈节目.(1)求3个人来自两个不同专业的概率; (2)设X 表示取到B 专业的人数,求X 的分布列. 【答案】(1)79120(2)见详细解析 【详细解析】()1令事件A 表示“3个来自于两个不同专业”,1A 表示“3个人来自于同一个专业”,2A 表示“3个人来自于三个不同专业”,()3335131011120C C P A C +==, ()111235231030120C C C P A C ==, 3∴个人来自两个不同专业的概率:()()()1211307911120120120P A P A P A =--=--=. ()2随机变量X 有取值为0,1,2,3,()0337310350120C C P X C ===,()1237310631120C C P X C ===,()2137310212120C C P X C ===,()307331013120C C P X C ===,X ∴的分布列为:【题组三 二项分布与超几何分布综合运用】1.(2020·甘肃省会宁县第四中学) 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可吸入肺颗粒物.我国 2.5PM 标准采用世卫组织设定的最宽限值,即 2.5PM 日均值在35微克/立方米以下空气质量为一级;在35微克/立方米~75微克/立方米之间空气质量为二级;在75微克/立方米以上空气质量为超标,某试点城市环保局从该市市区2019年上半年每天的 2.5PM 监测数据中随机的抽取15天的数据作为样本,监测值如下茎叶图所示(十位为茎,个位为叶).(1)在这15天的 2.5PM 日均监测数据中,求其中位数;(2)从这15天的数据中任取2天数据,记ξ表示抽到 2.5PM 监测数据超标的天数,求ξ的分布列及数学期望;(3)以这15天的 2.5PM 日均值来估计该市下一年的空气质量情况,则一年(按365天计算)中平均有多少天的空气质量达到一级或二级. 【答案】(1)45;(2)分布列见详细解析,45;(3)219. 【详细解析】(1)由茎叶图可得中位数是45. (2)依据条件,ξ服从超几何分布:其中15N =,6M =,2n =,ξ的可能值为0,1,2,()026921512035C C P C ξ===,()116921518135C C P C ξ===,()2069215512357C C P C ξ====,所以ξ的分布列为:()121814012353575E ξ=⨯+⨯+⨯=. (3)依题意可知,一年中每天空气质量达到一级或二级的概率为93=155P =, 一年中空气质量达到一级或二级的天数为η, 则3365,5B η⎛⎫ ⎪⎝⎭,33652195E η=⨯=,∴一年中平均有219天的空气质量达到一级或二级.2.(2020·山东高二期末)1933年7月11日,中华苏维埃共和国临时中央政府根据中央革命军事委员会6月30日的建议,决定8月1日为中国工农红军成立纪念日.中华人民共和国成立后,将此纪念日改称为中国人民解放军建军节.为庆祝建军节,某校举行“强国强军”知识竞赛,该校某班经过层层筛选,还有最后一个参赛名额要在A ,B 两名学生中间产生,该班委设计了一个测试方案:A ,B 两名学生各自从6个问题中随机抽取3个问题作答.已知这6个问题中,学生A 能正确回答其中的4个问题,而学生B 能正确回答每个问题的概率均为23,A ,B 两名学生对每个问题回答正确与否都是相互独立、互不影响的. (1)求A 恰好答对两个问题的概率; (2)求B 恰好答对两个问题的概率;(3)设A 答对题数为X ,B 答对题数为Y ,若让你投票决定参赛选手,你会选择哪名学生?请说明理由. 【答案】(1)35 ;(2)49;(3)选择A . 【详细解析】(1) A 恰好答对两个问题的概率为214236C C 3C 5=; (2) B 恰好答对两个问题的概率为223214339C ⎛⎫⨯= ⎪⎝⎭;(3) X 所有可能的取值为1,2,3. ()124236C C 11C 5P X ===,214236C C 3(2)C 5P X ===,304236C C 1(3)C 5P X ===,所以131()1232555E X =⨯+⨯+⨯=,2221312()(12)(22)(32)5555D X =-⨯+-⨯+-⨯=; 而23,3Y B ⎛⎫- ⎪⎝⎭,2()323E Y =⨯=,212()3333D Y =⨯⨯=, 所以()()E X E Y =,()()D X D Y <,可见,A 与B 的平均水平相当,但A 比B 的成绩更稳定. 所以选择投票给学生A .3.(2021·湖南高二期末)一个袋中装有大小形状相同的标号为1,2,3,4,5,6的6个小球,某人做如下游戏,每次从袋中拿一个球(拿后放回袋中)记下标号,若拿出球的标号是奇数,则得1分,否则得0分. (1)求拿2次得分不小于1分的概率;(2)拿4次所得分数ξ的分布列和数学期望()E ξ【答案】(1)34;(2)分布列见详细解析;期望为2. 【详细解析】(1)一次拿到奇数的概率3162P ==, 所以拿2次得分为0分的概率为2021124C ⎛⎫= ⎪⎝⎭ 所以拿2次得分不小于1分的概率为2211311244C ⎛⎫-=-= ⎪⎝⎭(2)ξ可以取值:0,1,2,3,4所以()404121601C P ξ⎛⎫= ⎪⎝⎭== ()13141112124C P ξ⎛⎫⎛⎫⨯= ⎪ ⎪⎝⎭⎝⎭== ()22241132228C P ξ⎛⎫⎛⎫⨯= ⎪ ⎪⎝⎭⎝⎭== ()31341112324C P ξ⎛⎫⎛⎫⨯= ⎪ ⎪⎝⎭⎝⎭==()404411122164P C ξ⎛⎫⎛⎫⨯= ⎪ ⎪⎝⎭⎝⎭== 分布列满足二项分布概率1~42B ξ⎛⎫ ⎪⎝⎭,1()=4=22E ξ∴⨯4.(2020·武汉外国语学校高二期中)为有效预防新冠肺炎对老年人的侵害,某医院到社区检查老年人的体质健康情况.从该社区全体老年人中,随机抽取12名进行体质健康测试,根据测试成绩(百分制)绘制茎叶图如下.根据老年人体质健康标准,可知成绩不低于80分为优良,且体质优良的老年人感染新冠肺炎的可能性较低.(Ⅰ)从抽取的12人中随机选取3人,记ξ表示成绩优良的人数,求ξ的分布列及数学期望;(Ⅱ)将频率视为概率,根据用样本估计总体的思想,在该社区全体老年人中依次抽取10人,若抽到k 人的成绩是优良的可能性最大,求k 的值.【答案】(Ⅰ)分布列见详细解析;()2E ξ=;(Ⅱ)7k =.【详细解析】(Ⅰ)由题意12人中有8人体质优良,ξ可能的取值为0,1,2,3,()343121055C P C ξ===,()128431212155C C P C ξ⋅===, ()218431228255C C P C ξ⋅===,()3831214355C P C ξ===, 所以ξ的分布列为:数学期望()0123255555555E ξ=⨯+⨯+⨯+⨯=; (Ⅱ)由题意可知,抽取的10人中,成绩是优良的人数210,3X B ⎛⎫ ⎪⎝⎭∼, 所以()10102133kkk P X k C -⎛⎫⎛⎫==⋅⋅ ⎪ ⎪⎝⎭⎝⎭,0,1,210k =⋅⋅⋅,令()()10110111010101101110102121333321213333k k k kk kk k k kk kC CC C------+-++⎧⎛⎫⎛⎫⎛⎫⎛⎫⋅⋅≥⋅⋅⎪ ⎪ ⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭⎨⎪⎛⎫⎛⎫⎛⎫⎛⎫⋅⋅≥⋅⋅⎪ ⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭⎩,解得192233k≤≤,又k∈N,所以7k=,所以当7k=时,抽到k人的成绩是优良的可能性最大.。
7.4 二项分布与超几何分布 -(人教A版2019选择性必修第二、三册) (教师版)
成对数据的统计相关性1 相关关系与确定关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.比如正方形面积与边长,高一定时圆锥的体积与底圆半径等均为确定关系;体重与身高,子女的身高与父亲的身高,空气污染指数与汽车保有量等均为相关关系.2正相关与负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,称这两个变量正相关;从散点图来看,点从左下角往右上角走.如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关;从散点图来看,点从左上角往右下角走.比如脂肪含量与年龄, 子女的身高与父亲的身高正相关.3线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.4样本相关系数对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1 ,y1) ,(x2 ,y2) ,… ,(x n ,y n),其中x1 ,x2 ,… ,x n和y1 ,y2 ,… ,y n的均值分别为x̅和y̅,则r=∑i ini=1√∑(x i−x̅)2ni=1√∑(y i−y̅)2ni=1我们称r为变量x和变量y的样本相关系数.①当r>0时,称成对数据正相关;当r<0时,称成对数据负相关.②|r|越接近于1,两个变量的线性相关性越强;|r|接近于0时,两个变量之间几乎不存在线性相关关系.③样本相关系数r也可以推导得到r=∑(x−x̅)(y−y̅)ni=1√∑(x i−x̅)2ni=1√∑(y i−y̅)2ni=1=∑x yni=1−nx̅y̅√∑(x i−x̅)2ni=1√∑(y i−y̅)2ni=1【题型一】相关关系与确定关系【典题1】下面哪两个变量间是相关关系()A.出租车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量【解析】根据题意,依次分析选项:对于A,出租车费与行驶的里程之间的关系是确定,是函数关系,不符合题意;对于B,房屋面积与房屋价格之间的关系是确定,是函数关系,不符合题意;对于C,身高与体重之间的关系是不确定,但在一定范围内,身高越高,体重越大,是相关关系,符合题意;对于D,铁块的大小与质量之间的关系是确定,是函数关系,不符合题意;故选:C.【点拨】是确定关系还是相关关系,看两变量之间关系是否确定的.【题型二】正相关与负相关【典题1】有以下五组变量:①某商品的销售价格与销售量;②学生的学籍号与学生的数学成绩;③坚持每天吃早餐的人数与患胃病的人数;④气温与冷饮销售量;⑤电瓶车的重量和行驶每千米的耗电量.其中两个变量成正相关的是()A.①③B.②④C.②⑤D.④⑤【解析】对于①,一般情况下,某商品的销售价格与销售量成负相关关系;对于②,学生的学籍号与学生的数学成绩没有相关关系;对于③,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于④,一般情况下,气温与冷饮销售量成正相关关系;对于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中两个变量成正相关的序号是④⑤.故选:D.【点拨】如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,称这两个变量正相关;如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关.【典题2】在各散点图中,两个变量具有正相关关系的是()A.B.C.D.【解析】根据题意,依次分析选项为:对于A、是相关关系,但不是正相关关系,不符合题意;对于B、是相关关系,也是正相关关系,符合题意;对于C、是相关关系,是负相关关系,不符合题意;对于D、所示的散点图中,样本点不成带状分布,这两个变量不具有线性相关关系,不符合题意.故选:B.【点拨】从散点图来看,点从左下角往右上角走是正相关;从散点图来看,点从左上角往右下角走是负相关.【题型三】成对数据的统计相关系数【典题1】对某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是()A.r4<r2<0<r1<r3B.r2<r4<0<r1<r3C.r2<r4<0<r3<r1D.r4<r2<0<r3<r1【解析】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;由题中数据可知:(1)(3)为正相关,(2)(4)为负相关;数据越集中在一条线附近,说明相关性越强,故r1>0 ,r3>0;r2<0 ,r4<0;又(1)与(2)中散点图更接近于一条直线,故r1>r3 ,r2<r4,因此,r2<r4<0<r3<r1.故选:C.【点拨】①若散点图中数据集中所在的直线斜率为正,则正相关;斜率为负,则负相关.②数据越集中在一条线附近,说明相关性越强;与该直线的斜率大小无关.【典题2】如图所示,5个(x ,y)数据,去掉D(3 ,10)后,下列说法正确的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变小D.解释变量x与预报变量y的相关性变强【解析】由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,所以相关系数r的值变大,相关指数R2的值变大,残差平方和变小.故选:AD.【点拨】①相关系数r判断线性的相关性的强弱;而残差平方和与相关指数R2判断的是模型的拟合效果,残差平方和越小,相关指数R2越大,模型拟合效果越好;②本题中点D属于“歧义点”,偏离回归直线较远,若剔除少数的“歧义点”,解释变量x与预报变量y的相关性变强.巩固练习1(★)下列两个量之间的关系是相关关系的为()A.正方体的体积与棱长的关系B.学生的成绩和体重C.路上酒后驾驶的人数和交通事故发生的多少D.水的体积和重量【答案】C【解析】A、由正方体的棱长和体积的公式知,V=a3(a>0),故A不对;B、学生的成绩和体重,没有关系,故B不对;C、路上酒后驾驶的人数会影响交通事故发生的多少,但不是唯一因素,它们之间有相关性,故C对;D、水的体积V和重量x的关系为:V=k•x,是确定的函数关系,故D不对;故选:C.2(★) 下列说法正确的是()A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间成正相关关系D.人的体重与视力成负相关关系【答案】C【解析】对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;对于B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B错误;对于C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C正确;对于D,人的体重与视力是没有相关关系的,所以D错误.故选:C.3(★)变量x ,y有观测数据(x i ,y i)(i=1 ,2 ,… ,10),得散点图(1);对变量u ,v,有观测数据(u i ,v i)(i= 1 ,2 ,… ,10),得散点图(2),由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【答案】C【解析】由题图1可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图2可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选:C.4(★) 判断如图所示的图形中具有相关关系的是()A.B.C.D.【答案】C【解析】由题意,选项A,B中的x与y的对应是确定的,选项C、D是不确定的,而在选项C、D中,C具有相关关系,故选:C.5(★) 对两个变量x,y的几组观测数据统计如表,则这两个相关变量的关系是() x1098765y23 3.54 4.85 A.负相关B.正相关C.先正后负相关D.先负后正相关【答案】A【解析】根据两个变量x,y的几组观测数据统计表知,y随x的增大而减小,所以这两个相关变量负相关.故选:A.6(★) 关于相关关系,下列说法不正确的是()A.相关关系是一种非确定关系B.相关关系r越大,两个变量的相关性越强C.当两个变量相关且相关系数r>0时,表明两个变量正相关D.相关系数r的绝对值越接近1,表明两个变量的相关性越强【答案】B【解析】对于A,相关关系不同于函数关系,它是一种非确定的关系,A正确;对于B,相关关系|r|越大,两个变量的相关性越强,∴B错误;对于C,当两个变量相关且相关系数r>0时,说明两个变量正相关,∴C正确;对于D,相关系数r的绝对值越接近1,表明两个变量的相关性越强,D正确.故选:B.7(★) 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()参考公式:线性相关系数r=ni=1i−x)(y i−y)√∑i=1(x i−x)√∑i=1(y i−y)A.r2<r1<0B.0<r2<r1C.r2<0<r1D.r1=r2【答案】C【解析】由已知中的数据可知:第一组数据正相关,则相关系数大于零,第二组数据负相关,则相关系数小于零,故选:C.8(★) 【多选题】为了对变量x与y的线性相关性进行检验,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的样本相关系数为r,那么下面说法中错误的有()A.若所有样本点都在直线y=−2x+1上,则r=1B.若所有样本点都在直线y=−2x+1上,则r=−2C.若|r|越大,则变量x与y的线性相关性越强D.若|r|越小,则变量x与y的线性相关性越强【答案】ABD【解析】当所有样本点都在直线y=-2x+1上时,样本点数据完全负相关,其相关系数r=-1,所以A、B都错误;相关系数|r|值越大,则变量x与y的线性相关性越强,C正确;相关系数|r|值越小,则变量x与y的线性相关性越弱,D错误.综上知,以上错误的说法是ABD.故选:ABD.9(★)对相关系数r,下列说法正确的是()A.r越大,线性相关程度越大B.r越小,线性相关程度越大C.|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大D.|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小【答案】D【解析】两个变量之间的相关系数,r的绝对值越接近于1,表面两个变量的线性相关性越强,r的绝对值越接近于0,表示两个变量之间几乎不存在线性相关,故选:D.10(★) 下列四个图各反映了两个变量的某种关系,其中可以看作具有较强线性相关关系的是()A.①③B.①④C.②③D.①②【答案】B【解析】∵两个变量的散点图,若样本点成带状分布,则两个变量具有线性相关关系,∴两个变量具有线性相关关系的图是①和④.故选:B.11(★) 已知甲、乙、丙、丁四组数据变量间对应的线性相关系数分别为0.46,0.79,−0.92,0.85,则() A.甲组数据变量间的线性相关程度最强B.乙组数据变量间的线性相关程度最弱C.丙组数据变量间的线性相关程度最强D.丁组数据变量间的线性相关程度最强【答案】C【解析】因为线性相关系数的绝对值越大,线性相关性越强,甲、乙、丙、丁四组数据的线性相关系数分别为0.46,0.79,−0.92,0.85,所以丙组数据的线性相关性最强.故选:C.12(★) 对两个变量x ,y进行线性相关检验,得线性相关系数r1=0.7859,对两个变量u ,v进行线性相关检验,得线性相关系数r2=−0.9568,则下列判断正确的是()A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强【答案】C【解析】由线性相关系数r1=0.7859>0知x与y正相关,由线性相关系数r2=-0.9568<0知u,v负相关,又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.故选:C.。
高考培优微专题《超几何分布与二项分布》解析版
高考数学培优微专题《超几何分布与二项分布》【考点辨析】在高考概率题型中,二项分布和超几何分布是两个非常重要的概率模型,它们在解决实际问题中发挥着关键作用。
其中,二项分布描述的是固定次数的独立实验中,成功的次数的概率分布。
而超几何分布则描述的是不返回抽样问题,即从有限的总体中抽取一定数量的样本时,其中含有特定种类的数量的概率分布。
在解题过程中,正确地区分题目条件是否涉及到放回或不放回抽样是解决超几何分布和二项分布问题的关键。
掌握这两个分布的定义、性质和计算方法,对于提高学生的逻辑思维能力和解决复杂问题的能力具有重要意义。
【知识储备】(1)二项分布①背景:每次事件A p事件A1-p连续重复n次 事件A发生的次数X~B(n,p)事件A发生的次数Y~B(n,p)②分布列X01⋯k⋯n P C0n p0q n C1n p1q n-1⋯C k n p k q n-k⋯C n n p n q0③数字特征:E(X)=np,D(X)=np(1-p)(2)超几何分布①背景:一次某-类 M另一类 N-M搭配n个 某一类的个数X~H(n,N,M)另一类的个数Y~H(n,N,N-M)②分布列:X01⋯k⋯nP C0M C n-kN-MC n N C1M C n-1N-MC n N⋯C k M C n-kN-MC n N⋯C n M C0N-MC n N③数字特征:E(X)=n×MN,D(X)=n×MN×(1-n-1N-1)【例题讲解】类型一:有放回与无放回的区别1.一个袋子里10个大小相同的球,其中有黄球4个,白球6个(1)若从袋中随机摸出3个球作为样本,若有放回的摸球,求恰好摸到2个白球的概率;(2)若从袋中随机摸出3个球作为样本,若不放回的摸球,用X表示样本中白球的个数,求X的分布列和均值.【解析】【答案】解:(1)设恰好摸到2个白球为事件A,则P(A)=C23352⋅25=54125;(2)由题意可知,X的可能取值为0,1,2,3,由题意可知X服从超几何分布,则P(X=0)=C34C06C310=130,P(X=1)=C24C16C310=310,P(X=2)=C14C26C310=12,P(X=3)=C04C36C310=16,所以X的分布列为:X0 1 2 3 P130 3101216则E(X)=0×130+1×310+2×12+3×16=95.类型二:占比与概率的区别2.某地区拟建立一个艺术博物馆,采取竞标的方式从多家建筑公司选取一家建筑公司,经过层层筛选,甲、乙两家建筑公司进入最后的招标.现从建筑设计院聘请专家设计了一个招标方案:两家公司从6个招标问题中随机抽取3个问题,已知这6个招标问题中,甲公司可正确回答其中4道题目,而乙公司能正确回答每道题目的概率均为23,甲、乙两家公司对每题的回答都是相互独立,互不影响的.(I)求甲、乙两家公司共答对2道题目的概率;(II)设甲公司答对题数为随机变量X,求X的分布列、数学期望和方差;(III)请从期望和方差的角度分析,甲、乙两家哪家公司竞标成功的可能性更大?【解析】【答案】解:(I)设事件A“甲、乙两家公司共答对2道题”,由题意可知:所求概率P(A)=C14C22C36×C1323 11-232+C24C12C36×1-233=115.(II)设甲公司答对题数为X,则X的取值分别为1,2,3.P(X=1)=C14C22C36=15,P(X=2)=C24C12C36=35,P(X=3)=C34C02C36=15,则X的分布列为:X123P153515∴E(X)=1×15+2×35+3×15=2,D(X)=(1-2)2×15+(2-2)2×35+(3-2)2×15=25. (III)法一:设乙公司答对题数为Y,则Y取值分别为0,1,2,3. P(Y=0)=13 3=127,P(Y=1)=C13×23×13 2=29,P(Y=2)=C23×23 2×13=49,P(Y=3)=23 3=827,则Y的分布列为:Y0123P1272949827∴E(Y)=0×127+1×29+2×49+3×827=2.D (Y )=(0-2)2×127+(1-2)2×29+(2-2)2×49+(3-2)2×827=23.所以E (X )=E (Y ),D (X )<D (Y ),所以甲公司竞标成功的可能性更大.法二:由题知:Y ~B 3,23,∴E (Y )=3×23=2,D (Y )=3×23×13=23,所以E (X )=E (Y ),D (X )<D (Y ),所以甲公司竞标成功的可能性更大.类型三:样本与总体的区别3.某食品厂为了检查一条自动包装流水线的生产情况,随即抽取该流水线上40件产品作为样本算出他们的重量(单位:克)重量的分组区间为490,495 、495,500 、⋯、510,515 ,由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量;(2)在上述抽取的40件产品中任取2件,设X 为重量超过505克的产品数量,求X 的分布列及期望;(3)样本估计总体,从流水线上任取5件产品,设Y 为重量超过505克的产品数量,求Y 的期望、方差.【解析】【答案】解:(1)由频率分布直方图得重量超过505克的产品频率为:(0.05+0.01)×5=0.3,∴重量超过505克的产品数量为:0.3×40=12(件).(2)由题意X 的可能取值为0,1,2,P (X =0)=C 228C 240=63130,P (X =1)=C 128C 112C 240=56130=2865,P (X =2)=C 212C 240=11130,∴X 的分布列为:X 0 1 2 P63130286511130随机变量X 的数学期望为E (X )=0×63130+1×2865+2×11130=35;(3)从流水线上任取5件产品服从二项分布:Y 可能取值有0、1、2、3、4、5,超过505克的产品发生的概率为p =0.3,则Y ~B (5,0.3),Y 的期望E (Y )=5×0.3=1.5,方差D (Y )=5×0.3×0.7=1.05.类型四:一次与多次的区别4.学校游园活动有这样一个游戏项目:甲箱子里装有3个白球、2个黑球,乙箱子里装有1个白球、2个黑球,这些球除颜色外完全相同,每次游戏从这两个箱子里各随机摸出2个球,若摸出的白球不少于2个,则获奖.(每次游戏结束后将球放回原箱)(1)求在1次游戏中,①摸出3个白球的概率;②获奖的概率;(2)求在4次游戏中获奖次数X 的分布列及数学期望E (X ).【答案】【答案】(1)①15,②710;(2)分布列见解析,145.【解析】【解析】(1)设“在1次游戏中摸出i 个白球”为事件A i (i =0,1,2,3),①P (A 3)=C 23C 25·C 12C 23=15.②设“在1次游戏中获奖”为事件B ,则B =A 2∪A 3,又P (A 2)=C 23C 25·C 22C 23+C 13C 12C 25·C 12C 23=12,且A 2,A 3互斥,所以P (B )=P (A 2)+P (A 3)=12+15=710.(2)由题意可知X 的所有可能取值为0,1,2,3,4,由(1)P (B )=710,P (B )=1-P (B )=310,P (X =0)=P (B ) 4=310 4=8110000,P (X =1)=C 14P (B )P (B ) 3=4×710×310 3=1892500,P (X =2)=C 24P (B ) 2P (B ) 2=6×710 2×310 2=13235000P (X =3)=C 34P (B ) 3P (B )=4×710 3×310=10292500P (X =4)=P (B ) 4=710 4=240110000所以X 的分布列是X 01234P811000018925001323500010292500240110000显然X ~B 4,710 ,所以X 的数学期望E (X )=4×710=145.【解题策略】____________________________________________________________________________________________________________________________________________________________________________________________________________【教考衔接】1.现对某高校16名篮球运动员在多次训练比赛中的得分进行统计,将每位运动员的平均成绩所得数据用频率分布直方图表示如下.(如:落在区间[10,15)内的频率/组距为0.0125)规定分数在[10,20),[20,30),[30,40)上的运动员分别为三级篮球运动员、二级篮球运动员、一级篮球运动员,现从这批篮球运动员中利用分层抽样的方法选出16名运动员作为该高校的篮球运动员代表.(1)求a 的值和选出篮球运动员代表中一级运动员的人数;(2)若从篮球运动员代表中选出三人,求其中含有一级运动员人数X 的分布列;(3)若从该校篮球运动员中有放回地选三人,求其中含有一级运动员人数Y 的期望.【答案】【答案】(1)a =0.0250,4人;(2)答案见解析;(3)34.【解析】【解析】(1)由频率分布直方图知:(0.0625+0.0500+0.0375+a +2×0.0125)×5=1,∴a =0.0250.其中为一级运动员的概率为(0.0125+0.0375)×5=0.25,∴选出篮球运动员代表中一级运动员为0.25×16=4人.(2)由已知可得X 的可能取值分别为0,1,2,3,P (X =0)=C 312C 316=1128,P (X =1)=C 212⋅C 14C 316=3370,P (X =2)=C 112⋅C 24C 316=970,P (X =3)=C 34C 316=1140,∴X 的分布列为X 0123P112833709701140(3)由已知得Y ~B 3,14 ,∴E (Y )=np =3×14=34,∴含有一级运动员人数Y 的期望为34.2.甲、乙两名运动员进行羽毛球单打比赛,根据以往比赛胜负情况知道,每一局甲胜的概率为23,乙胜的概率为13.如果比赛采用“五局三胜”(即有一方先胜三局即获胜,比赛结束)规则,设比赛场次为随机变量X .(1)求乙胜的概率;(2)求随机变量X 的概率分布列及数学期望、方差;.【解析】【答案】解:(1)记“乙获胜”为事件A ,则P A =13 3+C 2313 2×23×13+C 2413 2×23 2×13,即P A =1781,所以乙获胜的概率1781;(2)由题意可知,随机变量X 可以取:3、4、5,所以P X =3 =23 3+13 3=927=13,P X =4 =C 2323 3×13×23+C 2313 2×23 ×13=1027,P X =5 =C 2423 3×13 2×23+C 2413 2×23 2×13=827所以X 的分布列为:X 345P131027827所以随机变量X 的数学期望:E X =3×13+4×1027+5×827=10727;(3)随机变量X 的方差:D X =E (X 2)-(E (X ))2=32×13+42×1027+52×827 -10727 2=44127-10727 2=458729. 3.食品安全问题越来越受到人们的重视.某超市在进某种蔬菜的货前,要求食品安检部门对每箱蔬菜进行三轮各项指标的综合检测,只有三轮检测都合格,该种蔬菜才能在该超市销售.已知每箱这种蔬菜第一轮检测不合格的概率为13,第二轮检测不合格的概率为14,第三轮检测不合格的概率为15,每轮检测只有合格与不合格两种情况,且各轮检测互不影响.(1)求每箱这种蔬菜能在该超市销售的概率;(2)若这种蔬菜能在该超市销售,则每箱可获利200元,若不能在该超市销售,则每箱亏损100元,现有3箱这种蔬菜,求这3箱蔬菜总收益X 的分布列和数学期望.【解析】【答案】解:(1)设每箱这种蔬菜能在该超市销售为事件A ,则P (A )=1-13 ×1-14 ×1-15 =25,即每箱这种蔬菜能在该超市销售的概率为25.(2)X 的所有可能取值为600,300,0,-300.因为P (X =600)=25 3=8125,P (X =300)=C 2325 2×35=36125,P (X =0)=C 13×25×35 2=54125,P (X =-300)=35 3=27125,所以X 的分布列为:X 6003000-300P8125361255412527125所以E (X )=600×8125+300×36125-300×27125=60. 4.体育课程的实施可以有效地促进学生身体的正常发育,提高身体的健康水平.某校对高一年男生进行1000米测试,经对随机抽取的100名学生的成绩数据处理后,得到如下频率分布直方图:(1)从这100名学生中,任意选取2人,求两人测试成绩都低于60分的概率;(2)从该校所有高一年男生中任意选取3人,记70分以上的人数为ξ,求ξ的分布列和期望、方差;【解析】(1)从这100名学生中,任意选取2人,求两人测试成绩都低于60分的概率;(2)从该校所有高一年男生中任意选取3人,记70分以上的人数为ξ,求ξ的分布列和期望、方差;解:(1)设两人测试成绩都低于60分为事件A ,低于60分频率为(0.002+0.001)×10=0.03,所以在100人中有3人低于60分,故P (A )=C 23C 2100=11650,(2)70分以上的频率为1-10×(0.001+0.002+0.017)=0.8,用样本估计总体即100个样本的频率视为高一年男生总体的概率服从二项分布ξ~B (3,0.8),P (ξ=0)=C 03(1-0.8)3=0.008,P (ξ=1)=C 13(1-0.8)2×0.8=0.096,P (ξ=2)=C 23(1-0.8)×0.82=0.384,P (ξ=3)=C 330.83=0.512,故分布列为:ξ0123P0.0080.0960.3840.512E (ξ)=3×0.8=2.4;D (ξ)=3×0.8×(1-0.8)=0.485.2020·浙江台州市·高二期中)2020年五一期间,银泰百货举办了一次有奖促销活动,消费每超过600元(含600元),均可抽奖一次,抽奖方案有两种,顾客只能选择其中的一种.方案一:从装有10个形状、大小完全相同的小球(其中红球2个,白球1个,黑球7个)的抽奖盒中,一次性摸出3个球其中奖规则为:若摸到2个红球和1个白球,享受免单优惠;若摸出2个红球和1个黑球则打5折;若摸出1个白球2个黑球,则打7折;其余情况不打折.方案二:从装有10个形状、大小完全相同的小球(其中红球3个,黑球7个)的抽奖盒中,有放回每次摸取1球,连摸3次,每摸到1次红球,立减200元.(1)若两个顾客均分别消费了600元,且均选择抽奖方案一,试求两位顾客均享受免单优惠的概率;(2)若某顾客消费恰好满1000元,试从概率角度比较该顾客选择哪一种抽奖方案更合算?【答案】【答案】(1)114400;(2)选择第二种方案更合算.【解析】【解析】(1)选择方案一若享受到免单优惠,则需要摸出三个红球,设顾客享受到免单优惠为事件A,则P A=C22C11C310=1120,所以两位顾客均享受到免单的概率为P=P A⋅P A=1 14400;(2)若选择方案一,设付款金额为X元,则X可能的取值为0、500、700、1000.P X=0=C22C11C310=1120,P X=500=C22C17C310=7120,P X=700=C11C27C310=740,P X=1000=1-1120-7120-740=91120.故X的分布列为,X05007001000P1120712074091120所以E X=0×1120+500×7120+700×740+1000×91120=910(元).若选择方案二,设摸到红球的个数为Y,付款金额为Z,则Z=1000-200Y,由已知可得Y~B3,3 10,故E Y =3×310=910,所以E Z=E1000-200Y=1000-200E Y=820(元).因为E X>E Z,所以该顾客选择第二种抽奖方案更合算.6.某种水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:等级标准果优质果精品果礼品果个数10304020(1)将频率视为概率,从这100个水果样本中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率.(结果用分数表示)(2)用水果样本中的样本估计总体,果园老板提出两种购销方案给采购商参考.方案1:不分类卖出,单价为20元/kg.方案2:分类卖出,分类后的水果售价如下:等级标准果优质果精品果礼品果售价(元/kg)16182224从采购商的角度考虑,应该采用哪种方案?(3)用分层抽样的方法从这100个水果样本中抽取10个,再从抽取的10个水果中随机抽取3个,X表示抽取的是精品果的数量,求X的分布列及数学期望.【解析】【答案】解:(1)设从100个水果中随机抽取一个,抽到礼品果的事件为A,则P(A)=20100=15,现有放回地随机抽取4个,设抽到礼品果的个数为Y,则Y~B4,1 5,∴恰好抽到2个礼品果的概率为:P(Y=2)=C241-15215 2=96625;(2)设方案2的单价为ξ,则单价的期望值为:E(ξ)=16×110+18×310+22×410+24×210=20.6,∵E(ξ)>20,∴从采购商的角度考虑,应该采用第一种方案;(3)用分层抽样的方法从100个水果中抽取10个,则其中精品果4个,非精品果6个,现从中抽取3个,则精品果的数量X所有可能的取值为0,1,2,3,则P(X=0)=C36C310=16;P(X=1)=C26C14C310=12;P(X=2)=C16C24C310=310;P(X=3)=C34C310=130,∴X的分布列为:X0123P1612310130∴E(X)=0×16+1×12+2×310+3×130=65.。
二项分布和超几何分布(含答案)讲课教案
二项分布和超几何分布(含答案)超几何分布和二项分布一、两者的定义是不同的1超几何分布的定义2独立重复试验与二项分布的定义(1)独立重复试验.(2)二项分布.本质区别(1)超几何分布描述的是不放回抽样问题,而二项分布描述的是放回抽样问题.(2)超几何分布中的概率计算实质上是古典概型问题;二项分布中的概率计算实质上是相互独立事件的概率问题.二、两者之间是有联系的人教版新课标选修2-3第59页习题2.2B组第3题:例1某批n件产品的次品率为2%,现从中任意地依次抽出3件进行检验,问:(1)当n=500,5000,500000时,分别以放回和不放回的方式抽取,恰好抽到1件产品的概率各是多少?(2)根据(1)你对超几何分布与二项分布的关系有何认识?【说明】由于数字比较大,可以利用计算机或计算器进行数值计算.另外,本题目也可以帮助学生了解超几何分布和二项分布之间的关系:第一,n次试验中,某一事件A出现的次数X可能服从超几何分布或二项分布.当这n次试验是独立重复试验时,X服从二项分布;当这n次试验是不放回摸球问题,事件A为摸到某种特性(如某种颜色)的球时,X服从超几何分布第二,在不放回n次摸球试验中,摸到某种颜色的次数X服从超几何分布,但是当袋子中的球的数目N 很大时,X的分布列近似于二项分布,并且随着N的增加,这种近似的精度也增加.从以上分析可以看出两者之间的联系:当调查研究的样本容量非常大时,在有放回地抽取与无放回地抽取条件下,计算得到的概率非常接近,可以近似把超几何分布认为是二项分布.例2袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取一个球,求(1)又放回抽样时,取到黑球的个数X的分布列;(2)无放回地抽样时,取到黑球的个数Y的分布列.[错解分析]第二问的选人问题是不放回抽样问题,按照定义先考虑超几何分布,但是题目中又明确给出:“以这16人的样本数据来估计整个社区的总体数据,从该社区(人数很多)任选3人”,说明不是从16人中任选3人,而是从该社区(人数很多)任选3人,所以可以近似看作是3次独立重复试验,应该按照二项分布去求解,而不能按照超几何分布去处理.【正解】(1)同上;从以上解题过程中我们还发现,错解中的期望值与正解中的期望值相等,好多学生都觉得不可思议,怎么会出现相同的结果呢?其实这还是由于前面解释过的原因,超几何分布与二项分布是有联系的,看它们的期望公式:综上可知,当提问中涉及“用样本数据来估计总体数据”字样的为二项分布。
高中数学选择性必修三 7 4二项分布与超几何分布
第七章随机变量及其分布7.4 二项分布与超几何分布课后篇巩固提升基础达标练1.甲、乙两人进行羽毛球比赛,比赛采取五局三胜制,无论哪一方先胜三局比赛都结束,假定甲每局比赛获胜的概率均为23,则甲以3∶1的比分获胜的概率为( ) A.827B.6481C.49D.89解析当甲以3∶1的比分获胜时,说明甲乙两人在前三场比赛中,甲只赢了两局,乙赢了一局,第四局甲赢,所以甲以3∶1的比分获胜的概率为P=C 322321-23×23=3×49×13×23=827,故选A .2.已知X~B (n ,p ),E (X )=8,D (X )=1.6,则n 与p 的值分别为( ) A.100和0.08 B.20和0.4 C.10和0.2D.10和0.8X~B (n ,p ),所以{np =8,np (1-p )=1.6,解得n=10,p=0.8.3.已知随机变量X~B (100,0.2),则D (4X+3)的值为 ( )A.64B.256C.259D.320X~B (100,0.2),∴D (X )=100×0.2×0.8=16.D (4X+3)=16D (X )=16×16=256.4.口袋里放有大小相同的两个红球和一个白球,每次有放回地摸取一个球,定义数列{a n },a n ={-1,第n 次摸取红球,1,第n 次摸取白球,如果S n 为数列{a n }的前n 项和,那么S 7=3的概率为( )A.C 75×(13)2×(23)5B.C 72×(23)2×(13)5C.C 75×(13)5D.C 72×(23)2S 7=3知,在7次摸球中有2次摸取红球,5次摸取白球,而每次摸取红球的概率为23,摸取白球的概率为13,则S 7=3的概率为C 72×(23)2×(13)5,故选B .5.(2020河北高二月考)在10个排球中有6个正品,4个次品.从中抽取4个,则正品数比次品数少的概率为( ) A.542B.435C.1942D.821,有两种情况:0个正品、4个次品或1个正品、3个次品,由超几何分布的概率可知,当0个正品、4个次品时,概率为C 44C 104=1210.当1个正品、3个次品时,概率为C 61C 43C 104=24210=435.所以正品数比次品数少的概率为1210+435=542.6.(2019江苏高二期末)10件产品中有2件次品,从中随机抽取3件,则恰有1件次品的概率是 .A 为“从中随机抽取3件,则恰有1件次品”,则P (A )=C 82·C 21C 103=715.7.在4次独立重复试验中,事件A 发生的概率相同,若事件A 至少发生1次的概率为6581,则在1次试验中事件A 发生的概率为 .,事件A 发生的概率为p ,由题意知,1-(1-p )4=6581, 所以(1-p )4=1681,故p=13.8.某市公租房的房源位于A,B,C 三个片区,设每位申请人只申请其中一个片区的房源,且申请其中任一个片区的房源是等可能的.该市的4位申请人中恰有2人申请A 片区房源的概率为 .,这是4次独立重复试验,设申请A 片区房源为A ,则P (A )=13,所以恰有2人申请A 片区的概率为C 42·(13)2·(23)2=827.9.网上购物逐步走进大学生活,某大学学生宿舍4人积极参加网购,大家约定:每个人通过掷一枚质地均匀的骰子决定自己去哪家购物,掷出点数为5或6的人去A 网购物,掷出点数小于5的人去B 网购物,且参加者必须从A 网和B 网选择一家购物. (1)求这4个人中恰有1人去A 网购物的概率;(2)用ξ,η分别表示这4个人中去A 网和B 网购物的人数,令X=ξη,求随机变量X 的分布列.,得这4个人中,每个人去A 网购物的概率为13,去B 网购物的概率为23.设“这4个人中恰有i 人去A 网购物”为事件A i (i=0,1,2,3,4),则P (A i )=C 4i13i 234-i(i=0,1,2,3,4).(1)这4个人中恰有1人去A 网购物的概率为P (A 1)=C 41(13)1233=3281. (2)X 的所有可能取值为0,3,4, 则P (X=0)=P (A 0)+P (A 4)=C 40130×234+C 44134×23=1681+181=1781, P (X=3)=P (A 1)+P (A 3)=C 41131×233+C 43133×231=3281+881=4081, P (X=4)=P (A 2)=C 42132232=2481. 所以随机变量X 的分布列为能力提升练1.种植某种树苗,成活率为0.9.若种植这种树苗5棵,则恰好成活4棵的概率约为( ) A.0.33B.0.66C.0.5D.0.45n 次独立重复试验中,事件A 恰好发生k 次的概率公式得到种植这种树苗5棵,则恰好成活4棵的概率为C 54·0.94(1-0.9)≈0.33,故选A .2.在4次独立重复试验中,随机事件A 恰好发生1次的概率不大于其恰好发生两次的概率,则事件A 在一次试验中发生的概率p 的取值范围是( ) A.[0.4,1] B.(0,0.4]C.(0,0.6]D.[0.6,1),C 41·p (1-p )3≤C 42p 2(1-p )2,∴4(1-p )≤6p.∵0<p ≤1,∴0.4≤p ≤1.3.一次测量中出现正误差和负误差的概率都是12,在5次测量中恰好2次出现正误差的概率是( ) A.516B.25C.58D.132,在5次测量中恰好2次出现正误差的概率P=C 52·(12)2×(12)3=516.4.设随机变量X~B (2,p ),随机变量Y~B (3,p ),若P (X ≥1)=59,则P (Y ≥1)= .X~B (2,p ),∴P (X ≥1)=1-P (X=0)=1-C 20(1-p )2=59,解得p=13.又Y~B (3,p ),∴P (Y ≥1)=1-P (Y=0)=1-C 30(1-p )3=1927.5.(2020潍坊高三月考)有8件产品,其中3件是次品,从中任取3件,若X 表示取得次品的件数,则P (X ≤1)= .,P (X ≤1)=P (X=0)+P (X=1)=C 53C 83+C 52C 31C 83=1056+3056=57.6.位于坐标原点的一个质点P 按下述规则移动:质点每次移动一个单位,移动的方向为向上或向右,并且向上、向右移动的概率都是12.质点P 移动五次后位于点(2,3)的概率是 . 解析由于质点每次移动一个单位,移动的方向为向上或向右,移动五次后位于点(2,3),所以质点P 必须向右移动两次,向上移动三次,故其概率为C 53123·122=C 53125=C 52125=516.7.(2020广西高三模拟)甲、乙两人参加某种选拔测试,在备选的10道题中,甲答对其中每道题的概率都是45,乙能答对其中的8道题,规定每次考试都从备选的10道题中随机抽出4道题进行测试,只有选中的4个题目均答对才能入选. (1)求甲恰有2个题目答对的概率; (2)求乙答对的题目数X 的分布列;(3)试比较甲、乙两人平均答对的题目数的大小,并说明理由.∵甲在备选的10道题中,答对其中每道题的概率都是45,∴选中的4个题目甲恰有2个题目答对的概率P=C 42(45)2(15)2=96625. (2)由题意知乙答对的题目数X 的可能取值为2,3,4,则P (X=2)=C 22C 82C 104=28210=215,P (X=3)=C 21C 83C 104=112210=815,P (X=4)=C 84C 104=70210=13,故X 的分布列为(3)乙平均答对的题目数E (X )=2×215+3×815+4×13=165.∵甲答对题目数Y~B 4,45, ∴甲平均答对的题目数E (Y )=4×45=165. ∵E (X )=E (Y ),∴甲平均答对的题目数等于乙平均答对的题目数.8.甲、乙两人各射击一次,击中目标的概率分别是23和34.假设两人射击是否击中目标相互之间没有影响,每人每次射击是否击中目标相互之间也没有影响. (1)求甲射击4次,至少有1次未击中目标的概率.(2)求两人各射击4次,甲恰好击中目标2次且乙恰好击中目标3次的概率.(3)假设每人连续2次未击中目标,则终止其射击.问:乙恰好射击5次后,被终止射击的概率是多少?解(1)记“甲连续射击4次,至少有1次未击中目标”为事件A 1,则事件A 1的对立事件A 1为“甲连续射击4次,全部击中目标”.由题意知,射击4次相当于做4次独立重复试验.故P (A 1)=C 44234=1681.所以P (A 1)=1-P (A 1)=1-1681=6581. 所以甲连续射击4次,至少有1次未击中目标的概率为6581.(2)记“甲射击4次,恰好有2次击中目标”为事件A 2,“乙射击4次,恰好有3次击中目标”为事件B 2,则P (A 2)=C 42×232×1-232=827, P (B 2)=C 43×343×1-341=2764.由于甲、乙射击相互独立, 故P (A 2B 2)=P (A 2)P (B 2)=827×2764=18.所以两人各射击4次,甲恰有2次击中目标且乙恰有3次击中目标的概率为18.(3)记“乙恰好射击5次后,被终止射击”为事件A 3,“乙第i 次射击未击中”为事件D i (i=1,2,3,4,5), 则A 3=D 5D 4D 3(D 2D 1∪D 2D 1∪D 2D 1), 且P (D i )=14.由于各事件相互独立,故P (A 3)=P (D 5)P (D 4)·P (D 3)P (D 2D 1∪D 2D 1∪D 2D 1) =14×14×34×1-14×14=451 024. 所以乙恰好射击5次后,被终止射击的概率为451 024.素养培优练(2020福建高三模拟)一款小游戏的规则如下:每轮游戏要进行三次,每次游戏都需要从装有大小相同的2个红球、3个白球的袋中随机摸出2个球,若摸出的“两个都是红球”出现3次获得200分,若摸出“两个都是红球”出现1次或2次获得20分,若摸出“两个都是红球”出现0次则扣除10分(即获得-10分).(1)设每轮游戏中出现“摸出两个都是红球”的次数为X ,求X 的分布列;(2)玩过这款游戏的许多人发现,若干轮游戏后,与最初的分数相比,分数没有增加反而减少了,请运用概率统计的相关知识分析解释上述现象.每次游戏,出现“两个都是红球”的概率为P=C 22C 52=110.X 可能的取值为0,1,2,3, 则P (X=0)=C 30(1-110)3=7291 000,P (X=1)=C 31110·(1-110)2=2431 000, P (X=2)=C 32(110)2·(1-110)=271 000,P (X=3)=C 33(110)3=11 000,所以X 的分布列为(2)设每轮游戏得分为Y. 由(1)知,Y 的分布列为E (Y )=-10×7291 000+20×2701 000+200×11 000=-1.69. 这表明,获得分数Y 的均值为负.因此,多次游戏之后大多数人的分数减少了.。
《二项分布与超几何分布》 讲义
《二项分布与超几何分布》讲义在概率论中,二项分布和超几何分布是两个非常重要的离散型概率分布。
它们在许多实际问题中都有着广泛的应用,理解和掌握这两种分布对于解决概率相关的问题至关重要。
一、二项分布1、定义二项分布是 n 个独立的成功/失败试验中成功的次数的离散概率分布。
假设每次试验成功的概率为 p ,失败的概率则为 1 p 。
2、概率质量函数如果随机变量 X 服从参数为 n 和 p 的二项分布,记为 X ~ B(n, p) ,则 X 的概率质量函数为:P(X = k) = C(n, k) p^k (1 p)^(n k) ,其中 k = 0, 1, 2,, n ,C(n, k) 表示从 n 个不同元素中取出 k 个元素的组合数。
3、期望和方差二项分布的期望 E(X) = np ,方差 Var(X) = np(1 p) 。
4、应用场景例如,抛硬币多次,计算正面朝上的次数;进行多次独立的产品质量检测,计算合格产品的数量等。
二、超几何分布1、定义超几何分布描述了从有限 N 个物件(其中包含 M 个指定种类的物件)中抽出 n 个物件,成功抽出指定种类物件的次数的概率分布。
2、概率质量函数设随机变量 X 服从参数为 N, M, n 的超几何分布,记为 X ~ H(N, M, n) ,则 X 的概率质量函数为:P(X = k) = C(M, k) C(N M, n k) / C(N, n) ,其中 k = 0, 1, 2,,min{M, n} 。
3、期望和方差超几何分布的期望 E(X) = n M / N ,方差 Var(X) = n M / N(1 M / N) (N n) /(N 1) 。
4、应用场景比如从一批产品中随机抽取一定数量的产品,计算其中次品的数量;从一群学生中抽取若干人,计算其中男生的人数等。
三、二项分布与超几何分布的区别1、试验类型二项分布是独立重复试验,每次试验的结果只有成功和失败两种,且每次试验成功的概率相同。
7.4.2超几何分布课件2024-2025学年人教A版选择性必修第三册
二、探究新知
1.问题. 已知100件产品中有8件次品,分别采用有放回 和不放回的方式随机抽取4件.设抽取的4件产品中次品 数为X,求:随机变量X的散布列.
如果采用有放回抽样,则每次抽到次品的概率为0.08 且各次抽样的结果相互独立,此时X~B(4,0.08).
如果采用不有放回抽样,那么抽到4件产品中次品数X是
PM2.5日均值(微 克/立方米)
[25,35) [35,45) [45,55) [55,65) [65,75) [75,85]
频数
3
1
1
1
1
3
(1)从这10天的PM2.5日均值监测数据中,随机抽出3天,求恰有一天
空气质量到达一级的概率;
(2)从这10天的数据中任取3天数据,记ξ表示抽到PM2.5监测数据超 标的天数,求ξ 的散布列.
,k
m, m 1, m 2,, r.
其中n,
N,
M
N,M
CNn
N,n N,m
max0, n
N
M, r
min
n, M.
得,
E(
X
)
k
r m
k
C C k nk M NM CNn
M
r k m
C C k 1 nk M 1 N M CNn
(kCMk MCMk11)
(易知,(1 x)N1 (1 x)M1 (1 x)NM , 等号两侧展开式的xn1的系数相等)
两种摸球方式下,随机变量X服从二项散布和超几何散布.
这两种散布的均值相等都等于8.
0.25 0.20 0.15 0.10 0.05
0
但从两种分步的概率分步图看,超几何散布更 集中在均值附近.
7.4.2 超几何分布 -高二数学同步精品讲义(人教A版2019选择性必修第三册)(解析版)
7.4.2超几何分布课程标准课标解读1.理解超几何分布概率模型的特点,理解超几何分布与古典概型之间的关系;2.根据超几何分布概率模型的特点,会求超几何概型的分布列、期望、方差;3.在实际问题中能用超几何概型解决实际问题.通过本节课的学习,能解决数学中的超几何概率的相关问题,能建立超几何概型解决实际问题.知识点1超几何分布1.定义:在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P (X =k )=k n k M N MnNC C C --,k =0,1,2,…,m ,其中m =min{M ,n },且n ≤N ,M ≤N ,n ,M ,N ∈N *,即如果随机变量X 的分布列具有下表形式X01…mP00nM N MnNC CC--11nM N MnNC CC--…m n mM N MnNC CC--则称随机变量X服从超几何分布.2.均值:若X服从参数为N,M,n的超几何分布,则E(X)=nMN.3.对超几何分布的理解(1)在超几何分布的模型中,“任取n件”应理解为“不放回地一次取一件,连续取n件”.如果是有放回地抽取,就变成了n重伯努利试验,这时概率分布是二项分布.所以两个分布的区别就在于是否为有放回地抽取.(2)若随机变量X满足:试验是不放回地抽取n次;随机变量X表示抽到两类中其中一类物品的件数.则该随机变量服从超几何分布.(3)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数,超几发布的特征是:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体数X的概率分布超几何分布主要用于抽检产品,摸不同类别的小球概率模型,其实质是古典概型.【即学即练1】下列问题中,哪些属于超几何分布问题,说明理由.(1)抛掷三枚骰子,所得向上的数是6的骰子的个数记为X,求X的分布列;(2)有一批种子的发芽率为70%,任取10颗种子做发芽实验,把实验中发芽的种子的个数记为X,求X的分布列;(3)盒子中有红球3只,黄球4只,蓝球5只,任取3只球,把不是红色的球的个数记为X,求X的分布列;(4)某班级有男生25人,女生20人.选派4名学生参加学校组织的活动,班长必须参加,其中女生人数记为X,求X的分布列;(5)现有100台平板电脑未经检测,抽取10台送检,把检验结果为不合格的平板电脑的个数记为X,求X的分布列.【解析】(1)(2)中样本没有分类,不是超几何分布问题,是重复试验问题.(3)(4)符合超几何分布的特征,样本都分为两类,随机变量X表示抽取n件样本某类样本被抽取的件数,是超几何分布.(5)中没有给出不合格产品数,无法计算X的分布列,所以不属于超几何分布问题.【即学即练2】现有来自甲、乙两班学生共7名,从中任选2名都是甲班的概率为1 7 .(1)求7名学生中甲班的学生数;(2)设所选2名学生中甲班的学生数为ξ,求ξ≥1的概率.【解析】(1)设甲班的学生人数为M ,则C 2MC 27=M (M -1)42=17,即M 2-M -6=0,解得M =3或M =-2(舍去).∴7名学生中甲班的学生共有3人.(2)由题意可知,ξ服从超几何分布.∴P (ξ≥1)=P (ξ=1)+p (ξ=2)=C 13C 14C 27+C 23C 04C 27=47+17=57.【即学即练3】有N 件产品,其中有M 件次品,从中不放回地抽n 件产品,抽到的次品数的均值是()A .n B.(n -1)M N C.nMND.(n +1)M N【解析】设抽到的次品数为X ,则有N 件产品,其中有M 件次品,从中不放回地抽n 件产品,抽到的次品数X 服从超几何分布,∴抽到的次品数的均值E (X )=nMN.故选C 【即学即练4】某校高一,高二年级的学生参加书法比赛集训,高一年级推荐了4名男生,2名女生,高二年级推荐了3名男生,5名女生,从参加集训的男生中随机抽取3人,女生中随机抽取3人组成代表队参加市上比赛.(1)求高一恰好有1名学生入选代表队的概率;(2)正式比赛时,从代表队的6名队员中随机抽取2人参赛,设ξ表示参赛的男生人数,求ξ的分布列和数学期望【答案】(1)435;(2)ξ的分布列见解析,()1E ξ=.(1)从参加集训的男生中随机抽取3人,女生中随机抽取3人组成代表队的抽取方法数为3377C C 1225⋅=,代表队中恰好有1名高一学生的抽取方式中,恰有1名高一学生,若学生为男生,则抽取方法数为123435C C C 120⋅⋅=,若学生为女生,则抽取方法数为312325C C C 20⋅⋅=,∴高一恰好有1名学生入选代表队的概率120204122535P +==;(2)依题意得,ξ的所有可能取值为0,1,2,则()2326C 310C 155P ξ====,()113326C C 3331C 155P ξ⨯====,()2326C 312C 155P ξ====,ξ∴的分布了如下:ξ12P153515()1310121555E ξ∴=⨯+⨯⨯.知识点2超几何分布和二项分布的区别和联系(1)超几何分布需要知道总体的容量,而二项分布不需要;(2)超几何分布是“不放回”抽取,而二项分布是“有放回”抽取(独立重复);(3)当总体的容量非常大时,超几何分布近似于二项分布.注:(1)区别由古典概型得出超几何分布,由伯努利试验得出二项分布.这两个分布的关系是,假设一批产品共有N 件,其中有M 件次品.从N 件产品中随机抽取n 件,用X 表示抽取的n 件产品中的次品数,若采用有放回抽样的方法抽取,则随机变量X 服从二项分布,即(,)X B n p (其中Mp N=)若采用不放回抽样的方法抽取,则随机变量X 服从超几何分布.超几何分布需要知道总体的容量,二项分布不需要知道总体容量,但需要知道“成功率”.超几何分布的概率计算是古典概型问题,二项分布的概率计算是相互独立事件的概率问题.(2)联系二项分布和超几何分布都可以描述随机抽取n 件产品中次品数的分布规律,并且二者的均值相同.每次试验只有两种可能的结果:成功或失败.当总数很大而抽样数不太大时,不放回抽样可以认为是有放回抽样,即对于不放回抽样,当n 远远小于N 时,每抽取一次后,对N 的影响很小,超几何分布可以近似为二项分布.【即学即练5】某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40件产品作为样本称出它们的质量(单位:克),质量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图如图.(1)根据频率分布直方图,求质量超过505克的产品数量;(2)在上述抽取的40件产品中任取2件,设X 为质量超过505克的产品数量,求X 的分布列,并求其均值;(3)从该流水线上任取2件产品,设Y 为质量超过505克的产品数量,求Y 的分布列.【解析】(1)质量超过505克的产品的频率为5×0.05+5×0.01=0.3,所以质量超过505克的产品数量为40×0.3=12(件).(2)质量超过505克的产品数量为12件,则质量未超过505克的产品数量为28件,X 的取值为0,1,2,X 服从超几何分布.P (X =0)=C 228C 240=63130,P (X =1)=C 112C 128C 240=2865,P (X =2)=C 212C 240=11130,∴X 的分布列为X 012P63130286511130∴X 的均值为方法一E (X )=0×63130+1×2865+2×11130=35.方法二E (X )=2×1240=35.(3)根据样本估计总体的思想,取一件产品,该产品的质量超过505克的概率为1240=310.从流水线上任取2件产品互不影响,该问题可看成2重伯努利试验,质量超过505克的件数Y 的可能取值为0,1,2,且Y ~2,310,P (Y =k )=C k 2310k×1-310-k,k =0,1,2,∴P (Y =0)=C 02×7102=49100,P (Y =1)=C 12×310×710=2150,P (Y =2)=C 22=9100.∴Y 的分布列为Y 012P4910021509100考点一对超几何分布的理解解题方略:判断一个随机变量是否服从超几何分布,应看三点(1)总体是否可分为两类明确的对象.(2)是否为不放回抽样.(3)随机变量是否为样本中其中一类个体的个数.【例1-1】【多选】下列随机变量中,服从超几何分布的有()A .在10件产品中有3件次品,一件一件地不放回地任意取出4件,记取到的次品数为XB .从3台甲型彩电和2台乙型彩电中任取2台,记X 表示所取的2台彩电中甲型彩电的台数C .一名学生骑自行车上学,途中有6个交通岗,记此学生遇到红灯的数为随机变量XD .从10名男生,5名女生中选3人参加植树活动,其中男生人数记为X【解析】依据超几何分布模型定义可知,ABD 中随机变量X 服从超几何分布.而C 中显然不能看作一个不放回抽样问题,故随机变量X 不服从超几何分布.故选ABD变式1:下列问题中,哪些属于超几何分布问题,说明理由.(1)抛掷三枚骰子,所得向上的数是6的骰子的个数记为X ,求X 的概率分布;(2)有一批种子的发芽率为70%,任取10颗种子做发芽试验,把试验中发芽的种子的个数记为X ,求X 的概率分布;(3)盒子中有红球3只,黄球4只,蓝球5只.任取3只球,把不是红色的球的个数记为X ,求X 的概率分布;(4)某班级有男生25人,女生20人.选派4名学生参加学校组织的活动,班长必须参加,其中女生人数记为X,求X的概率分布;(5)现有100台MP3播放器未经检测,抽取10台送检,把检验结果为不合格的MP3播放器的个数记为X,求X的概率分布.【答案】答案见解析【详解】(1)(2)中样本没有分类,不是超几何分布问题,是重复试验问题.(3)(4)符合超几何分布的特征,样本都分为两类.随机变量X表示抽取n件样本中某类样本被抽取的件数,是超几何分布.(5)中没有给出不合格品数,无法计算X的概率分布,所以不属于超几何分布问题.变式2:一个袋中有6个同样大小的黑球,编号为1,2,3,4,5,6,还有4个同样大小的白球,编号为7,8,9,10.现从中任取4个球,有如下几种变量:①X表示取出的最大号码;②X表示取出的最小号码;③取出一个黑球记2分,取出一个白球记1分,X表示取出的4个球的总得分;④X表示取出的黑球个数.这四种变量中服从超几何分布的是()A.①②B.③④C.①②④D.①②③④【答案】BX=表示从黑球编号为1,2,3,4,5中取3个黑球,【详解】对于①,当X表示最大号码,比如6而8X=表示从6个黑球和编号为7的白球共7个球中取3个球,故该随机变量不服从超几何分布,同理②中的随机变量不服从超几何分布.对于③,X的可能取值为4,5,6,7,8,X=表示取出4个白球;45X=表示取出3个白球1个黑球;X=表示取出2个白球2个黑球;6X=表示取出1个白球3个黑球;7X=表示取出4个黑球;8因此X服从超几何分布.由超几何分布的概念知④符合,故选:B.考点二超几何分布的概率解题方略:求超几何分布的分布列的步骤【例2-1】某12人的兴趣小组中,有5名“三好学生”,现从中任意选6人参加竞赛,用X 表示这6人中“三好学生”的人数,则当X 取________时,对应的概率为C 35C 37C 612.【解析】由题意可知,X 服从超几何分布,由概率值中的C 35可以看出“从5名三好学生中选取了3名”.【例2-2】一个盒子里装有大小相同的10个黑球,12个红球,4个白球,从中任取2个,其中白球的个数记为X ,则下列概率等于C 122C 14+C 222C 226的是()A .P (0<X ≤2)B .P (X ≤1)C .P (X =1)D .P (X =2)【解析】本题相当于求至多取出1个白球的概率,即取到1个白球或没有取到白球的概率.故选B【例2-3】在100张奖券中,有4张能中奖,从中任取2张,则2张都能中奖的概率是()A.150B.125C.1825D.14950【解析】记X 为2张中的中奖数,则P (X =2)=C 24C 096C 2100=1825.故选C变式1:从一副不含大、小王的52张扑克牌中任意抽出5张,则至少有3张是A 的概率为()A.C 34C 248C 552B.C 348C 24C 552C .1-C 148C 44C 552D.C 34C 248+C 44C 148C 552【解析】设X 为抽出的5张扑克牌中含A 的张数,则P (X ≥3)=P (X =3)+P (X =4)=C 34C 248C 552+C 44C 148C 552.故选D变式2:在10个排球中有6个正品,4个次品,从中抽取4个,则正品数比次品数少的概率为()A.542B.435C.1942D.821【解析】正品数比次品数少,有两种情况:0个正品4个次品,1个正品3个次品,由超几何分布的概率公式可知,当0个正品4个次品时,P =C 44C 410=1210,当1个正品3个次品时,P =C 16C 34C 410=24210=435,所以正品数比次品数少的概率为1210+435=542.故选A.变式3:从某批产品中,有放回地抽取产品二次,每次随机抽取1件,假设事件A “取出的2件产品都是二等品”的概率P (A )=0.04.(1)求从该批产品中任取1件是二等品的概率;(2)若该批产品共10件,从中任意抽取2件,X 表示取出的2件产品中二等品的件数,求X 的分布列.【解析】(1)设任取一件产品是二等品的概率为p ,依题意有P (A )=p 2=0.04,解得p 1=0.2,p 2=-0.2(舍去),故从该批产品中任取1件是二等品的概率为0.2.(2)若该批产品共10件,由(1)知其二等品有10×0.2=2(件),故X 的可能取值为0,1,2.P (X =0)=C 28C 210=2845,P (X =1)=C 18C 12C 210=1645,P (X =2)=C 22C 210=145.所以X 的分布列为X 012P28451645145变式4:某市A ,B 两所中学的学生组队参加辩论赛,A 中学推荐了3名男生、2名女生,B 中学推荐了3名男生、4名女生,两校所推荐的学生一起参加集训.由于集训后队员水平相当,从参加集训的男生中随机抽取3人、女生中随机抽取3人组成代表队.(1)求A 中学至少有1名学生入选代表队的概率;(2)某场比赛前,从代表队的6名队员中随机抽取4人参赛,设X 表示参赛的男生人数,求X 的分布列.【解析】(1)由题意知,参加集训的男生、女生各有6人.代表队中的学生全从B 中学抽取(等价于A 中学没有学生入选代表队)的概率为C 33C 34C 36C 36=1100.因此,A 中学至少有1名学生入选代表队的概率为1-1100=99100.(2)根据题意,知X 的所有的可能取值为1,2,3.P (X =1)=C 13C 33C 46=15,P (X =2)=C 23C 23C 46=35,P (X =3)=C 33C 13C 46=15.所以X 的分布列为X 123P153515变式5:吃粽子是我国端午节的传统习俗.现有一盘子粽子装有10个,其中红豆粽2个,肉粽3个,蛋黄粽5个,假设这三种粽子除馅料外外观完全相同,从中任意选取3个.(1)求选取的三个粽子中恰有1个肉粽的概率;(2)求所选3个粽子有肉粽的条件下红豆粽不少于1个的概率.(3)设ξ表示取到的红豆粽个数,求ξ的分布列与期望.【答案】(1)2140(2)3985(3)分布列见解析,35【详解】(1)令A 表示事件“三个粽子中有1个肉粽”,从中任意选取3个有310C 120=种可能,其中恰有1个肉粽的可能选法有1237C C 63=种,∴由古典概型的概率计算公式有1237310C C 21()C 40P A ==.(2)所选3个粽子有肉粽的可能选法有33107C C 1203585-=-=种,所选3个粽子有肉粽的条件下红豆粽不少于1个的选法有111221235323C (C C C )C C 39++=种,故所选3个粽子有肉粽的条件下红豆粽不少于1个的概率为3985.(3)由题意知,ξ可能取的值为0,1,2,则()328310C C ,0,1,2C k k P k k ξ-===∴0328310C C 7(0)C 15P ξ===,1228310C C 7(1)C 15P ξ===,2310218C C 1(2)C 15P ξ===,故ξ的分布列为:ξ012。
7.4.2超几何分布课件高二下学期数学人教A版选择性
从100件产品中任取4件, 样本空间包含 C1400个样本点,
且每个样本点都是等可能发
生的. 其中4件产品中恰有k
件次品的结果数为
C8k
C 4k 92
.
X
0
1
2
3
4
P 0.71257 0.25621 0.02989 0.00131 0.00002
【探究2】从探究1中我们能够抽象出一个数学模型:从含有M件次品的N 件产品中,不放回地抽取n件产品,用X表示抽取的次品数,则
随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的
分布列为
P(X
k)
C C k nk M NM
C
n N
,k
0,1,2, ,r .
2. 超几何分布的均值
若随机变量X服从超几何分布,则有 E( X ) np. (其中p M ) N
THE END
P( X 1) P( X 1) P( X 2) P( X 3)
C
31C
9 27
C 10 30
C
32C
8 27
C 10 30
C
33C
7 27
C 10 30
146 203
或
P(X
1) 1 P( X
0)
1
C
C0 10
3 27
C 10 30
146 203
(直接法) (间接法)
【探究3】服从超几何分布的随机变量的均值是什么?
②不放回抽样;
③随机变量是从总体中抽取的n个个体中某一类个体的数量.
【例1】从50名学生中随机选出5名学生代表,求甲被选中的概率.
解:设X表示选出的5名学生中含甲的人数,则X服从超几何分布, 且N=50, M=1, n=5.
人教版高二下数学选择性必修第三册-7.4 二项分布与超几何分布(第4课时)【课件】
年龄
20以下 [20,30) [30,40) [40,50) [50,60) [60,70]
使用人数
3
12
17
6
4
2
未使用人数
0
0
3
14
36
3
(1)现随机抽取1名顾客,试估计该顾客年龄在[30,50)且未使用自由购的概
率;
(2)从被抽取的年龄在[50,70]且使用自由购的顾客中,随机抽取 3 人进一步 了解情况,用 X 表示这 3 人中年龄在[50,60)的人数,求随机变量 X 的分布列及 数学期望;
∴X的分布列为:
X
0
1
2
P
63 130
28 65
11 130
(3)根据样本估计总体的思想,任取1件产品,该产品的质量超过505克的概
率为1420=130.
从流水线上任取2件产品互不影响,该问题可看成2重伯努利试验,Y的可能
取值为0,1,2,且Y~B2,130,P(Y=k)=C2k130k1-1302-k,所以P(Y=0)=
(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率; (2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列与数学期望 E(X). 【解析】 (1)记接受甲种心理暗示的志愿者中包含A1但不包含B1的事件为 M,则P(M)=CC18045=158. (2)由题意知X可取的值为0,1,2,3,4,则 P(X=0)=CC16055=412,P(X=1)=CC641C0541=251, P(X=2)=CC631C0542=1201,P(X=3)=CC621C0543=251,
所以X的分布列为:
X1 2 3
P
1 5
3 5
人教版高二下数学选择性必修第三册-7.4 二项分布与超几何分布(第1课时)【课件】
思考题2 某气象站天气预报的准确率为80%,计算(结果保留到小数点后
第2位): (1)5次预报中恰有2次准确的概率; (2)5次预报中至少有2次准确的概率; (3)5次预报中恰有2次准确,且其中第3次预报准确的概率.
【思路分析】
【解析】 令X表示5次预报中预报准确的次数,则X~B 5,45 ,故其分布
∴P(X=1)=C51×12×1-124=352.
(2)令1-p=q,根据二项式定理,P(X=0)+P(X=1)+P(X=2)+…+P(X= n)=Cn0p0qn+Cn1p1qn-1+Cn2p2qn-2+…+Cnnpnq0=(q+p)n.
因为p+q=1,所以P(X=0)+P(X=1)+P(X=2)+…+P(X=n)=1, 即分布列P(X=k)=Cnkpk(1-p)n-k,k=0,1,2,…,n满足性质 k∑=n 0 Cnkpk(1- p)n-k=[(1-p)+p]n=1.
【解析】 (1)由于试验的条件不同(质地不同),因此不是n重伯努利试验. (2)某人射击击中目标的概率是稳定的,因此是n重伯努利试验. (3)每次抽取,试验的结果有三种,因此不是n重伯努利试验. 探究1 n重伯努利试验的判断依据 (1)要看该试验是不是在相同的条件下可以重复进行. (2)每次试验相互独立,互不影响. (3)每次试验都只有两种结果,即事件发生或不发生.
(3)“5次预报中恰有2次准确,且其中第3次预报准确”的概率为C41×
4 5
×
1-453×45≈0.02.
题型三 二项分布及其均值与方差
例3
(1)若离散型随机变量X~B(n,p),且E(X)=
5 2
,D(X)=
5 4
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.4 二项分布与超几何分布(精讲)考法一 二项分布【例1】(2020·全国高二课时练习)高尔顿(钉)板是在一块竖起的木板上钉上一排排互相平行、水平间隔相等的圆柱形铁钉(如图),并且每一排铁钉数目都比上一排多一个,一排中各个铁钉恰好对准上面一排两相邻铁钉的正中央.从入口处放入一个直径略小于两颗铁钉间隔的小球,当小球从两钉之间的间隙下落时,由于碰到下一排铁钉,它将以相等的可能性向左或向右落下,接着小球再通过两铁钉的间隙,又碰到下一排铁钉.如此继续下去,在最底层的5个出口处各放置一个容器接住小球.(1)理论上,小球落入4号容器的概率是多少?(2)一数学兴趣小组取3个小球进行试验,设其中落入4号容器的小球的个数为X ,求X 的分布列. 【答案】(1)14;(2)分布列答案见解析. 【解析】(1)记“小球落入4号容器”为事件A ,若要小球落入4号容器,则需要在通过的四层中有三层向右,一层向左,∴理论上,小球落入4号容器的概率43411()C 24P A ⎛⎫== ⎪⎝⎭. (2)落入4号容器的小球的个数X 的所有可能取值为0,1,2,3,303127(0)C 1464P X ⎛⎫∴==⨯-= ⎪⎝⎭, 2131127(1)C 14464P X ⎛⎫==⨯⨯-= ⎪⎝⎭,2123119(2)C 14464P X ⎛⎫⎛⎫==⨯⨯-= ⎪ ⎪⎝⎭⎝⎭,33311(3)C 464P X ⎛⎫==⨯=⎪⎝⎭, X ∴的分布列为【一隅三反】1.(2020·重庆市第七中学校高二月考)若随机变量14,2X B ⎛⎫ ⎪⎝⎭~,则()21E X +=( ) A .2 B .3C .4D .5【答案】D【解析】因为14,2X B ⎛⎫ ⎪⎝⎭~,所以1422EX =⨯=,所以()21215E X EX +=+=.故选:D. 2.(多选)(2020·全国高二单元测试)已知随机变量120,3X B ⎛⎫ ⎪⎝⎭,若使()P X k =的值最大,则k 等于( ) A .5 B .6C .7D .8【答案】BC【解析】令()()1201120202012120331221233k k k k k k C P X k kP X k k C +--+-⎛⎫⎛⎫⋅ ⎪ ⎪=+-⎝⎭⎝⎭==>=+⎛⎫⎛⎫⋅ ⎪ ⎪⎝⎭⎝⎭,得k 6<,即当k 6<时,()1()P X k P X k =+>=; 当6k =时,()()76P X P X ===; 当6k >时,()1()P X k P X k =+<=, 所以(6)P X =和()7P X =的值最大. 故选:BC .3.(2020·江苏淮安市·淮阴中学高二期末)江苏实行的“新高考方案:312++”模式,其中统考科目:“3”指语文、数学、外语三门,不分文理:学生根据高校的要求,结合自身特长兴趣,“1”指首先在在物理、历史2门科目中选择一门;“2”指再从思想政治、地理、化学、生物4门科目中选择2门某校,根据统计选物理的学生占整个学生的34;并且在选物理的条件下,选择地理的概率为23;在选历史的条件下,选地理的概率为45. (1)求该校最终选地理的学生概率;(2)该校甲、乙、丙三人选地理的人数设为随机变量X . ①求随机变量2X =的概率; ②求X 的概率分布列以及数学期望. 【答案】(1)710;(2)①4411000;②分布列见解析,()2110E X =. 【解析】(1)该校最终选地理的学生为事件A ,()32147434510P A =⨯+⨯=; 因此,该校最终选地理的学生为710; (2)①由题意可知,73,10XB ⎛⎫ ⎪⎝⎭,所以,()22373441210101000P X C ⎛⎫==⋅⋅= ⎪⎝⎭; ②由于73,10XB ⎛⎫ ⎪⎝⎭,则()33270101000P X ⎛⎫=== ⎪⎝⎭, ()121373189110101000P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()22373441210101000P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()33373433101000P X C ⎛⎫=== ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:()72131010E X ∴=⨯=.4.(2020·陕西渭南市)已知某植物种子每粒成功发芽的概率都为13,某植物研究所分三个小组分别独立进行该种子的发芽试验,每次试验种一粒种子,每次试验结果相互独立.假设某次试验种子发芽,则称该次试验是成功的,如果种子没有发芽,则称该次试验是失败的. (1)第一小组做了四次试验,求该小组恰有两次失败的概率;(2)第二小组做了四次试验,设试验成功与失败的次数的差的绝对值为X ,求X 的分布列及数学期望. 【答案】(1)827;(2)答案见解析;14881. 【解析】(1)记“该小组有两次失败”为事件A ,222412248()338127P A C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭. (2)由题意可知X 的可能取值为0,2,4.2224128(0)3327P X C ⎛⎫⎛⎫===⎪ ⎪⎝⎭⎝⎭, 13311344121232840(2)33338181P X C C +⎛⎫⎛⎫⎛⎫⎛⎫==+== ⎪ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭, 444442116117(4)338181P X C C +⎛⎫⎛⎫==+== ⎪ ⎪⎝⎭⎝⎭. 故X 的分布列为:84017148()024********E X =⨯+⨯+⨯=. 考点二 超几何分布【例2】(2020·全国高二单元测试)现对某高校16名篮球运动员在多次训练比赛中的得分进行统计,将每位运动员的平均成绩所得数据用频率分布直方图表示如下.(如:落在区间[10,15)内的频率/组距为0.0125)规定分数在[10,20),[20,30),[30,40)上的运动员分别为三级篮球运动员、二级篮球运动员、一级篮球运动员,现从这批篮球运动员中利用分层抽样的方法选出16名运动员作为该高校的篮球运动员代表.(1)求a的值和选出篮球运动员代表中一级运动员的人数;(2)若从篮球运动员代表中选出三人,求其中含有一级运动员人数X的分布列;(3)若从该校篮球运动员中有放回地选三人,求其中含有一级运动员人数Y的期望.【答案】(1)a=0.0250,4人;(2)答案见解析;(3)34.【解析】(1)由频率分布直方图知:(0.0625+0.0500+0.0375+a+2×0.0125)×5=1,∴a=0.0250. 其中为一级运动员的概率为(0.012 5+0.037 5)×5=0.25,∴选出篮球运动员代表中一级运动员为0.25×16=4人.(2)由已知可得X的可能取值分别为0,1,2,3,P(X=0)=312316CC=1128,P(X=1)=21243161C CC⋅=3370,P(X=2)=24113162C CC⋅=970,P(X=3)=34316CC=1140,∴X的分布列为(3)由已知得Y~B1 (3,)4,∴E(Y)=np=3×14=34,∴含有一级运动员人数Y 的期望为34. 【一隅三反】1.(2020·全国高二课时练习)新冠肺炎疫情期间,为了更有效地进行防控,各地学校都发出延期开学的通知.很多学校及老师为响应各地教育行政部门实行“停课不停学”的号召,让学生们在家通过收看网络直播的方式进行学习,已知高一某班共有学生21人,其中男生12人,女生9人.现采用分层抽样的方法从中抽取7人,测试他们对网络课程学习的效果,效果分为优秀和不优秀两种,优秀得2分,不优秀得1分. (1)应抽取男生、女生各多少人?(2)若抽取的7人中,4人的测试效果为优秀,3人为不优秀,现从这7人中随机抽取3人. (i )用X 表示抽取的3人的得分之和,求随机变量x 的分布列及数学期望;(ii )设事件A 为“抽取的3人中,既有测试效果为优秀的,也有为不优秀的”,求事件A 发生的概率. 【答案】(1)4人;(2)(i )分布列答案见解析,数学期望:337;(ii )67.【解析】(1)因为采用分层抽样的方法进行抽样,所以应抽取女生97321⨯=人,抽取男生127421⨯=人. (2)(i )随机变量X 的所有可能取值为3,4,5,6.0343371(3)35C C P X C ===, 12433712(4)35C C P X C ===, 21433718(5)35C C P X C ===,3043374(6)35C C P X C ===, 所以随机变量X 的分布列为数学期望11218416533()345635353535357E X =⨯+⨯+⨯+⨯==. (ii )由(i )知12186()(4)(5)35357P A P X P X ==+==+=, 故事件A 发生的概率为67. 2.(2020·绵阳市·四川省绵阳江油中学)某校五四青年艺术节选拔主持人,现有来自高一年级参赛选手4名,其中男生2名;高二年级参赛选手4名,其中男生3名.从这8名参赛选手中随机选择4人组成搭档参赛.(Ⅰ)设A 为事件“选出的4人中恰有2名男生,且这2名男生来自同一个年级”,求事件A 发生的概率; (Ⅱ)设X 为选出的4人中男生的人数,求随机变量X 的分布列和数学期望. 【答案】(Ⅰ)635(Ⅱ)分布列见解析,数学期望52【解析】(Ⅰ)由已知有()2222233348635C C C C P A C +==,所以事件A 发生的概率为635.(Ⅱ)随机变量X 的所有可能取值为1,2,3,4,()()453481,2,3,4k kC C P X k k C -=== 所以随机变量X 的分布列为所以随机变量X 的数学期望()1331512341477142E X =⨯+⨯+⨯+⨯=. 3.(2021·北京东城区)为了解学生自主学习期间完成数学套卷的情况,一名教师对某班级的所有学生进行了调查,调查结果如下表.(1)从这班学生中任选一名男生,一名女生,求这两名学生完成套卷数之和为4的概率?(2)若从完成套卷数不少于4套的学生中任选4人,设选到的男学生人数为X ,求随机变量X 的分布列和数学期望;(3)试判断男学生完成套卷数的方差21s 与女学生完成套卷数的方差22s 的大小(只需写出结论). 【答案】(1)796(2)详见解析(3)2212s s > 【解析】(1)设事件A :从这个班级的学生中随机选取一名男生,一名女生,这两名学生完成套卷数之和为4,由题意可知,()1341712896P A ⨯+⨯==⨯.(2)完成套卷数不少于4本的学生共8人,其中男学生人数为4人,故X 的取值为0,1,2,3,4.由题意可得()44481070C P X C ===;()13444816817035C C P X C ====;()224448361827035C C P X C ====; ()31444816837035C C P X C ====;()44481470C P X C ===.所以随机变量X 的分布列为随机变量X 的均值116361610123427070707070EX =⨯+⨯+⨯+⨯+⨯=. (3)2212s s >.考点三 二项分布与超几何分布综合运用【例3】(2020·浙江台州市·高二期中)2020年五一期间,银泰百货举办了一次有奖促销活动,消费每超过600元(含600元),均可抽奖一次,抽奖方案有两种,顾客只能选择其中的一种.方案一:从装有10个形状、大小完全相同的小球(其中红球2个,白球1个,黑球7个)的抽奖盒中,一次性摸出3个球其中奖规则为:若摸到2个红球和1个白球,享受免单优惠;若摸出2个红球和1个黑球则打5折;若摸出1个白球2个黑球,则打7折;其余情况不打折.方案二:从装有10个形状、大小完全相同的小球(其中红球3个,黑球7个)的抽奖盒中,有放回每次摸取1球,连摸3次,每摸到1次红球,立减200元.(1)若两个顾客均分别消费了600元,且均选择抽奖方案一,试求两位顾客均享受免单优惠的概率; (2)若某顾客消费恰好满1000元,试从概率角度比较该顾客选择哪一种抽奖方案更合算?【答案】(1)114400;(2)选择第二种方案更合算.【解析】(1)选择方案一若享受到免单优惠,则需要摸出三个红球,设顾客享受到免单优惠为事件A ,则()21213101120C C P A C ==, 所以两位顾客均享受到免单的概率为()()114400P P A P A =⋅=;(2)若选择方案一,设付款金额为X 元,则X 可能的取值为0、500、700、1000.()212131010120C C P X C ===,()21273107500120C C P X C ===, ()1217310770040C C P X C ===,()177911000112012040120P X ==---=.故X 的分布列为,所以()0500700100091012012040120E X =⨯+⨯+⨯+⨯=(元). 若选择方案二,设摸到红球的个数为Y ,付款金额为Z ,则1000200Z Y =-, 由已知可得3~3,10Y B ⎛⎫⎪⎝⎭,故()3931010E Y =⨯=, 所以()()()10002001000200820E Z E Y E Y =-=-=(元). 因为()()E X E Z >,所以该顾客选择第二种抽奖方案更合算.【一隅三反】1.(2020·辽宁大连市)学校游园活动有这样一个游戏项目:甲箱子里装有3个白球、2个黑球,乙箱子里装有1个白球、2个黑球,这些球除颜色外完全相同,每次游戏从这两个箱子里各随机摸出2个球,若摸出的白球不少于2个,则获奖.(每次游戏结束后将球放回原箱) (1)求在1次游戏中,①摸出3个白球的概率;②获奖的概率;(2)求在4次游戏中获奖次数X 的分布列及数学期望()E X . 【答案】(1)①15,②710;(2)分布列见解析,145. 【解析】(1)设“在1次游戏中摸出i 个白球”为事件(0,1,2,3),=i A i①2132322531().5==C C P A C C · ②设“在1次游戏中获奖”为事件B ,则23B A A =⋃,又21121332222222253531(),2=+=C C C C C P A C C C C ··且A 2,A 3互斥, 所以23117()()().2510P B P A P A (2)由题意可知X 的所有可能取值为0,1,2,3,4, 由(1)7()10P B =,3()1()10P B P B =-=, 44381(0)()1010000P X P B ⎛⎫⎡⎤==== ⎪⎣⎦⎝⎭, 331473189(1)()()410102500P X C P B P B ⎛⎫⎡⎤===⨯⨯= ⎪⎣⎦⎝⎭, []222224731323(2)()()610105000P X C P B P B ⎛⎫⎛⎫⎡⎤===⨯⨯= ⎪ ⎪⎣⎦⎝⎭⎝⎭ []3334731029(3)()()410102500P X C P B P B ⎛⎫===⨯⨯=⎪⎝⎭[]4472401(4)()1010000P X P B ⎛⎫====⎪⎝⎭ 所以X 的分布列是显然7~B 410X ⎛⎫ ⎪⎝⎭, ,所以X 的数学期望E(X)=7144105⨯=. 2.(2020·广东云浮市)甲、乙去某公司应聘面试.该公司的面试方案为:应聘者从6道备选题中一次性随机抽取3道题,按照答对题目的个数为标准进行筛选.已知6道备选题中应聘者甲有4道题能正确完成,2道题不能完成;应聘者乙每题正确完成的概率都是23,且每题正确完成与否互不影响. (1)分别求甲、乙两人正确完成面试题数的分布列,并计算其数学期望; (2)请分析比较甲、乙两人谁的面试通过的可能性较大?【答案】(1) 甲、乙的分布列见解析;甲的数学期望2、乙的数学期望2; (2)甲通过面试的概率较大. 【解析】(1)设X 为甲正确完成面试题的数量,Y 为乙正确完成面试题的数量, 依题意可得:~(6,3,4)X H ,∴1223461(1)5C C P X C ⋅===,4212363(2)5C C P X C ⋅===,3042361(3)5C C P X C ⋅===, ∴X 的分布列为:∴1232555EX =⨯+⨯+⨯=. 2~3,3Y B ⎛⎫ ⎪⎝⎭,∴0303211(0)3327P Y C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,12132162(1)C 33279P Y ⎛⎫⎛⎫==== ⎪⎪⎝⎭⎝⎭, 212321124(2)C 33279P Y ⎛⎫⎛⎫==== ⎪ ⎪⎝⎭⎝⎭,333218(3)3327P Y C ⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭, ∴Y 的分布列为:∴01232279927EY =⨯+⨯+⨯+⨯=.(2)2221312(12)(22)(32)5555DX =⨯-+-⨯+-⨯=, 2121333(3)DY np p =-=⨯⨯=,∵DX DY <,∴甲发挥的稳定性更强,则甲通过面试的概率较大.3.(2021·哈尔滨市)一批产品共10件,其中3件是不合格品,用下列两种不同方式从中随机抽取2件产品检验:方法一:一次性随机抽取2件;方法二:先随机抽取1件,放回后再随机抽取1件.记方法一抽取的不合格产品数为1ξ.记方法二抽取的不合格产品数为2ξ. (1)求两种抽取方式下1ξ,2ξ的概率分布列;(2)比较两种抽取方式抽到的不合格品平均数的大小?并说明理由. 【答案】(1)1ξ,2ξ的分布列见解析;(2)平均数相等,理由见解析.【解析】(1)方法一中随机变量1ξ可取的值为0,1,2,且1ξ服从超几何分布,于是()023*********C C P C ξ⋅===;()113712107115C C P C ξ⋅===; ()203712101215C C P C ξ⋅===; 因此1ξ的频率分布可表示为下表:方法二中随机变量2ξ可取的值为0,1,2,且2ξ服从二项分布,于是()02022374901010100P C ξ⎛⎫⎛⎫==⋅⋅= ⎪ ⎪⎝⎭⎝⎭;()12237211101050P C ξ==⋅⋅=; ()22223721010P C ξ⎛⎫⎛⎫==⋅⋅ ⎪ ⎪⎝⎭⎝⎭;因此2ξ的频率分布可表示为下表:(2)由(1)知,方法一中1ξ的数学期望为()10121515155E ξ=⨯+⨯+⨯=, 方法二中2ξ的数学期望为()2332105E ξ=⨯=, 所以两种方式抽到的不合格品平均数相等.。