分布列知识点
分布列知识点总结

分布列知识点总结一、概念介绍1.1 分布列的定义分布列是离散随机变量的取值和相应概率的列。
对于离散型随机变量X,其所有可能取值x1,x2,……,xn及其上对应的概率P(X=x1),P(X=x2),……,P(X=xn)就构成了X的分布列。
1.2 分布列的性质(1)分布列的概率和为1对于任意一个随机变量X,其分布列中所有可能取值的概率之和为1,即∑P(X=xi)=1。
(2)随机变量的取值是有限个或可列无限个分布列中的随机变量的取值只能是有限个或可列无限个,不可能是连续的。
二、分布列的应用2.1 用分布列计算期望和方差分布列是计算离散随机变量的期望和方差的有力工具。
根据期望和方差的公式,可以直接利用分布列中的取值和概率来计算期望和方差。
2.2 利用分布列进行概率计算通过分布列,可以计算得到随机变量取某个值的概率,或者计算随机变量在某个范围内取值的概率等。
这对于一些概率问题的求解非常有用。
三、分布列的例子3.1 二项分布二项分布是一种常见的离散型概率分布,用于描述在n次独立重复的伯努利试验中成功的次数。
设X为二项分布随机变量,其分布列为:X 0 1 2 …… nP C(n,0) * p^0 * (1-p)^n C(n,1) * p^1 * (1-p)^(n-1) C(n,2) * p^2 * (1-p)^(n-2) …… C(n,n) * p^n * (1-p)^0其中,p为成功的概率,n为试验的次数。
3.2 泊松分布泊松分布描述了单位时间内随机事件发生的次数。
设X为泊松分布随机变量,其分布列为:X 0 1 2 3 4 ……P e^(-λ) * λ^0 / 0! e^(-λ) * λ^1 / 1! e^(-λ) * λ^2 / 2! e^(-λ) * λ^3 / 3! e^(-λ) * λ^4 / 4! ……其中,λ为单位时间内随机事件发生的平均次数。
四、分布列与其他概率分布的关系4.1 分布列与连续型概率分布分布列适用于离散型随机变量,而连续型随机变量则需要用概率密度函数进行描述。
高二概率分布列知识点总结

高二概率分布列知识点总结概率分布列是概率论中的一种重要工具,用于描述离散型随机变量的取值与其概率之间的关系。
在高二阶段,学生需要掌握概率分布列的概念、性质以及计算方法等知识点。
本文将从这些方面逐一进行总结。
一、概率分布列的概念概率分布列是指将随机变量的所有可能取值及其对应的概率按照一定的格式列出来,以便于统计和分析。
对于一个离散型随机变量X,概率分布列的一般形式为:X | x1 | x2 | ... | xnP(X) | p1 | p2 | ... | pn其中,x1、x2、...、xn 表示随机变量X的所有可能取值,p1、p2、...、pn 表示对应取值的概率。
二、概率分布列的性质1. 概率非负性:对于所有可能取值xi,其对应的概率pi必须大于等于零,即pi ≥ 0。
2. 概率和为1:概率分布列中的所有概率之和必须等于1,即p1 + p2 + ... + pn = 1。
三、概率分布列的计算方法1. 等可能事件的概率分布列:当随机变量的各个取值具有相同的概率时,可以使用等可能事件的概率分布列。
例如,抛硬币的结果是正面或反面,它们的概率都是1/2。
2. 频率概率的概率分布列:当通过实验或观察来确定随机变量的各个取值及其对应的概率时,可以使用频率概率的概率分布列。
例如,通过调查某班同学身高的分布情况,可以得到相应的概率分布列。
3. 几何概率的概率分布列:当随机变量的取值来自于几何概率的实验,如抽奖、投掷骰子等时,可以使用几何概率的概率分布列。
例如,抛硬币出现正面的次数,它的概率分布列为:X | 0 | 1 | 2P(X) | 1/2 | 1/2 | 0四、常见概率分布列1. 二项分布:二项分布是指在n次独立重复试验中,成功事件发生的次数满足概率分布列。
例如,n次抛硬币的正面次数,其概率分布列可以通过二项分布计算得出。
2. 泊松分布:泊松分布是指在一段时间或一定区域内,独立事件发生的次数满足概率分布列。
高中数学高三分布列知识点

高中数学高三分布列知识点在高中数学的学习中,分布列是一个重要的概念和技巧,它用于描述随机试验中各个可能结果的概率分布。
分布列的研究可以帮助我们理解概率论的基本原理,并且可以应用于实际问题的解决。
一、概念和基本性质分布列是指随机试验的所有可能结果及其对应的概率。
在计算分布列时,我们需要确定试验的所有可能结果,并且计算每个结果出现的概率。
分布列具有以下基本性质:1. 概率的非负性:每个结果的概率都是非负数,不会出现负值。
2. 概率的和为1:所有结果的概率之和等于1,表示必然事件的发生。
3. 互斥性:不同结果之间是互斥的,即只能发生其中一个结果。
4. 可列性:试验的所有可能结果是可列的,即可以一一列举。
二、常见的分布列1. 二项分布:二项分布是一种离散的概率分布,适用于只有两个可能结果的试验。
二项分布的概率计算公式为P(X=k)=C(n,k)p^k(1-p)^(n-k),其中n表示试验的次数,k表示成功的次数,p表示每次试验成功的概率。
2. 泊松分布:泊松分布是一种离散的概率分布,适用于描述单位时间(或空间)内某事件发生的次数的概率分布。
泊松分布的概率计算公式为P(X=k)=e^(-λ)λ^k/k!,其中λ表示单位时间(或空间)内事件的平均发生次数。
3. 几何分布:几何分布是一种离散的概率分布,适用于描述在独立重复试验中,试验成功之前所需的失败次数的概率分布。
几何分布的概率计算公式为P(X=k)=(1-p)^(k-1)p,其中p表示每次试验成功的概率。
4. 正态分布:正态分布是一种连续的概率分布,适用于描述大部分事物的分布情况。
正态分布的概率密度函数为f(x)=1/(σ√(2π))e^(-(x-μ)^2/(2σ^2)),其中μ表示均值,σ表示标准差。
三、应用实例分布列的应用非常广泛,下面我们通过几个实例来说明其实用性。
1. 投掷硬币问题:假设我们进行10次硬币的正反面投掷试验,每次成功的概率都是0.5。
概率统计分布列知识点总结

概率统计分布列知识点总结一、离散分布对于离散型随机变量,它取值为有限个或者可数个。
在概率统计中,常见的离散分布包括:伯努利分布、二项分布、泊松分布等。
1. 伯努利分布伯努利分布是最简单的概率分布之一,它描述了只有两种可能结果的随机实验的分布。
例如,抛一次硬币的结果可以是正面或反面,这就是一个典型的伯努利分布。
伯努利分布的概率质量函数可以表示为:P(X=x) ={p, if x=11-p, if x=0}其中,p表示事件发生的概率,1-p表示事件不发生的概率。
伯努利分布的期望值为p,方差为p(1-p)。
2. 二项分布二项分布描述了一系列独立重复的伯努利试验的结果。
例如,抛n次硬币,其中正面的次数就是一个二项分布。
二项分布的概率质量函数可以表示为:P(X=k) = C(n,k) * p^k * (1-p)^(n-k)其中,n表示试验的次数,k表示事件发生的次数,p表示事件发生的概率,C(n,k)表示组合数。
二项分布的期望值为np,方差为np(1-p)。
3. 泊松分布泊松分布描述了单位时间内随机事件发生次数的分布。
例如,单位时间内接到的电话数、单位时间内发生事故的次数等都可以用泊松分布来描述。
泊松分布的概率质量函数可以表示为:P(X=k) = (λ^k * e^(-λ)) / k!其中,λ表示单位时间内事件发生的平均次数。
泊松分布的期望值和方差都等于λ。
二、连续分布对于连续型随机变量,它可以取任意的实数值。
在概率统计中,常见的连续分布包括:均匀分布、正态分布、指数分布等。
1. 均匀分布均匀分布描述了取值在一定范围内的随机变量的概率分布。
例如,在区间[a,b]内取值的随机变量就可以用均匀分布来描述。
均匀分布的概率密度函数可以表示为:f(x) ={1 / (b-a), if x∈[a,b]0, otherwise}均匀分布的期望值为(a+b)/2,方差为(b-a)^2 / 12。
2. 正态分布正态分布是最常见的连续分布之一,它具有许多重要的性质,例如中心极限定理。
分布列知识点与应用举例

分布列知识点与应用举例分布列是概率论与数理统计中的重要概念,它描述了一组可能值的出现概率。
在实际应用中,我们经常会遇到各种各样的概率分布,并使用它们来描述和解决各种问题。
下面是一些常见的概率分布及其应用的举例。
1.二项分布二项分布是最常见的概率分布之一,它描述了在一系列独立重复的伯努利试验中成功的次数。
在实际应用中,二项分布经常被用来描述二元事件的概率,比如投硬币、赌博、产品缺陷等。
举个例子,假设一个投硬币游戏中硬币正面的概率为0.5,现在进行了100次投掷,我们想知道正面出现60次的概率。
这个问题可以用二项分布来解决。
2.正态分布正态分布又称为高斯分布,它是概率论中最重要的概率分布之一,也是自然界和社会现象中许多变量的分布模型。
正态分布的概率密度函数呈钟形,对称地分布在平均值周围。
在实际应用中,正态分布经常被用来描述连续型变量的分布,如身高、体重、考试分数等。
举个例子,假设一些班级的考试分数服从正态分布,平均分数为80分,标准差为10分,我们想知道成绩在70分至90分之间的学生所占的比例。
这个问题可以用正态分布来解决。
3.泊松分布4.指数分布指数分布是一种连续型的概率分布,描述了独立均匀分布的随机变量第一次成功所需时间的概率分布。
指数分布的概率密度函数随着时间的增长而减小。
在实际应用中,指数分布经常被用来描述一些随机事件的持续时间,如等待时间、故障间隔时间等。
举个例子,假设一些网站的平均用户等待时间为5分钟,我们想知道一个用户等待时间小于10分钟的概率。
这个问题可以用指数分布来解决。
总之,概率分布在实际应用中有着广泛的应用。
通过了解和应用不同的概率分布,我们可以更好地理解和解决各种实际问题。
以上只是一些常见的概率分布及其应用的举例,实际应用中还有很多其他的概率分布,每个分布都有其自身的特点和适用领域。
高考数学总复习考点知识专题讲解11 离散型随机变量及其分布列

高考数学总复习考点知识专题讲解 专题11离散型随机变量及其分布列知识点一 随机变量的概念、表示及特征1.概念:一般地,对于随机试验样本空间Ω中的每个样本点ω都有唯一的实数X (ω)与之对应,我们称X 为随机变量.2.表示:用大写英文字母表示随机变量,如X ,Y ,Z ;用小写英文字母表示随机变量的取值,如x ,y ,z .3.特征:随机试验中,每个样本点都有唯一的一个实数与之对应,随机变量有如下特征:(1)取值依赖于样本点. (2)所有可能取值是明确的. 知识点二 离散型随机变量可能取值为有限个或可以一一列举的随机变量,我们称之为离散型随机变量. 判断离散型随机变量的方法 (1)明确随机试验的所有可能结果; (2)将随机试验的结果数量化;(3)确定试验结果所对应的实数是否可以一一列出,如能一一列出,则该随机变量是离散型随机变量,否则不是.【例1】((2023•丰台区期末)下面给出的四个随机变量中是离散型随机变量的为() ①高速公路上某收费站在半小时内经过的车辆数1X ;②一个沿直线2y x 进行随机运动的质点离坐标原点的距离X;③某同学射击3次,命中的次数3X;④某电子元件的寿2命X;4A.①②B.③④C.①③D.②④【例2】(2023•从化区期中)袋中有大小相同的5个球,分别标有1,2,3,4,5五个号码,现在在有放回抽取的条件下依次取出两个球,设两个球的号码之和为随机变量X,则X所有可能取值的个数是()A.25B.10C.9D.5知识点三离散型随机变量的分布列及其性质1.定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,x n,我们称X取每一个值x i的概率P(X=x i)=p i,i=1,2,3,…,n为X的概率分布列,简称分布列.2.分布列的性质(1)p i≥0,i=1,2,…,n.(2)p1+p2+…+p n=1.分布列的性质及其应用(1)利用分布列中各概率之和为1可求参数的值,此时要注意检验,以保证每个概率值均为非负数.(2)求随机变量在某个范围内的概率时,根据分布列,将所求范围内各随机变量对应的概率相加即可,其依据是互斥事件的概率加法公式.【例3】(2023•辽宁期末)随机变量X的分布列如下表所示,则(2)(…)P XA .0.1B .0.2C .0.3D .0.4【例4】(2022•朝阳区开学)设随机变量X 的分布列为()(1P X k k k λ===,2,3,4),则λ的值为() A .10B .110C .10-D .110-【例5】(2023•珠海期末)已知某离散型随机变量ξ的分布列为:则(q =)A .13和1-B .13C .12D .1-【例6】(2022•多选•天津模拟)设随机变量ξ的分布列为()(15kP ak k ξ===,2,3,4,5),则()A .115a =B .141()255P ξ<<= C .112()10215P ξ<<=D .23()510P ξ=…【例7】(2023•湖北模拟)设随机变量ξ的分布列如表:则下列正确的是()A .当{}n a 为等差数列时,5615a a += B .数列{}n a 的通项公式可以为109(1)n a n n =+C .当数列{}n a 满足1(1,2,9)2n na n ==时,10912a =D .当数列{}n a 满足2()(1k P k k a k ξ==…,2,10)时,1110(1)n a n n =+知识点四 两点分布如果P (A )=p ,则P (A )=1-p ,那么X 的分布列为我们称X 服从两点分布或0-1【例8】(多选)若离散型随机变量X 的分布列如下表所示,则下列说法错误的是()A .常数c 的值为23或13B .常数c 的值为23C .1(0)3P X ==D .2(0)3P X ==【例9】(2023•阜南县期末)从6名男生和4名女生中随机选出3名同学参加一项竞技测试.(1)求选出的3名同学中至少有1名女生的概率;(2)设ξ表示选出的3名同学中男生的人数,求ξ的分布列.【例10】(2023•崂山区期末)某电视台“挑战主持人”节目的挑战者闯第一关需要回答三个问题,其中前两个问题回答正确各得10分,回答不正确得0分,第三个问题回答正确得20分,回答不正确得10-分.如果一位挑战者回答前两个问题正确的概率都是2 3,回答第三个问题正确的概率为12,且各题回答正确与否相互之间没有影响.若这位挑战者回答这三个问题的总分不低于10分就算闯关成功.(1)求至少回答对一个问题的概率.(2)求这位挑战者回答这三个问题的总得分X的分布列.(3)求这位挑战者闯关成功的概率.同步训练1.(2022•多选•临朐县开学)下列X是离散型随机变量的是()A.某座大桥一天经过的某品牌轿车的辆数XB .一天内的温度为XC .某网页一天内被点击的次数XD .射击运动员对目标进行射击,击中目标得1分,未击中目标得0分,用X 表示该运动员在一次射击中的得分2.(2023•上蔡县校级月考)设随机变量ξ的概率分布列如下表:则(|2|1)(P ξ-==) A .712B .12C .512D .163.(2023•周至县期末)设随机变量X 的分布列为()(1,2,3,4,5,6)2kcP X k k ===,其中c 为常数,则(2)P X …的值为() A .34B .1621C .6364D .64634.(2023•多选•宝安区期中)已知随机变量ξ的分布如下:则实数a 的值为()A .12-B .12C .14D .14-5.(2023•和平区校级期末)设随机变量与的分布列如下:则下列正确的是()A .当{}n a 为等差数列时,5615a a +=B .当数列{}n a 满足1(12n na n ==,2,⋯,9)时,10912a = C .数列{}n a 的通项公式可以为109(1)n a n n =+D .当数列{}n a 满足2()(1k P k k a k ξ==…,2,⋯,10)时,1110(1)n a n n =+6.(2023•郫都区模拟)甲袋中有2个黑球,4个白球,乙袋中有3个黑球,3个白球,从两袋中各取一球.(Ⅰ)求“两球颜色相同”的概率;(Ⅱ)设ξ表示所取白球的个数,求ξ的概率分布列.。
专题06 离散型随机变量及其分布列、数字特征(解析版)

06离散型随机变量及其分布列、数字特征知识点1随机变量(1)定义:一般地,对于随机试验样本空间Ω中的每个样本点ω,都有唯一的实数X(ω)与之对应,我们称X为随机变量.随机变量的取值X(ω)随着随机试验结果ω的变化而变化.(2)离散型随机变量:可能取值为有限个或可以一一列举的随机变量称之为离散型随机变量.(2)表示:随机变量通常用大写英文字母表示,例如X,Y,Z;随机变量的取值用小写英文字母表示,例如x,y,z.知识点2离散型随机变量的分布列的定义(1)定义:一般地,设离散型随机变量X的可能取值为x1,x2,…,x i,…,x n,我们称X取每一个值x i 的概率P(X=x i)=p i,i=1,2,…,n为X的概率分布列,简称分布列.(2)表示方法:①表格;②概率分布图.知识点3离散型随机变量的分布列的性质(1)p i ≥0,i =1,2,…,n ;(2)p 1+p 2+…+p n =1.知识点4离散型随机变量的均值与方差一般地,若离散型随机变量X 的分布列如下表所示,X x 1x 2…x n Pp 1p 2…p n(1)均值:称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n =i ii 1nx P =∑为随机变量X 的均值或数学期望,数学期望简称期望.(2)方差:称D (X )=(x 1-E (X ))2p 1+(x 2-E (X ))2p 2+…+(x n -E (X ))2p n =i 1n=∑(x i -E (X ))2p i 为随机变量X的方差,有时也记为Var (X ),并称D (X )为随机变量X 的标准差,记为σ(X ).(3)均值的意义:均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.(4)方差和标准差的意义:随机变量的方差和标准差都可以度量随机变量取值与其均值E (X )的偏离程度,反映了随机变量取值的离散程度.方差或标准差越小,随机变量的取值越集中;方差或标准差越大,随机变量的取值越分散.知识点5均值与方差的性质若Y =aX +b ,其中X 是随机变量,a ,b 是常数,随机变量X 的均值是E (X ),方差是D (X ).则E (Y )=E (aX +b )=aE (X )+b ;D (Y )=D (aX +b )=a 2D (X ).(a ,b 为常数).知识点6分布列性质的两个作用(1)利用分布列中各事件概率之和为1可求参数的值.(2)随机变量ξ所取的值分别对应的事件是两两互斥的,利用这一点可以求相关事件的概率.知识点7均值与方差的四个常用性质(1)E (k )=k ,D (k )=0,其中k 为常数.(2)E (X 1+X 2)=E (X 1)+E (X 2).(3)D (X )=E (X 2)-(E (X ))2.(4)若X1,X 2相互独立,则E (X 1X 2)=E (X 1)·E (X 2).考点1离散型随机变量分布列的性质(1)求a的值;(2)求;(3)求X.【答案】(1)由分布列的性质,得++++P(X=1)=a+2a+3a+4a+5a=1,所以a=115.(2)=++P(X=1)=3×115+4×115+5×115=45.(3)X=++=115+215+315=25.【总结】离散型随机变量分布列性质的应用(1)利用“总概率之和为1”可以求相关参数的取值范围或值;(2)利用“离散型随机变量在一范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率;(3)可以根据性质判断所得分布列结果是否正确.【变式1-1】设随机变量X的分布列为P(X=k)=Ck(k+1),k=1,2,3,C为常数,则P(X<3)=__________.【答案】89【解析】随机变量X的分布列为P(X=k)=Ck(k+1),k=1,2,3,∴C2+C6+C12=1,即6C+2C+C12=1,解得C=43,∴P(X<3)=P(X=1)+P(X=2)=43=89.【变式1-2】设离散型随机变量X的分布列为X01234P0.20.10.10.3m(1)求随机变量Y=2X+1的分布列;(2)求随机变量η=|X-1|的分布列;(3)求随机变量ξ=X2的分布列.【解析】(1)由分布列的性质知,0.2+0.1+0.1+0.3+m=1,得m=0.3.首先列表为:X012342X+113579从而Y=2X+1的分布列为:Y13579P0.20.10.10.30.3(2)列表为:X01234|X-1|10123∴P(η=0)=P(X=1)=0.1,P(η=1)=P(X=0)+P(X=2)=0.2+0.1=0.3,P(η=2)=P(X=3)=0.3,P(η=3)=P(X=4)=0.3.故η=|X-1|的分布列为:η0123P0.10.30.30.3(3)首先列表为:X01234X2014916从而ξ=X2的分布列为:ξ014916P0.20.10.10.30.3【变式1-3】设随机变量X的分布列如下:X12345P 112161316p则p为()A.1 6B.13C.14D.112【答案】C【解析】由分布列的性质知,112+16+13+16+p=1,∴p=1-34=14.【变式1-4】设X是一个离散型随机变量,其分布列为X-101P 121-q q-q2则q等于()A.1 B.22或-22C.1+22D.2 2【答案】D【解析】1-q+q-q2=1,1-q≤12,q-q2≤12,解得q=22.【变式1-5】(多选)设随机变量ξ的分布列为ak(k=1,2,3,4,5),则()A.a=115B.ξ=15C.ξ=215D.P(ξ=1)=310【答案】AB【解析】对于选项A,∵随机变量ξ的分布列为ak(k=1,2,3,4,5),∴P(ξ=1)=a+2a+3a+4a+5a=15a=1,解得a=115,故A正确;对于B,易知ξ3×115=15,故B正确;对于C,易知ξ=115+2×115=15,故C错误;对于D,易知P(ξ=1)=5×115=13,故D错误.【变式1-6】设X是一个离散型随机变量,其分布列为X01P9a2-a3-8a则常数a的值为()A.13B.23C.13或23D.-13或-23【答案】A【解析】≤9a 2-a ≤1,≤3-8a ≤1,a 2-a +3-8a =1,解得a =13.【变式1-7】离散型随机变量X 的概率分布列为P (X =n )=an (n +1)(n =1,2,3,4),其中a 是常数,则P X 的值为()A.23B.34C.45D.56【答案】D【解析】因为P (X =n )=a n (n +1)(n =1,2,3,4),所以a 2+a 6+a 12+a 20=1,所以a =54,所以X P (X =1)+P (X =2)=54×12+54×16=56.【变式1-8】若随机变量X 的分布列如下表,则mn 的最大值是()X 024Pm0.5n A.116B.18C.14D.12【答案】A【解析】由分布列的性质,得m +n =12,m ≥0,n ≥0,所以mn =116,当且仅当m =n =14时,等号成立.【变式1-9】随机变量X 的分布列如下:X -101Pabc其中a ,b ,c 成等差数列,则P (|X |=1)=______,公差d 的取值范围是______.【答案】23-13,13【解析】因为a ,b ,c 成等差数列,所以2b =a +c .又a +b +c =1,所以b =13,所以P (|X |=1)=a +c =23.又a =13-d ,c =13+d ,根据分布列的性质,得0≤13-d ≤23,0≤13+d ≤23,所以-13≤d ≤13.考点2求离散型随机变量的分布列【例2】双败淘汰制是一种竞赛形式,与普通的单败淘汰制输掉一场即被淘汰不同,参赛者只有在输掉两场比赛后才丧失争夺冠军的可能.在双败淘汰制的比赛中,参赛者的数量一般是2的次方数,以保证每一轮都有偶数名参赛者.第一轮通过抽签,两人一组进行对阵,胜者进入胜者组,败者进入负者组.之后的每一轮直到最后一轮之前,胜者组的选手两人一组相互对阵,胜者进入下一轮,败者则降到负者组参加本轮负者组的第二阶段对阵;负者组的第一阶段,由之前负者组的选手(不包括本轮胜者组落败的选手)两人一组相互对阵,败者被淘汰(已经败两场),胜者进入第二阶段,分别对阵在本轮由胜者组中降组下来的选手,胜者进入下一轮,败者被淘汰.最后一轮,由胜者组最终获胜的选手(此前从未败过,记为A)对阵负者组最终获胜的选手(败过一场,记为B),若A胜则A获得冠军,若B胜则双方再次对阵,胜者获得冠军.某围棋赛事采用双败淘汰制,共有甲、乙、丙等8名选手参赛.第一轮对阵双方由随机抽签产生,之后每一场对阵根据赛事规程自动产生对阵双方,每场对阵没有平局.(1)设“在第一轮对阵中,甲、乙、丙都不互为对手”为事件M,求M的概率;(2)已知甲对阵其余7名选手获胜的概率均为23,解决以下问题:①求甲恰在对阵三场后被淘汰的概率;②若甲在第一轮获胜,设甲在该项赛事的总对阵场次为随机变量ξ,求ξ的分布列.【分析】(1)先求出8人平均分成四组的方法数,再求出甲,乙,丙都不分在同一组的方法数,从而可求得答案;(2)①甲恰在对阵三场后淘汰,有两种情况:“胜,败,败”和“败,胜,败”,然后利用互斥事件的概率公式求解即可;②由题意可得ξ∈{3,4,5,6,7},然后求出各自对应的概率,从而可得ξ的分布列.【解析】(1)8人平均分成四组,共有C28C26C24C22A44种方法,其中甲,乙,丙都不分在同一组的方法数为A35,所以P(A)=A35C28C26C24C22A44=4 7.(2)①甲恰在对阵三场后淘汰,这三场的结果依次是“胜,败,败”或“败,胜,败”,故所求的概率为23×13×13+13×23×13=427.②若甲在第一轮获胜,ξ∈{3,4,5,6,7}.当ξ=3时,表示甲在接下来的两场对阵都败,即P(ξ=3)=13×13=19.当ξ=4时,有两种情况:(ⅰ)甲在接下来的3场比赛都胜,其概率为23×23×23=827;(ⅱ)甲4场对阵后被淘汰,表示甲在接下来的3场对阵1胜1败,且第4场败,概率为C12·23×13×13=427,所以P (ξ=4)=827+427=49.当ξ=5时,有两种情况:(ⅰ)甲在接下来的2场对阵都胜,第4场败,概率为23×23×13=427;(ⅱ)甲在接下来的2场对阵1胜1败,第4场胜,第5场败,概率为C12·23×13×23×13=881;所以P (ξ=5)=427+881=2081.当ξ=6时,有两种情况:(ⅰ)甲第2场胜,在接下来的3场对阵为“败,胜,胜”,其概率为23×132=881;(ⅱ)甲第2场败,在接下来的4场对阵为“胜,胜,胜,败”,其概率为133×13=8243;所以P (ξ=6)=881+8243=32243.当ξ=7时,甲在接下来的5场对阵为“败,胜,胜,胜,胜”,即P (ξ=7)=134=16243.所以ξ的分布列为:ξ34567P194920813224316243【总结】离散型随机变量分布列的求解步骤【变式2-1】为创建国家级文明城市,某城市号召出租车司机在高考期间至少进行一次“爱心送考”,该城市某出租车公司共200名司机,他们进行“爱心送考”的次数统计如图所示.(1)求该出租车公司的司机进行“爱心送考”的人均次数;(2)从这200名司机中任选两人,设这两人进行送考次数之差的绝对值为随机变量X ,求X 的分布列.【解析】(1)由统计图得200名司机中送考1次的有20人,送考2次的有100人,送考3次的有80人,∴该出租车公司的司机进行“爱心送考”的人均次数为20×1+100×2+80×3200=2.3.(2)从该公司任选两名司机,记“这两人中一人送考1次,另一人送考2次”为事件A ,“这两人中一人送考2次,另一人送考3次”为事件B ,“这两人中一人送考1次,另一人送考3次”为事件C ,“这两人送考次数相同”为事件D .由题意知X 的所有可能取值为0,1,2,则P (X =0)=P (D )=C 220+C 2100+C 280C 2200=83199,P (X =1)=P (A )+P (B )=C 120C 1100C 2200+C 1100C 180C 2200=100199.P (X =2)=P (C )=C 120C 180C 2200=16199.∴X 的分布列为:X 012P8319910019916199【变式2-2】(多选)设离散型随机变量X 的分布列为X 01234Pq0.40.10.20.2若离散型随机变量Y 满足Y =2X +1,则下列结果正确的有()A .q =0.1B .E (X )=2,D (X )=1.4C .E (X )=2,D (X )=1.8D .E (Y )=5,D (Y )=7.2【答案】ACD【解析】因为q +0.4+0.1+0.2+0.2=1,所以q =0.1,故A 正确;由已知可得E (X )=0×0.1+1×0.4+2×0.1+3×0.2+4×0.2=2,D (X )=(0-2)2×0.1+(1-2)2×0.4+(2-2)2×0.1+(3-2)2×0.2+(4-2)2×0.2=1.8,故C 正确;因为Y =2X +1,所以E (Y )=2E (X )+1=5,D (Y )=4D (X )=7.2,故D 正确.考点3求离散型随机变量的均值与方差【例3】为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为14,16;1小时以上且不超过2小时离开的概率分别为12,23;两人滑雪时间都不会超过3小时.(1)求甲、乙两人所付滑雪费用相同的概率;(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E (ξ),方差D (ξ).【解析】(1)两人所付费用相同,相同的费用可能为0,40,80元,两人都付0元的概率为P 1=14×16=124,两人都付40元的概率为P 2=12×23=13,两人都付80元的概率为P 3-14--16-=124.则两人所付费用相同的概率为P =P 1+P 2+P 3=124+13+124=512.(2)ξ可能取值为0,40,80,120,160,则P (ξ=0)=14×16=124,P (ξ=40)=14×23+12×16=14,P (ξ=80)=14×16+12×23+14×16=512,P (ξ=120)=12×16+14×23=14,P (ξ=160)=14×16=124.所以,随机变量ξ的分布列为ξ04080120160P1241451214124∴E (ξ)=0×124+40×14+80×512+120×14+160×124=80,D (ξ)=(0-80)2×124+(40-80)2×14+(80-80)2×512+(120-80)2×14+(160-80)2×124=40003.【总结】求离散型随机变量ξ的均值与方差的步骤(1)理解ξ的意义,写出ξ全部的可能取值;(2)求ξ取每个值的概率;(3)写出ξ的分布列;(4)由均值的定义求E (ξ),由方差的定义求D (ξ).【变式3-1】据有关权威发布某种传染病的传播途径是通过呼吸传播,若病人(患了某种传染病的人)和正常人(没患某种传染病的人)都不戴口罩而且交流时距离小于一米90%的机率被传染,若病人不戴口罩正常人戴口罩且交流时距离小于一米时60%的机率被传染,若病人戴口罩而正常人不戴口罩且交流距离小于一米时30%的机率被传染上,若病人和正常人都带口罩且交流距离大于一米时不会被传染.为此对某地经常出入某场所的人员通过抽样调查的方式对戴口罩情况做了记录如下表:男士女士戴口罩不戴口罩戴口罩不戴口罩甲地40203010乙地10304515假设某人是否戴口罩互相独立(1)求去甲地的男士带口罩的概率,用上表估计所有去甲地的人戴口罩的概率.(2)若从所有男士中选1人,从所有女士中选2人,用上表的频率估计概率,求戴口罩人数X 的分布列和期望.(3)上表中男士不戴口罩记为“ξ=0”,戴口罩记为“ξ=1”,确定男士戴口罩的方差为Dξ,和女士不戴口罩记为“η=0”,戴口罩记为“η=1”确定女士戴口罩的方差为Dη.比较Dξ和Dη的大小,并说明理由.【解析】(1)设“去甲地的男士带口罩”为事件M ,则P (M )=4040+20=23,设“去甲地的人戴口罩”为事件N ,则P (N )=40+3040+20+30+10=710,(2)设“男士带口罩”为事件A ,则P (A )=40+1040+20+10+30=12,设“女士带口罩”为事件B ,则P (B )=30+4530+10+45+15=34,所有男士中选1人,从所有女士中选2人,戴口罩人数X =0,1,2,3,P (X =0)=12×14×14=132,P (X =1)=12×14×14+12×34×14+12×14×34=732,P (X =2)=12×34×14+12×14×34+12×34×34=1532,P (X =3)=12×34×34=932分布列为:X123P1327321532932E (X )=0×132+1×732+2×1532+3×932=2(3)E (ξ)=0×12+1×12=12,D (ξ)=(0-12)2×12+(1-12)2×12=14,E (η)=0×14+1×34=34,D (η)=(0-34)2×14+(1-34)2×34=316.100名男士中有50人戴口罩,50人不戴口罩,100名女士中有75人戴口罩,25人不戴口罩,从数据分布可看出来女士戴口罩的集中程度要好于男士,所以其方差偏小.【变式3-2】已知X 的分布列为X -101P121316设Y =2X +3,则E (Y )的值为()A .73B .4C .-1D .1【答案】A【解析】∵E (X )=-12+16=-13,∴E (Y )=E (2X +3)=2E (X )+3=-23+3=73.【变式3-3】已知离散型随机变量X 的分布列为X 012P0.51-2qq 2则常数q =________.【答案】1-22【解析】由分布列的性质得0.5+1-2q +q 2=1,解得q =1-22或q =1+22(舍去).【变式3-4】设随机变量X 的分布列为P (X =k )=a k,k =1,2,3,则a 的值为__________.【答案】2713【解析】因为随机变量X 的分布列为P (X =k )=a k,k =1,2,3,所以根据分布列的性质有a ·13+a 2+a 3=1,所以a +19+=a ×1327=1,所以a =2713.【变式3-5】已知随机变量X 的分布列如下:X -101P121316若Y =2X +3,则E (Y )的值为________.【答案】73【解析】E (X )=-12+16=-13,则E (Y )=E (2X +3)=2E (X )+3=-23+3=73.【变式3-6】若随机变量X 满足P (X =c )=1,其中c 为常数,则D (X )的值为________.【答案】0【解析】因为P (X =c )=1,所以E (X )=c ×1=c ,所以D (X )=(c -c )2×1=0.【变式3-7】(2022·昆明模拟)从1,2,3,4,5这组数据中,随机取出三个不同的数,用X 表示取出的数字的最小数,则随机变量X 的均值E (X )等于()A.32B.53C.74D.95【答案】A【解析】由题意知,X 的可能取值为1,2,3,而随机取3个数的取法有C 35种,当X =1时,取法有C 24种,即P (X =1)=C 24C 35=35;当X =2时,取法有C 23种,即P (X =2)=C 23C 35=310;当X =3时,取法有C22种,即P (X =3)=C 22C 35=110;∴E (X )=1×35+2×310+3×110=32.【变式3-8】已知随机变量X ,Y 满足Y =2X +1,且随机变量X 的分布列如下:X 012P1613a则随机变量Y 的方差D (Y )等于()A.59B.209C.43D.299【答案】B【解析】由分布列的性质,得a =1-16-13=12,所以E (X )=0×16+1×13+2×12=43,所以D (X )×16+×13+×12=59,又Y =2X +1,所以D (Y )=4D (X )=209.【变式3-9】已知m ,n 为正常数,离散型随机变量X 的分布列如表:X -101Pm14n若随机变量X 的均值E (X )=712,则mn =________,P (X ≤0)=________.【答案】11813【解析】+n +14=1,-m =712,=112,=23,所以mn =118,P (X ≤0)=m +14=13.【变式3-10】(2022·邯郸模拟)小张经常在某网上购物平台消费,该平台实行会员积分制度,每个月根据会员当月购买实物商品和虚拟商品(充话费等)的金额分别进行积分,详细积分规则以及小张每个月在该平台消费不同金额的概率如下面的表1和表2所示,并假设购买实物商品和购买虚拟商品相互独立.表1购买实物商品(元)(0,100)[100,500)[500,1000)积分246概率141214表2购买虚拟商品(元)(0,20)[20,50)[50,100)[100,200)积分1234概率13141416(1)求小张一个月购买实物商品和虚拟商品均不低于100元的概率;(2)求小张一个月积分不低于8分的概率;(3)若某个月小张购买了实物商品和虚拟商品,消费均低于100元,求他这个月的积分X 的分布列与均值.【解析】(1)小张一个月购买实物商品不低于100元的概率为12+14=34,购买虚拟商品不低于100元的概率为16,因此所求概率为34×16=18.(2)根据条件,积分不低于8分有两种情况:①购买实物商品积分为6分,购买虚拟商品的积分为2,3,4分;②购买实物商品积分为4分,购买虚拟商品的积分为4分,故小张一个月积分不低于8分的概率为14×+12×16=14.(3)由条件可知X 的可能取值为3,4,5.P (X =3)=1313+14+14=25,P (X =4)=P (X =5)=1413+14+14=310,即X 的分布列如下:X 345P25310310E (X )=3×25+4×310+5×310=3910.考点4均值与方差在决策中的作用【例4】2021年3月5日李克强总理在政府作报告中特别指出:扎实做好碳达峰,碳中和各项工作,制定2030年前碳排放达峰行动方案,优化产业结构和能源结构.某环保机器制造商为响应号召,对一次购买2台机器的客户推出了两种超过机器保修期后5年内的延保维修方案:方案一:交纳延保金5000元,在延保的5年内可免费维修2次,超过2次每次收取维修费1000元;方案二:交纳延保金6230元,在延保的5年内可免费维修4次,超过4次每次收取维修费t 元;制造商为制定收取标准,为此搜集并整理了200台这种机器超过保修期后5年内维修的次数,统计得到下表:维修次数0123机器台数20408060以这200台机器维修次数的频率代替1台机器维修次数发生的概率,记X 表示2台机器超过保修期后5年内共需维修的次数.(1)求X 的分布列;(2)以所需延保金与维修费用之和的均值为决策依据,为使选择方案二对客户更合算,应把t 定在什么范围?【分析】(1)由题设描述确定2台机器超过保修期后5年内共需维修的次数的可能值,并确定对应的基本事件,进而求各可能值的概率,写出分布列.(2)根据(1)所得分布列,由各方案的费用与维修次数的关系写出费用的分布列,并求期望,通过期望值的大小关系求参数的范围.【解析】(1)由题意得,X =0,1,2,3,4,5,6,P (X =0)=110×110=1100,P (X =1)=110×15×2=125,P (X =2)=110×25×2+15×15=325,P (X =3)=110×310×2+15×25×2=1150,P (X =4)=310×15×2+25×25=725,P (X =5)=310×25×2=625,P (X =6)=310×310=9100,∴X 的分布列为X 0123456P110012532511507256259100(2)选择方案一:所需费用为Y 1元,则X ≤2时,Y 1=5000,X =3时,Y 1=6000;X =4时,Y 1=7000;X =5时,Y 5=8000,X =6时,Y 1=9000,∴Y 1的分布列为Y 150006000700080009000P1710011507256259100E (Y 1)=5000×17100+6000×1150+7000×725+8000×625+9000×9100=6860,选择方案二:所需费用为Y 2元,则X ≤4时,Y 2=6230;X =5时,Y 2=6230+t ;X =6时,Y 2=6230+2t ,则Y 2的分布列为Y 262306230+t 6230+2t P671006259100E (Y 2)=6230×67100+(6230+t )×625+(6230+2t )×9100=6230+21t50,要使选择方案二对客户更合算,则E (Y 2)<E (Y 1),∴6230+21t50<6860,解得t <1500,即t 的取值范围为[0,1500).【总结】利用均值、方差进行决策的2个方略(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.【变式4-1】直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有56是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,并根据列联表判断是否有85%的把握认为经常使用网络直播销售与年龄有关?使用直播销售情况与年龄列联表年轻人非年轻人合计经常使用直播销售用户不常使用直播销售用户合计(2)某投资公司在2021年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为710,15,110;方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为35,310,110.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.参考数据:独立性检验临界值表α0.150.100.0500.0250.010x α2.0722.7063.8415.0246.635其中,χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .【解析】(1)由图1知,“年轻人”占比为45.5%+34.5%=80%,即有200×80%=160(人),“非年轻人”有200-160=40(人),由图2知,“经常使用直播销售用户”占比为30.1%+19.2%+10.7%=60%,即有200×60%=120(人),“不常使用直播销售用户”有200-120=80(人).“经常使用直播销售用户的年轻人”有120×56=100(人),“经常使用直播销售用户的非年轻人”有120-100=20(人).∴补全的列联表如下:年轻人非年轻人合计经常使用直播销售用户10020120不常使用直播销售用户602080合计16040200于是a =100,b =20,c =60,d =20.∴χ2=200×(100×20-60×20)2120×80×160×40=2512≈2.083>2.072,即有85%的把握认为经常使用网络直播销售与年龄有关.(2)若按方案一,设获利X 1万元,则X 1可取的值为300,-150,0,X 1的分布列为:X 1300-1500p71015110E (X 1)=300×710+(-150)×15+0×110=180(万元),D(X1)=(300-180)2×710+(-150-180)2×15+(0-180)2×110=1202×710+3302×15+1802×110=35100若按方案二,设获利X2万元,则X2可取的值为500,-300,0,X2的分布列为:X2500-3000p 35310110E(X2)=500×35+(-300)×310+0×110=210(万元),D(X2)=(500-210)2×35+(-300-210)2×310+(0-210)2×110=2902×35+5102×310+2102×110=132900∵E(X1)<E(X2),D(X1)<D(X2),由方案二的均值要比方案一的均值大,从获利角度来看方案二更大,故选方案二.由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.【变式4-2】某班体育课组织篮球投篮考核,考核分为定点投篮与三步上篮两个项目.每个学生在每个项目投篮5次,以规范动作投中3次为考核合格,定点投篮考核合格得4分,否则得0分;三步上篮考核合格得6分,否则得0分.现将该班学生分为两组,一组先进行定点投篮考核,一组先进行三步上篮考核,若先考核的项目不合格,则无需进行下一个项目,直接判定为考核不合格;若先考核的项目合格,则进入下一个项目进行考核,无论第二个项目考核是否合格都结束考核.已知小明定点投篮考核合格的概率为0.8,三步上篮考核合格的概率为0.7,且每个项目考核合格的概率与考核次序无关.(1)若小明先进行定点投篮考核,记X为小明的累计得分,求X的分布列;(2)为使累计得分的均值最大,小明应选择先进行哪个项目的考核?并说明理由.【解析】(1)由已知可得,X的所有可能取值为0,4,10,则P(X=0)=1-0.8=0.2,P(X=4)=0.8×(1-0.7)=0.24,P(X=10)=0.8×0.7=0.56,所以X的分布列为X0410P0.20.240.56(2)小明应选择先进行定点投篮考核,理由如下:由(1)可知小明先进行定点投篮考核,累计得分的均值为E(X)=0×0.2+4×0.24+10×0.56=6.56,若小明先进行三步上篮考核,记Y为小明的累计得分,则Y的所有可能取值为0,6,10,P(Y=0)=1-0.7=0.3,P (Y =6)=0.7×(1-0.8)=0.14,P (Y =10)=0.7×0.8=0.56,则Y 的均值为E (Y )=0×0.3+6×0.14+10×0.56=6.44,因为E (X )>E (Y ),所以为使累计得分的均值最大,小明应选择先进行定点投篮考核.【变式4-3】为加快某种病毒的检测效率,某检测机构采取“k 合1检测法”,即将k 个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;②已知10人分成一组,分10组,两名感染患者在同一组的概率为111,定义随机变量X 为总检测次数,求检测次数X 的分布列和均值E (X );(2)若采用“5合1检测法”,检测次数Y 的均值为E (Y ),试比较E (X )和E (Y )的大小(直接写出结果).【解析】(1)①对每组进行检测,需要10次;再对结果为阳性的一组每个人进行检测,需要10次,所以总检测次数为20.②由题意,X 可以取20,30,P (X =20)=111,P (X =30)=1-111=1011,则X 的分布列为X 2030P1111011所以E (X )=20×111+30×1011=32011.(2)由题意,Y 可以取25,30,两名感染者在同一组的概率为P 1=C 120C 22C 398C 5100=499,不在同一组的概率为P 1=9599,则E (Y )=25×499+30×9599=295099>E (X ).【变式4-4】(2022·莆田质检)某工厂生产一种精密仪器,由第一、第二和第三工序加工而成,三道工序的加工结果相互独立,每道工序的加工结果只有A ,B 两个等级.三道工序的加工结果直接决定该仪器的产品等级:三道工序的加工结果均为A 级时,产品为一等品;第三工序的加工结果为A 级,且第一、第二工序至少有一道工序加工结果为B 级时,产品为二等品;其余均为三等品.每一道工序加工结果为A 级的概率如表一所示,一件产品的利润(单位:万元)如表二所示:表一工序第一工序第二工序第三工序概率0.50.750.8表二等级一等品二等品三等品利润2385(1)用η表示一件产品的利润,求η的分布列和均值;(2)因第一工序加工结果为A 级的概率较低,工厂计划通过增加检测成本对第一工序进行改良,假如改良过程中,每件产品检测成本增加x (0≤x ≤4)万元(即每件产品利润相应减少x 万元)时,第一工序加工结果为A 级的概率增加19x .问该改良方案对一件产品利润的均值是否会产生影响?并说明理由.【解析】(1)由题意可知,η的所有可能取值为23,8,5,产品为一等品的概率为0.5×0.75×0.8=0.3,产品为二等品的概率为(1-0.5×0.75)×0.8=0.5,产品为三等品的概率为1-0.3-0.5=0.2,所以η的分布列为η2385P0.30.50.2E (η)=23×0.3+8×0.5+5×0.2=11.9.(2)改良方案对一件产品的利润的均值不会产生影响,理由如下:在改良过程中,每件产品检测成本增加x (0≤x ≤4)万元,第一工序加工结果为A 级的概率增加19x ,设改良后一件产品的利润为ξ,则ξ的所有可能取值为23-x,8-x,5-x ,+19x 0.75×0.8=0.3+x15,二等品的概率为10.75×0.8=0.5-x15,三等品的概率为10.2,所以E (ξ)-x )-x )+0.2×(5-x )=6.9-0.3x +2315x -115x 2+4-0.5x -815x +1152+1-0.2x =11.9,因为E (ξ)=E (η),所以改良方案对一件产品的利润的均值不会产生影响.1.(多选)设离散型随机变量X 的分布列如下表:X 12345Pm0.10.2n0.3若离散型随机变量Y =-3X +1,且E (X )=3,则()A .m =0.1B .n =0.1C .E (Y )=-8D .D (Y )=-7.8【答案】BC【解析】由E (X )=1×m +2×0.1+3×0.2+4×n +5×0.3=3得m +4n =0.7,又由m +0.1+0.2+n +0.3=1得m +n =0.4,从而得m =0.3,n =0.1,故A 选项错误,B 选项正确;E (Y )=-3E (X )+1=-8,故C 选项正确;因为D (X )=0.3×(1-3)2+0.1×(2-3)2+0.1×(4-3)2+0.3×(5-3)2=2.6,所以D (Y )=(-3)2D (X )=23.4,故D 选项错误.2.已知随机变量ξ的分布列如下表,D (ξ)表示ξ的方差,则D (2ξ+1)=___________.ξ012pa1-2a14【答案】2【解析】由题意可得:a +1-2a +14=1,解得a =14,ξ012p141214所以E (ξ)=0×14+1×12+2×14=1,D (ξ)=14(0-1)2+12×(1-1)2+14×(2-1)2=12,D (2ξ+1)=22D (ξ)=2.3.京西某地到北京西站有阜石和莲石两条路,且到达西站所用时间互不影响.下表是该地区经这两条路抵达西站所用时长的频率分布表:时间(分钟)10~2020~3030~4040~5050~60莲石路(L 1)的频率0.10.20.30.20.2阜石路(L 2)0.10.40.40.1的频率若甲、乙两人分别有40分钟和50分钟的时间赶往西站(将频率视为概率)(1)甲、乙两人应如何选择各自的路径?(2)按照(1)的方案,用X表示甲、乙两人按时抵达西站的人数,求X的分布列和数学期望.【解析】(1)A i表示事件“甲选择路径L i时,40分钟内赶到火车站”,B1表示事件“乙选择路径L i时,50分钟内赶到火车站”,i=1,2,用频率估计相应的概率,则有P(A1)=0.1+0.2+0.3=0.6,P(A2)=0.1+0.4=0.5,P(A1)>P(A2),所以甲应选择路径L1;P(B1)=0.1+0.2+0.3+0.2=0.8,P(B2)=0.1+0.4+0.4=0.9,P(B1)<P(B2),所以乙应选择路径L2;(2)用A,B分别表示针对(1)的选择方案,甲,乙在各自的时间内到达火车站,由(1)知P(A)=0.6,P(B)=0.9,且A,B相互独立,X的取值是0,1,2,P(X=0)=P(A-B-)=0.1×0.4=0.04,P(X=1)=P(A-B+A B-)=0.4×0.9+0.6×0.1=0.42,P(X=2)=P(AB)=0.9×0.6=0.54,所以X的分布列为:X012P0.040.420.54E(X)=0×0.04+1×0.42+2×0.54=1.5.4.品酒师需定期接受酒味鉴别功能测试,通常采用的测试方法如下:拿出n(n∈N*且n≥4)瓶外观相同但品质不同的酒让品酒师品尝,要求其按品质优劣为它们排序;经过一段时间,等其记忆淡忘之后,再让其品尝这n瓶酒,并重新按品质优劣为它们排序.这称为一轮测试,根据一轮测试中的两次排序的偏离程度的高低为其评分.现分别以a1,a2,a3,…,a n表示第一次排序时被排在1,2,3,…,n的n种酒在第二次排序时的序号,并令X=|1-a1|+|2-a2|+|3-a3|+...+|n-a n|,则X是对两次排序的偏离程度的一种描述.下面取n=4研究,假设在品酒师仅凭随机猜测来排序的条件下,a1,a2,a3,a4等可能地为1,2,3,4的各种排列,且各轮测试相互独立.(1)直接写出X的可能取值,并求X的分布列和数学期望;(2)若某品酒师在相继进行的三轮测试中,都有X≤2,则认为该品酒师有较好的酒味鉴别功能.求出现这种现象的概率,并据此解释该测试方法的合理性.【解析】(1)X的可能取值为0,2,4,6,8P(X=0)=1A44=124,。
超几何分布列(高二)

资料范本本资料为word版本,可以直接编辑和打印,感谢您的下载超几何分布列(高二)地点:__________________时间:__________________说明:本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容离散型随机变量的分布列(一)一.知识点归纳1.随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量随机变量常用希腊字母X,Y____,____等表示2. 离散型随机变量:对于随机变量可能取的值,可以按一定次序_______列出,这样的随机变量叫做离散型随机变量若ξ是随机变量,η=aξ+b,其中a、b是常数,则η也是随机变量.3. 离散型随机变量的分布列:4. 离散型随机变量分布列的两个性质:①…);②P1+P2+…=_____。
5.两点分布列:如果随机变量X的分布列为两点分布列,就称X服从_______________,两点分布又称_________分布,而称p=P(X=1)为________________.6.二项分布:ξ~B(n,p),并记=b(k;n,p).7.超几何分布:引例:在含有5件次品的100件产品中,任取3件,试求:取到次品数X的分布列;至少取到1件次品的概率。
一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品数,则事件{X=k}发生的概率为:P(X=k)=——————,k=0,1,2,…..且n≤N, M≤N, n, M, N∈N*. 称下面分布列为超几何分布列。
二.题型讲解例1 某厂生产电子元件,其产品的次品率为5%,现从一批产品中任意连续取出2件,其中次品数的概率分布是例2 在10件产品中有2件次品,连续抽3次,每次抽1件,求:(1)不放回抽样时,抽到次品数ξ的分布列;(2)放回抽样时,抽到次品数η的分布列.例3 一袋中装有5只球,编号为1,2,3,4,5,在袋中同时取3只,以ξ表示取出的三只球中的最小号码,写出随机变量ξ的分布列.例4 袋中有4个黑球,3个白球,2个红球,从中任取2个球,每取到一个黑球得0分,每取到一个白球得1分,每取到一个红球得2分,用表示分数,求的概率分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
离散型随机变量及其分布知识点一:离散型随机变量的相关概念;随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量随机变量常用希腊字母ξ、η等表示离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。
若ξ是随机变量,a b ηξ=+,其中a 、b 是常数,则η也是随机变量连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量离散型随机变量与连续型随机变量的区别与联系: 离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出离散型随机变量的分布列:设离散型随机变量ξ可能取的值为12i x x x ⋅⋅⋅⋅⋅⋅、ξ取每一个值()1,2,i x i =⋅⋅⋅的概率为()i i P x p ξ==,则称表为随机变量ξ的概率分布,简称ξ的分布列 知识点二:离散型随机变量分布列的两个性质;任何随机事件发生的概率都满足:0()1P A ≤≤,并且不可能事件的概率为0,必然事件的概率为1.由此你可以得出离散型随机变量的分布列都具有下面两个性质:(1) 01,2,i p i ≥=⋅⋅⋅,;12(2) 1P P ++=特别提醒:对于离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率的和即1()()()k k k P x P x P x ξξξ+≥==+=+知识点二:两点分布:若随机变量X 的分布列: 则称X 的分布列为两点分布列.特别提醒:(1)若随机变量X 的分布列为两点分布, 则称X 服从两点分布,而称P(X=1)为成功率.(2)两点分布又称为0-1分布或伯努利分布(3)两点分布列的应用十分广泛,如抽取的彩票是否中奖;买回的一件产品是否为正品;新生婴儿的性别;投篮是否命中等等;都可以用两点分布列来研究.知识点三:超几何分布:一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则(),0,1,,min{,},,,.k n k M N MnNC C P X k k m m M n n N M N C --===⋅⋅⋅=≤≤其中称超几何分布列.为超几何分布列,知识点四:离散型随机变量的二项分布;在一次随机试验中,某事件可能发生也可能不发生,在n 次独立重复试验中这个事件发生的次数ξ是一个随机变量.如果在一次试验中某事件发生的概率是p ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是kn k k n n q p C k P -==)(ξ,(0,1,2,3,k =…, p q -=1)ξ由于k k n k n C p q -恰好是二项式展开式:00111()n n n k k n kn n n n n n p q C p q C p q C p q C p q --+=+++++中的各项的值,所以称这样的随机变量ξ服从二项分布,记作(,)B n p ξ,其中n ,p 为参数,并记(,,)k k n kn C p q b k n p -=知识点五:离散型随机变量的几何分布:在独立重复试验中,某事件第一次发生时,所作试验的次数ξ也是一个正整数的离散型随机变量.“k ξ=”表示在第k 次独立重复试验时事件第一次发生.如果把k 次试验时事件A 发生记为k A 、事件A 不发生记为k A ,()k p A p =,(), (1)k p A q q p ==-,那么112311231()()()()()()()k k k k k P k P A A A A A P A P A P A P A P A q p ξ---====(0,1,2,k =…,p q -=1)于是得到随机变量ξ的概率分布如下:称这样的随机变量ξ服从几何分布,记作1(,),0,1,2,,1.k gk p q p k q p -===-其中 知识点六:求离散型随机变量分布列的步骤;(1)要确定随机变量ξ的可能取值有哪些.明确取每个值所表示的意义;(2)分清概率类型,计算ξ取得每一个值时的概率(取球、抽取产品等问题还要注意是放回抽样还是不放回抽样;(3)列表对应,给出分布列,并用分布列的性质验证. 几种常见的分布列的求法:(1)取球、投骰子、抽取产品等问题的概率分布,关键是概率的计算.所用方法主要有划归法、数形结合法、对应法等对于取球、抽取产品等问题,还要注意是放回抽样还是不放回抽样.(2)射击问题:若是一人连续射击,且限制在n 次射击中发生k 次,则往往与二项分布联系起来;若是首次命中所需射击的次数,则它服从几何分布,若是多人射击问题,一般利用相互独立事件同时发生的概率进行计算.(3)对于有些问题,它的随机变量的选取与所问问题的关系不是很清楚,此时要仔细审题,明确题中的含义,恰当地选取随机变量,构造模型,进行求解. 知识点六:期望数学期望:则称=ξE +11p x 22p x n n 数学期望的意义:数学期望离散型随机变量的一个特征数,它反映了离散型随机变量取值的平均水平。
平均数与均值:一般地,在有限取值离散型随机变量ξ的概率分布中,令=1p =2p …n p =,则有=1p =2p …1nn p ==,=ξE +1(x +2x …1)n n x +⨯,所以ξ的数学期望又称为平均数、均值。
期望的一个性质:若b a +=ξη,则b aE b a E +=+ξξ)(知识点七:方差;方差:对于离散型随机变量ξ,如果它所有可能取的值是1x ,2x ,…,n x ,…,且取这些值的概率分别是1p ,2p ,…,n p ,…,那么,ξD =121)(p E x ⋅-ξ+222)(p E x ⋅-ξ+…+n n p E x ⋅-2)(ξ+…称为随机变量ξ的均方差,简称为方差,式中的ξE 是随机变量ξ的期望. 标准差:ξD 的算术平方根ξD 叫做随机变量ξ的标准差,记作σξ 方差的性质:①ξξD a b a D 2)(=+;②22)(ξξξE E D -= . 方差的意义:(1)随机变量ξ的方差的定义与一组数据的方差的定义式是相同的;(2)随机变量ξ的方差、标准差也是随机变量ξ的特征数,它们都反映了随机变量取值的稳定与波动、集中与离散的程度;(3)标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛. 二项分布的期望与方差:若(),B n p ξ,则E np ξ= ,()1D np p ξ=-几何分布的期望和方差:若(),g k p 1k q p -=,其中0,1,2k =,…, p q -=1.则1E p ξ=,21p D pξ-=. 知识点八:正态分布;(1)频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.(2)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,就是进行了n 次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.(3)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.①()f x ≥0 (x R ∈);②由曲线()y f x =与x 轴围成面积为1. (5)解决总体分布估计问题的一般程序如下:①先确定分组的组数(最大数据与最小数据之差除以组距得组数); ②分别计算各组的频数及频率(频率=总数频数); ③画出频率分布直方图,并作出相应的估计.(6)条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率. (7)正态分布密度函数:简称正态曲线22()2,(),(,),((0))x x x μσμσϕμσσ--=∈-∞+∞>函数式中的实数、是参数,,()(),b x aX P a X b x d X μσϕ<≤=⎰随机变量满足:则称的分布为正态分布其中π是圆周率;e 是自然对数的底;x 是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为),(2σμN 。
即若()2,N ξμσ,则E ξμ=,2D ξσ=(8)正态分布),(2σμN 是由均值μ和标准差σ唯一决定的分布通过固定其中一个值,讨论均值与标准差对于正态曲线的影响 ,它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(),a b 内取值的概率等于该区间上总体密度曲线与x 轴、直线x a =、x b =所围成曲边梯形的面积.xyO对正态分布问题思考很长时间以来,几乎没见正态分布题目的身影,但2007年高考中,它却在全国Ⅱ卷及几个省市卷中突然亮相。
原本简简单单的题目却让众生无从下手,这不得不引起我们对这方面知识思考、重视。
在此略谈一下相关知识及有关题目的解题方法与技巧。
㈠知识点回顾:⑴、正态分布概念:若连续型随机变量ξ的概率密度函数为()()()2221,,2x f x e x μσπσ--=∈-∞+∞, 其中,σμ为常数,且0σ>,则称ξ服从正态分布,简记为ξ~()2,N μσ。
()f x 的图象称为正态曲线。
⑵、正态分布的期望与方差若ξ~()2,N μσ,则2,E D ξμξσ==⑶、正态曲线的性质:⑷、在标准正态分布表中相应于0x 的值()0x Φ是指总体取值小于0x 的概率。
即 ()()00x P x x Φ=<⑸两个重要公式:① ,②⑹、()2,N μσ与()0,1N 的关系:①若ξ~()2,Nμσ,则ξμησ-=~()0,1N ,有()()000x P x F x μξσ-⎛⎫<==Φ ⎪⎝⎭标准正态分布曲线)(0x Φ())()(1221x x x x P Φ-Φ=<<ξ())(100x x -Φ-=Φ1x 2x )(0x Φ)(10x -Φ-②若ξ~()2,Nμσ,则()2112x x P xx x μμσσ--⎛⎫⎛⎫<<=Φ-Φ ⎪ ⎪⎝⎭⎝⎭㈡07高考题再现:1、(07安徽卷,10)以()x Φ表示标准正态总体在区间(),x -∞内取值的概率,若随机变量ξ服从正态分布()2,N μσ,则概率()P ξμσ-<等于( )A.()()μσμσΦ+-Φ-B. ()()11Φ-Φ-C. 1μσ-⎛⎫Φ⎪⎝⎭D. ()2μσΦ+2、(07全国卷Ⅱ,14):在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>.若ξ在()0,1内取值的概率为0.4,则ξ在()0,2内-----------。