数学高考复习点拨:二项分布与超几何分布辨析
超几何分布和二项分布
超几何分布和二项分布超几何分布和二项分布是概率论中两种重要的离散型概率分布。
它们都在描述了离散型随机变量的分布规律,但在具体的描述和应用上有一定的区别。
本文将分别介绍超几何分布和二项分布的定义、特点、性质和应用,并对两者之间的关系和区别进行详细的比较分析。
一、超几何分布的定义、特点和性质超几何分布是描述了一种从有限个物件中抽出样本不放回地抽取成功次数的概率分布。
具体来说,超几何分布描述了在总体中有M个成功物件和N-M个失败物件时,从总体中抽取n个物件,其中成功物件的个数X的分布概率。
其概率质量函数为:P(X=k) = (M choose k) * (N-M choose n-k) / (N choose n),其中(M choose k)表示从M个物件中抽取k个物件的组合数。
超几何分布的特点有以下几点:1.超几何分布是离散型概率分布,其取值只能是非负整数。
2.超几何分布的期望值和方差分别为E(X) = n * M/N, Var(X) =n * M/N * (N-M)/N * (N-n)/(N-1)。
3.超几何分布的分布形状随着总体大小和成功物件的比例而改变,当总体很大时,超几何分布近似于二项分布。
超几何分布在实际应用中有着广泛的应用。
例如在质量抽样、抽样调查、生物统计学等领域,常常需要进行不放回地从总体中抽取物件的情况,而超几何分布恰好可以描述这类情况下随机变量的分布规律。
二、二项分布的定义、特点和性质二项分布是描述了n次独立重复的伯努利试验中成功次数的概率分布。
具体来说,二项分布描述了n次重复试验中成功的次数X的概率分布。
其概率质量函数为:P(X=k) = (n choose k) * p^k * (1-p)^(n-k),其中(n choose k)表示从n次试验中成功k次的组合数。
二项分布的特点有以下几点:1.二项分布是离散型概率分布,其取值只能是非负整数。
2.二项分布的期望值和方差分别为E(X) = np, Var(X) = np(1-p)。
二项分布与超几何分布的区别
(1)从中每次取出1个球然后放回,连续抽取三次,求取到红球 次数X的分布列和数学期望。 3k k k 解:由已知X~B(3,0.4), PX k C3 0.4 1 0.4 , (k 0,1,2,3)
X 所以,X的分布列为: p
0
1
2
3
27 54 36 8 E X 3 0.4 1.2 125 125 125 125
k n- k P(X=k)=Ck p (1 - p ) ,k=0,1,2,…,n. n
则称随机变量 X 服从参数为 n、p 的二项分布,记 作 X~B(n,p),并称 p 为成功概率.
2.超几何分布
一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其 中恰有 X 件次品,则事件{X=k}发生的概率为
E X 3 0.6 1.8
0
1
2
3
8 36 54 27 125 125 125 125
变式:(3)把(2)改为:若随机在样本不赞成高考改革的家长中 抽取3个,记这3个家长中是城镇户口的人数为Y,试求Y的分布列 及数学期望E(Y). k 3 k C15 C10 解:由已知Y服从超几何分布, PY k , (k 0,1,2,3) 3 C25 所以,Y的分布列为: Y
2018届南宁市摸底考试18题
摸底考试18题第(1)问
(2)用样本的频率估计概率,若随机在全省不赞成高考改革的家 长中抽取3个,记这3个家长中是城镇户口的人数为X,试求X的分 布列及数学期望E(X). 用样本的频率估计概率应怎样理解? 概率定义:对于给定的随机事件A,如果随着试验次数的增加,事 件A发生的频率稳定在某个常数上,把这个常数记作P(A),称为 事件A的概率。 在样本中,不赞成高考改革的家长中是城镇户口的频率为0.6,因 此,估计全省从不赞成高考改革的家长中随机抽取1个,他是城镇 户口的概率为0.6,抽取3个,即进行3次独立重复试验,所以, X~(n,p)
《二项分布与超几何分布》 讲义
《二项分布与超几何分布》讲义在概率论与数理统计中,二项分布和超几何分布是两个非常重要的离散型概率分布。
理解和掌握这两种分布对于解决实际问题以及深入研究概率理论都具有重要意义。
一、二项分布1、定义二项分布是 n 个独立的是/非试验中成功的次数的离散概率分布。
假设每次试验的成功概率为 p ,则在 n 次试验中,成功的次数 X 服从参数为 n 和 p 的二项分布,记为 X ~ B(n, p) 。
2、概率质量函数二项分布的概率质量函数为:P(X = k) = C(n, k) p^k (1 p)^(n k) ,其中 C(n, k) 表示从 n 个元素中选取 k 个元素的组合数。
3、期望和方差二项分布的期望为 E(X) = np ,方差为 Var(X) = np(1 p) 。
4、应用场景二项分布常用于以下场景:多次独立重复的试验,例如抛硬币多次,计算正面出现的次数。
产品的质量检验,判断一批产品中不合格品的数量。
二、超几何分布1、定义超几何分布描述了从有限 N 个物件(其中包含 M 个指定种类的物件)中抽出 n 个物件,成功抽出指定种类物件的次数 X 的概率分布。
2、概率质量函数超几何分布的概率质量函数为:P(X = k) = C(M, k) C(N M, n k) / C(N, n) 。
3、期望和方差超几何分布的期望为 E(X) = n M / N ,方差为 Var(X) = n M /N (1 M / N) (N n) /(N 1) 。
4、应用场景超几何分布常用于以下情况:不放回抽样问题,例如从一批产品中随机抽取若干个,计算其中合格品的数量。
对有限总体的抽样分析。
三、二项分布与超几何分布的区别1、试验类型二项分布是独立重复试验,每次试验的结果只有两种(成功或失败),且每次试验的成功概率相同。
超几何分布是非独立试验,每次抽样的结果会影响下一次抽样的概率。
2、总体大小二项分布的总体大小通常是无限的或者很大,而超几何分布的总体大小是有限的。
二项分布与超几何分布问题区别举例
二项分布与超几何分布问题区别举例文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)关于“二项分布”与“超几何分布”问题举例一.基本概念1.超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件X=k 发生的概率为:P(X=k)= nNk n MN k M C C C --⋅,k= 0,1,2,3,,m ;其中,m = minM,n,且n N , M N . n,M,N N 为超几何分布;如果一个变量X 的分布列为超几何分布列,则称随几变量X 服从超几何分布.其中,EX= n MN2.二项分布在n 次独立重复试验中,设事件A 发生的次数为X,在每次试验中,事件A 发生的概率为P,那么在n 次独立重复试中,事件A 恰好发生k 次的概率为:P(X=k)= C n kp k(1-p)n-k(k=0,1,2,3,,n),此时称随机变量X 服从二项分布.记作:X B(n,p),EX= np3.“二项分布”与“超几何分布”的联系与区别(1)“二项分布”所满足的条件每次试验中,事件发生的概率是相同的;是一种放回抽样.各次试验中的事件是相互独立的;每次试验只有两种结果,事件要么发生,要么不发生;随机变量是这n 次独立重复试验中事件发生的次数.(2)“超几何分布”的本质:在每次试验中某一事件发生的概率不相同,是不放回抽样,“当样本容量很大时,超几何分布近似于二项分布;(3)“二项分布”和“超几何分布”是两种不同的分布,但其期望是相等的.即:把一个分布看成是“二项分布”或“超几何分布”时,它们的期望是相同的.分布”和“二项分布”的这种“巧合”,使得“超几何分布”期望的计算大简化.共同点:每次试验只有两种可能的结果:成功或失败。
不同点:1、超几何分布是不放回抽取,二项分布是放回抽取;2、超几何分布需要知道总体的容量,二项分布不需要知道总体容量,但需要知道“成功率”;联系:当产品的总数很大时,超几何分布近似于二项分布。
《二项分布与超几何分布》知识讲解
二项分布与超几何分布★ 知 识 梳理 ★1.条件概率:称)()()|(A P AB P A B P =为在事件A 发生的条件下,事件B 发生的概率。
特别提醒: ①0≤P (B|A )≤1;②P(B ∪C|A)=P(B|A)+P(C|A)。
2. 相互独立事件:如果事件A (或B )是否发生对事件B (或A )发生的概率没有影响,这样的两个事件叫做相互独立事件。
特别提醒:①如果事件A 、B 是相互独立事件,那么,A 与_B 、_A 与B 、_A 与_B 都是相互独立事件②两个相互独立事件同时发生的概率,等于每个事件发生的概率的积。
我们把两个事件A 、B 同时发生记作A ·B ,则有P (A ·B )= P (A )·P (B )推广:如果事件A 1,A 2,…A n 相互独立,那么这n 个事件同时发生的概率,等于每个事件发生的概率的积。
即:P (A 1·A 2·…·A n )= P (A 1)·P (A 2)·…·P(A n )3.独立重复试验: 在同样的条件下,重复地、各次之间相互独立地进行的一种试验.在这种试验中,每一次试验只有两种结果,即某事件要么发生,要么不发生,并且任何一次试验中发生的概率都是一样的.4.如果在1次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率计算公式:P n (k )=C k n P k (1-P )n -k ,其中,k =0,1,2,…,n 5.离散型随机变量的二项分布:在一次随机试验中,某事件可能发生也可能不发生,在n 次独立重复试验中这个事件发生的次数ξ是一个随机变量.如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是k n k k n n q p C k P -==)(ξ,(k =0,1,2,…,n ,p q -=1).于是得到随机变量ξ 0 1… k … n P n n q p C 00 111-n n q p C … k n k k n q p C - …0q p C n n n 由于k n k k n q p C -恰好是二项展开式011100)(q p C q p C q p C q p C p q n n n k n k k n n n n n n +++++=+--ΛΛ中的各项的值,所以称这样的随机变量ξ服从二项分布,记作ξ~B (n ,p ),其中n ,p 为参数,并记k n k k n q p C -=b (k ;n ,p ).6. 两点分布:X 0 1P 1-p p特别提醒: 若随机变量X 的分布列为两点分布, 则称X 服从两点分布,而称P(X=1)为成功率.7. 超几何分布:一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则},,min{,,1,0,)(n M m m k C C C k X P n Nk n M N k M ====--Λ其中,N M N n ≤≤,。
高考数学总复习考点知识专题讲解13 二项分布与超几何分布
高考数学总复习考点知识专题讲解 专题13 二项分布与超几何分布知识点一 n 重伯努利试验及其特征 1.n 重伯努利试验的概念将一个伯努利试验独立地重复进行n 次所组成的随机试验称为n 重伯努利试验. 2.n 重伯努利试验的共同特征 (1)同一个伯努利试验重复做n 次. (2)各次试验的结果相互独立.思考在相同条件下,有放回地抽样试验是n 重伯努利试验吗? 答案 是.其满足n 重伯努利试验的共同特征. 知识点二 二项分布一般地,在n 重伯努利试验中,设每次试验中事件A 发生的概率为p (0<p <1),用X 表示事件A 发生的次数,则X 的分布列为P (X =k )=C k n p k (1-p )n -k,k =0,1,2,…,n . 称随机变量X 服从二项分布,记作X ~B (n ,p ). 知识点三 二项分布的均值与方差若X ~B (n ,p ),则E (X )=np ,D (X )=np (1-p ).【例1】(2023•大埔县月考)设随机变量~(,)B n p ξ,若() 2.4E ξ=,() 1.44D ξ=,则参数n ,p 的值分别为()A .12,0.4B .12,0.6C .6,0.4D .6,0.6【例2】(2023•永春县月考)设随机变量~(2,)B p ξ,~(3,)B p η,5(1)9P ξ=…,则(2)(P η=…)A .19B .727C .59D .89【例3】(2023•海门市期末)A 、B 两组各3人独立的破译某密码,A 组每个人译出该密码的概率均为1p ,B 组每个人译出该密码的概率均为2p ,记A 、B 两组中译出密码的人数分别为X 、Y ,且12112p p <<<,则()A .()()E X E Y <,()()D X D Y <B .()()E X E Y <,()()D X D Y >C .()()E X E Y >,()()D X D Y < D .()()E X E Y >,()()D X D Y >【例4】(2018•新课标Ⅲ)某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立.设X 为该群体的10位成员中使用移动支付的人数,() 2.4D X =,(4)(6)P X P X =<=,则(p =)A .0.7B .0.6C .0.4D .0.3【例5】(2023•多选•琼中县模拟)若袋子中有2个白球,3个黑球,现从袋子中有放回地随机取球4次,每次取一个球,取到白球记1分,取到黑球记0分,记4次取球的总分数为X ,则()A .3~(4,)5X B B .4(3)25P X ==C .X 的期望8()5E X =D .X 的方差24()25D X =【例6】(2023•武汉模拟)已知离散型随机变量X 服从二项分布(,)B n p ,其中*n N ∈,01p <<,记X 为奇数的概率为a ,X 为偶数的概率为b ,则下列说法中正确的有()A .1a b +=B .12p =时,a b =C .102p <<时,a 随着n 的增大而增大 D .112p <<时,a 随着n 的增大而减小知识点四 超几何分布1.定义:一般地,假设一批产品共有N 件,其中有M 件次品,从N 件产品中随机抽取n 件(不放回),用X 表示抽取的n 件产品中的次品数,则X 的分布列为P (X =k )=C k M C n -k N -MC n N,k =m ,m +1,m +2,…,r .其中n ,N ,M ∈N *,M ≤N ,n ≤N ,m =max{0,n -N +M },r =min{n ,M }. 如果随机变量X 的分布列具有上式的形式,那么称随机变量X 服从超几何分布. 2.均值:E (X )=nM N. 3.超几何分布是不放回抽样,且超几何分布与二项分布的均值相同. 二项分布与超几何分布的关系在n 次试验中,某事件A 发生的次数X 可能服从超几何分布或二项分布.l 联系:在不放回n 次试验中,如果总体数量N 很大,而试验次数n 很小,此时超几何分布可近似转化成二项分布区别:①当这n 次试验是n 重伯努利试验时(如有放回摸球),X 服从二项分布;②当n 次试验不是n 重伯努利试验时(如不放回摸球),X 服从超几何分布。
例谈超几何分布与二项分布的辨析
例谈超几何分布与二项分布的辨析
超几何分布、二项分布是高考常考的概率分布类型,这两种分布既有区别,又有关联,学生在初学时由于对两种分布的本质认识不清,被易造成混淆,进面在解题中出现错解.那么如何区分这两种分布? 笔者归纳出如下几个区分点,供读者参考.
辨析超几何分布与二项分布既有区别,又有联系.当总体的数量非常大,抽取样本数量很少时,可以近似地认为每次抽取时事件发生的概率不变,这样就可以看成每次抽取结果是相互独立的,进面将超几何分布近似地看作二项分布来处理.
另外,常见的概率分布类型还有两点分布,两点分布是一种特殊的二项分布,即只进行一次独立重复试验,只有发生与不发生两种结果,与其有关的问题相对于前两种要简单一些
总之,在处理与概率分布有关的间题时,我们要明确各种概率分布的本质,以及不同概率类型之间的异同,结合题目条件,准确识别概率类型.。
超几何分布和二项分布的联系和区别
超几何分布和二项分布的联系和区别如何计算恰好有1件次品的概率?这道题目可以用超几何分布和二项分布两种方法来解决。
首先,我们可以使用超几何分布,因为这是一个不放回抽样问题。
根据题目条件,我们可以得到M=0.02n,N=n,n=3,k=1.代入超几何分布的公式,可以得到P(X=1)=0.111.其次,我们也可以使用二项分布,因为这是一个独立重复试验问题。
根据题目条件,我们可以得到n=3,p=0.02,k=1.代入二项分布的公式,可以得到P(X=1)=0.057.因此,两种方法得到的结果略有不同,但可以看出它们之间是有联系的。
二项分布可以看作是超几何分布的一种近似,当样本容量n很大时,二项分布的计算结果可以逼近超几何分布的计算结果。
在进行放回或不放回的方式抽取时,当产品总数分别为500、5000和时,恰好抽到1件次品的概率分别是多少?根据此问题,你对超几何分布与二项分布的关系有何认识?解析:在不放回的方式抽取中,每次抽取时都是从这n件产品中抽取,从而抽到次品的概率都为。
次品数X服从二项分布,恰好抽到1件次品的概率为1P(X=1)=C3×(1-2%)^2×(2%)^1≈0.057.在不放回的方式抽取中,抽到的次品数X是随机变量,X服从超几何分布,X的分布与产品的总数n有关,所以需要分3种情况分别计算。
①当n=500时,产品的总数为500件,其中次品的件数为500×2%=10,合格品的件数为490.从500件产品中抽出3件,其中恰好抽到1件次品的概率为P(X=1)=12C10×C×490×489÷3500×499×498≈0..②当n=5000时,产品的总数为5000件,其中次品的件数为5000×2%=100,合格品的件数为4900.从5000件产品中抽出3件,其中恰好抽到1件次品的概率为P(X=1)=12C100×Cxxxxxxx×4900×4899÷×4999×4998≈0.xxxxxx x。
【数学】超几何分布与二项分布的区别与联系
二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。
在实际应用中,如何理解它们的关联性同时又能区分两个概率模型呢?本文笔者就此问题予以阐述。
一、超几何分布与二项分布的定义1.一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为P (X=k)=C M k C n-m n-kC Nn,k=0,1,2,…,m其中m=min {M,n},且n ≤N ,M ≤N ,n ,M ,N ∈N*。
其分布列为超几何分布列。
如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。
2.一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验。
在n 次独立重复试验中,设事件A 发生的次数X ,在每次试验事件A 发生的概率为p,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为P (X=k)=C n k P k(1-p )n-k,k=0,1,2,…,n 。
此时称随机变量X 服从二项分布,记作X ~B (n ,p),并称p 为成功概率。
二、超几何分布与二项分布的区别从它们的定义不难看出超几何分布研究的是试验后的结果(不研究试验中先后取的顺序),并且是无放回的抽取;二项分布研究的是既有研究先后发生的顺序又有试验结果,并且是有放回的抽取。
超几何分布是无放回的抽取,即每做一次试验,下一次再发生同一事件A 的概率已经发生了变化,即每次发生的概率都不相等。
实质上,超几何分布是古典概型的一种特例。
二项分布是有放回的抽取,每做一次试验,发生同一事件A 的概率都相同。
这就是二者之间的区别。
本文笔者举例说明:例1:在装有4个黑球6个白球的袋子中,任取2个,试求:(1)不放回地抽取,取到黑球数X 的分布列;(2)有放回地抽取,取到黑球数的分布列。
解:(1)是不放回地抽取,X 服从超几何分布。
从10个球中任取2球的结果数为C 102,从10个球中任取2个,其中恰有k 个黑球的结果数为C 4k C 62-k,那么从10个球中任取2个,其中恰有k 个黑球的概率为P (X=k )=C 4k C 62-kC 102,k=0,1,2。
二项分布、超几何分布与正态分布-高考数学复习
其中 n , N , M ∈N*, M ≤ N , n ≤ N , m =max{0, n - N +
M }, r =min{ n , M }.如果随机变量 X 的分布列具有上式的形式,
那么称随机变量 X 服从超几何分布.
目录
提醒
超几何分布中的随机变量为抽到的某类个体的个数.主要特征
为:①考察对象分两类;②已知各类对象的个数;③从中抽取若干
对于超几何分布 X ~ H ( n , M , N ),则 E ( X )= , D
−
( X )= ·(1- )· .
−1
3. 对于正态分布 X ~ N (μ,σ2), E ( X )=μ, D ( X )=σ2.
目录
1. 已知一盒子中有棋子10粒,其中7粒黑子,3粒白子.任意取出2粒,
好 n , p 和 k 的值,再准确利用公式 P ( X = k )= pk (1-
p ) n - k , k =0,1,2,…, n 求概率.
目录
考向2 二项分布
【例2】
设甲、乙两位同学上学期间,每天7:30之前到校的概率均
2
为 ,假定甲、乙两位同学到校情况互不影响,且任一同学每天到校
3
1
位,移动的方向为向上或向右,并且向上、向右移动的概率都是 .
2
5
则质点 P 移动五次后位于点(2,3)的概率是 16 .
解析:由于质点每次移动一个单位,移动的方向为向上或向右,移
动五次后位于点(2,3),所以质点 P 必须向右移动两次,向上移
1
1
1
5
3
3
3
2
5
动三次,故其概率为 5 ( ) ( ) = 5 ( ) = .
备战高考数学复习考点知识与题型讲解82---二项分布与超几何分布的辨别
备战高考数学复习考点知识与题型讲解第82讲二项分布与超几何分布的辨别二项分布与超几何分布是概率中最重要的两种数学模型,学生对这两种模型的定义不能很好地理解,一遇到“取”或“摸”的题型,就认为是超几何分布,不加分析,滥用公式,运算对象不明晰,事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别.分别指出下列随机变量服从什么分布,并用合适的符号表示:(1)某班级共有30名学生,其中有10名学生戴眼镜,随机从这个班级中抽取5人,设抽到的不戴眼镜的人数为X;(2)已知女性患色盲的概率为0.25%,任意抽取300名女性,设其中患色盲的人数为X;(3)学校要从3名男教师和4名女教师中随机选出3人去支教,设抽取的人中男教师的人数为X.【解】(1)依题意不戴眼镜的人数为X服从参数为30,5,20的超几何分布,即X~H(30,5,20).(2)依题意每次抽到患色盲的概率为0.25%,任意抽取300名女性,设其中患色盲的人数为X,则X服从二项分布,即X~B(300,0.25%).(3)抽取的人中男教师的人数为X服从参数为7,3,3的超几何分布,即X~H(7,3,3).(2022·重庆市巴蜀中学高三适应性考试)一机床生产了100个汽车零件,其中有40个一等品、50个合格品、10个次品,从中随机地抽出4个零件作为样本.用X 表示样本中一等品的个数.(1)若有放回地抽取,求X的分布列;(2)若不放回地抽取,用样本中一等品的比例去估计总体中一等品的比例.①求误差不超过0.2的X的值;②求误差不超过0.2的概率(结果不用计算,用式子表示即可).【解】 (1)对于有放回抽取,每次抽到一等品的概率为40100=25,且各次试验之间的结果是独立的,因此X ~B ⎝ ⎛⎭⎪⎫4,25,从而P ()X =0=⎝ ⎛⎭⎪⎫1-254=81625,P ()X =1=C 14·25·⎝ ⎛⎭⎪⎫1-253=216625,P (X =2)=C 24⎝ ⎛⎭⎪⎫252·⎝ ⎛⎭⎪⎫1-252=216625,P (X =3)=C 34(25)3·⎝ ⎛⎭⎪⎫1-25=96625,P (X =4)=⎝ ⎛⎭⎪⎫254=16625, 所以X 的分布列如下:X 0 1 2 3 4 P816252166252166259662516625(2)对于不放回抽取,各次试验结果不独立,X 服从超几何分布,样本中一等品的比例为X 4,而总体中一等品的比例为40100=0.4,由题意,①⎪⎪⎪⎪⎪⎪X 4-0.4≤0.2⇒0.8≤X ≤2.4⇒X =1或X =2; ②P ⎝ ⎛⎭⎪⎫⎪⎪⎪⎪⎪⎪X 4-0.4≤0.2=P (X =1)+P (X =2)=C 140C 360+C 240C 260C 4100.超几何分布的抽取是不放回抽取,各次抽取不独立,二项分布的抽取是有放回抽取,各次抽取相互独立.当超几何分布所对应的总体数量很大时可以近似地看作二项分布.。
二项分布和超几何分布,五分钟让你再也不迷糊!
二项分布和超几何分布,五分钟让你再也不迷糊!有一次被学生问到:老师您给我讲讲二项分布和超几何分布的区别吧。
我想,二项分布和超几何分布的区别大着呀,没道理会把它们弄混。
但是既然学生提出来了,就说明这样的疑惑的确存在,我们今天就来捋一捋,让疑者不疑,不疑者更明。
发生条件的不同二项分布:描述n次独立重复试验,而且该随机试验只有两种可能结果:发生或者不发生(也常说试验成功或失败)。
“独立”强调的是各次试验互相不干扰,“重复”强调的是每次试验中事件发生与否的概率保持不变。
超几何分布:描述由N个物件(其中有M个指定物件)中抽出n 个物件。
随机变量的不同二项分布的随机变量ξ是n次独立重复试验中试验成功的次数k。
超几何分布的随机变量ξ是抽出的n个物件中抽到指定种类的物件的个数m。
概率:在二项分布中,P(ξ=k)= C(n, k) * p^k * (1-p)^(n-k).在超几何分布中,P(ξ=m)= C(M, m) * C(N-M, n-m) / C(N,n).用一个“抽取合格品/次品”(换成双色小球也是一样)模型来对比上述两种分布:现有N件产品,其中M件合格品,N-M件次品。
1.从中抽取一件产品,为合格品的概率是?p=M/N2.每次抽取一件产品,抽完放回,抽n次(这里的n与N无关),共抽到k次合格品的概率是?C(n, k) * p^k * (1-p)^(n-k),其中p为第1问里的p.3.每次抽取一件产品,抽完不放回,抽n次(这里的不大于N),共抽到m次合格品的概率是?C(M, m) * C(N-M, n-m) / C(N,n)对于第3问中的情况,和1次性抽出n件产品,其中有m件合格品的概率是一样的。
能不能像第2问一样,用分步做乘法的方法来写概率呢?也可以的,不过因为不放回,产品总数在递减,每次抽到合格品的概率受之前抽到合格品还是次品的结果影响,所以不是独立重复实验了!为了帮助大家进一步看清楚,我举一个数目较小的具体例子来演示,3件产品,其中2件合格品,1件次品。
二项分布与超几何分布比较
低碳 非低碳 来自 B 小区,求这族4人中恰族t 2人是低碳比例二项分布与超几何分布是两个非常重要的、 应用广泛的概率模型,实际中的 许多问题都可以利用这两个概率模型来解决。
在实际应用中,理解并区分两个概 率模型是至关重要的。
下面举例进行对比辨析。
1•有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是 相同的,可以看成是独立重复试验,此种抽样是二项分布模型。
2. 不放回抽样:取出一个则总体中就少一个,因此每次取到某物的概率是不 同的,此种抽样为超几何分布模型。
因此,二项分布模型和超几何分布模型最主 要的区别在于是有放回抽样还是不放回抽样。
所以,在解有关二项分布和超几何 分布问题时,仔细阅读、辨析题目条件是非常重要的(特别注意:二项分布是在n 次独立重复试验的3个条件成立时应用的)。
超几何分布和二项分布的区别:(1)超几何分布需要知道总体的容量,而二项分布不需要;(2 )超几何分布是“不放回”抽取,而二项分布是“有放回”抽取(独立 重复)。
练习题:1袋中有8个白球、2个黑球,从中随机地连续抽取 3次,每次取1个球。
求:(1) 有放回抽样时,取到黑球的个数X 的分布列;(2) 不放回抽样时,取到黑球的个数Y 的分布列。
2.今天你低碳了吗?近来,国内网站流行一种名为“碳排放计算器”的软件,人 们可以扰此计算出自己每天的碳排放量。
例如:家居用电的碳排放量(千克)耗电度数X .785,汽车的碳排放量(千克)=油耗公升数X 0.785等。
某班同学利 用寒假在两个小区逐户进行了一次生活习惯进否符合低碳观念的调查。
若生活习 惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”。
这二族人数占各自 小区总人数的比例P 数据如下:(II ) A 小区经过大力宣传,每周非低碳族中有 20%的人加入到低碳族的行列。
如果2周后随机地从A 小区中任选25个人,记 表示25个人中低碳族人数,求 E .3. 在“自选模块”考试中,某试场的每位同学都选了一道数学题,第一小组 选《数学史与不等式选讲》的有1人,选《矩阵变换和坐标系与参数方程》的有5 人,第二小组选《数学史与不等式选讲》的有2 人,选《矩阵变换和坐标系与参数方程》的有 4 人,现从第一、第二两小组各任选2人分析得分情况.(I)求选出的4人均为选《矩阵变换和坐标系与参数方程》的概率;(U)设为选出的4个人中选《数学史与不等式选讲》的人数,求的分布列和数学期望.4. (2008 年四川延考)一条生产线上生产的产品按质量情况分为三类:A 类、B类、C类.检验员定时从该生产线上任取2件产品进行一次抽检,若发现其中含有 C 类产品或 2 件都是 B 类产品,就需要调整设备,否则不需要调整.已知该生产线上生产的每件产品为 A 类品,B类品和C类品的概率分别为0.9,0.05和0.05,且各件产品的质量情况互不影响.(1) 求在一次抽检后,设备不需要调整的概率;(2) 若检验员一天抽检3次,以软示一天中需要调整设备的次数,求E 的分布列.5. 甲、乙两人参加2010 年广州亚运会青年志愿者的选拔.打算采用现场答题的方式来进行,已知在备选的10道试题中,甲能答对其中的 6 题,乙能答对其中的8 题.规定每次考试都从备选题中随机抽出 3 题进行测试,至少答对 2 题才能入选.(1) 求甲答对试题数E的概率分布;(2) 求甲、乙两人至少有一人入选的概率.(2oi2*an一模)甲、乙两名同学在§次與语口语测试中的咸绩统计如留的莖叶團所凤(1) 现莫从中选派一人泰加英话口语竞赛,从两同学的平均成議和方差分析,派谨参加更合适I(2) 若解频率视为槪率,前学生甲在今后的三次英语口语孟赛成麵进行预测,i己这三次成攝中鬲干汕分的次数为◎求电的分布列及數学期璽昭”(?t:样本数据“吁―> 龈的万差s*=-y L(x1~x r+ix^_x T+"-+(x ~r T] F其中工表示稈本均值丿6.7.仙⑷BI川aw为了蘇檢魅频瓢漏麟忆从械甦帳机齡了眩同勒这附禅鼬媒用数[婷叶跚示⑴竝睢薛赭解査蛹賊虽(2)处睢薛中耿选俯師学柚析髓冊楠込册城關司学中糊低千釉冊U瓠求血般狮期。
二项分布与超几何分布的区别
超几何分布与二项分布[知识点]关键是判断超几何分布与二项分布判断一个随机变量是否服从超几何分布,关键是要看随机变量是否满足超几何分布的特征:一个总体(共有N 个)内含有两种不同的事物()A M 个、()B N M -个,任取n 个,其中恰有X 个A .符合该条件的即可断定是超几何分布,按照超几何分布的分布列()k n k M N MnNC C P X k C --==(0,1,2,,k m = )进行处理就可以了.二项分布必须同时满足以下两个条件:①在一次试验中试验结果只有A 与A 这两个,且事件A 发生的概率为p ,事件A 发生的概率为1p -;②试验可以独立重复地进行,即每次重复做一次试验,事件A 发生的概率都是同一常数p ,事件A 发生的概率为1p -.1、某厂生产的产品在出厂前都要做质量检测,每一件一等品都能通过检测,每一件二等品通过检测的概率为23.现有10件产品,其中6件是一等品,4件是二等品.(Ⅰ)随机选取1件产品,求能够通过检测的概率;(Ⅱ)随机选取3件产品,其中一等品的件数记为X ,求X 的分布列;(Ⅲ)随机选取3件产品,求这三件产品都不能通过检测的概率.【解析】(Ⅰ)设随机选取一件产品,能够通过检测的事件为A…………………………1分事件A 等于事件“选取一等品都通过检测或者是选取二等品通过检测”……………2分151332104106)(=⨯+=A p …………………………4分(Ⅱ)由题可知X 可能取值为0,1,2,3.30463101(0)30C C P X C ===,21463103(1)10C C P X C ===,12463101(2)2C C P X C ===,03463101(3)6C C P X C ===.………………8分故X 的分布列为……………9分X 0123P3011032161(Ⅲ)设随机选取3件产品都不能通过检测的事件为B……………10分事件B 等于事件“随机选取3件产品都是二等品且都不能通过检测”所以,3111()()303810P B =⋅=.……………13分2、第26届世界大学生夏季运动会将于2011年8月12日到23日在深圳举行,为了搞好接待工作,组委会在某学院招募了12名男志愿者和18名女志愿者。
高考培优微专题《超几何分布与二项分布》解析版
高考数学培优微专题《超几何分布与二项分布》【考点辨析】在高考概率题型中,二项分布和超几何分布是两个非常重要的概率模型,它们在解决实际问题中发挥着关键作用。
其中,二项分布描述的是固定次数的独立实验中,成功的次数的概率分布。
而超几何分布则描述的是不返回抽样问题,即从有限的总体中抽取一定数量的样本时,其中含有特定种类的数量的概率分布。
在解题过程中,正确地区分题目条件是否涉及到放回或不放回抽样是解决超几何分布和二项分布问题的关键。
掌握这两个分布的定义、性质和计算方法,对于提高学生的逻辑思维能力和解决复杂问题的能力具有重要意义。
【知识储备】(1)二项分布①背景:每次事件A p事件A1-p连续重复n次 事件A发生的次数X~B(n,p)事件A发生的次数Y~B(n,p)②分布列X01⋯k⋯n P C0n p0q n C1n p1q n-1⋯C k n p k q n-k⋯C n n p n q0③数字特征:E(X)=np,D(X)=np(1-p)(2)超几何分布①背景:一次某-类 M另一类 N-M搭配n个 某一类的个数X~H(n,N,M)另一类的个数Y~H(n,N,N-M)②分布列:X01⋯k⋯nP C0M C n-kN-MC n N C1M C n-1N-MC n N⋯C k M C n-kN-MC n N⋯C n M C0N-MC n N③数字特征:E(X)=n×MN,D(X)=n×MN×(1-n-1N-1)【例题讲解】类型一:有放回与无放回的区别1.一个袋子里10个大小相同的球,其中有黄球4个,白球6个(1)若从袋中随机摸出3个球作为样本,若有放回的摸球,求恰好摸到2个白球的概率;(2)若从袋中随机摸出3个球作为样本,若不放回的摸球,用X表示样本中白球的个数,求X的分布列和均值.【解析】【答案】解:(1)设恰好摸到2个白球为事件A,则P(A)=C23352⋅25=54125;(2)由题意可知,X的可能取值为0,1,2,3,由题意可知X服从超几何分布,则P(X=0)=C34C06C310=130,P(X=1)=C24C16C310=310,P(X=2)=C14C26C310=12,P(X=3)=C04C36C310=16,所以X的分布列为:X0 1 2 3 P130 3101216则E(X)=0×130+1×310+2×12+3×16=95.类型二:占比与概率的区别2.某地区拟建立一个艺术博物馆,采取竞标的方式从多家建筑公司选取一家建筑公司,经过层层筛选,甲、乙两家建筑公司进入最后的招标.现从建筑设计院聘请专家设计了一个招标方案:两家公司从6个招标问题中随机抽取3个问题,已知这6个招标问题中,甲公司可正确回答其中4道题目,而乙公司能正确回答每道题目的概率均为23,甲、乙两家公司对每题的回答都是相互独立,互不影响的.(I)求甲、乙两家公司共答对2道题目的概率;(II)设甲公司答对题数为随机变量X,求X的分布列、数学期望和方差;(III)请从期望和方差的角度分析,甲、乙两家哪家公司竞标成功的可能性更大?【解析】【答案】解:(I)设事件A“甲、乙两家公司共答对2道题”,由题意可知:所求概率P(A)=C14C22C36×C1323 11-232+C24C12C36×1-233=115.(II)设甲公司答对题数为X,则X的取值分别为1,2,3.P(X=1)=C14C22C36=15,P(X=2)=C24C12C36=35,P(X=3)=C34C02C36=15,则X的分布列为:X123P153515∴E(X)=1×15+2×35+3×15=2,D(X)=(1-2)2×15+(2-2)2×35+(3-2)2×15=25. (III)法一:设乙公司答对题数为Y,则Y取值分别为0,1,2,3. P(Y=0)=13 3=127,P(Y=1)=C13×23×13 2=29,P(Y=2)=C23×23 2×13=49,P(Y=3)=23 3=827,则Y的分布列为:Y0123P1272949827∴E(Y)=0×127+1×29+2×49+3×827=2.D (Y )=(0-2)2×127+(1-2)2×29+(2-2)2×49+(3-2)2×827=23.所以E (X )=E (Y ),D (X )<D (Y ),所以甲公司竞标成功的可能性更大.法二:由题知:Y ~B 3,23,∴E (Y )=3×23=2,D (Y )=3×23×13=23,所以E (X )=E (Y ),D (X )<D (Y ),所以甲公司竞标成功的可能性更大.类型三:样本与总体的区别3.某食品厂为了检查一条自动包装流水线的生产情况,随即抽取该流水线上40件产品作为样本算出他们的重量(单位:克)重量的分组区间为490,495 、495,500 、⋯、510,515 ,由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量;(2)在上述抽取的40件产品中任取2件,设X 为重量超过505克的产品数量,求X 的分布列及期望;(3)样本估计总体,从流水线上任取5件产品,设Y 为重量超过505克的产品数量,求Y 的期望、方差.【解析】【答案】解:(1)由频率分布直方图得重量超过505克的产品频率为:(0.05+0.01)×5=0.3,∴重量超过505克的产品数量为:0.3×40=12(件).(2)由题意X 的可能取值为0,1,2,P (X =0)=C 228C 240=63130,P (X =1)=C 128C 112C 240=56130=2865,P (X =2)=C 212C 240=11130,∴X 的分布列为:X 0 1 2 P63130286511130随机变量X 的数学期望为E (X )=0×63130+1×2865+2×11130=35;(3)从流水线上任取5件产品服从二项分布:Y 可能取值有0、1、2、3、4、5,超过505克的产品发生的概率为p =0.3,则Y ~B (5,0.3),Y 的期望E (Y )=5×0.3=1.5,方差D (Y )=5×0.3×0.7=1.05.类型四:一次与多次的区别4.学校游园活动有这样一个游戏项目:甲箱子里装有3个白球、2个黑球,乙箱子里装有1个白球、2个黑球,这些球除颜色外完全相同,每次游戏从这两个箱子里各随机摸出2个球,若摸出的白球不少于2个,则获奖.(每次游戏结束后将球放回原箱)(1)求在1次游戏中,①摸出3个白球的概率;②获奖的概率;(2)求在4次游戏中获奖次数X 的分布列及数学期望E (X ).【答案】【答案】(1)①15,②710;(2)分布列见解析,145.【解析】【解析】(1)设“在1次游戏中摸出i 个白球”为事件A i (i =0,1,2,3),①P (A 3)=C 23C 25·C 12C 23=15.②设“在1次游戏中获奖”为事件B ,则B =A 2∪A 3,又P (A 2)=C 23C 25·C 22C 23+C 13C 12C 25·C 12C 23=12,且A 2,A 3互斥,所以P (B )=P (A 2)+P (A 3)=12+15=710.(2)由题意可知X 的所有可能取值为0,1,2,3,4,由(1)P (B )=710,P (B )=1-P (B )=310,P (X =0)=P (B ) 4=310 4=8110000,P (X =1)=C 14P (B )P (B ) 3=4×710×310 3=1892500,P (X =2)=C 24P (B ) 2P (B ) 2=6×710 2×310 2=13235000P (X =3)=C 34P (B ) 3P (B )=4×710 3×310=10292500P (X =4)=P (B ) 4=710 4=240110000所以X 的分布列是X 01234P811000018925001323500010292500240110000显然X ~B 4,710 ,所以X 的数学期望E (X )=4×710=145.【解题策略】____________________________________________________________________________________________________________________________________________________________________________________________________________【教考衔接】1.现对某高校16名篮球运动员在多次训练比赛中的得分进行统计,将每位运动员的平均成绩所得数据用频率分布直方图表示如下.(如:落在区间[10,15)内的频率/组距为0.0125)规定分数在[10,20),[20,30),[30,40)上的运动员分别为三级篮球运动员、二级篮球运动员、一级篮球运动员,现从这批篮球运动员中利用分层抽样的方法选出16名运动员作为该高校的篮球运动员代表.(1)求a 的值和选出篮球运动员代表中一级运动员的人数;(2)若从篮球运动员代表中选出三人,求其中含有一级运动员人数X 的分布列;(3)若从该校篮球运动员中有放回地选三人,求其中含有一级运动员人数Y 的期望.【答案】【答案】(1)a =0.0250,4人;(2)答案见解析;(3)34.【解析】【解析】(1)由频率分布直方图知:(0.0625+0.0500+0.0375+a +2×0.0125)×5=1,∴a =0.0250.其中为一级运动员的概率为(0.0125+0.0375)×5=0.25,∴选出篮球运动员代表中一级运动员为0.25×16=4人.(2)由已知可得X 的可能取值分别为0,1,2,3,P (X =0)=C 312C 316=1128,P (X =1)=C 212⋅C 14C 316=3370,P (X =2)=C 112⋅C 24C 316=970,P (X =3)=C 34C 316=1140,∴X 的分布列为X 0123P112833709701140(3)由已知得Y ~B 3,14 ,∴E (Y )=np =3×14=34,∴含有一级运动员人数Y 的期望为34.2.甲、乙两名运动员进行羽毛球单打比赛,根据以往比赛胜负情况知道,每一局甲胜的概率为23,乙胜的概率为13.如果比赛采用“五局三胜”(即有一方先胜三局即获胜,比赛结束)规则,设比赛场次为随机变量X .(1)求乙胜的概率;(2)求随机变量X 的概率分布列及数学期望、方差;.【解析】【答案】解:(1)记“乙获胜”为事件A ,则P A =13 3+C 2313 2×23×13+C 2413 2×23 2×13,即P A =1781,所以乙获胜的概率1781;(2)由题意可知,随机变量X 可以取:3、4、5,所以P X =3 =23 3+13 3=927=13,P X =4 =C 2323 3×13×23+C 2313 2×23 ×13=1027,P X =5 =C 2423 3×13 2×23+C 2413 2×23 2×13=827所以X 的分布列为:X 345P131027827所以随机变量X 的数学期望:E X =3×13+4×1027+5×827=10727;(3)随机变量X 的方差:D X =E (X 2)-(E (X ))2=32×13+42×1027+52×827 -10727 2=44127-10727 2=458729. 3.食品安全问题越来越受到人们的重视.某超市在进某种蔬菜的货前,要求食品安检部门对每箱蔬菜进行三轮各项指标的综合检测,只有三轮检测都合格,该种蔬菜才能在该超市销售.已知每箱这种蔬菜第一轮检测不合格的概率为13,第二轮检测不合格的概率为14,第三轮检测不合格的概率为15,每轮检测只有合格与不合格两种情况,且各轮检测互不影响.(1)求每箱这种蔬菜能在该超市销售的概率;(2)若这种蔬菜能在该超市销售,则每箱可获利200元,若不能在该超市销售,则每箱亏损100元,现有3箱这种蔬菜,求这3箱蔬菜总收益X 的分布列和数学期望.【解析】【答案】解:(1)设每箱这种蔬菜能在该超市销售为事件A ,则P (A )=1-13 ×1-14 ×1-15 =25,即每箱这种蔬菜能在该超市销售的概率为25.(2)X 的所有可能取值为600,300,0,-300.因为P (X =600)=25 3=8125,P (X =300)=C 2325 2×35=36125,P (X =0)=C 13×25×35 2=54125,P (X =-300)=35 3=27125,所以X 的分布列为:X 6003000-300P8125361255412527125所以E (X )=600×8125+300×36125-300×27125=60. 4.体育课程的实施可以有效地促进学生身体的正常发育,提高身体的健康水平.某校对高一年男生进行1000米测试,经对随机抽取的100名学生的成绩数据处理后,得到如下频率分布直方图:(1)从这100名学生中,任意选取2人,求两人测试成绩都低于60分的概率;(2)从该校所有高一年男生中任意选取3人,记70分以上的人数为ξ,求ξ的分布列和期望、方差;【解析】(1)从这100名学生中,任意选取2人,求两人测试成绩都低于60分的概率;(2)从该校所有高一年男生中任意选取3人,记70分以上的人数为ξ,求ξ的分布列和期望、方差;解:(1)设两人测试成绩都低于60分为事件A ,低于60分频率为(0.002+0.001)×10=0.03,所以在100人中有3人低于60分,故P (A )=C 23C 2100=11650,(2)70分以上的频率为1-10×(0.001+0.002+0.017)=0.8,用样本估计总体即100个样本的频率视为高一年男生总体的概率服从二项分布ξ~B (3,0.8),P (ξ=0)=C 03(1-0.8)3=0.008,P (ξ=1)=C 13(1-0.8)2×0.8=0.096,P (ξ=2)=C 23(1-0.8)×0.82=0.384,P (ξ=3)=C 330.83=0.512,故分布列为:ξ0123P0.0080.0960.3840.512E (ξ)=3×0.8=2.4;D (ξ)=3×0.8×(1-0.8)=0.485.2020·浙江台州市·高二期中)2020年五一期间,银泰百货举办了一次有奖促销活动,消费每超过600元(含600元),均可抽奖一次,抽奖方案有两种,顾客只能选择其中的一种.方案一:从装有10个形状、大小完全相同的小球(其中红球2个,白球1个,黑球7个)的抽奖盒中,一次性摸出3个球其中奖规则为:若摸到2个红球和1个白球,享受免单优惠;若摸出2个红球和1个黑球则打5折;若摸出1个白球2个黑球,则打7折;其余情况不打折.方案二:从装有10个形状、大小完全相同的小球(其中红球3个,黑球7个)的抽奖盒中,有放回每次摸取1球,连摸3次,每摸到1次红球,立减200元.(1)若两个顾客均分别消费了600元,且均选择抽奖方案一,试求两位顾客均享受免单优惠的概率;(2)若某顾客消费恰好满1000元,试从概率角度比较该顾客选择哪一种抽奖方案更合算?【答案】【答案】(1)114400;(2)选择第二种方案更合算.【解析】【解析】(1)选择方案一若享受到免单优惠,则需要摸出三个红球,设顾客享受到免单优惠为事件A,则P A=C22C11C310=1120,所以两位顾客均享受到免单的概率为P=P A⋅P A=1 14400;(2)若选择方案一,设付款金额为X元,则X可能的取值为0、500、700、1000.P X=0=C22C11C310=1120,P X=500=C22C17C310=7120,P X=700=C11C27C310=740,P X=1000=1-1120-7120-740=91120.故X的分布列为,X05007001000P1120712074091120所以E X=0×1120+500×7120+700×740+1000×91120=910(元).若选择方案二,设摸到红球的个数为Y,付款金额为Z,则Z=1000-200Y,由已知可得Y~B3,3 10,故E Y =3×310=910,所以E Z=E1000-200Y=1000-200E Y=820(元).因为E X>E Z,所以该顾客选择第二种抽奖方案更合算.6.某种水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:等级标准果优质果精品果礼品果个数10304020(1)将频率视为概率,从这100个水果样本中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率.(结果用分数表示)(2)用水果样本中的样本估计总体,果园老板提出两种购销方案给采购商参考.方案1:不分类卖出,单价为20元/kg.方案2:分类卖出,分类后的水果售价如下:等级标准果优质果精品果礼品果售价(元/kg)16182224从采购商的角度考虑,应该采用哪种方案?(3)用分层抽样的方法从这100个水果样本中抽取10个,再从抽取的10个水果中随机抽取3个,X表示抽取的是精品果的数量,求X的分布列及数学期望.【解析】【答案】解:(1)设从100个水果中随机抽取一个,抽到礼品果的事件为A,则P(A)=20100=15,现有放回地随机抽取4个,设抽到礼品果的个数为Y,则Y~B4,1 5,∴恰好抽到2个礼品果的概率为:P(Y=2)=C241-15215 2=96625;(2)设方案2的单价为ξ,则单价的期望值为:E(ξ)=16×110+18×310+22×410+24×210=20.6,∵E(ξ)>20,∴从采购商的角度考虑,应该采用第一种方案;(3)用分层抽样的方法从100个水果中抽取10个,则其中精品果4个,非精品果6个,现从中抽取3个,则精品果的数量X所有可能的取值为0,1,2,3,则P(X=0)=C36C310=16;P(X=1)=C26C14C310=12;P(X=2)=C16C24C310=310;P(X=3)=C34C310=130,∴X的分布列为:X0123P1612310130∴E(X)=0×16+1×12+2×310+3×130=65.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二项分布与超几何分布辨析二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.例 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求: (1)有放回抽样时,取到黑球的个数X的分布列; (2)不放回抽样时,取到黑球的个数Y的分布列. 解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均为,3次取球可以看成3次独立重复试验,则1~35X B ⎛⎫⎪⎝⎭,.3031464(0)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭∴;12131448(1)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭; 21231412(2)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭;3033141(3)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭. 因此,X 的分布列为2.不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有:03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101(2)15C C P Y C ===.因此,Y 的分布列为辨析:通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样. 超几何分布和二项分布都是离散型分布,超几何分布和二项分布的区别: 超几何分布需要知道总体的容量,而二项分布不需要; 超几何分布是不放回抽取,而二项分布是放回抽取(独立重复) 当总体的容量非常大时,超几何分布近似于二项分布........二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。
在实际应用中,理解并区分两个概率模型是至关重要的。
下面举例进行对比辨析。
1.有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型。
2.不放回抽样:取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型。
因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样。
所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的(特别注意:二项分布是在n次独立重复试验的3个条件成立时应用的)。
超几何分布和二项分布的区别:(1)超几何分布需要知道总体的容量,而二项分布不需要;(2)超几何分布是“不放回”抽取,而二项分布是“有放回”抽取(独立重复)。
练习题:1. 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球。
求:(1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列。
2. (2008年四川延考)一条生产线上生产的产品按质量情况分为三类:A类、B类、C类.检验员定时从该生产线上任取2件产品进行一次抽检,若发现其中含有C类产品或2件都是B 类产品,就需要调整设备,否则不需要调整.已知该生产线上生产的每件产品为A类品,B 类品和C类品的概率分别为0.9,0.05和0.05,且各件产品的质量情况互不影响.(1)求在一次抽检后,设备不需要调整的概率;(2)若检验员一天抽检3次,以ξ表示一天中需要调整设备的次数,求ξ的分布列.3. 今天你低碳了吗?近来,国内网站流行一种名为“碳排放计算器”的软件,人们可以扰此计算出自己每天的碳排放量。
例如:家居用电的碳排放量(千克)=耗电度数×.785,汽车的碳排放量(千克)=油耗公升数×0.785等。
某班同学利用寒假在两个小区逐户进行了一次生活习惯进否符合低碳观念的调查。
若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”。
这二族人数占各自小区总人数的比例P 数据如下:(I )如果甲、乙来自A 小区,丙、丁来自B 小区,求这4人中恰有2人是低碳族的概率; (II )A 小区经过大力宣传,每周非低碳族中有20%的人加入到低碳族的行列。
如果2周后随机地从A 小区中任选25个人,记ξ表示25个人中低碳族人数,求.ξE4. 在“自选模块”考试中,某试场的每位同学都选了一道数学题,第一小组选《数学史与不等式选讲》的有1人,选《矩阵变换和坐标系与参数方程》的有5人,第二小组选《数学史与不等式选讲》的有2人,选《矩阵变换和坐标系与参数方程》的有4人,现从第一、第二两小组各任选2人分析得分情况.(Ⅰ)求选出的4 人均为选《矩阵变换和坐标系与参数方程》的概率;(Ⅱ)设ξ为选出的4个人中选《数学史与不等式选讲》的人数,求ξ的分布列和数学期望.5.甲、乙两人参加2010年广州亚运会青年志愿者的选拔.打算采用现场答题的方式来进行,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才能入选.(1)求甲答对试题数ξ的概率分布;(2)求甲、乙两人至少有一人入选的概率.正态分布和线性回归高考要求1.了解正态分布的意义及主要性质2.了解线性回归的方法和简单应用知识点归纳1.正态分布密度函数:22()2()2xf x eμσπσ--=,(σ>0,-∞<x<∞)其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为),(2σμN2.正态分布),(2σμN)是由均值μ和标准差σ唯一决定的分布例1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.(1)2221)(xexf-=π,(-∞<x<+∞)(2)2(1)8()22xf x eπ--=,(-∞<x<+∞)解:(1)0,1 (2)1,23.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量ξ~N(μ,σ2),根据定义有:μ=Eξ,σ=Dξ。
正态曲线具有以下性质:(1)曲线在x轴的上方,与x轴不相交。
(2)曲线关于直线x =μ对称。
(3)曲线在x =μ时位于最高点。
(4)当x <μ时,曲线上升;当x >μ时,曲线下降。
并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。
(5)当μ一定时,曲线的形状由σ确定。
σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是2221)(x ex f -=π,(-∞<x <+∞)其相应的曲线称为标准正态曲线标准正态总体N (0,1)在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题 5.标准正态总体的概率问题:对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ,其中00>x ,图中阴影部分的面积表示为概率0()P x x < 只要有标准正态分布表即可查表解决.从图中不难发现:当00<x 时,)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)=0.5例2 设),(~2σμN X ,且总体密度曲线的函数表达式为:412221)(+--=x x ex f π,x ∈R 。
(1)求μ,σ;(2)求)2|1(|<-x P 的值。
分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。
利用一般正态总体),(2σμN 与标准正态总体N (0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。
解:(1)由于222)2(2)1(41222121)(--+--⋅==x x x eex f ππ,根据一般正态分布的函数表达形式,可知μ=1,2=σ,故X ~N (1,2)。
(2))2121()2|1(|+<<-=<-xP x P(1(1(1)(1)2(1)120.84131F F =-=Φ-Φ=Φ-Φ-=Φ-=⨯- 6826.0=。
点评:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。
通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。
9.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.10.回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析 对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。
两个变量具有相关关系是回归分析的前提。
(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
11.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度粗略地看,散点分布具有一定的规律12. 回归直线 设所求的直线方程为,^a bx y +=,其中a 、b 是待定系数.1122211()()()n ni i i i i i n n i i i i x x y y x y nxy b x x x nx a y bx====⎧---⎪⎪==⎨--⎪⎪=-⎩∑∑∑∑, ∑==n i i x n x 11,∑==ni i y n y 11 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 13.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y 与x 的一组观测值,把∑∑∑===----=ni ni i ini i iy y x xy y x xr 11221)()())((=∑∑∑===---n i n i i i ni ii y n y x n x yx n yx 1122221))((叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.14.相关系数的性质: r ≤1,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.一般的,当r ≥ 0.75 时,就可以判断其具有很强的相关性,这时求线性回归方程才有意义。