常用离散型分布
2.3几种重要的离散型分布
C
n N
.
规范性: k
pk
k
C C k nk M NM
C
n N
k
C C k nk M NM
C
n N
C
n N
C
n N
1.
例2.13 N件产品,含M件是次品,随机地从这N
件产品中抽取n件产品,求恰有k 件次品的概率。
15
注:我们用符号(n︱c )表示:随机抽取了n件
产品,其中的次品数≤c的方案。
9
例2.10 某城市每天发生火灾的次数 X ~ P 1 ,
求该城市一天内发生3次或3次以上火灾的概率.
2
解 P X 3 1 P X 3 1 P X k k0
对立事件公式 1 2 1k e1 1 0.920 0.08.
k0 k !
查泊松分布 表(附表1)
10
泊松分布有一个非常实用的特性——二项分
10 1k e1
k3 k !
0.0803.
二项分布的泊松 近似
查泊松分布 表(附表1)
它与例2.9的结果相比较,近似效果是良好的.
如果p较大,那么二项分布不宜转化泊松 分布,该如何办的问题将在§5.3中回答.
13
例2.12 某出租汽车公司共有出租汽车500辆, 设每天每辆出租汽车出现故障的概率为0.01,试求 一天内出现故障的出租汽车不超过10辆的概率.
布的泊松近似.具体地讲,设 X ~ Bn, p , Y ~ P , 其中 n 较大,p 很小,而 np,
如果要计算
PX
k
C
k n
pk
1
p nk ,
那么可近似计算 P Y k k e . 即
k!
概率论第二章知识点
第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x pp ====-<<则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =两点分布的方差:()(1)D X p p =-(2)二项分布: 若一个随机变量X 的概率分布由式{}(1),0,1,...,.k k n k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,.k kn k n P x k C p p k n -==-=二项分布的期望:()E X np =二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k e k k λλλ-==>=则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k e k k λλλ-==>=泊松分布的期望:()E X λ=泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt -∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布: (1)均匀分布:若连续型随机变量X 的概率密度为则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度: 均匀分布的期望:()2a bE X +=均匀分布的方差:2()()12b a D X -=(2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩则称X 服从参数为λ的指数分布,记为 X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a ab x f ⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a ab x f指数分布的期望:1()E X λ=指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X 的概率密度为22()21()x f x ex μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()21()x f x ex μσ--=-∞<<+∞正态分布的期望:()E X μ=正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==2222()()x t xx ex e dt ϕφ---∞=⎰标准正态分布表的使用: (1)0()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数:设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
4几种重要的离散型分布
以(255)为概率分布的随机变量通常称为服从超几何分布 超几何分布的期望和方差
N1 EX n N N1 N2 N n D( X ) n N N N 1
(258)
(259)
五、泊松分布
泊松分布(Poisson) 如果一个随机变量X的概率分布为
k! 其中0为参数 则称X服从参数为的泊松分布 记作X~P()
例219 设X服从几何分布 则对任何两个正整数m n 有 P{Xmn|Xm}P{Xn} (254) 证明 由 P{X m n | X m}
P{X m} q
k 1 m k m1
P{X m n} 据(250)知 P{X m}
j 1
n个点上的均匀分布的期望和方差
1 x def x EX i n i 1 n DX 1 (xi x)2 n i 1
n
(243)
(244)
说明 在古典概型中 试验共有 n 个不同的可能结果 且每个结 果出现的可能性相同 设{1 2 n ) 则P{i} 1 (i1 2, n n). 如果随机变量 X 是上的一一对应的函数 那么 X 便服 从均匀分布
p q q j 1 p qm
同理 有 于是得
P{Xmn}qmn P{Xn}qn
qmn n P{X m n| X m} m q P{X n} q
说明 式(254)通常称为几何分布的无记忆性 意指几何分布对 过去的m次失败的信息在后面的计算中被遗忘了
三、几何分布
几何分布 如果随机变量X的概率分布为 P{Xk}q k1p k1 2 (2.50) 其中q1p 则称随机变量X服从参数为p的几何分布 记为 X~g(k p)
数据的基本分布类型
数据的基本分布类型数据的基本分布类型是统计学中常用的概念,用于描述数据的分布特征。
根据数据的性质和分布情况,可以将数据的基本分布类型分为离散型和连续型两大类。
一、离散型分布离散型分布是指数据取值有限且可数的情况。
在离散型分布中,每个数据点都是独立的,不存在连续的取值范围。
下面我们将介绍几种常见的离散型分布。
1. 二项分布二项分布是一种离散型分布,它描述了在n次独立重复实验中成功的次数的概率分布。
例如,抛硬币的结果可以看作是一次二项分布实验,成功表示正面朝上,失败表示反面朝上。
二项分布的概率质量函数可以用来计算在n次实验中成功k次的概率。
2. 泊松分布泊松分布是一种离散型分布,它描述了在一个固定时间段内,某事件发生的次数的概率分布。
泊松分布常用于描述稀有事件的发生情况,例如单位时间内电话呼叫的次数、单位面积内的交通事故次数等。
泊松分布的概率质量函数可以用来计算在给定时间段内事件发生k次的概率。
3. 几何分布几何分布是一种离散型分布,它描述了在一系列独立重复实验中,首次成功所需的实验次数的概率分布。
例如,抛硬币直到正面朝上为止的次数可以看作是一次几何分布实验。
几何分布的概率质量函数可以用来计算在第k次实验中首次成功的概率。
二、连续型分布连续型分布是指数据可以取任意实数值的情况。
在连续型分布中,数据点之间存在无穷多个取值可能,可以形成连续的取值范围。
下面我们将介绍几种常见的连续型分布。
1. 正态分布正态分布是一种连续型分布,也称为高斯分布。
正态分布是自然界中许多现象的分布模型,例如人的身高、智力水平等。
正态分布的概率密度函数呈钟形曲线,均值和标准差决定了分布的位置和形状。
2. 均匀分布均匀分布是一种连续型分布,它的概率密度函数在一个区间上是常数。
均匀分布常用于描述随机变量在一定范围内等可能地取值的情况,例如掷骰子的结果。
均匀分布的概率密度函数可以用来计算在给定区间内随机变量取值的概率。
3. 指数分布指数分布是一种连续型分布,它描述了事件发生的时间间隔的概率分布。
常见离散型分布
刘妍丽主讲
一、单点分布(退化分布)
分布列 P(X=a)=1 期望 EX=a 方差 VarX=0
一次实验中事件A发生的次数X ~ b(1, p)
二、两点分布(0-1分布)EX p VarX pq
分布列 X P
0
1
1-p
p
P( X k) C1k p k (1 p)1k k 0,1
EX
r
k
C
k M
C nk N M
k 0
C
n N
r
M k 1 (n1)(k 1) k k C C M 1 ( N 1)(M 1)
k 1
N n
C n1 N 1
nM N
~ h(n 1, N 1, M 1)
VarX n M N M N n N N N 1
EX 2 VarX (EX )2
•超几何分布的近似分布
5、二项分布的近似分布 图2.4.1
X ~ P() np
n充分大,p很小 泊松定理
X ~ N (, 2 ) np 2 npq np 5 nq 5 极限定理
例2.4.1 例2.4.2 例2.4.3
四、泊松分布 X ~ P() EX VarX
分布列 正则性
P(X k) k e
X ~ h(n, N, M ) X ~ b(n, p)
p M n N N
EX 2
r
k2
C
k M
C
nk N M
r
(k(k
1)
k)
C
k M
C nk N M
r
(k(k
1))
M k
(M 1) (k 1)
C C k 2 (n2)(k 2) M 2 (N 2)(M 2)
概率分布的种类与性质
概率分布的种类与性质概率分布是概率论中的重要概念,用于描述随机变量的取值与其对应的概率。
不同的随机变量具有不同的概率分布,而概率分布又可以分为多种种类。
本文将介绍常见的概率分布种类及其性质。
一、离散型概率分布离散型概率分布是指随机变量取有限个或可数个值的概率分布。
常见的离散型概率分布有以下几种:1. 伯努利分布(Bernoulli Distribution)伯努利分布是最简单的离散型概率分布,它描述了只有两个可能结果的随机试验,如抛硬币的结果(正面或反面)。
伯努利分布的概率质量函数为:P(X=k) = p^k * (1-p)^(1-k),其中k=0或1,p为成功的概率。
2. 二项分布(Binomial Distribution)二项分布是一种重要的离散型概率分布,它描述了n次独立重复的伯努利试验中成功次数的概率分布。
二项分布的概率质量函数为: P(X=k) = C(n,k) * p^k * (1-p)^(n-k),其中k=0,1,...,n,C(n,k)为组合数,p为成功的概率。
3. 泊松分布(Poisson Distribution)泊松分布是一种用于描述单位时间或单位空间内随机事件发生次数的离散型概率分布。
泊松分布的概率质量函数为:P(X=k) = (λ^k * e^(-λ)) / k!,其中k=0,1,2,...,λ为平均发生率。
二、连续型概率分布连续型概率分布是指随机变量取值为连续区间内的概率分布。
常见的连续型概率分布有以下几种:1. 均匀分布(Uniform Distribution)均匀分布是一种简单的连续型概率分布,它在给定区间内的取值概率相等。
均匀分布的概率密度函数为:f(x) = 1 / (b-a),其中a为区间下界,b为区间上界。
2. 正态分布(Normal Distribution)正态分布是一种重要的连续型概率分布,也被称为高斯分布。
正态分布具有钟形曲线,对称分布于均值周围。
第2节 常用离散型分布
两点分布
如果 X 只有两个可能取值点,则称X服从两点分布.
例1 袋中共有N个球, 其中 N1个白球, N2个黑球. 从 中随机地取 n 个球, 以X表示取到的白球数. 求(1)有放 回时, X的概率分布;和(2)无放回时, X的概率分布.
通常, 将上述分布称为参数为 p 的几何分布.
推广在伯努利概型中令 X 表示直到事件 A 第r次发 生为止所行进的试验次数, 则 X 的概率分布为
P{ X
k}
Ckr
1 1
pr
(1
p)kr ,
k
r,r
1,
推广后的这一分布称为参数为 r 和 p 的负二项分布.
几何分布的无记忆性 引例 一个家庭已经连着生了3个女孩,求下一个
二、离散型随机变量及其概率分布
1. 离散型随机变量: 分布函数i }被称为离散型随机变量
X的概率分布, 如果它满足(1) pi 0, (2)
i 1
pi
1.
记
作 X ~ { pi }.
3. 概率分布与分布函数的等价性:
(1)设 X ~ { pi }, 则F ( x) p ; i:xi x i
k0
3 k0
2k k!
e 2
0.857124
综上,这 20000人中发生过敏反应的人数不超过 3
的概率约为85.7%.
第十次作业 (3.25)
必做题 练习2-3). 1. 3. (1)(2)(3). 8. 选做题 练习2-3). 5. (只求分布列). 补充题.
补充题 甲乙两棋手约定: 进行 5 盘比赛, 以赢的盘 数较多者胜. 假设在每盘中甲赢的概率为0.6,乙赢的概 率为 0.4, 而且各盘比赛相互独立, 求甲胜和乙胜的概 率各为多少? 并说明[5盘3胜制]与[3盘2胜制],哪种对甲 有利.
23 常用的离散型分布.
Poisson分布的数字特征
期望: 方差:
EX
DX
Poisson分布的应用
Poisson分布应用极为广泛. 如银行收到的 存款次数;保险公司收到的索赔单数;放射 粒子的数目(著名的Rutherford等人利用云 雾实验室观察镭说发射出的 粒子数目试 验);一定时间内发生的灾害数目;……
故每箱至少应装105个产品,才能符合要求.
例 设有同类型设备90台,每台工作相互独立, 每台设备发生故障的概率都是 0.01. 在通常 情况下,一台设备发生故障可由一个人独立 维修,每人同时也只能维修一台设备.
(1) 问至少要配备多少维修工人,才能保证当设 备发生故障时不能及时维修的概率小于0.01?
因为{X k}表示前 k 1中 A 恰好发生了r 1 次, 而第 k 次 A 发生,故
P{X
k}
C r1 k 1
p r 1q
k
r
p
C r1 k 1
p r q k r
,
k
r, r 1,,
亦可记为 P{X k} f (k; r, p).
一般地,若随机变量 X 的概率分布由上式给
例 某厂产品不合格率为0.03, 现将产品 装箱, 若要以不小于 90%的概率保证每箱 中至少有 100 个合格品, 则每箱至少应装 多少个产品?
解 设每箱至少应装100 + n 个, 每箱的不 合格品个数为X , 则X ~ B ( 100 + n , 0.03 )
n
由题意 P(X n) P100n (k) 0.9 k 0
解 (1) k = [( n + 1)p ] = [( 5000+ 1)0.001] =5
常见的离散型随机变量的分布
30台设备发生故障不能及时维修为事件 Ai
则
P( Ai )
P(Y
2)
k 2
e0.3 0.3k k!
0.0369 i 1,2,3
三个人各独立负责30台设备发生故障不能及时
维修为事件 A1 A2 A3 3
PA1 A2 A3 1 P( Ai )
i1
1 (1 0.0369)3 0.1067 0.013459
例1 独立射击5000次,每次的命中率为0.001, 求 (1) 最可能命中次数及相应的概率;
(2) 命中次数不少于2 次的概率.
解 (1) k = [( n + 1)p ] = [( 5000+ 1)0.001] = 5
P5000(5) C55000(0.001)5 (0.999)4995 0.1756
0 1 2 34 5 6 7 8
.039 .156 .273 .273 .179 .068 .017 .0024 .0000
P 0.273•
由图表可见 , 当 k 2或3 时, 分布取得最大值
P8(2) P8(3) 0.273 此时的 k 称为最可能成功次数
•••••••••
012345678
(1) 问至少要配备多少维修工人,才能保证当设 备发生故障时不能及时维修的概率小于0.01?
(2) 问3个人共同负责90台还是3个人各自独立负 责30台设备发生故障不能及时维修的概率低?
解 (1) 设 需要配备 N 个维修工人,设 X 为90 台
设备中发生故障的台数,则 X ~ B( 90, 0.01)
90
P( X N ) C9k0 (0.01)k (0.99)Nk
k N 1
令 90 0.01 0.9
离散型的常见的分布
离散型的常见的分布0-1分布x只能取1或0,对应概率为p和1-pP(X=k)=p k(1−p)1−k有两种实验结果,实验只做⼀次这是⼆项分布的⼀个特例⼏何分布(Geometric distribution)P(A)=p,第k次⾸次发⽣,前k-1次未发⽣P(X=k)=(1−p)k−1p记作X~G(p)⼆项分布(Binomial Distribution)P(A)=p,做了n次实验,发⽣了k次P(X=k)=C k n p k(1−p)n−k记作X~B(p)最可能值1)(n+1)p不为整数,则将(n+1)p取整后达最⼤值 2)(n+1)p是整数,(n+1)p、(n+1)p-1是最⼤值泊松分布(Poisson distribution)P(X=k)=(λk∗e−λ)/k!记作X~P(λ)⽽计算泊松分布的值是⼀件很痛苦的事情,主要解决⽅法是查表使⽤泊松分布来近似⼆项分布要求:n⽐较⼤,p较⼩,np适中(n>=100,np<=10)令λ=np,查表超⼏何分布(Hypergeometric Distribution)超⼏何分布是统计学上⼀种离散概率分布。
它描述了从有限N个物件(其中包含M个指定种类的物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回)。
P(X=k)=C k M C n−k/C M NN−M记作X~H(n,M,N)超⼏何分布主要⽤来描述不放回抽样实验,当n相对于N很⼩时,P=M/N改变⼩,可以将不放回实验近似为放回实验故可以⽤⼆项分布进⾏近似(因为超⼏何分布计算困难)P(X=k)=C k M C n−k/C M N≈C k n p k(1−p)n−kN−M⼀些题的思路:超⼏何分布近似⼆项分布,⼆项分布近似泊松分布(λ=np),查表Processing math: 100%。
3种常用离散型分布的公式
3种常用离散型分布的公式嘿,咱们来聊聊 3 种常用的离散型分布公式。
先来说说二项分布。
这二项分布啊,就好比你扔硬币。
假设你扔 10 次硬币,每次都只有正面和反面两种可能,而且每次扔硬币正面朝上的概率都一样。
那在这10 次中,出现正面的次数就可能符合二项分布。
我记得之前教过一个学生,他特别纠结这个二项分布的公式。
我就跟他说:“你就想象成你去抽奖,每次抽奖中奖的概率是固定的,抽了特定的次数,算一下总共中奖几次的可能性。
”他还是一脸懵。
于是我就给他举了个例子,假设抽奖中奖概率是 0.2,一共抽 5 次,那中奖 2次的概率咋算呢?这时候二项分布公式就派上用场啦。
二项分布的公式是:P(X = k) = C(n, k) * p^k * (1 - p)^(n - k) 。
这里的 n 就是试验次数,k 就是成功的次数,p 是每次试验成功的概率。
再讲讲泊松分布。
泊松分布就像是在一段时间或者一个区域内,某种事件发生的次数。
比如说,在一个小时内,某个路口发生交通事故的次数。
我曾经观察过我们学校门口的交通情况。
有一天,我特意在那站了一个小时,想看看大概会有多少起小的交通摩擦。
结果发现,差不多平均下来,一个小时会有那么两三起。
这其实就有点像泊松分布的情况。
泊松分布的公式是:P(X = k) = (λ^k * e^(-λ)) / k! ,这里的λ是单位时间或者单位面积内事件发生的平均次数。
最后说说几何分布。
几何分布就好像是你不断尝试做一件事,直到第一次成功为止,所需要的尝试次数。
有次我陪我家孩子玩猜谜语,他一直猜不对,我就告诉他,你猜猜看,平均几次能猜对一个。
这其实就和几何分布有点关系。
几何分布的公式是:P(X = k) = (1 - p)^(k - 1) * p ,其中 p 是每次试验成功的概率。
总之,这三种离散型分布公式在生活和学习中都有很多用处。
咱们多观察、多思考,就能更好地理解和运用它们啦!。
常用的离散型分布
四、二项分布
二项分布
如果一个随机变量 X 的概率分布为
P{X k} Ckn pk(1 p)nk k0 1 2, n
(245)
则称 X 服从参数为 n p 的二项分布 并记作 X~b(n p) 且记
b(k; n, p) Ckn pk(1 p)nk
二项分布的期望和方差
P{X
xi}
1 n
i1
2,
n
则称 X 服从 n 个点{x1 x2 xn}上的均匀分布
n个点上的均匀分布的期望和方差
EX
1 n
n
x i1 i
(xi
x)2
(242)
(243) (244)
三、n个点上的均匀分布
n个点上的均匀分布
设随机变量 X 取 n 个不同的值 且其概率分布为
退化分布之所以称为退化分布是因为其取值几乎是确定 的 即这样的随机变量退化成了一个确定的常数
二、两点分布
两点分布 一个随机变量只有两个可能取值 设其分布为
P{Xx1}p P{Xx2}1p 0p1 则称X服从x1 x2处参数为p的两点分布 两点分布的期望和方差
EXpx1(1p)x2 DXp(1p)(x1x2)2
在实际中 当N很大时 且N1和N2均较大 而n相对很小时 通常将不放回近似地当作放回来处理 从而用二项分布作为
超几何分布的近似 即
C C k nk N1 N2 CnN
Ckn
(
N1)k N
(
N2 N
)nk
(256)
六、超几何分布
超几何分布
一个袋子中共装有N个球 其中N1个白球 N2个黑球 从中 不放回地抽取n个球 X表示取到白球的数目 那么X的分布为
2.3常用的离散型分布
P { X m } q k 1 p q m q j 1 p q m
k m 1
j 1
同理 有
P{Xmn}qmn P{Xn}qn 于是得
P { X m n |X m } q q m m n q n P { X n } 说明
pn(注意这与试验的次数n有关) 如果n时 npn (0为常
数) 则对任意给定的k 有 k l n b i ( k ; n m , p n ) k ! e
( 2 6 3 )
说明
由该定理 我们可以将二项分布用泊松分布来近似 当二
项分布b(n p)的参数n很大 而p很小时 可以将它用参数为
说明
设X表 示 投 掷 一 枚 均 匀 的 骰 子 出 现 的 点 数 此 时 {1 2
6} 令
X()
则 X服 从 {1 2 6}上 的 均 匀 分 布
四、二项分布
二项分布
如 果 一 个 随 机 变 量 X的 概 率 分 布 为
P {Xk}C k npk(1p)nk k0 1 2, n
式(254)通常称为几何分布的无记忆性 意指几何分布对 过去的m次失败的信息在后面的计算中被遗忘了
六、超几何分布
超几何分布
一个袋子中共装有N个球 其中N1个白球 N2个黑球 从中 不放回地抽取n个球 X表示取到白球的数目 那么X的分布为
P { X k } C k N 1 C n N 2 k ,0 k n C n N
如果X只取0 1两个值 其概率分布为
P{X1}p P{X0}1p 0p1
(239)
则称X服从参数为p的01分布 也称X是参数为p的伯努利随机
分布律的名词解释
分布律的名词解释分布律,是指描述和表达随机变量在不同取值下的可能性的规则或规律。
它是概率论中的重要概念,用于描述随机事件发生的概率分布情况。
在不同的领域和学科中,分布律有着不同的表达方式和数学模型,用于研究和分析各种随机事件和现象的发生概率。
一、离散型分布律的名词解释离散型分布律用于描述随机变量只能取有限个或可数个值的情况。
常见的离散型分布律有以下几种:1. 伯努利分布:伯努利分布是最简单的分布律之一。
它描述了一个随机试验只有两个可能结果的情况,例如投硬币的结果可以是正面或反面。
伯努利分布的特点是只有一个参数p,表示事件发生的概率。
2. 二项分布:二项分布是一种多次独立且具有相同概率的伯努利试验的概率分布。
它描述了在多次重复试验中成功次数的概率分布。
二项分布有两个参数n和p,其中n表示试验次数,p表示每次试验成功的概率。
3. 泊松分布:泊松分布用于描述单位时间或单位面积内某事件发生的次数的概率分布情况。
它适用于描述独立事件在固定时间或空间上的随机性分布。
泊松分布只有一个参数λ,表示单位时间或单位面积内事件的平均发生次数。
二、连续型分布律的名词解释连续型分布律用于描述随机变量在一个区间内的值的概率分布情况。
与离散型分布律不同,连续型分布律无法用一个具体的值来表示,而是使用一个概率密度函数来表示。
1. 均匀分布:均匀分布是最简单的连续型分布之一,它描述了在一个区间内各个取值具有相同的概率密度。
均匀分布的概率密度函数为常数,表示取值在该区间内的均匀分布。
2. 正态分布:正态分布,也称为高斯分布或钟形曲线,是自然界中许多现象的分布规律。
它的概率密度函数是一个钟形曲线,对称于均值。
正态分布以其良好的数学性质和广泛适用性而在各个领域得到广泛应用。
3. 指数分布:指数分布是描述一些连续事件之间间隔时间的概率分布。
它常用于描述等待时间、寿命等现象。
指数分布的概率密度函数呈现出递减的指数函数形式。
三、应用与扩展分布律不仅仅用于描述和研究单个随机变量的概率分布,还能够通过随机过程、组合和变换等方式应用于更复杂的随机事件和现象。
常用离散型随机变量的概率分布
常用离散型随机变量的概率分布一、离散型随机变量简介离散型随机变量是指只能取有限个或可数个值的随机变量。
在概率论与数理统计中,离散型随机变量的概率分布描述了该随机变量每个可能取值的概率。
在实际问题中,常用的离散型随机变量包括伯努利分布、二项分布、泊松分布和几何分布等。
二、伯努利分布伯努利分布是一种表示两个可能结果的离散型概率分布。
它的特点是每次试验只有两个可能结果:成功和失败。
该分布由一个参数p确定,表示成功的概率,成功的概率为p,失败的概率为1-p。
伯努利分布的概率质量函数如下:P(X=x) = p^x * (1-p)^(1-x)其中,x为随机变量X的取值(0或1),p为成功的概率。
三、二项分布二项分布是一种多次独立重复实验的离散型概率分布。
它描述了n次重复独立实验中成功次数的概率分布。
每次实验都有两个可能结果:成功和失败。
每次实验成功的概率为p,失败的概率为1-p。
二项分布的概率质量函数如下:P(X=k) = C(n,k) * p^k * (1-p)^(n-k)其中,X为成功次数的随机变量,k为取值,n表示实验的次数,p为每次实验成功的概率。
四、泊松分布泊松分布是描述单位时间(或单位空间)内某种事件发生次数的离散型概率分布。
泊松分布适用于很多事件发生的情况,例如到达人口数量、电话交换机接收到的呼叫数量等。
泊松分布的特点是事件的发生率稳定且独立。
泊松分布的概率质量函数如下:P(X=k) = (λ^k * e^(-λ)) / k!其中,X为事件发生次数的随机变量,k为取值,λ表示单位时间(或单位空间)内事件的平均发生次数。
五、几何分布几何分布是描述进行独立重复实验,直到第一次成功出现时的实验次数的离散型概率分布。
每次实验成功的概率为p,失败的概率为1-p。
几何分布的概率质量函数如下:P(X=k) = (1-p)^(k-1) * p其中,X为成功所需的实验次数的随机变量,k为取值,p为每次实验成功的概率。
2.3常用的离散型分布
(k 0,1, 2,..., n)
其中0 p 1, 则称X服从参数为n, p的二项分布, 记为 X ~ b(n, p). 注 二项分布的试验背景是n重Bernoulli试验模型;
其中n是试验独立重复的次数, p是每一次基本试验“成功”的概率. 随机变量X指n次试验中“成功”出现的次数.
当n=1时,P(X=k)=pk(1-p)1-k, k=0,1,此时X服从
六. 超几何分布 1 引例 一个袋子中装有N个球,其中N1个白 球,N2个黑球(N=N1+N2),从中不放回地抽取 n个球,X表示取到白球数目,则
P{X k} C C
k N1
n k N2
/ C (0 k n)
n N
规定C 0(b a)
b a
称X服从超几何 分布
注:超几何分布的极限分布是二项分布。即
EX=(x1+x2+…+xn)/n x
1 n 2 D( X ) ( xi x ) n i 1
五.几何分布
1. 定义 若X的概率分布为:
k 1
P( X k ) (1 p)
p, k 1, 2,,
则称 X 服从参数为p 的几何分布。 注:无记忆性: P{X>m+n|X>m}= P{X>n} 2. EX=1/p DX=(1-p)/p2
4. Possion定理 设当 n , npn 0, 则对任意k
k! k 0,1, 2, Poisson定理说明若X ~ B( n, p), 则当n 较大, p 较小, 而 np 适中, 则可以用近似公式 k k k nk Cn p (1 p ) e , k 0,1, 2, k!
2-3常见的离散型分布
是确定最小的 N , 使得 P{ X N } 0.99.
由泊松定理,X 近似服从参数 =300 0.01 3的泊
松分布,故 P{ X N } N 3k e3 , k0 k!
故有
N 3k e3 0.99,
k0 k!
查表可求得满足此式最 小的N是8. 故至少需配置8
个工人,才干确保设备发生故障但不能及时维修旳 概率不大于0.01.
P{ X 1} 1 P{ X 0} 1 0.018316 0.9817
启示:小概率事件虽不易发生,但反复次数
多了,就成大约率事件.
6. 几何分布
(1)概率分布 记作X ~ G( p )
P{ X k} qk1 p, k 1, 2, (q 1 p)
(2)应用背景:描述伯努利试验序列中,
解 设X为800个纺锭在这段时间内发生断头的次数,
则X ~ b(800, 0.005),它近似服从参数 =800 0.005 4的泊
松分布, 故
2
2
P{0 X 2} P{ X k} b(k;800, 0.005)
k0
k0
2 4k e4 0.2381
k0 k !
P{ X 2} 1 P{0 X 2} 1 0.2381 0.7619
1 n
,i
1, 2,
n.
P{ X
xi }
P{i }
1 n
,
i 1, 2, n.
实例 抛掷骰子并记出现旳点数为随机变量 X,
则有 X 1 2 3 4 5 6
1 1 11 11
P 6 6 66 66
4. 二项分布
(1)概率分布
记作X ~ b(n, p) (0 p 1)
P{ X
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
离散型分布
Li Junrong
stat9@
随机变量的类型
●定量资料看作是连续型变量●定性资料看作是离散型变量
①、组合(Combination ):从个n 元素中抽取k 个元素组成一组(不考虑其顺序)的组合方式个数记为
!!()!
n n k k n k ⎛⎫=
⎪-⎝⎭2
333!6C =
322!(32)!21⎛⎫=== ⎪-⨯⎝⎭
k n n C k ⎛⎫ ⎪⎝⎭
或(n!为的阶乘,n!=1*2*……*n,0!=1)
回忆:数学概念
2
222)(b
ab a b a ++=+3
2
2
3
3
33)(b
ab b a a b a +++=+
②、牛顿二项展开式:
()()()(
)()()011
22
1
2
11
10()...n
n n n n n n n n n n n n
n n k n k
k k
a b a b a b a b a b a b a b
-----=+=+++++=∑
二项分布Binomial distribution
Bernoulli试验
毒性试验:小白鼠死亡——生存
临床试验:病人治愈——未愈
临床化验:血清阳性——阴性
事件成功(A)——失败(非A)这类“成功─失败型”试验称为Bernoulli试验。
一、二项分布定义
●任意一次试验中,只有事件A发生和不发生两种对立结果。
●A发生的概率是π,不发生的概率为(1-π)。
●若在相同的条件下,进行n次重复试验,其结果是相互独立的。
用X表示这n次试验中事件A发生的次数,那么X服从二项分布,记做X~B(n,π) 。
条件
二、二项分布的概率
例题:假设小白鼠接受一定剂量的毒物时,其死亡概率是80%。
对每只小白鼠来说,其死亡事件A发生的概率是0.8,不发生的概率是0.2。
试验用3只小白鼠,请列举可能出现的试验结果及发生的概率。
在n 次独立重复试验中,事件A (死亡)发
生的次数X (0,1,2,…,n)的概率P(X):
X ~B(n,π):随机变量X 服从以n,π为参数的二项分布。
(
)()(1)
n X
n X
X
P X π
π-=-()!
()!!
n X X
n
n C
n X X ==
-概率函数
●
在n 次独立重复试验中,事件A (死亡)至少发生k 次的概率:
●
在n 次独立重复试验中,事件A (死亡)至多发生k 次的概率:
分布函数
n
X=k
P X k)=P(k)+P(k+1)+...+P(n)=P(X)
≥∑(k
X=0
P X k)=P(0)+P(1)+...+P(k)=P(X)
≤∑(
三、二项分布的均数与标准差 X ~B(n,π):
X 的均数μX =n π
X 的方差σX 2 = n π(1-π)
X 的标准差:(1)
x n σππ=-
四、二项分布的图形
●图形特点:两个轴意义,对称、偏态、与正态分布的关系
●决定图形的两个参数:n,
五、样本率的均数和标准差
●样本率的均数μp :●样本率的标准差σp:●样本率的标准差(估计值)Sp:
11()p x n n n
μμππ===1(1)p x n n ππσσ-==(1)p p p S n
-=(标准误)
二项分布的应用:统计推断
●总体率区间估计
●样本率与总体率的比较
●两样本率的比较
(一)、总体率区间估计
●
查表法(基于二项分布原理)
●正态近似法(基于二项分布正态近似原理)条件:n 较大、p 与(1-p)均不太小,如np 及n(1-p)均大于5时。
95%CI:
π的p
p 1.96S ±
(二)样本率与总体率的比较
1、直接概率法(基于二项分布原理)
2、正态近似法(基于二项分布正态近似原理)
条件:n较大、p与(1-p)均不太小,如np
及n(1-p)均大于5时。
●例题:P118 例6-4
●分析题意,选择合适的计算统计量的方法。
假设检验过程
1.建立假设:
H0:π= 0.55
H1:π>0.55
2.确定显著性水平,α取0.05。
(单侧)
3.计算统计量:P(9)+P(10)直接得到P值。
4.比较P与α
5.做出推论
(三)两样本率的比较检验统计量u 的计算:
12
12p p p p u S --=注:可用卡方检验取代,了解即可。
不作要求:
家庭聚集性检验群检验
泊松分布Poisson distribution
问题的引出
●盒子中装有999个黑棋子和1个白棋子,在一次抽样中,抽中白棋子的概率为1/1000
●在100次抽样中,抽中0,1,2,…10个白棋子的概率分别是……
●放射性物质单位时间内的放射次数
●单位体积内粉尘的计数
●血细胞或微生物在显微镜下的计数
●单位面积内细菌计数
●人群中患病率很低的非传染性疾病的患病数
特点:罕见事件发生数的分布规律
Piosson 的概念●常用于描述单位时间、单位面积或单位空间中稀有事件发生数的随机分布规律。
●
若罕见事件A 的发生数为X(0,1,2,…),X 的发生概率P(X):则X 服从Piosson 分布,记为:X ~P ()。
Piosson 分布的总体均数为Piosson 分布的均数和方差相等。
=σ2 ()!
X e P X X λλ
-=σλ
=λ
λλ
Piosson分布的条件
●由于Piosson分布是二项分布的特例,所以,二项分布的三个条件也就是Piosson分布的适
用条件。
●另外,单位时间、面积或容积、人群中观察事件的分布应该均匀。
Piosson分布的特点
●Piosson分布的图形
●Piosson分布的可加性
●Piosson分布与正态分布及二项分布的关系。
泊松分布的图形
λ
λ
λλ
Piosson 分布的可加性
●
观察某一现象的发生数时,如果它呈Piosson 分布,那么把若干个小单位合并为一个大单位后,其总计数亦呈Piosson 分布。
●如果X 1~, X 2~,… X m ~,那么X=X 1+ X 2+… +X m ,则1()P λ2()P λ()m P λ12m λλλλ=+++ ()X P λ
Piosson 分布与
正态分布及二项分布的关系20λ≥二项分布
泊松分布正态分布
n 0,
n =ππλ→∞
→()n ,0.5n >5,n 1->5πππ↑→
Piosson分布的应用
●总体均数的区间估计
●样本均数与总体均数的比较
●两样本均数的比较
总体均数的区间估计
查表法(基于泊松分布原理)
正态近似法(基于泊松分布正态近似原理)条件:当X>20。
u a X X
样本均数与总体均数的比较
●直接概率法:例6-12 (P125)
●正态近似法:统计量u
例6-13 (P126)X
u
λ
λ
-=
两样本均数的比较
●两个样本观察单位相同时:计算统计量
●两个样本观察单位不同时:
12
12
X X u X X -=-1
212
122212
X X n n u X X n n -=+
例题:
●P127 例6-14
●P127 例6-15
负二项分布(略)
●常用于描述传染性疾病的分布●致病生物的分布
●毒理学中应用。