几种常见的概率分布复习过程

合集下载

几种常见的概率分布律

几种常见的概率分布律

的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16

ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为

ϕ
3
(1

ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。

考研数学概率与统计备考掌握常见概率分布和统计方法

考研数学概率与统计备考掌握常见概率分布和统计方法

考研数学概率与统计备考掌握常见概率分布和统计方法概率与统计是考研数学中的一个重要内容,备考期间,掌握常见的概率分布和统计方法是非常关键的。

本文将介绍几种常见的概率分布和统计方法,以助于考生备考时的复习。

一、离散型随机变量及其概率分布离散型随机变量是指在一次试验中,可能取一些特定值的变量。

在概率论中,常见的离散型随机变量有二项分布、泊松分布和几何分布。

1. 二项分布二项分布是指在n次试验中,成功次数为X的概率分布。

它的概率质量函数为:P(X=k) = C(n, k) * p^k * (1-p)^(n-k)其中,n为试验次数,k为成功次数,p为一次试验成功的概率,C(n, k)为组合数。

2. 泊松分布泊松分布是一种在独立时间段内总体事件发生次数的离散概率分布。

它的概率质量函数为:P(X=k) = (λ^k * e^(-λ)) / k!其中,X为事件发生的次数,λ为单位时间或空间内事件的平均发生率。

3. 几何分布几何分布是指在一系列独立重复的伯努利试验中,首次成功所需的试验次数的概率分布。

它的概率质量函数为:P(X=k) = p * (1-p)^(k-1)其中,X为首次成功所需的试验次数,p为一次试验成功的概率。

二、连续型随机变量及其概率分布连续型随机变量是指在某一区间内可能取任意值的变量。

在概率论中,常见的连续型随机变量有均匀分布、正态分布和指数分布。

1. 均匀分布均匀分布是指在一个区间内,随机变量取任意值的概率相等的分布。

它的概率密度函数为:f(x) = 1 / (b-a) (a <= x <= b)其中,a为区间下界,b为区间上界。

2. 正态分布正态分布也称为高斯分布,是自然界和社会现象中最常见的分布。

它的概率密度函数为:f(x) = 1 / (σ* √(2π)) * e^(-(x-μ)^2 / (2σ^2))其中,μ为均值,σ为标准差。

3. 指数分布指数分布是一种用于描述事件发生时间间隔的分布。

生物统计学 几种常见的概率分布律

生物统计学 几种常见的概率分布律

非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9

第一章 概率统计基础知识(4)常用分布

第一章 概率统计基础知识(4)常用分布
图1.2-12 标准正态分布的概率密度函数 的图形(教材28页)
(1) 标准正态分布函数
(1) 标准正态分布函数
表,用来计算形如“ ”的随机事件发生的概率,即标准正态分布函数。根据u的值可在标准正态分布函数表(附表1—2)上查得, .例如事件“u≤1.52“的概率可从附表1—2上查得p(u≤1.52)= (1.52)=0.9357它表示标准正态随机变量u取值不超过1.52 的概率,在数量上它恰好为1.52 左侧的一块阴影面积(见图1.2-13) 。
这个分布
这个分布称为二项分布,记为b(n,p)
是从n个不同元素中取出x个的组合数,它的计算公式为:
二项分布的均值、方差与标准差分别为:np, npq, .
特例:n=1的二项分布称为二点分布。它的概率函数为:
或列表如下:
它的均值、方差与标准差分别为p,p(1-p), 。
[例1.2-10]
[例1.2-10]在—个制造过程中,不合格品率为o.1,如今从成品中随机取出6个,记x为6个成品中的不合格品数,则x服从二项分布,简记为b(6,0.1)。现研究如下几个问题:
由于概率0.95 恰好介于0.9495 与0.9505 中间,故。
0.5 分位数,即50% 分位数,也称为中位数,在标准正态分布n(o,1)场合,
u0.5=0 。当α<o.5时,比如α=0.25,由对称性可知u0.25=-u0.75。u0.75=0.675,对它加上负号即得u0.25=-0.675,类似地有u0.1=-u0.9=-1.282(见图1.2—20) 。(p30)
1.2 起重大事故,这表明:x服从 =1.2 的泊松分布,现考察如下事件的概率:
(1) 在一个月内发生1起重大事故的概率为:
类似地也可计算x取其他值的概率,现罗列于如下分布列中:

第三章第二次课 几种常见的理论分布

第三章第二次课 几种常见的理论分布

第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。

第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。

难点:二项分布的概率函数特征,正态分布的特征。

一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。

对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。

在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。

在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。

先取n =4,k =2来讨论。

在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。

由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。

4 第三章 几种常见的概率分布律

4 第三章 几种常见的概率分布律

φ-事件A发生的概率(每次试验都是恒定的)
1-φ- 事件 A 发生的概率 p(y)-y的概率函数=P(Y=y)
F(y)= P(Y≤y)=
p( yi )
yi y
5
例3.1 从雌雄各半的100只动物中,每次抽一只, 做放回式抽样,若抽样试验共进行10次,问其中 包括0,1,2,3只雄性动物的概率是多少?包括 3只及3只以下的概率是多少?
1
e dz y

(
y )2 2 2

2
24
F(y) 1
1 2

y
25
正态分布的特性
当y=μ时,f(y)有最大值,正态分布曲线是以平均数 为中心的分布。
当y不论向哪个方向远离μ时, f(y)的值都减小,但永 远不会等于0,正态分布以y轴为渐近线, y的取值区 间(-∞,+∞)。
36
标准正态分布的概率计算
如:设y服从标准正态分布,求概率 P(y>0.3) 。 解:标准正态分布关于y=0对称,所以
P(y>0.3)=P(y<-0.3)= (0.30) 0.3821
37
标准正态分布的概率计算
例:设y服从标准正态分布,求概率P(-1.83 <y <0.3) 。
解:即求标准正态分布曲线下在(-1.83,-0.30)范围 内的面积
k,
k
1,
k

2,
...
20
第四节 正态分布
第四节 正态分布
正态分布:两头少,中间多,两侧对称。 一、正态分布的密度函数和累积分布函数
正态分布密度函数
f (y)
1
e
(
y )2 2 2

几种常见的概率分布率分解课件

几种常见的概率分布率分解课件

均匀分布的定 义
均匀分布是一种概率分布,其特点是随机变量在一定区间内取值的可能性是等可 能的。
在数学表达上,如果一个随机变量X服从某个区间[a, b]上的均匀分布,则其概率 密度函数f(x)可以表示为f(x)=1b−a,当x∈[a,b]时,f(x)=0,当x∉[a,b]时。
均匀分布的特点
均匀分布的期望值E(X)和方差Var(X) 分别为(a+b)/2和(b-a)^2/12。
泊松分布在生活中的应用
02
01
03
在物理学中,泊松分布用于描述放射性衰变过程中粒 子发射的次数。
在统计学中,泊松分布常用于二项分布的近似,当试 验次数很大而事件发生的概率很小时。
在计算机科学中,泊松分布在处理网络流量和计算机 系统中的任务调度等问题时非常有用。
04
二项分布
二项分布的定义
总结词
二项分布是一种离散概率分布,描述了在n次独立重复的伯努利试 验中成功的次数。
指数分布的期望值和方差是有限的,分别为1/λ和1/λ^2,其中λ是概率密度函数的 参数。
指数分布在生活中的应用
指数分布在可靠性工程中广泛应 用,用于描述产品寿命、故障间
隔时间等。
在排队论中,指数分布用于描述 顾客到达和服务时间等随机变量。
在保险精算中,指数分布用于计 算保费和准备金。
06
均匀分布
几种常见的概率分布率分解课 件
CONTENCT

• 概率分布率概述 • 正态分布 • 泊松分布 • 二项分布 • 指数分布 • 均匀分布
01
概率分布率概述
概率分布率的定 义
概率分布率
表示随机变量取值的概率规律。
定义方式
对于离散随机变量,概率分布律为P(X=xi)=pi,i=1,2,3...;对于连续随机变量, 概率分布函数为P(a≤X≤b)=∫[a,b]f(x)dx,其中f(x)为概率密度函数。

4. 第三章 几种常见的概率分布律

4. 第三章 几种常见的概率分布律

3.4 正态分布

两头少,中间多,两侧对称
正态分布曲线
μ
22

正态分布的密度函数和分布函数

对于平均数是μ ,标准差是σ的正态分布,其密 度函数为
1 f x e 2

x 2
2 2
, x , 0
以符号N(μ ,σ2)表示平均数为μ ,标准差为 σ的正态分布
20
结果如下:
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
有x颗杂草的概率 p(x) = 10x/x!e10
有小于等 于x颗杂草 的概率 (累加)
有多于于等于x 颗杂草的概率 (1-上一个数 值的累计)
p(x) 0.0005 0.0023 0.0076 0.0189 0.0378 0.0631 0.0901 0.1126 0.1251 0.1251 0.1137 0.0948 0.0729 0.0521 0.0347
n p x 1 1 x 0
8
n

将x=0,1,2,3代入二项分布概率函数,可得出出 现0,1,2,3只雄性动物的概率。
P(0)= 0.0009766
P(1)= 0.0097656
P(2)= 0.0439453Biblioteka P(3)= 0.1171876
抽到3只和3只以下雄性动物的概率为:
15

于是:
15 n C (1 ) ( ) 0.01 16 n(lg15-lg16)= lg0.01 -0.02803n =-2.00000 n =71.4
n n n 0 n

即需要72代
0 n 0 n

d 几种常见的概率分布律

d  几种常见的概率分布律

三、服从二项分布的随机变量的特征数
平均数: μ=nφ
方差: σ2=nφ(1-φ)
随着样本含量的增加,偏斜度和峭度趋 向于0,二项分布逐渐接近于正态分布。
四、二项分布应用实例
例:3.2 例:3.3 例:3.4
【例3.4】
用 棕 色 正 常 毛 (bbRR) 的 家 兔 和 黑 色 短 毛 (BBrr)兔杂交,杂种F1为黑色正常毛长的 家兔,F1雌、雄兔近亲交配,问最少需要 多少只F2代的家兔,才能以99%的概率至 少得到一只棕色短毛兔?
二、二项分布概率函数表达式:
p( y) Cny y (1)ny , y 0,1,2,, n
n=试验次数(或样本含量) y=在n次试验中事件A出现的次数 φ=事件A发生的概率(每次试验都是恒定的) 1-φ=事件A的对立事件发生的概率 p(y)=Y的概率函数=P(Y=y)
例:3.1
从雌雄各半的100只动物中做一抽样试验。第一次从这100只动 物中随机抽取一只,记下性别后放回,再做第二次抽取。共 做了10次抽样,计算抽中3只和3只以下雄性动物的概率。
(5)曲线和X坐标轴所夹的面积等于1。 (6)正态分布表查出的φ(u)的值表示随机变量
U落入区间(-∞, u)的概率。 (7)累积分布函数图形的特点是围绕点
(0, 0.5)对称。 (8)正态分布的偏斜度γ1=0 ,峭度γ2=0。
5. 一些重要值
68.27%
68.27%
95.00%
95.00%
99.00%
解: n=10 y=3,2,1,0 φ=1/2 p( y) Cny y (1)ny
p(3) 10! ( 1 )3 ( 1 )7 120 (210 ) 0.1171876 3!(10 3)! 2 2

第4章 几种常见的概率分布汇总

第4章 几种常见的概率分布汇总

第四章 几种常见的概率分布第一节 二项分布 一、二项总体 1. 定义由非此即彼事件构成的总体,叫做二项总体(binomial population) 孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等 2. 表示方法通常给“此”事件以变量“1”,具概率φ ,给“彼”事件以变量“0”,具概率1- φ 。

二项总体又称0、1总体。

● 在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k(0≤k ≤n)次的概率Pn(k)。

● 先取n=4,k=2来讨论。

在4次试验中,事件A 发生2次的方式有 24C● 其中Ak(k=1,2,3,4)表示事件A 在第k 次试验发生;kA (k=1,2,3,4)表示事件A 在第k 次试验不发生。

由于试验是独立的,按概率的乘法法则,于是有● 由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为● 一般,在n 重贝努利试验中,事件A 恰好发生k(0≤k ≤n)次的概率为k n k kn n q p C (k)P -=nk ,,2,1,0 =二、二项分布如果我们每次独立抽取二项总体的n 个个体,则所得变量X 将可能有0,1,…n ,共n+1种变量有它各自的概率而组成一个分布。

这个分布就叫做二项概率分布,或简称二项分布(binomial distribution) 由此得到计算二项分布任何一项概率的通式为:p(x) =Cnx φ x(1- φ)n-x二项分布是一种离散型随机变量的概率分布性质1)1(0=-∑=-nx x n x x n C ϕϕ∑=--=≤mx xn x x n C m x P 0)1()(ϕϕ∑=--=≥nmx xn x x nCm x P )1()(ϕϕ∑=-=≤≤=≤≤21)()(2121m m x xn x x nn q p Cm k m p m x m P● 例1:若研究施用某种农药后蚜虫的死亡数,设死虫子为0,其概率为0.3;其活的为1,概率为0.7。

概率论中几种常用重要分布

概率论中几种常用重要分布

概率论中几种常用的重要的分布摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。

其在实际中的应用。

关键词1 一维随机变量分布随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常用分布,即( 0 -1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布. 下面我们将对这六种分布逐一地进行讨论.随机事件是按试验结果而定出现与否的事件。

它是一种“定性”类型的概念。

为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。

称这种变数为随机变数。

本章内将讨论取实值的这种变数—— 一维随机变数。

定义1.1 设X 为一个随机变数,令 ()([(,)])([]),()F x P X x P Xx x=∈-∞=-∞+∞.这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。

它是一个普通的函数。

成这个函数为随机函数X 的分布函数。

有的随机函数X 可能取的值只有有限多个或可数多个。

更确切地说:存在着有限多个值或可数多个值12,,...,a a 使得 12([{,,...}])1P X a a ∈=称这样的随机变数为离散型随机变数。

称它的分布为离散型分布。

【例1】下列诸随机变数都是离散型随机变数。

(1)X 可能取的值只有一个,确切地说,存在着一个常数a ,使([])1P X a ==。

称这种随机变数的分布为退化分布。

一个退化分布可以用一个常数a 来确定。

(2)X 可能取的值只有两个。

确切地说,存在着两个常数a ,b ,使([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。

如果([])P X b p ==,那么,([])1P X a p ===-。

因此,一个两点分布可以用两个不同的常数,a b 及一个在区间(0,1)内的值p 来确定。

特殊地,当,a b 依次为0,1时,称这两点分布为零-壹分布。

机器学习笔记之常见的11种概率分布

机器学习笔记之常见的11种概率分布

机器学习笔记之常见的11种概率分布0x01 均匀分布1) 离散随机变量的均匀分布:假设 X 有 k 个取值:x1, x2, ..., xk 则均匀分布的概率密度函数为:2) 连续随机变量的均匀分布:假设 X 在 [a, b] 上均匀分布,则其概率密度函数为:0x02伯努利分布伯努利分布:参数为θ∈[0,1],设随机变量 X ∈ {0,1},则概率分布函数为期望:⽅差:0x03 ⼆项分布假设试验只有两种结果:成功的概率为θ,失败的概率为 1-θ. 则⼆项分布描述了:独⽴重复地进⾏ n 次试验中,成功 x 次的概率。

概率密度函数:期望:⽅差:0x04 ⾼斯分布正态分布是很多应⽤中的合理选择。

如果某个随机变量取值范围是实数,且对它的概率分布⼀⽆所知,通常会假设它服从正态分布。

有两个原因⽀持这⼀选择:'''建模的任务的真实分布通常都确实接近正态分布。

中⼼极限定理表明,多个独⽴随机变量的和近似正态分布。

在具有相同⽅差的所有可能的概率分布中,正态分布的熵最⼤(即不确定性最⼤)。

'''典型的⼀维正态分布的概率密度函数为 :0x05 拉普拉斯分布概率密度函数:期望:⽅差:0x06 泊松分布假设已知事件在单位时间(或者单位⾯积)内发⽣的平均次数为λ,则泊松分布描述了:事件在单位时间(或者单位⾯积)内发⽣的具体次数为 k 的概率。

概率密度函数:期望:⽅差:0x07 指数分布若事件服从泊松分布,则该事件前后两次发⽣的时间间隔服从指数分布。

由于时间间隔是个浮点数,因此指数分布是连续分布。

概率密度函数:( t 为时间间隔)期望:⽅差:0x08 伽马分布若事件服从泊松分布,则事件第 i 次发⽣和第 i+k 次发⽣的时间间隔为伽玛分布。

由于时间间隔是个浮点数,因此伽马分布是连续分布。

概率密度函数:其中, t 为时间间隔,k 称为形状参数,λ称为尺度参数期望和⽅差分别为:0x09 贝塔分布贝塔分布是定义在 (0,1) 之间的连续概率分布。

概率问题常见解题方法

概率问题常见解题方法

概率问题常见解题方法作为<<概率统计>>这门应用数学的重要分支之一,概率问题在中学数学中越来越得到重视,也是近年高考的热点。

在高中数学新教材中,必修三和理科的选修课本中重点介绍了等可能事件的概率(即古典概型)、几何概型、条件概率、互斥事件有一个发生的概率、相互独立的事件同时发生的概率(包括n 次独立重复试验)。

高考中对概率的考查主要以大题形式出现,重点在分布列问题与其他章节内容相结合,但始终离不开各种概率的求法。

因此要让学生正确理解概率发生的条件,并掌握一些基本的概率“模型”及其解题方法。

一、公式法 概率部分有四个主要的公式(1)等可能事件发生的概率P (A )=nm (2)互斥事件有一个发生的概率 P (A+B )= P (A )+ P (B ) (3)相互独立事件同时发生的概率P (A ·B )= P (A )·P (B ) (4)独立重复试验概率公式k k n k n P C P =)((1―P)k n -,应用这些公式的关键在于正确理解公式成立的条件。

例1:猎人在距100米处射击一野兔,其命中率为21,如果第一次射击未中,则猎人进行第二次射击,但距离为150米,如果第二次未击中,则猎人进行第三次射击,并且在发射瞬间距离为200米,已知猎人命中概率与距离平方成反比,求猎人命中野兔的概率。

解:记三次射击为事件A 、B 、C 其中P (A )=21 由21= P (A )=50001002=⇒K K ∴ P (B )=9215050002= P (C )=8120050002= ∴命中野兔的概率为:P (A )+P (A ·B )+ P (A ·B ·C )=14495 二、组合分析法对于等可能的事件,我们可以利用组合分析法来计算其概率,其关键是寻求等可能事件的总数和事件的发生数。

例2:设有n 个人,每个人都等可能地被分配到N 个房间中的任意一间去住(n ≤N ),求下列事件的概率(1)指定的n 个房间各有一个人住(2)恰好有n 个房间,其中各住一人解:∵每个人有N 个房间可供选择,所以n 个人住的方式共有 N n 种,它们是等可能的,∴(1)指定n 个房间各有一个人住记作事件A :可能的总数为n !则 P (A )=nN n ! (2)恰好有n 个房间其中各住一人记作事件B ,则这n 个房间从N 个房间中任选共有n N C 个, 由(1)可知:P (B )=n n N Nn C ! 三、间接法某些概率问题,正面求解,不是很容易,特别当问题中出现至多(至少)等条件时,可采用间接方法转化为“对立事件”来求解例3:已知某种高炮在它控制的区域内击中敌机制概率为0.2(1)假定有5门这种高炮控制某区域,求敌机进入该区域后被击中的概率。

几种常见的概率分布率-(1)分解

几种常见的概率分布率-(1)分解
➢ 曲线与横坐标轴所夹的图形面积为1; ➢ 累积分布函数曲线从-∞到0平稳上升,围绕点(0,0.5)对称;
➢ 标准正态分布的偏斜度γ1和峭度γ2均为零。
以下一些特征值很重要:
-3 -2 -1
1 23
68.27%
95.45%
99.73%
P(-1≤u<1)=0.6826 P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973
4.822),求:
(1)X<161cm的概率; (2)X>164cm的概率; (3)152<X<162的概率。
x-
=
161 - 156.2 4.82
=
1.00
x
=
164 - 156.2 4.82
=
1.62
x
=
152 - 156.2 4.82
=
-0.87
x
=
162 - 156.2 4.82
=
1.20
四、 正态分布的单侧分位数和双侧分位数
x
[(1-
-1
p) ]p - p(n-x)
(当n→∞时,系数的极限为1,且nφ =μ)Βιβλιοθήκη x!= x e-x!
1
-1
e = lim (1 z) z,lim (1 - p) p = e
z0
p0
二、 服从泊松分布的随机变量的特征数
➢ 平均数:μ=λ ➢ 方差: σ2 = λ
➢ 偏斜度: 1=
1

峭度:
标轴从-∞到u所夹的面积,该曲线下的面积即表示随机 变量U 落入区间(-∞,u)的概率;
➢ 标准正态分布查表常用的几个关系式:
• P(0<U <u1)=F(u1)-0.5 • P(U >u1)=F(-u1)=1-F(u1) • P(∣U∣>u1)=2F(-u1) • P(∣U∣<u1)=1- 2F(-u1) • P(u1<U <u2)=F(u2)-F(u1)

第四章 常见的几种概率分布

第四章  常见的几种概率分布

0.5 0.4 0.3 0.2 0.1 0 -4 -3 -2 -1 0 1 2 3 4
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
σ =0.5
σ =1 σ =2
2.正态分布特征
⑴ 曲线呈钟型,以 为对称轴左右对称。 ⑵ 在 处, 取最大值,即曲线最高。 ⑶ 正态分布有两个参数,即位置参数 和形态 参数 。 ⑷ 正态分布的标准化变换
u2 125 122.6 0.5 4.8
相当于
119 122.6 125 -0.75 0 0.5
该地当年7岁男孩身高界于119cm 到125cm范围所占的比例为46.49%。
第三节 2分布、t 分布、F分布
t分布
X ~ N( m ,2) ~
• 英国统计学家W. S. Gosset(1908)给出了统计 量t的分布规律,并称统计量
• t分布与正态分布的关系: 自由度v 较小时,t 分布 与标准正态分布相差较大,随着自由度v的增大,t 分 布曲线越来越接近于标准正态分布曲线。
• 当 时,t分布的极限分布就是标准正态分布。
单侧 双侧
• t分布的界值:
t界值示意图:
-t/2,v
t/2,
2分布
设 为相互独立的服从标准正态总体 的随机变量,统计量 为 一随机变量,且其密度函数为
的分布规律为t分布,自由度为v,记为t (v)分 布。 由于每个自由度v对应一个分布,因此t分布是一 簇分布。
自由度不同的三条t分布密度曲线
v =∞ v=5
v =1
v=1
t分布的图形特征和t界值
• 分布特征: t分布曲线是单峰的,且以t = 0左右对称。 • t分布是随自由度v而变化的一簇分布。

概率统计——讲透最经典的三种概率分布

概率统计——讲透最经典的三种概率分布

概率统计——讲透最经典的三种概率分布这一讲当中我们来探讨三种经典的概率分布,分别是伯努利分布、二项分布以及多项分布。

在我们正式开始之前,我们先来明确一个概念,我们这里说的分布究竟是什么?无论是在理论还是实际的实验当中,一个事件都有可能有若干个结果。

每一个结果可能出现也可能不出现,对于每个事件而言出现的可能性就是概率。

而分布,就是衡量一个概率有多大。

伯努利分布明确了分布的概念之后,我们先从最简单的伯努利分布开始。

伯努利分布非常简单,就是假设一个事件只有发生或者不发生两种可能,并且这两种可能是固定不变的。

那么,显然,如果假设它发生的概率是p,那么它不发生的概率就是1-p。

这就是伯努利分布。

生活中所有只可能出现两种结果并且概率保持不变的事件都可以认为服从伯努利分布,比如抛硬币,比如生孩子是男孩还是女孩。

伯努利实验就是做一次服从伯努利概率分布的事件,它发生的可能性是p,不发生的可能性是1-p。

二项分布我们明确了伯努利分布之后再来看二项分布就简单了。

说白了二项分布其实就是多次伯努利分布实验的概率分布。

以抛硬币举例,在抛硬币事件当中,每一次抛硬币的结果是独立的,并且每次抛硬币正面朝上的概率是恒定的,所以单次抛硬币符合伯努利分布。

我们假设硬币正面朝上的概率是p,忽略中间朝上的情况,那么反面朝上的概率是q=(1-p)。

我们重复抛n次硬币,其中有k项正面朝上的事件,就是二项分布。

我们来试着推导一下二项分布的公式:假设我们抛了4次硬币,每一次都有两种可能,既可能正面朝上,也可能反面朝上。

所以一共存在种情况,假设我们想知道4次当中有两次正面朝上的概率。

我们写成P(X=2),它应该是多少呢?我们先来看一种情况,假设某一次抛掷当中,我们的结果是正正反反,记作:OOXX。

那么,它的概率应该是但是这只是一种正面朝上两次的情况,与它相同的情况还有:以上的这5种都是两次正面朝上的情况,都满足要求,所以我们在计算概率的时候,需要乘上可能会导致两个正面朝上的种数。

d 几种常见的概率分布律

d  几种常见的概率分布律
③ P(|U|>u)=2φ(-u)
④ P(|U|<u)=1-2φ(-u)
5、常用关系式
⑤ P(u1<U<u2) =φ( u2)-φ( u1)
【例3.7】
利用正态分布表,查u= - 0.82及u=1.15时的Φ(u)的值。
解:查正态分布表知,u=-0.82时,Φ(u)=0.20611。
u=1.15时,Φ(u)=0.87493。
三、服从二项分布的随机变量的特征数
平均数: μ=nφ
方差: σ2=nφ(1-φ)
随着样本含量的增加,偏斜度和峭度趋 向于0,二项分布逐渐接近于正态分布。
四、二项分布应用实例
例:3.2 例:3.3 例:3.4
【例3.4】
用 棕 色 正 常 毛 (bbRR) 的 家 兔 和 黑 色 短 毛 (BBrr)兔杂交,杂种F1为黑色正常毛长的 家兔,F1雌、雄兔近亲交配,问最少需要 多少只F2代的家兔,才能以99%的概率至 少得到一只棕色短毛兔?
(5)曲线和X坐标轴所夹的面积等于1。 (6)正态分布表查出的φ(u)的值表示随机变量
U落入区间(-∞, u)的概率。 (7)累积分布函数图形的特点是围绕点
(0, 0.5)对称。 (8)正态分布的偏斜度γ1=0 ,峭度γ2=0。
5. 一些重要值
68.27%
68.27%
95.00%
95.00%
99.00%
p(1) 10! ( 1 ) ( 1 )9 10(210 ) 0.0097656 1!(10 1)! 2 2
p(0) 10! ( 1 )0 ( 1 )10 210 0.0009766 0!(10 0)! 2 2
F(3) p(3) p(2) p(1) p(0) 0.1718751

生物统计学:几种常见的概率分布律

生物统计学:几种常见的概率分布律

头仔猪中白色的为x头,则x为服从二项分布B(10,0.75)
的随机变量。于是窝产10头仔猪中有7头是白色的概率
为:
10! P ( x 7) C 0.75 0.25 0.75 7 0.253 0.2503 7!3!
7 10 7 3
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗? 假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20 %,则15 头家畜中染病头数x=0的概率为
1-p=q,则称这一串重复的独立试验为n重贝努利试验,
简称贝努利试验(Bernoulli trials)。
在生物学研究中,我们经常碰到的一类离 散型随机变量,如孵n枚种蛋的出雏数、n头病 畜治疗后的治愈数、n 尾鱼苗的成活数等,可用 贝努利试验来概括。 在n重贝努利试验中,事件 A 可能发生0,1, 2,…,n次,现在我们来求事件A恰好发生 k(0≤k≤n)次的概率Pn(k)。
四、二项分布的平均数与标准差 统计学证明,服从二项分布B(n,p)的随机变 量之平均数μ、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
μ=np
(3-5)
(3-6)
npq
【例3.4】求【例3.3】平均死亡猪数及死 亡数的标准差。
以p=0.2,n=5代入 (3-5)和(3-6) 式得: 平均死亡猪数 μ=5×0.20=1.0(头) 标准差
一、波松分布的意义
若随机变量x(x=k)只取零和正整数值0,1, 2,…,且其概率分布为
k , k=0,1,…… (3-10) P( x k ) e k!

第二三章15几种常见的概率分布

第二三章15几种常见的概率分布

定的区间内,落在一定区间内的概率可 以不为0,但
区间可以很小。随机变量Y的值落在区间(y, y+∆y)
内的概率为P
(y<Y<y+∆y)。当∆y→0时,p(
y

Y y
y

y)
的极限表示随机变量Y在点y处的概率密度,用f(y)表
示,称f(y)为随机变量的概率密度函数。
f ( y) lim p( y Y y y)
n
n
n
x0
(4)总体平均数μ =np=0.85×6=5.1 随机抽6株,平均5.1株成活。
(5)总体方差: σ 2 =npq=6×0.85×0.15=0.765
2 0.765 0.87
表示成活株数平均差异0.87
2.3.3 泊松分布
泊松分布是一种可以用来描述和分析随机地发生在单 位时间或空间里的稀有事件的概率分布。
y0
y
f(y)为随机变量的概率密度函数
f (x)
1
1( x )2
e2
2
正态分布概率密度函数:
分布函数(累积分布函数):是随机变量Y取得小于 y0值的概率,是对概率密度的积分。
F( y) PY y0
y0
f ydy
F() 0, F() 1
&2.2 随机变量的概率分布
随机变量(random variable)就是在随机试验中被测定的量。
2.2.1 离散型随机变量的概率分布
若随机变量X只取数轴上有限个或无限个子孤立 x1,x2,x3…xn ,并且这些值对应的概P1,P2,P3…Pn,则称X是离 散型随机变量.其概率函数为:
p(x)= P(X=x) 或表示为P{X=xi}=pi ,i=1,2,…..
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

几种常见的概率分布
一、 离散型概率分布
1. 二项分布
n 次独立的贝努利实验,其实验结果的分布(一种结果出现x 次的概率是多少的分布)即为二项分布
应用二项分布的重要条件是:每一种实验结果在每次实验中都有恒定的概率,各实验之间是重复独立的
平均数: (Y)np X E μ==
方差与标准差:2(1)X np P σ=-
;X σ=特例:(0-1)分布
若随机变量X 的分布律为
1(x k)p (1p)k k p -==- k=0,1;0<p<1,
则称X 服从参数p 的(0-1)分布
2. 泊松分布
泊松分布是一种用来描述一定的空间和时间里稀有事件发生次数的概率分布
泊松分布变量x 只取零和正整数:0、1、2…..其概率函数为:
(x)!x p e x μμ-=
泊松分布的平均数:(x)E μμ==
泊松分布的方差和标准差:2σμ=
、σ=
3. 超几何分布 P(X=k)=k n k M N M n N C C C -- 记X~(N ,M ,n ) P=M N
期望:E(X)=np
方差:D(X)=np(1-p)1
N n N -- 适用范围:多次完全相同并且相互独立的重复试验,如果在有限总体中不重
复抽样,抽样成功的次数X 的概率分布服从超几何分布,如福利彩票
二、 连续型概率分布
1. 均匀分布
若随机变量X 具有概率密度函数
(x)f =
则称X 在区间(a ,b )上服从均匀分布,记为X ~ U(a ,b)
在区间(a ,b )上服从均匀分布的随机变量X 的分布函数为
0F(x),1
x a x a a x b b a b x ⎧<⎪-⎪=≤<⎨-⎪≤⎪⎩
2指数分布
若随机变量X 具有概率密度函数,0(x)0,0
x e x f x λλ-⎧≥=⎨<⎩ 其中0λ> 是常数,
则称X 服从以λ 为参数的指数分布,记作~()X E λ ,X 的分布函数为
1,0(x)0,0
x e x F x λ-⎧-≥=⎨<⎩
3.正态分布
正态随机变量X 的概率密度函数的形式如下:
22(x )2(x),f x μδ--=-∞<<∞
式中,μ 为随机变量X 的均值;2δ 为随机变量X 的方差。

通常对具有均值μ,方差为2δ的正态概率分布,记为N (μ,2δ)。

于是有正态随机变量X~N (μ,2δ)。

1,;0,a x b b a ⎧<<⎪-⎨⎪⎩其他
4.2χ 分布
如果从标准正态分布N (0,1)的总体中得到n 个随机变量分别为12n ,....,X X X ,
时,则由2i X ∑ 得到的分布叫做自由度为n 的2χ 分布,记为2~n X χ()
2~n X χ() 。

2χ分布的数学期望和方差分别为:
E (X )= n ,D (X )=2n
关于2χ分布的加法定理。

设12,....k X X X ,
,是相互独立的随机变量,且2~(n ),i 1,2,....,i i X k χ=则
2121~(n n ...n )k i
k i X χ=++∑
2χ分布与N (0,1)分布有如下关系:
设12n ,....X X X ,是相互独立的随机变量,并且i X ~(0,1),i=1,2,…n ,则 221~(n)n
i
i X χ=∑ 5.t 分布
设X~N (0,1),2~(n)Y χ ,X 与Y 相互独立,则随机变量
t =
遵从n 个自由度的t
分布,记为~(n)t t =。

t 分布的数学期望和方差如下:
当n>2时,E(t)=0,D(t)=2
n n - t 分布的图形是对称的。

当n<30时,t 分布的分散程度比标准正态分布大,密度函数曲线比较平缓,随着n 的增大,t 分布逐渐逼近标准正态分布。

当n →∞ 时,t 分布渐近标准正态分布。

6.F 分布
设随机变量21~(n )X χ ,22Y ~(n )χ,且X 与Y 相互独立,则称随机变量
12
//X n F Y n 遵从自由度为12(n ,n ) 的F 分布,记作F~F 12(n ,n )
F 分布的形状为正偏态分布状,但随着12n ,n 的增大,其概率密度曲线的偏斜度虽有所缓减却仍保持偏态分布,并不以正态分布为其极限分布形式。

如果~(n)t t ,则2~(1,n)t F 如果12211~F(n ,n ),~F F
F 则(n ,n ) 。

相关文档
最新文档