第三章常用概率分布2010

合集下载

第三章几种重要的概率分布PPT课件

第三章几种重要的概率分布PPT课件

再计算数学期望 E(X2 )
n
n
n
n
E (X 2 )i2 p i[i2 ( i) i] p i( i2 i)p iiip
i 0
i 0
i 0
i 0
i n 0 (i2 i)C n ip iq n i E (X ) i n 0 i(i 1 )i!(n n !i)p ! iq n i np
质:
性质1 pi iei!0(i0,1,2, )
性质2 i 0pi i 0ie i!ei 0 i!i ee1
泊松分布是一种常见的分布,在二项分布中,当试 验次数很大时,而在每次试验中事件A发生的概率
又很小时,即当n ,np 时就是泊松分布。
即有
P X iC inpiqn i i!ie (当 n )
所以台秤不够用的概率为5%。
§3.2 泊松分布
一、泊松分布 定义3.3 若离散型随机变量X的概率分布为
P Xiie (0 )i(0 ,1 ,2 , )
i!
则称离散型随机变量X服从参数为 0 的泊松 (Poisson)分布,记作
X~P()
利出用泊幂 松级 分数 布展 满开 足式离散ex型随 i机0 xi变!i (量 概x率分布) 的,基容本易性看
所以发生交通事故的概率为0.3935。
在计算泊松分布的概率时,可以查泊松分布概率值表 (附表一)。
§3.3 均匀分布
一、均匀分布的概念 定义3.3 若连续型随机变量X的概率密度为
(x)
b
1
a
,
axb
0,
其它
则称连续型随机变量X服从区间[a,b]上的均匀分布,记作
X~U[a,b]
均匀分布显然满足连续型随机变量概率密度的基本性质:

02 常用概率分布&抽样分布

02 常用概率分布&抽样分布

Poisson分布的特点
• 形态:
– 离散分布 – 只取决于 λ,λ 很小时分布很偏,当 λ 增加时,逐渐趋于对称。 – 在 x=λ 和 x=λ-1 处达到峰值,且有
P( x = λ )oisson 分布的总体均数与总体方差 相等,为 λ
Poisson分布的特点
λ = 500 × 0.0008 = 0.4
X ~ P (0.4)
0.4k −0.4 P = 1− ∑ e k =0 k !
5
Poisson分布的正态近似
λ 越小分布越偏,随着 λ → ∞ ,Poisson 分布也 渐近正态,X ~ N (λ , λ ) 。 一般当 λ ≥ 20 时, Poisson 分布进行连续性校正后可按正态分布处理。
医学参考值范围
(Reference Value Range) 一、基本概念
通常指正常人的解剖、生理、生化、免疫及组织 代谢产物的含量等各种数据的波动范围。主要目 的:用于临床疾病诊断。最常用的是95%参考值范 围。
确定95%参考值范围示意图
确定医学参考值范围
例3.9 估计某地健康成年女子的血红蛋白 的95%医学参考值范围
二项分布的Poisson近似
• 设 xi ~ B (n, π ) ,当 n → ∞ ,nπ → c 常数时,此时 xi 的 极限分布是以 c 为参数的 Poisson 分布。 π 越小, 近似越好 例:某地食管癌的发病率 π=8/10000,在当地随即 抽查 500 人,患者至少为 6 人的概率。 P ( X ≥ 6) = 1 − P ( X < 6)
n • 由于上式是二项式 [π + (1 − π )] 展开式中相应地含
π 的项,因此称该分布为二项分布。 • 从阳性率为 π 的总体中随机抽取大小为 n 的样本, 则出现阳性数为 x 的样本的分布为二项分布, 记作 x~B(n, π) 。

《概率分布》课件

《概率分布》课件

06
概率分布的参数估计与假 设检验
参数估计方法
极大似然估计法
通过最大化样本数据的似然函数来估计参数,具有无偏性和一致 性。
最小二乘法
通过最小化误差的平方和来估计参数,适用于线性回归模型。
贝叶斯估计法
基于贝叶斯定理,通过先验信息和样本数据来估计参数,考虑了 参数的不确定性。
假设检验原理
零假设与对立假设
二项分布在统计学、可靠性工程、遗传学等领域有广泛应 用。
泊松分布
01
泊松分布描述了在单位时间内随机事件发生的次数 的概率分布情况。
02
泊松分布的概率函数为P(X=k) = λ^k * e^(-λ) / k! ,其中λ是随机事件发生的平均速率。
03
泊松分布在物理学、工程学、保险学等领域有广泛 应用。
相关系数
相关系数是协方差的归一化形式,用于衡量两个随机变量的线性相关程度,取值范围为 -1到1。
大数定律与中心极限定理
大数定律
大数定律是指在大量重复实验中,某一 事件发生的频率趋于稳定,并收敛于理 论概率。
VS
中心极限定理
中心极限定理表明,无论独立随机变量的 分布是什么,它们的和的分布趋近于正态 分布。
自然现象模拟
自然现象模拟是概率分布应用的另一个领域。在自然科学中,许多自然现象都可 以通过概率分布进行描述和模拟,例如天气变化、地震和疾病传播等。
概率分布在自然现象模拟中主要用于描述自然现象的概率规律,进行模拟和预测 。例如,通过概率分布可以模拟地震发生的概率和强度,预测流行病的传播趋势 等。
人工智能算法
数学期望值是概率分布的中心 位置,表示随机变量的平均值

方差
方差是用来描述概率分布的离 散程度的数值。

常用概率分布

常用概率分布
( pq) / n
第四节 波松分布
波松分布是一种 可以用来描述和分析随机地发生 在单位空间或 时间里的稀有事件的概率分布。 要观察到这类事件,样本含量 n 必须很大 。 如, 一定畜群中某种患病率很低的非传染性疾病 患病数或死亡数, 畜群中遗传的畸形怪胎数, 每升饮水中大肠杆菌数,计数器小方格中血球 数都是服从波松分布的。
率。
3、 在 一次试验中 随机变量x之取值 必在
-∞<x<+∞范围内,为一必然事件。所以
P( x ) f ( x)dx 1 (4-5)


(4—5)式表示分布密度曲线下、横轴上的全 部面
积为1。
第三节 二项分布
非此即彼事件所构成的总体, 为二项总体,其分布称二项分布.
求窝产仔10头,有7头白猪的概率。
根据题意,n=10,p=3/4=0.75,q=1/
4=0.25。设10头仔猪中白色的为x头,则x为服从二
项分布B(10,0.75)的随机变量。于是窝产10头仔猪 中有7头是白色的概率为:
P ( x 7)
7 C10 0.75 7 0.25 3
10! 0.75 7 0.25 3 0.2503 7!3!
第一节 概率基础知识
一、概念:
1、事件: 必然事件 不可能事件 随机事件
2、频率:设事件A在n次重复试验中发生了m次,其比 值m/n称为事件A发生的频率。[0,1]
3、概率:某事件A在n次重复试验中发生了m次,当试 验次数n不断增大时,事件A发生的频率就越接近某一 确定值p
表3-1 抛掷硬币发生正面朝上的试验记录
可称为随机试验的古典概型。其概率可定义如下: 设样本空间由 n 个等可能的基本事件所构成,其 中事件A包含有m个基本事件,则事件A的概率为 m/n,即

常用的概率分布类型与其特征

常用的概率分布类型与其特征

常用的概率分布类型与其特征概率分布是用于描述随机变量取值的概率的数学函数。

在统计学和概率论中,常用的概率分布类型包括离散型分布和连续型分布。

下面将分别介绍常见的离散型分布和连续型分布以及它们的特征。

离散型分布:1. 伯努利分布(Bernoulli distribution)是最简单的离散型分布,用于描述只有两个可能结果的随机试验,如抛硬币。

特征是一个参数p,表示取得成功的概率,取值为0或12. 二项分布(Binomial distribution)是伯努利分布的扩展,用于描述独立重复进行的二项试验中成功次数的概率分布。

特征是两个参数n和p,n表示试验次数,p表示单次试验成功的概率。

3. 泊松分布(Poisson distribution)用于描述单位时间内事件发生次数的概率分布。

特征是一个参数λ,表示单位时间内事件平均发生的次数。

连续型分布:1. 均匀分布(Uniform distribution)是最简单的连续型分布,用于描述在一个区间内各个取值概率相等的情况。

特征是两个参数a和b,表示区间的上下界。

2. 正态分布(Normal distribution)是最常见的连续型分布,也称为高斯分布。

在许多自然现象中常见,如测量误差、生物学特征等。

特征是两个参数μ和σ,μ表示均值,σ表示标准差,曲线呈钟形。

3. 指数分布(Exponential distribution)用于描述不断独立进行的事件中第一个事件发生的时间间隔的概率分布。

特征是一个参数λ,表示事件发生的速率。

4. γ(伽玛)分布(Gamma distribution)也用于描述事件发生的时间间隔,但相对于指数分布而言,γ分布更加灵活,可以包含更多的形态。

特征是两个参数α和β,α表示发生的次数,β表示单位时间间隔内的事件平均发生次数。

5. β分布(Beta distribution)用于描述由有限个独立事件组成的随机变量的概率分布,其取值范围在[0, 1]之间。

概率论中几种常用的重要的分布

概率论中几种常用的重要的分布

伯努利试验、泊松过程、独立同分布生成的重要分布敖登(内蒙古大学数学科学学院2010级数理基地,01008104)摘要本文是一篇读书报告。

主要研究了伯努利试验与二项分布的关系,泊松过程生成泊松分布的过程和在泊松条件下的埃尔朗分布,正态分布的生成用到的独立同分布以及均匀分布生成任意分布的重要性质。

关键词:伯努利试验泊松分布独立同分布均匀分布的生成性Important in theory of probabilitydistribution of explorationAuthor:Ao DengTutor: Luo Cheng (School of Mathematical sciences ,Huhhot Inner Mongolia 01008104 )AbstractThis article mainly discusses the theory of several common distribution (0-1) distribution, binomial distribution, poisson distribution and uniform distribution, exponential distribution, normal distribution and normal distribution out three kinds of important distribution, distribution, distribution and the distribution of the source and the relationship among them and their application in actual.Key words: random variable; The discrete distribution ;Continuous distribution目录第一章伯努利试验生成二项分布 (4)第二章泊松过程生成泊松分布 (6)第三章独立同分布生成正态分布 (13)第四章均匀分布的生成性 (17)第五章几种重要分布的比较及应用 (19)小结 (22)致谢………………………………………………………………………………23. 参考文献…………………………………………………………………………24.第一章 伯努利试验生成二项分布考虑n 重伯努利实验中成功次数ξ.易见ξ的可能值为0,1,2,...,k n =.注意{}k ξ=当且仅当这n 次实验中恰有k 个成功A 与n k -个失败A .先考虑前k 次试验全成功而后n k -次试验全失败这一特殊情形.可得出现这种结果的概率{......}()...()()...()k n k k n k k n k p A A A A P A P A P A P A p q ---==个个个个注意所得结果仅与A 的个数k 有关,与A 出现在哪k 个位置上无关.再者,在这n次试验中选择k 次成功共有n k ⎛⎫⎪⎝⎭种方式,且各种方式两两不相容,故由可加性立得ξ的密度{}k n k n p k p q k ξ-⎛⎫== ⎪⎝⎭, 0,1,2,...,k n =一般地,任给定自然数n 及正数p ,(1)q p q +=,令0(;,)nk n k k n b k n p p q k -=⎛⎫= ⎪⎝⎭∑则(;,)0b k n p 且0(;,)nk n k k n b k n p p q k -=⎛⎫= ⎪⎝⎭∑()1n p q =+=称以{(;,)}b k n p 为密度的离散型分布为二项分布,记作(,)B n p .当1n =时的特例又称作伯努利分布.这是一个两点分布,其密度称阵为01 q p ⎛⎫⎪⎝⎭.上述推导表明,n 重伯努利试验的成功次数ξ服从参数为,n p 的二项分布(,)B n p .下面讨论二项分布的性质,对,考虑比值(;,)(1)(1)1(1;,)b k n p n k n p kb k n p kq kq-++-==+-易见,当(1)kn p +时,(;,)(1;,b k n p b k n p -:而当(1)kn p +时,(;,)(1;,b k n p b k n p -.这说明,对任何固定的参数n 与p ,(;,)b k n p 的值先随k的变大而上升,再随k 的变大而下降,于是必有最大值.如果(1)m n p =+是整数,则(;,)(1;,)b m n p b m n p =-同为(;,)b k n p 的最大值.如果(1)n p +不是整数,则(;,)b k n p 在[(1)]m n p =+处取到最大值(这里[]a 表示不超过a 的整数).我们称使(;,)b k n p 取到最大值的m 为二项分布随机变量的最可能值,或称为n 重伯努利试验的最可能成功次数。

常用概率分布

常用概率分布
关于 左右对称,正态高峰位于中央 在 处取得该概率密度函数的最大值,在 x处
有拐点,表现为钟形 靠近 x 处曲线下面积较为集中,两边减少,意味
着正态分布变量取值靠近 x处 的概率较大,两 边逐渐减少 正态分布的总体偏度系数和峰度系数均为0
8
正态分布曲线下面积
正态分布变量X的取值为(-∞,∞)
23
四、二项分布的图形
24
图形特点:两个轴意义,对称、偏态、与 正态分布的关系
决定图形的两个参数:n,
25
五、样本率的均数和标准差
样本率的总体均数p:
p
1 n
x
1 n
(n )
样本率的总体标准差p:
p
1 n
x
(1 )
n
样本率的标准差(标准误)Sp:
Sp
p(1 p) n
26
根据中心极限定理,在n较大,n(1- )均大于5时,二项分 布接近于正态分布。当n → ∞ , 二项分布B(n,)的极限分布 是总体均数为X = n、总体方差 X2 = n(1-)的正态分布 N(n, n(1-))。这个时候可以用正态分布N(n, n(1-)) 作近似计算。
16
确定医学参考值范围
例 估计某地健康成年女子的血红蛋白的95% 医学参考值范围
具体步骤如下: 1. 根据研究背景确定研究对象的入选标准和排
除标准。这类研究一般要求参加体检并且要 求除研究指标血红蛋白指标外,其他指标均 正常的对象。 2. 根据研究背景,确定血红蛋白过高或过低均 属于不正常(双侧范围)。
6. 如果受检指标血红蛋白呈偏态分布,则可 以用百分位数P2.5~P97.5确定95%参考值 范围,但样本量要充分大。
7. 样本量充分大是相对与指标的变异程度, 指标变异大,要求样本量大;指标变异程 度小,要求样本量可以相对小一些。

《常用概率分布》PPT课件

《常用概率分布》PPT课件

n=20,π=0.5
π=0.5时,不同n值对应的二项分布
n=5,π=0.3
n=10,π=0.3
n=30,π=0.3
π=0.3时,不同n值对应的二项分布
二项分布图的形态取决于π和n,高峰在µ= πn处
➢ 当π=0.5,图形是对称的; ➢ 当π≠0.5,图形不对称;π离0.5愈远,对称性愈差,
但随着n的增大,分布趋向于对称.
〔2〕其中最少有2人感染的概率有多大?
解:P(x ≥ 2)= x1=5∑02 C150x 0.13x(0.97)150-x
= 1 -(C1500 0.130 × 0.97150 +C1501 0.131 × 0.97149) ≈1
〔3〕其中最少有20人感染的概率有多大?
解:P(x ≥
150
20)=
∑C150x
第一节 二项分布及其应用
1.1 二项分布的概念和函数 1.2 二项分布的特征 1.3 二项分布的应用
一、二项分布的概念 和概率函数
摸球模型
一个袋子里有5个乒乓球,其中2个黄球、3个白球, 我们进行摸球游戏,每次摸1球,放回后再摸.先后摸 100次,请问:
⑴摸到0次黄球的概率是多大?
解:① 每次摸到白球的概率 =0.6
〔1〕至多有4人患先天性心脏病的概率是多少? 〔2〕至少有5人患先天性心脏病的概率是多少?
举例2:实验室显示某100cm2的培养皿中平均菌落数为6
个,试估计<1>该培养皿中菌落数小于3的概率,
<2>大于1个的概率.
解析:菌落长、不长
二项分布
长概率很小, n很大
Poission分布
故:
=nπ=6 (1) P(x<3)=

概率论第三章

概率论第三章

8 July 2010
联合密度函数的基本性质 (1) p(x, y) ≥ 0. (非负性) (2) (正则性)
注意: P{(X,Y) ∈D} = ∫∫ p(x, y)dxdy
D
8 July 2010
3.1.5
一,多项分布
常用多维分布 常用多维分布
若每次试验有r 种结果:A1, A2, ……, Ar 记 P(Ai) = pi , i = 1, 2, ……, r 记 Xi 为 n 次独立重复试验中 Ai 出现的次数. 则 (X1, X2, ……, Xr)的联合分布列为:
2x
+∞
1 2x +∞ 1 3y +∞ = A e × e 2 0 3 0
=A/6 所以, A=6
8 July 2010
例3.1.4
6e(2x+3y) , x ≥ 0, y ≥ 0 若 (X, Y) ~ p( x, y) = 其 它 0,
试求 P{ X< 2, Y< 1}.
8 July 2010
注 意 点 (2)
二维正态分布的边际分布是一维正态: 若 (X, Y) N ( ), 则 XN( ), YN( ).
二维均匀分布的边际分布不一定是一维均匀分布.
8 July 2010
例3.2.1 设 (X, Y)服从区域 D={(x, y), x2+y2 <1} 上的均匀分布,求X 的边际密度p(x). 解: 由题意得
e y , 0 < x < y p( x, y) = 其 他 0,
求概率P{X+Y≤1}. 解: P{X+Y≤1}=
1/2
1x x
y=x
x+y=1
= ∫ dx∫

常用的概率分布类型及其特征

常用的概率分布类型及其特征

常用的概率分布类型与其特征3.1 二点分布和均匀分布1、两点分布许多随机事件只有两个结果.如抽检产品的结果合格或不合格;产品或者可靠的工作,或者失效.描述这类随机事件变量只有两个取值,一般取0和1.它服从的分布称两点分布.其概率分布为:其中 Pk=P〔X=Xk〕,表示X取Xk值的概率:0≤P≤1.X的期望 E〔X〕=PX的方差 D〔X〕=P〔1—P〕2、均匀分布如果连续随机变量X的概率密度函数f〔x〕在有限的区间[a,b]上等于一个常数,则X服从的分布为均匀分布.其概率分布为:X的期望 E〔X〕=〔a+b〕/2X的方差 D〔X〕=〔b-a〕2/123.2 抽样检验中应用的分布3.2.1 超几何分布假设有一批产品,总数为N,其中不合格数为d,从这批产品中随机地抽出n 件作为被检样品,样品中的不合格数X服从的分布称超几何分布.X的分布概率为:X=0,1,……X的期望 E〔X〕=nd/NX的方差 D〔X〕=〔〔nd/N〕〔〔N-d〕/N〕〔〔N-n〕/N〕〕〔1/2〕3.2.2 二项分布超几何分布的概率公式可以写成阶乘的形式,共有9个阶乘,因而计算起来十分繁琐.二项分布就可以看成是超几何分布的一个简化.假设有一批产品,不合格品率为P,从这批产品中随机地抽出n件作为被检样品,其中不合格品数X服从的分布为二项分布.X的概率分布为:0<p<1x=0,1,……,nX的期望 E〔X〕=npX的方差 D〔X〕=np〔1-p〕3.2.3 泊松分布泊松分布比二项分布更重要.我们从产品受冲击〔指瞬时高电压、高环境应力、高负载应力等〕而失效的事实引入泊松分布.假设产品只有经过一定的冲击次数后,产品才失效,又设这些冲击满足三个条件:〔1〕、两个不相重叠的时间间隔内产品所受冲击次数相互独立;〔2〕、在充分小的时间间隔内发生两次或更多次冲击的机会可忽略不计;〔3〕、在单位时间内发生冲击的平均次数λ〔λ>0〕不随时间变化,即在时间间隔Δt内平均发生λΔt次冲击,它和Δt 的起点无关.则在[0,t]时间内发生冲击的次数X服从泊松分布,其分布概率为:X的期望 E〔X〕=λtX的方差 D〔X〕=λt假设仪表受到n次冲击即发生故障,则仪表在[0,t]时间内的可靠度为:其中:x =0,1,2,……,λ>0,t>0.3.2.4 x2分布本分布是可靠性工程中最常用的分布之一,虽然其概率密度形式较复杂,但可由标准正态分布推出.设有v个相互独立的随机变量X1,X2,…… Xv,它们服从于标准正态分布N 〔0,1〕.记x2 =X12 + X22 +…Xv2 ,x2读作"卡方"则x2服从的分布称为x2分布.它的概率密度函数为:该式称为随机变量x2服从自由度为V的x分布.式中:V—为自由度,是个自然数x2分布最重要的性质是:当m为整数时:3.3 产品的寿命分布3.3.1 指数分布指数分布是电子产品在可靠性工程学中最重要的分布.通常情况下,电子产品在剔除了早期故障后,到发生元器件或材料的老化变质之前的随机失效阶段其寿命服从指数分布规律.指数分布是唯一的失效率不随时间变化而变化的连续随机变量的概率分布.容易推出:指数分布有如下三个特点:1.平均寿命和失效率互为倒数;MTBF=1/λ2.特征寿命就是平均寿命;3.指数分布具有无记忆性.〔即产品以前的工作时间对以后的可能工作时间没有影响〕3.3.2 威布尔分布从上面的描述可知,指数分布只适用于浴盆曲线的底部,但任何产品都有早期故障,也总有耗损失效期.在可靠性工程学中用威布尔分布来描述产品在整个寿命期的分布情况.将指数分布中的〔-λt〕替换为〔-〔t/η〕m〕,就得到威布尔分布.容易得到:3.3.3 正态分布与对数正态分布正态分布又称为常态分布或高斯分布.它的概率密度函数为:式中:-∞<x<∞分布函数记为:对数正态分布是指:若寿命T的对数lnT服从正态分布N〔u,σ〕,则T服从对数正态分布.它的概率密度函数为:式中:t,σ为正数,μ和σ分别称为对数正态分布的"对数均值"和"对数标准差".3.4 为进行统计推断所构造的分布3.4.1 t分布〔学生氏分布〕t—分布常用于区间估计、正态总体的假设检验以与机械概率设计之中.服从t—分布的随机变量记住t.它是服从标准正态分布N〔0,1〕的随机变量U和服从自由度为v的x2分布的随机变量x2〔v〕的函数.它的概率密度函数f〔t〕为:3.4.2 F—分布F分布主要用于两个总体的假设检验与方差分析.服从F分布的随机变量F是两个相互独立的x2分布随机变量x2〔v1〕和x2〔v2〕的函数:式中:F只能取正值.F分布的概率密度函数为:另外还有β—分布等.中位秩是β—分布的中位数,一般用下式求出:中位秩值≈〔i-0.3〕/<n+0.4> 式中:n为样本总数.。

常见概率分布表(超全总结)

常见概率分布表(超全总结)
������ ������ ������
指数分布 (负指数分布)
Γ(1, ������)
������ > 0
������
������ 2
注:指数分布是Γ分布的特殊情况
n
2n
χ2 分布
������ 2 (������)
������ ≥ 1
f(x) = {
2n⁄2 Γ(������⁄2) 0 ,
������ ≥ 1
������ > 0
均匀分布
U(a, b)
a<b
K=0,1,2,… 1 , ������ < ������ < ������ f(x) = {������ − ������ 0, 其它 f(x) = 1 f(x) = {√2������������������ 1 √2������������ ������ ������ −(������−������)
非中心χ 分布
2
������ f(x) = {
������+������ −( 2 ) ∞
������ (������, ��� 0
2������⁄2
������ 2+������−1 ������������ ∑ ������ , (������ > 0) 2������ ������=0 Γ (2 + ������) 2 ������! 0 , 其它
逆高斯分布
N (μ, λ)
−1
λ, μ > 0
Γ分布
连 续 型
(伽玛分布)
Γ(������, ������)
������, ������ > 0
1 ������ ������−1 ������ −������⁄������ , ������ > 0 f(x) = {������ ������ Γ(������) 0 , 其它 1 −������ ������ ������ , ������ > 0 f(x) = { ������ 0 , 其它 1 ������ 2 −1 ������ −2 , ������ > 0 其它

几种常见的概率分布率 (1)

几种常见的概率分布率 (1)

0 0.1 0.08 0.06 0.04 0.02 0
100
200 300 n=500,p=0.01
400
500
γ1=0.84 γ2=0.51
γ1=0.27 γ2=0.05
γ1=0.12 γ2=0.01
0
n=10,p=0.10
25 50 75 n=100,p=0.10
100
0 0.05 0.04 0.03 0.02 0.01 0
解: 设 p为非棕色短毛兔出现的概率,则 1- p就为棕色短毛
兔出现的概率。
在 [p+(1-p)]n 的展开式中只有第一项 pn 无棕色短毛兔 出现,因此n值可由pn=1-0.99求出。 pn =(15/16)n = 0.01
n(lg15-lg16)= lg0.01 -0.02803n =-2.00000 n =71.4
二、 二项分布应用实例
例3.2 用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔杂交, F1代为黑色正常毛长的家兔 (BbRr), F1代自交,F2代表型比为: 9/16B_R_ : 3/16B_rr : 3/16bbR_ : 1/16bbrr。问最少需要多少 F2代家兔,才能以99%的概率得到一个棕色短毛兔(bbrr)?
100 200 300 400 n=500,p=0.10
500
γ1=0
γ2=-0.02
γ1=0
γ2=0
γ1=0 γ2=-0.20
4 6 8 n=10,p=0.50
0. n=100,p=0.50 100
0
100 200 300 n=500,p=0.50
400
500
=
=
x
x! x
x!
(1 - p) n - x
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6 f (6) C10 0.56 (1 0.5)106 6 4 10! 0 . 5 0 .5 6!(10 6)! 0.2051
产公猪头数的期望值: E ( X ) np 10 0.5 5 产公猪头数的方差: Var( X ) np(1 p) 10 0.5 0.5 0.25
可查P302 t 分布的双侧分位表。
例:df=4
双侧 t0.05=2.776 t0.01=4.604
单侧 t0.05=2.132 t0.01=3.747
T表
自由度
F分布(F-distribution) 2分布(Chi-Square)
样本均数的标准差 x


n 2 的正态分布。 故样本均数的分布是服从 x — N(, ) n
t 分布
当以样本s 估计 时(n < 30 ),得到统计量:
x t sx
W.S.Gosset(歌赛特,英国,1777~1855)
1908年以“Student(学生)”为笔名在该年的
Biometrika上发表了论文《平均数的概率误差》, 创立了小样本检验代替大样本检验的理论,即t分布 和t检验法,也称为学生氏分布。
正态分布
平均数的影响
标准差的影响
正态分布
标准正态分布(standard normal distribution) 对于 X ~ N ( , 2 ) 令 Z X 标准化
E(Z ) 1 [ E( X ) ] 1 ( ) 0


1 [Var( X ) Var( )] 1 ( 2 0) 1 Var( Z ) 2 2
3 3 3 3 3 3 3 3 1 e e e e 0 ! 1! 2! 3!
0 1 2 3
=0.3528
连续型随机变量的概率分布
正态分布(normal distribution)
具有如下概率密度函数的随机变量称为正态 分布随机变量:
(x )2 f ( x) e[ ] 2 2 2 x 1
标准正态分布的双侧分位数
标准正态分布的双侧分位数表 ----附表2 (p. 299)
对于给定的两尾概率求标准正态分布在 x轴上的分位点
/2 /2
(1)设标准正态分布的两尾概率之和 0.05 ,求分位数u值。 由附表2可直接查得分位数为u = 1.959964 (2) 0.01 , 分位数为u = 2.575829
离散型随机变量的概率分布
普哇松分布(Poisson distribution)
描述稀有事件的试验,对于二项分布 X ~ B(n, p) 如果概率P很小,试验次数n很大 ,则二项分布 趋近普哇松分布,表示为:
x ~ p ( )
离散型随机变量的概率分布
普哇松分布的概率函数
p ( X x)
第三章
常用概率分布
二项分布 普哇松分布 正态分布 抽样分布
离散型随机变量的概率分布
二项分布(binomial distribution)
假设:1. 在相同条件下进行了n次试验 2. 每次试验只有两种可能结果(1或0) 3. 结果为1的概率为p,为0的概率为1-p 4. 各次试验彼此间是独立的 在n次试验中,结果为1的次数(X = 0,1,2, ,n)服从二项分布,表示为
二项分布的方差
Var( X ) np(1 p)
2
离散型随机变量的概率分布
例1:一头母猪一窝产了10头仔猪,分别求其
中有2头公猪和6头公猪的概率。
2 f (2) C10 0.52 (1 0.5)102 2 8 10! 0 .5 0 . 5 2!(10 2)! 0.0439
1
2
正态分布
(1) P( Z u) 或 P(Z -u) (u > 0)
P(Z u) P(Z u)
直接查表
标准正态分布的概率计算
标准正态分布函数表----附表1 (p. 297)
(1) 直接查附表1,P(Z 0.64)= 0.7389; (2) P( Z 1.53)= 1 - P( Z 1.53)= 1 – 0.9370 = 0.0630; (3) P (2.12 Z 0.53)= P (Z -0.53)- P (Z 2.12) = 0.2981 – 0.0136 = 0.2811。
正态总体样本平均数的抽样分布
1、中心极限定理:从正态总体N(µ,σ2)抽样,样本均数的分 布服从正态分布;若从非正态总体抽样,当n→∞ (n>30)样本均 数的分布亦接近正态分布。 2、设原总体的期望为,方差为 2 ,则样本平均数的期望为 ,方差为 2 /n
样本均数的均数(期望) x


Z服从正态分布
Z ~ N (0,1)
标准正态分布
正态分布
标准正态分布的概率密度函数
f ( z) z2 e[ ] 2 2 1 z
0
正态分布
标准正态分布的概率计算
附表1 (p. 297)
P( Z u )

u

f ( z )dz



z e( )dz 2 2
标准正态分布的双侧分位数
标准正态分布几个常用的分位数值:
双侧(尾)概率: 0.05 时,u = 1.96 下面是标准正态分布的几个特殊的且常用的分位数值: 当双尾概率为0.05时,u = 1.96 0.01 时,u = 2.58 单侧(尾)概率: 0.05 时,u = 1.64(-1.64) 0.01 时,u = 2.33(-2.33)

x
x!
e

普哇松分布的期望与方差

2
离散型随机变量的概率分布
例2:某遗传病的发病率为0.0003,某鸡场有10000头 肉鸡,问今年发生该遗传病4头及4头以上的概率有 多少? λ=μ=np=10000×0.0003=3 x=4 P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
X ~ B(n, p)
离散型随机变量的概率分布
二项分布的概率函数
f ( x)
x x Cn p (1
p)
n x
E ( X ) xi f ( xi ) np
x n x n! p (1 p ) ( x 0,1,2, , n) x!(n x)! 二项分布的期望 E ( X ) xi f ( xi ) np
= 期望 2 = 方差
X ~ N( , )
2
正态分布
正态分布概率密度函数的几何表示
f (x)
正态曲线

x
曲线下某区间的面积即为随机变量在该区间取值的概率
正态分布
正态分布的特点
只有一个峰,峰值在x = 处 曲线关于x = 对称,因而平均数=众数=中 位数 x轴为曲线向左、右延伸的渐进线 由两个参数决定: 平均数 和 标准差 • 决定曲线在x 轴上的位置 • 决定曲线的形状
标准正态分布的双侧分位数表 ----附表2 (p. 299)
对于给定的一尾概率求标准正态分布在 x轴上的分位点
0.05
/2
0.01
/2
(1)设标准正态分布的右尾(左尾)概率为 0.05 ,求分位数u值 用2 查附表2,可得一尾概率为 时的分位数u值 = 20.05 = 0.1查表得u = 1.644854 。 (2) 0.01 , = 20.01 = 0.02查表得u = 2.326348
1. t 分布图像类似于标准正态分布,两侧对称,均数为 0。 2. t 分布曲线随样本自由度不同而异, 与正态曲线相比,离散度
较大,顶部略低,尾部略高。自由度小的t 分布,更为明显。
n>30时, t 分布接近于标准正态分布; n>100时,t 分布基本与标准正态分布相同; n→∞时,t 分布与标准正态分布完全一致。 3. t 分布概率求法
当双尾概率为0.01时,u = 2.58 当右尾概率(左尾概率)为0.05 时,u = 1.64(-1.64) 当右尾概率(左尾概率)为0.01 时,u = 2.33(-2.33)
抽样分布 P43
样本统计量的概率分布 称为抽样分布
原总体
样本1 样本2

样本n
n 统计量
x1
x2
新总体
xn
相关文档
最新文档