第三章常用概率分布

合集下载

第三章几种常见的概率分布律

PY 2 C32 (0.05)2 (0.95)32 0.007125
二项分布的程序计算方法
❖ 二项分布函数Binomdist（k,n,p,false/true）
❖ 某数阶乘的计算函数Fact
❖ 从给定元素数目m的集合中抽取若干n元素的排列
组合数C
n m
计算函数Combin（m，n）
n
n
（2） P(y) Cny y (1 )ny [ (1 )]n 1n 1
y0
y0
例一，纯种白猪与纯种黑猪杂交，根据孟德尔遗传理论，子二代中白猪与黑猪的比率为3:1。求窝产仔10头，有7头白猪的概率。
解：根据题意，这是一个二项分布的问题，
视白猪为成功，有 n 10, ＝ 3 0.75，y 7。
例如：抛一枚硬币，看得到正面还是反面；掷一次骰子，看得到6还是没有得到6；随机抽查一名婴儿的性别，看是男是女
在贝努利试验里，两种结果可分别称为“成功”和“失败”，或者“事件A发生”和“事件A没有发生”。
• 什么情形时应用二项分布：实验中进行了n次独立的贝努利试验，统计在这n次试验中总共获得了多少次“成功”。“成功”的次数，记为变量Y；Y称为二项分布变量，Y的概率分布称为二项分布。
每种方式发生的概率为：
乘法法则
P(ssff) P(s)P(s)Pf()P(f) (1 ) (1 ) 2 (1 )2
其它5种方式发生的概率也是如此。
因此，在n 4次试验中取得y 2次成功的概率为
P(2) C42 2 (1 )42
** 由此类推到一般情形，在n此贝努利试验中，共获得 y次成功的概率是
2. 二项分布的常用符号
n :贝努利试验的次数（或样本含量） y :在n次试验中事件 A出现的次数，即二项分布变量Y的取值

第3章常用概率分布(田间试验与统计分析四川农业大学)

P（“至少1粒种子出苗”） = P(x=1)+P(x=2)+…+P(x=6) = C610.6710.335 C62 0.6720.334 C66 0.6760.330 = 0.0157＋0.0799＋0.2162 ＋0.3292＋0.2672＋0.0905 = 0.9987
二项分布的应用条件：
在统计学上，把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理，亦称为小概率原理(small probability principle)。
小概率事件实际不可能性原理是统计学上进行假设检验（显著性检验）的基本依据。
第二节概率分布
事件的概率表示了一次试验某一个结果发生的可能性大小。
标准正态分布的概率密度函数及分布函数分别记作ψ(u)和Φ(u)。
(u)
1
u2
e2
2
(u) 1
u 1u2
e 2 du
2
u～N(0，1)
对于任何一个服从正态分布N(μ,σ2)的随机变量x，都可以通过标准化变换：
u x
将其变换为服从标准正态分布的随机变量u。
一、正态分布的定义及其特征
（一）正态分布的定义若连续型随机变量 x 的概率分布密度函数为
其中μ为平均数，σ2为方差，则称随机变量 x 服从正态分布(normal distribution) ，记为x~N(μ, σ2)。
相应的概率分布函数为：
F(x) 1
e dx x

(
x) 2 2
对于样本是取自连续型随机变量的情况，这条函数曲线将是光滑的。这条曲线排除了抽样和测量的误差，完全反映了水稻行产量的变动规律。这条曲线叫概率分布密度曲线，相应的函数叫概率分布密度函数。

第三章常用概率分布之正态分布

图4.13 离均差的绝对值≤1 , 2 和3 的概率值
随机变量x在区间( μ – kσ, μ + kσ )外取值的概率P ( x<μ – kσ ) + P( x>μ + kσ )为两尾概率，记为α P ( x<μ – kσ ) + P( x>μ + kσ )=α P ( x<μ – kσ ) = P( x>μ + kσ )=α/2 两尾分位数Uα
=0.0227
0.020
fN (x)
0.020
fN (x)
0.016
0.016
0.012
0.012
0.008
P( y 40) 0.9773
P( y 26) 0.2119
0.008
0.004
0.004
0.000 10 15 20 25 30 35 40 45
0.000 10 15 20 25 30 35 40 45
第三章
常用概率分布
第一节事件与概率第二节概率分布第三节二项式分布第四节正态分布第五节样本平均数抽样分布与标准误第六节 t分布，x2分布和F分布
第三章
常用概率分布
第一节事件与概率第二节概率分布第三节二项式分布第四节正态分布第五节样本平均数抽样分布与标准误第六节 t分布，x2分布和F分布
首先计算：
查附表2，当u=－0.8时，FN(26)=0.2119，说明这一分布从－∞到26范围内的变量数占全部变量数的 21.19%，或者说，y≤26概率为0.2119. 同理可得： FN(40)=0.9773
所以：P(26＜y≤40)=FN(40)－FN(26)=0.9773－0.2119

第3章几种常见的概率分布律

服从
U
110k 2
,
110k 2
的
r.v.
随机变量
期望
区间(a,b)上的均匀分布
f
(
x)
b
1
a
,
0,
a x b, 其它
ab 2
方差
区间(a,b)上的均匀分布
f
(x)
b
1
a
,
0,
a x b, (b a)2 其它 12
(2) 指数分布若 X 的d.f. 为
ex , x 0
(2) 二项分布 n 重Bernoulli 试验中, X 是事件A 在 n 次试验中发生的次数 , P (A) = p ,则
Pn (k) P( X k) Cnk pk (1 p)nk , k 0,1,, n
称 X 服从参数为n, p 的二项分布，记作
X ~ B(n, p)
0–1 分布是 n = 1 的二项分布
其期望和方差都是
在某个时段内：
① 大卖场的顾客数；
应用
② 市级医院急诊病人数； ③ 某地区拨错号的电话呼唤次数； ④ 某地区发生的交通事故的次数.
场 ⑤ 放射性物质发出的粒子数；
合 ⑥ 一匹布上的疵点个数；
⑦ 一个容器中的细菌数；
⑧ 一本书一页中的印刷错误数；
都可以看作是源源不断出现的随机质点流 , 若它们满足一定的条件, 则称为 Poisson 流, 在长为 t 的时间内出现的质
Show[fn1,fn3]
小
0.5 0.4
大 0.3 0.2 0.1
-6
几何意义数据意义
-5 -4 -3 -2 -1
大小与曲线陡峭程度成反比大小与数据分散程度成正比

概率论第三章

若二维随机变量（若二维随机变量（X,Y）具有概率密度） 1 1 x − µ1 2 f (x, y) = exp{− ) 2 [( 2 2(1− ρ ) σ1 2πσ1σ2 1− ρ x − µ1 y − µ2 y − µ2 2 )( ) +( ) ]} − 2ρ( 其中
µ1, µ2,σ1,σ2, ρ
3.1.2、二维随机变量的联合分布函数、维随机变量的联合联合分布函数
二维随机变量（二维随机变量（X,Y）） ( X , Y )的联合分布函数 )的联合分布函数
一维随机变量X 一维随机变量 X的分布函数的分布函数
F(x, y) = P(X≤ x,Y ≤ y) − ∞ < x, y < ∞
xi ≤3yj ≤2
求：F(3,2) = P(X≤ 3,Y ≤ 2) = ∑∑pij
1 1 1 1 = + 0+ 0+ + + 0 = 4 8 8 2
例２设随机变量 Y ~ E (1) ，随机变量
0 , 若Y ≤ k ( k = 1，） 2 Xk = 1 , 若Y > k 的联合概率分布列。求 X 1 和 X 2 的联合概率分布列。
第三章多维随机变量及其分布
到现在为止，到现在为止，我们只讨论了一维随机变量及其分布. 及其分布. 但有些随机现象用一个随机变量来描述还不够，描述还不够，而需要用几个随机变量来描述在打靶时, 在打靶时,命中点的位置是由一对随机变量(两个坐标)来确定的. 对随机变量(两个坐标)来确定的. 飞机的重心在空中的位置是由三个随机变量(三个坐标）机变量(三个坐标）来确定的等等. 确定的等等.
1/ 4 x 1 1 解: (3)P( X < ,Y < ) = ∫0 [∫0 3xdy]dx 4 2

常用概率分布

关于左右对称，正态高峰位于中央在处取得该概率密度函数的最大值，在 x处
有拐点，表现为钟形靠近 x 处曲线下面积较为集中,两边减少,意味
着正态分布变量取值靠近 x处的概率较大,两边逐渐减少正态分布的总体偏度系数和峰度系数均为0
8
正态分布曲线下面积
正态分布变量X的取值为(-∞,∞)
23
四、二项分布的图形
24
图形特点：两个轴意义，对称、偏态、与正态分布的关系
决定图形的两个参数：n，
25
五、样本率的均数和标准差
样本率的总体均数p:
p
1 n
x
1 n
(n )
样本率的总体标准差p:
p
1 n
x
(1 )
n
样本率的标准差（标准误)Sp:
Sp
p(1 p) n
26
根据中心极限定理，在n较大，n(1- )均大于5时，二项分布接近于正态分布。当n → ∞ , 二项分布B(n,)的极限分布是总体均数为X = n、总体方差 X2 = n(1-)的正态分布 N(n, n(1-))。这个时候可以用正态分布N(n, n(1-)) 作近似计算。
16
确定医学参考值范围
例估计某地健康成年女子的血红蛋白的95% 医学参考值范围
具体步骤如下： 1. 根据研究背景确定研究对象的入选标准和排
除标准。这类研究一般要求参加体检并且要求除研究指标血红蛋白指标外，其他指标均正常的对象。 2. 根据研究背景，确定血红蛋白过高或过低均属于不正常（双侧范围）。
6. 如果受检指标血红蛋白呈偏态分布，则可以用百分位数P2.5～P97.5确定95%参考值范围，但样本量要充分大。
7. 样本量充分大是相对与指标的变异程度，指标变异大，要求样本量大；指标变异程度小，要求样本量可以相对小一些。

田间试验与统计分析第三章概率和概率分布课件

发芽频率 0.9 0.95 0.92 0.93 0.93 0.91 0.92 0.92 0.91 0.92 0.92 0.92
概率的统计定义
在相同条件下进行n次重复试验，如果随机事件A发生的次数为 m ，那么 m/n 称为随机事件 A 的频率（frequency）；当试验重复数n逐渐增大时，随机事件A的频率越来越稳定地接近某一数值p，那么就把 p 称为随机事件A的概率。
一、统计概率的含义
事件：在试验的结果中所发生的现象
概率：每一事件出现的可能性
随机事件：在相同条件下，对事物或现象所进行的观察，其试验结果具有以下特点：可以在相同的条件下重复进行；每次试验结果可能不止一个；试验的所有可能结果在试验之前是确切知道的，但在试验结束之前，不能确定该次试验的确切结果。
对于随机事件，如果要研究它的规律性，必须通过大量重复观察、调查或试验，从而计算在相同条件下发生这
类事件的可能程度大小。
水稻某品种种300 400 500 600 800 1000
发芽粒数 9 19 41 93 141 182 277 365 458 555 733 921
（
）区间内的概率。
在实际应用中，凡计算正态分布区间概率时，先将x
转换为u值，然后查附表2，便可得到x落于这一区间
的概率。
例1：
计算生物统计中的常用的几个概率植： (1) P(μ-σ＜ X ≤ μ+σ) (2) P(μ-2σ＜ X ≤ μ+2σ) (3) P(μ-3σ＜ X ≤ μ+3σ) (4) P(μ-1.96σ＜ X ≤ μ+1.96σ) (5) P(μ-2.58σ＜ X ≤ μ+2.58σ) (6) P(︱X︱≥ μ+1.96σ ) (7) P(︱X︱≥ μ+2.58σ )

数学初中二年级下册第三章概率分布的认识与运算

数学初中二年级下册第三章概率分布的认识与运算数学初中二年级下册第三章：概率分布的认识与运算在初中数学的学习中，概率是一门重要的数学分支。

概率分布是概率的重要内容之一，它描述了不同事件发生的可能性。

在初中二年级下册的数学教材中，第三章主要介绍了概率分布的认识与运算。

本文将深入探讨这一章节的内容，帮助读者更好地理解和运用概率分布。

1. 基本概念引入概率分布是指在一次试验中，各种可能结果发生的概率情况。

在初中二年级下册第三章的学习中，通过一系列的例子和练习，我们可以了解到概率分布的基本概念和计算方法。

2. 离散型概率分布离散型概率分布是指概率与某个随机变量关联的概率分布。

在学习中，我们主要学习了两种离散型概率分布：均匀分布和二项分布。

2.1 均匀分布均匀分布是指在一个区间内，各个数值出现的概率是相等的。

我们可以通过一种数学方法来计算均匀分布的概率，即通过区间的长度与总数的比值来计算。

2.2 二项分布二项分布是离散型概率分布的另一种常见形式。

它描述了在一次试验中，成功和失败发生的次数的概率分布。

我们可以通过二项分布的计算公式来求解其中的概率。

3. 连续型概率分布与离散型概率分布不同，连续型概率分布是指概率与某个随机变量关联的概率分布。

在初中二年级下册第三章的学习中，我们主要学习了两种连续型概率分布：正态分布和均匀分布。

3.1 正态分布正态分布是一种非常常见的概率分布，在自然界和社会现象中的许多现象都可以近似地遵循正态分布。

我们需要掌握正态分布的概率性质和计算方法，以解决一些实际问题。

3.2 均匀分布与离散型概率分布中的均匀分布类似，连续型概率分布中的均匀分布是指在一个区间内，概率密度函数是常数的概率分布。

我们可以利用区间长度与总长度的比值来计算均匀分布的概率。

4. 概率计算应用概率分布的认识与运算不仅仅只是理论上的探讨，它在实际应用中也有着广泛的应用。

在日常生活中，我们可以利用概率计算解决一些实际问题，比如抽奖、游戏中的胜率计算等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

上一张下一张主页
退出
如果表示试验结果的变量x，其可能取值至多为可列个，且以各种确定的概率取这些不同的值，则称 x为离散型随机变量；如果表示试验结果的变量x ，其可能取值为某范围内的任何数值，且x在其取值范围内的任一区间中取值时，其概率是确定的，则称x为连续型随机变量。
上一张下一张主页
第三章常用概率分布
本章在介绍概率论中最基本的两个概念—— 事件、概率的基础上，重点介绍生物科学研究中常用的几种随机变量的概率分布——二项分布、正态分布以及样本平均数的抽样分布、t分
分布和F分布。布、
2
上一张下一张主页退出
第一节
概率
刻划事件发生可能性大小的数量指标，称为
概率。事件A的概率记为P（A）。
退出
二、离散型随机变量的概率分布
要了解离散型随机变量x的统计规律，就必须知道它的一切可能值 xi 及取每种可能值的概率pi。如果我们将离散型随机变量x的一切可能取值xi ( i=1, 2 , … )，及其对应的概率pi，记作 P(x=xi)=pi i=1,2,… (3—3)
则称（3—3）式为离散型随机变量x的概率分布或分布。
上一张下一张主页
退出
三、小概率事件实际不可能性原理
随机事件的概率表示了随机事件在一次试验例如小于0.05、0.01、0.001，称之为小概率事件。
中出现的可能性大小。若随机事件的概率很小，
上一张下一张主页
退出
小概率事件虽然不是不可能事件，但在一次试验中出现的可能性很小，不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上，把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理，亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验（显著性检验）的基本依据。
例如，为了确定1粒小麦种子发芽这个事件的概率，在表3 下一张主页
退出
表3—1
试验种子粒数n 发芽种子粒数m 频率 m/n 100 65 0.650
小麦种子发芽试验记录
200 155 300 204 400 274 500 349 600 419 700 489
上一张下一张主页退出
常用列表法表示离散型随机变量的概率分布：
x x 1 x 2 … xn p p 1 p 2 … pn
… …
显然离散型随机变量的概率分布具有
pi≥0和Σpi=1这两个基本性质。
上一张下一张主页
退出
三、连续型随机变量的概率分布
连续型随机变量的概率分布不能用分布列
0.675 0.680 0.685 0.698 0.6983 0.6986
上一张下一张主页
退出
从表3-1可看出，随着实验次数的增多， 1
粒小麦种子发芽这个事件的概率越来越稳定地
接近0.7，我们就把0.7作为这个事件的概率。
在一般情况下，随机事件的概率 p 是不可能准确得到的。通常以试验次数n充分大时随机事件A的频率作为该随机事件概率的近似值。即 P（A）=p≈m/n （n充分大）
mB=10，即抽得数字为 2，4，6，8，
10，12，14，16，18，20中的任何1
个，事件B便发生，故
mB 10 P( B) 0.5 n 20
上一张下一张主页
退出
（三）概率的性质
1、对于任何事件A，有0≤P（A）≤1；
2、必然事件的概率为1，即P（Ω）=1； 3、不可能事件的概率为0，即P（ф）=0。
来表示，因为其可能取的值是不可数的。
对于连续型随机变量x，要了解的是它在
某个区间[a，b）上取值的概率，即P（a≤x＜
b）＝？
下面通过频率分布密度曲线予以说明。
上一张下一张主页
退出
由表2-6 作140行水稻产量资料的频率分布直方图，见图3-1 ，图中纵座标取频率与组距的比值。
上一张下一张主页
退出
因为该试验样本空间由20个等可能的基本事件构成，即n=20,而事件A所包含的基本事件有4个，既抽得编号为1，2，3，4中的任何1个，事件A便发生，即mA=4，所以
mA 4 P( A) 0.2 n 20
上一张下一张主页
退出
同理
，事件B所包含的基本事件数
上一张下一张主页
退出
（二）概率的古典定义
有很多随机试验具有以下特征：
1、试验的所有可能结果只有有限个，即样
本空间中的基本事件只有有限个；
2、各个试验的可能结果出现的可能性相
等，即所有基本事件的发生是等可能的；
3、试验的所有可能结果两两互不相容。
上一张下一张主页
退出
具有上述特征的随机试验，称为古典概型。
（一）概率的统计定义
上一张下一张主页
退出
在相同条件下进行n次重复试验，如果随机
事件A发生的次数为m ，那么m/n称为随机事件 A的频率；当试验重复数n逐渐增大时，随机事
件A的频率越来越稳定地接近某一数值 p ，那
么就把 p称为随机事件A的概率。这样定义的概率称为统计概率。
上一张下一张主页退出
对于古典概型，概率的定义如下：设样本空间由n个等可能的基本事件所构成，其中事件A包含有m个基本事件，则事件 A的概率为m/n，即
P（A）=m/n
上一张下一张主页
退出
这样定义的概率称为古典概率。【例3· 1】在1、2、3、… 、20这20个数字中随机抽取1个，求下列随机事件的概率。（1）A=“抽得1个数字≤4”；（2）B=“抽得1个数字是2的倍数”。
上一张下一张主页退出
第二节概率分布
事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验，则必须知道试验的全部可能结果及各种可能结果发生的概率，即必须知道随机试验的概率分布。先引入随机变量的概念。
上一张下一张主页
退出
一、随机变量
作一次试验，其结果有多种可能。每一种可能结果都可用一个数来表示，把这些数作为变量 x的取值范围，则试验结果可用变量x来表示。【例 3· 2】对 100 株树苗进行嫁接，观察其成活株数，其可能结果是 “0 株成活”，“1 株成活”，……，“100 株成活”。用x表示成活株数，则x的取值为0、1、2、……、100。