第三章 概率与概率分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a
b
对于一个连续型随机变量x,取值于区间[a,b]内的概 率为函数f(x)从a到b的积分,即:
P(a x b) f ( x)dx
a
b
连续型随机变量的概率由概率分布密度函数所确定。
P( x ) f ( x)dx 1
概率密度函数f(x)曲线与x轴所围成的面积为1。
第三章
概率与概率分布
第一节:概率基础知识
一、概率的概念 二、概率的计算 三、概率的分布
一、概率基本概念
(一)事件 定义:在一定条件下,某种事物出现与否 就称为是事件。
自然界和社会生活上发生的现象是各 种各样的,常见的有两类。
在一定条件下必然出现某种结果或必然不出现某种结果。
确定性事件
必然事件(U) (certain event)
对立事件
发芽
有芒
成活
无芒
死亡
生物个体
• 二项总体: 这种“非此即彼”的事件构成的 整体 • 二项分布: 二项总体的概率分布
一、二项分布
设有一随机试验,每次试验结果出现且只出现对立事 件A与 A之一,这两种结果是互不相容的,在每次试 验中出现A的概率是p(0<p<1),则出现对立事件 A的
概率是1-p=q,则称这一串重复的独立试验为n重贝努
n个事件两两互不相容,则称这n个事件互斥。
豌豆开红花、白花事件
4 对立事件
事件A和事件B必有一个发生,但二者不能同 时发生,且A和B的和事件组成整个样本空间。 即A+B=U,AB=V。我们称事件B为事件A的 对立事件。
B= A
生男孩、女孩
5 独立事件
事件A和事件B的发生无关,事件B的发生与 事件A的发生无关,则事件A和事件B为独立 事件。
例:
表 婴儿的性别情况表
性别(x) 概率(P) 0(男) 1(女) 0.517 0.483
此表列出了性别变量的取值及相应值的概率,揭示了观 察婴儿性别试验的统计规律。 用随机变量的可能取值及取相应值的概率来表示随机 试验的规律称为随机变量的分布律或概率函数。
表3-3 离散型变量的概率分布
变量(x)
对离散型变量x的一切可能值xi(i=1,2,3…), 及其对应的概率pi P (x=xi) = pi, i=1,2,3…
例:
表3-2某鱼群的年龄组成 年龄(x) 1 2 3 4 5 6 7
频率(W) 0.4597 0.3335 0.1254 0.0507 0.0215 0.0080 0.0012
此表给出了该鱼群年龄构成的全部,我们称 之为该鱼群年龄的概率分布。
2 积事件
事件A和事件B中同时发生而构成的新事件称 为事件A和事件B的积事件,记作A•B。
n个事件的积,可表示为A1 • A2 • … • An
如调查田间病害发生情况,棉铃虫发生为事件A, 黄萎病发生为B,则棉铃虫与黄萎病同时发生的新 事件为A和B的积事件
3 互斥事件(互不相容事件)
事件A和事件B不能同时发生,则称这两个事 件A和B互不相容或互斥。
不可能事件(V) (impossible event)
在一定条件下可能发生也可能不发生。
随机事件(random event) 不确定事件(indefinite event)
为了研究随机现象,需要进行大量重复的调查、实验、 测试等,这些统称为试验。
(二)频率(frequency)
若在相同的条件下,进行了n次试验,在这n 次试验中,事件A出现的次数m称为事件A出现的 频数,比值m/n称为事件A出现的频率(frequency), 记为W(A)=m/n。
P(A) = p
抛掷一枚硬币发生正面朝上的试验记录 实验者 蒲丰 K 皮尔逊 K 皮尔逊 投掷次数 4040 12000 24000 发生正面朝上的次数 2048 6019 12012 频率(m/n) 0.5069 0.5016 0.5005
随着实验次数的增多,正面朝上这个事件发生的频 率稳定接近0.5,我们称0.5作为这个事件的概率。
三、大数定律
几种常见的理论分布
第二节:几种常见的理论分布
随机变量的概率分布 (probability distribution)
离散型变量
二项分布 泊松分布 正态分布
变 量
(非连续变量资料)
连续型变量
一、二 项 分 布
一、二项分布的概率函数
离散型随机变量的分布
雄性
哺乳动物
种子 穗子
雌性 不发芽
m m P(A) = p=lim n n
n ∝
在一般情况下,随机事件的概率P是不可能准 确得到的。通常以试验次数n充分大时,随机 事件A的频率作为该随机事件概率的近似值。
任何事件
必然事件 不可能事件 随机事件
0≤P(A)≤1 P(U)=1
P(V)=0 0<P(A)<1
第二部分
概率的计算
(一)事件的相互关系
2 独立事件乘法定理
定理: 事件A和事件B为独立事件,则事件A与事 件B同时发生的概率为各自概率的乘积。 P(AB)=P(A)P(B)
推理:A1、A2、…An彼此独立,则
P(A1A2A3…An)=P(A1)P(A2)P(A3)…P(An)
三、概率分布 (一)离散型变量的概率分布
要了解离散型随机变量x的统计规律,必须知道 它的一切可能值xi及取每种可能值的概率pi。
概率(P)
x1
p1
x2
p2
x3
p3
x4
p4
……..
…….
xn
pn
P (x=xi) = pi, i=1,2,3…
设离散型变量x的所有一切可能值xi(i=1,2,3…),
取相应值的概率为pi,则P (x=xi)称为离散型随机变
量x的概率函数。
离散型变量的概率分布的特点
1≥ Pi≥ 0
(i=1,2,…)
表 观察4株出现红花的概率分布表 (p=0.75 q=1-p=0.25)
概率函数 Cnxpxqn-x P(x) P(0) P(1) C40p0q4 C41p1q3 0.0039 0.0469 F(x) 0.0039 0.0508 NP(x) 0.39 4.69
P(2)
P(3) P(4) 合计
C42p2q2
里试验,简称贝努里试验。
在贝努里试验中,独立将此试验重复n次,求在n 次试验中,一种结果A出现x次的概率P(x)是多少。 在种子发芽试验中,设事件A为“种子发芽”,则 A为“种子不发芽”。取4粒种子(n=4)来做试验,求
有2粒种子发芽(x=2)的概率。
在4次试验中,事件A发生2次的方式有以下 C 42种:
Pi
i 1
=1
(二)连续型变量的概率分布
当试验资料为连续型变量,一般通过分组
整理成频率分布表。如果从总体中抽取样本的
容量n相当大,则频率分布就趋于稳定,我们将
它近似地看成总体概率分布。
频 率 密 度
0.25一
0.20一 0.15一 0.10一 0.05一
35 40 45 50 55 60 65 70 75 80 85 90
2 + P( A1 A2 A3 A4)= C 4 p 2 q 42
一般,在n重贝努利试验中,事件A恰好发生 x(0≤x≤n)次的概率为
kx n i x=0,1,2…,n x) C kknxpp qqnk x C n p i q n i p Pn (k C
公式
p(x)= Cnxpxqn-x
A1 A2 A3 A4 A1 A2 A3 A4
A1 A2 A3 A4 A1 A2 A 3 A4
A1 A2 A 3 A4 A1 A2 A3 A4
又由于以上各种方式中,任何二种方式
都是互不相容的,按概率的加法法则,在4 粒
种子中正好有2粒种子发芽的概率为:
P4(2) = P( A1 A2 A3 A4) + P( A1 A2 A3 A4 ) + …
和事件 积事件 互斥事件 对立事件
二、概率的计算
独立事件
完全事件系
1 和事件
事件A和事件B中至少有一个发生而构成的新 事件称为事件A和事件B的和事件,记作A+B。
n个事件的和,可表示为A1+A2+…+An
如:随机抽取一样品的出粉率为81%以下,称事件A,另 一 81-85%为B,现取一新样品出粉率85以下,则其为A和 B的和事件
称作二项分布概率函数 ,其中 Cnx= 1,2,…,n。
n!
x!(n-x)!
, p>0,
q>0,p+q=1,x是一个离散型随机变量,取值为0,
例: n=试验次数(或样本含量)
x=在n次试验中事件A出现的次数
n=4 x=2
p=事件A发生的概率(每次试验是恒定的) p=0.9
1-p=事件A不发生的概率 1-p=0.1
定理: 若事件A与B互斥,则 P(A+B)=P(A)+P(B)
推理1 P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
推理2 P(A)=1-P(A) 推理3 完全事件系的和事件的概率为1。
2 独立事件乘法定理 例:播种玉米,种子的发芽率为90%,每穴两粒,则: A:第一粒种子发芽,P (A) = 0.9, P(A) = 0.1 B:第二粒种子发芽,P (B) = 0.9, P( B ) = 0.1 求: C:两粒种子均发芽 D:一粒种子发芽 E:两粒种子均不发芽 C:两粒种子均发芽, C = AB,P(C) = P(A) P(B) = 0.81 D:一粒种子发芽:D= AB + AB,P(D)=0.9*0.1+ 0.1*0.9=0.18 E:两粒种子均不发芽:E= A B,P(E)=P(A)P(B)=0.1*0.1=0.01
图3.1 鲢鱼体长的频率分布图
直方图中同一组内的频率是相等的。
直方图中每一矩形的面积就表示该组的频率。
当n无限大时,频率转化为概率,频率密度也转化为概率
密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率 分布也就转化为概率分布了,此曲线为总体的概率密度曲线,
曲线函数f(x)称为概率密度函数。
试验只有两个对立结果,记为A和
二 项 总 体
A,出现概率分别为p和q=1-p。
重复性:每次试验条件不变时,事件A出
现为恒定概率p;
独立性:任何一次试验中事件A的出现与
其余各次试验结果无关。
(二)二项分布的计算
例:豌豆F1为红花和白花,杂交后F2红花:白花=3:1 F1
F2
3:1
若每次观察4株,共观察100次,问红花为0、 1、2、3、4株的概率Байду номын сангаас为多少?
如果多个事件A1、A2、A3、…、An 彼此独立, 则称之为独立事件群。
如播种两粒玉米,它们的发芽
6
完全事件系
如果多个事件A1、A2、A3、…、An两两互斥, 且每次试验结果必然发生其一,则称事件A1、 A2、A3、…、An为完全事件系。 完全事件系的和事件概率为1,任何一个事 件发生的概率为1/n。即: P(A1+A2+…+An)=1
频率表明了事件频繁出现的程度,因而其稳定性说
明了随机事件发生的可能性大小,是其本身固有的 客观属性,提示了隐藏在随机现象中的规律性。
概 率
(三)概率(probability,P)
概率的统计定义:设在相同的条件下,进行大量重复试验, 若事件A的频率稳定地在某一确定值p的附近摆动,则称p 为事件A出现的概率。
如,抽取一位阿拉伯数字,抽取数字为0、1、2….8、9构成了 完全事件系
(二)概率的计算法则 1 互斥事件加法定理 例:玉米田中,一穗株(A)占67.2%,双穗株(B)占30.7%,空 穗株(C)占2.1%,试计算一穗株和双穗株的概率。 P(A+B)=P(A)+P(B)=0.672+0.307=0.979 因为P(A)+P(B)+P (C) =1 P(A+B)=1-P(C)=1-0.021=0.979
p(x)=X的概率函数=P(X=x) 则4粒种子有两粒发芽的概率为:
P(2)
P(x)= C 42p2 q4-2=6×0.92×0.12=0.0486
现已求出某事件发生的概率,若试验N次, 则该事件发生的理论次数为: 理论次数=NP(x) 二项分布的概率累积函数为: F (x) = ΣP(x)=1
二项分布的两个条件:
C43p3q1 C44p4q0
0.2109
0.4219 0.3164 1.000
0.2617
0≤W(A) ≤1
例:
表3-1 玉米种子发芽试验结果 种子总数(n) 发芽种子数(m) 10 9 20 19 50 47 100 91 200 186 500 1000 458 920
种子发芽率(m/n) 0.900 0.950 0.940 0.910 0.930 0.918 0.920
种子发芽与否是不能事先确定的,但从表中可以看出, 试验随着n值的不同,种子发芽率也不相同,当n充分大 时,发芽率在0.92附近摆动。