第三章_几种常见的概率分布律b
生物统计学答案第三章
第三章 几种常见的概率分布律3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少?答:代入二项分布概率函数,这里φ=1/2。
()75218.02565621562121!5!3!83835==⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫⎝⎛=p结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为 0.21875。
3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1)543223455414143541431041431041435434143⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛=⎪⎭⎫⎝⎛+表型共有1+5+10+10+5+1 = 32种。
(2)()()()()()()6976000.0024114165014.00241354143589087.002419104143107263.0024127104143105395.00241815414353237.0024124343554322345541322314==⎪⎭⎫⎝⎛==⨯=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛===⎪⎭⎫⎝⎛=隐隐显隐显隐显隐显显P P P P P P 它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。
3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大?答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为:()()()()()φφφ--=-=--=-1lg 1lg 1lg 1lg 11a a an P n P n P3.4 根据以往的经验,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。
几种常见的概率分布率
点数(x)
率(f)
μx P (x)= e –μ . x!
N × P (x)
0
57
0
P(0)=e-3.87 ×3.870/0!=0.0209 54.5072
1
203
203 P(0)=e-3.87 ×3.871/1!=0.0807 210.4656
2
283
766 P(0)=e-3.87 ×3.872/2!=0.1562 407.3696
3
525
1575 P(0)=e-3.87 ×3.873/3!=0.2015 525.5120
4
532
2128 P(0)=e-3.87 ×3.874/4!=0.1949 508.2992
5
408
2040 P(0)=e-3.87 ×3.875/5!=0.1509 393.5472
6
273
1638 P(0)=e-3.87 ×3.876/6!=0.0973 253.7584
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
2. 普阿松分布:----小概率事件( p≦ 0.1)符合普阿松式分布.
nk
x------在n次抽样中某一种类型的个体数.
μ= N
n k (N-K)(N-n)
S2 = N2(N-1) ^ nk N= x
N------^群体大小的估计. K------加有标记的个体数.
几种常见的概率分布律
的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16
。
ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为
•
ϕ
3
(1
−
ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。
几种常见的概率分布.
2017/10/18
1
定义
2017/10/18
2
正态分布的密度函数图形是一条以均值为中心的对称钟 型曲线
2017/10/18
3
正态分布密度函数 f ( x) 的数学性质
2017/10/18
4
参数 m 和 s 对曲线形态的影响
2017/10/18
版权所有 BY 统
2017/10/18
13
1. 分布由阿贝(Abbe) 于1863年首先给出,后 来由海尔墨特 (Hermert)和卡· 皮尔逊(K· Pearson) c2 分别于1875年和1900年推导出来。 2. 分布也称学生氏(Student)分布,是由哥 塞特(W.S.Gosset)在1908年首次提出,其重要 t 意义在于提供了小样本研究方法。 3. 分布是由统计学家费雪(R.A.Fisher)首次 提出的。
正态分布表及上侧分位数
2017/10/18
版权所有 BY 统计
10
3s
准则
2017/10/18
版权所有 BY 统计
11
3s
准则示意图
2017/10/18
12
正态分布的重要意义
在随机理论中,正态分布是最重要的一种分布,理由如下: ⑴ 它是最常见的一种分布,现实中许多随机变量服从或 近似服从正态分布。 ⑵ 在一定的条件下,正态分布是其他分布的近似分布。 ⑶ 许多有用的分布,特别是小样本的精确分布是由正态 分布推导出来的。
F
2017/10/18
24
F
2017/10/18
25
2017/10/18
几种常见的概率分布律
•
2、二项分布的概率之和等于1,即
k k nk n C p q ( q p ) 1 n k 0
P( x m) Pn ( k m) •3、
k k nk C p q (4-15) n k 0
n k k n k (4-16) C p q n
m
•4、P( x m) Pn (k • •
6
二项式分布的概率图
•
二项分布的应用条件有三:
• (1)各观察单位 只具有互相对立 的一种结果 ,如阳性或阴性, 生存或死亡等, 属于二项分 类资料; • (2)已知发生某一结果 (如死亡) 的概率为p ,其对立结果的概率则为1-P=q,实际中要求p 是 从大量观察中获得的比较稳定的数值;
• (3)n个观察单位的观察结果互相独立,即每 个观察单位的观察结果不会影响到其它观察单位 的观察结果。
0 10头全部愈好的概率为: P(0) C10 (0.4)0 (0.6)10 0.00605
受害株数 概率函数P(y)
C p q
y n
y
n y
P(y)
F(y)
nP(y)
P (0 )
0 C5 0.3500.655
1 C5 0.3510.654
0.1160
0.1160
46.40
P (1 )
0.3124
)· P( A3 )· P( A4
)= p 2 q 42
又由于以上各种方式中,任何二种方式都是互
不相容的,按概率的加法法则,在4 次试验中,事件A
恰好发生2次的概率为
•
P4(2) = P( A1 A2 A3 A4 ) + P(
)4 + … A1 A2 A3 A
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
第三章第二次课 几种常见的理论分布
第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。
第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。
难点:二项分布的概率函数特征,正态分布的特征。
一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。
对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。
在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。
在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。
先取n =4,k =2来讨论。
在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。
由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。
几种常见的概率分布率分解课件
均匀分布的定 义
均匀分布是一种概率分布,其特点是随机变量在一定区间内取值的可能性是等可 能的。
在数学表达上,如果一个随机变量X服从某个区间[a, b]上的均匀分布,则其概率 密度函数f(x)可以表示为f(x)=1b−a,当x∈[a,b]时,f(x)=0,当x∉[a,b]时。
均匀分布的特点
均匀分布的期望值E(X)和方差Var(X) 分别为(a+b)/2和(b-a)^2/12。
泊松分布在生活中的应用
02
01
03
在物理学中,泊松分布用于描述放射性衰变过程中粒 子发射的次数。
在统计学中,泊松分布常用于二项分布的近似,当试 验次数很大而事件发生的概率很小时。
在计算机科学中,泊松分布在处理网络流量和计算机 系统中的任务调度等问题时非常有用。
04
二项分布
二项分布的定义
总结词
二项分布是一种离散概率分布,描述了在n次独立重复的伯努利试 验中成功的次数。
指数分布的期望值和方差是有限的,分别为1/λ和1/λ^2,其中λ是概率密度函数的 参数。
指数分布在生活中的应用
指数分布在可靠性工程中广泛应 用,用于描述产品寿命、故障间
隔时间等。
在排队论中,指数分布用于描述 顾客到达和服务时间等随机变量。
在保险精算中,指数分布用于计 算保费和准备金。
06
均匀分布
几种常见的概率分布率分解课 件
CONTENCT
录
• 概率分布率概述 • 正态分布 • 泊松分布 • 二项分布 • 指数分布 • 均匀分布
01
概率分布率概述
概率分布率的定 义
概率分布率
表示随机变量取值的概率规律。
定义方式
对于离散随机变量,概率分布律为P(X=xi)=pi,i=1,2,3...;对于连续随机变量, 概率分布函数为P(a≤X≤b)=∫[a,b]f(x)dx,其中f(x)为概率密度函数。
第3章 几种常见的概率分布律
服从
U
110k 2
,
110k 2
的
r.v.
随机变量
期望
区间(a,b)上的 均匀分布
f
(
x)
b
1
a
,
0,
a x b, 其它
ab 2
方差
区间(a,b)上 的均匀分布
f
(x)
b
1
a
,
0,
a x b, (b a)2 其它 12
(2) 指数分布 若 X 的d.f. 为
ex , x 0
(2) 二项分布 n 重Bernoulli 试验中, X 是事件A 在 n 次试 验中发生的次数 , P (A) = p ,则
Pn (k) P( X k) Cnk pk (1 p)nk , k 0,1,, n
称 X 服从参数为n, p 的二项分布,记作
X ~ B(n, p)
0–1 分布是 n = 1 的二项分布
其期望和方差都是
在某个时段内:
① 大卖场的顾客数;
应 用
② 市级医院急诊病人数; ③ 某地区拨错号的电话呼唤次数; ④ 某地区发生的交通事故的次数.
场 ⑤ 放射性物质发出的 粒子数;
合 ⑥ 一匹布上的疵点个数;
⑦ 一个容器中的细菌数;
⑧ 一本书一页中的印刷错误数;
都可以看作是源源不断出现的随机 质点流 , 若它们满足一定的条件, 则称为 Poisson 流, 在 长为 t 的时间内出现的质
Show[fn1,fn3]
小
0.5 0.4
大 0.3 0.2 0.1
-6
几何意义 数据意义
-5 -4 -3 -2 -1
大小与曲线陡峭程度成反比 大小与数据分散程度成正比
4. 第三章 几种常见的概率分布律
3.4 正态分布
两头少,中间多,两侧对称
正态分布曲线
μ
22
正态分布的密度函数和分布函数
对于平均数是μ ,标准差是σ的正态分布,其密 度函数为
1 f x e 2
x 2
2 2
, x , 0
以符号N(μ ,σ2)表示平均数为μ ,标准差为 σ的正态分布
20
结果如下:
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
有x颗杂草的概率 p(x) = 10x/x!e10
有小于等 于x颗杂草 的概率 (累加)
有多于于等于x 颗杂草的概率 (1-上一个数 值的累计)
p(x) 0.0005 0.0023 0.0076 0.0189 0.0378 0.0631 0.0901 0.1126 0.1251 0.1251 0.1137 0.0948 0.0729 0.0521 0.0347
n p x 1 1 x 0
8
n
将x=0,1,2,3代入二项分布概率函数,可得出出 现0,1,2,3只雄性动物的概率。
P(0)= 0.0009766
P(1)= 0.0097656
P(2)= 0.0439453Biblioteka P(3)= 0.1171876
抽到3只和3只以下雄性动物的概率为:
15
于是:
15 n C (1 ) ( ) 0.01 16 n(lg15-lg16)= lg0.01 -0.02803n =-2.00000 n =71.4
n n n 0 n
即需要72代
0 n 0 n
第三章 概率分布
f(0)
0.0039
0.0039
f(1)
0.0469
0.0508
f(2)
0.2109
0.2617
f(3)
0.4219
0.6836
f(4) 总和
0.3164 1.0000
1.0000
NP(x) 0.39 4.69 21.09 42.19 31.64 100.00
精品课件
例2:某批鸡种蛋的孵化率是0.90,今从该 批种蛋中每次任选5个进行孵化,试求孵出 小鸡的各种可能概率。
(2)当p值趋于0.5时,分布趋于对称。
精品课件
图4—9 n值不同的二项分布比较
图4—10 p值不同的二项分布比 较
精品课件
2、二项分布的参数 • 总体平均数(次数):
μx=np • 总体标准差(次数):
σx= npq
如例1,n=4, p=0.75,可求红花出现的株数为 4×0.75=3株,σ=(4×0.75×0.25)1/2=0.866株
在一般情况下,随机事件的概率p是不可能准确 得到的。通常以试验次数n充分大时随机事件A的 频率作为该随机事件概率的近似值。
即
P(A)=p≈m/n (n充分大)
精品课件
概率有如下基本性质:
1、对于任何事件A,有0≤P(A)≤1; 2、必然事件的概率为1,即P(U)=1; 3、不可能事件的概率为0,即P(V)=0。
精品课件
三、概率计算
(一)事件的相互关系 1、和事件
事件A和事件B至少有一件发生而构成的新 事件称为事件A和事件B的和事件,以A+ B表示。 2、积事件 事件A和事件B同时发生,以A·B表示
精品课件
3、互斥事件 事件A和事件B不能同时发生,A·B=V 如新生儿男为A,女为B
d 几种常见的概率分布律
三、服从二项分布的随机变量的特征数
平均数: μ=nφ
方差: σ2=nφ(1-φ)
随着样本含量的增加,偏斜度和峭度趋 向于0,二项分布逐渐接近于正态分布。
四、二项分布应用实例
例:3.2 例:3.3 例:3.4
【例3.4】
用 棕 色 正 常 毛 (bbRR) 的 家 兔 和 黑 色 短 毛 (BBrr)兔杂交,杂种F1为黑色正常毛长的 家兔,F1雌、雄兔近亲交配,问最少需要 多少只F2代的家兔,才能以99%的概率至 少得到一只棕色短毛兔?
二、二项分布概率函数表达式:
p( y) Cny y (1)ny , y 0,1,2,, n
n=试验次数(或样本含量) y=在n次试验中事件A出现的次数 φ=事件A发生的概率(每次试验都是恒定的) 1-φ=事件A的对立事件发生的概率 p(y)=Y的概率函数=P(Y=y)
例:3.1
从雌雄各半的100只动物中做一抽样试验。第一次从这100只动 物中随机抽取一只,记下性别后放回,再做第二次抽取。共 做了10次抽样,计算抽中3只和3只以下雄性动物的概率。
(5)曲线和X坐标轴所夹的面积等于1。 (6)正态分布表查出的φ(u)的值表示随机变量
U落入区间(-∞, u)的概率。 (7)累积分布函数图形的特点是围绕点
(0, 0.5)对称。 (8)正态分布的偏斜度γ1=0 ,峭度γ2=0。
5. 一些重要值
68.27%
68.27%
95.00%
95.00%
99.00%
解: n=10 y=3,2,1,0 φ=1/2 p( y) Cny y (1)ny
p(3) 10! ( 1 )3 ( 1 )7 120 (210 ) 0.1171876 3!(10 3)! 2 2
第章几种常见的概率分布律
3
4
12 36 0.218750 7.000000
4
12
48 192 0.273437 8.749984
5
6
30 150 0.218750 7.000000
6
5
30 180 0.109375 3.500000
7
2
14 98 0.031250 1.000000
8
0
0 0 0.003906 0.124992
总数
14.04.2020
N=32
139 665 0.999999 31.99968
.
16
3.1.3 二项分布应用实例
样本平均数、总体平均数;样本方差、总体方
差如下:
x
fx
139
4.343750
N 32
n
8
1 2
4.000000
2
fx2
fx
665 1392
s2
N
32 1.974798
在Cumulative后填入0(或FALSE),表示计算成功次
14.04.2020 数恰好等于指定数值的. 概率;填入1(或TRUE)表 14
3.1.3 二项分布应用实例
例1 以杂合基因型Wvwv的小鼠为父本,隐性纯合 子小鼠wvwv为母本杂交(wv波浪毛,Wv直毛), 后代两种基因型的数目应各占一半。实验只选8只 的,多于8只和少于8只的都淘汰。利用下面的公式 或者Excel 可以计算直毛后代出现的概率:
第2步:在Excel表格界面中,直接点击“f(x)”(插入函数)命 令
第3步:在复选框“函数分类”中点击“统计”选项,在 “函数名”
中点击“BINOMDIST”选项,然后确定
几种常见的概率分布率
❖对于一般正态分布,要先进行标准化,再查表;
标准化的公式为: u = x -
u
=
x-
=
9.2 10
5
= 0.42
正态分布 σ= 10
标准正态分布 σ=1
μ=5 9.2
x
μ=0 0.42 u
例3.7 查标准正态分布u=-0.82 及u=1.15时的F(u)的值 例3.8 随机变量u服从正态分布N(0,1),问随机变量u的值落
在生物统计学中,正态分布占有极其重要的地位。许多生物学 现象所产生的数据,都服从正态分布。
一、 正态分布(x—N (μ,σ2))的密度函数与分布函数
➢ 正态分布的规律是数据分布集
中在平均数附近,并且在平均
数的两侧成对称分布。正态分
布密度函数的图像,称为正态
曲线。
➢ 密度函数: f (x) =
1
正态曲线
p(x)
=
cnx
px (1-
p)n-x
=
n! x!(n -
x)!
p x (1-
p)n-x
= n(n -1)(n - 2)(n - x 1) px (1- p)n-x
=
1(1-
1
)(1-
x! x -1)
(np) x
(1-
p)n-x
(将系数的分子分母同乘以nx)
n
n
x!
= x (1- p)n-x
=
x!
2
=
1
概率函数内的λ ,不但是它的平均数,而且是
它的方差。
λ很大时, γ1和γ2则接近于0,这时的泊松分布近
似于正态分布。
三、 泊松分布应用实例
例3.5 在麦田中,平均每10m2有一株杂草,问每 100m2麦田中,有0株、1株、2株、…杂草的概率 是多少?
第三章 常见的概率分布率
(--)二项分布的生物学应用:
1.预测后代分离比及基因组合。 例1、4对独立基因自由组合,后代3个显性 基因5个隐性基因概率?
2 推断所需群体和样本大小
例1、小麦自然变异概率φ=0.0045 (1)调查100株,获两株或两株以上变异株
例4
豌豆红花纯合基因AA,白花纯合基 因aa,杂交后F2后代 红花:白花 =3:1 , 每次随机观察4株。共观 察100次,则红花0株,1株,2株, 3株,4株的次数各多少?
例5
设在家畜中感染某种疾病的概率为20%,
现有两种疫苗,用疫苗A 注射了15头家畜 后无一感染,用疫苗B 注射 15头家畜后有
第三章 几种常见的概率分布律
3.1 二项分布-----离散型概率分布 率(binomial distribution) 例1、某射击手命中概率0.9,连续 射四次,恰好命中0、1、2、3、4 的概率。
3.1.1二项分布的概率函数
如果在一次试验中某事件发生的概率为φ, 那么在n次实验中(独立重复试验)恰好发 生x次的概率。
σ/√n –平均数的标准误差 (standard error of mean )
μ x = μ ,σ x =σ2/n
例1
小麦株高服从正态分布μ =110cm, σ=10cm.
现随机抽一株 问 (1)x>112cm的概率? (2)抽取n=36的样本,则样本的平均数株 高X>112cm的概率? (3)抽取n=100的样本, X>112cm的概率
拐点落在 -处
拐点落在 一个处
以平均数和标准差不同的正态分布系列曲线
正态分布
68-95-99.7规则
几种常见概率分布
值。
二项分布具有概率分布的一切性质,即:
( k=0,1,2,…,n) P(X = k) = P n (k) ≥0
n 二项分布的概率之和等于 1n ,即: k k n-k
∑C p q
n k =0
= (q +p) = 1
二项分布的性质
k n k P (X ≤m) = Pn (k ≤m) = C k p q n k =0 n m
μ = np σ = npq
当试验结果以事件A发生的频率k/n表示时,
μp = p
p 也称率的标准误。
σ p = (pq) /n
四、二项分布的概率计算及其应用条件
(一)概率计算 直接利用二项概率公式 [例6] 有一批种蛋,其孵化率为0.85,今在该批 种蛋中任选6枚进行孵化,试给出孵化出小鸡的
P (X ≥m) = Pn (k ≥m) =
k =m
k k n -k C np q
P(m1 ≤ X ≤m2 ) Pn (m1 ≤k ≤m2 )
k m1 k k n-k C n p q (m1 ≤m2 ) m2
三、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变量之 平均数μ 、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
0 .5 P( x k ) e 0 .5 k!
k
x
(k=0,1,2…)
计算结果如表4—5所示。
表4—5 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是相
当吻合的 , 进一步说明用波松分布描述单位容积(
或面积)中细菌数的分布是适宜的。
概率论与数理统计图文课件最新版-第3章-多维随机变量及其分布
比如:
概率统计
比如:
1 x y 0
F( x, y) 0 x y 0
对这二元函数来验证第4条性质。
现找 4 个点如下:
( x2 , y2 ) (1, 1); ( x1, y2 ) (1, 1)
( x2 , y1 ) (1, 1); ( x1, y1 ) (1, 1)
F(1,1) F(1,1) F(1, 1) F(1, 1)
0
x 0, y 0 其它
求: (1) 分布函数 F( x, y)
(2) ( X ,Y )落在G内的概率
其中 G: x y 1 及 x 轴、y 轴所围区域
解: (1) Q
x
F(x, y)
y
f ( x, y)dxdy
当 x 0, y 0 时
xy
F( x, y)
0 dx 0
2,4,8,10,14,16,20这7个 数不能被3整除,但能
被2整除
6,12,18这3个数能被2 整除,又能被3整除
不难验证:
1 1
7473
pi j 0, 0 0 pi j 21 21 21 21 1
概率统计
故 得: (X,Y) 的 联合分布 律为:
XY
0 1
01
7
4
21 21
7
P( x1 X x2 , y1 Y y2 )
F ( x2 , y2 ) F ( x2 , y1 ) F ( x1, y1 ) F ( x1, y2 )
如图:
y
y2 L
y1 L M
M
x
0 x1
x2
概率统计
2. 二维随机变量分布函数 F(x,y) 的性质
性质1 F(x,y) 分别对 x 和 y 单调非减, 即:
生物统计学:几种常见的概率分布律
头仔猪中白色的为x头,则x为服从二项分布B(10,0.75)
的随机变量。于是窝产10头仔猪中有7头是白色的概率
为:
10! P ( x 7) C 0.75 0.25 0.75 7 0.253 0.2503 7!3!
7 10 7 3
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗? 假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20 %,则15 头家畜中染病头数x=0的概率为
1-p=q,则称这一串重复的独立试验为n重贝努利试验,
简称贝努利试验(Bernoulli trials)。
在生物学研究中,我们经常碰到的一类离 散型随机变量,如孵n枚种蛋的出雏数、n头病 畜治疗后的治愈数、n 尾鱼苗的成活数等,可用 贝努利试验来概括。 在n重贝努利试验中,事件 A 可能发生0,1, 2,…,n次,现在我们来求事件A恰好发生 k(0≤k≤n)次的概率Pn(k)。
四、二项分布的平均数与标准差 统计学证明,服从二项分布B(n,p)的随机变 量之平均数μ、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
μ=np
(3-5)
(3-6)
npq
【例3.4】求【例3.3】平均死亡猪数及死 亡数的标准差。
以p=0.2,n=5代入 (3-5)和(3-6) 式得: 平均死亡猪数 μ=5×0.20=1.0(头) 标准差
一、波松分布的意义
若随机变量x(x=k)只取零和正整数值0,1, 2,…,且其概率分布为
k , k=0,1,…… (3-10) P( x k ) e k!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
n
n(n 1) 2 n n 2 2 n 2 n
2 Var( X ) n 2 2 n 2 n (n ) 2 n n 2 n (1 )
例三,某树种幼苗成材率为70%,现种植 2000株,问成材幼苗数的平均值和标准差是 多少?
大约有 100 P( X 3) 100 0.4232 42.32(张)
第三节 正态分布
(Normal Distribution)
正态分布是一种最重要的连续型变量的概率分布。
• 在生物科学研究里,有许多变量是服从或近似 服从正态分布的,如水稻产量、小麦株高、玉 米百粒重等; • 许多统计分析方法是以正态分布为基础的。 • 不少随机变量的概率分布在样本容量增大时趋于 正态分布。
2 在4次贝努利试验里,获得 2次成功的方式有 C4 种:
ssff
sfsf
sffs
fssf
fsfs
ffss
2 注意 :C 4 是从四个位置选取两个 位置的组合方式。
n! 4! 4 3 2 1 2 依据计算公式C , C4 =6 x!(n x)! 2!2! 2 1 2 1
n n! n! x n x 2 (1 ) [(x x)] x (1 ) n x x x 2 x!( n x )! x 1 x!( n x )! n (n 2)! (n 1)! x2 n x n(n 1) (1 ) n x 1 (1 ) n x x 2 ( x 2)!( n x )! x 1 ( x 1)!( n x )! 2 n n
0 0 1 1 n n [ (1 )]n Cn (1 )n Cn (1 )n1 Cnx x (1 )n x Cn (1 )0
(2) P( x) Cnx x (1 ) n x [ (1 )]n 1n 1
* * 由此类推到一般情形, 在n此贝努利试验中, 共获得x次成功的概率是 P( x) C (1 )
x n x n x
关于P( x) C (1 )
x n x
n x
的讨论:
( 1 )从形式上来说, Cnx x (1 ) n x 是二项式 [ (1 )]n 展开 的第x 1项,所以有“二项分布 ”这个名称。
1. 在什么情形下应用泊松分布
泊松分布是一种用来描述一定的空间或时间里稀有事件发生次 数的概率分布。 服从泊松分布的变量的一些例子: • 一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。 • 畜群中遗传的畸形怪胎数 • 单位空间内某些野生动物或昆虫数 • 每升饮水中的大肠杆菌数
2. 泊松分布的概率函数与特征数
x n
每种方式发生的概率为:
P(ssff)
乘法法则
P(s)P(s)P( f)P(f) (1 ) (1 ) 2 (1 ) 2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得 x 2次成功的概率为
2 2 P(2) C4 (1 ) 42
泊松分布变量X只取零和正整数:0,1,2…,其概率 函数为 x
P( x)
x!
e
其中ห้องสมุดไป่ตู้ 0, e 2.7182 是自然对数底数。
注意:P( x)怎么得到的呢?泊松分 布可以用二项分布在 n , 0, n 的情形来近似。在这种 情形下C (1 )
x n x n x
第三章 几种常见的概率分布律
回顾一下,在上一章里讲了变量及其概率分布的一 般概念。
• 离散变量用概率函数来研究,概率函数定义了这个变量
取每个值的概率;
• 连续变量用密度函数(一条曲线)来研究,通过这条曲线我
们可以求得变量在某个特定区间取值的概率。
在这一章里,我们将介绍一些在实际研究中应用最 广的变量类型及其概率分布。
因此,在统计学里,正态分布无论在理论研究上还是在实际 应用中均占有重要的地位。
1 正态分布的定义与主要特征
n 1
n 1
(n 1)! n t (1 ) n1t t 0 t!(n 1 t )!
n[ (1 )]n1
n
• 方差和标准差
Var( X ) n (1 )
2
n (1 )
证明: 2 Var( X ) E( X 2 ) [ E( X )]2
P( x) x( x 1) 2
x
x 0
xe
x!
x 2
x( x 1) 2
x 2
2
2e
( x 2)!
2e e 2
例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告, 平均每张样片可以观察到3个微粒,问在一次观察中看到3个 微粒的概率是多大?少于3个微粒的概率是多少?若观察100 张片子,大约有多少张片子看到的微粒数少于3个?
7 10 7
107
10! 0.757 0.253 7!3! 0.2503
所以,窝产仔10头,有7头白猪的概率是0.2503。
例二,有一批玉米种子,出苗率为0.67。现任取6粒 种子种1穴中,问这穴至少有1粒种子出苗的概率是 多少?
解:根据题意,这是一 个二项分布的问题。 视出苗为成功,有 n 6, =0.67。 设出苗的种子数为 x, 则x服从二项分布。
2. 二项分布的常用记号
n:
x:
贝努利试验的次数 ;
二项分布变量 X的取值,即总共获得“ 成功”的次数;
:
1 - :
一次贝努利试验中获得 “成功”的概率;
显然是一次试验中获得 “失败”的概率;
P( x) :
总共获得x次“成功”的概率。
3. 二项分布的概率函数P(x)
• 怎样得到P(x)?
以n=4,x=2为例,欲求P(x=2)=?。
注意:
0.5时,分布对称; 0.5时,分布偏斜:
概率
0.5时,正偏 0.5时,负偏
5 二项分布变量的平均数和标准差
• 平均数
E ( X ) n
定义 n
证明: E ( X )
P( x) x
x 0
n! x (1 ) n x x x 0 x!( n x)!
解:一张片子里看到的 微粒数X,可以看成是一定空间 里的稀有 事件数,所以它服从泊 松分布,且有 3。
P( X 3)
xe
x!
33 e 3 0.2240 3!
P ( X 3) P( X 0) P ( X 1) P ( X 2) 30 e 3 31 e 3 32 e 3 0! 1! 2! 0.4232
解:设2000 株幼苗的成材数为 X , 则X服从二项分布。
根据题意, n 2000 , 0.70 。
平均数 n 2000 0.70 1400
标准差 n(1 ) 2000 0.7 0.3 20.49
第二节 泊松分布
(Poisson Distribution)
x 0 1 2
P(x) 0.0625 0.250 0.375
n 4, 0.5,
0 P(0) C4 0.500.54 0.062
3 4
0.250 0.0625
X的概率分布图为
二项分布 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 获得正面的次数x 3 4
x 0 x 0
n
n
例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传 理论,子二代中白猪与黑猪的比率为3:1。求产仔 10头,有7头白猪的概率。
解:根据题意,这是一 个二项分布的问题, 3 视白猪为成功,有 n 10, = 0.75,x 7。 4
P( x 7) P(7) C 0.75 (1 0.75)
n! x (1 ) n x x x 1 x!( n x)!
n
n
n! x (1 ) n x x 1 ( x 1)!( n x)!
t x 1
n
n! t 1 n 1t ( 1 ) t 0 t!( n 1 t )!
• 什么情形时应用二项分布:实验中进行了n次独立的贝努利 试验,统计在这n次试验中总共获得了多少次“成功”。“成 功”的次数,记为变量X;X称为二项分布变量,X的概率分布 称为二项分布。 X的可能取值为0,1,2,…,n。所以X是个离散型变量。
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。 (5)n尾鱼苗的成活数X,X服从二项分布。
二项分布 泊松分布
正态分布
离散变量
连续变量
超几何分布
标准正态分布 指数分布
负二项分布
第一节 二项分布
(Binomial Distribution)
1.贝努利试验和在什么情形下应用二项分布
•贝努利试验(Bernoulli trial):试验只有两种可能的结果, 并且发生每种结果的概率是一定的。 例如:抛一枚硬币,看得到正面还是 反面;掷一次骰子,看得到6还是没有 得到6;随机抽查一名婴儿的性别,看 是男是女 在贝努利试验里,两种结果可分别称为“成功”和“失败”, 或者“事件A发生”和“事件A没有发生”。
P(至少有 1粒出苗)=P( x 1) P( x 1) P( x 2) P( x 6)