第三章 常见的概率分布率
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
u 1u2
e 2 du
2
正态分布的曲线图
fN (y)
0.4
0.3
68.27%
0.2
0.1
95.45%
0.0
2 2
图4.6 正态分布曲线图
(平均数为 ,标准差为 )
fN(u)
0.4
0.3
68.27%
0.2
0.1
95.45%
0.0
u
-3 -2 -1 0 1 2 3
图4.7 标准正态分布曲线图
第三章 几种常见的概率分布律
3.1 二项分布-----离散型概率分布 率(binomial distribution) 例1、某射击手命中概率0.9,连续 射四次,恰好命中0、1、2、3、4 的概率。
3.1.1二项分布的概率函数
如果在一次试验中某事件发生的概率为φ, 那么在n次实验中(独立重复试验)恰好发 生x次的概率。
4.1 .1 样本平均数的分布
➢若总体服从正态 N(, 2) ,则样本 的平均数 xn 也服从正态 N(, 2 n )。
平均数正态分布与样本容量的关系
1.2
1.0
0.8
0.6
0.4
0.2
0.0
-3
-2
-1
n=9
n=4
n=1
0
1
2
3
(X- μ)/ σ/√n 服从 N(0,1) -----u分布
拐点落在 -处
拐点落在 一个处
以平均数和标准差不同的正态分布系列曲线
正态分布
68-95-99.7规则
4、随机变量在(a,b)区间内的概率
b
P(a≤x<b)=
f (x)dx
a
P(a x b) FN (b) FN (a)
fN(y)
A=P(a<y<b)
正态分布密度函数的积分说明图面积A=P(a<y<b)
例2
在江苏沛县调查336个m2小地老虎虫危害 情况的结果, =4.73头, =2.63,试问样 本容量n=30时,由于随机抽样得到样本平 均数 等于或小于4.37的概率为多少?
2、σ未知时的平均数x的分布
标准差未知时样本平均数的分布服从t分布 (t-distribution )
(X- μ)/ s /√n 服从t分布
不同自由度的t分布密度曲线
图4-13 不同自由度的t分布密度曲线
t分布表的使用
当df=15时,两尾概率等于0.05的临界t值 为?
意义
临界t值2.131 P(-∞<t<-2.131)= P(2.131<t<+∞)
=0.025 P(-∞<t<-2.131)+ (2.131<t<+∞)=0.05
双侧临界值
以平均数和标准差不同的正态分布系列曲线
总体和样本的关系
参数与统计量 parameter and statistic
参数:总体的统计指标,如总体均数、标准差,
采用希腊字母分别记为μ、σ。
统计量:样本的统计指标,如样本均数、标准
差,采用英文字母分别记为 x、s 。 参数
附近波动的随机变量 。
生物统计研究的内容
正态曲线较大
概率分布函数
F(x) 1
(x)2
x
e
2 2
dx
2
3、正态分布特征 ? (normal distribution )
特征
①以平均数为对称轴,左右对称 ②系列曲线 ③正态分布曲线与x轴间的面积为1 ④一个标准差处有拐点, f(x)是非负函数 不会与X轴相交
正态曲线的拐点
图5-1 | t|≥2.426的两尾概率
t分布表的使用
df=9,P( t<3.25)=? P(t>1.833)=? P( I t I >0.883)=?
ab
F(b)
A=F(b) -F(a) F(a)
正 无穷大
图4.11 正态分布的累积函数FN (y) 长度A=P(a<y≤b)
以平均数和标准差不同的正态分布系列曲线
3.4.2 标准正态分布 (standard normal distribution )
标准化 Standardization
U x
(平均数 为0,标准差 为1)
3.4.3正态分布表查法
设u服从标准正态分布,则u在[u1,u2 )何内 取值的概率为: Φ(u2)-Φ(u1) Φ(u1)与Φ(u2)可由附表1查得。
正交表查法练习
例1 u=-0.82及u=1.15时的Φ(u)值
常见关系
P(0≤u<u1)=Φ(u1)-0.5 P(u≥u1) =Φ(-u1) P(|u|≥u1)=2Φ(-u1) P(|u|<u1==1-2Φ(-u1) P(u1≤u<u2)=Φ(u2)-Φ(u1)
1头感染。设各头家畜没有相互传染疾病的 可能,问:应该如何评价这两种疫苗?
(--)二项分布的生物学应用:
1.预测后代分离比及基因组合。 例1、4对独立基因自由组合,后代3个显性 基因5个隐性基因概率?
2 推断所需群体和样本大小
例1、小麦自然变异概率φ=0.0045 (1)调查100株,获两株或两株以上变异株
2 正态分布的概率密度函数
(x)2
f (x)
1
e 2 2
2
由σμ决定图形, σ越大越分散
正态分布两个参数
μ是位置参数 μ愈大,则曲线沿x轴愈向右移动; μ愈小,曲线沿x轴愈向左移动。
σ是变异度参数, σ愈大,x 的取值愈分散, 曲线愈“胖”; σ愈小,x的愈集中在μ附近,曲线愈“瘦”。
记为 x~N(μ,σ2)。
2、参数
理论 平均数 average
μ=nφ 标准差 standard deviation
σ2=nφ(1-φ)
3.4 正态分布(normal distribution )
连续型随机变量的概率分布 continuous random variable 1 定义:
两头少,中间多且对称分布
正态分布图
的概率,介乎26和40区间的概率以及大于 40的概率。
0.020 f N ( y)
0.016
0.020 f N ( y)
0.016
0.012
0.008
P(y 26) 0.2119
0.004
0.000
10
15
20
25
30
35
40
45
0.020
fN (y)
wk.baidu.com
0.016
P(26 y 40) 0.7654
0.012
0.012
P(y 40) 0.9773
0.008
0.004
0.000
10
15
20
25
30
35
40
45
0.020
fN (y)
0.016
P( y 40) 0.0227
0.012
0.008
0.008
0.004
0.004
0.000
10
15
20
25
30
35
40
45
0.000
10
15
20
25
30
概率? (2)期望以0.99概率获得1株或1株以上变 异株至少需调查多少株?
3、预测后代表现型分离比及概率
例1 1对基因,后代表现型2种,分离比3:1, 2对基因,后代表现型4种,分离比9:3:3:1 3对基因,后代表现型8种,分离比?
三、二项分布的形状和参数
1、二项分布形状
Pn(X)=CnX φx(1- φ)n-x 图形由n、φ决定 A φ=1/2 对称 B φ>1/2 最高点偏右 C φ<1/2最高点偏左
例2、已知u~N(0,1),试求: (1) P(u<-1.64)=? (2) P (u≥2.58)=? (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
上一张 下一张 主 页 退 出
例3
P(-1≤u<1)= P(-2≤u<2)= P(-3≤u<3)= P(-1.96≤u<1.96)= P (-2.58≤u<2.58)=
35
40
45
图4.12 概率计算图示
例5
x服从N(82.3,1.752),求 (1)小麦株高95%的正常范围 (2)株高>85cm的概率?
例5
例4 小麦株高x服从N(156.2,4.822),求 (1)X<161cm的概率? (2)X>164cm的概率? (3)X在152~162之间的概率?
中心极限定理 (central limit theorem)
标准正态分布 (standard normal distribution)
μ=0,σ2=1 记作u~N(0,1),记为N(0,1) u 称 为 标 准 正 态变量或标准正态离 差(standard normal deviate)
概率密度函数及分布函数
ψ(u)
(u)
1
u2
e2
2
Φ(u),
(u)
例4
豌豆红花纯合基因AA,白花纯合基 因aa,杂交后F2后代 红花:白花 =3:1 , 每次随机观察4株。共观 察100次,则红花0株,1株,2株, 3株,4株的次数各多少?
例5
设在家畜中感染某种疾病的概率为20%,
现有两种疫苗,用疫苗A 注射了15头家畜 后无一感染,用疫苗B 注射 15头家畜后有
概 率 , 等 于服 从 标 准 正 态 分 布 N(0,1) 的 随 机 变 量u 在 [(x1-μ)/σ, (x2-μ)/σ)内取值的概率 上下限作适当变换(标准化(standardization )),
u=(x-μ)/σ
例4
假定X是一随机变数具有正态分布,平均数 30,标准差 5,试计算小于26,小于40
σ2为未知如果以样本均方S2估计σ2 ,则其标准化离差为:
正态分布
t (x ) (x )
Sx S / n
u (x ) x
式中,S 为样本标准差,n 为样本容量。
t分布的特点
(1)左右对称 t=0 (2)t分布受自由度(degree of freedom ) n-1 影响 (样本容量) (3)t顶部偏低,尾部偏高?
从总体N( μ ,σ2)中抽出的样本,其样 本平均数 x 服从正态分布 N (μ , σ2/n)
临界值
单侧临界值 上侧临界值 ua 下侧临界值 -ua
双侧临界值 ua/2 ua(双)
中心极限定理 (central limit theorem)
从总体N( μ ,σ2)中抽出的样本,其样 本平均数 x 服从正态分布 N (μ , σ2/n)
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0.0
-3
-2
-1
0
1
2
3
0.5
0.0
-3
-2
-1
0
1
2
3
0.4 P(1.96 u 1.96) 0.95
0.3
0.2
0.1
0.0
-3
-2
-1
0
1
2
3
图4.13 离均差的绝对值≤1 , 2 和1.96 的概率值
一般正态分布的概率计算
正态分布N(μ,σ2)的随机变量x 在 [ x1 ,x2 ) 内 取 值 的
总体
抽取部分观察单位 样本
推断inference
参数
统计量
总体和样本的关系
总体
随机样本1 2
……
3
无穷个样本
第四章 抽样分布 (sampling distribution )
4.1 .1 样本平均数的分布 4.2.2 样本标准差的分布
大数法则 law of large numbers
➢ 由平均数 的总体随机抽样,随着样
几种概率
关于标准正态分布,以下几种概率应当熟记: P(-1≤u<1)=0.6826 P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973
P(-1.96≤u<1.96)=0.95 P (-2.58≤u<2.58)=0.99
0.5
0.4 P(1 u 1) 0.6827
0.5
P(2 u 2) 0.9545
Pn(X)=CnX φx(1- φ)n-x
应用条件:①每次试验结果互斥 ②试验之间互相独立 ③每次试验概率恒定
Pn (k) Ckk p k q nk
n
(q p)n Cnk pk qnk
k 0
相比较就可以发现,事件A发生x次的概率
恰好等于 展开式中的第k+1项,所以称作
二项概率公式 。
二项分布性质
本容量的增加,样本平均数越接近总x 体
的均数 。 ➢ 样本平均数的这种行为称为大数法则
(law of large numbers)。
大数法则
n
33
前 32
31
个 30 样 29 本 28 的 27 均 26 数 25
24 23 22
1
5 10
50 100 500 1000 5000 10000
Number of observations, n
σ/√n –平均数的标准误差 (standard error of mean )
μ x = μ ,σ x =σ2/n
例1
小麦株高服从正态分布μ =110cm, σ=10cm.
现随机抽一株 问 (1)x>112cm的概率? (2)抽取n=36的样本,则样本的平均数株 高X>112cm的概率? (3)抽取n=100的样本, X>112cm的概率
1、P(X=x)= Pn(x) (X=0,1,…,n)
2、二项分布的概率之和等于1
生物学中离散型随机变量
入孵n枚种蛋的出雏数 n头病畜治疗后的治愈数 n 尾鱼苗的成活数等
例2
例2、生男生女的概率为50%,某 一医院连续生30个男孩概率。
例3
• 纯种白猪与纯种黑猪杂交,根据孟德尔遗 传理论 , 子二代中白猪与黑猪的比率为 3∶1。求窝产仔10头,有7头白猪的概率。