生物统计学第三章概率分布
生物统计学第三章 概率和概率分布(2)
的第x 1项,所以有“二项分布”这个名称。
0 0 1 1 x x n n [ (1 )]n Cn (1 )n Cn (1 )n1 Cn (1 )nx Cn (1 )0
x x (2) P(x) Cn (1 )nx [ (1 )]n 1n 1 x 0 x 0
2. 二项分布的常用符号
n :贝努利试验的次数(或 样本含量)
x : 在n次试验中事件A出现的次数,即二项分布变量X 的取值
: 事件A发生的概率 (每次试验都是恒定的 )
1 - : 事件A发生的概率
p(x) : X的概率函数即P(X x)
F( x) P(X x) p(xi )
2014-4-21
二项分布的程序计算方法
二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排 列组合数C n m 计算函数Combin(m,n)
2014-4-21
二、 泊松分布 (Poisson Distribution)
2014-4-21
二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 X 为所抽取的3件产品中的次品数,则根据二项分 布公式有
P X 2 C32 (0.05)2 (0.95)32 0.007125
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。
生物统计学课件1、概率及概率分布
指数分布在统计分析中常用于计算随机事件的概率和期望值,如生存 分析和可靠性工程。
REPORT
CATALOG
DATE
ANALYSIS
SUMMAR Y
03
概率分布的应用
在生物统计学中的应用
描述生物样本人群的特征
遗传学研究
通过概率分布,可以描述生物样本人 群的某些特征,如身高、体重、年龄 等。
在遗传学研究中,概率分布被广泛应 用于基因频率的分布和遗传疾病的分 布。
正态分布在统计学中的重要性在于许 多统计方法和假设检验都是基于正态 分布的假设。
泊松分布
泊松分布是一种离散概率分布 ,常用于描述单位时间内随机
事件发生的次数。
泊松分布的概率函数由两个参 数λ和k控制,其中λ表示单位时
间内随机事件发生的平均次数 ,k表示随机事件发生的次数。
泊松分布在生物统计学中常用 于描述某些离散变量的分布, 如遗传学中的基因突变频率、 流行病学中的疾病发病率等。
在社会科学研究中的应用
人口统计学研究
在人口统计学研究中,概率分布 被用于描述人口特征和分布情况
。
社会调查
在社会调查中,概率分布被用于描 述调查结果的分布情况,例如调查 结果的置信区间和抽样误差。
经济预测
在经济预测中,概率分布被用于预 测经济发展趋势和未来经济状况。
REPORT
CATALOG
DATE
描述随机变量取连续数值时的概率分布,如正态分布、指数 分布等。
离散概率分布
二项分布
描述在n次独立重复的伯努利试验中 成功的次数的概率分布,常用于描述 生物实验和调查中的成功次数。
泊松分布
描述单位时间内(或单位面积上)随 机事件发生的次数,常用于描述稀有 事件的概率模型。
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
生物统计学:第三章随机变量与概率分布
例:用复合饲料饲养动物,每天增重的kg数及 其相应的概率如下:
每天增重xi /kg 0.5
概率 0.10
1.0
0.20
1.5
0.50
2.0
0.20
问每天增重的数学期望和方差是多少?
解: μ=E(X)=1.40
E(X2 ) =2.15
var=σ2 = E(X2 ) –μ2=2.15-1.42=0.19
15.167
(4)随机变量的方差(variance) - 总体方差
度量随机变量取值的变异程度的指标,其定义式:
Var( X ) 2 ( xi )2 E[( X )2 ]
N
E[( X )2 ] E( X 2 2 X 2 )]
E(X 2) 2E(X ) 2
对于例1:
件的集合)的概率有以下关系:P(A )=1-P(A)
2 )条件概率
➢ 已知事件B发生的条件下,事件A发生的概率 称为条件概率,记为P(A︱B) P(A∣B)=P(AB)/P(B) P(B∣A)=P(AB)/P(A)
例:一周的天气情况如下:
周日
日
一
二
三
四
五
六
预报
晴
阴
雨
雨
雨
晴
雨
实际
晴
雨
阴
雨
雨
晴
晴
设A表示预报有雨的事件,B表示实际下雨的事件
些值的概率p(x1),p(x2),…,p(xn),…,排列起来,构 成了离散型随机变量的概率分布。常用概率分布表或概 率分布图表示(如,p28表与p29图3-1)。
例3.1 掷一次骰子所得点数的概率函数
f (x) 1 , x 1, 2, 3, 4, 5, 6 6
生物统计学03概率和概率分布
e
−λ
(λ = np)
x = 0, 1, 2…, n
第二节 常用的概率分布 二、泊松分布
☆ 参数 参数:
µ= λ
2 = λ σ
☆ 形状
λ=0.5 λ=1.5 λ=2.5
λ→20
泊松分布→正态分布 泊松分布 正态分布
第二节 常用的概率分布 三、正态分布
☆ 是一种连续随机变量的概率分布 ☆ 许多生物现象的计量资料均服从正态分布 ☆ 一般假定试验误差的分布服从正态分布 ☆ 非正态总体统计数的抽样分布近似服从正态分布
☆当 p 值较小且 n 值不
0.25 0.2 0.15 0.1 0.05 0 1 3 5 7
p=0.3
p=0.5
p=0.75
大时, 大时,图形是偏倚的
☆当 p 值趋于 时,分 值趋于0.5时
布趋于对称
9
11
13
15
17
19
21
第二节 常用的概率分布 二、泊松分布
☆ 概率函数
P( x ) =
λ
x
x!
第二节 常用的概率分布
随机抽取20株小麦 测得平均株高为82.3cm,标准差为 株小麦, cm, 例3.4 随机抽取 株小麦,测得平均株高为 cm 1.7502cm,试计算: cm,试计算: cm 1)株高≥85cm的概率; 的概率; 的概率 的正常值范围。 2)小麦株高的95%的正常值范围。 小麦株高的 的正常值范围
第二节 常用的概率分布 三、正态分布
1. 概率函数
f (x) = 1
− ( x−µ)2 2σ 2
σ 2 π
e
记为x~ 记为 ~N(µ,σ2)
第二节 常用的概率分布
2. 正态曲线的特点
生物统计学课后习题答案
生物统计学课后习题答案【篇一:生物统计学第四版李春喜课后习题答案】和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19。
【答案】1=20,s1=1.247,cv1=6.235%;2=20,s2=3.400,cv2=17.0%。
2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46;2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19。
【答案】1=20,s1=1.247,cv1=6.235%;2=20,s2=3.400,cv2=17.0%。
2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46;第三章概率与概率分布3.1解释下列概念:互斥事件、对立事件、独立事件、频率、概率?频率如何转化为概率?影响?3.3已知u服从标准正态分布n(0,1),试查表计算下列各小题的概率值:(1)p(0.3<u≤1.8);(2)p(-1<u≤1);(3)p(-2<u≤2);(4)p(-1.96<u≤1.96;(5)p(-2.58<u≤2.58)。
生物统计学课件-3正态分布和抽样分布
近似性
当样本量足够大时,样本 统计量近似服从正态分布。
抽样分布在生物学中的应用
01
实验设计
在生物学实验中,常常需要从总体中随机抽取一定数量的样本进行实验,
以评估实验结果的可重复性和可靠性。抽样分布理论为实验设计提供了
理论基础。
02
数据处理和分析
在生物学数据分析和统计推断中,常常需要利用样本统计量来估计总体
生物统计学课件-3正态分布 和抽样分布
目录
• 正态分布 • 抽样分布 • 正态分布与抽样分布的关系 • 实例分析
01
正态分布
正态分布的定义
正态分布是一种连续概率分布,其概率密度函数呈钟形,对称轴为均值所在直线。
在正态分布中,数据点在均值附近最为集中,向两侧逐渐减少,形成钟形曲线。
正态分布是自然界和人类社会中最为常见的分布形态之一,许多随机变量都服从或 近似服从正态分布。
02
抽样分布
抽样分布的定义
01
02
03
抽样分布
描述样本统计量(如样本 均值、样本方差等)的概 率分布。
样本统计量
从总体中随机抽取的样本 所计算出的各种统计指标, 如样本均值、样本方差等。
总体
研究对象全体个体的集合。
抽样分布的性质
独立性
样本统计量之间相互独立。
随机性
样本统计量的取值具有随 机性。
中心极限定理
在大量独立随机抽样的前提下,不论总体分布如何,样本均值的分布趋近于正态分布。
样本均值的方差与总体方差的关系
样本均值的方差随着样本量的增加而趋近于总体方差的1/n,其中n为样本量。
正态分布与抽样分布的区别
定义不同
正态分布是对总体特征的描述,而抽样分布是对样本统计 量的描述。
生物统计学 第三章 概率分布09
2
2 2
x
= 期望 2 = 方差
X ~ N(, 2)
正态分布
正态分布概率密度函数的几何表示
f (x)
正态曲线
x
曲线下某区间的面积即为随机变量在该区间取值的概率
正态分布
正态分布的特点
➢只有一个峰,峰值在x = 处 ➢曲线关于x = 对称,因而平均数=众数=中
位数 ➢x轴为曲线向左、右延伸的渐进线
P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
1
30!0 e331 1!e3 Nhomakorabea32 2!
e3
33 3!
e3
=0.3528
连续型随机变量的概率分布
正态分布(normal distribution)
➢具有如下概率密度函数的随机变量称为正态 分布随机变量:
f (x) 1 e[ (x )2 ]
第三章 常用概率分布
二项分布 普哇松分布 正态分布 抽样分布
离散型随机变量的概率分布
二项分布(binomial distribution)
假设:1. 在相同条件下进行了n次试验 2. 每次试验只有两种可能结果(1或0) 3. 结果为1的概率为p,为0的概率为1-p 4. 各次试验彼此间是独立的
在n次试验中,结果为1的次数(X = 0,1,2, ,n)服从二项分布,表示为
较大,顶部略低,尾部略高。自由度小的t 分布,更为明显。 n>30时, t 分布接近于标准正态分布; n>100时,t 分布基本与标准正态分布相同; n→∞时,t 分布与标准正态分布完全一致。 3. t 分布概率求法 可查P302 t 分布的双侧分位表。
例:df=4 双侧 t0.05=2.776 t0.01=4.604 单侧 t0.05=2.132 t0.01=3.747
几种常见的概率分布率
❖对于一般正态分布,要先进行标准化,再查表;
标准化的公式为: u = x -
u
=
x-
=
9.2 10
5
= 0.42
正态分布 σ= 10
标准正态分布 σ=1
μ=5 9.2
x
μ=0 0.42 u
例3.7 查标准正态分布u=-0.82 及u=1.15时的F(u)的值 例3.8 随机变量u服从正态分布N(0,1),问随机变量u的值落
在生物统计学中,正态分布占有极其重要的地位。许多生物学 现象所产生的数据,都服从正态分布。
一、 正态分布(x—N (μ,σ2))的密度函数与分布函数
➢ 正态分布的规律是数据分布集
中在平均数附近,并且在平均
数的两侧成对称分布。正态分
布密度函数的图像,称为正态
曲线。
➢ 密度函数: f (x) =
1
正态曲线
p(x)
=
cnx
px (1-
p)n-x
=
n! x!(n -
x)!
p x (1-
p)n-x
= n(n -1)(n - 2)(n - x 1) px (1- p)n-x
=
1(1-
1
)(1-
x! x -1)
(np) x
(1-
p)n-x
(将系数的分子分母同乘以nx)
n
n
x!
= x (1- p)n-x
=
x!
2
=
1
概率函数内的λ ,不但是它的平均数,而且是
它的方差。
λ很大时, γ1和γ2则接近于0,这时的泊松分布近
似于正态分布。
三、 泊松分布应用实例
例3.5 在麦田中,平均每10m2有一株杂草,问每 100m2麦田中,有0株、1株、2株、…杂草的概率 是多少?
生物统计学课件ch3常用的概率分布
(3) 各次试验独立。即一次试验出现什么样的 结果与前面已出现的结果无关。
成功次数的概率分布——二项分布
• 例 设某毒理试验采用白鼠共3只,它们有 相同的死亡概率π,相应存活概率为1-π。记 试验后白鼠死亡的例数为X,分别求X=0、 1、2和3的概率
35
30
25
人数
20
15
10
5
0
2.7~ 3.1~ 3.5~ 3.9~ 4.3~ 4.7~ 5.1~ 5.9~56..53~
血清总胆固醇(mmol/L)
如果样本量很大,组段很多,矩形顶端组 成的阶梯型曲线可变成光滑的分布曲线。
大多数情况下,可采用一个函数拟合这 一光滑曲线。这种函数称为概率密度函数
把钱分成7份,赢了4局的就拿4份,赢了3局 的就拿3份呢?或者一人分一半呢?
频率与概率 frequency and probability
样本的实际发生率称为频率。设在相同条 件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。
概率:随机事件发生的可能性大小,用大 写的P 表示;取值[0,1]。
p(X=xi) p(x1) p(x2) …… p(xk) ……
离散型随机变量分布的特点:
(1) 0 p(xi ) 1(i 1, 2,...)
(2) p(xi ) 1 所有xi
离散型随机变量的概率分布举例
f(x)
抗体滴度 人数, x 比例, f(x)
1:10
4
.058
1:20
3
.043
二项分布的概率计算
例 如 果 =0.4,
生物统计学答案第三章
第三章 几种常见的概率分布律3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少?答:代入二项分布概率函数,这里φ=1/2。
()75218.02565621562121!5!3!83835==⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫⎝⎛=p结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为 0.21875。
3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1)543223455414143541431041431041435434143⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛=⎪⎭⎫⎝⎛+表型共有1+5+10+10+5+1 = 32种。
(2)()()()()()()6976000.0024114165014.00241354143589087.002419104143107263.0024127104143105395.00241815414353237.0024124343554322345541322314==⎪⎭⎫⎝⎛==⨯=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛===⎪⎭⎫⎝⎛=隐隐显隐显隐显隐显显P P P P P P 它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。
3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大?答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为:()()()()()φφφ--=-=--=-1lg 1lg 1lg 1lg 11a a an P n P n P3.4 根据以往的经验,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。
生物统计学 第三章 概率论
即复合事件的概率必等于该事件出现的组合数目乘以
单个事件的概率;而这一复合事件的可能组合数目则相
当于从n(3)个物体中任取其x(2)个物体的组合数。数学上 的组合公式为:
n! C x!(n x)!
x n
(二)二项分布的概率函数
二项式中包含两项,这两项的概率为p、q,并且 p+q=1,可推知变量x的概率函数为:
0 2
• 若期望有0.99的概率获得1头或1头以上的 死去的,至少应该调查多少头?
• 若期望有0.99的概率获得1头或1头以上的 死去的,至少应该调查多少头? 解:应调查的头数应该满足 P(0)=1-0.99=0.01 P(0)=Cn0p0qn=0.01 0.6n=0.01 nlg0.6=lg0.01 n=(lg0.01)/(lg0.6)=-2/(-0.222)=9头
抽取三粒种子(以Y代黄子叶,以G代青子叶), 即n=3,有两粒黄子叶种子,即x=2,这时有3种不
同组合: GGY,GYG,YGG。出现第一粒,第二
粒和第三粒种子是互不影响的,因此这三个事件是 独立事件,由乘法法则可得:
3 3 1 9 P(GGY ) ( )( )( ) 4 4 4 64
3 1 3 9 P (GYG ) ( )( )( ) 4 4 4 64
当p=q,二项式分布呈对称状,如p≠q,则表现偏斜状。
二项分布的几点性质 (1) 当p值较小且n不大时 ,分布是偏倚的。但随着n的增大,分布 逐渐趋于对称 (下图1) (2) 当 p 值趋于0.5,分布趋于对称(下图2) (3) 对于固定的n及p,当k增加时,Pn(k)先随之增加并达到其极大 值,以后又下降 (4) 在n较大,np、nq 较接近时,二项分布接近于正态分布;当 n→∞时,二项分布的极限分布是正态分布
生物统计2PPT课件
i
➢ 概率累积函数: F(x) P(x) x0
-
23
一、二项分布
Cnx
n! x!(n x)!
扔7次硬币,求 有0,1,2,3,4,5, 6,7次国徽面的 概率?
C
0 7
7! 0 ! ( 7 0 )!
7! 7!
7 6 5 4 3 21 7 6 5 4 3 21
1
C
1 7
7! 1 ! ( 7 1 )!
➢ 贝努里大数定律(Bernoulli theorem): ➢ 辛钦大数定律(Khinchine theorem):
-
13
四 大数定律
➢ 贝努里大数定律(Bernoulli theorem): 设m是n次独立试验中事件A出现的次数,
而p是事件A在每次试验中出现的概率,则对 于任意小的正数ε,有如下关系:
第三章 概率与概率分布
第一节 概率基础知识 一、概率的概念 二、概率的计算 三、概率分布 四、大数定律
第二节 几种常见的理论分布 一、二项分布 二、泊松分布 三、正态分布
第三节 统计数的分布 一、抽样试验与无偏估计 二、样本平均数的分布 三、样本平均数差数的分布 四、t分布 五、x2分布 六、F分布
➢ 推理3:完全事件系的和事件的概率等于1
举例:开花颜色
-
9
三 概率计算法则
1.事件加法定理
例:玉米田中,一穗株(A)占67.2%,双穗株(B)占 30.7%,空穗株(C)占2.1%,试计算一穗株和双穗 株的概率。 解1.
P(A+B)=P(A)+P(B)=0.672+0.307=0.979 解2.
7 6 5 4 3 21 6 5 4 3 2 11
第三章常用概率分布生物统计学课件
上一张 下一张 主 页 退 出
【例3·3】 抛掷一枚硬币,其可能结 果是“币值一面朝上” 、“币值一面朝 下”。“币值一面朝上”用1表示,“币 值一面朝下”用0表示,用x表示试验结果, 则x的取值为0、1。
如“取得1个数字是2的倍数”是一个复合 事件,它由“取得1个数字是2”、“是4”、 “是6”、…… 、“是20”10个基本事件组合 而成。
(2)必然事件 在一定条件下必然会发生的事件称为必然
事件,用Ω表示。
上一张 下一张 主 页 退 出
(3)不可能事件 在一定条件下不可能发生的事件称为不可
能事件,用ф表示。 必然事件与不可能事件实际上是确定性现
第三章 常用概率分布
本章在介绍概率论中最基本的两个概念— —事件、概率的基础上,重点介绍生物科学研 究中常用的几种随机变量的概率分布——二项 分布、正态分布以及样本平均数的抽样分布、t 分布、 2 分布和F分布。
上一张 下一张 主 页 退 出
第一节 事件与概率
一、事 件 (一)必然现象与随机现象
在自然界与生产实践和科学试验中,人 们会观察到各种各样的现象,把它们归纳起 来,大体上分为两大类:
上一张 下一张 主 页 退 出
从表3-1可看出,随着实验次数的增多, 1粒小麦种子发芽这个事件的概率越来越稳定地 接近0.7,我们就把0.7作为这个事件的概率。
在一般情况下,随机事件的概率 p 是不可 能准确得到的。通常以试验次数n充分大时随机 事件A的频率作为该随机事件概率的近似值。
第三章 概率与概率分布 华中农业大学生物统计学讲义
该试验样本空间由10个等可能的基本事件构成,即n=10,而事 件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一 个,事件A便发生。
P(A)=3/10=0.3
P(B)=5/10=0.5
12 3 4 5
6
7
8 9 10
一、概率基本概念
A=“一次取一个球,取得红球的概率”
10个球中取一个球,其可能结果有10个基本事件(即每个球 被取到的可能性是相等的),即n=10 事件A:取得红球,则A事件包含3个基本事件,即m=3
P(A)=3/10=0.3
12 3 4 5
6
7
8
9 10
一、概率基本概念
B= “一次取5个球,其中有2个红球的概率” 10个球中任意取5个,其可能结果有C105个基本事件,即n= C105 事件B =5个球中有2个红球,则B包含的基本事件数m= C32 C73
P(B) = C32 C73 / C105 = 0.417
2、在一定条件下可能发生也可能不 发生。
(二)频率(frequency)
一、概率基本概念
若在相同的条件下,进行了n次试验,在这n 次试验中,事件A出现的次数m称为事件A出现的 频数,比值m/n称为事件A出现的频率(frequency), 记为W(A)=m/n。
0≤W(A) ≤1
例:
一、概率基本概念
设样本空间有n个等可能的基本事件所构成,其中事件A包 含有m个基本事件,则事件A的概率为m/n,即P(A)=m/n。
古典概率(classical probability) 先验概率(prior probability)
一、概率基本概念
1 2 3 4 5 6 7 8 9 10
随机抽取一个球,求下列事件的概率; (1)事件A=抽得一个编号< 4 (2)事件B =抽得一个编号是2的倍数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中位数 ➢ x轴为曲线向左、右延伸的渐进线
➢ 由两个参数决定: 平均数 和 标准差 • 决定曲线在x 轴上的位置 • 决定曲线的形状
正态分布
平均数的影响
标准差的影响
正态分布
标准正态分布(standard normal distribution)
对于给定的两尾概率求标准正态分布在x 轴上的分位点
/2
/2
对于给定的一尾概率求标准正态分布在x 轴上的分位点
/2
/2
(1)设标准正态分布的右尾(左尾)概率为
,求分位数u值
用2 查附表2,可得一尾概率为 时的分位数u值
= 20.05 = 0.1查表得u = 1.644854 。
(2)
, = 20.01 = 0.02查表得u = 2.326348
离散型随机变量的概率分布
普哇松分布的概率函数
普哇松分布的期望与方差
离散型随机变量的概率分布
例2:某遗传病的发病率为0.0003,某鸡场有10000头 肉鸡,问今年发生该遗传病4头及4头以上的概率有 多少?
λ=μ=np=10000×0.0003=3 x=4 P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
离散型随机变量的概率分布
二项分布的概率函数
二项分布的期望 二项分布的方差
离散型随机变量的概率分布
例1:一头母猪一窝产了10头仔猪,分别求其
中有2头公猪和6头公猪的概率。
产公猪头数的期望值: 产公猪头数的方差:
离散型随机变量的概率分布
普哇松分布(Poisson distribution)
描述稀有事件的试验,对于二项分布 如果概率P很小,试验次数n很大 ,则二项分布 趋近普哇松分布,表示为:
标准正态分布几个常用的分位数值:
双侧(尾)概率: 下面是标准正态时分,布u的=几个1.特96殊的且常用的分位数值: 时,当u双=尾概2.率58为0.05时,u = 1.96
当双尾概率为0.01时,u = 2.58 当右尾概率(左尾概率)为0.05 时,u = 1.64(-1.64) 当右尾概率(左尾概率)为0.01 时,u = 2.33(-2.33)
例:df=4 双侧 t0.05=2.776 t0.01=4.604 单侧 t0.05=2.132 t0.01=3.747
T表
自由度
对于
令
标准化
Z服从正态分布
标准正态分布
正态分布
标准正态分布的概率密度函数
0
正态分布
标准正态分布的概率计算
➢ 附表1 (p. 297)
正态分布
(1) P( Z u) 或 P(Z -u) (u > 0)
直接查表
标准正态分布的概率计算
标准正态分布函数表----附表1 (p. 297)
标准正态分布的双侧分位数
单侧(尾)概率: 时,u = 1.64(-1.64) 时,u = 2.33(-2.33)
原总体
样本统计量的概率分布 称为抽样分布
样本1
样本2 样本n n
统计量
新总体
正态总体样本平均数的抽样分布
数的分 (n>30)
1、中心极限定理:从正态总体N(µ,σ2)抽样,样本均 布服从正态分布;若从非正态总体抽样,当n→∞ 样本均数的分布亦接近正态分布。
的期望为
2、设原总体的期望为,方差为 ,方差为 2 /n
样本均数的均数(期望)
,则样本平均数
样本均数的标准差
故样本均数的分布是服从
的正态
t 分布
当以样本s 估计 时(n < 30 ),得到统计量:
W.S.Gosset(歌赛特,英国,1777~1855) 1908年以“Student(学生)”为笔名在该年的
生物统ห้องสมุดไป่ตู้学第三章概率分布
离散型随机变量的概率分布
二项分布(binomial distribution)
假设:1. 在相同条件下进行了n次试验
2. 每次试验只有两种可能结果(1 或0)
为1-p
3. 结果为1的概率为p,为0的概率
4. 各次试验彼此间是独立的
在n次试验中,结果为1的次数(X = 0, 1,2,,n)服从二项分布,表示为
=0.3528
连续型随机变量的概率分布
正态分布(normal distribution)
➢ 具有如下概率密度函数的随机变量称为 正态分布随机变量:
= 期望 2 = 方差
正态分布
正态分布概率密度函数的几何表示
f (x)
正态曲线
x
曲线下某区间的面积即为随机变量在该区间取值的概率
正态分布
正态分布的特点
Biometrika上发表了论文《平均数的概率误差》, 创立了小样本检验代替大样本检验的理论,即t分布 和t检验法,也称为学生氏分布。
1. t 分布图像类似于标准正态分布,两侧对称,均数为 0。 2. t 分布曲线随样本自由度不同而异, 与正态曲线相比,离散度
较大,顶部略低,尾部略高。自由度小的t 分布,更为明显。 n>30时, t 分布接近于标准正态分布; n>100时,t 分布基本与标准正态分布相同; n→∞时,t 分布与标准正态分布完全一致。 3. t 分布概率求法 可查P302 t 分布的双侧分位表。