生物统计学第三章概率和概率分布(2)
生物统计学第三章 概率和概率分布(2)
的第x 1项,所以有“二项分布”这个名称。
0 0 1 1 x x n n [ (1 )]n Cn (1 )n Cn (1 )n1 Cn (1 )nx Cn (1 )0
x x (2) P(x) Cn (1 )nx [ (1 )]n 1n 1 x 0 x 0
2. 二项分布的常用符号
n :贝努利试验的次数(或 样本含量)
x : 在n次试验中事件A出现的次数,即二项分布变量X 的取值
: 事件A发生的概率 (每次试验都是恒定的 )
1 - : 事件A发生的概率
p(x) : X的概率函数即P(X x)
F( x) P(X x) p(xi )
2014-4-21
二项分布的程序计算方法
二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排 列组合数C n m 计算函数Combin(m,n)
2014-4-21
二、 泊松分布 (Poisson Distribution)
2014-4-21
二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 X 为所抽取的3件产品中的次品数,则根据二项分 布公式有
P X 2 C32 (0.05)2 (0.95)32 0.007125
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。
生物统计学课件1、概率及概率分布
指数分布在统计分析中常用于计算随机事件的概率和期望值,如生存 分析和可靠性工程。
REPORT
CATALOG
DATE
ANALYSIS
SUMMAR Y
03
概率分布的应用
在生物统计学中的应用
描述生物样本人群的特征
遗传学研究
通过概率分布,可以描述生物样本人 群的某些特征,如身高、体重、年龄 等。
在遗传学研究中,概率分布被广泛应 用于基因频率的分布和遗传疾病的分 布。
正态分布在统计学中的重要性在于许 多统计方法和假设检验都是基于正态 分布的假设。
泊松分布
泊松分布是一种离散概率分布 ,常用于描述单位时间内随机
事件发生的次数。
泊松分布的概率函数由两个参 数λ和k控制,其中λ表示单位时
间内随机事件发生的平均次数 ,k表示随机事件发生的次数。
泊松分布在生物统计学中常用 于描述某些离散变量的分布, 如遗传学中的基因突变频率、 流行病学中的疾病发病率等。
在社会科学研究中的应用
人口统计学研究
在人口统计学研究中,概率分布 被用于描述人口特征和分布情况
。
社会调查
在社会调查中,概率分布被用于描 述调查结果的分布情况,例如调查 结果的置信区间和抽样误差。
经济预测
在经济预测中,概率分布被用于预 测经济发展趋势和未来经济状况。
REPORT
CATALOG
DATE
描述随机变量取连续数值时的概率分布,如正态分布、指数 分布等。
离散概率分布
二项分布
描述在n次独立重复的伯努利试验中 成功的次数的概率分布,常用于描述 生物实验和调查中的成功次数。
泊松分布
描述单位时间内(或单位面积上)随 机事件发生的次数,常用于描述稀有 事件的概率模型。
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
生物统计学:第三章随机变量与概率分布
例:用复合饲料饲养动物,每天增重的kg数及 其相应的概率如下:
每天增重xi /kg 0.5
概率 0.10
1.0
0.20
1.5
0.50
2.0
0.20
问每天增重的数学期望和方差是多少?
解: μ=E(X)=1.40
E(X2 ) =2.15
var=σ2 = E(X2 ) –μ2=2.15-1.42=0.19
15.167
(4)随机变量的方差(variance) - 总体方差
度量随机变量取值的变异程度的指标,其定义式:
Var( X ) 2 ( xi )2 E[( X )2 ]
N
E[( X )2 ] E( X 2 2 X 2 )]
E(X 2) 2E(X ) 2
对于例1:
件的集合)的概率有以下关系:P(A )=1-P(A)
2 )条件概率
➢ 已知事件B发生的条件下,事件A发生的概率 称为条件概率,记为P(A︱B) P(A∣B)=P(AB)/P(B) P(B∣A)=P(AB)/P(A)
例:一周的天气情况如下:
周日
日
一
二
三
四
五
六
预报
晴
阴
雨
雨
雨
晴
雨
实际
晴
雨
阴
雨
雨
晴
晴
设A表示预报有雨的事件,B表示实际下雨的事件
些值的概率p(x1),p(x2),…,p(xn),…,排列起来,构 成了离散型随机变量的概率分布。常用概率分布表或概 率分布图表示(如,p28表与p29图3-1)。
例3.1 掷一次骰子所得点数的概率函数
f (x) 1 , x 1, 2, 3, 4, 5, 6 6
生物统计学(第四版)答案 1—6章
2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19。
【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。
2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46;第三章概率与概率分布3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值:(1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96;(5)P(-2.58<u≤2.58)。
【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。
3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值:(1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。
【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。
3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。
(1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率;(2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。
生物统计2
2
(二项分布的概率之和等于1)
m
3
k P ( x m) P ( k m) C n p k q n k k 0
4 5
k P ( x m) P ( k m) C n p k q n k k m
n
P(m1 x m2 ) P(m1 k m 2 )
3. 概率
概率的基本性质:
任何事情的概率都在0和1之间,即:0≤ P(A) ≤1 必然事件的概率等于1,即:P(U)=1 不可能事件的概率等于0,即:P(V)=0
二 事件的相互关系
1.和事件: 事件A和事件B至少有一件发生而构成的新事件称 为事件A和事件B的和事件,以A+B表示。
2.积事件:
第一节 概率基础知识
一、概率的概念 事件 频率 概率 二、事件的相互关系 三、概率计算法则 四、大数定律
1. 事件
在一定条件下,某种事物出现与否就称为是事件。 确定性事件和不确定事件 必然事件(U):在一定条件下必然出现的现象。 不可能事件(V):在一定条件下必然不出现的现象。 随机事件:在一定条件下可能发生也可能不发生的现象。
概率累积函数: F ( x)
P( x)
x 0
i
一、二项分布
0 C7
n! x Cn x!(n x)!
扔7次硬币,求 有0,1,2,3,4,5, 6,7次国徽面的 概率?
1 C7
2 C7
3 C7
4 C7
5 C7
6 C7
7 C7
7! 7! 7 6 5 4 3 2 1 1 0!(7 0)! 7! 7 6 5 4 3 2 1 7! 7! 7 6 5 4 3 2 1 7 1 (7 1)! ! 1 6! !* 1 6 5 4 3 2 1 7! 7! 7 6 5 4 3 2 1 21 2!(7 2)! 2!*5! 2 1 5 4 3 2 1 7! 7! 7 6 5 4 3 2 1 35 3!(7 3)! 4!*3! 4 3 2 1 3 2 1 7! 7! 7 6 5 4 3 2 1 35 4!(7 4)! 4!*3! 4 3 2 1 3 2 1 7! 7! 7 6 5 4 3 2 1 21 5!(7 5)! 5!*2! 5 4 3 2 1 2 1 7! 7! 7 6 5 4 3 2 1 7 6!(7 6)! 6!*1 ! 6 5 4 3 2 1 1 7! 7! 7 6 5 4 3 2 1 1 7!(7 7)! 7! 7 6 5 4 3 2 1
生物统计学课件--2概率的基本知识
A1 A2 An V
则有:
P( A1 A2 An) P( A1) P( A2) P( An) 1
1 如果n个事件出现的概率相等,那么, P ( Ai ) n
称Ai为完全事件系。
复习思考题
①什么概率论?什么叫统计学?两者的关系是什么? ②什么是试验? ③举例说明什么是必然事件、什么是随机事件?请说 明事件之间的关系。
④什么是概率?利用统计概率的定义说明概率的性质。
⑤什么是统计概率?要想了解随机事件的发生规律, 应如何进行研究? ⑥试阐述“小概率实际不可能性”的原理及应用。 ⑦说明随机事件的概率计算法则。
第四章
第一节 随机变量
几种常见的概率分布
一、随机变量 在随机试验中被测量的量,称随机变量。 有时随机试验的结果为数量,有时随机试验的结果 不是数量,要人为地量化。
F ( x0) P( x), 其中,xx0
例:掷骰子试验,X为点数,是离散型随 机变量,其可能值为1、2、3、4、5、6, 若求出现的点数不多于3点的概率,则为 求 P( x 3) F (3)
P( x 1) P( x 2) P( x 3)
p(1) p(2) p(3)
方 差:2 = npq ,
标准差: =
npq
四、例1:
试求掷10次硬币,出现3次正面的概率是多少? 解:掷硬币为随机试验,可能的结果有两种, A:正面向上;B:反面向上。 p = P(A)= 1/n =1/2 = 0.5,
q = 1- p = 0.5
则有:P(x=3)= p(3)
x C n p x
0.40 0.48
2、概率的性质 • 任何事件(A)的概率均满足:0≤P(A)≤1; • 必然事件的概率为1;
生物统计学第三章概率分布
中位数 ➢ x轴为曲线向左、右延伸的渐进线
➢ 由两个参数决定: 平均数 和 标准差 • 决定曲线在x 轴上的位置 • 决定曲线的形状
正态分布
平均数的影响
标准差的影响
正态分布
标准正态分布(standard normal distribution)
对于给定的两尾概率求标准正态分布在x 轴上的分位点
/2
/2
对于给定的一尾概率求标准正态分布在x 轴上的分位点
/2
/2
(1)设标准正态分布的右尾(左尾)概率为
,求分位数u值
用2 查附表2,可得一尾概率为 时的分位数u值
= 20.05 = 0.1查表得u = 1.644854 。
(2)
, = 20.01 = 0.02查表得u = 2.326348
离散型随机变量的概率分布
普哇松分布的概率函数
普哇松分布的期望与方差
离散型随机变量的概率分布
例2:某遗传病的发病率为0.0003,某鸡场有10000头 肉鸡,问今年发生该遗传病4头及4头以上的概率有 多少?
λ=μ=np=10000×0.0003=3 x=4 P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
离散型随机变量的概率分布
二项分布的概率函数
二项分布的期望 二项分布的方差
离散型随机变量的概率分布
例1:一头母猪一窝产了10头仔猪,分别求其
中有2头公猪和6头公猪的概率。
产公猪头数的期望值: 产公猪头数的方差:
离散型随机变量的概率分布
普哇松分布(Poisson distribution)
生物统计学题库
生物统计学题库《生物统计学》第一章概论名词1. 样本:从总体中抽出若干个个体的集合称为样本。
2. 变量:相同性质的事物间表现差异性或差异特征的数据称为变量。
3. 参数:参数也称参量,是对一个总体特征的度量。
4. 准确性:是指统计数接近真知的程度。
5. 统计数:从样本计算所得的数值称为统计数,它是总体参数的估计值。
6. 生物统计学:是统计学在生物学中的应用,是用数理统计的原理和方法来分析解释生命现象的一门科学,是研究生命过程中以样本推断总体的一门科学。
五、简答:1. 简述生统在生命科学中的作用:(1)提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。
(2)判断试验结果的可靠性。
(3)提供由样本推断总体的方法。
(4)提供试验设计的一些重要原则。
2. 简述变量的分类:(1)变量按其性质可分为连续变量和非连续变量。
连续变量表示在变量范围内可抽出某一范围的所有值,这种变量是连续的;非连续变量表示在变量数列中仅能取得固定值。
(2)变量又可分为定量变量和定性变量。
第二章:试验资料的整理和特征数的计算四、解释(1)中位数:将资料中所有观测数依大小顺序排列,居于中间位置的观测数。
(2) 变异数:反映变量分布离散性的特征数。
包括极差、方差、标准差和变异系数等。
3.变异系数:样本标准差除以样本平平均数得出的比值。
五、简答题计量资料在整理成次数分布表时,一般采用组距式分组法(1)答:1)求全距;2)确定组数和组距;3)确定组限和组中值4)分组、编制次数分布表。
(2)算术平均数的特点和作用:答:特性:1)离均差的总和等于0。
2)离均差的平方和最小。
作用:1)指出一数据资料内变量的中心位置,标志着资料所代表性状的质量水平和数量水平。
2)作为样本或资料的代表数与其他资料进行比较。
(3)标准差的特性:答:1)标准差的大小受各观测数的影响,如果观测数与观测数间差异较大,其离均差也大,因而标准差也大,反之则小。
2)在计算标准差时,对各观测数加上或减去一个常数,其标准差不变,各观测数乘以或除以一个常数a,则所的标准差扩大或缩小了a倍。
生物统计学 第三章 概率论
即复合事件的概率必等于该事件出现的组合数目乘以
单个事件的概率;而这一复合事件的可能组合数目则相
当于从n(3)个物体中任取其x(2)个物体的组合数。数学上 的组合公式为:
n! C x!(n x)!
x n
(二)二项分布的概率函数
二项式中包含两项,这两项的概率为p、q,并且 p+q=1,可推知变量x的概率函数为:
0 2
• 若期望有0.99的概率获得1头或1头以上的 死去的,至少应该调查多少头?
• 若期望有0.99的概率获得1头或1头以上的 死去的,至少应该调查多少头? 解:应调查的头数应该满足 P(0)=1-0.99=0.01 P(0)=Cn0p0qn=0.01 0.6n=0.01 nlg0.6=lg0.01 n=(lg0.01)/(lg0.6)=-2/(-0.222)=9头
抽取三粒种子(以Y代黄子叶,以G代青子叶), 即n=3,有两粒黄子叶种子,即x=2,这时有3种不
同组合: GGY,GYG,YGG。出现第一粒,第二
粒和第三粒种子是互不影响的,因此这三个事件是 独立事件,由乘法法则可得:
3 3 1 9 P(GGY ) ( )( )( ) 4 4 4 64
3 1 3 9 P (GYG ) ( )( )( ) 4 4 4 64
当p=q,二项式分布呈对称状,如p≠q,则表现偏斜状。
二项分布的几点性质 (1) 当p值较小且n不大时 ,分布是偏倚的。但随着n的增大,分布 逐渐趋于对称 (下图1) (2) 当 p 值趋于0.5,分布趋于对称(下图2) (3) 对于固定的n及p,当k增加时,Pn(k)先随之增加并达到其极大 值,以后又下降 (4) 在n较大,np、nq 较接近时,二项分布接近于正态分布;当 n→∞时,二项分布的极限分布是正态分布
生物统计学二解析
为P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
推理2 对立事件的概率:对立事件的概率互补。若事件A的
概率为P(A),那么其对立事件的概率为 P(A) 1 P(A)
推理3 完全事件系和事件的概率等于1。
乘法定理(multiplicative theorem)如果事件A与事 件B为独立事件,则事件A与事件B同时发生的概率等 于事件A和事件B各自概率的乘积。
(1)P(x≥2)=1-P(0)-P(1)=1-
(2)P(0)=
C
0 n
p
0
q
n=0.01
对于本问题即 0.9955n =0.01
查对数表可得n=1021
C0 100
p-
0
q100
C1 100
p1=q099.0751
例如:某种昆虫在某地区的死亡率为40%,即p=0.4, 现对这种害虫用一种新药进行治疗试验,每次抽样10 头为一组治疗。试问如新药无疗效,则在10头中死3 头、2头、1头以及全部愈好的概率为多少?
二:概率的计算
事件的相互关系
和事件(sum event)事件A和事件B至少有一个发生构成的新 事件称事件A和事件B的和事件。记为A+B或 A B
积事件(product event )积事件:事件A和事件B同时发生构 成的新事件,又叫变事件,记作AB 或 A B
互斥事件(mutually exclusive event) A和B不可能同时存在 (或发生)即AB为不可能事件,那么称事件A和事件B是互斥 事件。 A B
P(A) p lim m n n
频率和概率是不相同的,只有当试验次数无限增 大时,任一事件的频率趋于稳定,这时频率又称 统计概率.这时的频率和概率才是一样的.
生物统计学 第3章 几种常见的概率分布律
n
Cnk p k q nk (q p)n 1
k 0
3. P( x m) Pn (k m)
m
Cnk p k q nk
(3-2)
4. P( x m) Pn (k m)
nk 0
Cnk p k q nk
(3-3)
k m
5. m2
P(m1 x m2 ) pn (m1 k m2 )
• 平均数:
nK
N
• 方差:
2 nK(N K )( N n)
N 2 (N 1)
2. 负二项分布
• 负二项分布所要求的条件与二项分布是一样 的。不同的是负二项分布需要求出在第x次试 验时,发生第k次事件A的概率。或者说,在x 次试验中,共发生k次事件A,而且事件A的第 k次试验恰恰是在第x次试验发生的。
x 中细菌数服从波松分布。以=0.500代替 (3-10)
式中的λ,得
P( x k ) 0.5k e0.5 (k=0, 1, 2, …) k!
计算结果如表3-3所示。
表3-3 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是 相当吻合的 , 进一步说明用波松分布描述单位 容积(或面积)中细菌数的分布是适宜的。
P(x
7)
C170 0.7570.253
10! 0.757 7!3!
0.253
0.2503
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗?
二项分布的应用条件有三:
(1)各观察单位只具有互相对立的一种结果,如阳 性或阴性,生存或死亡等,属于二项分类资料;
生物统计学习题集答案
生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为连续变量和非连续变量。
2 样本统计数是总体参数的估计量。
3 生物统计学是研究生命过程中以样本来推断总体的一门学科。
4 生物统计学的根本内容包括_试验设置、统计分析_两大局部。
5 统计学的开展过程经历了古典记录统计学、近代描述统计学现代推断统计学3个阶段。
6 生物学研究中,一般将样本容量n大于等于30称为大样本。
7 试验误差可以分为__随机误差、系统误差两类。
二、判断〔-〕1 对于有限总体不必用统计推断方法。
〔-〕2 资料的准确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
〔+〕4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的假设干个体所构成的集合称为样本。
总体:具有一样的个体所构成的集合称为总体。
连续变量:是指在变量*围内可抽出*一*围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中*一试验指标或性状的观测值与真实值接近的程度。
准确性:也称准确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章试验资料的整理与特征数的计算一、填空1 资料按生物的性状特征可分为___数量性状资料_变量和__变量性状资料_变量。
2 直方图适合于表示__计量、连续变量_资料的次数分布。
3 变量的分布具有两个明显根本特征,即_集中性_和__离散性_。
4 反映变量集中性的特征数是__平均数__,反映变量离散性的特征数是__变异数〔标准差〕_。
5 样本标准差的计算公式s=√∑〔*-*横杆〕平方/(n-1)。
二、判断( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
( - ) 2 条形图和多边形图均适合于表示计数资料的次数分布。
〔 +〕3 离均差平方和为最小。
〔 + 〕4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
第三章 概率与概率分布 华中农业大学生物统计学讲义
该试验样本空间由10个等可能的基本事件构成,即n=10,而事 件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一 个,事件A便发生。
P(A)=3/10=0.3
P(B)=5/10=0.5
12 3 4 5
6
7
8 9 10
一、概率基本概念
A=“一次取一个球,取得红球的概率”
10个球中取一个球,其可能结果有10个基本事件(即每个球 被取到的可能性是相等的),即n=10 事件A:取得红球,则A事件包含3个基本事件,即m=3
P(A)=3/10=0.3
12 3 4 5
6
7
8
9 10
一、概率基本概念
B= “一次取5个球,其中有2个红球的概率” 10个球中任意取5个,其可能结果有C105个基本事件,即n= C105 事件B =5个球中有2个红球,则B包含的基本事件数m= C32 C73
P(B) = C32 C73 / C105 = 0.417
2、在一定条件下可能发生也可能不 发生。
(二)频率(frequency)
一、概率基本概念
若在相同的条件下,进行了n次试验,在这n 次试验中,事件A出现的次数m称为事件A出现的 频数,比值m/n称为事件A出现的频率(frequency), 记为W(A)=m/n。
0≤W(A) ≤1
例:
一、概率基本概念
设样本空间有n个等可能的基本事件所构成,其中事件A包 含有m个基本事件,则事件A的概率为m/n,即P(A)=m/n。
古典概率(classical probability) 先验概率(prior probability)
一、概率基本概念
1 2 3 4 5 6 7 8 9 10
随机抽取一个球,求下列事件的概率; (1)事件A=抽得一个编号< 4 (2)事件B =抽得一个编号是2的倍数
生物统计学课后习题解答
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。
24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注意:
0.5时,分布对称; 0.5时,分布偏斜:
概率
0.5时,正偏 0.5时,负偏
2016/3/6
5 二项分布变量的平均数和标准差
平均数
E(X) n
方差和标准差
Var( X ) n (1 )
2
n (1 )
2016/3/6
σ=0.5 σ=1 σ=2
2016/3/6
(5)曲线下和x轴所夹义:μ=0,σ=1时的正态分布称为标准正态分布。 标准正态分布变量记为U,写作 U~N(0,1)。
密度函数: (u) 1 e 2
u
u2 2
分布函数:(u ) P(U u )
2. 二项分布的常用符号
n :贝努利试验的次数(或 样本含量)
x : 在n次试验中事件A出现的次数,即二项分布变量X 的取值
: 事件A发生的概率 (每次试验都是恒定的 )
1 - : 事件A发生的概率
p(x) : X的概率函数即P(X x)
F( x) P(X x) p(xi )
第三章 概率与概率分布
第一节 概率基础知识 第二节 几种常见的理论分布
第三节 统计数的分布
2016/3/6
第二节 几种常见的理论分布
二项分布
泊松分布 离散型变量 超几何分布 负二项分布 连续型变量 指数分布 正态分布
2016/3/6
一、二项分布 (Binomial Distribution)
的第x 1项,所以有“二项分布”这个名称。
0 0 1 1 x x n n [ (1 )]n Cn (1 )n Cn (1 )n1 Cn (1 )nx Cn (1 )0
x x (2) P(x) Cn (1 )nx [ (1 )]n 1n 1 x 0 x 0
xi x
2016/3/6
3. 二项分布的概率函数P(y)
怎样得到P(x)?
以n=4,x=2为例,欲求P(x=2)=?。
在4次贝努利试验里,获得 2次成功的方式有 C 种:
2 4
ssff
sfsf
sffs
fssf
fsfs
ffss
2 注意:C4 是从四个位置选取两个位置的组合方式。
n! 4! 4 3 2 1 2 依据计算公式C , C4 =6 2016/3/6 x!(n x)! 2!2! 2 1 2 1
n
n
2016/3/6
例一,纯种白猪与纯种黑猪杂交,根据孟德 尔遗传理论,子二代中白猪与黑猪的比率为 3:1。求窝产仔10头,有7头白猪的概率。
解:根据题意,这是一个二项分布的问题, 3 视白猪为成功,有n 10, = 0.75,x 7。 4
P(x 7) P(7) C 0.75 (1 0.75)
1 f (x) e 2 (x )2 2 2
其中,为平均数, 2为方差,则称变量X服从正态分布,记为X ~ N (, 2 )。
f(x)的曲线为 • X的分布函数
2016/3/6
没有更简化 的形式
(x )2 2 2
F (x) P(X x)
x
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。
2016/3/6 (5)n尾鱼苗的成活数X,X服从二项分布。
x n
每种方式发生的概率为:
P(ssff)
乘法法则
P(s)P(s)P( f)P(f) (1 ) (1 ) 2 (1 ) 2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得x 2次成功的概率为
2 2 P(2) C4 (1 ) 42
数学期望与方差
计算程序: P( X ) =hypgeomdist ( x , n ,
M,N)
2016/3/6
例子
四川卧龙大熊猫自然保护区共有野生大熊猫 100只,其中10 只做了标记。某小组去调查研究大熊猫的生活习性,随机观 察了15只大熊猫,问这15只大熊猫中有5只做了标记的概率?
解:依题意有N=100,M=10,n=15,y=5,求p(5)
7 10 7
107
10! 0.757 0.253 7!3! 0.2503
2016/3/6
所以,窝产仔10头,有7头白猪的概率是0.2503。
例二,有一批玉米种子,出苗率为 0.67 。现任取 6 粒种子种1穴中,问这穴至少有1粒种子出苗的概率 是多少?
解:根据题意,这是一个二项分布的问题。视出苗为成功,有n 6, =0.67。 设出苗的种子数为x, 则x服从二项分布。
1 2
e y
2
/2
dy
密度函数 (u)的曲线:
2016/3/6
3 标准正态分布的概率计算
查表法:附表1(260页)列出了标准正态变量的累积分布 函数值,即U小于某个值u的概率:P(U<u)
例如,抛硬币4次,获得的正面数记为X,则X服从二项分布。 X的概率分布表为 X P(x)
n 4, 0.5,
0 P(0) C4 0.50 0.54 0.062
0
1 2 3
2016/3/6
0.062
0.250 0.375 0.250 0.062
4
X的概率分布图为
二项分布 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 获得正面的次数y 3 4
1. 在什么情形下应用泊松分布
泊松分布是一种用来描述一定的空间或时间里稀有事件发生次 数的概率分布。 服从泊松分布的变量的一些例子:
• 一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。 • 畜群中遗传的畸形怪胎数 • 单位空间内某些野生动物或昆虫数
2016/3/6
• 每升饮水中的大肠杆菌数
2. 泊松分布的概率函数与特征数
1.贝努利试验和在什么情形下应用二项分布
•贝努利试验(Bernoulli trial):试验只有两种可能的结果,
并且发生每种结果的概率是一定的。
例如:抛一枚硬币,看得到正面还是反面; 掷一次骰子,看得到6还是没有得到6; 随机抽查一名婴儿的性别,看是男是女 在贝努利试验里,两种结果可分别称为“成功”和“失败”,
p ( 5 ) =hypgeomdist ( x , n , M , N ) =hypgeomdist
(5,15,10,100)=0.00569
2016/3/6
三、正态分布 (Normal Distribution)
正态分布是一种最重要的连续型变量的概率分布。
• 在生物科学研究里,有许多变量是服从或近似服从正态
分布的,如水稻产量、小麦株高、玉米百粒重等;
• 许多统计分析方法是以正态分布为基础的。 • 不少随机变量的概率分布在样本容量增大时趋于正态分 布。 因此,在统计学里,正态分布无论在理论研究上还是在实际
2016/3/6
应用中均占有重要的地位。
1 正态分布的定义与主要特征
定义:若变量X的概率分布的密度函数为
2016/3/6
二项分布的程序计算方法
二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排 列组合数C n m 计算函数Combin(m,n)
2016/3/6
二、 泊松分布 (Poisson Distribution)
1 f (x)dx 2
x
e
dx
正态分布曲线的主要特征:
(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是x=μ (2)曲线是非负函数,以x轴为渐近线,分布从-∞到∞ (3)曲线在x=μ±σ处各有一个拐点,即在[μ-σ, μ+σ]范围 内是上凸,其余是下凸。 (4)曲线有两个参数:μ和σ。 μ代表平均数,σ代表标准差, μ和σ一起决定曲线的位置和形状。 μ越大,则曲线沿x轴 越向右移动;反之向左。 σ是变异度参数, σ愈大则曲线 愈“胖”;反之则愈瘦。
2016/3/6
二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 X 为所抽取的3件产品中的次品数,则根据二项分 布公式有
P X 2 C32 (0.05)2 (0.95)32 0.007125
例三,某树种幼苗成材率为 70%,现种植 2000 株,问成材幼苗数的平均值和标准差是多少?
解:设2000株幼苗的成材数为X, 则X服从二项分布。
根据题意, n 2000 , 0.70。
平均数 n 2000 0.70 1400
标准差 n(1 ) 2000 0.7 0.3 20.49
2016/3/6
大约有 100 P( X 3) 100 0.4232 42.32(张)
程序计算
Poisson(x,µ ,true or false)
2016/3/6
超几何分布
适用范围:多次完全相同并且相互独立的 重复试验,如果在有限总体中不重复抽样, 抽样成功的次数X的概率分布服从超几何分 布,如福利彩票
另外一种方法: P(至少有1粒出苗)=1-P(没有出苗)=1 P( y 0)