生物统计学第三章 概率和概率分布(2)
生物统计学 几种常见的概率分布律
了解
标准正态分布
/fai/
学习小组任务
1、请分析讲解例题3.2和3.4。 2、请讲解负二项分布的统计学意义。 3、自学标准正态分布的9个特性。 4、请分析讲解例题3.10。 5、请讲解各习题的答题思路。 6、如果从班级里随机抽取10名同学,分析其中正好男 女生各占一半概率的问题应用什么概率分布率?为 什么? 7、如果从班级里随机抽取1名同学,分析其体重在5070kg范围内的概率应用什么概率分布率?为什么?
μ=20,泊松分布很接近正态分布; μ=50,两者无区别。 当φ<0.1且n φ<5时,可用泊松分布作为 二项分布的近似。
泊松分布应用实例
泊松分布是描述在一定空间 (长度、面积和体积)或一 定时间间隔内点子散布状况 的理想化模型。
利用科学计算 器进行计算
§3.3 另外几种离散型概率分布
超几何分布
生物统计学
Biostatistics
第三章 几种常见的概率分布律
Several Common Probability Distributions
2016.3
生物统计学主要教学内容
统计数据的收集与整理 概率与概率分布 抽样分布 统计推断 拟合优度检验与列联表卡方检验 方差分析 回归与简单相关分析 实验设计 EXCEL和SPSS的一般应用
§3.4 正态分布
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
除了σ,还可以用什么统计量描 请问,这是概率分布曲线还 述这3个曲线的差异? 是频率分布曲线?
生物统计学第三章 概率和概率分布(2)
的第x 1项,所以有“二项分布”这个名称。
0 0 1 1 x x n n [ (1 )]n Cn (1 )n Cn (1 )n1 Cn (1 )nx Cn (1 )0
x x (2) P(x) Cn (1 )nx [ (1 )]n 1n 1 x 0 x 0
2. 二项分布的常用符号
n :贝努利试验的次数(或 样本含量)
x : 在n次试验中事件A出现的次数,即二项分布变量X 的取值
: 事件A发生的概率 (每次试验都是恒定的 )
1 - : 事件A发生的概率
p(x) : X的概率函数即P(X x)
F( x) P(X x) p(xi )
2014-4-21
二项分布的程序计算方法
二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排 列组合数C n m 计算函数Combin(m,n)
2014-4-21
二、 泊松分布 (Poisson Distribution)
2014-4-21
二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 X 为所抽取的3件产品中的次品数,则根据二项分 布公式有
P X 2 C32 (0.05)2 (0.95)32 0.007125
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
生物统计学:第三章随机变量与概率分布
例:用复合饲料饲养动物,每天增重的kg数及 其相应的概率如下:
每天增重xi /kg 0.5
概率 0.10
1.0
0.20
1.5
0.50
2.0
0.20
问每天增重的数学期望和方差是多少?
解: μ=E(X)=1.40
E(X2 ) =2.15
var=σ2 = E(X2 ) –μ2=2.15-1.42=0.19
15.167
(4)随机变量的方差(variance) - 总体方差
度量随机变量取值的变异程度的指标,其定义式:
Var( X ) 2 ( xi )2 E[( X )2 ]
N
E[( X )2 ] E( X 2 2 X 2 )]
E(X 2) 2E(X ) 2
对于例1:
件的集合)的概率有以下关系:P(A )=1-P(A)
2 )条件概率
➢ 已知事件B发生的条件下,事件A发生的概率 称为条件概率,记为P(A︱B) P(A∣B)=P(AB)/P(B) P(B∣A)=P(AB)/P(A)
例:一周的天气情况如下:
周日
日
一
二
三
四
五
六
预报
晴
阴
雨
雨
雨
晴
雨
实际
晴
雨
阴
雨
雨
晴
晴
设A表示预报有雨的事件,B表示实际下雨的事件
些值的概率p(x1),p(x2),…,p(xn),…,排列起来,构 成了离散型随机变量的概率分布。常用概率分布表或概 率分布图表示(如,p28表与p29图3-1)。
例3.1 掷一次骰子所得点数的概率函数
f (x) 1 , x 1, 2, 3, 4, 5, 6 6
生物统计学(第四版)答案 1—6章
2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19。
【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。
2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46;第三章概率与概率分布3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值:(1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96;(5)P(-2.58<u≤2.58)。
【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。
3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值:(1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。
【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。
3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。
(1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率;(2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。
生物统计2
2
(二项分布的概率之和等于1)
m
3
k P ( x m) P ( k m) C n p k q n k k 0
4 5
k P ( x m) P ( k m) C n p k q n k k m
n
P(m1 x m2 ) P(m1 k m 2 )
3. 概率
概率的基本性质:
任何事情的概率都在0和1之间,即:0≤ P(A) ≤1 必然事件的概率等于1,即:P(U)=1 不可能事件的概率等于0,即:P(V)=0
二 事件的相互关系
1.和事件: 事件A和事件B至少有一件发生而构成的新事件称 为事件A和事件B的和事件,以A+B表示。
2.积事件:
第一节 概率基础知识
一、概率的概念 事件 频率 概率 二、事件的相互关系 三、概率计算法则 四、大数定律
1. 事件
在一定条件下,某种事物出现与否就称为是事件。 确定性事件和不确定事件 必然事件(U):在一定条件下必然出现的现象。 不可能事件(V):在一定条件下必然不出现的现象。 随机事件:在一定条件下可能发生也可能不发生的现象。
概率累积函数: F ( x)
P( x)
x 0
i
一、二项分布
0 C7
n! x Cn x!(n x)!
扔7次硬币,求 有0,1,2,3,4,5, 6,7次国徽面的 概率?
1 C7
2 C7
3 C7
4 C7
5 C7
6 C7
7 C7
7! 7! 7 6 5 4 3 2 1 1 0!(7 0)! 7! 7 6 5 4 3 2 1 7! 7! 7 6 5 4 3 2 1 7 1 (7 1)! ! 1 6! !* 1 6 5 4 3 2 1 7! 7! 7 6 5 4 3 2 1 21 2!(7 2)! 2!*5! 2 1 5 4 3 2 1 7! 7! 7 6 5 4 3 2 1 35 3!(7 3)! 4!*3! 4 3 2 1 3 2 1 7! 7! 7 6 5 4 3 2 1 35 4!(7 4)! 4!*3! 4 3 2 1 3 2 1 7! 7! 7 6 5 4 3 2 1 21 5!(7 5)! 5!*2! 5 4 3 2 1 2 1 7! 7! 7 6 5 4 3 2 1 7 6!(7 6)! 6!*1 ! 6 5 4 3 2 1 1 7! 7! 7 6 5 4 3 2 1 1 7!(7 7)! 7! 7 6 5 4 3 2 1
生物统计学第三章概率分布
中位数 ➢ x轴为曲线向左、右延伸的渐进线
➢ 由两个参数决定: 平均数 和 标准差 • 决定曲线在x 轴上的位置 • 决定曲线的形状
正态分布
平均数的影响
标准差的影响
正态分布
标准正态分布(standard normal distribution)
对于给定的两尾概率求标准正态分布在x 轴上的分位点
/2
/2
对于给定的一尾概率求标准正态分布在x 轴上的分位点
/2
/2
(1)设标准正态分布的右尾(左尾)概率为
,求分位数u值
用2 查附表2,可得一尾概率为 时的分位数u值
= 20.05 = 0.1查表得u = 1.644854 。
(2)
, = 20.01 = 0.02查表得u = 2.326348
离散型随机变量的概率分布
普哇松分布的概率函数
普哇松分布的期望与方差
离散型随机变量的概率分布
例2:某遗传病的发病率为0.0003,某鸡场有10000头 肉鸡,问今年发生该遗传病4头及4头以上的概率有 多少?
λ=μ=np=10000×0.0003=3 x=4 P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
离散型随机变量的概率分布
二项分布的概率函数
二项分布的期望 二项分布的方差
离散型随机变量的概率分布
例1:一头母猪一窝产了10头仔猪,分别求其
中有2头公猪和6头公猪的概率。
产公猪头数的期望值: 产公猪头数的方差:
离散型随机变量的概率分布
普哇松分布(Poisson distribution)
最新生物统计学课后习题解答-李春喜
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地100 例30 ~40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种10 个果穗长度(cm) 的标准差和变异系数,并解释所得结果。
24 号:19 ,21 ,20 ,20 ,18 ,19 ,22 ,21 ,21 ,19 ;金皇后:16 ,21 ,24 ,15 ,26 ,18 ,20 ,19 ,22 ,19 。
【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。
生物统计学习题集答案
生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为连续变量和非连续变量。
2 样本统计数是总体参数的估计量。
3 生物统计学是研究生命过程中以样本来推断总体的一门学科。
4 生物统计学的根本内容包括_试验设置、统计分析_两大局部。
5 统计学的开展过程经历了古典记录统计学、近代描述统计学现代推断统计学3个阶段。
6 生物学研究中,一般将样本容量n大于等于30称为大样本。
7 试验误差可以分为__随机误差、系统误差两类。
二、判断〔-〕1 对于有限总体不必用统计推断方法。
〔-〕2 资料的准确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
〔+〕4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的假设干个体所构成的集合称为样本。
总体:具有一样的个体所构成的集合称为总体。
连续变量:是指在变量X围内可抽出某一X围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
准确性:也称准确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章试验资料的整理与特征数的计算一、填空1 资料按生物的性状特征可分为___数量性状资料_变量和__变量性状资料_变量。
2 直方图适合于表示__计量、连续变量_资料的次数分布。
3 变量的分布具有两个明显根本特征,即_集中性_和__离散性_。
4 反映变量集中性的特征数是__平均数__,反映变量离散性的特征数是__变异数〔标准差〕_。
5 样本标准差的计算公式s=√∑〔x-x横杆〕平方/(n-1)。
二、判断( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
( - ) 2 条形图和多边形图均适合于表示计数资料的次数分布。
〔+〕3 离均差平方和为最小。
〔+ 〕4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
生物统计学答案第三章
第三章 几种常见的概率分布律3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少?答:代入二项分布概率函数,这里φ=1/2。
()75218.02565621562121!5!3!83835==⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫⎝⎛=p结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为 0.21875。
3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1)543223455414143541431041431041435434143⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛=⎪⎭⎫⎝⎛+表型共有1+5+10+10+5+1 = 32种。
(2)()()()()()()6976000.0024114165014.00241354143589087.002419104143107263.0024127104143105395.00241815414353237.0024124343554322345541322314==⎪⎭⎫⎝⎛==⨯=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛===⎪⎭⎫⎝⎛=隐隐显隐显隐显隐显显P P P P P P 它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。
3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大?答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为:()()()()()φφφ--=-=--=-1lg 1lg 1lg 1lg 11a a an P n P n P3.4 根据以往的经验,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。
生物统计学 第三章 概率论
即复合事件的概率必等于该事件出现的组合数目乘以
单个事件的概率;而这一复合事件的可能组合数目则相
当于从n(3)个物体中任取其x(2)个物体的组合数。数学上 的组合公式为:
n! C x!(n x)!
x n
(二)二项分布的概率函数
二项式中包含两项,这两项的概率为p、q,并且 p+q=1,可推知变量x的概率函数为:
0 2
• 若期望有0.99的概率获得1头或1头以上的 死去的,至少应该调查多少头?
• 若期望有0.99的概率获得1头或1头以上的 死去的,至少应该调查多少头? 解:应调查的头数应该满足 P(0)=1-0.99=0.01 P(0)=Cn0p0qn=0.01 0.6n=0.01 nlg0.6=lg0.01 n=(lg0.01)/(lg0.6)=-2/(-0.222)=9头
抽取三粒种子(以Y代黄子叶,以G代青子叶), 即n=3,有两粒黄子叶种子,即x=2,这时有3种不
同组合: GGY,GYG,YGG。出现第一粒,第二
粒和第三粒种子是互不影响的,因此这三个事件是 独立事件,由乘法法则可得:
3 3 1 9 P(GGY ) ( )( )( ) 4 4 4 64
3 1 3 9 P (GYG ) ( )( )( ) 4 4 4 64
当p=q,二项式分布呈对称状,如p≠q,则表现偏斜状。
二项分布的几点性质 (1) 当p值较小且n不大时 ,分布是偏倚的。但随着n的增大,分布 逐渐趋于对称 (下图1) (2) 当 p 值趋于0.5,分布趋于对称(下图2) (3) 对于固定的n及p,当k增加时,Pn(k)先随之增加并达到其极大 值,以后又下降 (4) 在n较大,np、nq 较接近时,二项分布接近于正态分布;当 n→∞时,二项分布的极限分布是正态分布
生物统计学 第3章 几种常见的概率分布律
n
Cnk p k q nk (q p)n 1
k 0
3. P( x m) Pn (k m)
m
Cnk p k q nk
(3-2)
4. P( x m) Pn (k m)
nk 0
Cnk p k q nk
(3-3)
k m
5. m2
P(m1 x m2 ) pn (m1 k m2 )
• 平均数:
nK
N
• 方差:
2 nK(N K )( N n)
N 2 (N 1)
2. 负二项分布
• 负二项分布所要求的条件与二项分布是一样 的。不同的是负二项分布需要求出在第x次试 验时,发生第k次事件A的概率。或者说,在x 次试验中,共发生k次事件A,而且事件A的第 k次试验恰恰是在第x次试验发生的。
x 中细菌数服从波松分布。以=0.500代替 (3-10)
式中的λ,得
P( x k ) 0.5k e0.5 (k=0, 1, 2, …) k!
计算结果如表3-3所示。
表3-3 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是 相当吻合的 , 进一步说明用波松分布描述单位 容积(或面积)中细菌数的分布是适宜的。
P(x
7)
C170 0.7570.253
10! 0.757 7!3!
0.253
0.2503
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗?
二项分布的应用条件有三:
(1)各观察单位只具有互相对立的一种结果,如阳 性或阴性,生存或死亡等,属于二项分类资料;
第三章 概率与概率分布 华中农业大学生物统计学讲义
该试验样本空间由10个等可能的基本事件构成,即n=10,而事 件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一 个,事件A便发生。
P(A)=3/10=0.3
P(B)=5/10=0.5
12 3 4 5
6
7
8 9 10
一、概率基本概念
A=“一次取一个球,取得红球的概率”
10个球中取一个球,其可能结果有10个基本事件(即每个球 被取到的可能性是相等的),即n=10 事件A:取得红球,则A事件包含3个基本事件,即m=3
P(A)=3/10=0.3
12 3 4 5
6
7
8
9 10
一、概率基本概念
B= “一次取5个球,其中有2个红球的概率” 10个球中任意取5个,其可能结果有C105个基本事件,即n= C105 事件B =5个球中有2个红球,则B包含的基本事件数m= C32 C73
P(B) = C32 C73 / C105 = 0.417
2、在一定条件下可能发生也可能不 发生。
(二)频率(frequency)
一、概率基本概念
若在相同的条件下,进行了n次试验,在这n 次试验中,事件A出现的次数m称为事件A出现的 频数,比值m/n称为事件A出现的频率(frequency), 记为W(A)=m/n。
0≤W(A) ≤1
例:
一、概率基本概念
设样本空间有n个等可能的基本事件所构成,其中事件A包 含有m个基本事件,则事件A的概率为m/n,即P(A)=m/n。
古典概率(classical probability) 先验概率(prior probability)
一、概率基本概念
1 2 3 4 5 6 7 8 9 10
随机抽取一个球,求下列事件的概率; (1)事件A=抽得一个编号< 4 (2)事件B =抽得一个编号是2的倍数
生物统计学课件1、概率及概率分布
指数分布在统计分析中常用于计算随机事件的概率和期望值,如生存 分析和可靠性工程。
REPORT
CATALOG
DATE
ANALYSIS
SUMMAR Y
03
概率分布的应用
在生物统计学中的应用
描述生物样本人群的特征
遗传学研究
通过概率分布,可以描述生物样本人 群的某些特征,如身高、体重、年龄 等。
在遗传学研究中,概率分布被广泛应 用于基因频率的分布和遗传疾病的分 布。
正态分布在统计学中的重要性在于许 多统计方法和假设检验都是基于正态 分布的假设。
泊松分布
泊松分布是一种离散概率分布 ,常用于描述单位时间内随机
事件发生的次数。
泊松分布的概率函数由两个参 数λ和k控制,其中λ表示单位时
间内随机事件发生的平均次数 ,k表示随机事件发生的次数。
泊松分布在生物统计学中常用 于描述某些离散变量的分布, 如遗传学中的基因突变频率、 流行病学中的疾病发病率等。
在社会科学研究中的应用
人口统计学研究
在人口统计学研究中,概率分布 被用于描述人口特征和分布情况
。
社会调查
在社会调查中,概率分布被用于描 述调查结果的分布情况,例如调查 结果的置信区间和抽样误差。
经济预测
在经济预测中,概率分布被用于预 测经济发展趋势和未来经济状况。
REPORT
CATALOG
DATE
描述随机变量取连续数值时的概率分布,如正态分布、指数 分布等。
离散概率分布
二项分布
描述在n次独立重复的伯努利试验中 成功的次数的概率分布,常用于描述 生物实验和调查中的成功次数。
泊松分布
描述单位时间内(或单位面积上)随 机事件发生的次数,常用于描述稀有 事件的概率模型。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(5,15,10,100)=0.00569
2014-4-21
三、正态分布 (Normal Distribution)
正态分布是一种最重要的连续型变量的概率分布。
• 在生物科学研究里,有许多变量是服从或近似服从正态
2. 二项分布的常用符号
n :贝努利试验的次数(或 样本含量)
x : 在n次试验中事件A出现的次数,即二项分布变量X 的取值
: 事件A发生的概率 (每次试验都是恒定的 )
1 - : 事件A发生的概率
p(x) : X的概率函数即P(X x)
F( x) P(X x) p(xi )
的第x 1项,所以有“二项分布”这个名称。
0 0 1 1 x x n n [ (1 )]n Cn (1 )n Cn (1 )n1 Cn (1 )nx Cn (1 )0
x x (2) P(x) Cn (1 )nx [ (1 )]n 1n 1 x 0 x 0
n
n
2014-4-21
例一,纯种白猪与纯种黑猪杂交,根据孟德 尔遗传理论,子二代中白猪与黑猪的比率为 3:1。求窝产仔10头,有7头白猪的概率。
解:根据题意,这是一个二项分布的问题, 3 视白猪为成功,有n 10, = 0.75,x 7。 4
P(x 7) P(7) C 0.75 (1 0.75)
P(至少有1粒出苗)=P(x 1) P(x 1) P(x 2) P(x 6)
1 2 6 C6 0.6710.335 C6 0.672 0.334 C6 0.676 0.330
0.0157 0.0799 0.0905 0.9987
2014-4-21
二项分布的程序计算方法
二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排 列组合数C n m 计算函数Combin(m,n)
2014-4-21
二、 泊松分布 (Poisson Distribution)
2014-4-21
大约有 100 P( X 3) 100 0.4232 42.32(张)
程序计算
Poisson(x,µ ,true or false)
2014-4-21
超几何分布
适用范围:多次完全相同并且相互独立的 重复试验,如果在有限总体中不重复抽样, 抽样成功的次数X的概率分布服从超几0.757 0.253 7!3! 0.2503
2014-4-21
所以,窝产仔10头,有7头白猪的概率是0.2503。
例二,有一批玉米种子,出苗率为 0.67 。现任取 6 粒种子种1穴中,问这穴至少有1粒种子出苗的概率 是多少?
解:根据题意,这是一个二项分布的问题。视出苗为成功,有n 6, =0.67。 设出苗的种子数为x, 则x服从二项分布。
2014-4-21
二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 X 为所抽取的3件产品中的次品数,则根据二项分 布公式有
P X 2 C32 (0.05)2 (0.95)32 0.007125
例如,抛硬币4次,获得的正面数记为X,则X服从二项分布。 X的概率分布表为 X P(x)
n 4, 0.5,
0 P(0) C4 0.50 0.54 0.062
0
1 2 3
2014-4-21
0.062
0.250 0.375 0.250 0.062
4
X的概率分布图为
二项分布 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 获得正面的次数y 3 4
第三章 概率与概率分布
第一节 概率基础知识 第二节 几种常见的理论分布
第三节 统计数的分布
2014-4-21
第二节 几种常见的理论分布
二项分布
泊松分布 离散型变量 超几何分布 负二项分布 连续型变量 指数分布 正态分布
2014-4-21
一、二项分布 (Binomial Distribution)
1 f (x) e 2 (x )2 2 2
其中,为平均数, 2为方差,则称变量X服从正态分布,记为X ~ N (, 2 )。
f(x)的曲线为 • X的分布函数
2014-4-21
没有更简化 的形式
(x )2 2 2
F (x) P(X x)
x
x
x!
e 。
2014-4-21
泊松分布的平均数
=E ( X )
泊松分布的方差和标准差
=Var( X )
2
2014-4-21
例一,显微镜下观察一种悬浮液中的某种颗粒,据 前人报告,平均每张样片可以观察到3个微粒,问在 一次观察中看到 3 个微粒的概率是多大?少于 3个微 粒的概率是多少?若观察100张片子,大约有多少张 片子看到的微粒数少于3个?
分布的,如水稻产量、小麦株高、玉米百粒重等;
• 许多统计分析方法是以正态分布为基础的。 • 不少随机变量的概率分布在样本容量增大时趋于正态分 布。 因此,在统计学里,正态分布无论在理论研究上还是在实际
2014-4-21
应用中均占有重要的地位。
1 正态分布的定义与主要特征
定义:若变量X的概率分布的密度函数为
x n
每种方式发生的概率为:
P(ssff)
乘法法则
P(s)P(s)P( f)P(f) (1 ) (1 ) 2 (1 ) 2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得x 2次成功的概率为
2 2 P(2) C4 (1 ) 42
解:一张片子里看到的微粒数X,可以看成是一定空间里的稀有 事件数,所以它服从泊松分布,且有 3。
P(X 3)
x e
33 e3 0.2240 x! 3!
P (X 3) P( X 0) P( X 1) P( X 2) 30 e 3 31 e 3 32 e 3 0! 1! 2! 0.4232
** 由此类推到一般情形,在n此贝努利试验中,共获得 x次成功的概率是
2014-4-21
P (x) Cnx x (1 )n x
关于P(x) C (1 )
x n x
nx
的讨论:
x x ()从形式上来说, 1 Cn (1 )nx 是二项式[ (1 )]n 展开
2014-4-21
或者“事件A发生”和“事件A没有发生”。
• 什么情形时应用二项分布:实验中进行了 n 次独立的贝努利 试验,统计在这n次试验中总共获得了多少次“成功”。“成 功”的次数,记为变量X;X称为二项分布变量,X的概率分布 称为二项分布。
X的可能取值为0,1,2,…,n。所以X是个离散型变量。
1. 在什么情形下应用泊松分布
泊松分布是一种用来描述一定的空间或时间里稀有事件发生次 数的概率分布。 服从泊松分布的变量的一些例子:
• 一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。 • 畜群中遗传的畸形怪胎数 • 单位空间内某些野生动物或昆虫数
2014-4-21
• 每升饮水中的大肠杆菌数
2. 泊松分布的概率函数与特征数
例三,某树种幼苗成材率为 70%,现种植 2000 株,问成材幼苗数的平均值和标准差是多少?
解:设2000株幼苗的成材数为X, 则X服从二项分布。
根据题意, n 2000 , 0.70。
平均数 n 2000 0.70 1400
标准差 n(1 ) 2000 0.7 0.3 20.49
xi x
2014-4-21
3. 二项分布的概率函数P(y)
怎样得到P(x)?
以n=4,x=2为例,欲求P(x=2)=?。
在4次贝努利试验里,获得 2次成功的方式有 C 种:
2 4
ssff
sfsf
sffs
fssf
fsfs
ffss
2 注意:C4 是从四个位置选取两个位置的组合方式。
n! 4! 4 3 2 1 2 依据计算公式C , C4 =6 2014-4-21 x!(n x)! 2!2! 2 1 2 1
泊松分布变量 X 只取零和正整数: 0,1,2… ,其概率 函数为
P(x)
其中 0,
x
x!
e
e 2.7182 是自然对数底数。
注意:P(x)怎么得到的呢?泊松分布可以用二项分布在n , 0, n 的情形来近似。在这种情形下C (1 )
x n x nx
σ=0.5 σ=1 σ=2
2014-4-21
(5)曲线下和x轴所夹的总面积为1
2 标准正态分布
定义:μ=0,σ=1时的正态分布称为标准正态分布。 标准正态分布变量记为U,写作 U~N(0,1)。
密度函数: (u) 1 e 2
u
u2 2
分布函数:(u ) P(U u )
另外一种方法: P(至少有1粒出苗)=1-P(没有出苗)=1 P( y 0)
0 1 C6 0.670 0.336 1 0.0013 0.9987
2014-4-21