几率值表(生物统计)
生物统计学 几种常见的概率分布律
了解
标准正态分布
/fai/
学习小组任务
1、请分析讲解例题3.2和3.4。 2、请讲解负二项分布的统计学意义。 3、自学标准正态分布的9个特性。 4、请分析讲解例题3.10。 5、请讲解各习题的答题思路。 6、如果从班级里随机抽取10名同学,分析其中正好男 女生各占一半概率的问题应用什么概率分布率?为 什么? 7、如果从班级里随机抽取1名同学,分析其体重在5070kg范围内的概率应用什么概率分布率?为什么?
μ=20,泊松分布很接近正态分布; μ=50,两者无区别。 当φ<0.1且n φ<5时,可用泊松分布作为 二项分布的近似。
泊松分布应用实例
泊松分布是描述在一定空间 (长度、面积和体积)或一 定时间间隔内点子散布状况 的理想化模型。
利用科学计算 器进行计算
§3.3 另外几种离散型概率分布
超几何分布
生物统计学
Biostatistics
第三章 几种常见的概率分布律
Several Common Probability Distributions
2016.3
生物统计学主要教学内容
统计数据的收集与整理 概率与概率分布 抽样分布 统计推断 拟合优度检验与列联表卡方检验 方差分析 回归与简单相关分析 实验设计 EXCEL和SPSS的一般应用
§3.4 正态分布
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
除了σ,还可以用什么统计量描 请问,这是概率分布曲线还 述这3个曲线的差异? 是频率分布曲线?
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
生物统计学03概率和概率分布
e
−λ
(λ = np)
x = 0, 1, 2…, n
第二节 常用的概率分布 二、泊松分布
☆ 参数 参数:
µ= λ
2 = λ σ
☆ 形状
λ=0.5 λ=1.5 λ=2.5
λ→20
泊松分布→正态分布 泊松分布 正态分布
第二节 常用的概率分布 三、正态分布
☆ 是一种连续随机变量的概率分布 ☆ 许多生物现象的计量资料均服从正态分布 ☆ 一般假定试验误差的分布服从正态分布 ☆ 非正态总体统计数的抽样分布近似服从正态分布
☆当 p 值较小且 n 值不
0.25 0.2 0.15 0.1 0.05 0 1 3 5 7
p=0.3
p=0.5
p=0.75
大时, 大时,图形是偏倚的
☆当 p 值趋于 时,分 值趋于0.5时
布趋于对称
9
11
13
15
17
19
21
第二节 常用的概率分布 二、泊松分布
☆ 概率函数
P( x ) =
λ
x
x!
第二节 常用的概率分布
随机抽取20株小麦 测得平均株高为82.3cm,标准差为 株小麦, cm, 例3.4 随机抽取 株小麦,测得平均株高为 cm 1.7502cm,试计算: cm,试计算: cm 1)株高≥85cm的概率; 的概率; 的概率 的正常值范围。 2)小麦株高的95%的正常值范围。 小麦株高的 的正常值范围
第二节 常用的概率分布 三、正态分布
1. 概率函数
f (x) = 1
− ( x−µ)2 2σ 2
σ 2 π
e
记为x~ 记为 ~N(µ,σ2)
第二节 常用的概率分布
2. 正态曲线的特点
生物统计学课件--2概率的基本知识
A1 A2 An V
则有:
P( A1 A2 An) P( A1) P( A2) P( An) 1
1 如果n个事件出现的概率相等,那么, P ( Ai ) n
称Ai为完全事件系。
复习思考题
①什么概率论?什么叫统计学?两者的关系是什么? ②什么是试验? ③举例说明什么是必然事件、什么是随机事件?请说 明事件之间的关系。
④什么是概率?利用统计概率的定义说明概率的性质。
⑤什么是统计概率?要想了解随机事件的发生规律, 应如何进行研究? ⑥试阐述“小概率实际不可能性”的原理及应用。 ⑦说明随机事件的概率计算法则。
第四章
第一节 随机变量
几种常见的概率分布
一、随机变量 在随机试验中被测量的量,称随机变量。 有时随机试验的结果为数量,有时随机试验的结果 不是数量,要人为地量化。
F ( x0) P( x), 其中,xx0
例:掷骰子试验,X为点数,是离散型随 机变量,其可能值为1、2、3、4、5、6, 若求出现的点数不多于3点的概率,则为 求 P( x 3) F (3)
P( x 1) P( x 2) P( x 3)
p(1) p(2) p(3)
方 差:2 = npq ,
标准差: =
npq
四、例1:
试求掷10次硬币,出现3次正面的概率是多少? 解:掷硬币为随机试验,可能的结果有两种, A:正面向上;B:反面向上。 p = P(A)= 1/n =1/2 = 0.5,
q = 1- p = 0.5
则有:P(x=3)= p(3)
x C n p x
0.40 0.48
2、概率的性质 • 任何事件(A)的概率均满足:0≤P(A)≤1; • 必然事件的概率为1;
生物统计学-概率及概率分布
2003-8-26
Prof.Dr.QF Chen, Lab of Genetics, Guizhou Normal University
统计概率的概念
• 概念:在n充分大时事件A发生的频率作为该 事件概率p的近似值,即P(A) = p ≈ (m/n),这 种通过抽样试验和统计分析得到的概率,就 称为统计概率。 • 例如,绵阳11号小麦种子在播种前相同条件 下进行发芽试验,每1000粒种子中有901粒发 芽,则该品种这批种子的发芽概率(发芽率) 为90.1%。 æ
2003-8-26
Prof.Dr.QF Chen, Lab of Genetics, Guizhou Normal University
统计概率有重要意义,常常是生产上决策的 基本依据
• 大田植物发病率和虫害率是植物保护的重要依据。 通常当危害率达5%以上时,就要进行病虫防治。 • 种子发芽率是确定播种量的基本依据。若小麦基本 苗在5万株时产量最高,测得发芽率为80%,则亩 播种种子数应为5/0.80 = 6.25 万粒,若其千粒重为 40克,则亩播种量为6.25×40/1000 = 2500克。 • 工厂生产上,常常要统计废品率,一般废品率>1% 时就需要加强管理和进行技改,以提高产品的质量。 • 显然,事件的概率是介于0和1之间的数值,即 0≤P(A)≤1。当概率为0时,事件为不可能事件;当概 率为1时,事件为必然事件;当概率为0到1之间时, 事件为随机事件。 æ
2003-8-26 Prof.Dr.QF Chen, Lab of Genetics, Guizhou Normal University
概率(probability)定义:
• 定义:在相似条件下重复进行同一类试验或调查, 事件A发生的频率(m/n)(即事件A发生的次数m与 总试验次数n的比值),随着总试验次数的增加, 越来越稳定地接近于一个定值p,则这个定值p就被 称为事件A发生的概率,记作P(A) = p。 • 显然,要准确计算出概率p,必须使重复试验的次 数n趋向于无穷大,或使样本容量n倾向于总体容量 N,使调查试验覆盖总体中的所有个体。 • 因此,在一般情况下,该概率p是不可能准确获得 的。
第二章概率和概率分布(生物统计学)
第二章概率和概率分布做这样一个试验,取一枚五分硬币,将图案面称为A,文字面称为B。
上抛硬币,观察落下后是A向上还是B向上。
重复10次为一组,记下A向上的次数,共做10组。
再以100次为一组,1 000次为一组,各做10组,分别统计出A的频率,验证的内容。
答:在这里用二项分布随机数模拟一个抽样试验,与同学们所做的抽样试验并不冲突。
以变量Y表示图向上的次数,n表示重复的次数,m表示组数,每次落下后图向上的概率φ=1/2。
SAS程序如下,该程序应运行3次,第一次n=10,第二次n=100,第三次n=1000。
options nodate;data value;n=10;m=10;phi=1/2;do i=1 to m;retain seed 3053177;do j=1 to n;y=ranbin(seed,n,phi);output;end;end;data disv;set value;by i;if first.i then sumy=0;sumy+y;meany=sumy/n;py=meany/n;if last.i then output;keep n m phi meany py;run;proc print;title 'binomial distribution: n=10 m=10';run;proc means mean;var meany py;title 'binomial distribution: n=10 m=10';run;以下的三个表是程序运行的结果。
表的第一局部为每一个组之Y的平均结果,包括平均的频数和平均的频率,共10组。
表的第二局部为10组数据的平均数。
从结果中可以看出,随着样本含量的加大,样本的频率围绕0.5做平均幅度越来越小的波动,最后稳定于0.5。
binomial distribution: n=10 m=10OBS N M PHI MEANY PYbinomial distribution: n=10 m=10Variable Mean--------------------------------------------binomial distribution: n=100 m=10OBS N M PHI MEANY PYbinomial distribution: n=100 m=10Variable Mean--------------------------------------------binomial distribution: n=1000 m=10OBS N M PHI MEANY PYbinomial distribution: n=1000 m=10Variable Mean--------------------------------------------每个人的一对第1号染色体分别来自祖母和外祖母的概率是多少?一位男性的X染色体来自外祖父的概率是多少?来自祖父的概率呢?答:〔1〕设A 为一对第1号染色体分别来自祖母和外祖母的事件,如此()41211211=⨯⨯⨯=A P 〔2〕设B 为男性的X 染色体来自外祖父的事件,如此()21211=⨯=B P〔3〕设C 为男性的X 染色体来自祖父的事件,如此()0=C P假设父母的基因型分别为I Ai 和I Bi 。
生物信息学常用概率统计方法精讲
其中0< p <1, 则称X服从参数为 n, p 的二项分布(也称 Bernoulli 分布),记为X~B( n, p)
泊松分布(Poisson distribution)
若随机变量 X 的分布律为:
P( X k) k e , k 0,1,2...
P 1/3 1/2
1/6
求 P(0<X≤2) 解 P(0<X≤2)=P(X=1)+P(X=2)
=1/2+1/6=2/3
几种常见的离散型分布
二项分布(Binomial distribution) △定义:在n重贝努利试验中,若以X表示事件A发生的
次数, 则X可能的取值为0,1,2,3,…,n
若随机变量X的分布律满足:
若u=-1.96,那么Ф(-1.96)则表示从-∞移到-1.96所对
应区域的面积,通过查标准正态分布曲线面积分布表 得到Ф(-1.96)=0.025
双尾概率u
单尾概率u/2
① X 轴与正态曲线所夹面积恒等于 1 或 100%;
② 区间 的面积为 68.27%;
③ 区间 1.96 的面积为 95.00%; ④ 区间 2.58 的面积为 99.00%。
随机现象:在同样条件下可能会出现两种或多种 结果,究竟会发生哪种结果,事先不能确定。其 表现结果称为随机事件。 随机事件的特征:①随 机性;②规律性:每次发生的可能性的大小是确 定的。
概率(probability):随机事件发生的可能性大小,
用大写的P 表示;取值[0,1]。
频率 frequency
1(男)、x2 =1(男)、x3 =0(女) 、…
(卫生统计学)第四章 常用概率分布
P (X 3 ) C 5 33 1 5 3
二项分布图 (1)
P(x) 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05
0 012345
n=3,π=0.5
0.3 P(x) 0.25 0.2 0.15 0.1 0.05
p P ( X 2) 5 ( 2 0 5 3 0) 0 2 0 0 0 ( 2 ) 0 0 . 0 2 2 . 2 % 2 8 8 350
例4-11 -2
某地1986年120名8岁男孩身高均数 x12.302cm, S=4.79
(1)试估计身高在130cm以上的百分比; (2)身高在120cm~128cm的百分比; (3)该地80%的男孩身高集中在哪个范围? 解:
总体均数x 30.61.( 8 人) 总体标准差 x 30.60.4 0.8( 5 人) 总体方差x2 0.7225
样本率的误差估计—频率的标准误
用样本率p估计总体率π存在抽样误差,样本率p的总体均数和标准差为:
p
1nx
1(n)
n
p
x
n
(1)
n
当n 较大时,对随机抽取的一个样本而言,95%的可能样本与总体率间的误
0 012345
n=6,π=0.3
0.25 P(x)
0.2
0.15
0.1
0.05
0 0 1 2 3 4 5 6 7 8 9 10 11 12
n=20,π=0.3
二项分布的均数与方差
若X~B(x, n, π),则
X的均数 x n X的方差 x2 n(1) X的标准差x n(1)
生物统计学 几种常见的概率分布律共60页文档
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。
25、学习是劳动,是充满思想的劳动。——乌申斯基
谢谢!
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
生物统计学 第3章 几种常见的概率分布律
n
Cnk p k q nk (q p)n 1
k 0
3. P( x m) Pn (k m)
m
Cnk p k q nk
(3-2)
4. P( x m) Pn (k m)
nk 0
Cnk p k q nk
(3-3)
k m
5. m2
P(m1 x m2 ) pn (m1 k m2 )
• 平均数:
nK
N
• 方差:
2 nK(N K )( N n)
N 2 (N 1)
2. 负二项分布
• 负二项分布所要求的条件与二项分布是一样 的。不同的是负二项分布需要求出在第x次试 验时,发生第k次事件A的概率。或者说,在x 次试验中,共发生k次事件A,而且事件A的第 k次试验恰恰是在第x次试验发生的。
x 中细菌数服从波松分布。以=0.500代替 (3-10)
式中的λ,得
P( x k ) 0.5k e0.5 (k=0, 1, 2, …) k!
计算结果如表3-3所示。
表3-3 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是 相当吻合的 , 进一步说明用波松分布描述单位 容积(或面积)中细菌数的分布是适宜的。
P(x
7)
C170 0.7570.253
10! 0.757 7!3!
0.253
0.2503
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗?
二项分布的应用条件有三:
(1)各观察单位只具有互相对立的一种结果,如阳 性或阴性,生存或死亡等,属于二项分类资料;
概率论与数理统计常用数值表
附录: 常用数理统计表表1 标准正态分布函数⎰∞--=Φxu du ex 2221)(π数值表附录:常用数理统计表 354表2 对应于概率αχχ=>)(22P 及自由度k 的2αχ的数值表表4 F—分布表355表3 对应于概率α及自由度的的数值表表4 对应于概率αα=≥)(F FP 及自由度),(21k k 的αF 的数值表表4 F—分布表359附录:常用数理统计表360表4 F—分布表361附录:常用数理统计表362 表5 多重比较中的q值表多重比较中1%的q表(两尾))2(3L)2(7L)2(7L 二列间的交互作用)2(7L 表头设计) L2(11)2(15L3(13))3(1327L 二列间的交互作用列 号 列 号123 4 5 6 7 8 910 11 12 13 1 1 ⎪⎩⎪⎨⎧43)1( 242 3 6 7 5 7 56 910 810 89 1213 11 13 11 12 2 2 ⎪⎩⎪⎨⎧41)2( 1 38 11 9 12 10 13 5 11 6 12 7 13 5 8 6 9 7 10 3 3 ⎪⎩⎪⎨⎧21)3( 9 1310 118 12 7 12 5 13 6 11 6 10 7 8 5 9 4 4 ⎪⎩⎪⎨⎧1210)4( 8 139 116 137 11 5 12 7 9 5 10 68 5 5 ⎪⎩⎪⎨⎧71)5( 1 62 113 134 12 2 8 4 10 3 9 6 6 ⎪⎩⎪⎨⎧51)6( 4 132 123 11 3 10 2 94 8 7 7 ⎪⎩⎪⎨⎧123)7( 4 112 134 93 8 2 10 8 8 ⎪⎩⎪⎨⎧101)8( 1 9 253 74 6 9 9 ⎪⎩⎪⎨⎧81)9( 4 7 26 3 5 10 104 52 7 11 111 212 12)3(1327L 表头设计因子数 列 号123 4 5 6 7 8 9 10 11 12 133 A B 1AB 2AB C 1AC 2AC 1BC2BC 4AB1AB 2AB C 1AC 2AC 1BC D 1AD 2BC 1BD 2CD1CD2BD 2AD5 AB1AB 2AB C1AC 2AC 1BC DE2BC1CD2BD 2AD6AB1AB 2AB C1AC 2AC 1BCDE2BC F1CD2BD)L4(5L)5(25 5 5 4 3 2 1表8 二次回归设计表二因子二次回归正交组合设计表试验号Z0 Z1 Z2 Z1Z2Z1' Z2'1 1 -1 —1 1 0。
概率统计分布表(常用)
标准正态表标准文案标准文案标准文案标准文案标准文案标准文案标准文案T分布标准文案标准文案标准文案标准文案标准文案标准文案标准文案F分布P= 0.90标准文案标准文案P= 0.99标准文案标准文案标准文案标准文案标准文案标准文案标准文案Excel公式1.正态分布函数Excel计算正态分布时,使用NORMDIST函数,其格式如下:NORMDIST(a,μ,σ,累积)其中,“累积”:若为TRUE,则输出分布函数值,即P{X≤a};若为FALSE,则为概率密度函数值.示例:已知X服从正态分布,μ=600,σ=100,求P{X≤500}.输入公式NORMDIST(500, 600, 100, TRUE)得到的结果为0.158655,即P{X≤500}=0.158655.2、正态分布函数的反函数标准文案Excel计算正态分布函数的反函数使用NORMINV函数,格式如下:NORMINV(p,μ ,σ ),此公式计算a,使P{X ≤a}=p 3标准正态分布反函数=NORMSINV(0.975)3、t分布Excel计算t分布的值,采用TDIST函数,格式如下:TDIST(a,自由度,侧数)其中,“侧数”:指明分布为单侧或双侧:若为1,为单侧;此命令输出P{ T >a }若为2,为双侧.此命令输出P{ |T| >a}示例:设T服从自由度为24的t分布,求P(T>1.711).已知t=1.711,df=24,采用单侧,则T分布的值:TDIST(1.711,24,1)得到0.05,即P(T > 1.711)=0.05.4. t分布的反函数标准文案Excel使用TINV函数得到t分布的反函数,格式如下:TINV(α,自由度)输出T 分布的α / 2 分位点:t_α/2_(n)若求临界值tα(n),则使用公式=TINV(2*α, n)函数FDIST 的计算公式为FDIST=P( F>x ),5.F分布的反函数FINV(probability,deg_freedom1,deg_freedom2) 已知probability=P( F>x ),求x标准文案。