生物统计2章 概率和概率分布.

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.2.1离散型随机变量的概率分布
将随机变量X所取得值x的概率P(X=x) 写成x的函数p(x),称为随机变量X的概 率函数公式为p(x)=P(X=x)。
• 概率函数应满足:
p(x)0
p(x)=1
2019/5/22
2.2.1 离散型随机变量的概率分布(续)
• 将X的一切可能值x1,x2,x3……,xn,……, 以及取得这些值的概率P(x1), P(x2), …..
– 曲线下面积为等于1;
– 累积分布函数 (u)的值可查表; – 累积分布函数 (u)曲线从-∞到0平稳上升,围
绕点(0,0.5)对称;
2019/5/22
重要特征值:
• u=-1 到 u=1 面积为0.6827 • u=-2 到 u=2 面积为0.9543 • u=-3 到 u=3 面积为0.9973 • u=-1.960 到 u=1.960 面积为
• 频率分布可出现各种类型:两侧对称,不对称, 但对于不同的频率分布均有相应理论分布,即 随机变量变化规律的理想化数学模型。虽然很 难与实际情况完全一致,但近似得非常好,因 此可以用建立在概率分布基础上的统计规律来 解决实际问题。如果我们从总体中取出了一个 很大的样本,可把这个样本的分布近似作为总 体的分布。
2.4.1 二项分布
• 二项分布在生物学中应用很广,其特征如下: – 每次试验只有两个对立结果(A和Ā); – N次试验是重复,独立的。
• 回放式抽样适合于二项分布;非回放式抽样适 合于超几何分布。
p(x) cnx x (1 )nx 二项分布概率函数
2019/5/22
2.4.1 二项分布(续)
e 2 2 , x , 0
2
累积分布函数:
x
F(x) p(X x) f (z)dz
1
e dz x

(
z) 2 2
2

2
2019/5/22
正态曲线特点
• 正态分布规律是数据分布两头少,中间多,两 侧对称。
• 密度曲线以X=μ直线为对称;

• 对于任意两点a和b(a < b),下式成立: P(X≤a) + P(a<X≤b) = P(X≤b) 或P(a<X≤b) = F(b) -F(a)
2019/5/22
2.2.3概率分布与频率分布的关系
• 通过样本数据得到的频率分布称为统计分布或 经验分布,描述总体的概率分布称为理论分布 或总体分布。
lim f (x)
P(x X x x)
x0
x
• 概率密度的图形y=f(x)称为分布曲线。
2019/5/22
2.2.2连续型随机变量的概率分布(续)
• 分布函数(或称为累积分布函数)是随机 变量X取得小于X0的值的概率
F (x0 ) P( X
xo )
x0 f (x)dx
2019/5/22
2.1.1 概率的统计定义
– 概率的统计定义是在大量的试验中,以频率的稳 定性为基础上提出来的。设k次随机试验,成功事 件A 出现l次,则称l/k是K次随机试验中成功的频 率。频率是由样本数据计算得到的。由于样本分 布的不恒定性,不同的随机试验,事件A的出现频 率也不同,随着K改变,频率也有一定的波动。
2019/5/22
2.2 概率分布
随机变量 • 随机变量就是在随机试验中被测定的量,
所取得的值称为观察值。可分为离散型随 机变量和连续型随机变量。 • 离散型随机变量:可能取得的数值为有限 个或可数无穷个孤立的数值。 • 连续型随机变量:可取某一(有限或无限) 区间内的任何数值。
2019/5/22
• 在研究连续型随机变量时,实际观察值只 能是落在一定的区间内,其概率可以不为0, 当然这种区间可以很小。
2019/5/22
2.2.2连续型随机变量的概率分布(续)
• 随机变量X的值落在区间(x,x+△x)内的 概率为P(x<X<x+△x),其中△x为区间长度。 当△x趋于零时,此时区间概率称为密度函 数:
服从二项分布的随机变量的特征数
平均数 n, (用比率表示时)
方差 2 n(1), 2 (1)(用比率表示时)
n
偏斜度
1
1 2 n(1 )
峭度
2

1
n(1 )
6

2019/5/22
2.4.1 二项分布(续)
• 二项分布决定于两个参考数:试验次数 和概率,因此其图形变化趋势与这两个 参数有关
F(x0 ) p(xi ) P(X x0 ) xi x0
指随机变量等于或小于某一可能值(x0)的 概率。
2019/5/22
2.2.2 连续型随机变量的概率分布
• 对于离散型随机变量的任何值,都可以求 出它的概率。而连续型随机变量则不同, 因为试验中可以取某一区间内的任何值, 这些数值构成不可数的无穷集合。任何值 的概率都等于0,这并不是说这种事件不会 出现,只是由于技术上的限制,在测量时 不可能无限提高精确度。

k i 1
(
n
fi
)( 1
xi
x)
k
k
[ ( fd)i ]2
s
( fd2)i
i 1
i 1
n
n 1
总体方差和标准差
2 p(x)( x )2 E[( X )2 ]
x
2 E( X 2 ) [E( X )]2
p(x)(x )2 E[(X )2 ]
– 随试验次数的增大图形分布趋于对称;而且 当概率趋于0.5时分布趋于对称
– 偏斜度和峭度是与试验次数和概率有关。当 相同时,随样本含量的增加,γ1和γ2逐渐 接近于0(正态分布);或样本含量相同时, 愈接近于0.5, γ1和γ2愈接近于0。
– 表3-1 P37
• 二项式分布应用实例
2019/5/22
2
, u ;(u) P(U u) 1
2
u
e 2 d
2
2019/5/22
标准正态分布有以下特性
– 在u=0时,(u)达到最大值,概率密度值最大; – 当u 远离0时,e 的指数变得愈大,因此(u)的
值愈小;
– 曲线两侧对称,即(u) = (-u) ; – 曲线在u=1 和 u=-1 处有两个拐点;
,p(xn),…..排列起来,构成了离散型随机 变量的概率分布。常用概率分布表或概率分布 图表示。
离散型随机变量的概率分布表
x1
x2

xn

p(x1)
p(x2)

p(xn)

2019/5/22
离散型随机变量的概率分布图
2019/5/22
2.2.1 离散型随机变量的概率分布(续)
离散型变量概率的分布函数:离散型变量概 率的累积。其公式为
第二章 概率和概率分布
2.1 概率的基本概念 2.2 概率分布 2.3 总体特征数 2.4 几种常见的概率分布律
2019/5/22
第二章 概率和概率分布
2.1 概率的基本概念
– 自然现象:确定性现象和非确定性现象 (随机现象)
– 从随机现象中做大量的研究,能从其偶然 性中揭示内在的规律
– 统计学所研究的是非确定性现象,
所谓X或X的函数的数学期望,即它们的理论
平均数。样本平均数:
k
x
( fx)i
i 1
n

k i 1
(
fi n
) xi
随着n的充分增加,平均数稳定于总体平均数
E(x) p(x)x
x
2019/5/22
2.3.1 随机变量的数学期望和方差(续)
频数资料的样本方差和标准差
s 2
f (x)dx
1
u2
e 2 du
1
u2
e 2 du
2
2
f (u)
1
u2
e2
2
2019/5/22
正态分布表的查法(续)
• 例3.10 :已知高粱品种“三尺三”株高服
2019/5/22
正态分布表(附表2)的查法(续) 对于一般正态分布,要先将进行标准化:
u

x


再查标准正态分布表也很容易得到。

令 u x
代入概率 密度函数
f (x)
1
u2
e2
2
f (x)
1
e
(
x)2 2 2
2
因为 所以
x u
dx du
≤1 – 必然事件W的概率为1,即P(W)
=1 – 不可能事件(V)的概率为0,即P
(V)=0
2019/5/22
2.1.2 概率的古典定义
– 概率的统计定义是在大量的试验中,以频 率的稳定性为基础上提出来的。不需要做 试验就可以确定事件出现的概率,称为古 典概率,具有以下特点: • 随机试验的全部可能结果(基本事件数) 是有限的; • 各基本事件间是互不相容且等可能的。 • 缺点:要求各基本事件是等概率且有限 的。
2019/5/22
2.3 总体特征数
• 样本特征数是描述频率分布特征的:统 计量
• 总体特征数是描述概率分布特征的:参 数
• 总体特征数包括随机变量的数学期望 (理论平均数),方差和各阶矩,可以 用类似求样本特征数方法求得。
2019/5/22
2.3.1 随机变量的数学期望和方差
• 总体特征数:描述概率分布特征的数字,包括 数学期望、方差和各阶矩。
• σ 固定时,μ值决定曲线的位置, 当μ增大时曲线向右平移, 当μ减少时曲线向左平移,但曲线形状不 变。2019/5/22
标准正态分布
μ=0,σ=1时的正态分布称为标准正态分布
N(0,1) 。其密度函数和累积分布函数分别为:
(u)
1
u2
e 2 , u ;(u) P(U
2.4.2 正态分布
在生物统计学中,正态分布占有极其重 要的地位。许多生物学现象所产生的数 据,都服从正态分布。 • 正态分布密度函数的图像称为正态曲线 – 正态分布密度函数的图像,称为正态
曲线。
2019/5/22
正 态 曲 线
平均数为μ,标准差为
的正态分布,其密度函数: f (x)
1
( x )2
– 随着K的增大,频率l/k将围绕着某一确定的常数P 做平均幅度愈来愈小的变动,这就是所谓频率的 稳定性,其中P即为事件A的概率。简单的说概率 就是频率的稳定值。在试验次数较多时,可以用 频率作为概率的近似值。
– (P23 表2-1)
2019/5/22
2.1.1 概率的统计定义(续)
概率是事件在试验结果中出现可能性大 小的定量计算,是事件固有的属性,有 以下明显的性质: – 任何事件A的概率均满足:0≤P(A)
x
2019/5/22
2.3.1 随机变量的数学期望和方差(续)
• X或X的函数的数学期 望可用通式表示
E[g( X )] p(x)g(x)
x
随机变量的数学期望就是这个随机变量的所有 可能值,以其相应概率为权的加权平均数。
k
p(x1)x1 p(x2)x2 ... p(xk)xk p(x1) p(x2) ... p(xk)
• X=- 和 X=+ 所确定的点为曲线的两个
“拐点”;
• 曲线向左、向右无限延伸,以x轴为渐近线;x
越趋向于μ, f(x)的取值越大;
1
• X=μ 时,f(x)具有最大值,其值为: 2
2019/5/22
正态曲线特点(续)
• σ的大小,决定曲线的“胖”、“瘦”程 度, σ越小,曲线越“瘦”,数据越集中, σ越大,曲线越“胖”,数据越分散。

i 1 k
p( xi ) xi p( xi )

k i 1
p( xi ) xi
i 1
2019/5/22
2.3.1 随机变量的数学期望和方差(续)
• 连续型随机变量的 数学期望定义为 • 连续型随机变量方差定义为
2019/5/22
2.3.2 数学期望和方差的运算
2019/5/22
2.4 几种常见的概率分布律
0.9500
• u=-2.576 到 u=2.576 面积为
0.9900
– 正态分布的偏斜度和峭度都为0。
2019/5/22源自文库
正态分布表
正态分布表常用的几个关系式
P(0≤u<u1)=Φ(u1)-0.5 P(u≥u1) =Φ(-u1)
P(|u|≥u1)=2Φ(-u1) P(|u|<u1)==1-2Φ(-u1) P(u1≤u<u2)=Φ(u2)-Φ(u1)
正态分布表(附表2)的查法
2019/5/22
正态分布表(附表2)的查法
• 对于标准正态分布,其累积分布函数值可 直接查表(附表2)得到;
• 例 查u=-0.82及u=1.15时的Φ(u)的值。 • u=-0.82时, Φ(u)=0.20611 • u=1.15时, Φ(u)=0.87493 • 在分布曲线上画出Φ(u)所代表的面积。
相关文档
最新文档