理论分布 PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例如,在编号为1、2、3、…、10 的十个球 中随机抽取1个,有10种不同的可能结果:
“ 取得一个编号是1” 、“ 取得一个编号是 2”、…、“取得一个编号是10”,这10个事件都 是不可能再分的事件,它们都是基本事件。
由若干个基本事件组合而成的事件称为复合 事件 (compound event)。如“取得一个编号 是2的倍数”是一个复合事件,它由“取得一个 编号是2 ”、“是4”、“是6、“是8”、“是10”5 个基本事件组合而成。
在一般情况下,随机事件的概率p是不可能 准确得到的。通常以试验次数n充分大时随机事 件A的频率作为该随机事件概率的近似值。 即 P(A)=p≈a/n (n充分大)
(二)概率的古典定义
对于某些随机事件,用不着进行多次重复试 验来确定其概率,而是根据随机事件本身的特 性直接计算其概率。
有很多随机试验具有以下特征:
=0.97500-0.02500
=0.9500
u x
例:已知菜豆角长度服从正态分布N(9.978,1.4412) 问(1)角长小于6.536㎝;(2)大于12.128㎝;(3)介于8.537㎝ 和9.978㎝之间概率
二项分布必须满足两个基本假定: 1、各事件是相互独立的,即任何一个事件发生 与否,不影响其它事件发生的概率; 2、各个随机事件只能发生非此即彼的对立事件。 形状: (1)、当p=0.5,即p=q时,二项分布为对称分布, (2)、当p>0.5,即q<0.5时,二项分布为偏右, (3)、当p<0.5,即q>0.5时,二项分布为偏左。
概率的统计定义 在相同条件下进行n次 重复试验,如果随机事件A发生的次数为a, 那么a/n称为随机事件A的频率(frequency); 当试验重复数n逐渐增大时,随机事件A的频 率越来越稳定地接近某一数值 p ,那么就把p 称为随机事件A的概率。
这样定义的概率称为统计概率(statistics probability)。
第三节 正态分布
一、正态分布方程及特性
(一)正态分布方程 正态分布是连续型随机变量的理论分布
客观世界确有许多现象的数据是服从正态分布。 其次在适当条件下,它可用做二项分布离散型 或连续型的近似分布,因此常常应用正态分布 代替其他分布来计算概率和进行假设测验。 虽有些总体不作正态分布,但从总体中随机抽 出的样本平均数及其他一些统计数的分布在 n→∞仍然趋近于正态分布
3、正态分布曲线与横轴间的总面积为1
µ±1δ
68.24%
µ±2δ
95.46%
µ±3δ
99.73%
µ±1.96δ
95%
µ±2.58δ
99%
二、正态分布标准化
由上述正态分布的特征可知,正态分布是依赖 于参数μ和σ2(或σ)的一簇分布, 正态曲线之位置及 形态随μ和σ2的不同而不同。这就给研究具体的正 态总体带来困难, 需将一般的N(μ,σ2)转换为 μ=0,σ2=1的正态分布。我们称μ=0,σ2=1的正态分 布为标准正态分布(standard normal distribution)。 从标准正态分布累积函数的数值表中查出(附表 2) 标准化正态分布是µ=0,δ2=1的正态分布由于不同 的正态总体存在不同的µ和δ2,所以N(µ,δ2)不是 一条曲线,而是一个曲线系统这给研究具体正态 总体带来许多困难,需要将一般正态分布标准化,
fN(x) 1 e-12(x-)2
2
(二)正态分布曲线的特征
1、正态分布曲线是中间高、两边低,而且 对称的光滑曲线,曲线最高峰在平均数处, 越是接近平均数的组变量分布的次数越多、 离平均数越远,分布的次数越少。
2、正态分布曲线因总体平均数和标准差的 不同呈现为不同的曲线,所以它不是一条 曲线,而是一个曲线系统,不同的总体都 有它自己的曲线。
(二)随机试验与随机事件
1、随机试验:通常我们把根据某一 研究目的,在一定条件下对自然现象所 进行的观察或试验统称为试验(trial)。 而一个试验如果满足下述三个特性,则 称其为一个随机试验(random trial), 简称试验:
(1)试验可以在相同条件下多次重复进行; (2)每次试验的可能结果不止一个 ,并且 事先知道会有哪些可能的结果;
一类是可预言其结果的,即在保持条件不 变的情况下,重复进行试验,其结果总是确定 的,必然发生(或必然不发生)。这类现象称 为必然现象(inevitable phenomena)或确定性 现象(definite phenomena)。
另一类是事前不可预言其结果的,即在保 持条件不变的情况下,重复进行试验,其结果 未必相同。这类在个别试验中其结果呈现偶然 性、不确定性现象,称为随机现象(random phenomena )或不确定性现象(indefinite phenomena)。
(二)计算概率的基本定理
定理I:P(A)=1-P(A)
对立事件
定理II:P(A+B)=P(A)+P(B) 互斥事件
定理III:P(A·B)=P(A)·P(B) 独立事件
例5.1一批种子发芽的概率为0.95,不发芽的概 率为0.05
例5.2某农场一批杂交水稻种子进行品质分级, 其中一级种子占15%二级种子占30%其余为三级。 计算二级以上种子的概率
即把正态曲线原点0移到µ的位置,这样原 横轴上的x值就会有离均差x-µ,再将离均差以 标准差为单位进行度量,转换为u变数。
例:已知随机变量U服从正态分布N(0, 1)。问随机变量U的值落在-1.96和1.96之间的 概率是多少? 解∵(-1.96﹤U﹤1.96) ∴P(-1.96﹤U﹤1.96)=Φ(1.96)-Φ(-1.96)
小概率事件虽然不是不可能事件,但在一 次试验中出现的可能性很小,不出现的可能性 很 大 ,以 至于实际上可以看成是不可能发生 的。在统计学上,把小概率事件在一次试验中 看成是实际不可能发生的事件称为小概率事件 实际不可能性原理,亦称为小概率原理。小概 率事件实际不可能性原理是统计学上进行假设 检验(显著性检验)的基本依据。
P(A+B)=P(A)+(B)=15%+30%=wk.baidu.com5%
例5.4两次掷硬币于地面, 计算两次都是币值的一面 向上的概率。
P(A·B)=P(A)·P(B)= 1/2×1/2=1/4
三、小概率事件实际不可能性原理
随机事件的概率表示了随机事件在 一次试验中出现的可能性大小。若随 机事件的概率很小,例如小于0.05、 0.01、0.001,称之为小概率事件。
必然事件与不可能事件实际上是确定性现象, 即它们不是随机事件, 但是为了方便起见,我 们把它们看作为两个特殊的随机事件。
二、统 计 概 率
(一)概率的统计定义
研究随机试验,仅知道可能发生哪些随机 事件是不够的,还需了解各种随机事件发生的 可能性大小,以揭示这些事件的内在的统计规 律性,从而指导实践。这就要求有一个能够刻 划事件发生可能性大小的数量指标,这指标应 该是事件本身所固有的,且不随人的主观意志 而改变,人们称之为概率(probability)。事 件A的概率记为P(A)。
P(ф)=0。
三、概率的基本运算
(一)事件间的相互关系
1、和事件:事件A与事件B至少有一个发生
2、积事件:事件A与事件B同时发生
3、互斥事件:事件A与事件B不能同时发生
4、对立事件:事件A与事件B必发生其一,但 不能同时发生
5、独立事件:事件A的发生与否,与事件B的 概率毫无关系;反之事件B的发生与否,与事 件A的概率也毫无关系。
例如:为了确定抛掷一枚硬币发生正面朝上 这个事件的概率 ,历史上有人作过成千上万次 抛掷硬币的试验。在下表中列出了他们的试验 记录。
表 抛掷一枚硬币发生正面朝上的 试验记录
从上表中可看出,随着实验次数的增多, 正面朝上这个事件发生的频率越来越稳定地接 近0.5,我们就把0.5作为这个事件的概率。
f(0)=1/2 f(1)=1/2
若两枚X=0、1、2,如q为反面1/2,p为正 面1/2
(p+q)2二项式展开得:
(p+q)2 f(0)=q2=(½ )2=¼
f(1)=2pq=2(½ )(½ )=½ f(2)=p2=(½ )2=¼ 若掷n枚于地面x=0、1、2、3、……n, (p+q)n二项式展开计算各个随机变量的 概率函数
一、二项分布的概念
试验或调查中有这样一类常见的变数, 其总体中的全部个体可以根据某种性状 的出现与否分为两类
例,一粒种子可能发芽也可能不发芽等
这类变数属于间断性随机变数,其总体 包括非此即彼的两项对立事件,这样的 总体称为二项总体
二、二项分布的概率计算
如将掷一枚硬币于地面出现正面,反面为0, 正面为1,随机变量X取值有0和1两个数,所 以正面数与概率呈函数关系,可以用f(x)来表 示,f(x)称为随机变量X的概率函数
f(x)=Cnxpxqn-x——贝努里公式
Cnm
Anm Amm
n! m!(nm)!
例一批种子发芽率为70%,每穴播种6粒种子计 算每穴出6棵苗、5、4、3、2、1、0棵苗的概率 各为多少?
解:设x表示每穴出苗数 P(x=6)=C660.76 × 0.30=0.117 649 P(x=5)=C650.75 × 0.31=0.302 526 P(x=4)=C640.74 × 0.32=0.324 135 P(x=3)=C630.73 × 0.33=0.185 220 P(x=2)=C620.72 × 0.34=0.059 535 P(x=1)=C610.71 × 0.35=0.010 206 P(x=0)=C600.70 × 0.36=0.000 729
随机现象或不确定性现象,有如下特点:
在一定的条件实现时,有多种可能的结果 发生,事前人们不能预言将出现哪种结果;对 一次或少数几次观察或试验而言,其结果呈现 偶然性、不确定性;
但在相同条件下进行大量重复试验时,其 试验结果却呈现出某种固有的特定的规律性— —频率的稳定性,通常称之为随机现象的统计 规律性。
(3)每次试验总是恰好出现这些可能结果中 的一个,但在一次试验之前却不能肯定这次试 验会出现哪一个结果。
例如:在一定孵化条件下,孵化6枚种蛋, 观察其出雏情况,它们都具有随机试验的三个 特征,因此都是随机试验。
2、随机事件 随机试验的每一种可能结果,在一定条件下 可能发生,也可能不发生,称为随机事件 (random event),简称事件(event),通常用 A、B、C等来表示。 (1)基本事件 我们把不能再分的事件称为基本事件 (elementary event),也称为样本点(sample point)。
1、试验的所有可能结果只有有限个,即样 本空间中的基本事件只有有限个;
2、各个试验的可能结果出现的可能性相等, 即所有基本事件的发生是等可能的;
3、试验的所有可能结果两两互不相容。
(三)概率的性质 1、对于任何事件A,有
0≤P(A)≤1; 2、必然事件的概率为1,即
P(Ω)=1; 3、不可能事件的概率为0,即
第五章 理论分布
为了便于读者理解统计分析的基本原理, 正确掌握和应用以后各章所介绍的统计分析方 法,本章在介绍概率论中最基本的两个概念— —事件、概率的基础上,重点介绍生物科学研 究中常用的几种随机变量的概率分布——正态 分布、二项分布、及样本平均数的抽样分布和 t 分布。
一、事 件 (一)必然现象与随机现象 在自然界与生产实践和科学试验中,人 们会观察到各种各样的现象,把它们归纳起 来,大体上分为两大类:
大家有疑问的,可以询问和交流
可以互相讨论下,但要小声点
9
(2)必然事件 我们把在一定条件下必然会发生的事件称为 必然事件(certain event),用Ω表示。 例如,在标准大气压下,水加热到100℃必 然会沸腾,就是一个必然事件。
(3)不可能事件 我们把在一定条件下不可能发生的事件称为 不可能事件(impossible event),用ф表示。 例如,在标准大气压下,水温度低于100 ℃ 就不可能会沸腾。