第四章常用概率分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章常用概率分布
为了便于读者理解统计分析的基本原理,正确掌握和应用以后各章所介绍的统计分析方
法,本章在介绍概率论中最基本的两个概念一一事件、概率的基础上,重点介绍生物科学
研究中常用的几种随机变量的概率分布一一正态分布、二项分布、波松分布以及样本平均数
的抽样分布和t分布。
第一节事件与概率
一、事件
(一)必然现象与随机现象在自然界与生产实践和科学试验中,人们会观察到各
种各样的现象,把它们归纳起来,大体上分为两大类:一类是可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,必然发生(或必然不发生) 。例如,
在标准大气压下,水加热到100 C必然沸腾;步行条件下必然不可能到达月球等。这类现象
称为必然现象 (inevitable phenomena)或确定性现象 (definite phenomena)。另一类是事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同。例如,掷一枚质地均匀对称的硬币,其结果可能是出现正面,也可能出现反面;孵化6枚种蛋, 可能“孵化出0只雏”,也可能“孵化出1只雏”,…,也可能“孵化出 6只雏”,事前不可能断言其孵化结果。这类在个别试验中其结果呈现偶然性、不确定性现象,称为随机现象
(random phenomena) 或不确定性现象 (indefinite phenomena)。
人们通过长期的观察和实践并深入研究之后,发现随机现象或不确定性现象,有如下特点:在一定的条件实现时,有多种可能的结果发生,事前人们不能预言将出现哪种结果;对一次或少数几次观察或试验而言,其结果呈现偶然性、不确定性;但在相同条件下进行大
量重复试验时,其试验结果却呈现出某种固有的特定的规律性一一频率的稳定性,通常称之
为随机现象的统计规律性。例如,对于一头临产的妊娠母牛产公犊还是产母犊是事前不能确定的,但随着妊娠母牛头数的增加,其产公犊、母犊的比例逐渐接近1:1的性别比例规律。
概率论与数理统计就是研究和揭示随机现象统计规律的一门科学。
(二)随机试验与随机事件
1、随机试验通常我们把根据某一研究目的,在一定条件下对自然现象所进行的观察或试验统称为试验(trial)。而一个试验如果满足下述三个特性,则称其为一个随机试验(random trial ),简称试验:
(1)试验可以在相同条件下多次重复进行;
(2)每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果;
(3)每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果。
如在一定孵化条件下,孵化6枚种蛋,观察其出雏情况;又如观察两头临产妊娠母牛所
产犊牛的性别情况,它们都具有随机试验的三个特征,因此都是随机试验。
2、随机事件随机试验的每一种可能结果,在一定条件下可能发生,也可能不发生,
称为随机事件 (random event),简称事件(event),通常用A、B、C等来表示。
(1)基本事件我们把不能再分的事件称为基本事件
(elementary event),也称为样
本点(sample point)。例如,在编号为1、2、3、…、10的十头猪中随机抽取 1头,有10 种不同的可能结果:“取得一个编号是1”、“取得一个编号是2”、…、“取得一个编号是10”,这10个事件都是不可能再分的事件,它们都是基本事件。由若干个基本事件组合而成的事
件称为复合事件(compound event )。如“取得一个编号是 2的倍数”是一个复合事件,它由“取得一个编号是2”、“是4”、“是6、“是8”、“是10” 5个基本事件组合而成。
(2)必然事件我们把在一定条件下必然会发生的事件称为必然事件(certain event), 用Q表示。例如,在严格按妊娠期母猪饲养管理的要求饲养的条件下,妊娠正常的母猪经
114天左右产仔,就是一个必然事件。
(3)不可能事件我们把在一定
条件下不可能发生的事件称为不可能事件(impossible event),用Q表示。例如,在满足一定孵化条件下,从石头孵化出雏鸡,就是一个不可能事
件。
必然事件与不可能事件实际上是确定性现象,即它们不是随机事件,但是为了方便起见,
我们把它们看作为两个特殊的随机事件。
二、概率
(一)概率的统计定义研究随机试验,仅知道可能发生哪些随机事件是不够的,
还需了解各种随机事件发生的可能性大小,以揭示这些事件的内在的统计规律性,从而指导
实践。这就要求有一个能够刻划事件发生可能性大小的数量指标,这指标应该是事件本身所
固有的,且不随人的主观意志而改变,人们称之为概率(probability )。事件A的概率记为
P (A)。下面我们先介绍概率的统计定义。
在相同条件下进行 n次重复试验,如果随机事件A发生的次数为 m,那么m/n称为随机事件A的频率(frequency);当试验重复数 n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值 p,那么就把p称为随机事件A的概率。这样定义的概率称为统计概率
(statistics probability),或者称后验概率 (posterior probability )。
例如为了确定抛掷一枚硬币发生正面朝上这个事件的概率,历史上有人作过成千上万次
抛掷硬币的试验。在表 4—1中列出了他们的试验记录。
表4— 1抛掷一枚硬币发生正面朝上的试验记录
k.皮尔逊12000 6019 0.5016
k.皮尔逊24000 12012 0.5005 从表4-1可看出,随着实验次数的增多,正面朝上这个事件发生的频率越来越稳定地接近0.5,我们就把0.5作为这个事件的概率。
在一般情况下,随机事件的概率 p是不可能准确得到的。通常以试验次数n充分大时随
机事件A的频率作为该随机事件概率的近似值。