(完整版)概率的定义及其确定方法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(完整版)概率的定义及其确定方法
§1.2 概率的定义及其确定方法
在本节,我们要给出概率的定义,这是概率论中最基本的概念。

本节中我们还将介绍几种确定概率的方法。

随机事件的发生有偶然性,但我们常常会觉察到随机事件发生的可能性是有大小之分的。

例如,购买彩票后可能中大奖,可能不中奖,但中大奖的可能性远比不中奖的可能性小。

既然各种事件发生的可能性有大有小,自然使人们想到用一个数字表示事件发生的可能性大小。

这个数字就称为事件的概率。

然而,对于给定的事件A ,该用哪个数字作为它的概率呢?这决定于所研究的随机现象或随机试验以及事件A 的特殊性,不能一概而论。

在概率论的发展历史上,人们针对特定的随机试验提出过不同的概率的定义和确定概率的方法:古典定义、几何定义和频率定义。

这些概率的定义和确定方法虽然有其合理性,但也只适合于特定的随机现象,有很大的局限性。

那么如何给出适合于一切随机现象的概率的最一般的定义呢? 1900年数学家希尔伯特提出要建立概率的公理化定义以解决这个问题,即以最少的几条本质特性出发去刻画概率的概念.1933年数学家柯尔莫哥洛夫首次提出了概率的公理化定义,这一公理化体系迅速得到举世公认,有了这个定义后,概率论才被正式承认为一个数学分支,并得到迅猛发展.
1. 概率的公理化定义
定义1.2.1 设Ω为样本空间,F 为Ω的某些子集组成的事件域.))((F
A A P ∈是定义在事件域F 上的实值集函数,如果它满足:
(1) 非负性公理对于任一F A ∈,有0)(≥A P ;
(2) 正则性公理1)(=ΩP ;
(3) 可列可加性公理若,,21A A …,,n A …两两互不相容,则
则称)(A P 为事件A 的概率,称三元总体),,(P F Ω为概率空间.
概率的公理化定义刻画了概率的本质,概率是集合(事件)的实值函数,若在
事件域上给出一个函数,只要这个函数满足上述三条公理就称为概率。

这个定义只涉及样本空间和事件域及概率的最本质的性质而与具体的随机现象无关。

对于具体的随机现象中的给定的事件,其概率如何合理地确定那要依据具
体情况而定。

历史上出现的概率的频率定义、古典定义和几何定义都是特定的场合下有着各自的确定概率的方法。

在有了概率的公理化定义之后,把它们看作确定概率的方法是恰当的。

下面介绍这些确定概率的方法。

2. 频率方法
设E 为一随机试验,A 为其中一事件,在相同条件下将E 独立重复做n 次,记
)(A n 为事件A 发生的次数(也叫频数)
,比值称为事件A 在这n 次试验中的频率。

容易验证频率满足概率的公理化定义中的三条公理。

一般地,如事件A 发生的可能性愈大,那么在多次重复试验中, 事件A 发生愈频繁即频率)(A f n 也愈大.反之,频率)(A f n 愈大表明事件A 发生的可能性愈大.因此事件频率的大小与事件发生的可能性大小有密切的联系.但是还不能把事件的频率就确定为概率,因为频率有“波动性”.长期实践表明,随着试验次数n 的增加,频率)(A f n 会稳定于某一个常数p ,这个频率的稳定值是由事件本身决定的并且这样的稳定值满足概率的公理化定义中的三条公理,因能把这个稳定值确定为事件的概率是合理的.
这种确定概率的方法虽然有其合理性,但其缺点是明显的:在现实世界里,人们无法把一个试验无限次地重复下去,因此我们无法精确地得到频率的稳定值.尽管有明显的缺点,但这种方法有其重大意义:一方面,频率具有稳定性这一客观事实给概率提供经验背景.同时频率方法给我们提供了一个可以想象的具体值,并且在试验次数较大时,可用频率给出概率的近似值.例如,工业生产中,依据抽检的一些产品估计产品的废品率.另一方面,它提供了检验理论正确与否的准则.设想依据某一理论或假定
算出了某事件A 的概率为p ,这一理论或假定是否与实际相符,我们并无把握,于是我们可诉诸试验,即进行大量重复试验以观察事件A 的频率)(A f n .若频率)(A f n 与p 接近,则可认为试验结果支持了有关理论或假定.若频率)(A f n 与p 相差较大,则认为理论可能有误.例如,在抛硬币的试验中,假定正反面出现的可能性相等,则出现正面的概率与出现反面的概率都是0.5, 如果我们多次抛掷硬币,若正面出现的频率与0.5相差甚远,那么正反面出现的可能性相等这个假定的正确性值得怀疑.
下面是频率稳定性的几个实例.
3. 古典方法
确定概率的古典方法是概率论历史上最早研究的情形,它简单、直观、不需做大量重复试验。

先看一个简单试验:掷一个六面均匀的骰子,这个试验有6个基本结果,如果六个面是平等看待,那么可以认为每个面朝上的可能性相同,即每个点数出现的概率相等,这样的试验称为古典概型。

在古典概型中,事件的概率应该与事件包含的样本点个数成正比,事件的概率也就能容易地确定。

如果试验E 具有下列性质
(1)试验的基本结果只有有限个,即试验的样本空间Ω为有限样本空间;
(2)一切基本事科发生的可能性相等。

则称试验E 为古典概型。

设试验E 为古典概型,样本空间Ω包含有n 个样本点,A 为试验E 的一事件,且事件A 包含k 个样本点,则事件A 的概率为
古典方法是概率论发展初期确定概率的常用方法,在古典方法中,为求一个事件A 的概率,需求出试验的等可能的基本结果总数和事件A 包含的基本结果数。

例将一硬币抛3次,假设每次抛掷中出现正面和反面的可能性相等,求恰好出现1次正面的概率。

解:由于每次抛掷中出现正面和反面的可能性相等,因此该试验的等可能的基本结果有8个。

即样本空间取为
且各个基本结果具有等可能性,而事件=A “恰好出现1次正面”包含1个样本点“HHH ”,即{HHH}A =,所以所求的概率为注意,此试验中若我们考虑的样本空间为}3,2,1,0{=Ω,那么=A “恰好出现1次正面”为Ω的子事}1{,但并不能由此得出A 的概率为4 1,因为样本空间为}3,2,1,0{=Ω的各个基本事件不具有等可能性.因此用古典方法确定概率时一定要注意“基本事件的等可能性”.
当样本空间中样本点较多时,我们不必将样本点一一列举出来,而只需求出样本点总数n 和事件A 包含的样本点个数k ,但要注意“等可能性”.下面介绍古典概型
中几件常见的模型.
一、抽样模型(也叫取球模型)
抽样有两种方式:不放回抽样与放回抽样
1. 不放回抽样:一个总体由两类元素(用A,B 表示)组成,共有N 元素,其中有M 个A 类元素,M N -个B 类元素,从中任取n 个元素,我们常关注取出元素A 类成B 类元素的个数.求事件=m A “取出的n 个元素中有m 个A 类元素”的概率.
解:样本空间中样本点的总数为n N C ,事件m A 包含的样本点个数为m n M N m M C C --.由于
是随机抽取的,所以这n N C 个基本事件是等可能,故所求的概率是若引入随机变量X :取出的A 类元素的个数,则可得X 的概率分布(或分布列。

随机变量的概率分布就是全面地、动态地描述随机变量取各个可能值的概率规律)为
)(m X P =n N
m n M N m N C C C --=,),min(),0max(M n m N M n ≤≤-+ 为方便,我们约定:,0=k m
C 0,那么上述概率分布可写为 )(m X P =n N
m n M N m M C C C --=,n m ,,1,0Λ= 以上的概率分布称为超几何分布(后面章节会继续讨论这种分布),这种分布在抽样调查中是很重要的.比如N 件产品中有M 件不合格品, M N -件合格品,从中抽检n 件产品.在实际问题中,N 的值已知,而M 的值未知,要根据抽查的n 件产品
中的次品件数去推断M 的值,这属于统计问题.也有M 的值已知,而N 的值未知的情况,例如,从某一湖里,捕捉M 尾鱼,将这些鱼作上某种标记,然后放回湖中,过一段时间后,再从湖中捕捉出n 尾鱼,发现其中有m 尾有标记,对该湖中鱼的总数N 能作出什么结论?这个问题在学习数理统计时再来讨论.
注: 1.对以上模型作稍微的改变:一个袋有7个球,其中5个红球,2个白球.从中依次取3次球,每次取一个,取后不放回.试求下列事件的概率,
(1) =A “前2次取到红球,最后1次取到白球”;
(2) =B “取到2个红球,1个白球”;
(3) =C “第2次取到红球”.
解: (1)214567245)(==
A P 错解: 37245)(C A P ??=
(2) 7
45673245)(==B P 或 74)(37
1225==C C C B P 在此问题中,两种做法都可得出正确答案,为什么? (3) 7
5567152452245345)(=+??+??+??=
C P 或75675245)(=??+?=C P 可以看出,第2次取到红球的概率与第1次取到红球的概率相等,同样地可算出第3次取到红球的的概率也是
7
5.这就是“抽签与顺序无关”的原理,从概率论上解释了“抓阄的公平性”.
2. 以上模型可推广至N 个元素由多类元素组成的情形,比如,一批产品共N 件,其中有1M 件一等品, 2M 件二等品, 3M 件三等品(N M M M =++321),从中任取n 件产品,则取到1m 件一等品, 2m 件二等品, 3m 件三等品(n m m m =++321)的概率为
教材的例
若引入随机变量Y X ,:Y X ,分别表示取出的一等品和二等品件数,则),(Y X 的概率分布属于多项超几何分布.
2. 放回抽样: 一个总体由两类元素(用A,B 表示)组成,共有N 元素,其中有M 个A 类元素,M N -个B 类元素,从中依次取n 次,每次取1个元素,取后放回.求事件=m A “取出的n 个元素中有m 个A 类元素”的概率.
解:样本空间中样本点的总数为n N ,事件m A 包含的样本点个数为m n m m n M N M C --)(.由于是随机抽取的,所以这n N C 个基本事件是等可能,故所求
的概率是
将上面结果变形为
m n m m n m p p C A P --=)1()(, 其中N
M p =,这是什么模型的概率问题(这是你们中学学过的)? 若引入随机变量X :X 表示取出的A 类元素的个数,则可得X 的概率分布为 )(m X P =m n m m n p p C --=)1(,n m ,,Λ1,0=,N M p =
以上的概率分布称为二项分布(后面章节会继续讨论这种分布).二项分布的一种推广就是多项分布.
二、盒子模型(也叫放球模型)
设有n 个球,每个球都等可能地放到N 个盒子中的任一个,盒子的容量不限.
(1) 设N n ≤,求球放入不同盒子中的概率;
(2) 求某指定的盒子为空盒的概率的概率;
(3) 求某指定的盒子有k 个球的概率的概率
解: (1)设A 表示事件“球放入不同盒子中”,则
(2) 设B 表示事件“某指定的盒子为空盒”,则
(3) 设C 表示事件“某指定的盒子有k 个球”,则
以上结果可变形为
由变形后的结果会想到什么概率模型?
在盒子模型中,我们还会关注于各个盒子的球的数目或球的分布状况.我们看下面问题:
将6个球随机地放入5个盒子中,5个盒子分别编号1,2,3,4,5.则1号,2号,3号,4号,5号盒子中分别有2个球,2球,1个球,1个球,和0个球
的球的概率为思考:6个球的分布状况是2,2,1,1,0(即有2个盒子各放2个球,3个盒子各放1个球,1个盒子没球)的概率是多少?
教材的例
三、补充问题:重复组合问题及其应用
从n 个不同元素中每次取一个,放回后取下一个,如此连续取r 次所得的组合称为重复组合(不考虑次序).那么重复组合数是多少呢?
易见,这个问题等价于将r 个不可分辨的球放入n 个盒子(盒子是可分辨的)中,可区分的放球结果有多少种?
为求解此问题,我们先求每个盒子至少有1个球的不同放法的总数(此时要求)n r ≥.设想将r 个球排成一行,相邻两球之间各有一个空格,共有1-r 个空格,在这1-r 个空格中任取1-n 个空格上插入“|”,每种插法一一对应于每个盒子都有球的一种放法,于是可得每个盒子都有球的放法共有11--n r C 。

再考虑原方问题的求解,设想先在每个盒子中各放1球,这样将r 个不可分辨的球放入n 个盒子中的不同放法总数等于将n r +个不可分辨的球放入n 个盒子时每个盒子至少有1个球的不同放法的总数,由此可知将r 个不可分辨的球放入
n 个盒子中,可区分的放球结果有11--+n r n C (或r r n C 1-+)种。

以上问题也等价于方程
共有多少个正整数解及多少个非负整数解的问题。

等价的问题有很多,请思考下面问题。

思考:(1)同时掷n 个相同的骰子,可区分的结果共有多少种?
(2)n z y x )(++的展开式中共有多少项?
(3)n 元函数),,,(21n x x x f u Λ=的k 阶偏导共有多少个(假定偏导存在且连续)?
例一个通信系统含有n 个天线,顺序地排成一行,只要没有两个连续的天线都失效,这个系统就可以接收到信息,现已探明这n 个天线里,恰有m 个天线失效,问此系统仍然有效的概率有多大?
分析:m 个失效天线在n 个天线中的排列位置共有m n C 种,从
而有m n C 个等可能的基本事件。

系统有效当且仅当相邻的两个失效天线之间都有有效天线,设想先把m 个失效天线排成一行,然后把m n -个有效天线安排在相邻的两个失效天线之间以及头、尾两端(头尾两端可以没有)。

记1x ,1+m x 分别表示头、尾两端的有效天线数,i x 表示第1-i 个失效天线与第i 个失效天线之间的有效天线数(m i ,,3,2Λ=)。

这样问题化为求方程
满足),,2(1,0,011m i x x x i m Λ=≥≥≥+的整数解的个数。

令i i m m x y x y x y =+=+=++,1,11111,上面问题等价于方程正整数解的个数问题。

由前面的讨论知,该问题的答案是m m n C 1+-,
故所求结果为
下面讨论一下游程问题,游程理论可以有很多方式应用于统计中,主要用于随机性检验和齐次检验(将在第七章讨论)
在由两类元素构成的有序序列中,由同一类元素组成的(没有异类元素隔开)最大的子序列称为一个游程(或一个连贯)。

例如,6个α和4个β排成序列
αααβααβββα
,那么该序列有3个α游程,2个β游程,总游程数为5。

设1n 个α元素和2n 个β元素排成一序列,总游程数记为R ,若总游程数过小则说明同类元素有聚集现象,若过大则说明有混杂现象。

为了从统计上要侦别是否有某种系统因素造成以上现象,为此需计算在这n (21n n n +=)个元素随机排成一列的假定条件下,游程数R 取各个可能值的概率。

即计算)(m R P =。

首先可以看出这n 个元素(同类元素不加区分)排成一列时,有1n n C (或2n n C )
个可以区分的排列结果,在这n 个元素随机排列的条件下,这1n n C 个结果是等概
的。

下面考虑事件)(m R =包含的基本结果数。

若k m 2=(即m 为偶数),则α游程
数和β游程数均为k ,α游程数为k 的排列结果数为11
1--k n C (它等于方程121n x x x k =+++Λ的正整数解的个数)。

同样地,β游程数为k 的排列结果数为11
2--k n C ,前面的游程可以是α游程也可以是β游程。

所以事件“总游程为k 2”包含了11
11212----k n k n C C 个基本结果。

故同样地可得 1212111
1111)12(n n k n k n k n k n C C C C C k R P ------+=+=。

注意以上计算结果中我们都约定:0
,0<
=k
C k
m 或m
k>。

4.几何方法
古典概率适合的随机试验有两个特点:(1)试验只有有限个基本结果,即样本空间为有限样本空间,(2)一切基本事件地位均等,即基本事件具有等可能性。

而在实际中,经常会遇到这样一类随机现象:基本结果有无穷个且一切基本事件的地位均等。

例如,从1,2,3,4,5,6中任取一个数,考虑取到的数不小于4的概率,这是古典概率的问题,如把该问题改为;从区间]6,1[中任取一个数,考虑取到的数不小于4的概率,这个试验的样本空间为区间]6,1[,其基本事件有无穷个,且一切基本事件的地位均等,即基本事件具有“等可能性”。

容易想到这个试验中事件的概率与事件(即样本空间]6,1[的子集)的长度成正比。

这便是几何概率。

如果试验E的基本结果有无穷个且其样本空间Ω为度量有限的区间或区域(这里所说的度量是指区间的长度,区域的面积、体积),样本点在样本空间中均匀分布(样本点在样本空间中均匀分布的详细内容是:样本点落在Ω中任一有度量的子集中的可能性大小只与子集的度量成正比),这样的试验称为几何概型。

设试验E为几何概型,样本空间为Ω,A为一事件(即A为Ω一
子集),则事件A 的概率为
其中)
(A
L表示A的度量(长度,面积或体积)。

例(1)从区间]6,1[中任取一个数,求取到的数不小于4的概率;
(2)从区间]6,1[中任取两个数,求取到的两数之和不小于8的概率.
例(会面问题)
例(蒲丰投针问题)
例(贝特朗悖论)
5.确定概率的主观方法。

相关文档
最新文档