第二讲：主观概率

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

为了讨论方便，我们先引入几个记号： l 、 l 和 l。
于事件B发生的似然率”；
A l B 读作 “事件A发生的似然率大
事件B发生的似然率相当”；小于事件B发生的似然率”。
A l B 读作 “事件A发生的似然率与 A l B 读作 “事件A发生的似然率不
假设 2.1 （连通性 (connectivity) 假设，又称可比性(comparability)假设）是指事件A和 B发生的似然率是可以比较的，即 A B 或
p( A) k n
(2.3)
其中， k 为事件 A 中所包含的基本事件数量， n为基本事件的总数。
显然，上述定义的适用条件是： ① 基本事件的数量有限，即试验的样本空间 S {e1 , e2 ,, en } ； ② 每个基本事件都是等可能的，即
p(e1 ) p(e2 ) p(en ) 1 n
2）离散型随机变量先验分布的设定
（ 1 ）对各事件加以比较确定相对似然率。
f n ( A)
示例1 某人考博士生被录取的概率。示例2 某个农民为了确定当年种植作物的适宜品种，需要判断当年的气候状况。
（2）打赌法
设事件E发生时收入 p(0 p 1) ，其中的 1 代表某个适当的数值的钱，例如 1000 元或 100 元，不同的决策人可以取不同的值，这一数值与决策人的财产相比是一个小数目，以保证在此范围内对决策人的实际价值接近于线性；
（3）概率的公理化定义
Kormogorov在1930年的著作中给出的概率的公理化定义。
定义2.1 E是随机试验，S是E的样本空间，对E的每一事件A，对应有确定的实数 p(A),若p(A)满足：
① 非负性：0≤ p(A)≤1;
② 规范性： p(S)=1;
③ 可列可加性：对两两不相容事件 Ak
(两两不相容是指 i j, Ai Aj )，有
p( Ak ) p( Ak )
k k
则称为事件A发生的概率。
以上所述的几种概率的定义中有一个共同的特点，这就是概率是在多次重复试验中，随机事件A发生的可能性的大小的度量。而在实际的决策问题中，自然状态的概率往往无法通过重复试验求得，通常也并不包含等可能的基本事件。
2）连续型随机变量先验分布的设定
（1）直方图法。这种方法适用于自然状态的
取值是实轴
的某个区间的情况。具体步骤是：
① 将区间离散化即把的取值范围划分
为若干个子区间
1 ,2 ,,n
；
② 赋值：设定每个子区间的似然率
(i ), i 1,, n
并根据
(i )作出直方图；
4）主客观概率的比较
（1）基本认为：概率是系统的固有的客观性质，是在相同条件下重复试验时频率的极限。
主观概率论者（以下简记为 S ）认为：概率是观察者而非系统的性质，是观察者对系统处于某状态的信任程度。
（2）抛硬币：正面向上概率为1/2。
a）选定一个似然率最大的子区间 k 作为基准，设基准区间的相对似然率为 Rk 10 （或者取1、100等，视决策人的习惯而定），然后给出其他各区间似然率与基准区间似然率的相对比值 Ri ，即
Ri : Rk (i ) : (k )
b ）由决策者给出每二个子区间似然率的比例关系：
设E不发生即 E 发生时收入为 1 p 。调整p值，使决策人感到两者无差异为止，则
( E ) 1 p
为了帮助决策人量化随机事件的主观概率，可以借助于概率盘，其形状如下图。
主观概率待定的抽概率盘正面奖
概率盘正面分为红、兰两个扇形区，扇形区的面积可任意调整；反面有刻度指示红色扇形区占整个圆盘面积的百分比。使用时调整红色扇形区域的大小，直到决策人认为它与右图抽奖中后果 E 发生的概率相等为止，这时概率盘反面的刻度值就是决策人心目中后果E发生的概率。
例如，在出门是否带伞的决策问题中可能会遇到明天是否下雨，项目申请问题中的中标可能性，以及在实际决策中经常遇到的明年国民经济增长率的分布、战争中对敌方下一步行动的估计等等这样广义的自然状态，这些状态或事件显然是无法重复试验的，其中也没有所谓的基本事件。
有些问题虽然不是完全不能重复试验，但由于种种原因，实际上不能施行。例如洲际导弹的命中率，虽然在原则上可以通过相同条件下的重复试验获得，但是每次试验费用过于昂贵、代价过大，实际上不可能多次重复试验。
ri j (i ) ( j ) i, j 1, 2,, n
③ 规范化
对赋值法a) ：
③ 可列可加性，若 Ai , Aj为两两不相容事件，则
p(i 1 Ai ) i 1 p( Ai )

则 p ( A) 称为事件A的（主观或客观）概率测度，简称概率。
上述定义中， ω 为基本事件， A 为事件，三元总体（Ω，F，P）则称为概率空间。
需要注意的是，定义 2.2 既适用于客观概率，也完全可用于主观概率，即两者有着完全相同的数学定义。因此，由客观概率论者发展起来的概率论的整套推理和计算方法，也都完全适用于主观概率。
f n ( A)
要求一群学生估计针尖朝上的概率，虽然这些学生事先都没有抛过图钉，但是大部分学生都认为针尖朝上的概率大于二分之一，众数在 0.55~0.7 之间。许多人是凭直觉判断的。试验（抛掷1000次以上）的结果是针尖朝上的概率略大于 0.6 ，也就是说，即使凭直觉也可以作出相当不错的概率估计。
f n ( A)
在概率论教材中，对于一定类型问题应该采用哪种特定的概率分布，有着广泛的一致意见，因此有许多问题可以迅速而客观地赋以适当概率。而对那些不具备典型特征的事件，要让两个人就同一个特定的概率分布的适用性取得一致意见通常都十分困难，这时概率的设定就有高度的主观性。
由于在实际的决策问题中所遇到的概率的设定大部分属于后者，这里主要讨论在这种情况下如何设定概率（即似然率），并在设定似然率时充分反映决策人拥有的信息和信念。
f n ( A)
由于历史原因，客观概率论者习惯使用概率（probability）一词，采用记号表示自然状态的概率；而主观概率论者习惯用似然率（ likelihood ），采用记号表示自然状态的的似然率。
2. 先验分布及其设定
在决策分析中，尚未通过试验收集自然状态信息时所具有的信息叫先验信息，由先验信息所确定的概率分布叫先验分布（Prior distribution）。
f n ( A)
S ：对决策人来说，下次出现正、反是等可能的。但这不是说硬币本身是公正的，它可能会有偏差，只是就他现有知识而言，没有理由预言一面出现的可能会大于另一面，但多次抛掷的观察结果可以改变他的信念。
O 、 S ：下次抛硬币出现正面还是反面不能确定，但知道：要么是正面，要么是反面。
③ 变换：把直方图变换成概率密度函数曲线。
示例3 明年国民经济的增长率的设定。
直方图法的主要缺点是：
① 子区间的划分没有标准，可以只分成两三个子区间，也可以分成十多个子区间；子区间划分的数量不同，最后拟合所得到的概率密度函数曲线往往会有比较大的差异；
② 确定每个子区间的似然率很不容易，在子区间数量较多时尤其困难；
设定先验分布是贝叶斯分析（Bayesean analysis）的需要。
1）设定先验分布时的几点假设
对许多领域的实际问题，设定在相关的域上的事件的概率分布对于这些领域的专业人员来说已经是常规性和标准化的工作。这种赋值通常是模型与经验相结合，而且许多典型的问题有其相应的概率模型，如二项分布、正态分布、泊松分布等可以使用。
③ 拟合所得的概率密度函数通常尾部误差很大。
（2）相对似然率法该方法是为了克服直方图法的缺点之② 而提出的，它的适用范围与直方图法相同。具体步骤为：
① 离散化
与直方图法的第一步相同，将随机变量的取值范围划分为若干个子区间，但是由于其赋值比直方图法容易，子区间可以多些；
② 赋值为各子区间赋值的方法有两种：
2）主观概率
根据 Savage （ 1954 ）的观点，主观概率是一种见解，是合理的信念的测度。它是某人对特定事件会发生的可能性的信念（或意见、看法）的度量，即他相信或认为事件将会发生的可能性的大小。
f n ( A)
f n ( A)
这种相信的程度是一种信念，是主观的，但又是根据经验、各方面的知识以及对客观情况的了解，利用相关信息进行分析、推理、综合判断而设定（ Assignment ）的，与主观臆测不同。
在以上各种情况下，前面提到的三种概率的定义均不适用。
由于上述原因，需要有一种能在频率观点不适用、实际上无法进行随机试验时设定概率的方法，这就是主观概率（subjective probability）；与此同时，把上面三种定义所规定的概率称为客观概率（objective probability）。
f n ( A)
O ：只要硬币均匀，抛法类似，次数足够多，正面向上的概率就会是1/2，这是简单的定义。
S ：这确是定义，决策人认为硬币是均匀的，正、反面出现的可能性 ( 似然率 ) 相同，是个主观的量。
（3）下次抛硬币出现正面的概率是1/2。 O ：这种说法不对，不重复试验就谈不上概率。
A
称为事件A发生的频率，记作 f n ( A) 。
即
fn ( A) nA n
下：
(2.1)
古典的概率（probability）的定义如
p ( A) lim f n ( A)
n
(2.2)
（2） Laplace的概率定义 Laplace （ 1812 ）把事件 A 发生的概率定义为：
l
A l B 或 A l B 必有一种也仅有一种成
立。
假设2.2（传递性 (Transitivity)假设）若对事件A、B和C， A B ， B C ，则
l l
A l C
假设2.3（部分小于全体）若事件A是事件 B的一部分，即B包含A，记作 A B ，则事件B发生的可能性不会小于事件A，即
B l A
假设2.4 若 A A A 是离散的事 1 2 3 件序列，B是某个固定事件，且对任意i 有 A B ，则
i l
Ai l B
假设 2.5 在[0，1]区间存在均匀分布的随机变量。
i 1
Savage （ 1954 ）指出满足：假设 2.1~2.5 就可以保证概率分布的惟一存在性。在实际设定先验分布的时候，注意满足前三条假设就可以了，分析人员的注意力应该放在量化决策人的“信念”的准确性上。
f n ( A)
例如，一个即将毕业的硕士生考虑下一步去向的时候，面临着就业还是继续深造（考博士生）的选择。而是否考博士生在很大程度上取决于被录取的可能性大小。这种考博被录取概率的设定显然是主观的，但也不是随意的、毫无根据的，获得的相关信息越多、越准确，设定概率也越可信。
又比如掷硬币，稍有常识的人都知道，只要硬币是均匀的，无需多次重复试验，也能判断正面朝上的概率是二分之一。又如，抛一枚图钉，它落地并最终静止时可能针尖朝上，也可能针尖朝下。
3）概率的数学定义
定义2.2 对非空集Ω=｛ω｝，F是Ω的子集A所构成的σ-域，即F满足如下条件：
f n ( A)
① Ω∈F；
② 若 A F 则 A F ； ③ 若 Ai F 则 Ai F 。
若 p ( A)是定在F上的实值集函数，它满足：
① 非负性 p( A) 0 ；
② 规范性 p() 1 ；
第二讲：主观概率
主要内容：
1. 概率的基本概念 2. 先验分布及其设定 3. 设定主观概率案例
1. 概率的基本概念
1）概率
（1）频率与概率
f n ( A)
为了描述随机事件发生的可能性大小，人们通常进行随机试验并观察试验结果。在相同条件下进行了n次试验，其中事件A发生的次数n 称为事件A发生的频数，比值 nA n