第二讲:主观概率

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

f n ( A)
例如,一个即将毕业的硕士生考虑下一 步去向的时候,面临着就业还是继续深造 (考博士生)的选择。而是否考博士生在很 大程度上取决于被录取的可能性大小。这种 考博被录取概率的设定显然是主观的,但也 不是随意的、毫无根据的,获得的相关信息 越多、越准确,设定概率也越可信。
又比如掷硬币,稍有常识的人都知道, 只要硬币是均匀的,无需多次重复试验,也 能判断正面朝上的概率是二分之一。又如, 抛一枚图钉,它落地并最终静止时可能针尖 朝上,也可能针尖朝下。
设 定 先 验 分 布 是 贝 叶 斯 分 析 (Bayesean analysis)的需要。
1)设定先验分布时的几点假设
对许多领域的实际问题,设定在相关的 域上的事件的概率分布对于这些领域的专业 人员来说已经是常规性和标准化的工作。这 种赋值通常是模型与经验相结合,而且许多 典型的问题有其相应的概率模型,如二项分 布、正态分布、泊松分布等可以使用。
B l A
假设2.4 若 A A A 是离散的事 1 2 3 件序列,B是某个固定事件,且对任意i 有 A B ,则
i l
Ai l B
假设 2.5 在[0,1]区间存在均匀分布的随 机变量。
i 1
Savage ( 1954 )指出满足:假设 2.1~2.5 就可以保证概率分布的惟一存在性。在实际 设定先验分布的时候,注意满足前三条假设 就可以了,分析人员的注意力应该放在量化 决策人的“信念”的准确性上。
③ 变换:把直方图变换成概率密度函数曲线。
ห้องสมุดไป่ตู้ 示例3 明年国民经济的增长率的设定。
直方图法的主要缺点是:
① 子区间的划分没有标准,可以只分 成两三个子区间,也可以分成十多个子区间; 子区间划分的数量不同,最后拟合所得到的 概率密度函数曲线往往会有比较大的差异;
② 确定每个子区间的似然率很不容易, 在子区间数量较多时尤其困难;
2)连续型随机变量先验分布的设定
(1)直方图法。 这种方法适用于自然状态的
取值是实轴
的某个区间的情况。具体步骤是:
① 将区间离散化 即把 的取值范围划分
为若干个子区间
1 ,2 ,,n

② 赋值:设定每个子区间的似然率
(i ), i 1,, n
并根据
(i )作出直方图;
(3)概率的公理化定义
Kormogorov在1930年的著作中给出 的概率的公理化定义。
定义2.1 E是随机试验,S是E的样本空 间,对E的每一事件A,对应有确定的实数 p(A),若p(A)满足:
① 非负性:0≤ p(A)≤1;
② 规范性: p(S)=1;
③ 可列可加性:对两两不相容事件 Ak
A
称为事件A发生的频率,记作 f n ( A) 。

fn ( A) nA n
下:
(2.1)
古典的概率(probability)的定义如
p ( A) lim f n ( A)
n
(2.2)
(2) Laplace的概率定义 Laplace ( 1812 )把事件 A 发生的概率 定义为:
f n ( A)
要求一群学生估计针尖朝上的概率,虽 然这些学生事先都没有抛过图钉,但是大部 分学生都认为针尖朝上的概率大于二分之一, 众数在 0.55~0.7 之间。许多人是凭直觉判断 的。试验(抛掷1000次以上)的结果是针尖 朝上的概率略大于 0.6 ,也就是说,即使凭 直觉也可以作出相当不错的概率估计。
4)主客观概率的比较
(1) 基本属性
f n ( A)
客观概率论者(以下简记为 O )认为: 概率是系统的固有的客观性质,是在相同条 件下重复试验时频率的极限。
主观概率论者(以下简记为 S )认为: 概率是观察者而非系统的性质,是观察者对 系统处于某状态的信任程度。
(2) 抛硬币:正面向上概率为1/2。
为了讨论方便,我们先引入几个记 号: l 、 l 和 l。
于事件B发生的似然率”;
A l B 读作 “事件A发生的似然率大
事件B发生的似然率相当”; 小于事件B发生的似然率”。
A l B 读作 “事件A发生的似然率与 A l B 读作 “事件A发生的似然率不
假设 2.1 (连通性 (connectivity) 假设,又 称可比性(comparability)假设)是指事件A和 B发生的似然率是可以比较的,即 A B 或
ri j (i ) ( j ) i, j 1, 2,, n
③ 规范化
对赋值法a) :
f n ( A)
在概率论教材中, 对于一定类型问题 应该采用哪种特定的概率分布,有着广泛的 一致意见,因此有许多问题可以迅速而客观 地赋以适当概率。而对那些不具备典型特征 的事件,要让两个人就同一个特定的概率分 布的适用性取得一致意见通常都十分困难, 这时概率的设定就有高度的主观性。
由于在实际的决策问题中所遇到的概率 的设定大部分属于后者,这里主要讨论在这 种情况下如何设定概率(即似然率),并在 设定似然率时充分反映决策人拥有的信息和 信念。
2)离散型随机变量先验分布的设定
( 1 )对各事件加以比较确定相对似然率。
f n ( A)
示例1 某人考博士生被录取的概率。 示例2 某个农民为了确定当年种植作物的 适宜品种,需要判断当年的气候状况。
(2)打赌法
设事件E发生时收入 p(0 p 1) ,其中 的 1 代表某个适当的数值的钱,例如 1000 元 或 100 元,不同的决策人可以取不同的值, 这一数值与决策人的财产相比是一个小数目, 以保证在此范围内对决策人的实际价值接近 于线性;
p( A) k n
(2.3)
其中, k 为事件 A 中所包含的基本事件数量, n为基本事件的总数。
显然,上述定义的适用条件是: ① 基本事件的数量有限,即试验的样本 空间 S {e1 , e2 ,, en } ; ② 每个基本事件都是等可能的,即
p(e1 ) p(e2 ) p(en ) 1 n
例如,在出门是否带伞的决策问题中 可能会遇到明天是否下雨,项目申请问题中 的中标可能性,以及在实际决策中经常遇到 的明年国民经济增长率的分布、战争中对敌 方下一步行动的估计等等这样广义的自然状 态,这些状态或事件显然是无法重复试验的, 其中也没有所谓的基本事件。
有些问题虽然不是完全不能重复试验, 但由于种种原因, 实际上不能施行 。例如 洲际导弹的命中率,虽然在原则上可以通 过相同条件下的重复试验获得,但是每次 试验费用过于昂贵、代价过大,实际上不 可能多次重复试验。
③ 拟合所得的概率密度函数通常尾部 误差很大。
(2)相对似然率法 该方法是为了克服直方图法的缺点之② 而提出的,它的适用范围与直方图法相同。 具体步骤为:
① 离散化
与直方图法的第一步相同,将随机变量 的取值范围划分为若干个子区间,但是由于 其赋值比直方图法容易,子区间可以多些;
② 赋值 为各子区间赋值的方法有两种:
在以上各种情况下,前面提到的三种 概率的定义均不适用。
由于上述原因,需要有一种能在频 率观点不适用、实际上无法进行随机试 验时设定概率的方法,这就是 主观概率 (subjective probability);与此同时, 把上面三种定义所规定的概率称为 客观 概率(objective probability)。
f n ( A)
O :只要硬币均匀,抛法类似,次数足 够多,正面向上的概率就会是1/2,这是简单 的定义。
S :这确是定义,决策人认为硬币是均 匀的,正、反面出现的可能性 ( 似然率 ) 相同, 是个主观的量。
(3)下次抛硬币出现正面的概率是1/2。 O :这种说法不对,不重复试验就谈不上 概率。
3)概率的数学定义
定义2.2 对非空集Ω={ω},F是Ω的子 集A所构成的σ-域,即F满足如下条件:
f n ( A)
① Ω∈F;
② 若 A F 则 A F ; ③ 若 Ai F 则 Ai F 。
若 p ( A)是定在F上的实值集函数,它满足:
① 非负性 p( A) 0 ;
② 规范性 p() 1 ;
l
A l B 或 A l B 必有一种也仅有一种成
立。
假设2.2(传递性 (Transitivity)假设)若 对事件A、B和C, A B , B C ,则
l l
A l C
假设2.3(部分小于全体)若事件A是事件 B的一部分,即B包含A,记作 A B ,则事 件B发生的可能性不会小于事件A,即
设E不发生即 E 发生时收入为 1 p 。 调整p值,使决策人感到两者无差异为止, 则
( E ) 1 p
为了帮助决策人量化随机事件的主观概 率,可以借助于概率盘,其形状如下图。
主观概率待定的抽 概率盘正面 奖
概率盘正面分为红、兰两个扇形区,扇 形区的面积可任意调整;反面有刻度指示红 色扇形区占整个圆盘面积的百分比。使用时 调整红色扇形区域的大小,直到决策人认为 它与右图抽奖中后果 E 发生的概率相等为止, 这时概率盘反面的刻度值就是决策人心目中 后果E发生的概率。
f n ( A)
S :对决策人来说,下次出现正、反是等 可能的。但这不是说硬币本身是公正的,它可 能会有偏差,只是就他现有知识而言,没有理 由预言一面出现的可能会大于另一面,但多次 抛掷的观察结果可以改变他的信念。
O 、 S :下次抛硬币出现正面还是反面不 能确定,但知道:要么是正面,要么是反面。
(两两不相容是指 i j, Ai Aj ),有
p( Ak ) p( Ak )
k k
则称为事件A发生的概率。
以上所述的几种概率的定义中有一个 共同的特点,这就是概率是在多次重复试 验中,随机事件A发生的可能性的大小的度 量。而在实际的决策问题中,自然状态的 概率往往 无法通过重复试验 求得,通常也 并不包含等可能的基本事件。
f n ( A)
由于历史原因,客观概率论者习惯使用概 率(probability)一词,采用记号表示自然状 态的概率;而主观概率论者习惯用似然率 ( likelihood ),采用记号表示自然状态的的 似然率。
2. 先验分布及其设定
在决策分析中,尚未通过试验收集自 然状态信息时所具有的信息叫先验信息, 由先验信息所确定的概率分布叫先验分布 (Prior distribution)。
a)选定一个似然率最大的子区间 k 作 为基准,设基准区间的相对似然率为 Rk 10 (或者取1、100等,视决策人的习惯而定), 然后给出其他各区间似然率与基准区间似然 率的相对比值 Ri ,即
Ri : Rk (i ) : (k )
b )由决策者给出每二个子区间似然率 的比例关系:
2)主观概率
根据 Savage ( 1954 )的观点,主观概率 是一种见解,是合理的信念的测度。它是某 人对特定事件会发生的可能性的信念(或意 见、看法)的度量,即他相信或认为事件将 会发生的可能性的大小。
f n ( A)
f n ( A)
这种相信的程度是一种信念,是主观的, 但又是根据经验、各方面的知识以及对客观 情况的了解,利用相关信息进行分析、推理、 综合判断而 设定 ( Assignment )的,与主观 臆测不同。
第二讲:主观概率
主要内容:
1. 概率的基本概念 2. 先验分布及其设定 3. 设定主观概率案例
1. 概率的基本概念
1)概率
(1) 频率与概率
f n ( A)
为了描述随机事件发生的可能性大小, 人们通常进行随机试验并观察试验结果。在 相同条件下进行了n次试验,其中事件A发生 的次数n 称为事件A发生的频数,比值 nA n
③ 可列可加性 ,若 Ai , Aj为两两不相容事件,则
p(i 1 Ai ) i 1 p( Ai )

则 p ( A) 称为事件A的(主观或客观)概率测度,简 称概率。
上述定义中, ω 为基本事件, A 为事件, 三元总体(Ω,F,P)则称为概率空间。
需要注意的是,定义 2.2 既适用于客观 概率,也完全可用于主观概率,即两者有着 完全相同的数学定义。因此,由客观概率论 者发展起来的概率论的整套推理和计算方法, 也都完全适用于主观概率。
相关文档
最新文档