第十六章随机决策分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十六章随机性决策分析方法
人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定,而又必须做出判断和决定的问题. 这类问题称为随机性决策问题. 任何一个随机性决策问题都包含两个方面的内容,即决策人所采取的行动方案(简称决策)和问题的自然状态(简称状态),而且具有两个基本特点:后果的不确定性和后果的效用.
所谓后果的不确定性,主要是由于问题的随机性,使得问会出现什么状态是不确定的,所以对策人做出的某种决策以后会出现什么后果也是不确定的. 而效用是后果价值的量化,由于不确定性,无论决策人采用什么策略,都可能会遇到事先不能完全预料的后果,这要承担一定的风险,不同的决策人对待风险的态度会不同. 因而,同样的后果对不同的策略人产生的效用也会不同. 即使在没有风险的情况下,不同的决策人对待各种后果也有不同的偏好,为此,在进行定量分析之前,就应该确定出所有后果的效用. 只有这样,人们才能比较各种策略的优劣,根据自己的喜好来选择最佳的决策方案.
在决策分析中,后果的不确定性和对于后果赋予的效用是两个关键性的问题. 为此,对于状态的不确定性主要用主观概率来表示,而后果的效用则用效用理论来研究.
16.1 随机性决策问题的基本概念
16.1.1 主观概率
随机性决策问题的后果的不确定性,主要是由状态的不确定性所引起的. 状态的不确定性,往往不能通过在相同条件下的大量重复试验来确定其概率分布(此称客观概率)是有区别的.
主观概率是决策人进行决策分析的依据,虽然他与客观概率有本质的区别,但在定义概率方面有不同之处,同样遵循客观概率应该遵循的若干假设、公理和性质等,因此,适用于客观概率的所有的逻辑推理方法均适用于主观概率. 这里仅给出主观概率所服从的基本假设(或称公理系统):
(1)设为一非空集合,其元素可以是某种试验或观察的结果, 也可以是自然的状态.
(2)设F是中的一些子集A所构成的集合,F满足下列条件:
1) F
2) 如果A F,则A A F ;
3) 如果可列多个A n F,n 1,2,L ,则它们的并集U A n F -
n 1
(3)设P(A)(A F)是定义在F上的实值集函数,如果它满足下列条件,就称为F上的(主观或客观)概率测度,或简称概率,这些条件是
1) 对于每个A F ,有0 P(A) 1;
2) P( ) 1;
3) 如果可列多个A F (n 1,2,L ), A A j (i j),贝U
这里称点为基本事件,F中的集A称为事件,F是全体事件的集合,P(A)称为事件A的(主观或客观)概率,三元总体(,F,P)称为(主观或客观)概率空间.
设定主观概率的方法主要有:主观先验分布法、无信息先验分布法、极大熵(极大平均信息量)先验分布法和利用过去数据设定先验分布法等[3.4].
16.1.2效用函数
在随机性决策冋题中,后果的不确定性是有状态的不确定性引起的.所以,在研究后果的效用时要充分考虑后果的不确定性.
设决策人在选择某一行动时,决策问题可能的n个后果为C1,C2,L ,C n;后果G可能发生的
n
概率分别是p i(i 1,2丄,n),且口 1.用P表示所有后果的概率分布,并记
i 1
P (P1,G; P2,C2;L ; P n,C n)则称P为展望.所有展望构成的集合记为P,可以验证P关于凸线性组合是封闭的,即如果P1,P, P,而且0 1,则有
P (1 )P2 P.
对于任意两个展望R,B P,都存在一定的优先关系,即对于决策人可以认为P优于P2,
或R与F2无差异,或R不优于P2三种情况,将这三种关系分别记为Rf P2,R: P2和P2fP1..这种优先关系反映了决策人对各种后果的偏好程度.
定义16.1 设u(P)是定义在展望P上的实值函数,且满足
(1 )它和在P上的优先关系f 一致,即如果对于所有P,P2P,有PfP2,当且仅当
U(P l) U(P2);
(2)它在P上是线性的,即如果PR P,而且0 1,则
那么称u(P)是定义在展望P上的效用函数.
如果P (P1,G;P2,C2;L ;P n,C n) P,则U(P)就是表示以概率口选择Q (i 1,2,L小)的期望效用.效用是决策人在有风险的情况下对后果的偏好的量化,因此,其中包含有决策人对于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.如果所研究的事件是确定的
事件,并不受自然状态的影响,类似地可以定义一个效用来表示决策人对确定事件的各种后果的偏好程度.对于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.
定义16.2 设X为所有确定事件的后果X的集合,u(x)是定义在X上的实值函数,如果对于任意的X1,X2 X有u(X1) u(X2),当且仅当xfx2.,则称u(x)是定义在X上的序数效用函数.
基数效用和序数效用的主要区别是:基数效用在正线性变换下是唯一的,而序数效用在保序变换下是唯一的.
正线性变换:$(P) u(P) ( 0).
保序变换:$(x) f(u(x)),对任意X X, f为严格的单调增加函数.
16.2 效用函数理论
16.2.1 效用与风险的关系
实际中很多的决策冋题都涉及经济效益,对于这类冋题,在后果不确定的情况下,决
策人的决策往往是效益和风险并存,但对不同的决策人对待风险的态度一般是不同的,通
常可分为三种态度,即厌恶型、中立型和喜好型
假设决策人面对一种风险的情况有 1/2的机会得不到任何盈利,也有1/2的机会盈利2a 元,即他的期望盈利为a 元.如果决策人认为冒此风险的期望盈利只等价于比它低的不冒风 险的盈利,则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的•如果决策人认 为这和不冒任何风险的另一行为盈利
a 元等价,则对待风险的态度是 中立型的•这三种不同
的态度可以反映在效用函数上就是凹
(上凸)函数,线性函数和凸(下凸)函数.如图16-1.
1
X ! _.2
u(X 1) u(X 2) u( ) 2
2
;
实际中,很多的情况效用函数的曲线呈 S 型,即在后果的范围内,决策人对待风险的
态度往往会从厌恶风险改变为喜好风险
•如图16-2.
图16-2( a )反映了决策人的财产从小到大,对待风险的态度从喜好到厌恶的改变 .图
16-2(b )反映了决策人的财产随着从损失到盈利的增加,对待风险的态度会从喜好到厌恶 的变化•这是最常用的效用函数•
16.2.2损失函数与风险函数
由图16-1(
- £ uU2
'_
a )是风险厌恶型的效用函数[即有/ 立型的效用函数,,即有一
il
i3 i2 1
X ! u(x 1) u(X 2)
u(
2
(c)
X 2 (b)
由图16-1 (c )是风险喜好型的效用函数,即有
u(X 3)
:
U (X 3
)
种不同的效用函数
2
? > 一
Q J xl
i2 X
图 16-1
u(i3
1
1 : x ,/
2出吐凹__u H