决策理论与方法第三章效用函数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设决策系统的自然状态集Θ={1,…, n}、行动集 A={a1, …,am}、后果集C={cij=c(ai,j)},最优后果为
c*=max {cij},最劣后果为c0=min {cij}。则对于任意 后果cij的效用值u(cij),可按以下步骤获得: ◦ 设u(c*)=1, u(c0)=0; ◦ 建立简单展望<p,c*;1-p,c0>,p可调 ◦ 反复向决策人提问,改变可调概率p,使得当p=pij
2020/6/2
◦ 复合展望:当无法确定采取某个行动时, 可随机选择一种行动,设选择行动aj的概率 为qj。则决策的展望就是一种复合展望,记 为P=<q1, P1; q2, P2;…;qm,Pm>。所有展望( 包括简单展望和复合展望)构成展望空间 。
2020/6/2
抽奖(lottery)与确定当量
若 (
;
)
则称 确定性后果 为抽奖的确定当量
效用的定义
◦ 若展望空间上的实值函数u对于展望空间P
的任意两个展望P1、P2,有P1≥P2 当且仅当
u(P1)≥u(P2),则称u为效用函数
三、效用存在性公理(理性行为公理)
◦ 连通性:任意两个展望的优劣都是可比的 ◦ 传递性:展望的优劣满足传递性 ◦ 复合保序性:展望的优劣关系是可以复合的,
2020/6/2
*偏好次序是决策人的个性与价值观的反映,与决策人所 处的社会、经济地位,文化素养,心理和生理(身体)状态 有关。
* 除风险偏好之外,还有时间偏好。
而效用(Utility)就是偏好的量化,是数(实值函数).
Daniel Bernoulli 在1738年指出:
若一个人面临从给定行动集(风险性展望集)中作选择的 决策问题,如果他知道与给定行动有关的将来的自然状态 ,且这些状态出现的概率已知或可以估计,则他应选择对 各种可能后果的偏好的期望值最高的行动。
◦ 则效用函数u(P)为(基数)效用函数
2020/6/2
四、效用函数—基数性和序数性
前述定义的效用是一种基数效用,不仅能够反映决 策者的偏好次序,还能够反映决策者的偏好强度。
但在实际决策中,有时只需要偏好次序而不一定需 要知道偏好强度就可以决策。此时只需要序数效用 就可以了。有关序数效用的应用在多属性决策中介 绍。
Hicks对效用函数的基数性和序数性的比喻:如果知 道两个人的身高,那么我们可以把高个儿排在第一 位;如果不知道他俩的身高也没关系,让他们比一 下就可以了。
2020/6/2
第二节 效用函数的构造
一、估计效用函数值的方法 概率当量法(Von Neumann, Morgenstern,N-M法):
时得到如下的无差异关系:cij~<pij,c*;1-pij,c0> ◦ 测得后果cij的效用值为:
202u0/(6c/2ij)=pij*u(c*)+(1-pij)*u(c0)=pij
确定当量法(修正N-M法): ◦ 设u(c*)=1, u(c0)=0; ◦ 建立简单展望<p,c*;1-p,c0>,p为0-1间的给定值,如 p=0.5 ◦ 反复向决策人提问,改变cij得到如下的无差异关系: cij~<p,c*;1-p,c0> ◦ 测得后果cij的效用值为: u(cij)=p*u(c*)+(1-p)*u(c0)=pij
◦ 对展望空间中的任意展望P1、P2,P1>P2 当且仅 当 u(P1)>u(P2)
◦ u(P1+(1-)P2)= u(P1)+(1-)u(P2) (复合展望的 效用等于展望效用的复合)
◦ 对满足上述条件的实值函数u1, u2, 必有 u1(Pi)=bu2(Pi)+c, 其中b, c∈R1,b>0。(任意两 个决策人的效用是线性相关的)
50万元 250万元 0元
抽奖b1 抽奖b2
0.11 0.89
50万元 0万元
0.10 0.90
决策B
250万元 0元
实际上决策B是在决策A的基础上同时减去了89% 的机会获得50万元,复合保序性没有得到满足
2020/6/2
效用的公理化定义:在上述公理系统中, 若展望空间上存在实值函数u,有:
增益当量法:已知u(cij)和u(c0),确定u(c*)的方法 损失当量法:已知u(cij)和u(c*),确定u(c0)的方法
2020/6/2
如何选择估计方法
使用确定当量法时决策人对最优后果( 增益)的保守性和对损失的冒险性都比 概率当量法严重(Hershey,1982)
采用增益当量法与损失当量法时产生的 误差也比用概率当量法大
决策理论与方法第三章 效用函数
2020年6月2日星期二
例2:
礼品a1
1.0
10万元
抽奖a2
0.5
25万元
0.5
0元
ຫໍສະໝຸດ Baidu
在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望 收益大但风险也大!不同的决策人有不同的选择,相同的决策人在不 同的情境下选择也不同。那么在决策中如何描述或表达后果对决策人 的实际价值,以便反映决策人心目中对各种后果的偏好次序呢?
尽可能使用概率当量法
二、离散型后果的效用设定
后果为离散型随机变量时,后果集中元素为有限个 ,构造后果集上的效用函数有两个方面的内容,一 是确定各后果之间的优先顺序,二是确定后果之间 的优先程度。
决策的目标就是使期望效用极大化。
二、效用基本概念及符号 ◦ 严格序>:a>b表示a优于b。满足传递性和非对称性。 ◦ 无差异~:a~b表示a与b无差异。满足自反性、对称性和 传递性。 ◦ 弱序≥:a≥b表示a不劣于b。满足可比性、传递性、与无 差异~的一致性和严格优于的一致性。 ◦ 展望(prospect)(可能的前景):各种后果(r种)及后果出 现的概率的组合,记为:Pj=<p1(j),c1;p2(j),c2;…;pr(j),cr>, (j=1,2,…,m; m为行动的可能种数)
且复合不会破坏原有的优劣关系 ◦ 偏好的有界性:展望的优劣是相对的,没有无
限优的展望,也不存在无限劣的展望。
理性行为公理认为合乎理性的决策人在进 行价值判断时一定能满足这些公理。(实 际决策中是否存在某种悖论呢?)
2020/6/2
Allais悖论
抽奖a1
1.0
50万元
抽奖a2
0.89 0.10 0.01 决策A
相关文档
最新文档