决策理论与方法第三章效用函数.pptx

合集下载

第03讲随机决策理论与方法-1

第03讲随机决策理论与方法-1
传递性假设:若对事件A、B、C,有p(A)>p(B), p(B)>p(C), 则 p(A)>p(C)。(满足连通性和传递性的二元关系才能构成完全 序)
部分与全体关系假设:若事件A是事件B的一部分,则 p(B)≥p(A)。
6
主观概率—先验分布估计:比较法
❖ 比较法1-离散型(对事件发生的各种状态加以比较确定相 对似然率)
均匀分布(连续型):如果随机变量落在某个区间(a, b) 中任意等长度的子区间内的可能性相等,则它服从均匀 分布,均匀分布的概率密度函数为: [Matlab函数: unifpdf(x,a,b),unifit(DATA)]
f (x) 1 ba
1 ba
a
b
13
主观概率—先验分布估计:分布函数法
二项分布:(离散型)每次随机试验中事件A出现的概率为 p,n次独立试验中事件A出现k次的概率服从二项分布: [Matlab函数:binopdf(k,n,p),binofit(k,n)]
14
15
主观概率—先验分布估计:分布函数法
正态分布(高斯分布): (连续型)若连续型随机变量的
概率密度函数为:
f (x)
1
e(x22)2
2
则称随机变量服从参数为、2的正态分布[Matlab函数: normpdf(x,,), normfit(DATA)] 。

效用函数-决策

效用函数-决策
24
效用函数 的定义
书P29:
25
效用函数
基数效用:不仅反映偏好/优先次序,还反映偏好/优先强弱程度
序数效用:仅反映偏好/优先次序,无法反映偏好/优先强弱程度
26
效用函数
27
效用函数 的构造方法
1、估计效用值的方法:
A、NM方法(概率当量法)
28
效用函数 的构造方法
1、估计效用值的方法:
A、NM方法(概率当量法)
12
效用的定义
熟悉一下详细描述:书P28:定义:2.4.1
13
效用的定义
书中例子:带伞问题
方案/行动:1、不带伞 2、带伞
方案/行动所带来的后果: 1、不带伞无雨 2、不带伞遇雨 3、带伞不遇雨 4、带伞遇雨 假设天气只有3中情况: 1、遇雨概率为0,不遇雨概率为1 2、遇雨概率为0.5,不遇雨概率为0.5 3、遇雨概率为1,不遇雨概率为0 3种天气情况下决策者的行为是“不带伞”所对应的展望: 书2.4-2.5式
34
效用函数 的构造方法
2、离散型结果的效用设定:
请写出后果?
35
效用函数 的构造方法
2、离散型结果的效用设定:
根据题意请写出后果的优先顺序?
36
效用函数 的构造方法
2、离散型结果的效用设定:
37
效用函数 的构造方法

第三章效用函数.pptx

第三章效用函数.pptx

3.2.1 效用和效用函数的概念
3. 估计效用函数的方法
(1)标准效用测定法(概率当量法,V-M法)
思路:对于给定的结果值,测定其效用值。
设有决策系统(Ω,A,F),其结果值集
合为:
O=(o1, o2 , …, on)
记:
o* ≽max{o1, o2 , …, on }
o0 ≼min{o1, o2 , …, on }
①取
O=(o1, o2 , …, on) o* ≽max{o1, o2 , …, on }
o0 ≼min{o1, o2 , …, on } 并令 u(o*)=1,u(o0)= 0;
② 构造简单事态体(0.5, o*; 0.5, o0),用确
定当量法找到该事态体的确定当量oξ,使
得:
oξ~(0.5, o*; 0.5, o0)
且:
这里,qj(j=1, 2, …, n)为oj关 于o*与o0的无差异概率。
3.1.3 事态体的基本性质
根据性质3. 3
比较一般事态体之间的优劣关系,可以转化 为比较简单事态体之间的优劣关系(将问题 简化)
得到事态体之间两两的优劣或无差异关系后, 再根据公理3.2(传递性)即可得到所讨论 事态体的排序。
§3.2 效用函数的定义和构造
3.2.1 效用和效用函数的概念 1. 效用的概念 2. 定义3.5 3. 设决策问题的各可行方案有多种可能的

效用函数

效用函数

3.2.3 效用的公理化定义和效用 的存在性
3.2.3 效用函数的存在性
3.2.4 基数效用与序数效用
基数:为实数,如1,2,3,π 序数:如第一,二,…,4,3,2,1 基数性效用函数与序数效用函数区别:
1.基数效用定义在展望集P上(考虑后果及其概率分布), 是实数;序数效用定义在后果集C上,不涉及概率,可 以是整正数. 2.基数效用反映偏好强度:(正线性变换下唯一)
3.1 引言
由上面两个例子可知:在进行决策分析时,存 在如何描述或表达后果对决策人的实际价值, 以便反映决策的人心目中各种后果的偏好次序 (preference order)的问题。
偏好次序是决策人的个性与价值观的反映,它 与决策人所处的社会地位、经济地位、文化素 养、心理和生理(身体)状态有关。
3.2.2 效用存在性公理
定义3.1给出了效用函数的最基本性质,这就 是可以根据它的大小来判断展望P的优劣。
但是这样的效用函数是否一定存在呢?回答是 不一定。
至于决策人的价值判断在满足什么条件时存在 与之一致的效用函数,von NeumannMorgenstern (1944)给出了效用的存在性公理 ,又称理性行为公理。
(5) 抽奖与确定当量
由机会点和该机会点发出的 n 个机会枝的概率及相应
后果构成的图形称为抽奖(lottery),抽奖又称彩票。

决策理论3-效用函数课件

决策理论3-效用函数课件

决策理论3-效用函数
⑴ 概率当量法
决策理论3-效用函数
2.离散型后果的效用设定
• 后果为离散型随机变量时,后果集C中元素为有限 个,构造后果集上的效用函数有两方面的内容: (1)确定各后果之间的优先序; (2)确定后果之间的优先程度。 • 离散型后果效用值的设定可以采用概率当量法,简 称NM法。
决策理论3-效用函数
圣彼得堡悖论的解释3:
(三)效用上限论
也有一种观点认为奖金的效用可能有一个上限,这样,期望效用 之和就有了一个极限值。Menger认为效用上限是惟一能消解该悖论的 方法。设效用值等于货币值,上限为100 单位,则游戏的期望效用为 7.56l25,如表3所示。
决策理论3-效用函数
3 效用函数
• 3.1 引言 • 3.2 效用的定义和公理系统 • 3.3 效用函数的构造 • 3.4 风险与效用 • 3.5 货币的效用 • 3.6 阿莱斯悖论(Allais’s paradox)
决策理论3-效用函数
3.1 引言
• 在定量评价可能的行动的各种后果时,会遇到两个主要问题:
✓(1) 后果本身是用语言表述,可能没有任何合适的直接测量标度。 ✓(2) 即使有一个明确的标度可以测量后果,按这个标度测得的量也可能并
果构成的图形称为抽奖(lottery),抽奖又称彩票。
1.0
C1
p

决策理论3_效用函数

决策理论3_效用函数

决策理论3_效用函数

决策理论是研究人类在面对不确定性和风险的情况下做出决策的理论。效用函数是决策理论中的一个重要概念,用于衡量不同决策结果带来的效

用或满足程度,从而指导人们做出最优决策。

效用函数的概念最早由经济学家边沁提出,他认为人们根据自身对事

物的偏好程度,对不同结果赋予一定的效用值。效用函数可以看作是将决

策结果映射为实数的函数,而不同人对相同决策结果的效用值可能是不同的。

效用函数的具体形式和性质因人而异,常见的效用函数包括线性函数、指数函数、对数函数等。线性函数在描述决策者对风险的态度时较为简单,即效用与结果成正比。指数函数则可以很好地描述决策者对小概率事件的

偏好,即决策者更容易选择高概率事件而放弃低概率事件。对数函数则可

以很好地描述决策者对较大收益的饱和效应,即对于相同数量级的收益,

决策者的边际效用递减。

效用函数在决策分析中的应用非常广泛。一方面,通过确定决策者的

效用函数,可以将决策问题转化为一个最优化问题,通过求解最大效用值

或最小效用值来确定最优决策。例如,在投资决策中,决策者可以通过测

量不同投资组合的效用值来选择最优的投资方案。另一方面,效用函数也

可以用来比较不同决策者之间的偏好,帮助决策者进行选择。例如,在公

共政策制定中,政府可以通过测量不同政策方案对公众的效用值来确定最

优政策。

然而,在实际应用中,确定有效的效用函数并不容易。一方面,人的

偏好往往是主观和复杂的,难以用简单的函数来直接描述。另一方面,效

用函数的形式和参数可能随着决策情境和决策者的变化而变化,因此需要不断调整和修正。为了解决这一问题,决策理论提出了一些方法,如实证研究、实验方法和专家调查等,以获得更准确和可靠的效用函数。

第三讲 间接效用函数与支出函数

第三讲 间接效用函数与支出函数
• 间接效用函数使用收入和价格两个变量 来描述的消费者的最优消费均衡。
ICC
PCC
三、间接效用函数的性质
• 1、在价格和财富上是连续的。 • 2、它对于价格和财富是零次齐次的,即价格 和财富的同比例变化并不影响效用水平。 • 3、在财富上是严格递增的。 • 4、而在价格上则是严格递减的。 • 5、满足罗伊恒等式。
两式相除,就可以得到罗伊恒等式
• 例:从直接效用函数
1
u( x1 , x2 ) ( x1 x2 ) ,0 1, 推出 接效用函
v( p, y),
• 并验证性质5。
x1 x2 y y
p1 p1 ,x1 x2 p2 p2 p1 x1 p2 x2 x2 p
• 最大值函数(Maximum Value Function) • 最优规划问题max f ( x), x x g ( x) c 中, x 我们知道最优解是与参数有关的函数, 即 x x(c) ,因此在最优解处,目标函数的值 为:
f ( x ) f ( x(c)) V (c)
p
y
• 现在应用效用最大化理论来分析两个实际问题:所得税与 销售税的比较,价格补贴发放办法比较。 • 问题1:所得税与销售税哪一种对消费者更为有利? • 国家向居民征税有两种办法,一种是征收所得税,另一种 是征收销售税。假定不论采取哪种办法,居民缴纳的税额 是一样的。那么,哪一种征税办法对居民更为有利些? • 问题2:涨价补贴对消费者是否有利? • 商品涨价,国家要发放价格补贴。一种办法是控制价格, 不许涨价,把价格补贴发给生产者。另一种办法是允许涨 价,把价格补贴发给消费者。那么,哪一种补贴办法对消 费者更为有利? • 为了分析这两个问题,设当前的市场价格体系为 p,消费 者收入为 r,消费者的选择为 xD( p, r)。

3、理性行为公理与效用函数

3、理性行为公理与效用函数
说明Γ上元素优劣关系比较是可传递 。
全序集
满足以下两个公理的事态体集合,称为全 序集。
连通性公理 传递性公理
即:事态体集合上事态体的优劣关系是可 比的,并且该关系是具有传递性的。
复合保序性公理
若T1, T2,Q∈Γ,且0<λ<1,则
当且仅当
λT1+(1-λ)Q λT 2+(1-λ)Q
反之,称o1不劣于o2, 记做o1 | o2。
事态体比较的有关定义
设两个简单事态体T1,T2具有相同的结果值 o1, o2,即T1=(p1, o1;1-p1, o2), T2=(p2, o1;1-p2,o2), 并假定o1 o2
若p1=p2,则称事态体T1无差异于T2,记作T1~T2。 若p1>p2,则称事态体T1优于T2,记作T1
T=( p, o1; 1-p, o2)~o3 其中结果值o3称为事态体T的确定当量,p 称为o3关于o1与o2的无差异概率。
事态体的基本性质(三)
任一事态体无差异于一个简单事态体。 设事态体T=( p1, o1; p2, o2;…; pn, on),则必 存在一个简单事态体T’=( p’, o*;1-p’, o0) , 使得T’~T。其中
损失值可以通过收益值计算出来,计算公 式为
rij max q kj qij
1 k m

效用函数

效用函数

其决策表如表3-20所示。按期望值法以损益值进行决策,可得: 表3-20 生产方案决策表
E ( A1 ) 20 0.2 0 0.3 (10) 0.5 1(万元) E ( A2 ) 15 0.2 2 0.3 (5) 0.5 1.1(万元) E ( A3 ) 5 0.2 1 0.3 (1) 0.5 0.8(万元)
2
Copyright © 2009 All Rights Reserved,信息管理学院
第五节 效用理论及风险评价
事实上,任何决策都是由决策人作出的,决策人自己 的经验、才智、胆识和判断能力等主观因素,必然会 对决策方案的选择产生影响。决策人对风险的态度也 是至关重要的,同一个决策问题,保守型决策人与冒 险型决策人所做出的选择会很不一致,而且同样的货 币量对不同的经济主体往往具有不同的“价值”。即 使是对同一经济主体,在不同时刻、不同环境下,同 样的货币量也可能具有不同的“价值”。
下面用几个简单的例子来说明效用曲线在风险决策中的应用。 例3-14 某决策人面临着大、中、小批量三种生产方案的选 择问题。该产品投放市场可能有三种情况:畅销、一般、滞销。 根据以前同类产品在市场上的销售情况,畅销的可能性是0.2, 一般为 0.3,滞销的可能性为0.5,问该如何决策?
18
Copyright © 2009 All Rights Reserved,信息管理学院

第三章 效用函数与风险厌恶

第三章  效用函数与风险厌恶
x, y, z C, ifx y, y z x z
(4)连续性(continunity)
对于任意的X、y,集合 x x y 和x x y是闭
集,则 x x y和 x x y是开集。
即如果x是一组至少与y一样好的消费束,而
且它趋近于另一消费束z,则z与y至少同样好。 这样就可以得到一条连续的无差异曲线。
风险:是指那些涉及已知概率或可能性形式出现的随机 问题,但排除了未数量化的不确定性问题。即对于未来可 能发生的所有事件,以及每一事件发生的概率有准确的认 识。但对于哪一种事件会发生却事先一无所知。
不确定性:是指发生结果尚未不知的所有情形,也即那 些决策的结果明显地依赖于不能由决策者控制的事件,并 且仅在做出决策后,决策者才知道其决策结果的一类问 题。即知道未来世界的可能状态(结果),但对于每一种 状态发生的概率不清楚。
该游戏的数学期望值:
E(.) 1 1 1 2 1 4 24 8
1 2n
2n1
但实验的结果表明一般理性的投资者参加该 游戏愿意支付的成本(门票)仅为2-3元。
圣彼德堡悖论:面对无穷的数学期望收益的 赌博,为何人们只愿意支付有限的价格?
B.期望效用原则
Daniel Bernoulli (1700-1782)是出生于瑞 士名门著名数学家,1725-1733年期间一直在圣彼德堡 科学院研究投币游戏。其在1738 年发表《对机遇性赌博的 分析》提出解决“圣彼德堡悖论”的“风险度量新理 论”。指出人们在投资决策时不是用“钱的数学期望”来 作为决策准则,而是用“道德期望”来行动的。而道德期 望并不与得利多少成正比,而与初始财富有关。穷人与富 人对于财富增加的边际效用是不一样的。

第4讲 3.期望效用函数

第4讲 3.期望效用函数
高产20% 正常40% 低产40%
雨量大20%
雨量中50% 雨量小30%
0.04
0.10 0.06
0.08
0.20 0.12
0.08
0.20 0.12
0.20
0.50 0.30
奖品是产量的分布,它们又具有不确定性,而成为 赌局本身。
三、不确定条件下的选择公理
【完备性与传递性公理】对两种不同的结果, 消费者的偏好为:
E( ) 0,E( 2 )为 的方差,略去高阶,得:
Var h '' u ( w0 ) Ru ( w0 ) u ( w0 ) u ( w0 ) 2 Var h u '' ( w0 ) R 2 u ' ( w0 )
'
也就是:
Var h R R w 2
对于有多个可能结果的赌博,消费者的期 望效用为:
单赌gs ( p1a1 , p2a2 ,
Eu ( g s ) piu (ai )
i 1 n
, pn an )
期望效用函数的作用:当消费者面临不确定性 时,可用期望效用最大化分析消费者的行为。
四.期望效用函数
期望效用函数的构造:
书上58页
3、保险费
令Z 表示一个均值为和方差为 2的随机变量, 并设消费者拥有x的财富: 保险费 I:u x I E u x +Z

技术经济评价效用函数评价方法ppt课件

技术经济评价效用函数评价方法ppt课件
利,不顾风险,乐于大胆尝试。 如图中的C曲线。 C曲线凹得越厉害,决策者风险性越大。
27
4.渴望型效用函数
渴望型效用函数表明:当货币额不太大时,决 策者具有一定的冒险胆略,但一旦货币额增至 相当数量(超过h点)时,他将由冒险策略转 为稳妥策略。
需要说明:对于不同的此类决策者,有不同的 策略转折点(h点)。
在向决策者提问问题时,方案a1的可能结果不一定 用0元和100元的效用值表示。可以用任意两个货币 数值,只要它们的效用值已经得出,且预测点介于 它们之间。例如:
12
u(50) = 0.7,u(100) = 1,问:u(65) =? 设a1:(p,100; 1-p,50);a2:(1.0,65),提问:p为何值
效用函数评价方法
1
效用函数法
第一节 效用的概念和测定方法
1.效用,就是某一事物的“使用价值”。 2.评价分析中的两个关键问题:
一是对所研究的对象的状态的不确定性进行量 化——用概率描述; 二是对各种可能出现的(决策)后果赋值(赋 予价值)——用效用理论。 3.效用的相对性: 同样是100元,对于不同的人或同一人的不同时 间(条件),其效用值不同。
的速度是递减的。 决策者不求大利,但避风险。 决策者对肯定得到某一损益值的效用大于对带有风
险的相等的损益期望值的效用。 决策者的态度是风险厌恶型。 如图中的B曲线。 B曲线上凸越厉害,表示讨厌风险的程度越高。

大型工程决策-第三章 随机性决策问题与效用函数

大型工程决策-第三章 随机性决策问题与效用函数

贝叶斯决策规则
贝叶斯风险r( ,最 ) 小的L(策, )略(x(| )d损 失最小)
正规型,
r( , ) L( , (x)) ( | x)
扩展型
扩展型贝叶斯决策问题分析步骤
获得原始自然状态信息的主观概率估计 获得关于原始自然状态的试验估计 自然状态与行动方案的损失函数确定 计算后验概率或密度 确定最优行动:即预测自然状态不同时的
**由于该方法误差积累,一般不再进一步划分
相对似然法
在事件的不确定量区间中,要求决策者首先确定“最可能” 和“最不可能”的量,然后询问“最可能”量的可能性是 “最不可能”量的可能性的几倍-相对似然性,再对其他 量进行相对似然性估计,由此得到非正常先验密度曲线 (密度积分不等于1,故非正常)。
例如,关于某产品明年的销售量,在1000~10000件之间, 最可能是5000件,最不可能是9000件,最可能发生5000件 的可能性是最不可能9000件的4倍,于是得到5000对9000的 相对似然。继续问4000件与8000件的相对似然性。。。
行动规则-显然它是一种随机应变的。
一个贝叶斯分析案例
某油井公司拥有一块油田,当前该公司可以采取 的措施为:a1:自己钻采; a2:无条件出租,租 金45万;a3:有条件出租,租金依照产量而定, 产油在20万桶或以上,每桶提成5元,产量不足20 万桶不受租金。

决策理论与方法(ppt 177页)实用资料

决策理论与方法(ppt 177页)实用资料
事态体理论与期望效用理论的差别在于价值函数代替了效用函数决策权重decisionweightshogarthandeinhorn1990年代替了主观概率kahnemanandtversky1979年目前在风险研究领域中一个重要发展方向是关于风险收益模型riskreturnmodels的研究我们知道在一个同时包含风险和收益的决策问题中如马尔可夫证券组合决策问题中将收益和风险同时考虑进行决策的难度现在还没有一个一般的通用准则帮助决策者在非被支配方案间进行选择而风险收益模型是将风险和收益表示在一个函数中
• 未来的发展,首先是建立决策公理化体系,如决策及 其解的定义、知识和理论方法的公理化建设等。其次,
多目标规划理论(向量极值)已深入到一般偏序和无 限维目 标的抽象空间中,新的更实用的决策模式与方
法将兴起;把计算机专家系统和多目标决策结合起来,
即研究具有自动决策支持功能的专家系统、计算机支 持合作工作 CSCW(Computer Supported Cooperative Work)的研究与应用也将逐渐开展起来;多目标动态 决策、时序决策、信息不对称决策、风险(不确定性) 决策和非线性决策等问题的研究也将迅速发展起来。
个单目标决策问题。
• 目前关于决策分析主要困扰人们的问题是决策 复杂性的处理和研究,这里的复杂性 (Complexity)是指实际决策背景往往比决策 分析模型要复杂;复杂性的 研究主要是分析其 从哪些方面影响决策过程和决策模型,以及决 策过程和模型在哪些方面不能满足实际决策问 题的复杂性要求。从概念上来说,决策复杂性 可以分为 规范复杂性、描述复杂性和沟通复杂 性。规范和描述复杂性与决策分析中的规范性 研究和描述性研究相对应,而沟通复杂性是指 在决策分析研究中存在的学科交叉问 题。

决策理论与方法第三章效用函数

决策理论与方法第三章效用函数
◦ 对展望空间中的任意展望P1、P2,P1>P2 当且仅 当 u(P1)>u(P2)
◦ u(P1+(1-)P2)= u(P1)+(1-)u(P2) (复合展望的 效用等于展望效用的复合)
◦ 对满足上述条件的实值函数u1, u2, 必有 u1(Pi)=bu2(Pi)+c, 其中b, c∈R1,b>0。(任意两 个决策人的效用是线性相关的)
Hicks对效用函数的基数性和序数性的比喻:如果知 道两个人的身高,那么我们可以把高个儿排在第一 位;如果不知道他俩的身高也没关系,让他们比一 下就可以了。
第二节 效用函数的构造
一、估计效用函数值的方法
概率当量法(Von Neumann, Morgenstern,N-M法):
设决策系统的自然状态集Θ={1,…, n}、行动集 A={a1, …,am}、后果集C={cij=c(ai,j)},最优后果为
抽奖a2
0.89 0.10 0.01 决策A
50万元 250万元 0元
抽奖b1 抽奖b2
0.11
50万元 0万元
0.10 0.90
决策B
250万元 0元
实际上决策B是在决策A的基础上同时减去了89% 的机会获得50万元,复合保序性没有得到满足
效用的公理化定义:在上述公理系统中,
若展望空间上存在实值函数u,有:

微观经济学第03章效用论-PPT精选文档

微观经济学第03章效用论-PPT精选文档
2019/3/19 12
序数效用(Ordinal Utility)
从20世纪30年代开始,逐步为西方经济学 家们所采用。 核心观点:效用只能用序数来表示。效用 作为一种心理现象无法计量,也不能加总求和 提出消费者偏好的概念,以序数来度量效 用,所受到的限制较少。 分析方法:无差异曲线分析法。
2019/3/19 13
• 经济人(或理性人)假设:是指人们的一切行 为都是理性的(Rational),利己的,都以个 人效用最大化为基本动力。
– 人是理性的; – 人是自私(利)的,追求效用的最大化
• 理性人+看不见的手=传统经济学
2019/3/19 5
违背人性的道德说教后果如何呢?
• 苹果案例:大小苹果两人分
– 以自利为目的谈判具有双方同意的均衡点,而以利他为 目的的谈判不存在双方同意的均衡点。
• 边际概念的数学本质:导数
2019/3/19 17
表3-1 某商品的效用举例
商品数量 0 1 2 3 4 5 6 7 总效用 /TU 0 10 18 24 28 30 30 28 边际效用 /MU — 10 8 6 4 2 0 -2
2019/3/19
18
TU 40
30 20 10 0 0 1 2 3 4 5 6 7
– 1、一次性付清全部费用; – 2、先付一部分费用,每个景点另附门票。 – 采取那一套方案,游客的总效用更高。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
◦ 对展望空间中的任意展望P1、P2,P1>P2 当且仅 当 u(P1)>u(P2)
◦ u(P1+(1-)P2)= u(P1)+(1-)u(P2) (复合展望的 效用等于展望效用的复合)
◦ 对满足上述条件的实值函数u1, u2, 必有 u1(Pi)=bu2(Pi)+c, 其中b, c∈R1,b>0。(任意两 个决策人的效用是线性相关的)
◦ 则效用函数u(P)为(基数)效用函数
2021年1月9日10时55分
四、效用函数—基数性和序数性
前述定义的效用是一种基数效用,不仅能够反映决 策者的偏好次序,还能够反映决策者的偏好强度。
但在实际决策中,有时只需要偏好次序而不一定需 要知道偏好强度就可以决策。此时只需要序数效用 就可以了。有关序数效用的应用在多属性决策中介 绍。
且复合不会破坏原有的优劣关系 ◦ 偏好的有界性:展望的优劣是相对的,没有无
限优的展望,也不存在无限劣的展望。
理性行为公理认为合乎理性的决策人在进 行价值判断时一定能满足这些公理。(实 际决策中是否存在某种悖论呢?)
2021年1月9日10时55分
Allais悖论
抽奖a1
1.0
50万元
抽奖a2
0.89 0.10 0.01 决策A
策系统的自然状态集Θ={1,…, n}、行动集A={a1, …,am}、 后果集C={cij=c(ai,j)},最优后果为c*=max {cij},最劣后
果为c0=min {cij}。则对于任意后果cij的效用值u(cij),可按 以下步骤获得: ◦ 设u(c*)=1, u(c0)=0; ◦ 建立简单展望<p,c*;1-p,c0>,p可调 ◦ 反复向决策人提问,改变可调概率p,使得当p=pij时得
50万元 250万元 0元
抽奖b1 抽奖b2
0.11 0.89
50万元 0万元
0.10 0.90
决策B
250万元 0元
实际上决策B是在决策A的基础上同时减去了89% 的机会获得50万元,复合保序性没有得到满足
2021年1月9日10时55分
效用的公理化定义:在上述公理系统中, 若展望空间上存在实值函数u,有:
决策的目标就是使期望效用极大化。
二、效用基本概念及符号 ◦ 严格序>:a>b表示a优于b。满足传递性和非对称性。 ◦ 无差异~:a~b表示a与b无差异。满足自反性、对称性和 传递性。 ◦ 弱序≥:a≥b表示a不劣于b。满足可比性、传递性、与无 差异~的一致性和严格优于的一致性。 ◦ 展望(prospect)(可能的前景):各种后果(r种)及后果出 现的概率的组合,记为:Pj=<p1(j),c1;p2(j),c2;…;pr(j),cr>, (j=1,2,…,m; m为行动的可能种数)
2021年1月9日10时55分
◦ 复合展望:当无法确定采取某个行动时, 可随机选择一种行动,设选择行动aj的概率 为qj。则决策的展望就是一种复合展望,记 为P=<q1, P1; q2, P2;…;qm,Pm>。所有展望 (包括简单展望和复合展望)构成展望空 间。
2021年1月9日10时55分
抽奖(lottery)与确定当量
例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个 人,身无分文时的100元,与已有10000元再增加100元的作用不同, 这是钱的边际价值问题。
例2:
礼品a1
1.0
10万元
抽奖a2
0.5
25万元
0.5
0元
在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望 收益大但风险也大!不同的决策人有不同的选择,相同的决策人在不 同的情境下选择也不同。那么在决策中如何描述或表达后果对决策人 的实际价值,以便反映决策人心目中对各种后果的偏好次序呢?
到如下的无差异关系:cij~<pij,c*;1-pij,c0> ◦ 测得后果cij的效用值为:
u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij
2021年1月9日10时55分
确定当量法(修正N-M法): ◦ 设u(c*)=1, u(c0)=0; ◦ 建立简单展望<p,c*;1-p,c0>,p为0-1间的给定值,如 p=0.5 ◦ 反复向决策人提问,改变cij得到如下的无差异关系: cij~<p,c*;1-p,c0> ◦ 测得后果cij的效用值为: u(cij)=p*u(c*)+(1-p)*u(c0)=pij
第三章 效用函数
第一节 效用的定义和公理系统
一、引言
·为什么要引入效用
决策问题的特点:自然状态不确定——以概率表示;
后果价值待定:以效用度量。
1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数 值度量;
2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的 价值因人而异。
1.0
C1
p
C2
若 C1 ( p, C2 ; (1 p), C)3
1-p
C3
则称 确定性后果 为抽奖的确定当量
效用的定义
◦ 若展望空间上的实值函数u对于展望空间P
的任意两个展望P1、P2,有P百度文库≥P2 当且仅当
u(P1)≥u(P2),则称u为效用函数
三、效用存在性公理(理性行为公理)
◦ 连通性:任意两个展望的优劣都是可比的 ◦ 传递性:展望的优劣满足传递性 ◦ 复合保序性:展望的优劣关系是可以复合的,
Hicks对效用函数的基数性和序数性的比喻:如果知 道两个人的身高,那么我们可以把高个儿排在第一 位;如果不知道他俩的身高也没关系,让他们比一 下就可以了。
2021年1月9日10时55分
第二节 效用函数的构造
一、估计效用函数值的方法 概率当量法(Von Neumann, Morgenstern,N-M法):设决
2021年1月9日10时55分
*偏好次序是决策人的个性与价值观的反映,与决策人所 处的社会、经济地位,文化素养,心理和生理(身体)状态 有关。
* 除风险偏好之外,还有时间偏好。
而效用(Utility)就是偏好的量化,是数(实值函数).
Daniel Bernoulli 在1738年指出:
若一个人面临从给定行动集(风险性展望集)中作选择的 决策问题,如果他知道与给定行动有关的将来的自然状态, 且这些状态出现的概率已知或可以估计,则他应选择对各 种可能后果的偏好的期望值最高的行动。
相关文档
最新文档