效用函数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2) 即使有一个明确的标度可以测量后果, 按这个标度测得的量也可能并不反映后果对 决策人的真正价值。
3.1 引言
例3.1 考虑钱对同一个人的价值。假设一个学生手头紧张,正好有机会挣 100元钱,但是所要做的是他相当讨厌的工作。
(1)如他经济情况差,他会认为100元钱的实际价值足够大,所要做的 工作即使是相当讨厌的,他仍会去干;
第3章 效用函数
3.1 引言 3.2 效用的定义和公理系统 3.3 效用函数的构造 3.4 风险与效用 3.5 货币的效用 3.6 阿莱斯悖论(Allais’s paradox)
3.1 引言
在定量评价可能的行动的各种后果时, 会遇到两个主要问题:
(1) 后果本身是用语言表述,可能没有任何 合适的直接测量标度。
1.0
1000 优于
0.5 0
在例3.2的决策问题中,后果集 C={1000, 2500, 0},采取行 动a1和a2时的展望分别是:
P1=<1.0, 1000; 0,2500; 0,0> P2=<0, 1000; 0.5,2500; 0.5,0>
(4) 展望(prospect)
展望既考虑各种后果Ci,又考虑了各种后果出现的概率 (客观概率pi或主观概率πi), 全面地描述了在决策问题中 采取某种行动的可能前景。
一、效用的基本概念与符号
(3) 弱序“≥” 记作aRb,含义是“a不劣于b”,亦即a
优于或者无差异于b。
一、效用的基本概念与符号
(4) 展望(prospect)
展望指决策的可能的前景,即各种后果及后果出
现的概率的组合,记作P= <p1,c1; p2,c2;…; pr,cr; > .
2500 0.5
二、效用的定义
根据上述讨论和记号,可以初步给出效用函数的定义 如下。
定义3.1 在集合P上的实值函数u,若它和P上的优先关 系≥一致,即:
若 P1,P2属于 P ,P1≥ P2当且仅当u(P1)≥u(P2) ,则 称u为效用函数。
•把效用函数定义在展望集P上而不是定义在后果集C上, 是为了使效用函数能够反映决策人对风险的态度。
3.1 引言
由上面例子可知:在进行决策分析时,存在如何描述 或表达后果对决策人的实际价值,以便反映决策的人 心目中各种后果的偏好次序(preference order)的问 题。
偏好次序是决策人的个性与价值观的反映,它与决策 人所处的社会地位、经济地位、文化素养、心理和生 理(身体)状态有关。
Gustason认为,要避免矛盾,必须对期望值概念进 行限制,其一是限制其结果的数目;其二是把其结果 值的大小限制在一定的范围内。
这是典型的结果有限论,这一观点是从实际出发的。 因为实际上,游戏的投掷次数总是有限的数。
比如对游戏设定某一个投掷的上限数L,在投掷到这个 数的时候,如果仍然没有成功,也结束游戏,不管你 还能再投多少,就按照L付钱。因为你即便不设定L, 实际上也总有投到头的时候,人的寿命总是有限的, 任何原因都可以使得游戏中止。现在设定了上限,期 望值自然也就可以计算了。
3.2.3 效用的公理化定义和效用的存在性
3.2.3 效用函数的存在性
3.2.4 基数效用与序数效用
基数:为实数,如1,2,3,π 序数:如第一,二,…,4,3,2,1
基数性效用函数与序数效用函数区别:
基数效用定义在展望集P上(考虑后果及其概率分布),是实数; 序数效用定义在后果集C上,不涉及概率,可以是整正数.
⑴ 概率当量法
2.离散型后果的效用设定
后果为离散型随机变量时,后果集C 中元素为有限个,构造后果集上的 效用函数有两方面的内容: (1)确定各后果之间的优先序; (2)确定后果之间的优先程度。
离散型后果效用值的设定可以采用 概率当量法,简称NM法。
NM法步骤如下:
例3.6
例3.6 天气预报说球赛时可能有雨,一个足球爱好者要决定是否去球场看球。
(2)如他先有了10000元,要为100元钱去干这份让他讨厌的工作, 他就很可能不干了。
实际价值
0
100
钱 100000 100100
这个例子说明:即使是数值量表示的后果,它对决策人的实际价值仍有待确定。
3.1 引言
例3.2 决策人面临图3.1中决策树所示的选择:
①确定收入礼品1000元;
②参与一次抽奖:有50%的机会得0元,50%的机会得2500元。
圣彼得堡悖论的解释2:
(二)风险厌恶论
圣彼得堡悖论对于奖金额大小没有限制。 比如连续投掷40次才成功的话,奖金为1.1万亿元。但是这一奖
金出现的概率极小,1.1万亿次才可能出现一次。实际上,游戏 有一半的机会,其奖金为 2元,四分之三的机会得奖4元和2元。 奖金越少,机会越大,奖金越大,机会越小。 Hacking(1980)所说:花25元的费用冒险参与游戏将是非常 愚蠢的,虽有得大奖的机会,但是风险太大。 因此,考虑采用风险厌恶因素的方法可以消解矛盾。Pual Weirich就提出在期望值计算中加人一种风险厌恶因子,并得出 了游戏费用的有限期望值,认为这种方法实际上解决了该悖论。
圣彼得堡悖论的解释3:
(三)效用上限论
也有一种观点认为奖金的效用可能有一个上限,这样,期望效用 之和就有了一个极限值。Menger认为效用上限是惟一能消解该悖论 的方法。设效用值等于货币值,上限为100 单位,则游戏的期望效用 为7.56l25,如表3所示。
圣彼得堡悖论的解释4:
(四)结果有限论
满足程度越高,效用越大; 满足程度越低,效用越小。
对效用的理解:《最好吃的东西》
兔子和猫争论,世界上什么东西最好吃。 兔子说,“世界上萝卜最好吃。萝卜又甜又脆又解渴,我一想起
萝卜就要流口水。” 猫不同意,说,“世界上最好吃的东西是老鼠。老鼠的肉非常嫩,
嚼起来又酥又松,味道美极了!” 兔子和猫争论不休、相持不下,跑去请猴子评理。 猴子听了,不由得大笑起来:“瞧你们这两个傻瓜蛋,连这点儿
圣彼得堡悖论的解释1:
(一)边际效用递减论
Daniel Bernoulli在提出这个问题的时候就给出一种解决办 法。他认为游戏的期望值计算不应该是金钱,而应该是金钱的期
望效用,即利用众所周知的“期望效用递减律”,将金钱的效用 测度函数用货币值的对数来表示:效用=log(货币值),如表 2所 示。所有结果的效用期望值之和将为一个有限值log(4)≈ 0.60206,如果这里的效用函数符合实际,则理性决策应以4元 为界。
礼品a1 抽奖a2
1.0
1000 有人选确定性的1000元的收入。抽
奖的期望值虽大,风险也大,实际价
值还不如保险的1000元。
2500
0.5
而有人认为礼品不如抽奖,因为
抽奖提供了获得2500元的机会。
0.5 0
图3.1 例3.2的决策树
这个例子说明:决策人的风险态度影 响其对后果的实际价值判断。
看球 a1 看电视a2
(1 ) ( 2 )
( 1 ) ( 2 )
c1下雨看球 c2无雨看球 c3下雨看电视 c4无雨看电视
首先作该问题的决策树如图所示。由题意可知决策人对四种后果优劣的排序是: c2c3c4c1。
步骤:
第一步: 令u(c1)=0, u(c2)=1。 第二步: 询问决策人,下雨在家看电视这种后果与去球
பைடு நூலகம்递性推导:
P1
P2
αP1+(1-α)P1 αP2+(1-α)P2
αP1+(1-α)P3 αP2+(1-α)P3
公理3.3表明两个有序的展望各有相同的比例 (1 ) 被相等的量 (1 )P3 替代后,优先关系不变.
例3.3 横过马路问题:效用有界性证明
3.3 效用函数的构造
1.估计效用函数值的方法 2.离散型后果的效用设定 3.连续型后果的效用函数构造 4.用解析函数近似效用曲线
1.估计效用函数值的方法
⑴ 概率当量法 ⑶ 增益当量法
⑵ 确定当量法 ⑷ 损失当量法
从纯理论角度看,这四种方法并没有实质性的区别; 但是实验结果表明,使用确定当量法时决策人对最优 后果(增益)的保守性和对损失的冒险性都比概率当 量法严重(Hershey,1982);采用增益当量法与损 失当量法时产生的误差也比用概率当量法大,因此只 要有可能,应该尽可能使用概率当量法。
3.2.2 效用存在性公理
定义3.1给出了效用函数的最基本性质,这就是 可以根据它的大小来判断展望P的优劣。
但是这样的效用函数是否一定存在呢?回答是 不一定。
至于决策人的价值判断在满足什么条件时存在 与之一致的效用函数,von NeumannMorgenstern (1944)给出了效用的存在性公理, 又称理性行为公理。
复合展望
一、效用的基本概念与符号
(5) 抽奖与确定当量 由机会点和该机会点发出的n个机会枝的概率及相应后
果构成的图形称为抽奖(lottery),抽奖又称彩票。
1.0
C1
p
C2
1-p
C3
若C1 ~ (p, C2; (1-P),C3), 则称 确定性后果C1为抽奖(p, C2; (1P),C3)的确定当量(certainty equivalent)。
基数效用反映偏好强度(正线性变换下唯一, 即原数列可变换 为:b+c, 2b+c, 3b+c, 100b+c; 其中 b, c ∈R1, b>0. )
序数效用不反映偏好强度,(保序变换下唯一), 原序数列可变 换为16,9,4,1;或 8,6,4,2,或10,7,6,1等.
3.2.4 基数效用与序数效用
效用就是偏好的量化,是数(实值函数)。
1738年,Daniel Bernoulli就指出:若一个人面临从给定 行动集(风险性展望集)中作选择的决策问题,如果他知 道与给定行动有关的将来的自然状态,且这些状态出现 的概率已知或可以估计,则他应选择对各种可能后果的 偏好的期望值最高的行动。
一、效用的基本概念与符号
3.2 效用的定义和公理系统
3.2.1 效用的定义 3.2.2 效用存在性公理 3.2.3 效用的公理化定义和效用的存在性 3.2.4 基数效用与序数效用
3.2.1 效用的定义
效用(utility):消费者从消费商品中得 到的满足程度。
效用完全是消费者的一种主观心理感受。
基数(cardinal number)效用:边际效用分析方法
总效用(TOTAL UTILITY,TU) :消费者在一定时间内 从一定数量商品的消费中所得到的效用量的总和 ;
边际效用(MARGINAL UTILITY,MU):消费者在一定 时间内增加一单位商品的消费所得到的效用量的增量.
序数(ordinal number)效用:无差异曲线分析方法 希克斯认为,效用的数值表现只是为了表达偏好的 顺序,并非效用的绝对数值。现在比较通用的是序 数效用。
(1) 严格序“ ” a b(或者记作aPb)的含义是“a优于b”( a
is preferred to b );也就是说,若非外界因素 的强迫,决策人只会选择a而不会选择b。
一、效用的基本概念与符号
(2) 无差异“~” a~b(或记作aIb)的含义是“a无差异于b”
(a is indifference to b);也就是说,决策人 对选择或同样满意。
圣彼得堡悖论 (St. Petersburg Paradox/game)
圣彼得堡悖论是数学家丹尼尔·伯努利(Daniel Bernoulli)的表 兄尼古拉·伯努利(Nicolaus Bernoulli)在1738提出的一个概率 期望值悖论,它来自于一种掷币游戏,即圣彼得堡游戏(表1)。
问题:你愿意花100元来参加一次圣彼得堡游戏吗?
常识都不懂!世界上最好吃的东西是什么?是桃子!桃子不但美 味可口,而且长得漂亮。我每天做梦都梦见吃桃子。” 兔子和猫听了,全都直摇头。那么,世界上到底什么东西最好吃?
以上的故事说明效用完全是个人的心理感觉。 不同的偏好决定了对同一种商品效用大小的不同评价。
3.2.1 效用的定义
在决策理论中,后果对决策人的实际价值,即决策人对 后果的偏好次序是用效用(utility)来描述的。
相关文档
最新文档