效用函数

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据上述讨论和记号,可以初步给出效用函数的定义如 下。
定义3.1 在集合P上的实值函数u,若它和P上的优先关 系≥一致,即:
若 P1, P2属于 P ,P1≥ P2当且仅当u(P1)≥u(P2) ,则 称u为效用函数。
•把效用函数定义在展望集P上而不是定义在后果集C上,是
为了使效用函数能够反映决策人对风险的态度。
假设一个学生手头紧张,正好有机会挣100元钱,但是所要做的是他相 当讨厌的工作。
1)如他经济情况差,他会认为100元钱的实际价值足够大,所要做的 工作即使是相当讨厌的,他仍会去干;
2)如他先有了10000元,要为100元钱去干这份让他讨厌的工作,他就 很可能不干了。
问题一:1)、2)中后果的数值分别是多少? 问题二:1)、2)中后果的实际价值哪个大?
(1) 严格序“ ” a b(或者记作aPb)的含义是“a优于b”( a
is preferred to b );也就是说,若非外界因素 的强迫,决策人只会选择a而不会选择b。
一、效用的基本概念与符号
(2) 无差异“~” a~b(或记作aIb)的含义是“a无差异于b”
(a is indifference to b);也就是说,决策人 对选择或同样满意。
效用就是偏好的量化,是数(实值函数)。 1738年,Daniel Bernoulli就指出:若一个人面临从给定
行动集(风险性展望集)中作选择的决策问题,如果他知 道与给定行动有关的将来的自然状态,且这些状态出现 的概率已知或可以估计,则他应选择对各种可能后果的 偏好的期望值最高的行动。
一、效用的基本概念与符号
Allais悖论:a1和a2的优先关系与 b1和b2优先关系相对应(替代性)
P(a1)=500*1 + 2500*0 + 0*0 =500 P(a1)=500*0.11 + 2500*0 + 0*0+500*0.89 =500 P(b1)=500*0.11 +2500*0 + 0*0.89=55
P(a2)=500*0.89 + 2500*0.1 + 0*0.01 =695 P(a2)=500*0 + 2500*0.1 + 0*0.01+ 500*0.89 =695 P(b2)=500*0 +2500*0.1 + 0*0.01+0*0.89=250
3.2.2 效用存在性公理
式(3.3)推导:
P1
P2
αP1+(1-α)P1 αP2+(1-α)P2
αP1+(1-α)P3 αP2+(1-α)P3
公理3.3表明两个有序的展望各有相同的比例
被相等的量
替代后,优先关系不变.
例3.3 横过马路问题:效用有界 性证明
例3.5 Allais悖论:对预期效用 的独立性公理的挑战
首先作该问题的决策树如图所示。由题意可知决策人对四种后果优劣的排序是 :c2 c3 c4 c1。
步骤:
第一步: 令u(c1)=0, u(c2)=1。
第二步: 询问决策人,下雨在家看电视这种后果与去球
场看球有多大概率下雨被淋相当,若决策人的回答是
0.3,则c30.7 c2+0.3c1,u(c3)=0.7u(c2) =0.7。
Allais悖论:
P(a1)=500*1 + 2500*0 + 0*0 =500 P(a2)=500*0.89 + 2500*0.1 + 0*0.01 =695
P(b1)=500*0.11 + 2500*0 + 0*0.89=55 P(b2)=500*0 + 2500*0.1 + 0*0.9=250
(1)后果的损失严重程度; (2)出现损失的可能性的大小.
一般的,可以用以下几种指标来度量风 险。
(1)方差
(2)自方差
(3)临界概率
(4)Fishburn的风险定义
3.4.2 效用函数包含的内容
1.对风险的态度 2.对后果的偏好强度 3.可测价值函数
1.对风险的态度
如图所示为几种典型的效 用函数曲线。曲线A是下凹的 ,曲线N是线性的,曲线P是凸 函数。这三种形状的曲线分别 反映了决策人的三种风险态度 :风险厌恶(risk aversion)、风 险中立 (risk neutralness)和风 险追求 (risk proneness)。
例子说明:即使是数值量表示的后果,它对决策人的实际价值仍有待确定。
3.1 引言
例3.2 决策人面临图3.1中决策树所示的选择:① 收入礼品1000元,或是②参与一次抽奖:有50% 的机会得0元,50%的机会得2500元。
有人选确定性的1000元的 收入。抽奖的期望值虽大,风 险也大,实际价值还不如保险 的1000元。而有人认为礼品不 如抽奖,因为抽奖提供了获得 2500元的机会。
3.2.3 效用的公理化定义和效用 的存在性
3.2.3 效用函数的存在性
3.2.4 基数效用与序数效用
基数:为实数,如1,2,3,π 序数:如第一,二,…,4,3,2,1 基数性效用函数与序数效用函数区别:
1.基数效用定义在展望集P上(考虑后果及其概率分布), 是实数;序数效用定义在后果集C上,不涉及概率,可 以是整正数. 2.基数效用反映偏好强度:(正线性变换下唯一)
P1=<1.0, 1000; 0,2500; 0,0> P2=<0, 1000; 0.5,2500; 0.5,0>
(4) 展望(prospect)
展望既考虑各种后果Ci,又考虑了 各种后果出现的概率(客观概率pi或主 观概率πi), 全面地描述了在决策问题 中采取某种行动的可能前景。
复合展望
一、效用的基本概念与符号
⑴ 概率当量法
2.离散型后果的效用设定
后果为离散型随机变量时,后果集C 中元素为有限个,构造后果集上的 效用函数有两方面的内容: (1)确定各后果之间的优先序; (2)确定后果之间的优先程度。
离散型后果效用值的设定可以采用 概率当量法,简称NM法。
NM法步骤如下:
例3.6
例3.6 天气预报说球赛时可能有雨,一个足球爱好者要决定是否去球场看球。
3.1 引言
由上面两个例子可知:在进行决策分析时,存 在如何描述或表达后果对决策人的实际价值, 以便反映决策的人心目中各种后果的偏好次序 (preference order)的问题。
偏好次序是决策人的个性与价值观的反映,它 与决策人所处的社会地位、经济地位、文化素 养、心理和生理(身体)状态有关。
原数列可变换为:b+c, 2b+c, 3b+c, 100b+c; 其中 b, c ∈R1, b>0. 而序数效用不反映偏好强度,(保序变换下 唯一), 原序数列可变换为16,9,4,1;或 8,6,4,2,或10,7,6,1 等.
3.2.4 基数效用与序数效用
基数(cardinal number)效用:边际效用分析方法 --总效用(TOTAL UTILITY,TU) :消费者在一 定时间内从一定数量商品的消费中所得到的效用量 的总和 ; -- 边际效用(MARGINAL UTILITY,MU):消费 者在一定时间内增加一单位商品的消费所得到的效 用量的增量.
序数(ordinal number)效用:无差异曲线分析方法 希克斯认为,效用的数值表现只是为了表达偏好的 顺序,并非效用的绝对数值。现在比较通用的是序 数效用。
无差异曲线(Indifference curve)
含义:无差异曲线表示对消费者没有区别的商品组合的点的轨迹 。即无差异曲线是用来表示两种商品或两组商品的不同数量的组 合对消费者所提供的效用是相同的。
一、效用的基本概念与符号
(3) 弱序“≥” 记作aRb,含义是“a不劣于b”,亦即a优
于或者无差异于b。
一、效用的基本概念与符号
(4) 展望(prospect) 展望指决策的可能的前景,即各种后果及后果出 现的概率的组合,记作P= <p1,c1; p2,c2;…; pr,cr; > .
在例3.2的决策问题中,后果集 C={1000, 2500, 0},采取行 动a1和a2时的展望分别是:
(5) 抽奖与确定当量
由机会点和该机会点发出的 n 个机会枝的概率及相应
后果构成的图形称为抽奖(lottery),抽奖又称彩票。
若C1 ~ (p, C2; (1-P),C3), 则称 确定性后果C1为抽奖(p, C2; (1-P),C3)的确定当量(certainty equivalent)。
二、效用的定义
效用函数
2020年5月24日星期日
3.1 引言
在定量评价可能的行动的各种后果时, 会遇到两个主要问题:
(1) 后果本身是用语言表述,可能没有任 何合适的直接测量标度。
(2) 即使有一个明确的标度可以测量后果 ,按这个标度测得的量也可能并不反映 后果对决策人的真正价值。
3.1 引言
例3.1 考虑钱对同一个人的价值。
3.2 效用的定义和公理系统
3.2.1 效用的定义 3.2.2 效用存在性公理 3.2.3 效用的公理化定义和效用的存在性 3.2.4 基数效用与序数效用
3.2.1 效用的定义
效用:商品满足人的欲望的能力和消费者在消费商品时 所感受到的满足程度.
在决策理论中,后果对决策人的实际价值,即决策人对 后果的偏好次序是用效用(utility)来描述的。
3.2.2 效用存在性公理
定义3.1给出了效用函数的最基本性质,这就 是可以根据它的大小来判断展望P的优劣。
但是这样的效用函数是否一定存在呢?回答是 不一定。
至于决策人的价值判断在满足什么条件时存在 与之一致的效用函数,von NeumannMorgenstern (1944)给出了效用的存在性公理 ,又称理性行为公理。
特征: (1) 无差异曲线是是一条凸向原点,并向右下方倾斜的曲线,其斜 率为负值,它表明在收入与价格既定的条件下,为了获得同样的 满足程度,增加一种商品消费时就必须放弃或减少另一种商品的 消费。 (2) 两种商品在消费者偏好不变的条件下,不能同时减少或增多。 在同一平面图上有无数条无差异曲线,同一条无差异曲线代表同 样的满足程度,不同的无差异曲线代表不同的满足程度,离原点 越远,满足程度越大,反之则越小。 (3) 在同一平面图上,任意两条无差异曲线不能相交,否则与第二 点矛盾。
4.用解析函数近似效用曲线
为了分析和运算方便,分析人员通常希 望能够用某种解析函数式u(x)来近似地表 达效用。
常用的函数有幂函数和对数函数.
3.4 风险与效用
3.4.1 风险的含义 3.4.2 效用函数包含的内容 3.4.3 相对风险态度
3.4.1 风险的含义
风险包含有两个方面的内容:
3.3 效用函数的构造
1.估计效用函数值的方法 2.离散型后果的效用设定 3.连续型后果的效用函数构造 4.用解析函数近似效用曲线
1.估计效用函数值的方法
⑴ 概率当量法 ⑶ 增益当量法
⑵ 确定当量法 ⑷ 损失当量法
从纯理论角度看,这四种方法并没有实质性的区别 ;但是实验结果表明,使用确定当量法时决策人对最 优后果(增益)的保守性和对损失的冒险性都比概率 当量法严重(Hershey,1982);采用增益当量法与损 失当量法时产生的误差也比用概率当量法大,因此只 要有可能,应该尽可能使用概率当量法。
3.连续型后果的效用函数构造
当后果c为连续变量时,上述方法就不再 适用。
但是如果能通过分析找到u(c)的若干特征 值,求特征点的效用后,再连成光滑曲 线;
或者u(c)是连续、光滑的,则可以分段构 造u(c)。
每天学习时间与效用
•随着学习时间的增加,效用值也会有所增加 •但是由于进入状态需要一定的时间,所以在t较小时,效用的增加较慢; •过了一小段时间后,效用与所化时间基本上是线性关系; •随着学习时间的不断增加,人会疲劳,效率会下降; •时间太长,这时的效果不如时间适度,即存在效用值最大的点tm; •再增加学习时间又会从效用最大值处下降。其中与效用最大值对应的tm是因人 而异。 •由于效用函数的惟一性(即在正线性变换下惟一,见效用的公理化定义),效用的 值域可以是整个实轴,而不必限于[0,1]区间。
第三步:询问决策人,无雨看电视这种后果与去球场看
Байду номын сангаас
球有多大概率下雨被淋相当,若决策人的回答是0.6,
则c40.4c2+0.6c1,得u (c4)=0.4c2=0.4。
第四步:
进行一致性校验。c30.4c2+0.6c4,则
u’(c3)=0.64≠0.7。重复二、三,若u(c3)不变,则调整
u(c4)=0.5,决策人仍认为c30.4c2+0.6c4,则通过校验。
相关文档
最新文档