期望效用值
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
θ1 ≻ θ 3 ≻ θ 2
θ 则必存在 p ∈ [0,1] ,使当 x = p 时, 3 ~ (θ 1 ,θ 2 ; p )
θ 事实上, 3 ~ (θ 3 ,θ 2 ;1) 。应用假设2即可得到证明。
两个定理― Step.3 两个定理―决策分析的理论基础
定理1 设 T1 = (θ 1 ,θ 2 ; x) , θ 3 -必然事件, 定理1
θ1 ≻ θ 3 ≻ θ 2
θ 则必存在 p ∈ [0,1] ,使当 x = p 时, 3 ~ (θ 1 ,θ 2 ; p )
事实上, 3 ~ (θ 3 ,θ 2 ;1) 。应用假设2即可得到 θ 证明。
•
把随机事件转化为确定性事件。
两个定理― Step.3 两个定理―决策分析的理论基础
定理1 设 T1 = (θ 1 ,θ 2 ; x) , θ 3 -必然事件, 定理1
目的:
把决策的准则从期望收益值推广到期望效用值。
重点:
期望效用值准则的建立。
难点:
一个概念,三个假设,两个定理
Review 10.1 期望收益值
决策问题的分类
–风险型决策分析 风险型决策分析 –非确定型决策分析 非确定型决策分析 –多目标决策分析 多目标决策分析
风险型决策问题
一般地,假设有 个备选方案 个备选方案A 一般地,假设有m个备选方案 i (i=1,2,…,m),n , 个自然状态,各自然状态出现的概率分别为p 个自然状态,各自然状态出现的概率分别为 1, p2, …, pn.各方案可表示为 各方案可表示为 Ai (θi1,θi2,…,θin; p1, p2, …, pn),i=1,2,…,m ,
解释:把简单事态体转化为标准事态体。 q1 θ* θ* p1 θ1 p1 q2 θ* p2 p2 θ2 T~ ~ θ* θ j ~ (θ * ,θ* ; q j ) ⋮ ⋮ qn * θ pn θ p
n n
p1q1 p 1 (1 − q 1 ) θ
*
θ*
~
p 2 (1 − q 2 ) θ
⋮
⋮*
θ*
假设3 假设3
无差关系、优越关系的传递性 无差关系、
T1 ~ T2 , T2 ~ T3 ⇒ T1 ~ T3 T1 ≻ T2 , T2 ≻ T3 ⇒ T1 ≻ T3
两个定理― Step.3 两个定理―决策分析的理论基础
定理1 设 T1 = (θ 1 ,θ 2 ; x) , θ 3 -必然事件, 定理1
Ai (θi1 , θi 2 ,..., θ in ; p1 , p2 ,..., pn ), i = 1, 2,..., m
从统计学的角度出发,用数学期望来权衡方案 的各种可能结果,期望从多次决策中取得的平均收 益最大。计算公式为
E (Ai ) = ∑ p jθij
j =1
n
取方案 Ak
E ( Ak ) = max E ( Ai )
分析、比较各种事态体的办法及推导效用函数的基本途 径是辩优。
一个概念― Step.1 一个概念―偏好关系
对于后果集 J = {θ 1 ,θ 2 , ⋯ ,θ n } 中任意两个 可能的结果 x 和 y ,总可以按照既定目标的需 要,前后一致地判定其中一个不比另一个差。
x≻ y( x
不比
y 差)
一个概念― Step.1 一个概念―偏好关系
(θ 1 ,⋯θ n ; p1 ,⋯ p n ) ~ (θ * ,θ * ; p)
n j =1
其中,
p = ∑ p jq j
qj
为 θ j 关于 θ * 与 θ * 的无偏概率
i
θ * ≺ min{θ i }
θ * ≻ max{θ i }
i
作用:把简单事态体转化为标准事态体,进而可用 p进行比较以确定方案的优劣。
∀x, y ∈ J , x ≻ y ∨ y ≻ x
二者必居其一
若 记为
x ≻ y ,且 y ≻ x ,称 x 与 y 无差别, 。 x~ y
在此基础上,也可定义优越关系: x > y (优于)
Step. 三个假设― 把后果集J中结果的比 Step.2 三个假设 ― 把后果集 中结果的比 较推广到标准事态体的比较
10.2 行为假设与偏好关系
一般的风险型决策可用事态体表示: 简单事态体: 简单事态体:
T = (θ1 ,θ 2 ,...,θ n ; p1 , p2 ,..., pn )
T = (θ1 , θ 2 ; p1 , p2 )
标准事态体
复合事态体: 复合事态体:
T = (T1 , T2 ; p,1 − p )
θ1 ≻ θ 3 ≻ θ 2
θ 则必存在 p ∈ [0,1] ,使当 x = p 时, 3 ~ (θ 1 ,θ 2 ; p )
事实上, 3 ~ (θ 3 ,θ 2 ;1) 。应用假设2即可得到 θ 证明。
• 把随机事件转化为确定性事件。 • 若θ ~ (θ ,θ ; p) ,则称 p 为θ
3 1 2
1≤i ≤ m
期望收益值作为决策准则的问题
1.后果的多样性 后果可能反映直接经济效益、间接 . 经济效益,也可能是生态效益、社会效益。 2.决策往往是一次性的,采用期望后果值是否合理? .决策往往是一次性的,采用期望后果值是否合理? 3. 没有考虑决策者的主观因素 4. 不适合具有致命威胁后果的方案评价 5. 负效用
结论: 结论:
——需要一种能表述人们主观价值的衡量指标, 需要一种能表述人们主观价值的衡量指标, 需要一种能表述人们主观价值的衡量指标 而且它能综合衡量各种定量和定性的结果; 而且它能综合衡量各种定量和定性的结果; ——这样的指标没有统一的客观评定尺度,因人 这样的指标没有统一的客观评定尺度, 这样的指标没有统一的客观评定尺度 而异,视各人的经济、社会和心理条件而定。 而异,视各人的经济、社会和心理条件而定。 因此,需要探求一种较期望收益值更为完善的决 策准则。 思路:后果值换为效用值。以期望效用值 期望效用值作为 期望效用值 判别准则。 为此,先讨论行为假设与偏好关系。
Ex.2 如同Ex.1,但两组中奖数额不同。设 T1 组奖 金θ 1 = 700 元, T2 组奖金 θ 2 =400元。 1 ≻ θ 2 。两 θ 组都发行1万张。若 T1 中奖个数 n1与 T2 中奖个数 n 2 相 同(均为100个),显然 T1 ≻ T2。若 T1 组中奖个数不 是100而降为小于100的某个数,储蓄者是否有可能改 变主意?
p = ∑ p jq j
j =1
n
具体地说,对于方案集 A = { A1 , ⋯, Am }
Ai = (θi1 ,⋯θin ; p1 ,⋯ pn ), i = 1, 2,⋯ , m
Ai ~ (θ , θ* ; ∑ p j qij )
* j =1
n
θ ij ~ (θ * ,θ * ; qij )
比较
∑p q ,
3
关于θ 1 和θ 2
的无差概率 无差概率。 无差概率
Ex.3 掷硬币事件 掷出正面H(正)和掷出方面T(反)的概率均为0.5, A1(500,200;0.5),A2(200,200;0.5)。A1为风险型事件 ,A2为确定型事件。二者何为优先? 此时,A2-200元 若A2 -500元,肯定不接受A1.若A2 -0元,什么机 会也没有,接受A1。
Ex.1 两组有奖储蓄,均发行储蓄券1万张,两组 中奖者均获得同样数目奖金(400元)。所不同的, 第一组拥有可中奖彩券150张,而第二组中只拥有 可中奖彩券100张,试问你愿参加哪一个组?
假设2 假设2
(连续性) 连续性)
T1 = (θ 1 ,η ; p )
T2 = (θ 2 ,η ; q )
θ1 ≻ η
θ* p n (1 − q n ) θ*
~
⋮ pnqn
p1q1 + p2 q2 + ⋯ + pn qn
θ*
θ*
p1 (1 − q1 ) + p2 (1 − q2 ) + ⋯ + pn (1 − qn )
p1q1 + p2 q2 + ⋯ + pn qn
θ*
θ*
T
~
p1 (1 − q1 ) + p2 (1 − q2 ) + ⋯ + pn (1 − qn )
第10章 期望效用值理论 10章
西安电子科技大学 经济管理学院
—期望收益值 —行为假设与偏好关系 —效用函数及其确定 —主观期望效用值理论
本节课的内容、 本节课的内容、重点与难点
主要内容:
– 期望收益值作为决策准则有其不完善之处; – 如何从备选方案后果集中对于后果的比较转化为方案的比较,建立 备选方案比较的期望效用值准则; – 从决策理论的角度引入“效用”的概念。
即
(θ 1 ,⋯θ n ; p1 ,⋯ p n ) ~ (θ * ,θ * ; p)
p = ∑ p jq j
j =1
n
p1q1 + p2 q2 + ⋯ + pn qn
θ*
θ*
T
~
p1 (1 − q1 ) + p2 (1 − q2 ) + ⋯ + pn (1 − qn )
即
(θ 1 ,⋯θ n ; p1 ,⋯ p n ) ~ (θ * ,θ * ; p)
假设1 假设1
T1 = (θ1 ,θ 2 ; p ) T2 = (θ1 ,θ 2 ; q)
若p = q, T1 ~ T2 θ1 ≻ θ 2 ⇒ 若p > q, T1 ≻ T2
p
θ1 θ2
p=q
q
θ1 θ2
T1
T2
p>q
假设1 假设1
T1 = (θ 1 ,θ 2 ; p )
若p = q, T1 ~ T2 θ1 ≻ θ 2 ⇒ T2 = (θ 1 ,θ 2 ; q ) 若p ≻ q, T1 ≻ T2
θ2 ≻ η
θ 1 ≻ θ 2 ⇒ ∃p ′ < q ,使当 p = p ′ 时, 1 ~ T2 。 T
假设2 假设2
(连续性) 连续性)
T1 = (θ 1 ,η ; p )
T2 = (θ 2 ,η ; q )
θ1 ≻ η
θ2 ≻ η
θ 1 ≻ θ 2 ⇒ ∃p ′ < q ,使当 p = p ′ 时, 1 ~ T2 。 T
对于后果集 J = {θ 1 ,θ 2 , ⋯ ,θ n } 中任意两个 可能的结果 x 和 y ,总可以按照既定目标的需 要,前后一致地判定其中一个不比另一个差。
x≻ y( x
不比
y 差)
偏好关系“≻ ”必须满足下面三个条件: 1)自反性 x ≻ x (一个方案不会比它自己差) x ≻ y, y ≻ z ⇒ x ≻ z 2)传递性 3)完备性 任何两个结果都可以比较优劣,即
qij = u (θ ij )
θ ij 对决策主体所能提供的作用或价值,转化为它对决策 者的效用,而 qij 就是衡量这种效用大小的数值,称为效用 效用
。 u (θ ij )称为效用函数 效用函数。 效用函数
j ij j
i = 1, 2,⋯ m 之间的大小即可对方
案集进行排序,从而定出最优方案。
Key: 计算 qij
θ ij ~ (θ * ,θ * ; qij )
Key: 计算 qij
θ ij ~ (θ * ,θ * ; qij )
分析: 分析:
当 θ * ,θ * 固定时,
θ ij → qij ,即
Ex.3 掷硬币事件 掷出正面H(正)和掷出方面T(反)的概率均为0.5, A1(500,200;0.5),A2(200,200;0.5)。A1为风险型事件 ,A2为确定型事件。二者何为优先? 此时,A2-200元 若A2 -500元,肯定不接受A1.若A2 -0元,什么机 会也没有,接受A1。 参与不参与A1取决于另一个收益为确定值的方案, 此确定值在200与500之间。可以推断,从肯定不参与 到参与之间,此确定值相应有个转折点。这个转折点 就是和事态体方案A1等价的确定值,即称为等价确定 等价确定 值。
如若 A2 = 305 假设
则 A2 ≻ A1
A2 = 295 则
A2 ≺ A1
A1 ~ 300
则 A1 的等价确定值为300。
等价确定值的作用: 事态体的选择问题有可能转化为等价确定值的选择问 题。
定理10.2 定理10.2
(简化性)任一有n 种可能结果的事
Biblioteka Baidu
态体 (θ ,⋯θ ; p ,⋯ p ) 无差于某一简单事态体, 1 n 1 n 即
θ 则必存在 p ∈ [0,1] ,使当 x = p 时, 3 ~ (θ 1 ,θ 2 ; p )
θ 事实上, 3 ~ (θ 3 ,θ 2 ;1) 。应用假设2即可得到证明。
两个定理― Step.3 两个定理―决策分析的理论基础
定理1 设 T1 = (θ 1 ,θ 2 ; x) , θ 3 -必然事件, 定理1
θ1 ≻ θ 3 ≻ θ 2
θ 则必存在 p ∈ [0,1] ,使当 x = p 时, 3 ~ (θ 1 ,θ 2 ; p )
事实上, 3 ~ (θ 3 ,θ 2 ;1) 。应用假设2即可得到 θ 证明。
•
把随机事件转化为确定性事件。
两个定理― Step.3 两个定理―决策分析的理论基础
定理1 设 T1 = (θ 1 ,θ 2 ; x) , θ 3 -必然事件, 定理1
目的:
把决策的准则从期望收益值推广到期望效用值。
重点:
期望效用值准则的建立。
难点:
一个概念,三个假设,两个定理
Review 10.1 期望收益值
决策问题的分类
–风险型决策分析 风险型决策分析 –非确定型决策分析 非确定型决策分析 –多目标决策分析 多目标决策分析
风险型决策问题
一般地,假设有 个备选方案 个备选方案A 一般地,假设有m个备选方案 i (i=1,2,…,m),n , 个自然状态,各自然状态出现的概率分别为p 个自然状态,各自然状态出现的概率分别为 1, p2, …, pn.各方案可表示为 各方案可表示为 Ai (θi1,θi2,…,θin; p1, p2, …, pn),i=1,2,…,m ,
解释:把简单事态体转化为标准事态体。 q1 θ* θ* p1 θ1 p1 q2 θ* p2 p2 θ2 T~ ~ θ* θ j ~ (θ * ,θ* ; q j ) ⋮ ⋮ qn * θ pn θ p
n n
p1q1 p 1 (1 − q 1 ) θ
*
θ*
~
p 2 (1 − q 2 ) θ
⋮
⋮*
θ*
假设3 假设3
无差关系、优越关系的传递性 无差关系、
T1 ~ T2 , T2 ~ T3 ⇒ T1 ~ T3 T1 ≻ T2 , T2 ≻ T3 ⇒ T1 ≻ T3
两个定理― Step.3 两个定理―决策分析的理论基础
定理1 设 T1 = (θ 1 ,θ 2 ; x) , θ 3 -必然事件, 定理1
Ai (θi1 , θi 2 ,..., θ in ; p1 , p2 ,..., pn ), i = 1, 2,..., m
从统计学的角度出发,用数学期望来权衡方案 的各种可能结果,期望从多次决策中取得的平均收 益最大。计算公式为
E (Ai ) = ∑ p jθij
j =1
n
取方案 Ak
E ( Ak ) = max E ( Ai )
分析、比较各种事态体的办法及推导效用函数的基本途 径是辩优。
一个概念― Step.1 一个概念―偏好关系
对于后果集 J = {θ 1 ,θ 2 , ⋯ ,θ n } 中任意两个 可能的结果 x 和 y ,总可以按照既定目标的需 要,前后一致地判定其中一个不比另一个差。
x≻ y( x
不比
y 差)
一个概念― Step.1 一个概念―偏好关系
(θ 1 ,⋯θ n ; p1 ,⋯ p n ) ~ (θ * ,θ * ; p)
n j =1
其中,
p = ∑ p jq j
qj
为 θ j 关于 θ * 与 θ * 的无偏概率
i
θ * ≺ min{θ i }
θ * ≻ max{θ i }
i
作用:把简单事态体转化为标准事态体,进而可用 p进行比较以确定方案的优劣。
∀x, y ∈ J , x ≻ y ∨ y ≻ x
二者必居其一
若 记为
x ≻ y ,且 y ≻ x ,称 x 与 y 无差别, 。 x~ y
在此基础上,也可定义优越关系: x > y (优于)
Step. 三个假设― 把后果集J中结果的比 Step.2 三个假设 ― 把后果集 中结果的比 较推广到标准事态体的比较
10.2 行为假设与偏好关系
一般的风险型决策可用事态体表示: 简单事态体: 简单事态体:
T = (θ1 ,θ 2 ,...,θ n ; p1 , p2 ,..., pn )
T = (θ1 , θ 2 ; p1 , p2 )
标准事态体
复合事态体: 复合事态体:
T = (T1 , T2 ; p,1 − p )
θ1 ≻ θ 3 ≻ θ 2
θ 则必存在 p ∈ [0,1] ,使当 x = p 时, 3 ~ (θ 1 ,θ 2 ; p )
事实上, 3 ~ (θ 3 ,θ 2 ;1) 。应用假设2即可得到 θ 证明。
• 把随机事件转化为确定性事件。 • 若θ ~ (θ ,θ ; p) ,则称 p 为θ
3 1 2
1≤i ≤ m
期望收益值作为决策准则的问题
1.后果的多样性 后果可能反映直接经济效益、间接 . 经济效益,也可能是生态效益、社会效益。 2.决策往往是一次性的,采用期望后果值是否合理? .决策往往是一次性的,采用期望后果值是否合理? 3. 没有考虑决策者的主观因素 4. 不适合具有致命威胁后果的方案评价 5. 负效用
结论: 结论:
——需要一种能表述人们主观价值的衡量指标, 需要一种能表述人们主观价值的衡量指标, 需要一种能表述人们主观价值的衡量指标 而且它能综合衡量各种定量和定性的结果; 而且它能综合衡量各种定量和定性的结果; ——这样的指标没有统一的客观评定尺度,因人 这样的指标没有统一的客观评定尺度, 这样的指标没有统一的客观评定尺度 而异,视各人的经济、社会和心理条件而定。 而异,视各人的经济、社会和心理条件而定。 因此,需要探求一种较期望收益值更为完善的决 策准则。 思路:后果值换为效用值。以期望效用值 期望效用值作为 期望效用值 判别准则。 为此,先讨论行为假设与偏好关系。
Ex.2 如同Ex.1,但两组中奖数额不同。设 T1 组奖 金θ 1 = 700 元, T2 组奖金 θ 2 =400元。 1 ≻ θ 2 。两 θ 组都发行1万张。若 T1 中奖个数 n1与 T2 中奖个数 n 2 相 同(均为100个),显然 T1 ≻ T2。若 T1 组中奖个数不 是100而降为小于100的某个数,储蓄者是否有可能改 变主意?
p = ∑ p jq j
j =1
n
具体地说,对于方案集 A = { A1 , ⋯, Am }
Ai = (θi1 ,⋯θin ; p1 ,⋯ pn ), i = 1, 2,⋯ , m
Ai ~ (θ , θ* ; ∑ p j qij )
* j =1
n
θ ij ~ (θ * ,θ * ; qij )
比较
∑p q ,
3
关于θ 1 和θ 2
的无差概率 无差概率。 无差概率
Ex.3 掷硬币事件 掷出正面H(正)和掷出方面T(反)的概率均为0.5, A1(500,200;0.5),A2(200,200;0.5)。A1为风险型事件 ,A2为确定型事件。二者何为优先? 此时,A2-200元 若A2 -500元,肯定不接受A1.若A2 -0元,什么机 会也没有,接受A1。
Ex.1 两组有奖储蓄,均发行储蓄券1万张,两组 中奖者均获得同样数目奖金(400元)。所不同的, 第一组拥有可中奖彩券150张,而第二组中只拥有 可中奖彩券100张,试问你愿参加哪一个组?
假设2 假设2
(连续性) 连续性)
T1 = (θ 1 ,η ; p )
T2 = (θ 2 ,η ; q )
θ1 ≻ η
θ* p n (1 − q n ) θ*
~
⋮ pnqn
p1q1 + p2 q2 + ⋯ + pn qn
θ*
θ*
p1 (1 − q1 ) + p2 (1 − q2 ) + ⋯ + pn (1 − qn )
p1q1 + p2 q2 + ⋯ + pn qn
θ*
θ*
T
~
p1 (1 − q1 ) + p2 (1 − q2 ) + ⋯ + pn (1 − qn )
第10章 期望效用值理论 10章
西安电子科技大学 经济管理学院
—期望收益值 —行为假设与偏好关系 —效用函数及其确定 —主观期望效用值理论
本节课的内容、 本节课的内容、重点与难点
主要内容:
– 期望收益值作为决策准则有其不完善之处; – 如何从备选方案后果集中对于后果的比较转化为方案的比较,建立 备选方案比较的期望效用值准则; – 从决策理论的角度引入“效用”的概念。
即
(θ 1 ,⋯θ n ; p1 ,⋯ p n ) ~ (θ * ,θ * ; p)
p = ∑ p jq j
j =1
n
p1q1 + p2 q2 + ⋯ + pn qn
θ*
θ*
T
~
p1 (1 − q1 ) + p2 (1 − q2 ) + ⋯ + pn (1 − qn )
即
(θ 1 ,⋯θ n ; p1 ,⋯ p n ) ~ (θ * ,θ * ; p)
假设1 假设1
T1 = (θ1 ,θ 2 ; p ) T2 = (θ1 ,θ 2 ; q)
若p = q, T1 ~ T2 θ1 ≻ θ 2 ⇒ 若p > q, T1 ≻ T2
p
θ1 θ2
p=q
q
θ1 θ2
T1
T2
p>q
假设1 假设1
T1 = (θ 1 ,θ 2 ; p )
若p = q, T1 ~ T2 θ1 ≻ θ 2 ⇒ T2 = (θ 1 ,θ 2 ; q ) 若p ≻ q, T1 ≻ T2
θ2 ≻ η
θ 1 ≻ θ 2 ⇒ ∃p ′ < q ,使当 p = p ′ 时, 1 ~ T2 。 T
假设2 假设2
(连续性) 连续性)
T1 = (θ 1 ,η ; p )
T2 = (θ 2 ,η ; q )
θ1 ≻ η
θ2 ≻ η
θ 1 ≻ θ 2 ⇒ ∃p ′ < q ,使当 p = p ′ 时, 1 ~ T2 。 T
对于后果集 J = {θ 1 ,θ 2 , ⋯ ,θ n } 中任意两个 可能的结果 x 和 y ,总可以按照既定目标的需 要,前后一致地判定其中一个不比另一个差。
x≻ y( x
不比
y 差)
偏好关系“≻ ”必须满足下面三个条件: 1)自反性 x ≻ x (一个方案不会比它自己差) x ≻ y, y ≻ z ⇒ x ≻ z 2)传递性 3)完备性 任何两个结果都可以比较优劣,即
qij = u (θ ij )
θ ij 对决策主体所能提供的作用或价值,转化为它对决策 者的效用,而 qij 就是衡量这种效用大小的数值,称为效用 效用
。 u (θ ij )称为效用函数 效用函数。 效用函数
j ij j
i = 1, 2,⋯ m 之间的大小即可对方
案集进行排序,从而定出最优方案。
Key: 计算 qij
θ ij ~ (θ * ,θ * ; qij )
Key: 计算 qij
θ ij ~ (θ * ,θ * ; qij )
分析: 分析:
当 θ * ,θ * 固定时,
θ ij → qij ,即
Ex.3 掷硬币事件 掷出正面H(正)和掷出方面T(反)的概率均为0.5, A1(500,200;0.5),A2(200,200;0.5)。A1为风险型事件 ,A2为确定型事件。二者何为优先? 此时,A2-200元 若A2 -500元,肯定不接受A1.若A2 -0元,什么机 会也没有,接受A1。 参与不参与A1取决于另一个收益为确定值的方案, 此确定值在200与500之间。可以推断,从肯定不参与 到参与之间,此确定值相应有个转折点。这个转折点 就是和事态体方案A1等价的确定值,即称为等价确定 等价确定 值。
如若 A2 = 305 假设
则 A2 ≻ A1
A2 = 295 则
A2 ≺ A1
A1 ~ 300
则 A1 的等价确定值为300。
等价确定值的作用: 事态体的选择问题有可能转化为等价确定值的选择问 题。
定理10.2 定理10.2
(简化性)任一有n 种可能结果的事
Biblioteka Baidu
态体 (θ ,⋯θ ; p ,⋯ p ) 无差于某一简单事态体, 1 n 1 n 即