第四节混合策略反应函数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019年2月19日
博弈论第二章 第四节混合策略
14
三、研究方法:反应函数法
3.反应函数 (1)Jim:Dela剪发的概率越小, Jim卖表越好
1, ifq 1 / 3, 此时1 3q 0, p越大越好 p [0,1], ifq 1 / 3 0, ifq 1 / 3, 此时1 3q 0, p越小越好
2019年2月19日
博弈论第二章 第四节混合策略
2
思考
如何分析“不存在”纳什均衡 或存在多个纳什均衡的博弈?
2019年2月19日
博弈论第二章 第四节混合策略
3
第二章 完全信息静态博弈
第四节 混合策略与期望支付
2019年2月19日
博弈论第二章 第四节混合策略
4
第四节 混合策略与期望支付
一、混合策略 (一)案例:小偷与守卫的猫鼠博弈 守卫 睡 不睡 偷 8,-2 -2,0 小偷 0,8 0,0 不偷
2019年2月19日
博弈论第二章 第四节混合策略
7
混合策略
小偷的混合策略:以p的概率偷,(p, 1-p) 守卫的混合策略:以q的概率睡(q, 1-q)
2019年2月19日
博弈论第二章 第四节混合策略
8
第四节 混合策略与期望支付
一、混合策略 (二)混合策略 2.相对的概念:纯策略 每个博弈方的非随机性选择——纯粹 行动计划,p=100%,1-p=0
2019年2月19日
博弈论第二章 第四节混合策略
9
小偷与守卫博弈
偷p 小偷 不偷(1-p) 守 睡q
8,-2 0,8
卫 不睡(1-q)
-2,0 0,0
2019年2月19日
博弈论第二章 第四节混合策略
10
第四节 混合策略与期望支付
二、期望支付 1.概率 (偷,睡)的概率:pq (偷,不睡)的概率:p(1-q) (不偷,睡)的概率:(1-p)q (不偷,不睡)的概率:(1-p)(1-q)
2019年2月19日
博弈论第二章 第四节混合策略
5
小偷与守卫博弈
无纳什均衡,如何分析? 引入……
2019年2月19日
博弈论第二章 第四节混合策略
6
第四节 混合策略与期望支付
一、混合策略 (二)混合策略 1.表述:博弈方按照一定概率,随机 从策略集中选择一种策略作为实际行 动 博弈方随机行动的目的:使自己的行 为不被对手预测
第四节混合策略
三、研究方法:反应函数法
2.期望支付 (1)UJim=(-2)pq+2p(1-q)+2(1p)q+0(1-p)(1-q)=2p(1-3q)+2q 整理原则:一项含p,一项不含p (2)UDel=(-2)pq+2p(1-q)+2(1p)q+0(1-p)(1-q)=2q(1-3p)+2p 整理原则:一项含q,一项不含q
2019年2月19日
博弈论第二章 第四节混合策略
11
第四节 混合策略与期望支付
二、期望支付 2.期望支付 U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1p)(1-q)=2p(5q-1ห้องสมุดไป่ตู้ U守卫= (-2) pq+0p(1-q)+8(1p)q+0(1-p)(1-q)=2q(4-5p)
博弈论第二章 第四节混合策略
2019年2月19日
16
三、研究方法:反应函数法
4.反应函数曲线 (1)交点(1,0) p 1 双方支付为2 (2)交点(0,1) 双方支付为2 (3)交点(1/3, 1/3 1/3) 双方支付为2/3
2019年2月19日
互相为对方着 想,期望支付 变小
社会福利博弈:无纳什均衡
政府 流浪汉 寻找工作 游荡 救济 不救济
你救济,他就游 荡;你游荡,他 就不救济
2019年2月19日
3,2 -1,1
-1,3 0,0
博弈论第二章 第四节混合策略
1
社会福利博弈的特征
不存在纳什均衡 类似:父母给予懒惰的儿子多少资助? 回望另一个不正常的博弈:情侣博 弈——两个纳什均衡
博弈论第二章 第四节混合策略
2019年2月19日
15
三、研究方法:反应函数法
3.反应函数 (2) Dela : Jim卖表的概率越小, Dela 剪发越好
1, ifp 1 / 3, 此时1 3p 0, q越大越好 q [0,1], ifp 1 / 3 0, ifp 1 / 3, 此时1 3p 0, q越小越好
2019年2月19日
博弈论第二章 第四节混合策略
12
第四节 混合策略与期望支付
三、研究方法 最佳反应函数曲线交叉法 1.案例:麦琪的礼物 Dela 剪发q 保留(1-q) 卖表p -2,-2 2,2 Jim 2,2 0,0 保留( 1-p) 博弈论第二章 13 2019年2月19 日
1/3
q 1
17
博弈论第二章 第四节混合策略
博弈论第二章 第四节混合策略
14
三、研究方法:反应函数法
3.反应函数 (1)Jim:Dela剪发的概率越小, Jim卖表越好
1, ifq 1 / 3, 此时1 3q 0, p越大越好 p [0,1], ifq 1 / 3 0, ifq 1 / 3, 此时1 3q 0, p越小越好
2019年2月19日
博弈论第二章 第四节混合策略
2
思考
如何分析“不存在”纳什均衡 或存在多个纳什均衡的博弈?
2019年2月19日
博弈论第二章 第四节混合策略
3
第二章 完全信息静态博弈
第四节 混合策略与期望支付
2019年2月19日
博弈论第二章 第四节混合策略
4
第四节 混合策略与期望支付
一、混合策略 (一)案例:小偷与守卫的猫鼠博弈 守卫 睡 不睡 偷 8,-2 -2,0 小偷 0,8 0,0 不偷
2019年2月19日
博弈论第二章 第四节混合策略
7
混合策略
小偷的混合策略:以p的概率偷,(p, 1-p) 守卫的混合策略:以q的概率睡(q, 1-q)
2019年2月19日
博弈论第二章 第四节混合策略
8
第四节 混合策略与期望支付
一、混合策略 (二)混合策略 2.相对的概念:纯策略 每个博弈方的非随机性选择——纯粹 行动计划,p=100%,1-p=0
2019年2月19日
博弈论第二章 第四节混合策略
9
小偷与守卫博弈
偷p 小偷 不偷(1-p) 守 睡q
8,-2 0,8
卫 不睡(1-q)
-2,0 0,0
2019年2月19日
博弈论第二章 第四节混合策略
10
第四节 混合策略与期望支付
二、期望支付 1.概率 (偷,睡)的概率:pq (偷,不睡)的概率:p(1-q) (不偷,睡)的概率:(1-p)q (不偷,不睡)的概率:(1-p)(1-q)
2019年2月19日
博弈论第二章 第四节混合策略
5
小偷与守卫博弈
无纳什均衡,如何分析? 引入……
2019年2月19日
博弈论第二章 第四节混合策略
6
第四节 混合策略与期望支付
一、混合策略 (二)混合策略 1.表述:博弈方按照一定概率,随机 从策略集中选择一种策略作为实际行 动 博弈方随机行动的目的:使自己的行 为不被对手预测
第四节混合策略
三、研究方法:反应函数法
2.期望支付 (1)UJim=(-2)pq+2p(1-q)+2(1p)q+0(1-p)(1-q)=2p(1-3q)+2q 整理原则:一项含p,一项不含p (2)UDel=(-2)pq+2p(1-q)+2(1p)q+0(1-p)(1-q)=2q(1-3p)+2p 整理原则:一项含q,一项不含q
2019年2月19日
博弈论第二章 第四节混合策略
11
第四节 混合策略与期望支付
二、期望支付 2.期望支付 U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1p)(1-q)=2p(5q-1ห้องสมุดไป่ตู้ U守卫= (-2) pq+0p(1-q)+8(1p)q+0(1-p)(1-q)=2q(4-5p)
博弈论第二章 第四节混合策略
2019年2月19日
16
三、研究方法:反应函数法
4.反应函数曲线 (1)交点(1,0) p 1 双方支付为2 (2)交点(0,1) 双方支付为2 (3)交点(1/3, 1/3 1/3) 双方支付为2/3
2019年2月19日
互相为对方着 想,期望支付 变小
社会福利博弈:无纳什均衡
政府 流浪汉 寻找工作 游荡 救济 不救济
你救济,他就游 荡;你游荡,他 就不救济
2019年2月19日
3,2 -1,1
-1,3 0,0
博弈论第二章 第四节混合策略
1
社会福利博弈的特征
不存在纳什均衡 类似:父母给予懒惰的儿子多少资助? 回望另一个不正常的博弈:情侣博 弈——两个纳什均衡
博弈论第二章 第四节混合策略
2019年2月19日
15
三、研究方法:反应函数法
3.反应函数 (2) Dela : Jim卖表的概率越小, Dela 剪发越好
1, ifp 1 / 3, 此时1 3p 0, q越大越好 q [0,1], ifp 1 / 3 0, ifp 1 / 3, 此时1 3p 0, q越小越好
2019年2月19日
博弈论第二章 第四节混合策略
12
第四节 混合策略与期望支付
三、研究方法 最佳反应函数曲线交叉法 1.案例:麦琪的礼物 Dela 剪发q 保留(1-q) 卖表p -2,-2 2,2 Jim 2,2 0,0 保留( 1-p) 博弈论第二章 13 2019年2月19 日
1/3
q 1
17
博弈论第二章 第四节混合策略