第一讲优势策略的含义

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二节 优势策略与优势策略均衡
三、优势策略均衡 (二)寻找优势策略均衡 2.给定装修商的策略选择(研究列) (1)给定装修商“给看”(第一列) 公明比较800与0,选择“要求看” (2)给定装修商“不给看”(第二列) 公明得0,生意泡汤,装修商选择“给 看”
第二节 优势策略与优势策略均衡
第一节 二人同时博弈
一、复习:要素 (一)参与人(局中人,博弈方) i=1,2,„,n (二)策略(行动) 1.策略集:集合 Si={si},某人的所有策略 2.策略组合:向量 s=(s1,„,si,„,sn),所有人的某一策略
第一节 二人同时博弈
一、复习:要素 (三)支付(得益) 1.某人支付:取决于所有人的策略 ui=(S1,„,Si,„,Sn) 2.支付组合:所有人的支付 u=(u1,„,ui,„un)
第一节 二人同时博弈
二、矩阵:经典模型 2.智猪博弈 小猪 要食 等待 要食 5,1 4,4 大猪 9,-1 0,0 等待
第一节 二人同时博弈
三、矩阵型(正规型、策略型)博 弈的数学描述
G S1 , , S n ; u1 , , un si Si , ui ( S1 , , S n )
第二节 优势策略与优势策略均衡
二、寻找优势策略:定义法 (三)分析:第二步,给定PEPSI的 策略(研究范围:列) 1.给定PEPSI选择低价,COCO比较 得益3与1(考察对象:第一列) COCO选择:低价 2.给定PEPSI选择高价,COCO比较 得益6与5(考察对象:第二列) COCO选择:低价
重复剔除不仅要求每个人是理性的,而且要求每个 人知道其他人是理性的,每个人知道每个人知道每 个人是理性的,如此等等,即理性是“共同知识” (共识)
C1
C2
C3
R1
10,4
1, 5
98,4
R2
R3
9, 9
11,98
0, 3
0,100
99,8
100,98
重复剔除的占优均衡
为了加深对重复剔除过程的理解,让我们再考虑一个例 参与人B 子:
重复剔除与理性共识
重复剔除不仅要求每个人是理性的,而且要求每 个人知道其他人是理性的,每个人知道每个人知 道每个人是理性的,如此等等,即理性是“共同 知识”(共识) C1 C2 C3
R1 R2 R3
10,4 9,9 11,98
1,5 0,3 0,100
98,4 99,8 100,98
重复剔除与理性共识
si si ' 和si , 有ui ( si , si ) ui ( si ' , si )
* *
si 优势策略
*
第二节 优势策略与优势策略均衡
一、优势策略:占优策略 (二)分类 1.严格优势策略 2.弱优势策略:ui(si*,s-i)至少不低于 ui(si’,s-i)
世界上最爱我的那个人发飙了

进 进 夫 退
-3,-3
0,2
退
2,0
0,0
夫妻吵架——斗鸡博弈
特征 1.双方了解各种情况下的得益:完全 信息 亲爱的,你先 进——胜利 吵,你吵完了 我再吵? 退——丢面子 2.同时决策:静态博弈
博弈论
第二章 同时决策博弈 ——静态博弈
两个厂商 : 瓜分市场容量 G q1 0, q2 0; 1 (q1 , q2 ), 2 (q1 , q2 )
哪个策略为最优?——诸多策 略中的优势策略
第二章 同时决策博弈 第二节 优势策略与优势策略 均衡
第二节 优势策略与优势策略均衡
一、优势策略:占优策略 (一)定义 无论其他参与人选择什么策略,某参 与人的某策略产生的支付高于(至少 不低于)自己的其他策略产生的支 付——此策略为优势策略
参 与 U 人 D L M R
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
参与人B 参 与U 人 L M
参 与U 人 D
A A
参与人B L M
1, 0 0, 3
1, 2 0, 1
1, 0
1, 2
A
局中人1
L
局中人2 M
5,1
8,4 9,6
R
6,2
3,6 2,8
U 4,3 M 2,1பைடு நூலகம்D 3,0
* *
si ' 严格劣势策略
第二节 优势策略与优势策略均衡
二、寻找优势策略:定义法 (一)案例:超市中的可乐价格大战 PESPI 低价 高价 低价 3,3 6,1 COCO 1,6 5,5 高价
第二节 优势策略与优势策略均衡
二、寻找优势策略:定义法 (二)分析:第一步,给定COCO的 策略(研究范围:行) 1.给定COCO选择低价,PEPSI比较 得益3与1(考察对象:第一行) PEPSI选择:低价 2.给定COCO选择高价,PEPSI比较 得益6与5(考察对象:第二行) PEPSI选择:低价
第二节 优势策略与优势策略均衡
二、寻找优势策略:定义法
(四)结论 严格优势策略组合(低价,低价) 囚徒困境:对个人而言最优的策略 (低价),对集体而言非最优。个人 理性与集体理性冲突 原因:只关心己方利益,双输
第二节 优势策略与优势策略均衡
三、优势策略均衡(占优均衡) (一)表述:优势策略组合 一个博弈中,某策略组合的所有策略 都是各参与人各自的上策 (低价,低价) 特征:博弈中的稳定结果
三、优势策略均衡(占优均衡) (二)寻找优势策略均衡 艺术家公明要求看装修商的设计方案 装修商 给看 不给看 要求看 800,600 0,0 公明 0,1000 0,1000 不要求看
第二节 优势策略与优势策略均衡
三、优势策略均衡 (二)寻找优势策略均衡 1.给定公明的策略选择(研究行) (1)给定公明“要求看”(第一行) 装修商比较600与0,选择“给看” (2)给定公明“不要求看”(第二行) 装修商赚取1000,“不要求看”为公明 的劣势策略
继续小试牛刀:智猪博弈
大猪 小猪
要食 要食 等待
5,1
9,-1
等待
4,4
0,0
重复剔除占优均衡
“重复剔除严格劣战略”(iterated elimination of strictly dominated strategy)的思路:首先找出博 弈参与人的劣战略(dominated strategy)(假定存 在的话),把这个劣战略剔除后,剩下的是一个不 包含已剔除劣战略的新的博弈;然后在剔除这个新 的博弈中的劣战略;继续这个过程,直到没有劣战 略存在。如果剩下的战略组合是唯一的,这个唯一 的战略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。 如果这样的解存在,我们说该博弈是“重复剔除占 优可解的”(iterated dominance solvable).
三、优势策略均衡 (二)寻找优势策略均衡 3.均衡:(要求看,给看)
800,600 0,1000 0,0 0,1000
个人理性与集体理性的冲突
“囚徒困境”表明个人理性与集体理性的 冲突。 这样的例子很多:寡头竞争,军备竞赛, 团队生产中的劳动供给,公共产品的供给, 等等; 许多的制度就是为解决“囚徒困境”而存 在的;
公共产品(public goods)
提供 提供 不提供 4,4 5,-1 不提供 -1,5 0,0
无论对方如何选择,每个人的最优选择:不提供。 所以,我们可以预测,结果将是(不提供,不提供)
公共产品与税收制度
比较私人产品与公共产品的不同:使 用上排他性; 私人产品是志愿购买的,但公共产品 可能需要强制购买; 税收制度就是保证公共产品的生产, 解决公共产品生产上的“囚徒困境”
“智猪博弈”(boxed pigs)
有些博弈没有占优均衡,但通过剔除“坏” 战略,我们可以预测博弈的结果。如“智 猪博弈”
这个博弈中,大猪的最优选择依赖于小猪的选择,但 小猪的最优选择与大猪的选择无关。如果大猪知道小 猪的理性的,大猪将选择“按”。均衡是“大猪按, 小猪等待”。 “劣”战略:无论对方选择什么,如果自己选择A得 到的总是收益小于选择B得到的收益,A就是相对于B 的劣战略。
案例:深更半夜去作案
深更半夜去作案 心惊又胆颤 没有星星和月亮 什么也看不见 顺了一些电脑主机 正在一边笑眯眯 不幸被警察看见了 被请进公安局
第一节 二人同时博弈
二、矩阵:经典模型 1.囚徒困境 嫌疑人乙 坦白 抵赖 坦白 -3,-3 0,-5 嫌疑人甲 -5,0 -1,-1 抵赖
选择越多,对理性共识的要求越高
C1 R1 R2 R3
C2
C3 1,20 2,0 4,3
C4 10,10 20,0 50,1
5,10 0,11 4,0 1,1
3,2
0,4
R4
2,93 0,92
0,91 100,90
si si ' 和si , 有ui ( si , si ) ui ( si ' , si )
* *
si 严格优势策略
*
第二节 优势策略与优势策略均衡
一、优势策略:占优策略(上策策略) (三)对应的概念:严格劣势策略
si si ' 和si , 有ui ( si , si ) ui ( si ' , si )
最优策略组合:s* (s1*,, si *,, sn *)
占优均衡
(dominant-strategy equilibrium)
占优战略均衡的出现只要求所有人都 是理性的,但不要求每个参与人知道 其他参与人是否理性。 囚徒困境博弈有占优均衡,所以其结 果很容易预测。
第二节 优势策略与优势策略均衡
相关文档
最新文档