博弈论入门(课堂PPT)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 考虑这样一个对称策略:给定其他两个 委员采取相同策略,以及对于其他成员 拥有哪个政策更好的知识的信念,不论 这个参与者什么类型,采取这个策略都 使他收益最大。
19
• 自然决定四项:哪个政策更好,以及三 个委员的类型。
• 当一个委员了解新政策时:投票给自己 认为更好的策略是一个弱占优策略。
– 当另外两位投票相同时 – 当另外两位投票分歧时
16
我校的某次人大投票
17
4. 委员会和陪审团的投票
• 4.1 弃权票策略 • 每个委员有两个类型:了解新政策和不
了解新政策。 • 一个委员了解新政策的概率为q,即其类
型为“了解新政”的概率为q • 如果不了解新政策,就不能确定哪个政
策更好。现政策更好的概率为p (1/2<p<1)
18
• 当一个委员了解新政策时,是否投票, 如何投票?当不了解时又是否投票,如 何投票?
1
黑暗中的舞者
1. 慕尼黑协定 2. 贝叶斯均衡:三步转换 3. 当所有人都拥有私人信息时 4. 委员会和陪审团的投票 5. 信号传递 6. 说谎及说谎者的信息
2
1. 慕尼黑协定
3
4
5
60%
40%
6
2. 贝叶斯均衡:三步转换
1. 在一个不完全信息博弈中,这个参与者 是谁?
– 参与者所拥有的私人信息成为参与者的类型 – 所有类型的集合成为类型空间 – 不同类型对应不同的收益
估价50
估价100
0.6
估价50
wenku.baidu.com
0.4
估价100
两种估价:50,100,概率分别为0.6和0.4 。出价以10为单位递增。
一个对称的简单策略:若估价50就出价40, 若估价100就出价60
13
• 出价40时的期望收益: 0.6*0.5*(50-40)+0.4*0=3
• 若估价50,出价40最优吗? • 出价60时的期望收益:
• 前两个都不是贝叶斯纳什均衡!
21
陪审团制度
• 现代之后,美国对陪审团制度进行了一系列的 改革。
– 首先是在陪审团组成人员上,逐渐对妇女和黑人开 放,对性别和种族的排斥度降低。
– 其次,历史上陪审团的人数是12人,改革之后组成 人数可以根据各州的情况在6-12人间组成。
– 再次,陪审团裁决原则上的变化。传统的陪审团裁 决是全体一致通过原则,现在开始应用多数主义。
20
若委员不知道哪个政策更好 …… (投票,弃权?)
• 三种对称策略组合: 1. 当委员了解新政策时,选自己认为更好的;
当不了解时,选现政策。
当委员1不了解,同时委员2、3有分歧时,委员1将做出错误决策。
2. 当委员不了解时,反对现政策;当了解时, 投票最好的策略。
3. 当委员不了解时,弃权;当了解时,选择最 好的策略。
0.6*(100-60)+0.4*0.5*(100-60)=32 • 若估价100,出价60最优吗?
– 40: 0.6*0.5*(100-40)+0.4*0=18 – 50: 0.6*(100-50)+0.4*0=30 – 70: 0.6*(100-70)+0.4*(100-70)=30
隐藏你的出价 14
共同价值和赢者的诅咒
• 两家代理:1个积极估价,1个消极估价
prob(v/s)11//22
vs2 vs2
• v均匀分布
• 出价b=?(一家和两家出价时有不同吗)
• 考察b=s-1这样一个对称策略
• 德士古公司的例子
15
几种常见的拍卖形式
• 英式公开叫价拍卖 • 荷式公开叫价拍卖 • 一价密封拍卖 • 二价密封拍卖
第五章 不完全信息博弈
本章讨论至少有一个博弈方不完全清楚其 他某些博弈方的得益的不完全信息博弈,也称 “贝叶斯博弈”。得益信息不充分和博弈进程 信息不充分是有差异的,因此不完全信心博弈 与不完美信息博弈有不同的表示和分析方法。 但不完全信息与不完美信息也有很强的内在联 系,可通过一定的方式统一起来,因此不完全 信息博弈和不完美信息博弈也可以用相同的方 法进行研究。
行认定 • 高能力接受教育的成本40,低能力120 • 低能力的人选择读大学还是放弃?
2. 确定每个参与者的类型,引入“自然” 3. 定义策略集。策略和自然,哪个先?
7
狂野西部枪战
• 1875年某个非同寻常的一天,警长马歇 尔﹒怀特﹒厄普去维持秩序,突然一个 陌生人拉住他的手,好像要开枪……
8
枪战博弈
厄普
陌生人(熟练枪手)
开枪
开枪
2,3
僵持
1,4
僵持 3,1 8,2
厄普
陌生人(普通牛仔)
• 通过改革,陪审团制度在美国得到了比英国更 好的发展。
22
投票程序
23
• 每个陪审员在陪审之前已经有一个大体 的判断
• 他们的类型 • 非专业性——从众行为
– 如果评判有罪的人数多于无罪,则投有罪 – 如果评判无罪的人数多于有罪,则投无罪 – 如果双方人数相等,则依照自己的评判结果
投票
24
• 陪1:假设投有罪 • 陪2:若评判有罪,则投有罪;若评判无
罪,则投无罪 • 陪3:若陪1和陪2投票不同,陪3根据自
己的评判结果投;若陪1和陪2投票相同 ,则陪3投相同票。 • ……
25
羊群行为(sheeple)
• 假设审判结束,10个陪审员认为无罪,2 个认为有罪。
• 投票结果取决于最开始的投票结果
26
5. 信号传递
27
5.1 劳动力市场博弈
• 50%高能力,50%低能力 • 高能力生产率200,低能力生产率100 • 假设经理雇佣时依据大学文凭对能力进
• 在被问及对最终的价格是否感到意外时 ,Frija抛下一个“不”字,随即离开了
11
简化的暗标拍卖
密封递交标书 统一时间公正开标 标价最高者以所报标价中标 中标博弈方的得益不仅取决于标价,还取决于他对拍
卖标的物的带有很大主观性的估计 每个博弈方的估价通常是自己的私人信息
12
0.6
0.4
开枪
开枪
5,2
僵持
6,3
僵持 4,1 8,4
9
10
3. 当所有人都拥有私人信息时
• 2012年5月3日,1.19亿$《呐喊》 ,12 分钟惊心动魄的争夺战
• 这幅名画引发了长达12分钟的竞价大战 ,最终被一位匿名电话竞买人拍下。4 千万起拍,1百万为单位递增
• 参与角逐的至少有四位藏家,其中有中 国、美国的藏家,以及奥斯陆 K画廊交 易商 Ben Frija,他在拍卖大厅内一直 压着所有的电话竞买人,但在7,300万 这道坎上放弃了。
相关文档
最新文档