博弈论入门5

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论中的交流

消息和语言一样吗? 消息的信息内容要与字面意思一致?

成功交流的两个条件

对消息的字面意义必须有共同认识 发送消息者没有欺骗接收者的动机

说谎

一个人必须成功地误导了他人才算“说谎”
6.1 不完全信息时
6.2 完全信息时
“夫妻战”中合作的可能性 无事前沟通 有事前沟通
理论
第五章 不完全信息博弈
本章讨论至少有一个博弈方不完全清楚其 他某些博弈方的得益的不完全信息博弈,也称 “贝叶斯博弈”。得益信息不充分和博弈进程 信息不充分是有差异的,因此不完全信心博弈 与不完美信息博弈有不同的表示和分析方法。 但不完全信息与不完美信息也有很强的内在联 系,可通过一定的方式统一起来,因此不完全 信息博弈和不完美信息博弈也可以用相同的方 法进行研究。
陪审团制度

现代之后,美国对陪审团制度进行了一系列的 改革。



首先是在陪审团组成人员上,逐渐对妇女和黑人开 放,对性别和种族的排斥度降低。 其次,历史上陪审团的人数是12人,改革之后组成 人数可以根据各州的情况在6-12人间组成。 再次,陪审团裁决原则上的变化。传统的陪审团裁 决是全体一致通过原则,现在开始应用多数主义。
情感体验 更多地感到担心、后悔、羞耻等 更多地感到愉悦、幸福、满足等 说不清楚或没有特别地感觉 合计
恋爱博弈
恋爱博弈
如何满足出现分离均衡的条件


重要的不是礼物价格昂贵,而是与杰克 爱罗斯时相比,杰克认为不爱罗斯时送 礼物更贵。不同类型的杰克之间差别化 损失才是关键 二手车市场Vs相亲大会 分手or悔婚
羊群行为(sheeple)


假设审判结束,10个陪审员认为无罪,2 个认为有罪。 投票结果取决于最开始的投票结果
5. 信号传递
5.1 劳动力市场博弈



50%高能力,50%低能力 高能力生产率200,低能力生产率100 假设经理雇佣时依据大学文凭对能力进 行认定 高能力接受教育的成本40,低能力120 低能力的人选择读大学还是放弃?
0.4 估价100
两种估价:50,100,概率分别为0.6和0.4。 出价以10为单位递增。 一个对称的简单策略:若估价50就出价40, 若估价100就出价60



出价40时的期望收益: 0.6*0.5*(50-40)+0.4*0=3 若估价50,出价40最优吗? 出价60时的期望收益: 0.6*(100-60)+0.4*0.5*(100-60)=32 若估价100,出价60最优吗?

有成本的行动 VS 无成本的行动 一个零成本的行动被称为消息。以消息 为载体的博弈被称为廉价谈话博弈。

发送错误的消息(说谎)没有成本 正确的消息呢?有收益吗? 不对真假做鉴别,重要的是有无信息量
消息在以下两个不同的场景中 产生重大影响

不完全信息:信号传递与声明 完全信息:事前沟通 例如:打电话博弈


当一个委员了解新政策时,是否投票, 如何投票?当不了解时又是否投票,如 何投票? 考虑这样一个对称策略:给定其他两个 委员采取相同策略,以及对于其他成员 拥有哪个政策更好的知识的信念,不论 这个参与者什么类型,采取这个策略都 使他收益最大。


自然决定四项:哪个政策更好,以及三 个委员的类型。 当一个委员了解新政策时:投票给自己 认为更好的策略是一个弱占优策略。

当另外两位投票相同时 当另外两位投票分歧时
若委员不知道哪个政策更好 …… (投票,弃权?)
1.
三种对称策略组合: 当委员了解新政策时,选自己认为更好的; 当不了解时,选现政策。
当委员1不了解,同时委员2、3有分歧时,委员1将做出错误决策。
2.
3.

当委员不了解时,反对现政策;当了解时, 投票最好的策略。 当委员不了解时,弃权;当了解时,选择最 好的策略。 前两个都不是贝叶斯纳什均衡!
从大学到科举
进入实习期后……

工作40小时还是加班到60小时? 员工:长期雇佣得益130,不聘用得益70 经理:雇佣勤奋型得100,懒惰型得25,不雇佣得60
给定一个策略组合和信念集

实习生:
若懒则工作40h;若勤则工作80

经理策略:
若实习生工作40或60h,则不雇佣;若工作80h则雇佣。


法律保障? 钻石戒指? 甜言蜜语?
5.3 信号传递的实例

三类商品:


搜索产品 体验商品 信任商品

如何广告才能分离优劣?
资本市场

Ross(1977):在一定条件下,企业的负债水平 越高,企业的盈利能力越强。
不同企业的破产可能
好企业 负债70% 负债30%

差企业 30% 5%
5% 1%



出价b=?(一家和两家出价时有不同吗) 考察b=s-1这样一个对称策略 德士古公司的例子
几种常见的拍卖形式

英式公开叫价拍卖 荷式公开叫价拍卖 一价密封拍卖 二价密封拍卖
我校的某次人大投票
4. 委员会和陪审团的投票



4.1 弃权票策略 每个委员有两个类型:了解新政策和不 了解新政策。 一个委员了解新政策的概率为q,即其类 型为“了解新政”的概率为q 如果不了解新政策,就不能确定哪个政 策更好。现政策更好的概率为p (1/2<p<1)
实验
37.5%
41%
49.9%
55%
单向交流被证明是最高效的,可 以使合作的概率达到95%
一个作业


格雷格正在考虑 是否邀请马西娅 ,但不确定对方 是否喜欢他。 博弈如图所示。 求解他们之间博 弈的贝叶斯均衡
又一个作业

现有某家医院为解决看病难而尝试改革 病人的排队规则:(1)在护士站分诊时 ,护士依照患者口述及其病征来确定病 情的严重程度;护士站将依照候诊者病 情的严重程度来确定先为谁诊治,而不 是“先来后到”。你能想象最后的结果 如何吗?用博弈模型描述并给出分析
开枪
厄普
僵持 4,1
8,4
开枪
僵持
5,2
6,3
3. 当所有人都拥有私人信息时

2012年5月3日,1.19亿$《呐喊》 ,12 分钟惊心动魄的争夺战 这幅名画引发了长达12分钟的竞价大战 ,最终被一位匿名电话竞买人拍下。4

千万起拍,1百万为单位递增

参与角逐的至少有四位藏家,其中有中 国、美国的藏家,以及奥斯陆 K画廊交 易商 Ben Frija,他在拍卖大厅内一直 压着所有的电话竞买人,但在7,300万 这道坎上放弃了。 在被问及对最终的价格是否感到意外时
Fra Baidu bibliotek
经理的信念:


工作40h——懒100% 工作60h——懒60%,勤40% 工作80h——勤100%
5.2 理智与情感



两汉:大赋、乐府诗 三国:五言诗、小赋 六朝:五言诗、小赋、骈体文 唐:古体诗(复兴)、近体诗、新乐府、复古文 晚唐五代:词 宋:词、诗、古文(中兴) 元:杂剧 明:小说、戏剧 清:小说、诗词(中兴)、古文(中兴) 民国:白话文 ……
黑暗中的舞者
1. 2. 3. 4. 5. 6.
慕尼黑协定 贝叶斯均衡:三步转换 当所有人都拥有私人信息时 委员会和陪审团的投票 信号传递 说谎及说谎者的信息
1. 慕尼黑协定
60%
40%
2. 贝叶斯均衡:三步转换
1.
在一个不完全信息博弈中,这个参与者 是谁?



参与者所拥有的私人信息成为参与者的类型 所有类型的集合成为类型空间 不同类型对应不同的收益

,Frija抛下一个“不”字,随即离开了
简化的暗标拍卖



密封递交标书 统一时间公正开标 标价最高者以所报标价中标 中标博弈方的得益不仅取决于标价,还取决于他对拍 卖标的物的带有很大主观性的估计 每个博弈方的估价通常是自己的私人信息
0.6 估价50 0.6 0.4 估价50 估价100
国有企业适用吗?

融资顺序:自有资本、债权融资、股权融资
显示信息 VS 隐瞒信息

显示:扎哈维(1975)——累赘原理

隐瞒:没有消息就是好消息 隐瞒:没有消息就是坏消息
你能理解这些现象吗?

互送礼品 婚姻契约 浪费性消费 “三好学生” 千奇百怪的求爱行为
6 消息:说谎和事前沟通
2. 3.
确定每个参与者的类型,引入“自然” 定义策略集。策略和自然,哪个先?
狂野西部枪战

1875年某个非同寻常的一天,警长马歇 尔﹒怀特﹒厄普去维持秩序,突然一个 陌生人拉住他的手,好像要开枪……
枪战博弈
陌生人(熟练枪手) 开枪 厄普 开枪 僵持 2,3 1,4 僵持 3,1 8,2
陌生人(普通牛仔)
生产工具与生产方式的关系
性关系的作用和出现时机
大学生非婚性行为-2013


大学的性健康教育应以“疏”代“堵” 大学生发生非婚性行为的比率为27.5%; 首次发生非婚性行为的年龄集中在19~21岁 体验到的负性情绪显著多于正性情绪
男生% 27.3 39.4 33.3 100 女生% 64.1 21.5 13.7 100 总计% 43.6 31.6 24.8 100

通过改革,陪审团制度在美国得到了比英国更 好的发展。
投票程序


每个陪审员在陪审之前已经有一个大体 的判断 他们的类型 非专业性——从众行为

如果评判有罪的人数多于无罪,则投有罪 如果评判无罪的人数多于有罪,则投无罪 如果双方人数相等,则依照自己的评判结果 投票



陪1:假设投有罪 陪2:若评判有罪,则投有罪;若评判无 罪,则投无罪 陪3:若陪1和陪2投票不同,陪3根据自 己的评判结果投;若陪1和陪2投票相同 ,则陪3投相同票。 ……
40: 0.6*0.5*(100-40)+0.4*0=18 50: 0.6*(100-50)+0.4*0=30 70: 0.6*(100-70)+0.4*(100-70)=30

隐藏你的出价
共同价值和赢者的诅咒

两家代理:1个积极估价,1个消极估价
1/ 2 v s 2 prob(v / s) 1/ 2 v s 2 v均匀分布
相关文档
最新文档