博弈论知识地图

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

狭路相逢的 策略--勇者 胜,先发优 势
就要在气势 上压倒对 方,至少要 显示出破釜 沉舟、背水 一战的决心 来,以迫使
让对方对自 己的实力进 行错误的评 估,尤其是 高估,从而 退缩
对方退却
只展示力
量,并不真
胆小鬼博
仪式化斗争
的下手伤害 敲山震虎,
弈:(一进
让对手主动 信号传递
一退)
退出
亡命徒 威胁,威慑
补偿换退让
的协议
此时纳什均 也就是都让 衡应该是赶 步,虽然这 尽杀绝,有 其实并不是 时候也事实 纳什均衡 也却是是这

最好的策略 是合作共 赢,而不是 斗争到底
混合战略纳 什均衡
最好的策略 有创意的策 是合作共 略可以通过 赢,而不是 改变矩阵格 斗争到底 局来实现更
高层次的均 衡
硬币正反博 弈
含义
对于每个参 与者来说, 只要其他人 不改变策 谁都不能改 略,他就无 变策略 法改善自己 的状况(达 到均衡)
纳什均衡的
存在性
纳什均衡的
多重性
最小最大均 不一定是纳

什均衡
子博弈精炼 是纳什均衡
非纳什均衡 纳什均衡 类型
的特殊形态 大都不是纳 什均衡,所 例如囚徒困
以博弈论才 境中都抗拒
有意义
帕累托最优 纳什均衡往
“教-学”之间 的均衡
从对方的回 答中获取信 息
海盗分金博

蜈蚣博弈
你死我活, 还是你好我 好
编排故事,
加深理解
博弈结果依 赖制度设置
树型博弈
树型博弈策 略组合的粗 线表示
确定树博弈 的纳什均衡
树型博弈的
子博弈
博弈论向自 己出难题
实验经济学 和行为经济 学
一报还一报
策略是对于
动态囚徒困
境下的利益
格局
略--最小最 极大最小化
大定理
策略、保留
策略
不可预测性
不一定是纳 什均衡
避免两败俱
伤的情况
不能依赖对
手的随机化
最佳混合策
略怎么变
1完全信息 静态博弈-纳什均衡
任何有限博 弈都至少存 在一个纳什
均衡
混合战略纳 什均衡
随机行动
独一无二
谎言的安全 措施
谎言,不让 别人了解你 的对策
出人意料
得势不饶人
要想取胜,
1.3 生物进 化与社会演
演化博弈与 自发秩序
化1.4的单不元同均 衡与多元均 衡2.1 协调博
第二节 演化 博弈举例
弈2.2 婚姻博 弈三色蜥蜴博

3.1 针锋相
第三节 囚徒 困境与合作 文化的演进
对者生存 3.2 弱稳定 与强稳定 3.3 合作文
化4.1的自破发坏秩
序4.2 产权博
第四节 自发 秩序与产权
1.3-5基础设
施建设:中
纳什均衡应 央政府和地
用举例
方政府之间
的博弈
为什么肯德 基和麦当劳 紧紧相邻?
提高薪酬, 触发一段潜 能传奇 给见义不为 的看客们 美丽心灵: 纳什传
2.1博弈的扩 展式表述
2.2扩展式表 述博弈的纳 什均衡 2.3-2子博弈
精炼纳什均
衡 动态博弈还
是一个博 弈,而重复 博弈则是一 个结束之后
制的社会规
范3.5 敌友规
则3.6 连带责
任1.1 动态博
第一节 威胁 弈1.2的作描为述行
的可信与不 动计划的战
可信
略1.3 威胁的
可信性
2.1 动态博
弈中的理性
要求
威胁与承诺
第二节 理性
序贯
22..23
子逆博向弈归
纳与理性共
识2.4 反事实
悖论
3.1 承诺的
第三节 承诺 作用
行为
3.2 承诺的
成4.1本有限政
均衡
枪手博弈: 先动与后
先发者
模仿后者才 不会被超越
动,先发优 势与后发优
后发者
冒险创新才 能超越
寡头竞争
军备竞赛
小学课外辅 导竞赛
公地悲剧
举例
搭便车
不团结
逐个击破
人质困境:
人质困境:
多个人的囚 徒困境
给猫栓个铃 铛
没有人愿意 牺牲自己拯 救大家,枪
打出头鸟
找出一个大 慈善家遵守 协议并容忍 作弊
政府监管或 干涉
往也不是帕
累托最优,
或者有两个
帕累托最优
无论对方如 只要参与人
只有一个纯 何决策,自 是理性的,
策略
己总是会选 不管对方是
择的策略 否理性
占优策略或 优势策略不 例如囚徒困 一定是帕累 境 托最优策略
含义
首先找到某
个参与人的
劣战略(假
定存在),
把这个劣战
略剔除掉, 重新构造一 个不包含剔 除战略的新 的博弈,然 后再剔除这 个新的博弈 中的某个参 与人的劣战 略,一直重
第四节 与民主
宪政
府4.2 民主作 为一种承诺
求解动态博
弈的倒推法
策略第一法
向前展望, 倒后推理
要有预见 性,预则立 不预则废
2完全信息 动态博弈-子博弈精炼 纳什均衡 SPNE

决策树与博 弈树
更加复杂的 树
1.1 合作与
第一节 讨价 还价问题
冲突 1.2 合作博 弈与非合作
百度文库博弈
2.1 蛋糕的
大小与分配
问2.1题聚点均 衡2.2 帕累托
选择
标准
第三章 多重
3.1 交通规
均衡与制度
则3.2的规演则进间
和文化
第三节 法律 的冲突和协
和社会规范 的协调作用
调3.3 协调中 的信息
3.4 规则的
正义性
4.1 键盘的
寓言
第四节 路径 依赖的困惑
4.2 VHS的秘 密4.3 微软神
话4.4 大学改
革的童话
乱拳打死老
逆向思考: 你考虑到别 人也会这么 选,你如果 也这么选就 会损失,所 以你选择一 条少有人走 到的路
但是如果其 他人也逆向 思考呢?你 就需要考虑 纳什均衡, 也就是无论 别人选什 么,你都会 选的策略
复这个过
程,直到只
剩下唯一的
战略组合为

多劳并不多 得 怎样让恋人 百依百顺?
三个和尚为 什么没水 吃?
重复博弈是 独立的,多 个的
再来一个
重复博弈不 是动态博弈
动态博弈下 一个人知道 上一个人每
一步的行
动,而重复 博弈无法了 解其他人任 何一步的选 择
有限次博弈 可以有限 2.5-1有限次 的最后一轮 次,但不知 重复博弈: 是不合作, 道到底有几 连锁店悖论 因此有限次 次,哪次是
不存在合作 最后一次
例:国有企 业改制中的 资产定价
3.1 有限次
谈判与后动
优势
3.2 无限期 第三节 轮流 谈判与耐心 出价与耐心 3.3 耐心与
公3.4平谈判成 本3.5 谈判与
信息
第四节 谈判 4.1 最后通
中的社会规 范
牒4.2博社弈会规 范
战争与和平
英国人玩的 博弈
2.4-1斯坦克
尔伯格
(Stackelberg
无限次重复 博弈促进合 作
既然是无限
次就无法倒
2.5重复博弈 和无名氏定 理
2.5-2无限次 重复博弈和 无名氏定理

存在无穷多 对战略,可 以成为无限
次重复博弈
的平衡点,
并同时实现
双方的合作

非合作博弈
2.5-3参与人
类型
不固定时的
重复博弈
2.5-4不确定
环境下的重
复博弈
1.1 重复博
重复博弈: 一夜性与地
师傅
保持神秘
不按套路出 牌,随机出 牌
让对方摸不 清门路
感,而不是 开放,让人 对你的套路
了如指掌
两个结果都
不可预测性 的重要性
有可能,让 对方抓不到 规律,即随
机性
随机概率的
魅力
怎样使输赢
机会相等
有人打网球

最大最小策
略,也称最
警察与小偷 博弈
小最大化策 略 (MinmaxSt
选择混合策 rategy)、
均衡筛选
点均衡)进 行选择
约定俗成 通过制度
抽签
相关均衡
混合策略的 均衡筛选
商品品牌的“
地域连坐”效

品牌地域连
坐的博弈分

抗共谋均衡
盯着不散伙
的共谋
德国世界杯
警方的优势
策略
稳定演进策 略
鹰的世界
鸽的天堂 鹰鸽共生演
霍布斯的原 始丛林
乌托邦

如果是斗鸡
博弈,因为
旗鼓相当,
所以不鼓励
攻击,如果
攻击有理 是鹰鸽博
不完全信息
博弈
变动收益博 弈
这里“完全但
把“不完全信 不完美信息”
息博弈”转换 指的是,自
3.1不完全信 息博弈和贝 叶斯纳什均 衡
3.1-2海萨尼 (Harsanyi)转 换
成“完全但不 完善信息博 弈” (complete but imperfect
然作出了它 的选择,但 其他局中人 并不知道它 人具体选择 是什么,仅
第一节 走出 囚徒困境
弈1.2 间1.3
战略空 合作的
老天荒
价2.1值针与锋耐相心
对2.2 永不原
谅2.3 信息与
第六章 重复 博弈和合作 行为
第二节 与惩罚
合作
合作 2.4 胡萝卜 加大棒 2.5 皇帝女 儿2.6不过愁犹嫁不
及3.1 多重关
系下的合作
3.2 长期参
第三节 大社 与3.3人和尚与 会中的合作 庙3.4 联合抵
解决不公平 缺陷的一个 办法是通过 掷硬币来随 机决定一起 去的地方 情侣博弈和 任一纳什均 协调博弈 衡都是帕累 托有效的
扑克牌对色 游戏
混合策略和 纳什定理
寻找纳什均
衡的反应函
数法
再说混合策
略纳什均衡
扑克牌讹诈
游戏
慕尼黑谈判
模拟
聚点均衡作
为共识均衡
解决:寻找 聚点均衡的
混合策略的 聚焦点(聚 制度设置
弈,因为完
全不同的物
种,如果鸽
多,那就做

策略
反向理论 与大众不同 (随坏境变
化)
与大众相同
左右撇子博 弈
社会的演化
是基因的竞

文化的演化
鹰鸽博弈: 进化中的路 径依赖(震 荡模式)
是模因的竞 争
博弈的演化 是策略的竞 争
1.1 从生物
进化到社会
演进
第一节 演化 博弈的基本 要素
1.2 演化稳 定战略
惩罚的保证
合理性) 道德感
惩罚方式
一报还一 报:出来混 迟早要还的
含义
名誉促进合

其主要特征
混合策略的 是作为混合
收益只能以 预期效用表
策略一部分 的每一个纯
概率论

策略有相同
的期望值
1.1 产品标
准1.2化交问通题博
第一节 多重 均衡问题
弈1.3 约会博 弈1.4 资源争
夺博弈
1.5 分蛋糕
第二节 聚点 均衡和均衡
枪打出头 鸟,刀砍地 头蛇
智猪博弈
怎样让偷懒 的员工不再“ 搭便车”?
借势,用他 人的资源办 自己的事
智猪博弈
为什么大股 东挑起监督 经理的重 任?
致所有的散 户投资者— —你是一头 聪明的“小猪 ”吗?
职场“大猪&
小猪”
纯战略纳什 均衡-重复 剔除的占优
小企业搭便 车
竞争中的弱 者以等待为 最佳策略
情侣博弈和 纳什均衡 情侣博弈的 其他例子 相对优势策 略下划线法
视觉友好的 对角排列
有两个纯策 略,且都帕 累托有效
情侣博弈表 达的对称性 嗜好
理性人一定 自私自利 吗? 不该一律贬 斥自利行为 情侣的拥挤 博弈 默契是协调 的一种方式 劣势策略消 去法的讨论
成功达到均 衡的关键是 谁先采取行 动,谁就能 够占领先 机,获得优 势
2.2 纳什谈
判解
第二节 谈判 砝码与谈判 能力
第五章 讨价 还价与耐心
相继发生的 策略-逆推 可解:用逆 向归纳法求 解子博弈精 炼纳什均衡
例子
2.5重复博弈 和无名氏定 理 抓钱游戏
2.3 边际贡
第二节 谈判 献与谈判能
砝码与谈判 能力
力2.4 改变谈 判砝码
2.5 应用举
第五章 讨价 还价与耐心
)寡头竞争模

2.4-2宏观经 济政策的动 态一致性
2.4-3中国过
去的财政包 干制度:中 央与地方的 关系
2.4-4工会与
雇主之间的
博弈
2.4-5轮流出
价的讨价还
价模型
共同知识的 车轱辘
庄子与惠施 的“鱼乐之辩 ”
脏脸博弈
好玩的数学 ——谁的脸 脏脸博弈 上沾有泥巴 公共知识: 谎言的“保镖 地球人都知 ” 道的知识 1天与100天 的博弈
information 知道各种选

择的概率分

3.1-3不完全 信息静态博 弈的战略式 表述和贝叶 斯纳什均衡
3.2-1不完全 信息库诺特 模型
3.2-2不完全
信息情况下
公共产品的 提供
1.1 连锁店
第一节 连锁 悖论
店悖论
1.2 奖惩与
合作
2.1 单方信
第二节 信息 不完全与声 誉机制
息不完全与 声誉机制
弈4.3 惯例的
制度的演化 出现
非合作博弈 类型
第四节 自发 秩序与产权 制度的演化
4.4 从惯例 到规范
有两个纯策
两个均衡点
略,但是只 猎鹿博弈, 但可以帕累
有一个帕累 挤兑博弈 托改进
托有效
1.3-1库诺特 (Cournot)寡 头竞争模型
1.3-2豪泰林 (Hotelling霍 特林)价格竞 争模型
2.2 双方信 息不完全下
的声誉机制
第七章 不完
3.1 解开连
全信息与声 誉
第三节 声誉 模型应用举
锁3.2店大悖智论若 愚3.3 政府的

声誉
3.4 “刑不上
大夫”

4.1 贝叶斯
法则
第四节 声誉 4.2 假作真
的积累
来真亦假
4.3 大学的
名声
3.2-3一级密
囚徒困境
多种情景,
一个思想一
段小小的历
史以牙还牙
较新的实验
如何达成合
作康德定然
律令解商界
中的困境公
财悲剧自然
界的腥牙血
爪案例分
走出囚徒困 析:捷足先 境--达成合 登

巴菲特困境
例如能臣与
博弈双方达 成协议
敌军 达成协议后 就是复杂的
合作博弈了
重复博弈与 动态博弈
觉察作弊
以牙还牙
对作弊者惩 罚(报复的
亡命徒往往 比胆小鬼更 加容易获胜
先下手为强
与其坐以待 毙,不如放 手一搏
虽然双方都
退步不如自
己进,而对
方退,但总
好于双方都

要有退步的 退一步海阔
智慧
天空
协和谬误: 不要将错误 沉默成本
进行到底
如何在博弈
中采用妥协
的方式取得
利益。如果
斗鸡博弈: 妥协的精髓 (各退一 步)
双方都换位 思考,它们 可以就补偿 进行谈判, 最后造成以
相关文档
最新文档