管理经济学5第五讲 博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(一)基本概念
支付(payoffs) 第i个人的支付表示在所有的参与人和自 然都选择了各自行动且博弈已经完成后, 他所获得的效用 支付矩阵
(一)基本概念
结果(outcome)与均衡(equilibrium) 结果:是指在博弈结束后,建模者从行 动、支付和其他变量的取值中所挑选出 来的他所感兴趣的要素的集合 均衡:指由博弈中的n个参与人每人选取 的最佳策略所组成的一个策略组合
如果某一信息是所有参与人都知道的 如果每个参与人都知道所有参与人知道这一信息 如果每个参与人都知道所有参与人都知道所有参 与人知道这一信息 如此这般以至无穷 这一信息就成为共同知识
12
A 甲
12 2
11
4
13 2
(二)纳什均衡及其判断方法
乙 a b c 10 3 12 B 0 12 C 3 1 2 8 11 1
12
A 甲
12 2
11
4
13 2
(二)纳什均衡及其判断方法
对每一个参与者而言,对不同的均衡结 果是有不同的偏好的,不同的结果有时 取决于不同的路径,所以为获得自己想 要的结果,要想办法使对方相信,某些 路径你是决不会采取的,以将此种路径 排除。 破釜沉舟
(三)从静态博弈到动态博弈
静态博弈是指双方同时决策,或者在决 策时不知道对方决策的结果
动态博弈是指一方先决策,另一方后决 策
(三)从静态博弈到动态博弈
先发优势与后发优势
乙 a 0 A 甲 100 B 10 5 0 10 5 b 4
(三)从静态博弈到动态博弈
乙 a b c 10 3 12 B 3 2 10 1
坦白 坦 白 不 坦 白 5 -5 -2 -10 -2 -2 -2 囚徒 A 不坦白 -10
囚徒 B
(二)纳什均衡及其判断方法
俾斯麦海之战 1943年,日本海军上将木村受命将日本 陆军运抵新几内亚,其间必须穿越俾斯 麦海,美国海军上将肯尼计划进行轰炸。 穿越俾斯麦海有两条路线:较短的北线 和较长的南线,木村需要从中选择一条, 肯尼也需要决定如何派飞机,如果选错 了,轰炸天数就会减少。
(一)基本概念
以囚徒困境为例
囚徒 A
坦白 不坦白 -1,-10 -2,-2
囚徒 B
坦白 不坦白
-5,-5 -10,-1
(二)纳什均衡及其判断方法
常见的均衡概念有三种: 优势策略均衡 (dominant strategy equilibrium) 重复剔除优势均衡 (iterated dominance equilibrium ) 纳什均衡 (Nash equilibrium )
(三)从静态博弈到动态博弈
A 开发 N 大0.5 B 开发 不开发 开发 B 不开发 小0.5 大0.5 B 开发 不开发 不开发 N 小0.5 B 开发 不开发 (0,0)
(4,4) (8,0)(-3,-3) (1,0) (0,8) (0,0) (0,1)
(三)从静态博弈到动态博弈
如果已知需求小
税收机关不检查的期望 收益 G 0, a 1 税收机关的期望收益: G 1, 1 G 0,
F a C a 1 a a F C a a 1 d C 0 F C a 0 * d aF
(二)纳什均衡及其判断方法
石头、剪刀、布游戏 赢者得1、输者-1、平局得0
(二)纳什均衡及其判断方法
如果允许混合策略,每个有限博弈都有 至少一个纳什均衡 在n人策略式博弈中,如果每个参与人的 纯策略空间Si是欧式空间上的一个非空的、 闭的、有界的凸集,支付函数ui(s)是连续 的且对si是拟凹的,那么存在一个纯策略 纳什均衡
博弈论
(一)基本概念 (二)纳什均衡及其判断方法 (三)从静态博弈到动态博弈 (四)从完全信息博弈到不完全信息博弈
(一)基本概念
参与人(players): 决策的个体,其目标都是自身效用的最大化 行动(actions)与策略(strategies) 行动:某个参与人所能做的某一选择,它所能 做的全部行动的集合称为行动集。一个行动组 合(action profile)是一个由博弈中的n个参与 人每人选取一个行动所组成的一个集; 策略:是决定参与人在博弈中每一个不同情况 下如何选择行动的规则(策略集、策略组合)
(二)纳什均衡及其判断方法
乙 a 2 A 甲 -1 B -1 1 1 2 -1000 b -1
(二)纳什均衡及其判断方法
路径依赖问题
乙 a b c 10 3 12 B 0 12 C 3 1 2 8 11 1
12
A 甲
12 2
11
4
13 2
(二)纳什均衡及其判断方法
乙 a b c 10 3 12 B 0 12 C 3 1 2 8 11 1
(三)从静态博弈到动态博弈
强盗分金 有5个强盗掘出了100块金币。经协商,分配金 币的规则为:老大先提出分配方案,经5人表 决,如多数人同意,方案就被通过,否则老大 将被扔入大海喂鲨鱼。如果老大被扔入大海, 则由老二提出分配方案,如多数人同意方案就 被通过,否则老二也要被扔入大海。以下类推。 金币会怎样分配
A 开发 B 开发 (-3,-3) 不开发 开发 不开发 B 不开发 (0,0)
(1,0)
(0,1)
(三)从静态博弈到动态博弈
B {开发,开发} 开发 A 不开发 0 -3 {开发, 不开发} {不开发,开发} {不开发, 不开发} -3 0 1 0 0 0 1 0 1 0 0
-3
1
-3
(三)从静态博弈到动态博弈
子博弈精炼纳什均衡
A 开发 B 开发 (-3,-3) 不开发 开发 不开发 B 不开发 (0,0)
(1,0)
(0,1)
(三)从静态博弈到动态博弈
子博弈精炼纳什均衡 1)是原博弈的纳什均衡 2)是每一个子博弈上的纳什均衡 剔除不可置信的威胁
(四)从完全信息博弈到不完全信息博弈
共同知识(common knowledge)
智猪博弈
小猪 按键 按 键 等 待 1 5 -1 9 0 4 0 等待 4
大猪
(二)纳什均衡及其判断方法
判断的方法可以有两种
劣势策略消去法 相对优势策略划线法
(二)纳什均衡及其判断方法
囚徒 A 坦白 坦 白 不 坦 白 5 -5 -1 -10 -2 -1 -2 不坦白 -10
囚徒 B
(二)纳什均衡及其判断方法
(二)纳什均衡及其判断方法
乙 a 2 A 甲 3 B 1 0 C 2 2 2 3 2 2 3 2 2 2 3 b 1 0 c 2
(二)纳什均衡及其判断方法
监督博弈 税收机关的纯策略是检查或不检查 纳税人的纯策略是逃税或不逃税
a:应纳税款 C:检查成本 F:罚款 假定C<a+F
(二)纳什均衡及其判断方法
12
A 甲
12 2
11
4
(三)从静态博弈到动态博弈
到后推理的基本思想 防鲨网的突破 避免恶意收购的防鲨网:董事会共有5位成员, 按目前选举办法,一年只能更换一位。要改变 选举程序,可以提交建议,按规定,投票以顺 时针次序沿着董事会圆桌进行,一份提议必须 获得50%以上支持(缺席算反对),且任何人 若是提交一份建议而未获得通过,他及其赞同 者都将失去自己的董事席位和股份,由其他人 平分
纳税人 逃税 检 查 不 检 查 -a-F a-C+F 0 0 a a-C -a 不逃税 -a
税 收 机关
(二)纳什均衡及其判断方法
表示税收机关检查的概 率,表示纳税人逃税的概率 给定: 税收机关检查的期望收 益 G 1, a C F a C 1 F a C
节(node) 枝(branches) 信息集(information set)
(三)从静态博弈到动态博弈
A 开发 N 大0.5 B 开发 不开发 开发 B 不开发 小0.5 大0.5 B 开发 不开发 不开发 N 小0.5 B 开发 不开发 (0,0)
(4,4) (8,0)(-3,-3) (1,0) (0,8) (0,0) (0,1)
(二)纳什均衡及其判断方法
类似可得到:
a aF
*
阿根廷作家奥斯瓦尔多· 索利亚诺的一部短篇小 说《世界上耗时最长的点球》:一场在阿根廷 乡间举办的足球比赛在终场前几秒钟不得不停 止,因为一位偏心的裁判刚刚因为判罚了一个 点球而被愤怒的球员一脚踢了出去。联赛法庭 判决这场比赛的最后二十秒钟——事实上就是 那个点球——将在下周日重新进行。这样每个 人都有一周的时间准备那个点球。
(三)从静态博弈到动态博弈
博弈的扩展式表述
A 开发 N 大0.5 B 开发 不开发 开发 B 不开发 小0.5 大0.5 B 开发 不开发 不开发 N 小0.5 B 开发 不开发 (0,0)
(4,4) (8,0)(-3,-3) (1,0) (0,8) (0,0) (0,1)
(三)从静态博弈到动态博弈
(二)纳什均衡及其判断方法
优势策略均衡 如果无论其他参与人选择什么策略,某 个策略都是参与人i 的强最佳应对,那么 该策略就是参与人i 的优势策略,每个人 参与人的优势策略的组合就是优势策略 均衡
(二)纳什均衡及其判断方法
囚徒 A 坦白 坦 白 不 坦 白 5 -5 -1 -10 -2 -1 -2 不坦白 -10
(二)纳什均衡及其判断方法
重复剔除优势均衡
北 -2 北 肯尼 -1 南 1 3 -3 2 2 木村 南 -2
(二)纳什均衡及其判断方法
纳什均衡 在一个策略组合中,在其他参与人都不 会改变已有策略的条件下,如果没有参 与人有改变自己策略的激励,则称此种 策略组合为纳什均衡
(二)纳什均衡及其判断方法
(二)纳什均衡及其判断方法
练习 情侣博弈,如果男方处心积虑要和女方 在一起,而女方想方设法躲避他 a构造一个博弈矩阵反映上述情况; b是否存在纳什均衡
(二)纳什均衡及其判断方法
Biblioteka Baidu
如果A国有两个师的兵力而B国有三个师 的兵力,任务是攻克B国一座城市。 规则是:双方兵力只能整师调动,通往 城市道路只有甲乙两条,如果A攻击时, 兵力超过对方就获胜,相等或少就失败。 A国的策略是什么
在罚点球前几天的晚餐上,需要扑救点球的守门员加 托· 迪亚兹思考主罚的那位球员会怎么做: “康斯坦总是朝右边踢。” “不错,一直如此。”俱乐部主席说。 “但是他知道我知道这个。” “那样的话我们就要丢球了。” “没错,不过我知道他知道我知道。”加托又说。 “那你就准备好朝右边扑救。”餐桌上有一个人插 嘴说。 “不,他知道我知道他知道的。”加托· 迪亚兹说, 他离开餐桌,躺在床上开始了无尽的思考。
相对优势策略划线法
小猪 按键 按 键 等 待 1 5 -1 9 0 4 0 等待 4
大猪
(二)纳什均衡及其判断方法
纳什均衡是谁都没有激励去改变现状,改 变就会不如现在(严格纳什均衡)或者至 少不会比现在好,它是一个稳定的结果。
(二)纳什均衡及其判断方法
乙 a 2 A 甲 3 B 1 0 C 2 2 2 3 2 2 3 2 2 2 3 b 1 0 c 2
(三)从静态博弈到动态博弈
A先生成为新董事,他提出提议,内容是: 如果该提议全票5通过,A可以选择一个全新的 董事会,其余董事可获得不多的补偿 如果4:1通过,投反对票的董事就要离开,没 有任何补偿 如果3:2通过,A将会把他的51%股份平分给 另两位投赞成票的董事,投反对票的董事就要 离开,没有任何补偿
(二)纳什均衡及其判断方法
一个博弈的纳什均衡不一定只有一个, 可能有两个,也可能更多
(二)纳什均衡及其判断方法
情侣博弈
女 拳击 拳 击 芭 蕾 1 2 0 0 1 0 2 芭蕾 0
男
(二)纳什均衡及其判断方法
如果出现两个以上的均衡应该如何选择
乙 a 2 A 甲 -1 B -1 1 1 2 -1 b -1
囚徒 B
(二)纳什均衡及其判断方法
弱优势策略均衡 剔除了每个参与人的全部弱劣势策略 (可以一样好,绝不会更好)所得到的 一个策略组合。 重复剔除优势均衡 剔除了某一参与人的弱劣势策略,再重 新考察各个参与人剩下的策略中那些是 弱劣的并剔除,最终得到的策略组合。
(二)纳什均衡及其判断方法
弱优势策略均衡