中级微观经济学博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
博弈论与策略行为(2):支付矩阵
可以用支付矩阵(Payoff Matrix,又称得益矩阵,收益矩阵,赢
得矩阵等)来描述一个博弈结构。下面这个简单的支付矩阵中,
有两个参与者厂商A和厂商B;它们各自可以选择两种策略,分
别用“左右”和“上下”来标识(它们可以表示生产或不生产
某种商品,提高或不提高价格,做不做广告的选择等);数字
一个所谓游戏至少需要三个要素:(1)博弈或游戏 参加者。博弈论分析假定参与者都是机智而理性的。 (2)行动或策略空间。博弈参与者必须知道他自己 及其对手伙伴的策略选择范围,并了解各种策略之间 的因果关系。(3)有可评价优劣高下的决策行为结 果。博弈论用数字表示这类结果,并称之为支付 (Payoff).上述3部分描述了一个博弈的规则或结构。
5
博弈论与策略行为(3):支配策略
由于游戏参与者试图实现自身利益最大化并具有机智而理性的决
策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具 有一个简单而确定的结果。从厂商A角度来说,它采取策略“下” 而得到的支付总是好于“上”(2,1分别对1,0)。同样,对于 B来说,选择策略“左”得到的利益总是优于“右”(1,2分别 对0,1)。因此,我们可以确定预期均衡选择策略是A选择“下” 而B选择“左”的策略。
在上面广告策略关系事例中,给定厂商B做广告的策略,A所能 做的一个最好选择是做广告;而当A做广告时,B的选择仍是它 能做的最好的。因而,纳什均衡条件得到满足。
它与支配策略均衡的区别在于:在纳什均衡下,“我(你)所做 的是给定你(我)的选择我(你)所能做的最好的”,而支配均 衡下, “我(你)所做的是不论你(我)的选择我(你)所能做 的更好的”。支配均衡必然是纳什均衡,但纳什均衡未必是支配 均衡。
这一博弈中每个参与者都存在一个支配策略(Dominant Strategy,
又称占优或超优策略)。不管其它参与者如何选择,每个局中人
自有的那个最优选择称作支配策略,由此实现的均衡是支配均衡
(又称占优或超优均衡)。
厂商B
左
右
上
1,2
0,1
厂商A 下
2,1
1,0
6
博弈论与策略行为(4):囚徒困境
下面支付矩阵表示著名的“囚徒困境(Prisoners’ Dilemma)”游戏。 从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯A, B来说,无论对方如何选择“坦白”都是各自的最优选择。
表示双方在不同策略选择组合下各自得到的支付,较大数字代
表较大利益或效用。例如,在厂商A和B分别选择上和左代表的
策略时,左上角方框的数字“1,2”表示A和B分别得到的支付。
同理, A和B分别选择策略下和右时,它们分别得到右下角方框
数字“1,0”代表的支付。
ห้องสมุดไป่ตู้
厂商B
左
右
上
厂商A
下
1,2 2,1
0,1 1,0
解答这一问题,A需要把自己放在B的位置,从B的角度看什么是最好的选择, 并在此基础上考虑自己的选择。支付矩阵表明B有一个支配策略:不论A选择 如何,B选择做广告时利益较大(5,8对0,2),因而A可以判断B会选择做 广告。而在B做广告时,A应当选择做广告。因而,均衡结局是双方都做广告。
厂商A
做广告 不做广告
做广告 10,5
厂商B 不做广告
15,0
6,8
20,2
8
完全信息静态博弈:纳什均衡
上述均衡结果被称作纳什均衡(The Nash Equilibrium)。纳什均衡 指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳 什均衡状态下,只要其它参与者不变换策略选择,任何单个参与 者不可能单方面通过变换策略来提高他的所获支付。美国数学家 和统计学家纳什(Nash)50年代提出这一概念,所以称作纳什均 衡。
虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保 持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)等 竞争性动机阻碍了它们达到更好的互利选择,它们面临“囚徒困 境”。我们将看到,寡头垄断厂商经常面临类似的困境。
囚徒困境告诉我们,不满足纳什均衡的协议是无效的。
坦白
囚犯B
保持沉默
囚犯A
坦白
保持 沉默
A坐3年牢 B坐3年牢
A坐10年牢 B坐3个月牢
A坐3个月牢 B坐10年牢
A坐1年牢
B坐1年牢
7
完全信息静态博弈:纳什均衡
支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵 表示的博弈中,厂商A,B在选择做广告问题上存在的策略关系。其中厂商A 没有支配策略。因为A的最佳决策取决于B的选择。例如,当B选择做广告时, A应当选择做广告,由此得到10而不是6的支付得益;然而,当B选择不做广告 时,A应当选择不做广告,从而得到20而不是15的支付得益。假定两个厂商需 要同时决策,A应当如何决策?
9
完全信息静态博弈:纳什均衡
一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策 略),有时又可能不存在纳什均衡。下面左表存在两个纳什均衡:
其中“上,左”是纳什均衡(A选上,则B选左;且B选左时A仍 应选上);“下,右”也是纳什均衡(A选下,则B选右;且B选 右时A仍应选下)。如没有更多信息,则无法判断均衡在什么位 置。右表没有纳什均衡。如A选“上”,B则选“左”;然而当B 选“左”时,A却应当选“下”。反之,A选“下”时,B应选 “右”;然而当B选右时,A又应选“上”。没有均衡点。
不完全信息
不完全信息静态博弈; 不完全信息动态博弈;
贝叶斯纳什均衡;
精炼贝叶斯纳什均衡;
海萨尼(1967-1968)
泽尔腾(1975), Kreps和Wilson (1982),Fudenberg 和Tirole(1991)
3
博弈论与策略行为(1):学科概念
博弈论(Game Theory)又名对策论,游戏论。顾名 思义,是一门研究互动关系的游戏中参与者各自选择 策略的科学,换言之,是研究机智而理性的决策者之 间冲突及合作的学科。博弈论把这些复杂关系理论化, 以便分析其中的逻辑和规律,并对实际决策提供指导 或借鉴。
第九讲 博弈论
1
博弈论
完全信息静态博弈:纳什均衡 完全信息动态博弈:子博弈精炼纳什均衡 不完全信息静态博弈:贝叶斯纳什均衡 不完全信息动态博弈:精炼贝叶斯均衡
2
博弈的分类及对应的均衡概念
行动顺序 信息
完全信息
静态
完全信息静态博弈; 纳什均衡; 纳什(1950,1951)
动态
完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965)
博弈论与策略行为(2):支付矩阵
可以用支付矩阵(Payoff Matrix,又称得益矩阵,收益矩阵,赢
得矩阵等)来描述一个博弈结构。下面这个简单的支付矩阵中,
有两个参与者厂商A和厂商B;它们各自可以选择两种策略,分
别用“左右”和“上下”来标识(它们可以表示生产或不生产
某种商品,提高或不提高价格,做不做广告的选择等);数字
一个所谓游戏至少需要三个要素:(1)博弈或游戏 参加者。博弈论分析假定参与者都是机智而理性的。 (2)行动或策略空间。博弈参与者必须知道他自己 及其对手伙伴的策略选择范围,并了解各种策略之间 的因果关系。(3)有可评价优劣高下的决策行为结 果。博弈论用数字表示这类结果,并称之为支付 (Payoff).上述3部分描述了一个博弈的规则或结构。
5
博弈论与策略行为(3):支配策略
由于游戏参与者试图实现自身利益最大化并具有机智而理性的决
策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具 有一个简单而确定的结果。从厂商A角度来说,它采取策略“下” 而得到的支付总是好于“上”(2,1分别对1,0)。同样,对于 B来说,选择策略“左”得到的利益总是优于“右”(1,2分别 对0,1)。因此,我们可以确定预期均衡选择策略是A选择“下” 而B选择“左”的策略。
在上面广告策略关系事例中,给定厂商B做广告的策略,A所能 做的一个最好选择是做广告;而当A做广告时,B的选择仍是它 能做的最好的。因而,纳什均衡条件得到满足。
它与支配策略均衡的区别在于:在纳什均衡下,“我(你)所做 的是给定你(我)的选择我(你)所能做的最好的”,而支配均 衡下, “我(你)所做的是不论你(我)的选择我(你)所能做 的更好的”。支配均衡必然是纳什均衡,但纳什均衡未必是支配 均衡。
这一博弈中每个参与者都存在一个支配策略(Dominant Strategy,
又称占优或超优策略)。不管其它参与者如何选择,每个局中人
自有的那个最优选择称作支配策略,由此实现的均衡是支配均衡
(又称占优或超优均衡)。
厂商B
左
右
上
1,2
0,1
厂商A 下
2,1
1,0
6
博弈论与策略行为(4):囚徒困境
下面支付矩阵表示著名的“囚徒困境(Prisoners’ Dilemma)”游戏。 从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯A, B来说,无论对方如何选择“坦白”都是各自的最优选择。
表示双方在不同策略选择组合下各自得到的支付,较大数字代
表较大利益或效用。例如,在厂商A和B分别选择上和左代表的
策略时,左上角方框的数字“1,2”表示A和B分别得到的支付。
同理, A和B分别选择策略下和右时,它们分别得到右下角方框
数字“1,0”代表的支付。
ห้องสมุดไป่ตู้
厂商B
左
右
上
厂商A
下
1,2 2,1
0,1 1,0
解答这一问题,A需要把自己放在B的位置,从B的角度看什么是最好的选择, 并在此基础上考虑自己的选择。支付矩阵表明B有一个支配策略:不论A选择 如何,B选择做广告时利益较大(5,8对0,2),因而A可以判断B会选择做 广告。而在B做广告时,A应当选择做广告。因而,均衡结局是双方都做广告。
厂商A
做广告 不做广告
做广告 10,5
厂商B 不做广告
15,0
6,8
20,2
8
完全信息静态博弈:纳什均衡
上述均衡结果被称作纳什均衡(The Nash Equilibrium)。纳什均衡 指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳 什均衡状态下,只要其它参与者不变换策略选择,任何单个参与 者不可能单方面通过变换策略来提高他的所获支付。美国数学家 和统计学家纳什(Nash)50年代提出这一概念,所以称作纳什均 衡。
虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保 持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)等 竞争性动机阻碍了它们达到更好的互利选择,它们面临“囚徒困 境”。我们将看到,寡头垄断厂商经常面临类似的困境。
囚徒困境告诉我们,不满足纳什均衡的协议是无效的。
坦白
囚犯B
保持沉默
囚犯A
坦白
保持 沉默
A坐3年牢 B坐3年牢
A坐10年牢 B坐3个月牢
A坐3个月牢 B坐10年牢
A坐1年牢
B坐1年牢
7
完全信息静态博弈:纳什均衡
支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵 表示的博弈中,厂商A,B在选择做广告问题上存在的策略关系。其中厂商A 没有支配策略。因为A的最佳决策取决于B的选择。例如,当B选择做广告时, A应当选择做广告,由此得到10而不是6的支付得益;然而,当B选择不做广告 时,A应当选择不做广告,从而得到20而不是15的支付得益。假定两个厂商需 要同时决策,A应当如何决策?
9
完全信息静态博弈:纳什均衡
一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策 略),有时又可能不存在纳什均衡。下面左表存在两个纳什均衡:
其中“上,左”是纳什均衡(A选上,则B选左;且B选左时A仍 应选上);“下,右”也是纳什均衡(A选下,则B选右;且B选 右时A仍应选下)。如没有更多信息,则无法判断均衡在什么位 置。右表没有纳什均衡。如A选“上”,B则选“左”;然而当B 选“左”时,A却应当选“下”。反之,A选“下”时,B应选 “右”;然而当B选右时,A又应选“上”。没有均衡点。
不完全信息
不完全信息静态博弈; 不完全信息动态博弈;
贝叶斯纳什均衡;
精炼贝叶斯纳什均衡;
海萨尼(1967-1968)
泽尔腾(1975), Kreps和Wilson (1982),Fudenberg 和Tirole(1991)
3
博弈论与策略行为(1):学科概念
博弈论(Game Theory)又名对策论,游戏论。顾名 思义,是一门研究互动关系的游戏中参与者各自选择 策略的科学,换言之,是研究机智而理性的决策者之 间冲突及合作的学科。博弈论把这些复杂关系理论化, 以便分析其中的逻辑和规律,并对实际决策提供指导 或借鉴。
第九讲 博弈论
1
博弈论
完全信息静态博弈:纳什均衡 完全信息动态博弈:子博弈精炼纳什均衡 不完全信息静态博弈:贝叶斯纳什均衡 不完全信息动态博弈:精炼贝叶斯均衡
2
博弈的分类及对应的均衡概念
行动顺序 信息
完全信息
静态
完全信息静态博弈; 纳什均衡; 纳什(1950,1951)
动态
完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965)