经济博弈论

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 1 1 1 1 (1) 2 2 2 2 11111(1) 0 2 2 2 2
零和博弈!
应用例子
本博弈中两博弈方决策的第一个原则是不
能让对方知道或猜到自己的选择,因而 必须在决策时利用随机性。第二个原则 是他们选择每种策略的概率一定要恰好 使对方无机可乘。
设博弈方1选A的概率为pA,选B的概率为pB, 博根弃据方上2述选第C二的个概原率则为,pC博,弈选方D的1选概A率和为Bp的D。 概 率,一定要使博弈方2选C的期望得益和选D的
诺贝尔经济学奖
1968年,瑞典中央银行成立300周年, 是为了纪念诺贝尔奖奖金提供者,设 立诺贝尔经济学奖。
1969年开始颁发。
从游戏到博弈
游戏的特点:下棋,打牌,赌胜,田径, 球类等等,共同的特点是 策略 策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略 和利益的依存性
什么是博弈论?
纳什均衡的一致预测性
如果所有博弈方预测到一个特定的纳什 均衡将会出现,那么,没有人有兴趣作 不同的选择。
纳什均衡的特征:博弈方预测到均衡, 博弈方预测到其他博弈方预测到均衡, 等等。
一致性预测,并不意味着纳什均衡一定 是一个好的预测。
纳什均衡应用
两个嫌犯受到指控,但除非至少一个招认, 否则警方不能将二人判有罪。警察把二人 分别带到不同的房间,告之后果:
我们常用G表示一个博弈; 如G有n个博 弈方,每个博弈方的全部可选策略的集 合我们称策略空间,分别用 S1,,Sn表示; 用 s表ij 示Si博弈方i的第j个策略,其中j可 取有限个值(有限策略博弈),也可取无限 个值(无限策略博弈);博弈方i的得益则 用 u 表i 示,u i 是各博弈方策略的多元函数。 n个博弈方的博弈G常写成
Selten and Harsanyi
泽尔腾(1965)将纳什均衡的概念引入了动 态分析,提出了“精炼纳什均衡”概念;以 及进一步刻画不完全信息动态博弈的“完备 贝叶斯纳什均衡”。
而海萨尼则发展了刻画不完全信息静态博弈 的“贝叶斯纳什均衡”(1967-1968)。总 之,他俩进一步将纳什均衡动态化,加入了 接近实际的不完全信息条件。他们的工作为 后人继续发展博弈论,提供了基本思路和模 型。
如果二人均不坦白,将被判入狱一年。 如果双方均坦白,将被判入狱5年。 如果一方坦白,另一方不坦白,坦白一 方立即释放,另一方判入狱8年。
囚徒2
不坦白
Hale Waihona Puke Baidu
坦白
囚徒1
不坦白 -1,-1 -8, 0
坦白
0,-8 -5,-5
囚徒困境说明了什么
在(坦白、坦白)这个组合中,A和B都不能 通过单方面的改变行动增加自己的收益,于是 谁也没有动力游离这个组合,因此这个组合是 纳什均衡,也叫非合作均衡。
方决策的好坏就会从平均得益上反映出
来,策略运用得当平均收益会较理想, 至少是不吃亏,否则平均得益就会很差。
概念的引进
在这种博弈中各博弈方决策的第一个 原则:自己的策略选择千万不能预先 被另一方侦知或猜到。
这就是说博弈方必须随机地选择策略。
其次,在本博弈中,如果盖硬币方虽然 是随机决定出正面还是反面,但如果 在总体上出正面多于出反面,即出正 面的概率大于出反面的概率,则猜硬 币方还是有机可乘。
第六章 完全信息静态博弈
博弈的基本概念 纳什均衡 纳什均衡应用 混合策略和混合策略纳什均衡
伐木工人的决策和一个将军的决策有什 么不同?
木头没有反抗。
将军的每一步计划都会引来抵抗,他必 须克服这种抵抗。
你!你的对手、竞争者都是聪明有主见 的!
社会科学研究策略性决策制定过程的分 支称为- 博弈论。
海萨尼(1967-1968)
不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
纳什均衡
纳什均衡的定义 纳什均衡的一致预测性 纳什均衡与严格下策反复消去法
纳什均衡的定义
各博弈方都不愿或不会单独改变自己 策略的策略组合,只要这种策略组合 存在且是唯一的,博弈就有绝对确定 的解。这种各博弈方都不愿单独改变 策略的策略组合就是博弈论中最重要 的一个概念——“纳什均衡”。
u
e 2
pC[ pAu2 ( A,C )
p B u 2 ( B , C )]
p D [ p Au 2 ( A, D ) p B u 2 ( B , D )]
0.8[0.8 3 0.2 1] 0.2[0.8 2 0.2 5]
从“纳什均衡”我们引出了“看不见的 手”的原理的一个悖论:从利己目的出 发,结果损人不利己,既不利己也不利 他。两个囚徒的命运就是如此。从这个 意义上说,“纳什均衡”提出的悖论实 际上动摇了西方经济学的基石。
研究囚徒困境问题的目的
利用这种困境达到有利于社会的目的 政府在经济活动中的组织协调工作的 必要性 避免囚徒困境
囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择不坦白,各判刑1年,显然 比都选择坦白各判刑8年好得多。当然,A和 B可以在被警察抓到之前订立一个“攻守同 盟”,但是这可能不会有用,因为它不构成纳 什均衡,没有人有积极性遵守这个协定,显然最 好的策略是双方都不坦白。
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个 “纳什均衡”,也是对所有人都不利的 结局。他们两人都是在坦白与不坦白策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
博弈方(局中人)----参与博弈但利益不完 全一致者。有二人博弈与多人博弈之分。
策略集----每个局中人都会有一系列的策略 可选,称为对应于每个局中人的策略集。 有限和无限个对策。
得益----在每策略组合下每一局中人的得益 情况,是选择策略的标准,称为得益函数 或支付函数。
博弈的关键
局中人理性地采取或选择自己的策略 行为,在相互制约相互影响的依存关系 中,尽可能的提高自己的利益所得,这 样,博弈论就是关于包含相互依存情况 中理性行为的研究。
相对于这种以一定概率分布在一些策略
中随机选择的混合策略,确定性的具体 的策略我们称为“纯策略”,而我们原 来意义上的纳什均衡,即任何博弈方都 不愿单独改变策略的纯策略组成的策略 组合现在可称为“纯策略纳什均衡”。 当然,纯策略也可以看作混合策略的特 例。
纯策略可以看作,选择相应纯策略
的概率为1,选择其余纯策略的概率 为0的混合策略。混合策略可以看作 纯策略的扩展。
数学界的梵高——“疯子天才”纳什
三位大师主要的贡献
1950年和1951年纳什的两篇关于非合作 博弈论的重要论文,彻底改变了人们对 竞争和市场的看法。他证明了非合作博 弈及其均衡解,并证明了均衡解的存在 性,即著名的纳什均衡。从而揭示了博 弈均衡与经济均衡的内在联系。因为在 现实世界中,非合作博弈要比合作博弈 普遍得多。
u i ( s 1 * , , s i * 1 , s i * , s i * 1 , s n * ) u i ( s 1 * , , s i * 1 , s i, s j i * 1 , s n * )
对任意 sij Si 都成立,则称 (s1*,,sn*) 为G 的一个“纳什均衡”。
引进了混合策略的概念以后,我们可将
纳什均衡的概念扩大到包括混合策略的 情况。对各博弈方的一个策略组合,不 管它是纯策略组成的还是混合策略组成 的,只要满足各博弈方都不会想要单独 偏离它,我们就称之为一个纳什均衡。 如果确实是一个严格意义上的混合策略
组合构成的纳什均衡,称为“混合策略 纳什均衡”。
猜硬币博弈中两博弈方都以(1/2,1/2)的概 率分布随机选择正面和反面的混合策略组合, 就是一个混合策略纳什均衡。 期望得益:
设盖硬币方出正面的概率为p,则出反面 的概率为1-p.出正面多于出反面,即 p>1-p或p>1/2。在这种情况下,如
猜硬币方全猜正面,则他的期望得益:
p 1 (1 p )( 1 ) 2 p 1 2 (p 1 ) 0 2
即平均来讲,猜硬币方一定是赢多输少。
双方都按照上述概率随机选择策略,即 在本博弈中,博弈方的决策内容不是确 定性的具体的策略,而是在一些策略中 随机选择的概率分布,这样的决策我们 称为“混合策略”。
期望得益相等,即:
u2CpA3pB1pA2pB5u2D 因为 pApB1 所以 pA0.8, pB0.2
这是博弈方1的混合策略。
同理,博弈方2的混合策略为
pC0.8, pD0.2
博弈方1以(0.8,0.2)的概率随机选择A和B, 博弈方2以(0.8,0.2)的概率随机选择C和 D,由于这时谁都无法通过改变自己的 混合策略(概率 分布)而改善自己的得益 (期望得益)、因此这样的混合策略组合 是稳定的,是一个混合策略纳什均衡。
该混合策略纳什均衡的期望结果(即双方的
期望得益)分别为:
u
e 1
p A[ pCu1( A,C )
p D u1 ( A, D )]
p B [ pC u1 ( B , C ) p D u1 ( B , D )]
0.8[0.8 2 0.2 5] 0.2[0.8 3 0.2 1]
2.6
定义
在博弈 G S 1 , ,S n ;u 1 , ,u n 中;博弈
方i的策略空间为 S i si1, ,si k,则博弃
方i以概率分布 pi(pi1, ,pik ) 随机在
其k个可选策略中选择的“策略”,称为
一个“混合策略”,其0 中p ij 1 对 j 1 , ,k 都成立,

pi1 pik1
混合策略纳什均衡
混合策略 混合策略博弈 混合策略纳什均衡 混合策略和严格下策反复消去法
许多现实中决策问题构成的博弈中根本
不存在具有稳定性的各博弈方都接受的 纳什均衡策略组合如猜硬币博弈和齐威 王田忌赛马,而另一些博弈却有多于一 个的纳什均衡策略组合,如夫妻之争博 弈。这两类博弈如果只进行一次,实际 结果如何确实取决于机会和运气,如果 多次独立反复进行这些博弈,这样博弈
严格讲,博弈论不是经济学的一个分支, 它是一种方法,涉及到很多领域:
实际上,博弈论是数学的一个分支。
策略故事
妙手传奇 给猫拴个铃铛 多管齐下 三思而后行
引言
博弈论 诺贝尔经济学奖 纳什(Nash) (1950-1951) 泽尔腾(selten) (1965,1975) 海萨尼(Harsanyi) (1967-1968) 共同获得1994年诺贝尔经济学奖
博弈论:就是关于包含相互依存情况中理性 行为的研究。 相互依存 :通常是指博弈中的任何一个局中 人受到其他局中人的行为的影响,反过来, 他的行为也影响到其他局中人。
相互依存的另一个方面是局中人可以有某些 共同的兴趣或利益所在。
“理性行为”的说明:博弈论中的所谓理性, 一般不是指道德标准。
博弈三要素
G S 1 , ,S n ;u 1 , ,u n
定义
在博弈 G S 1 , ,S n ;u 1 , ,u n 中,如果
由各个博弈方的各一个策略组成的某个策略组
合是对(s其1*, 余,博sn*弈) 中方,策任略一的博组弈合方i的策略
s
* i
,都
(s1 *, ,si* 1,si* 1, sn *) 的最佳策略,即
相互依存 理性行为
博弈的四种分类情况
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
博弈的分类及对应的均衡
完全 信息
静态
完全信息静态博弈; 纳什均衡; Nash(1950)
动态
完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965)
不完 全信 息
不完全信息静态博弈; 贝叶斯纳什均衡;
双寡头削价竞争
寡 高价 头
2 低价
寡头1 高价
100,100
150,20
低价
20,150
70,70
对经典经济学的冲击
“纳什均衡”首先对亚当·斯密的“看不见 的手”的原理提出挑战。按照斯密的理 论,在市场经济中,每一个人都从利己 的目的出发,而最终全社会达到利他的 效果。
《国富论》:“通过追求(个人的)自身利 益,他常常会比其实际上想做的那样更 有效地促进社会利益。”
相关文档
最新文档