西方经济学博弈论全解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论初步
博弈论与主流经济学的发展

传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
制是完美的,帕累托最优成立,平等与效率可以兼顾。然而 在以下情况不成立: 非完全竞争:垄断越来越普遍 外部性:市场不可能把所有的成本收益都计算在内 公共产品:市场无非解决“搭便车”问题 逆向选择问题:柠檬市场

道德风险问题:为什么市场的交易费用比较高?
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略 博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学

博弈论与主流经济学的发展

传统微观经济学与博弈论的比较
传统微观经济学的个人决策是在给定一个价格参数和收入
的条件下最大化自己的效用,个人的效用与其他人无关, 所有其他人的行为都被总结在“价格”参数之中 博弈论中,个人效用不仅依赖于自己的选择,还以来于他 人的选择,研究在存在外部经济条件下的个人选择问题 事实上,行为主体的数量通常不多,相互之间存在明显影响 经济学对博弈论寄予厚望,认为用博弈论可以重写经济学 原理 博弈论改写经济学,从放宽新古典的完全竞争和完全信息 两个条件展开
博弈论的代表人物及其贡献
1944年,J· 冯· 诺依曼、O· 摩根斯坦恩在《博弈 理论与经济行为》首先提出一些博弈论的概念。 1994年,纳什、泽尔腾和海萨尼获得诺贝尔 经济学奖。 1996年,莫里斯和维克里获得诺贝尔经济学奖。 2001年,阿克洛夫、斯蒂格利茨和斯宾塞获得 诺贝尔经济学奖 2005年,奥曼和谢林获得诺贝尔经济学奖。
一、什么是博弈论:从“囚徒困境”谈 起 囚徒困境
两个小偷甲和乙联手作案,私入民宅被警方 逮住但未获证据。警方将两人分别置于两间房间 分开审讯,政策是若一人招供但另一人未招,则 招者立即被释放,未招者判入狱 10 年;若二人都 招则两人各判刑8年;若两人都 不招则未获证据但因私入民宅 各拘留1年。
表1
囚徒困境博弈


不招 0,-10 -1,-1

甲 不招
-8,-8 -10,0
(问题:甲、乙如何选择?)
尽管甲不知乙是否招供,但他认为 自己选“招”最好,因而甲会选择 “招”,乙也同样会选择“招”,结果 各判8年;但若两人都不招,结果是两人 只被判1年,但这种结果是不会出现的。 我们可以运用“剔除劣战 略”的方法来获得这样的结果。
甲或乙可以作出的选择 被称为“战略”,如“招”
或“不招”都是战略。
思想
“囚徒困境”博弈的经济和社 会意义在于,个人理性不一定 导致集体理性,或者说人人为 自己未必导致整体利益。 这与市场机制的思想是不同的。 不过,两者是相辅相成的。


囚徒困境的几个事例: 价格大战 两个寡头企业选择产量 军备竞赛 做广告 围观时踮脚尖 应试教育 贸易自由与壁垒,地方保护主义
博弈论要点

博弈:决策主体在互相对抗中,对抗双方 (或多方)互相依存的一系列策略和行动的 过程集合
参与人的利益有冲突
博弈是一个过程集合(参与人、策略、行动、
信息等)。把博弈视为集合是思维从具体到抽 象的重要一步 博弈的一个本质特征是策略的相互依存性

博弈论:专门研究博弈如何出现均衡的规 律的学问
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用) 博弈有不同的种类:

从行动顺序角度:
静态博弈。参与人同时选择行动 动态博弈。参与人的行动有先后顺序

从拥有信息角度:
完全信息博弈。每个参与人对所有其他参与人的特征、 战略空间、支付函数有准确的知识 不完全信息博弈。

博弈的分类与对应的均衡概念
行动顺序/ 信息状况
完全信息 不完全信息
静 态
完全信息静态博弈; 纳什均衡
动 态
完全信息动态均衡;子 博弈精炼纳什均衡
不完全信息静态均衡; 不完全信息动态均衡; 贝叶斯纳什均衡 精炼贝叶斯纳什均衡
静态博弈:博弈中参与人同时选择行动或虽非同时但后行动者并 不知道前行动者采取什么行动;动态博弈(序贯博弈):参与人 的行动有先后顺序,且后行动者能够观察到先行动者所选择的行 动。 完全信息指的是每个参与人对所有其他参与人(对手)的特征、 战略空间及支付函数有准确的知识,否则就是不完全信息。
博弈的种类
合作博弈与非合作博 弈
厂商之间的经济博弈可以是合 作的,也可以是非合作的。 区别在于是否存在一个有约 束力的协议。如果有,就是 合作博弈;如果没有,就是 非合作博弈。前者强调团体 理性,即效率、公平和公正; 后者强调个人理性和个人最 优决策。
同时博弈与序贯博 弈 前者是博弈各方在 不了解对方情况下 制定决策;后者是 一方看到另一方的 行动之后再采取行 动。
一次博弈与重复博 弈
博弈行动只进行一次的是 一次博弈;博弈行动进行 多次的是重复博弈
双人博弈与 多 人博弈
前者只有两人参加行动, 后者有多人参加行动
零和博弈与非零 和博弈
在零和博弈中,一方 之所得即为另一方之 所失; 在非零和博弈中,双 方的得失取决于各自 选择采取的行动。
二、同时博弈:纯策略博弈
同时博弈与序贯博弈
同时博弈是参与人同时进行决策或行动的博弈;
所谓同时或先后主要是看参与人在决策时是否已经知道 其他参与人的决策
序贯博弈是参与人的决策和行动有先有后的博弈。
支付矩阵(也称报酬矩阵)被用来描述和分析 一个博弈。
占优策略
无论其他参与者采取什么策略,某参与者都存在 唯一的最优策略选择,这一最优策略就是他的占 优策略。 如果某个参与者具有占优策略,那么,无论其他 参与者选择什么策略,该参与者确信自己所选择 的唯一策略都是最优的。
博弈均衡
指博弈中的所有参与者都不想改变自己的策略的 一种状态。
纳什均衡
是指这样一种状态,任何一个参与者都不会改 变自己的策略,如果其他参与者不改变策略; 在该策略组合上,任何参与人单独改变策略都 不会得到好处;
条件策略下划线法
条件策略,参与人给定条件下的相对优势策略, 如甲厂商在乙厂商选择合作条件下的条件(优 势)策略为不合作。 首先用下划线表示甲厂商的条件策略 其次用下划线表示乙厂商的条件策略 最后找到在两个数字之下都画线的单元格即为 博弈的均衡。
纳什均衡
智猪博弈(boxed pigs) 猪圈中有一头大猪和一头小猪,在猪圈的 一端设有一个按钮,每按一下,位于猪 圈另一端的食槽中就会有 10 单位的猪食 进槽,但每按一下按钮会耗去相当于2单 位猪食的成本。如果大猪先到食槽,则 大猪吃到 9 单位食物,小猪仅能吃到 1 单 位食物;如果两猪同时到食槽,则大猪 吃 7 单位,小猪吃 3 单位食物;如果小猪 先到,大猪吃 6 单位而小猪吃 4 单位食物。 表4给出这个博弈的支付矩阵。

小猪 按 大猪 按 等待
5, 1 9,-1
4, 4 0, 0
等待
小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略 此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按 这是一个“多劳不多得,少劳不少得”的均衡
股市博弈
在股票市场上,大户是大猪,他们要进行技 术分析,收集信息、预测股价走势,但大量散户 就是小猪。 他们不会花成本去进行技术分析,而是跟着 大户的投资战略进行股票买卖,即所谓“散户跟 大户”的现象。
为什么中小企业不会花钱去开发新产品?
在技术创新市场上,大企业是大猪,它们投入大量 资金进行技术创新,开发新产品,而中小企业是 小猪,不会进行大规模技术创新,而是等待大企 业的新产品形成新的市场后生产,模仿大企业的新 产品的产品去销售。
三、序贯博弈
在序贯博弈中,参与人的决策有先有后,特别是, 后行动的参与人可以观察到先行动的参与人已经 采取了的策略。 在图中,有两个房地产开发商A和B分别决定 在同一地段上开发一栋写字楼。由于市场需求有 限,如果他们都开发,则在同一地段会有两栋写 字楼,超过了市场对写字楼的需求,难以完全出 售,空置房太多导致各自亏损1百万。
当只有一家开发商在这个地段
开发一栋写字楼时,它可以全部售
出,赚得利润 1 百万。假定 A 先决策,
B在看见A的决策后再决策
是否开发写字楼。在图中, 用“博弈树”表示博弈过程。
开发 B 开发
A
不开发 B
不开发
开发
不开发
(-1,-1)
(1,0)
(0,1)
(0,0)
房地产开发博弈

在其中每一条“路径”的末端用向 量给出A和B的支付,称为支付向量。 下面用“逆向归纳法”可以求解这 个博弈。在 B 进行决策的 2 个“决策结” 上,B在左边的决策结上选择“不开发”; 而在右边的决策结上选择“开发”。即 给定 A 开发, B 就不开发;给定 A 不开发, B 就开发。 B 应避免同时与 A 都选择开发 而蒙受损失。

在这种情况下, A在自己的决策结上当然 选择“开发”,因为他预计当自己选择“开发” 后, B 会选择“不开发”,自己就净赚一百万。 当B威胁A说:“不管你是否开发,我都会在这 里开发写字楼。”倘若A将B的话当了真,A就 不敢开发,让 B 单独开发写字楼占便宜。但是, B的威胁是“不可置信”的。 当 A不理会B的威胁而果断地开发出一栋 写字楼时, B 其实不会将事前的威胁付诸实施。 因为“识时务者为俊杰”,在 A 已开发的情况 下, B 的最优决策是 “不开发”而不是“开 发”。
但是,如果B在向A发出威胁的 同时又当着A的面与第三者C 打赌一 定要在该地段上开发出一栋写字楼, 否则输给 C 2 百万元。 B 与 C 为此签 定合同并加以公证有效。
思考:这时情况又会发生什么 样的变化呢?
情侣博弈
妻子

足球 芭蕾

( 2, 1 ) ( 0, 0 ) (-1,-1)
足球
丈夫


芭蕾
妻子 足球


芭蕾
◆(1,2)
先动优势
在夫妻博弈中,有两个纳什均衡,即(足球, 足球)和(芭蕾,芭蕾),前者对男方更加 有利,后者对女方更加有利,但是由于男方 是先行动者,通过逆向归纳法得到的最终结 果就是对男方更加有利的纳什均衡。 先动优势
先行动者的得益大于后行动者
每天读点博弈论
零和游戏:双赢和多赢才是正道 智猪博弈:做一头聪明的小猪 纳什均衡:合作是有利的“利己策略” 柠檬理论:逆向选择的困惑 ……

相关文档
最新文档