五讲博弈论基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 博弈论导论
➢博弈论的基本概念
1.参与人:博奕中选择行动以最大化自己效用的决 策主体(个人、团体、国家、企业)。
2.行动:参与人的决策变量。用ai表示第i个参与人 的一个特定行动,Ai={ai}表示可供i选择的所有行动 的集合。
n人博奕中,n个参与人的行动的有序集 a=(a1…ai…an)称为行动组合。 注:博奕论中,一般假定参与人的行动空间和行动 顺序是所有参与人的共同知识。
第一节 博弈论导论
▪博弈论又称对策论,它与决策论的区别: 决策论指决策者依据自然环境、状态、条件做出最 有利于自己的选择,是“人与自然的博弈”,自然 不会对人的选择做出应对性的反应。决策方法有熵 决策法、多属性多目标决策、群决策、随机决策、 模糊决策、线性规划决策等。
博弈论是多个能对其他可以做出应对性反应的参与 方做出应对性反应的决策方法,其中参与各方都具 有理性假设,都是具有决策能力的。
➢ 以交通事故为例:司机开车可能伤害他人,但要 每个司机与所有可能的受害人签定合同是不可能 的,有关交通的法律法规(侵权赔偿)替代了合 同;
➢ 但法律面临信息约束。
第一节 博弈论导论
➢什么是博弈论(Game theory) 研究决策主体的行为直接发生相互作用的时候,主体 如何决策以及决策的结果(均衡)是什么。
▪80年代克瑞普斯和威尔逊引入不完全信息重复博弈
第一节 博弈论导论
▪1994年纳什(Nash)、泽尔腾(Selten)、海莎尼 (Harsanyi)被授予诺贝尔经济学奖。 2.国内 ▪国内学者对博弈论的发展没有开创性的贡献。 ▪90年代初一批留学人员归国,引入“博弈论与信息经 济学”,其中以北大教授张维迎的《博弈论与信息经 济学》(1996年出版)一书最引人注目。
➢ 因此,无论初始产权如何安排,双方谈判可以实现帕累托 最优。
➢ 科斯定理意味着:如果没有交易成本,公司治理结构(包 括股权结构)是无关紧要的
交易成本与次优选择
➢ 定义:交易成本包括所有与交易有关的成本,包 括发现交易对象的成本、谈判成本、签约成本、 执行成本,以及所有可能的效率损失(与帕累托 最优相比);
博奕论前提假设:博弈的参与者都是理性人 ✓ 所谓理性人是指有一个很好定义的偏好,在面临给定的约束 下最大化自己的偏好。 ✓ 理性人可能是利己主义者,也可能是利它主义者。
第一节 博弈论导论
例:囚徒困境
囚徒A
坦白 抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为:A、B都选择坦白,各判8年刑
个人最优决策与社会最优
➢理性人的最优决策:边际个人成本等于边 际个人收益;
➢社会最优决策(帕累托最优):边际社会 成本等于边际社会收益;
➢因此,除非没有外部性,个人最优决策不 等于社会最优决策。
图示说明:社会成本大于个人成本
公海捕鱼为例
边际成本 与
边际收益
边际社会成本
边际外部成本
边际个人成本
边际个人收益 (等于边际社会收益)
➢革命通常不是一个帕累托改进。
外部性与科斯定理
➢个人收益与社会收益:一项活动的社会收 益等于决策者个人得到的收益加社会其他 成员得到的收益,如养花;
➢个人成本与社会成本:社会成本等于决策 者的个人承担的成本加社会其他成员承担 的成本,如环境污染,交通堵塞;
➢如果个人收益(/成本)不等于社会收益, 我们说存在外部性。
问题:现王二需要4颗野人参治疗某种疾病,他自己上山采摘划 算还是向张三购买划算?
应用:社会改革
➢如果改革中没有人受损,至少有一些人受 益,改革就是一个帕累托改进;
➢如果改革使一部分人受益,另一部分人受 损,但受益者所得大于受损者所失,改革 是一个卡儿多-希克斯改进,或者说,潜在 的帕累托改进;如果受损者得到足够的补 偿,就是一个帕累托改进;
➢比如说:夜间唱歌
科斯定理图示
农场主的边际净损失
牧羊的边际利润
S
P
O
社会最优量
牧养人放牧的数量
说明
➢ 如果产权归农场主,农场主可以禁止放牧(点0),小于 社会最优量S;但此时,增加放牧给牧羊人带来的边际利 润大于给农场主造成的损失,牧羊人将有积极性贿赂农场 主,直到放牧量达到S为止;
➢ 如果产权归牧羊人,牧羊人的利润最大点是P,大于社会 最优量S;但此时,减少放牧量对牧羊人的边际利润损失 小于给农场主节约的边际成本,所以,农场主将有积极性 贿赂牧羊人,直到S;
➢ 交易成本存在的原因:
✓ 交易者的数量(人越多,达成本协议越难) ✓ 信息不对称(信息越不对称,谈判越难,合同的执行
也越难)
➢ 交易成本意味着:只有次优,没有最优;
作为激励机制的法律
➢ 法律通过责任的分配和赔偿/惩罚规则是实施,将 个人行为的外部成本内部化,诱导个人选择社会 最优的行动;
➢ 如果个人之间签约的交易成本太高,法律可以节 约交易成本;
第一节 博弈论导论
3.战略:是参与人选择行动的规则,他告诉参与人在什么 时候选择什么行动。用si表示第i个参与人的一个特定战 略,Si={si}代表第i个参与人的所有可能选择的战略的集合。 n维向量s=(s1,…,si,…sn)称为一个战略组合。
注:战略与行动是两个不同的概念,战略是行动规则,规 定什么时候采取什么行动。
4.信息:指参与人在博奕中的知识,特别是有关“自然” 的选择,其它参与人(对手)的特征和行动的知识。
注:与信息有关的一个重要概念是共同知识,它指“所有 参与人知道,所有参与人知道所有参与人知道,所有参与 人知道所有参与人知道…”的知识。
第一节 博弈论导论
例:空城计与共同知识
懿果见孔明坐于城楼之上,笑容可掬,焚香操琴。城门内外,有 十余百姓,低头洒扫,旁若无人。懿见毕大疑,急令军速退。次子 司马昭曰:“莫非诸葛亮无军,故作此态?父亲何故退兵?”懿曰: “亮生平谨慎,不曾弄险。今城门大开,必有埋伏。宜速退”。见 魏兵退去,众人无不骇然,乃问孔明曰:“司马乃魏之名将,今统 十五万精兵到此,见了丞相,便速退去,何也?”孔明曰:“此人 料吾生平谨慎,必不弄险;见此模样,疑有伏兵,所以退去。吾非 行险,盖不得已而用之”……“吾若为司马懿,便不速退也”
第一节 博弈论导论
“囚徒困境”的博弈树
A
坦白
B 坦白
抵赖
(-8,-8) (0,-10)
抵赖 坦白
B 抵赖
(-10,0) (-1,-1)
均衡结果为:A、B都选择坦白,各判8年刑
第一节 博弈论导论
注意理解: 1.纳什均衡是如何产生的? 2.囚徒困境反映的个人理性与集体理性的矛盾性。 3.现实中那些问题属于囚徒困境问题? 彩电业的价格联盟、人民公社制度的效率低下、 公海捕鱼(外部性与科斯定理) 、军备竞赛、改革与搭 便车等 4.纳什均衡的哲学思想:只有构成纳什均衡的协议,才没 有人有积极性偏离协议规定,才能被参与人自动、自觉的 实施。
试问:“空城计”中双方是否满足拥有“共 同知识”的要求?
第一节 博弈论导论
司马知孔明“平生谨慎,不曾弄险”-退兵 孔明知<司马知孔明“平生谨慎,不曾弄险” >-空 城计 司马不知“孔明知<司马知孔明“平生谨慎,不曾弄 险” >”-退兵 孔明知司马不知“孔明知<司马知孔明“平生谨慎, 不曾弄险” >” -空城计
➢ 个人最优与社会最优的不一致意味着有帕累托改 进的余地;
➢ 核心是如何将外部性内部化:如果有办法使得个 人在边际上承担全部的社会成本和获得全部的社 会收益,问题就解决了;
➢ 传统的理论:政府管制或对个人征收皮古税(或 补贴);
➢ 在负外部性的情况,征税和补贴代表不同的产权 安排。
皮古税或补贴如何解决问题?
五讲博弈论基础
几个经济学概念
效率标准
➢ 问题:社会是由人组成的,每个人的行为都会影 响到他人的利益。那么,我们用什么样的标准判 断个人的行为是否正当?
➢ 考虑两种情形:
✓ 情形A:某店主雇人将竞争对手的店门堵上,使后者不 能营业;
✓ 情形B:某店主以更低的价格和更优良的服务将竞争对 手打垮。
➢ 这两种情形有什么不同?为什么法律允许第二种 情形而不允许第一种情形?
边际成本 与
边际收益
边际社会成本 (加税后的边际个人成本)
边际税率=边际外部成本
边际个人成本(无税情况)
边际个人收益 (等于边际社会收益)
社会最优产量 个人最优产量 产量
科斯定理
➢Coase(1960):只要产权界定是明晰的, 如果交易成本为零,外部性可以通过当事 人之间谈判解决,帕累托效率可以实现; 并且,最终的资源配置与初始的产权安排 无关。
➢博弈论的历史发展 1.国外
▪产生的标志:1944年冯·诺伊曼和摩根斯坦恩合作《博弈 论和经济行为》
▪50年代是博弈论巨人出现的年代:纳什(Nash)提出纳什 均衡概念、塔克尔( Tucker )讨论了“囚徒困境”。
▪60年代泽尔腾(Selten)引入动态博弈分析,提出“精练纳 什均衡”概念;海莎尼(Harsanyi)引入不完全信息博弈.
两人社会为例
B
的 收 。H 入
从Z到F、X是帕累托改进; 从Z到H、G不是帕累托改进; 从H、G到X、F、Z都不是帕累托改进
。X
。F 。Z
。G
A的收入
卡尔多-希克斯(Kaldor-Hicks)标准
➢ 设想:状态X下,A的收入是100,B的收入也是 100;在状态Y下,A的收入是1000,B的收入是 99。依帕累托标准,这两个状态是不可比较的: A在状态Y下更好,B在状态X下更好。
社会最优产量 个人最优产量 产量
图示说明:社会收益大于个人收益 养花为例
边际成本 与
边际收益
边际个人成本(等于边际社会成本)
边际社会收益
边际个人收益
个人最优产量 社会最优产量
产量
举例
➢环境污染; ➢夜间施工; ➢交通事故; ➢垄断定价; ➢国有企业的恶性竞争; ➢教育;
政府管制、皮古税与科斯定理
第一节 博弈论导论
➢博弈的分类
▪博弈分类所涉及的概念
1.静态博奕:指博奕中,参与人同时选择行动或虽非同时但后行动 者并不知道前行动者采取了什么具体的行动 2.动态博奕:指博奕中,参与人的行动有先后顺序,且后行动者能 观察到先行动者所选择的行动。 3.完全信息:指每一个参与人对所有其它参与人(对手)的特征、 战略空间及支付函数有准确的知识;否则即为不完全信息。
第一节 博弈论导论
5.支付函数:是指在一个特定的战略组合下参与人 获得的确定效用水平,或是参与人得到的期望效用 水平,它是所有参与人战略或行动的函数,是每个 参与人真正所关心的。 6.结果:是博奕分析者感兴趣的要素的集合,如均衡 战略组合,均衡行动组合,均衡支付组合等。 7.均衡:是所有参与人考虑到其他参与人做出理性 反应的前提下的最优战略或行动的组合,
问题:“一个两人世界构成的经济 中,甲比乙做任何工作的产出都高 ,则对甲来说,交易是不必要的” 。这个判断对吗?
?
下图是张三和王二在东北野外原始森林中的生产信息。假设野人
参和野灵芝生长在不同的两座高山上,一个人一天只能采摘其中一
种。
单位:一天
姓名 采摘野人参
ห้องสมุดไป่ตู้
采摘野灵芝
张三 3
2
王二 4
6
假设野人参与野灵芝的价值相当,都为200元。
帕累托改进与帕累托标准
➢ 定义:一种变革没有使任何人的处境变坏,至少 有一个人的处境变好。
➢ 如果一种状态不是帕累托最优,意味着存在帕累 托改进的可能。
➢ 如果社会已经处在帕累托最优状态,就不可能有 帕累托改进的余地。
➢ 状态X帕累托优于状态Y,如果在状态X下,至少 有一个人的处境比状态Y下更好,而没有任何人 的处境比在状态Y下坏。
➢ 卡尔多-希克斯标准:如果一种变革使得受益者的 所得足以弥补受损者的所失,这种变革就是一个 卡尔多-希克斯改进。如果补偿实际发生,就是帕 累托改进。因此,“卡尔多-希克斯标准”就是 “财富最大化”。
应用:交易效率
➢ 人们为什么交易:
✓ 偏好不同; ✓ 生产成本不同; ✓ 信息不同; ✓ 风险态度不同。 ➢ 自愿的交易一定是一个帕累托改进(假定没有欺诈) ➢ 设想:A拥有10个苹果,0个桃;B拥有0个桃,10个苹果。 如果边际效用是递减的,A用5个苹果换B的5个桃,对双 方是一个帕累托改进;交易的结果:各有5个苹果和5个桃。
第一节 博弈论导论
▪博弈的四要素: 1.博奕的参加者,即博奕方或参与人。
2.各博奕方可选择的全部策略或行为的集合。
3.进行博奕的次序。
4.博奕方的得益。 例:囚徒困境
囚徒A
坦白 抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为:A、B都选择坦白,各判8年刑
第一节 博弈论导论