博弈论导论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论导论
《博弈论》
主讲:李少斌 Tel:85221808 Email:tlishb@
第0章《博弈论》导论
《博弈论》研究什么, Game Theory
游戏理论,对策论,博弈论
下棋与博弈: 博弈论研究的问题决策及其均衡问题理性经济人(智能的) 行为互动假设:相互影响
经济学研究假设基础
经济学研究内容: 经济学研究的假设基础: 理性经济人新古典经济学的两个基本假定: 完全竞争市场不存在信息不对称问题
博弈论的研究范式
传统经济学研究范式:生产或消费的决策者在做出决策时,假设价格是固定不变的,以此使其效用最大化。

决策者是价格的接受者博弈论的突破:决策时考虑到主体的决策行为是互相影响的,即局中人决策时将考虑到其竞争对手的行为,并且预料到竞争对手对其行为的策略式反应;个人的最优选择是其他人选择的函数。

价格影响者:互动,相互影响
一、生活中的博弈现象
海滩占位问题 :
二人对称矩阵博弈:
二人矩阵博弈:智猪博弈
公共产品供给问题:
1、海滩占位问题
两个卖矿泉水的小商贩为了争夺在海滩上日光浴的顾客,假若晒太阳的人们在1公理长的沙滩上均匀分布,试问:两个商贩将如何布局,
海滩占位问题求解
帕累托最优:
纳什均衡:
类似的例子
电视台的娱乐节目竞争现象(节目克隆) 总统竞选的竞选纲领问题(尽量争取中间选民) 超市的布局问题不同航空公司飞往同一目的地的航班现象地方政府竞相设立开发区
支付函数的矩阵博弈问题
在现实中最常见的博弈问题通常是二人博弈问题,每一博弈方的行动选择通常只有两种,在这样的博弈问题中双方的得益函数通常可用一个矩阵来描述。

如图:
参与人B 参与人A U L a, e R b, f
D
c, g
d, h
2、二人对称矩阵博弈
考查二人对称博弈。

双方各有合作和不合作两种策略,其得益支付矩阵如下。

由其相对大小确定了不同类型的博弈问题。

这里,合作理解为投对方所好,或者说选择对方所希望的策略;不合作可理解为背叛。

参与人B 合作不合作合作参与人A 不合作 r, r t, s s,
t p, p
(1)囚徒困境博弈(t,r,p,s)
两个小偷被控有罪,法官对其分别审判,每个小偷决定是坦白还是抵赖,其得益矩阵如下。

小偷将如何行动, 囚徒困境博弈中的合作策略指什么策略, 囚徒B
抵赖
抵赖囚徒A 坦白 ,1,,1 0,,10
坦白
,10, 0 ,8,,8
纳什均衡与划线法
对矩阵博弈而言,纳什均衡是指这样一种策略(行动)组合,局中人谁都没有动机单方面偏离该状态。

矩阵博弈的纳什均衡求解――划线法: 对于参与人B的每一个给定策略选择,在A的最优策略下划一横线,然后再用类似的方法找出B 的最优策略。

囚徒困境博弈的划线法求解
囚徒B 抵赖抵赖囚徒A ,1,,1 坦白 ,10, 0
坦白
0,,10
,8,,8
囚徒困境博弈的启示
囚徒困境博弈:深刻地反映了个体理性与集体理性的冲突。

类似的例子有:卡特尔组织、公共产品的供给问题(搭便车现象,如两户穷人修路问题)、产品定价问题(价格战)、军备竞赛、经济改革、贸易壁垒问题(关税等)。

其特点
是:t,r,p,s。

素质教育还是应试教育,
教师B(家长B) 减负增负教师A (家长A) 减负增负 1,1 2,-1 -1, 2 0,0
孩子该不该上各种课外辅导班,
(2)胆小鬼博弈(t,s,r,p)
争路博弈:两个小孩争着过独木桥,若双方互不退让时,双方都将掉到河中,
若只有一方退让时,退让者将获得胆小鬼称号。

胆小鬼博弈中的合作策略指什么策略,
B W(退) T
W(退)
A T
0,0
2,1
1,2
,2,,2
胆小鬼博弈的启示
胆小鬼博弈,又称争路博弈,斗鸡博弈。

类似的例子有: 冷战期间美苏争抢
地盘夫妻间矛盾问题警察与游行队伍的进退问题公共产品的供给问题胆小鬼博弈的分类
胆小鬼博弈的特点是:t,s,(,,,)r ,p,对于s和 r的相对大小又有三种可能
的情形: (1)争路博弈(t,s,r,p); (2) t,s,r,p; (3)货币当局与财政当局的博弈(t,r, s,p)
胆小鬼博弈(t,r,s,p)
货币当局与财政当局博弈:货币当局的收益取决于是否控制住通货膨胀
(π,0),财政当局的收益取决于是否实行扩张性的财政政策(d,1)。

财政当局B
退d,0 退π,1
货币当局A 1,1 2,0
进d,1
0,2 ,2,,2
进π,0
(3)求同存异博弈(t,s,p?r)
性别战问题:如何度周末,一对恋人各自决定,看芭蕾舞还是足球赛, 性别战博弈中
的合作策略指什么策略,

芭蕾舞
足球赛女芭蕾舞 ,1,,1 2,1
足球赛
1,2 0,0
类似的例子
一对恋人选修课程: 政治外交等博弈问题: 董事会内部对两个投资项目意见分歧的决
策内部矛盾与一致对外基金抱团取暧其特点是: t,s,p?r。

(4)共同投资问题 (r,t,p, s)
当参与者共同投资大项目时将获得更高的收益,但当另一方玩花样而投资于小项目时,
大项目投资者将被套。

B
联合单独
0,1
A
联合
2,2
单独
1,0
1,1
在该博弈中,双方都投资于小项目是风险占优均衡。

类似的例子
共同打猎问题: 考试作弊: 其特点是:r,p,(,)t, s。

考试作弊
两位考生考试的得益矩阵如下。

在该博弈中,双方都不作弊是风险占优均衡。

B
作弊不作弊 0,8
A
作弊
9,9
不作弊
8,0
7,7
二人对称矩阵博弈小结
参与人B
合作不合作 s, t p, p
参与人A
合作不合作
r, r t, s
囚徒困境博弈: t,r,p,s 胆小鬼博弈: t,s,(,,,)r,p 求同存异博弈: t,s ,p,r 共同投资问题: r,p,(,)t, s
3、二人矩阵博弈
二人矩阵博弈中更为普遍的是非对称博弈。

参与人B
L 参与人A U D a, e c, g R b, f d, h
智猪博弈
自动控制的食槽有10个单位的食物,按控制键的成本为2,若大猪按小猪等待,则双方分吃的食物为6和4,若大猪等待小猪按,则双方分吃的食物为9和1,若同时按,则双方分吃的食物为7和3。

利益矩阵如下:
小猪按等待

大猪等待
5,1
9,,1
4,4
0,0
类似的例子
大股东和小股东对经理监督股票市场的散户跟庄现象大企业与小企业关于技术的研究与开发新产品广告改革的推动公共产品的供给问题:富户和穷户的修路问题 OPEC的成功:归因于沙特阿拉伯扮演大猪角色股改对价博弈:
4、一个公共产品供给问题的例子
公共产品的供给问题:供给不足存在多种模型解释: 囚徒困境博弈胆小鬼博弈智猪博弈共同投资问题
公共产品供给,,囚徒困境博弈
两户穷人修路问题:修路带给每家的收益均为3,修路的成本为4。

B
修修 A 不修
1,1 3,-1
不修
-1,3 0,0
公共产品供给,,胆小鬼博弈
两户富人修路问题:修路带给每人的收益均为5,修路的成本为4。

B
修修 A 不修
3,3 5,1
不修
1,5 0,0
公共产品的供给,,智猪博弈
富户和穷户的修路博弈:修路带给富户和穷户的收益分别为5和3,修路的成本为4。

穷户修修富户不修
3,1 5,-1
不修
1,3 0,0
公共产品供给,,共同投资博弈
在以上分析中,一个隐含条件是各家都有能力单独将路修好。

若假设每家不能单独将路修好,则博弈演化为共同投资问题。

修路问题,,口头承诺:修路带给每家的收益均为3 ,修路的成本为4 ,每家承诺投入资金2。

B 修不修
-2,0 0,0
A
修不修
1,1 0,-2
热点问题思考
尝试运用博弈模型分析: 人民币汇率博弈: 楼市调控博弈: 股市投资风格博弈: 宏观经济政策博弈: 中日争端博弈:
二、博弈论概论
博弈论的研究内容博弈论的发展脉络博弈论与经济学博弈论在经济金融领
域中的运用
1、博弈论的研究内容
博弈论是在考虑到决策主体的行为互动条件下研究理性经济人的决策及其均
衡问题的理论。

行为互动假设理性经济人决策及其均衡问题
2、博弈论的发展脉络
(1)博弈论的思想渊源孙武:《孙子兵法》
孙膑:齐王与田忌赛马
古诺(Cournot, 1838)、伯特兰(Betrand, 1883)和艾奇沃斯(Edgeworth, 1925)等人关于两寡头的产量和价格垄断模型
(2)博弈论理论的发展
冯? 诺依曼和摩根斯坦:《博弈论与经济行为》(1944) 五十年代的合作博弈论:讨价还价模型、核的概念; 非合作博弈论:纳什提出了纳什均衡(1950),
Tucker(1950)定义了“囚徒困境” 。

泽尔腾(Selten, 1965)提出了精炼纳什均
衡,海萨尼 (Harrsanyi, 1967,1968)则通过海萨尼转换把不完全信息引入博弈论的研究。

克瑞普斯(Kreps, 1982)等则研究了动态不完全信息博弈。

(3)博弈的分类
从信息角度看,博弈可分为:
完全信息博弈:指局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解。

不完全信息博弈:
从局中人行动的先后秩序看,博弈可分为:
静态博弈:局中人同时选择行动;
动态博弈:局中人的行动有先后顺序,且后行动者可以观察到先行动者的行动后再行动。

四类博弈
因此,博弈可分为四类: 完全信息静态博弈: 完全信息动态博弈: 不完全信息静态博弈: 不完全信息动态博弈:
非合作博弈与合作博弈
以决策者是否能进行信息沟通可将博弈分为: 合作博弈:强调效率、公正、公平联盟型博弈:卡特尔联盟谈判理论非合作博弈:博弈论的主要研究对象,强调个人理性、个人最优决策
(4)博弈论中的理性问题
在经济学研究中普遍采用“理性经济人” 假设。

对理性的理解有: 理性意识和理性能力: 理性意识是狭义的理性,是决策者始终以自身利益最大化为目标。

行为的理性和知识的理性: 行为的理性指决策者对不同的行动方案具有稳定的偏好序。

个体理性、集体理性
和交互理性:
博弈论中的完全理性假设
博弈论中的理性假设是完全理性:包括理性的和智能的两层含义。

理性的:如果一个决策者在追逐其目标时能前后一致地做出决策,即行为理性。

智能的:决策者进行决策时能策略性地做出反应,包括决策者的理性能力、交互理性和知识理性、理性的共同知识。

博弈论中的理性解释(1)
决策者的理性能力:指有理性意识的经济主体具有的、实现主观愿望所需要的客观能力,在计算和逻辑推理方面有很高要求。

交互理性:是人们的利益相互取决于其他人的行为时的理性。

知识理性(贝叶斯理性):指在有不确定性的情况下,最大限度地获得信息,形成准确判断的能力。

博弈论中的理性解释(2)
理性的共同知识:每个博弈方都知道所有博弈方都是理性的,都知道其他博弈方知道所有博弈方都是理性的,都知道其他博弈方知道其他博弈方知道所有博弈方都是理性的……
理性概念的发展
从完全理性到有限理性: 有限理性:有理性意识,但理性能力有限。

进化博弈论: 模仿模型学习模型:
(5)博弈论研究的前沿问题
博弈论中完全理性的局限性: 对理性概念的突破,博弈论与相关学科交叉融合,产生了一批新兴学科: 进化博弈论(生物进化理论) 实验经济学(实验理论) 行为经济学(心理学) 行为金融学(金融学、心理学)
3、博弈论与经济学
从经济学的各个分支如产业组织理论、现代企业理论、信息经济学、金融学等到政治、文化、日常生活等各个方面无不渗透着博弈论的思想。

(1)博弈论对西方经济学的改造
自使用资源的方式。

威廉姆森是新制度经济学”的命名者,特别是在企业边界方面的研究。

其理论显示,企业能够扮演解决冲突的角色。

过去三十年,他们的研究促使经济管理从经济学边缘研究成为前沿研究。

4、博弈论在经济金融领域中的运用
信息经济学中的运用产业组织理论中的运用金融理论中的运用
(1)信息经济学中的运用
信息不对称与机制设计委托代理中的激励约束问题逆向选择和道德风险问题(保险市场和旧货市场) 信号传导机制(劳动力市场的教育信号博弈模型)
(2)产业组织理论中的运用
产业组织理论是博弈论最早和最成功运用的领域之一。

从寡头垄断及垄断竞争的市场结构理论,到现代企业的生产、管理、营销、新产品开发无不渗透着博弈论的思想。

常见模型有:市场竞争模型、限制性定价、拍卖投标、搜索模型等。

(3)金融领域中的运用
宏观金融政策决策中央银行的货币政策决策及其传导问题:货币政策传导依赖于中央银行与企业、居民之间的相互博弈。

当前宏观经济政策的博弈问题货币政策取向货币政策调整
资本市场中博弈问题
IPO价格的询价博弈: 投资者抉择:股民还是基民, 投资者博弈:大股东与其他投资者的博弈,大小非解禁与流通股东的博弈,主力和游资、机构与散户等博弈问题证券市场
政策博弈:政策决策者与各类市场参与者投资者股票抉择:大盘股还是中小盘股,二八转换博弈监管与投机炒作博弈:监管机构、上市公司、中介机构与投资者
国际金融领域
国际金融中的均衡汇率问题: 如人民币汇率升值博弈问题: 国际游资投机与国家金融稳定: 国际游资投机与一国外汇监管当局的博弈问题:亚洲金融风暴、香港金融危机美国次贷危机及全球救市合作: 次贷危机引发的全球金融动荡及各国政府救市更是一个复杂的博弈问题
保险中的博弈问题
保险合同条款设计保险中的道德风险问题保险中的逆向选择问题
行为金融理论
综合运用心理学、社会学、金融学、实验经济学、数学等学科来研究人类的金融行为,涉及到金融学的投资、融资、筹资等诸多领域,是一门方兴未艾的边缘学科。

行为金融学主要研究人们在投资决策过程中认知、感情、态度等心理特征,以及由此而引起的市场非有效性。

(4)思考与作业
针对你熟悉的经济金融热点问题或社会生活现象,尝试构建一个简单博弈模型进行分析。

三、课程安排与参考书目
课程安排: 讲授10周:3-12周讨论与复习2周:13-14周考试1周:15周考试与论文: 平时作业与考勤:占30% 课程论文与开卷考试(可选):占70% 参考书目,,教材类
张维迎:《博弈论与信息经济学》,上海人民出版社、上海三联书店。

艾里克? 拉斯缪森:《博弈与信息》,北京大学出版社,刊中关于博弈论在经济金融领域的相关论文。

《经济研究》、《金融研究》等中文期刊中的相关论文。

相关文档
最新文档