复旦大学谢识予经济博弈论3

合集下载

经济博弈论_谢识予_2_完全信息动态博弈0.1

单结信息集:只包含一个决策结的信息集完美（Perfect）信息：博弈树的所有信息都是单结的。 ——博弈中没有任何参与人同时行动，且后行动者能观察到先行动者的行动，且所有参与人观察到N的行动）
1 动态博弈的扩展式表述

静态博弈用扩展式表述 A
坦白抵赖坦白
Q:何为完全信息？ B
抵赖
囚徒困境博弈
-3，-3 -4，-3
-3，-3 0，0
1，-2 -4，-3 割耳
1，-2 0，0 (-3,-3) (1，-2) 默认割耳 (-4,-3) (0,0)
三个NE: (不画,{割耳,默认}) (画,{默认，割耳}) (画,{默认，默认})
画小孩不画
父亲
父亲
默认
4 NE的缺陷——不可置信的威胁
换句话说，与抽烟有关决策不是单人在中性环境中的决定，而是一种博弈。“今日卡门”和不同偏好的卡门自己，即“未来卡门”间的博弈。

5 逆向归纳法
继续抽未来的卡门不抽今天的卡门
-1，1
1，-1
0,0 两个“卡门”如何行事？未来卡门如何行事？考虑到未来卡门的未来行动，今日卡门今日如何行事？

2 动态博弈中的策略

博弈树中参与人在结点上所选择的单个行动—— 一步/招 (move)
美中军事博弈

但是，参与人可以制定一个行动计划，将每个决策结上的选择都事先规定好，即使这个决策点实际上不会出美国现。——策略
中国中国
策略：人不犯我、我不犯人；人若犯我、我必犯人
不犯人
(-2,-2) (2,-4) (3,-5) (0,0)
4 NE的缺陷——不可置信的威胁

复旦大学-谢识予-经济博弈论2

两寡头间的囚徒困境博弈
厂不突破商 1 突破
厂商2
不突破
突破
4.5，4.5
3.75，5
5，3.75
4，4
以自身最大利益为目标：各生产 2单位产量，各自得益为4
以两厂商总体利益最大：各生产 1.5单位产量，各自得益为4.5
2.3.2 反应函数
古诺模型的反应函数
max q1
u1

max(6q1

q1q2
2.4 混合策略和混合策略纳什均衡
2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数
2.4.1 严格竞争博弈和混合策略的引进
一、猜硬币博弈
盖正面硬币反面方
猜硬币方
正面
反面
-1， 1
1， -1
-1， -1
之
境
争
猜
-1， 1
硬
币
1， -1
1， -1 -1， 1
2， 1 0， 0
0， 0 1， 3
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2.2.1 纳什均衡的定义
策略空间：S1 , S n
博弈方 i的第 j 个策略：si j Si 博弈方 i的得益：u i
博弈：G {S1,Sn;u1,un}
纳什均衡：在博弈G {S1,Sn;u1,un}中，如果由各个博弈方i
的各一个策略组成的某个策略组合(si*,sn* ) 中，任一博弈方的策略，都是对其余博弈方策略的组合 (si*,si*1, si*1,...sn* ) 的最佳对策，也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,si*1, sij , si*1,...sn*)

0_博弈论

大多数人把博弈论学习看作是一件艰难而痛苦的事情；

其实，博弈论是非常有趣的学问，把博弈论的学习看作是一件痛苦之事，实在不应该。
——快乐地学习博弈论
一、什么是博弈

game：游戏。如何在游戏中获胜？
机会/运气：除非传说中的魔法，运气是不能改变的
技巧：虽然后天锻炼可以改进，但是改进程度有限。策略：绝大多数人可以通过学习，提高在竞争中策略性地选择自己行为的技能。策略思维：本质上是你与他人之间的互动，别人也在进行类似的思考。
课程性质
日常生活中一种极重要的思维方式

你随时都在博弈。与父母、朋友、老师等等；
你可能已经获得大量本能性技巧，而你通过博弈论的学习发现你已经学到的经验；

博弈论是对这些经验的系统整理，以便你提高策略技巧并运用自如。萨缪尔森：要在现代社会做一个有文化的人，你必须对博弈论有大致的了解
课程性质
三、为什么学习博弈论

博弈论的用处

解释——许多事件促使我们探寻其发生的原因
预测——在观察多名决策者策略互动时，可用博弈论预测他们将采取的行动以及结果

提出建议或者找出解决的办法——辅助参与人，
告诉他们哪些策略可能获得良好的结果，哪些可能带来糟糕的结果。
四、博弈事例
别人的红包更诱人
地主在年终给长工张三和李四每人一个红包，他们都知道自己红包里有1000元，但是不知道对方红包里有多少钱。

地主说：“每人的红包里可能是1000元，也可能是3000 元。如果你们都愿意和对方换的话，那么我来做公证人，收取每人公证费100元。你们愿不愿和对方交换？”

张三想，假定换，若他是1000元，则亏100公证费，可能性仅50%；若他是3000元，则扣除公证费，净赚1900，可能性50%。预期净赚900元。所以应该换。

经济博弈论_谢识予_0_博弈论与信息经济

课程考核要求
期末考试论文（70％）平时作业+出勤（30%）
课程性质
经济学诺贝尔奖先后5个年度颁发给研究博弈论及其相关领域的13位经济学家/数学家
✓ 1994年3位：纳什、海萨尼、泽尔滕 ✓ 1996年2位：米/莫里斯、维克瑞 ✓ 2001年3位：斯宾塞、阿科诺夫、斯蒂格勒茨 ✓ 2005年2位：奥曼、谢林 ✓ 2007年3位：梅耶森、马斯汀、赫维兹
三、为什么学习博弈论
博弈论的用处
四、博弈事例
地主在年终给长工张三和李四每人一个红包，他们都知道自己红包里有1000元，但是不知道对方红包里有多少钱。地主说：“每人的红包里可能是1000元，也可能是3000 元。如果你们都愿意和对方换的话，那么我来做公证人，收取每人公证费100元。你们愿不愿和对方交换？” 张三想，假定换，若他是1000元，则亏100公证费，可能性仅50%；若他是3000元，则扣除公证费，净赚1900，可能性50%。预期净赚900元。所以应该换。
game：游戏。如何在游戏中获胜？
一、什么是博弈？
请10个志愿者来参加，每人在字条上写一个数字，该数字是0-100之间任何一个整数。只有一个人是赢家，他怎么会赢呢？
游戏规则：谁写的数字最接近平均数的一半，谁就是赢家。
一、什么是博弈？
分析：每个人获胜的概率不仅取决于自己写什么数字，也取决于别人写什么。——你们的决策相互影响和依赖
四、博弈事例
于是，张三和李四异口同声地说：“愿意。” 地主露出一丝狡诈的微笑：“真的？” 张三和李四又异口同声地说：“真的！” 结果，张三、李四各亏损100，地主用他小小伎俩骗了200元
四、博弈事例
如果你选了门课程，课程成绩评定按某பைடு நூலகம்线分布进行。无论你如何用功，都只有40%的学生得A，40% 学生得B。因此你需相对于其他同学更用功。

复旦大学-谢识予-经济博弈论3

3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个 “子博弈”。

乙借
甲分（2，2）
不分乙
不借（1，0）
2
接受
[0，0]
拒绝
努力
委托：
2
努力
偷懒 [0，0]
0.9*[20-w(E)]+0.1*[10-w(E)]>0
不委托：
0 低产
高产
(0.1)
(0.9)
高产 (0.1)
[10-w(E), w(E)-E]
0
低产
0.9*[20-w(E)]+0.1*[10-w(E)]<0
(0.9)
偷懒：
[10-w(S), w(S)-S] 委托：
阶段：动态博弈中一个博弈方的一次选择行为例子：仿冒和反仿冒博弈
仿冒
A 不仿冒
制止
（-2，5）制止
B 不制止（0，10）仿冒 A 不仿冒 B 不制止（5，5）
（2，2）
（10，4）
3.1.2 动态博弈的基本特点
策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合，构成一
第二阶段是博弈方3和博弈方4的选择阶段，他们在看到博弈方1和博弈方2的选择 a 1 和 a 2 以后，同时在各自的
可选策略（行为）集合 A 3 和 A4 中分别选择 a 3 和 a 4
各博弈方的得益都取决于所有博弈方的策略 a1,a2,a3,a4 即博弈方i的得益是各个博弈方所选择策略的多元函数 ui ui(a1,a2,a3,a4)

经济博弈论专业知识培训

《博弈论与信息经济学》
教学课件
教材与参照资料：
• 《经济博弈论（第三版）》 • 谢识予，复旦大学出版社，2023年1
月
• 《博弈与信息——博弈论概论（第二版）》 • 艾里克·拉斯缪森，北京大学出版社，
2023年7月 • 《博弈论基础》 • 罗伯特·吉本斯，中国社会科学出版社，
1999年3月
考核
• 平时成绩：30% 点到，5% 作业， 10% 课堂提问与论坛讨论， 15%
1996: 莫里斯（James A.Mirrlees）和维克瑞（William Vickrey）
这两位经济学家旳贡献集中于利用博弈论对现实经济问题旳解释。
博弈论和诺贝尔经济学奖
• 2023：阿克洛夫（Akerlof）、斯宾塞（Spence）、斯蒂格利茨（Stiglitz）
这三位作为不对称信息市场理论旳奠基人被授予诺贝尔经济学奖，以表扬他们分别在柠檬品市场等不对称信息理论研究领域做出旳基础性贡献。这些贡献发展了博弈论旳措施体系，拓宽了其经济解释范围。
一、基本模型
囚徒1：坦白囚徒2：坦白
坦白
囚徒 2 不坦白
囚坦白徒
1 不坦白
-5， -5 -8， 0
0， -8 -1， -1
两个罪犯旳得益矩阵
二、双寡头削价竞争
寡头2
高价
低价
寡高价头 1 低价
100，100 150，20
20，150 70，70
双寡头旳得益矩阵
寡头1：低价(70) 寡头2：低价(70)
1.1.1 什么是博弈
博弈就是策略对抗，或策略有关键作用旳游戏
• Game——博弈，Game Theory——博弈论 • 游戏和经济等决策竞争较劲旳共同特征：规则、成果、策略选

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石，对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。

本文首先将博弈划分为不同的类型，并对主要的均衡概念进行了数学描述，最后对不同的均衡概念进行了比较。

【关键词】博弈论；纳什均衡；重复博弈博弈论在现代经济学中占据着相当重要的位置，在微观经济学的本科教学环节中，如果将博弈论这一部分排除在外，那么教学内容是不完整的，并且和现代微观经济学的发展严重脱节。

但是由于课时以及学生接受能力的限制，对博弈论的内容进行全面深入地讲解难以做到，因此，将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。

在博弈论的基本概念当中，最重要的当属博弈均衡的概念，这些概念的掌握有助于学生把握博弈论的整体框架，并对博弈论的后续学习至关重要。

因此，本文将主要的博弈均衡概念进行分类和表述，并对不同的博弈概念进行比较，以期对博弈论的教学有所助益。

一、博弈的主要类型博弈构成的基本要素包括：1、参与人（1～N）；2、各个参与人各自可选择的行动集合Ai={ai}；3、参与人i的策略Si，给定信息集，该策略决定在博弈的每一阶段他选择的行动；4、参与人的收益Ui （S1，S2…SN）。

依据不同的分类标准，博弈可以被划分为不同的类型。

1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈，如猜硬币、投标等，静态博弈一般可以用支付矩阵来表达。

动态博弈是指博弈各方按照一定的先后次序进行策略的选择，典型的例子如对弈，动态博弈一般可以用“博弈树”来表达。

Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。

重复博弈是指同一个博弈（静态或动态）反复进行所构成的博弈过程，如体育比赛中的多局赛制等。

2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈，不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。

从博弈论的角度谈重建中国奶制品市场信心

从博弈论的角度谈重建中国奶制品市场信心摘要：自三聚氰胺毒奶粉事件发生后，国产奶质量问题便层出不穷，内地民众一时间对国产奶信心骤减。

近日，香港政府拟以立法的方式进一步提高奶制品的质量标准，以避免奶制品质量问题的发生。

我国政府是否应当效法港府，以严格的法律法规约束奶制品市场，重建民众对国产奶的信心，使中国人早日拥有能够放心饮用的健康奶。

本文将从博弈论的角度分析中国奶制品市场的可信性，并就重建我国奶制品市场信心提出几点切实可行的建议。

关键词：国产奶“质量门”奶制品市场可信性；动态博弈一、引言2013年3月，香港政府开始对奶粉实行严格的限购措施，其主要目的是限制内地民众抢购。

这一事件反映了一个“尴尬”的事实——由于国内奶制品行业质量问题频出，消费者在购买奶制品的过程中不得不面临取舍，到底是应该相信国产奶，还是远赴香港抢购？如果因为购买国产奶而发生了质量问题能否通过法律手段保障自身权益？消费者这种相机选择的存在使得在博弈方的策略中，所设定的各个阶段、各种情况下会采取的行为的“可信性”有了疑问。

对此问题适用于以完全且完美信息动态博弈的模型来分析，鉴于目前我国关于奶制品行业的法律法规尚不完善，下面便是在法律保障不健全的约束条件下所进行的具体分析。

二、“法律保障不健全”约束条件下购买国产奶的动态博弈在国内奶制品市场中，消费者可以选择买或者不买国产奶，供应奶制品者也可以选择提供质量好或劣的产品。

为了追求更大的利益，总会有某些惟利是图的供应者以次充好。

不过，值得注意的是，哪怕是最混乱的市场，也会有优质奶粉存在。

因为如果没有优质奶粉，消费者就会拒绝奶粉从而导致市场消失。

因此，假设市场中只有一个消费者和一个奶制品供应者，消费者在购买奶制品时首先需要选择是否购买国产奶。

如果不买，消费者会选择购买成本更高的进口奶（假设消费者对奶制品的需求是刚性的），供应者由于消费者的不买而未得利益；如果买，那么轮到供应者进行抉择，所提供的奶制品的质量是好还是劣？如果质量好，那么消费者因为购买国产奶的成本低（与进口奶相较）且质量好而获益，假设此时其得益为20，高于不买时的得益10，而供应者也因为消费者选择买而获益，假设得益也为20；如果质量劣，那么消费者虽然付出的成本低，但是由于食用了劣质的奶制品而影响了健康，利益反而受损，此时消费者可以选择打官司来维护自己的权益。

经济博弈论谢识予

同犯罪指控时的策略选择。
策略
每个囚犯都有坦白和抵赖两种策略。在给定对方策略的情况下，每个囚犯都追求自身利益最大化。
结果
最终的结果往往是两个囚犯都选择坦白，这并不是最优解。
智猪博弈
描述
智猪博弈描述了两个实力不同的大猪在猪圈里抢食的情况。
策略
大猪可以选择主动去踩踏板，小猪可以选择等待。
结果
最优策略是小猪等待，大猪踩踏板。
有多个参与者，如市场结构、政策制定等。
双人博弈
有两个参与者，如商业竞争、合作、贸易关系等。
博弈的策略与行动
01
02
03
纯策略
指参与者采取的明确行动方案，不涉及概率。
混合策略
指参与者以一定概率采取不同行动，以达到最佳预期结果。
反应函数
描述参与者如何根据对手的策略选择自己的最优策略。
博弈的结果与均衡
可以更全面地分析经济问题。
跨学科研究
借鉴其他学科的研究方法和成果，如心理学、社会学和政治学等，可以丰富博弈论
的应用领域和解释力。
实证研究
通过实证研究来检验博弈论的预测和结论，不断完善和发展博弈论在经济领域的应用。
提高政策制定水平
通过应用博弈论分析政策制定中的利益关系和策略互动，可以提高政策制定的科学性和有效性。
动态博弈和演化博弈
多智能体系统
研究将更加关注博弈的动态性和演化性，以更好地解释现实世界中的长期策略互动和变化。
结合人工智能和博弈论，构建多智能体系统，模拟更复杂的策略互动和集体行为。
06
结论
博弈论对经济分析的贡献
解释经济行为
博弈论通过分析参与者的策略互动，能够解释市场中的竞争行为、合作行为以及经济主体的决策过程。

博弈论最全完整-讲解

Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。但真正起作用的是你的朋友是否使用同样的
逻辑，或者认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然；反之，是否她认为这一选择对你同样显然。……以此类推。也就是说，需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。
例3：为什么教授如此苛刻？
问题是，一个好心肠的教授如何维持如此铁石心肠的承诺？
他必须找到某种使拒绝变得强硬和可信的方法。
拿行政程序或者学校政策来做挡箭牌在课程开始时做出明确和严格的宣布通过几次严打来获得“冷面杀手”的声
誉
导论
博弈均衡与一般均衡博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型主要参考文献
即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个局中人的得益。
“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识（common knowledge）。
据“共同知识”的掌握分为完全信息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束，然后以精心策划的方式选择自己的行为，按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。

复旦大学-谢识予-经济博弈论5(不讲,自学)

1
不进
2
不打
（1，5）
u 2 s x 0 (1 x ) 5 5 5 x u 2 n x 2 (1 x ) 5 5 3 x u 2 y u 2 s (1 y )u 2 n 5 2 xy 3 x
（0，0）（2，2）
博弈方1位置博弈群体复制动态相位图
dx dt
F ( x ) x (1 x )[ x ( a c ) (1 x )( b d )]
x (1 x )( 61 x 11)
一般2*2对称博弈
dx/dt
复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态和进化稳定策略
dy/dt 1 y 1 y
y[u 2 e u 2 ] y (1 y )(1 6 x )
dy/dt
x<1/6
x>1/6
dy/dt 1 y
x=1/6
两群体复制动态关系和稳定性
A
B
Y 1
5/6
C
1/6
D
1
x
5 3
2
协调博弈
反应、策略调整规则推导
采用 A 的得益： xi (t ) 50 [ 2 xi (t )] 49 采用 B 的得益： xi (t ) 0 [ 2 xi (t )] 60 当 xi (t ) 22 / 61时，采用 A ；当 xi (t ) 22 / 61时，采用 B
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰鸽
, vc
2
0, v
,

复旦大学经济博弈论经济博弈论

合并均衡分开均衡
混成均衡
2024/9/22
6.3.3 模型旳纯策略完美贝叶斯均衡
1、市场部提成功旳合并均衡
卖方选择卖，不论车子好差买方选择买，只要卖方卖买方旳判断是
p(g | s) pg , p(b | s) pb
条件：差车概率很小买到差车损失不大
伪装费用较小 P C
2024/9/22
低价
2
2
买
不买
买
不买
( Ph,V Ph)
(0,0) ( P,h VPh ) (0,0) (Pl ,V Pl) (0,0) ( Pl ,W Pl) (0,0)
2024/9/22
6.4.2 模型旳均衡
市场完全成功旳完美贝叶斯均衡条件： C Ph 均衡策略组合和判断：
卖方在车好时要高价，车差时要低价买方买下卖方出售车买方旳判断是
2024/9/22
6.1.3 不完美信息动态博弈旳子博弈
因为原博弈本身不会成为原博
弈旳后续阶段，所以子博弈不能从原博弈旳第一种节点开始，
Ll 1 R
即原博弈不是自己旳子博弈
包括全部在初始节点和终点，但不包括不跟在此初始节点之后旳节点
2R 2
L
L
R
3
不分割任何旳信息集。
LR
LR
2024/9/22
2024/9/22
一种策略组合和相应旳判断满足下列4个要求，称为一种“完美贝叶斯均衡”：
要求1：在各个信息集，轮到选择旳博弈方必须具有一种有关博弈到达该信息集中每个节点可能性旳“判断”。对非单节点信息集，一种“判断”就是博弈到达该信息集中各个节点可能性旳概率分布，对单节点信息集，则可了解为“判断到达该节点旳概率为1”

复旦大学-谢识予-经济博弈论6dlvv

市场接近失败
柠檬原理和逆向选择
允许价格变化消费者支付价格低于期望价值平均（期望）价值以上商品退出，市场上商品
质量越来越差消费者愿意支付的价格越来越低
柠檬原理和逆向选择是信息不完全导致的，对市场效率都是不利的。
6.5 有退款保证的双价二手车交易
原理：用退款
保证提高C ，
或者说卖方
p(g) p(b) 0.5
p(g | s) p(g) p(s | g)
p(g) p(s | g)
0.5 1
2
p(s)
p(g) p(s | g) p(b) p(s | b) 0.51 0.5 0.5 3
三方三阶段不完全信息动态博弈
1
F
B
2
(2,0,0)
L(p)
R(1-p)
3
U
DU
D
(1,2,1) (3,3,3,) (0,1,2) (0,1,1)
条件：差车概率很小买到差车损失不大
伪装费用较小 P C
2、市场完成成功的分开均衡
卖方在车好时卖，车差时不卖买方选买，只要卖方卖买方的判断为
p(g | s) 1, p(b | s) 0
条件：P C
3、市场完全失败的合并均衡
卖方选择不卖买方选择不买买方的判断为：
p(g | s) 0, p(b | s) 1
以及建立市场秩序的条件和方法等。
模型
好
1
差
1 低价
1
高价
高价
低价
2
2
买
不买
买
不买
( Ph,V Ph)
(0,0) ( P,h VPh ) (0,0) (Pl ,V Pl) (0,0) ( Pl ,W Pl) (0,0)

政治经济学参考书目

政治经济学参考书目经典著作①亚当·斯密《国民财富的性质和原因的研究》，商务印书馆，1974②卡尔·马克思《资本论》，中央编译局翻译，人民出版社，1975，2004③阿尔弗雷德·马歇尔《经济学原理》，商务印书馆，1965④列宁《帝国主义是资本主义的最高阶段》，人民出版社，1971，1973，2014⑤梅纳德·凯恩斯《就业、利息与货币通论》，高鸿业译，商务印书馆，1999⑥希法亭《金融资本》，商务印书馆，1998⑦保罗·巴兰、保罗·斯威奇《垄断资本》，商务印书馆，1977⑧阿里吉著；《亚当·斯密在北京：21世纪谱系》路爱国等人译，社会科学文献出版社,2009.⑨保罗·巴兰《增长的政治经济学》，商务印书馆，2000⑩迈克尔·布若威《制造同意：垄断资本主义劳动过程的变迁》，商务印书馆，2008⑾[比] 埃内斯特·曼德尔《<资本论>新英译本导言》，中共中央党校出版社，1991⑿约翰·罗默《在自由中丧失——马克思主义经济哲学导论》，段中桥等译，经济科学出版社,，2005经济史①李宗正，鲁友章《经济学说史》（第二版），人民出版社②姚开健主编《经济学说史》，中国人民大学出版社，2011③宋承先《西方经济学名著导读》，江西人民出版社④艾里克·罗尔《经济思想史》，商务印书馆，1981⑤吴易风等《当代西方经济学流派与思潮》，首都经济贸易大学出版社，2005⑥孙健主编《中国经济通史》，中国人民大学出版社，2000⑦高德步主编《世界经济史》，中国人民大学出版社，2001⑧萧国亮、隋福民《世界经济史》，北京大学出版社，2007⑨姚开建《马克思主义经济学说史》，中国人民大学出版社，2010方法论方面①苗东升《系统科学精要》，中国人民大学出版社，1998②[英]布劳格《经济学方法论》，.商务印书馆,1992③谢识予《经济博弈论》，复旦大学出版社，2007④[英]布劳格,巴克豪斯.《经济学方法论的新趋势》，经济科学出版社,2000.⑤[英]W.R.艾什比《控制论导论》，科学出版社，1965。

《经济博弈论(第三版)》谢识予 PPT课件

24
5
5
5
5
25
25
25
3
43
3
11
33
33
33
7
3
3
7
49
21
21
二、n个厂商连续产量
n
Q qi i 1
n
P P(Q) P( qi ) i 1
n
qi P qi P( qi ) i 1
n
n
qi P( qi ) cqi qi[P( qi ) c]
i 1
i 1
1.3 博弈结构和博弈分类
1.4 博弈论历史和发展简述
1.4.1博弈论的早期研究 1.4.2博弈论的形成 1.4.3博弈论的成长和发展 1.4.4博弈论的成熟及与主流经济
学的融合
1.4.1博弈论的早期研究
博弈论历史没有公认答案对具有策略依存特点决策问题的研究可上溯
到18世纪初甚至更早博弈论真正的发展在本世纪博弈论总体上仍然是发展中的学科
1.3.6 博弈方的能力和理性
完全理性和有限理性
完全理性：有完美的分析判断能力和不会犯选择行为的错误
有限理性：博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性：一个体利益最大为目标集体理性：追求集体利益最大化合作博弈：允许存在有约束力协议的博弈非合作博弈：不允许存在有约束力协议的博弈
2000年前我国古代的“齐威王田忌赛马” 1500年前巴比伦犹太教法典“婚姻合同问题”
等。
1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述，
有数种策略两人博弈的极小化极大解

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

定义：从动态博弈的最后
一个阶段博弈方的行为
开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第
乙
借
不借
一个阶段的分析方法，
甲
称为“逆推归纳法”。分
不分（1，0）
逆推归纳法是动态博弈分析最重要、基本的方法。
（2，2）
复旦大学谢识予经济博弈论3
（0，4）
3.3 子博弈和子博弈完美纳什均衡
复旦大学谢识予经济博弈论3
本章分六节
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论
复旦大学谢识予经济博弈论3
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
复旦大学谢识予经济博弈论3
3.3.1 子博弈
定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个 “子博弈”。
乙借
甲分（2，2）
各自的可选策略（行为）集合 A1 和 A2中分别选择 a 1 和 a2
第二阶段是博弈方3和博弈方4的选择阶段，他们在看到博弈方1和博弈方2的选择 a 1 和 a 2 以后，同时在各自的
可选策略（行为）集合 A 3 和 A4 中分别选择 a 3 和 a 4
各博弈方的得益都取决于所有博弈方的策略 a1,a2,a3,a4 即博弈方i的得益是各个博弈方所选择策略的多元函数 ui ui(a1,a2,a3,a4)
厂商1 厂商2
产量 3单位 1.5单位
得益 4.5 2.25
先行优势
复旦大学谢识予经济博弈论3
3.4.2 劳资博弈
先由工会决定工资率，再由厂商决定雇用多少劳动力
ma (W x ,L )m[R a(L x ) W ] L
L 0
L 0
R
斜率为W
W
R(L)
maux[W,L*(W)]
W0
WL
0
L* (W )
时选择即可。
Q q 1 q 2 ,P P ( Q ) 8 Qc1 c2 2
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ 8 ( q 1 q 2 ) 2 ] q 1 6q1q1q2q12
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ 8 ( q 1 q 2 ) 2 ] q 2 6q2 q1q2 q22
第三章完全且完美信息动态博弈
本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。
0.1*[20-w(S)] +0.9*[10-w(S)]>0
不Байду номын сангаас托：
[20-w(E), w(E)-E] [20-w(S), w(S)-S]
0.1*[20-w(S)] +0.9*[10-w(S)]<0
复旦大学谢识予经济博弈论3
四、有不确定性且不可监督的委托人—代理人博弈
1
委托
不委托
只能根据成果付酬，w是成果函数，而非努力程度函数。不确定性对代理人利益、选择有影响。
甲
不分
分
乙
（2，2）
不打
打
（1，0）不分
乙不打
开金矿博弈
（1，0）
（0，4）
有法律保障的开金矿博弈
（-1，0）（0，4）法律保障不足的开金矿博弈
——分钱打官司都可信
——分钱打官司都不可信
复旦大学谢识予经济博弈论3
3.2.2 纳什均衡的问题
第三种开金矿博弈中，（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。
委托人——代理人涉及问题：激励机制设计、机制设计理论，委托合同设计问题等
复旦大学谢识予经济博弈论3
二、无不确定性的委托人—代理人模型
1
委托
不委托
2
接受
[R(0),0] 拒绝
2
努力
[R(0),0] 偷懒
代理人的选择
激励相容约束：
w(E)-E> w(S)-S w(E)> w(S)+E-S
[R(E)-w(E), w(E)-E]
复旦大学谢识予经济博弈论3
参与约束： A B (4 e ) e2 1
当店员风险中性时 e* 2B符合其最大利益
店主选择下限 A B (4 e )e2 1代入得益公式得：
4ee2 1，期望得益为4ee21，易求得 e** 2
令e* e**得B1，再代入参与约束得 AB (8)5，
求数学期望得 A8B5解得 B1 ，A3 则店主的最优激励工资计算公式是 w 3R
复旦大学谢识予经济博弈论3
店主和店员的问题
商店的利润 R4e，是均值为0的随机变量店员的负效用 Ce2 ，e是店员的努力
机会成本为1
店主采用的报酬计算公式 S A B A R B ( 4 e )
店员的得益 AB(4e)e2 店员期望得益为 A 4B e e2
店主的得益为 4 e A B ( 4 e ) 4 ( 1 B ) e ( 1 B ) A
2
接受
[0，0]
拒绝
高产 (0.9)
2
努力
偷懒
0
低产高产 (0.1) (0.1)
[10-w(10), w(10)-E]
[0，0]
低产 (0.9)
[10-w(S), w(10)-S]
[20-w(20), w(20)-E][20-w(20), w(20)-S]
复旦大学谢识予经济博弈论3
促使代理人努力的激励相容约束、参与约束，以及委托人选择委托的条件
复旦大学谢识予经济博弈论3
3.1.1 阶段和扩展性表示
阶段：动态博弈中一个博弈方的一次选择行为例子：仿冒和反仿冒博弈
仿冒
A 不仿冒
制止
（-2，5）制止
B 不制止（0，10）仿冒 A 不仿冒 B 不制止（5，5）
（2，2）
（10，4）
复旦大学谢识予经济博弈论3
3.1.2 动态博弈的基本特点
或者它们的差额w(20) -w(10)
复旦大学谢识予经济博弈论3
五、选择报酬和连续努力水平的委托人—代理人博弈
参与约束：
w[R(e)]C(e) U
R, C
激励相容约束：
w[R((e*)]C(e*) w[R(e)]C(e)
U
C(e) + U R(e)
e*
e
委托人希望的代理人努力水平（满足参与约束）
复旦大学谢识予经济博弈论3
数值例子
R(E)10EE2
E=2, S=1, W(E)=4, w(S)=2
1
委托
不委托
2
接受
[0,0] 拒绝
2
努力
[0,0] 偷懒
[12, 2]
[7，1]
复旦大学谢识予经济博弈论3
三、有不确定性但可监督的委托人—代理人博弈
1
委托
不委托
因为可监督，因此代理人报酬与成果无关，只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。
努力： 0.9*[w(20)-E]+0.1*[w(10)-E] >0.1*[w(20)-S]+0.9*[w(10-S)]
激励相容约束
接受： 0.9*[w(20)-E]+0.1*[w(10)-E]>0
参与约束
委托： 0.9*[20-w(20)]+0.1*[10-w(10)]>0
对于委托人来说，就是要根据上述两个条件，以及 E、S的值，选择最佳的工资水平w(20)和w(10)，
1
1
委托
不委托
委托
不委托
[R(E)-w(E), w(E)-E]
[R(0),0]
委托： R(E)-w(E) > R(0) 不委托： R(E)-w(E) < R(0)
[R(S)-w(S), w(S)-S] [R(0),0]
委托： R(S)-w(S) > R(0) 不委托： R(S)-w(S) < R(0)
2
接受
[0，0]
拒绝
努力
委托：
2
努力
偷懒 [0，0]
0.9*[20-w(E)]+0.1*[10-w(E)]>0
不委托：
0 低产
高产
(0.1)
(0.9)
高产 (0.1)
[10-w(E), w(E)-E]
0
低产
0.9*[20-w(E)]+0.1*[10-w(E)]<0
(0.9)
偷懒：
[10-w(S), w(S)-S] 委托：
复旦大学谢识予经济博弈论3
3.5 有同时选择的动态博弈模型
3.5.1 标准模型 3.5.2 间接融资和挤兑风险 3.5.3 国际竞争和最优关税 3.5.4 工资奖金制度
复旦大学谢识予经济博弈论3
3.5.1 标准模型
博弈中有四个博弈方，分别称为博弈方1、博弈方2、博弈方3和博弈方4
第一阶段是博弈方1和博弈方2的选择阶段，他们同时在