博弈论谢识予第四五章参考答案

合集下载

基础博弈论课后习题答案

基础博弈论课后习题答案基础博弈论课后习题答案博弈论是一门研究决策制定和行为模式的学科，它的应用领域广泛，涉及经济学、政治学、社会学等多个学科。

在学习博弈论的过程中，课后习题是检验学生对于理论知识的理解和应用能力的重要方式。

下面将给出一些基础博弈论课后习题的答案，希望能够对读者有所帮助。

1. 博弈论的基本概念是什么？博弈论是一种研究决策制定和行为模式的数学理论。

它通过建立数学模型来描述各方之间的决策和行为，以及这些决策和行为对彼此的影响。

博弈论的基本概念包括博弈参与者、策略、支付和均衡等。

2. 什么是纳什均衡？纳什均衡是博弈论中的一个重要概念，指的是在一个博弈中，如果每个参与者都选择了最优策略，而且没有人可以通过改变自己的策略来改善自己的支付，那么这个博弈就达到了纳什均衡。

纳什均衡是一种稳定的状态，参与者之间没有激励去改变自己的策略。

3. 什么是零和博弈？零和博弈是一种特殊的博弈形式，它的特点是参与者的利益完全相反，一方的收益等于另一方的损失。

在零和博弈中，参与者的总收益为零，因此被称为“零和”。

在零和博弈中，参与者的最优策略是追求自己的最大化收益，同时也会考虑对方的最大化损失。

4. 什么是博弈树？博弈树是博弈论中用于描述博弈过程的一种图形模型。

它通过树状结构展示参与者的决策和行动，以及这些决策和行动对彼此的影响。

博弈树的根节点代表博弈的起始状态，每个分支代表一个参与者的决策，叶节点代表博弈的终止状态。

5. 什么是混合策略？混合策略是博弈论中的一种策略形式，指的是参与者以一定的概率选择不同的纯策略。

在混合策略中，参与者不是单一地选择一个纯策略，而是根据一定的概率分布选择不同的纯策略。

混合策略可以帮助参与者在博弈中达到更好的收益。

以上是对一些基础博弈论课后习题的简要答案。

博弈论作为一门重要的学科，其理论和应用价值不容忽视。

通过学习博弈论，我们可以更好地理解决策制定和行为模式，并在实际生活中做出更明智的选择。

博弈论谢识予第四五章参考答案

第四章参考答案2、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。

在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，甚至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。

这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

3、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者较长期的关系。

从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次16重复博弈中无法直接运用，因为没有最后一次重复。

因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。

此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，有些在有限次重复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。

例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。

两类重复博弈民间定理的差异也说明了这一点。

最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。

上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发是促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的意义。

6、用画线法容易找出该博弈的两个纯策略纳什均衡（T，L）和（M，R）。

这两个纳什均衡的得益都帕累托劣于（B，S）。

一次性博弈中效率较高的（B，S）不可能实现。

2019年“博弈论”阅读及答案-范文模板 (3页)

本文部分内容来自网络整理，本司不为其真实性负责，如有异议或侵权请及时联系，本司将立即删除！== 本文为word格式，下载后可方便编辑和修改！ ==“博弈论”阅读及答案阅读下面文字，完成6-8题。

“博弈论”是运筹学的一个分支，它是研究个体如何在错综复杂的相互影响中得出最合理的策略的一种理论。

“博弈”这一说法是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语，听上去有点玄奥，实际上却具有重要现实意义。

博弈论大师看经济社会问题犹如棋局，常常寓深刻道理于游戏之中。

所以，博弈论多从我们日常生活中的凡人小事入手，娓娓道来，并不乏味。

在博弈论中，有一个著名的“囚徒困境”博弈模型。

假设一位富翁在家中被杀，财物被盗。

警方抓到两个犯罪嫌疑人，并从他们的住处搜出赃物。

但是，他们矢口否认曾杀过人。

于是警方将两人隔离后进行审讯。

检察官给出如下条件：由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。

但是，如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。

如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。

但是，如果你们两人都坦白交代，那么，你们都要被判五年刑。

两个囚犯面临着两难的选择——坦白或抵赖。

显然最好的策略是双方都抵赖，结果是大家都只被判一年。

但是由于两人在隔离的情况下无法串供，所以，每一个人都从利己的目的出发，选择坦白交代这一最佳策略。

因为坦白交代可以期望得到最短的监禁，但前提是同伙抵赖，这显然比自己抵赖坐十年牢要好。

这种策略是损人利己的策略。

不仅如此，坦白还有更多的好处。

如果对方坦白了而自己抵赖了，那自己就得坐十年牢。

因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判五年。

所以，两人合理的选择是坦白，原本对双方都有利的策略（抵赖）和结局（被判一年刑）就不会出现。

在这个“囚徒困境”中，每个局中人选择了自己的最优策略，从而使自己利益最大化。

博弈论各章节课后习题答案 (5)

第五章合作博弈1.设三人联盟博弈的特征函数v 的值是：v({i})=0,i=1,2,3;v({1,2})=2/3,v({1,3})=7/12,v({2,3})=1/2,v({1,2,3})=1。

求出该联盟博弈的核心，并用图形表示出来。

解：博弈G 的核心C(v)。

博弈G 的转归集I[N,v]为:123123123[,]{(,,)0,0,0,1}I N v x x x x x x x x x x ==≥≥≥++=若，则的充分条件为：],[),,(321v N I x x x x ∈=)(v C x ∈x 1≥0;x 2≥0;x 3≥0;x 1+x 2≥2/3;x 1+x 3≥7/12;x 2+x 3≥1/2;x 1+x 2+x 3=1由后面几个不等式得到x 1≤1/2;x 2≤5/12,x 3≤1/3.该联盟博弈的核心C(v)={(x 1,x 2,x 3)|0≤x 1≤1/2,0≤x 2≤5/12,0≤x 3≤1/3,x 1+x 2+x 3=1}核心C(v)是图中阴影区域（含边界）。

2.假设有一3人合作博弈，其特征函数为：v({1,2,3})=200,v({1,2})=150,v({1,3})=110,v({2,3})=20,v({1})=100,v({2})=10,v({3})=0。

计算该合作博弈的Shapley 值，核心，最小ε-核心，稳定集，内核和核仁。

1、Shapley 值φ1(v)＝1/3（100-0）＋1/6（150－10）＋1/6（110-0）＋1/3（200-20）＝135φ2(v)＝1/3（10-0）＋1/6（150－100）＋1/6（20-0）＋1/3（200-110）＝45φ3(v)＝1/3（0-0）＋1/6（20－10）＋1/6（110-100）＋1/3（200-150）＝20所以该博弈的Shapley 值φ(v)＝（135，45，20）2、博弈G 的核心C(v)。

博弈G 的转归集I[N,v]为:}200,0,10,100),,({],[321321321=++≥≥≥==x x x x x x x x x x v N I 若，则的充分条件为：],[),,(321v N I x x x x ∈=)(v C x ∈x 1≥100;x 2≥10;x 3≥0;x 1+x 2≥150;x 1+x 3≥110;x 2+x 3≥20;x 1+x 2+x 3＝200对此可作高为200的重心三角形Δ123。

博弈论第四章

（1）起始结是一个单结的信息结;
（2）子博弈保留了原博弈的所有结构。则称它为原博弈的一个子博弈（子博弈）。
按照博弈树的延伸的时序，或者按照博弈树生长的时序，我们用一个扁椭圆形的虚线的圈，把所论局中人在同一个时点的若
干决策节点罩起来，成为他的一个信息集。
（1）起始结是一个单结的信息结
x1
L L 1 2 S L 2 S （1，1）（2，2） 1 （-1，-1）（-1，-1） S 2 L L S （2，2）
镇上能卖6000元；但如果另一家商铺同时在小镇上卖
鞭炮，价格下跌使得这批鞭炮只能卖4000元。纳什均
衡是什么？
• 假设甲先行动，商铺乙看到对方的选择后再决定是否
进货，子博弈精炼纳什均衡是什么？
如果甲先行动，但在博弈开始前商铺主乙有一次行动A 的机会，利用子博弈精炼均衡概念分析下述两种情况下
的博弈结果：何行动他都不会改变这个决定；
一颗大树表示一个博弈，一颗小树同样可以表示
一个博弈。如果小树是大树的一颗子树，并且
小树表示的博弈不破坏大树表示的博弈的结构，
那么小树表示的博弈，就叫做大树表示的博弈
的子博弈。
一、子博弈（sub-game）
子博弈定义：在一个扩展型博弈中，如果一个博弈由它的一个决策结及其所有后续结构成，并满足:
信息集的时候，面临决策的局中人对于博弈迄今的历史是
不清楚的，他不清楚博弈具体走到了他的这个信息集里面的哪个决策节点。
在市场进入博弈中，包含3个子博弈（包括原博弈）。而在囚徒博弈中，只有一个子博弈(?)
收益： A
B 容忍
进入抵抗 A 不进入 B
B
抵赖
B 抵赖
-1 ，-1 -9 ，0 0 ，-9

演化博弈论谢识予ppt

一般2*2对称博弈
dx/dt
复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态和进化稳定策略
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰鸽
, vc
2
0, v
,
v 2
鹰鸽博弈
复制动态方程和相位图
dx x(v c) (1 x)v F ( x) x(1 x)[ ] dt 2 2
(m-z)/(1-P) 1
x
(m-z)/(1-P)<0 0<(m-z)/(1-P)<1
dx/dt
1
x
(m-z)/(1-P)>1
5.4 复制动态和进化稳定性：两人非对称博弈
5.4.1 市场阻入博弈的复制动态和进化稳定策略 5.4.2 非对称鹰鸽博弈的进化分析
5.4.1 市场阻入博弈的复制动态和进化稳定策略
最优反应动态模拟
博弈方1 博弈方2
1 2.5 3 2 1.5 1.75
1 2 收敛条件 | dr || dr | 1
dq2
dq1
问题：两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性：两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
dy/dt
1 x
x=0
dy/dt
1
x
x=0
两群体复制动态的关系和稳定性
y 1

经济博弈论(第三版)复习题及答案%20谢识予著

5
L 2，0 3，4
R
7、我们用反应函数法来分析这个博弈。先讨论博弈方 1 的选择。根据问题的假设，如果博弈方 2 选择金额 s2（0≤s2≤10000），则博弈方 1 选择 s1 的利益为： s1 u(s1)= 0
当 S1≤10000 -s2 当 S1≤10000 -s2
因此博弈方 1 采用 s1=1000—s2 时，能实现自己的最大利益 u(s1)= s1=1000— s2。因此 s1=1000—s2 就是博弈方 1 的反应函数。博弈方 2 与博弈方 1 的利益函数和策略选择是完全相似的，因此对博弈方 1 所选择的任意金额 s1，博弈方 2 的最优反应策略，也就是反应函数是 s2=1000- s1。显然，上述博弈方 1 的反应函数与博弈方 2 的反应函数是完全重合的，因此本博弈有无穷多个纳什均衡，所有满足该反应函数，也就是 s1+ s2=10000 的数组（s1 ，s2）都是本博弈的纯策略纳什均衡。如果我是两个博弈方中的一个，那么我会要求得到 5000 元。理由是在该博弈的无穷多个纯策略纳什均衡中，（5000，5000）既是比较公平和容易被双方接受的，也是容易被双方同时想到的一个，因此是一个聚点均衡。 9、（1）两个厂商的利润函数为： πi=pqi-ciqi=(a-qi-qj)qi-ciqi 将利润函数对产量求导并令其为 0 得： ∂π i =a-qj-ci-2qi=0 ∂qi 解得两个厂商的反应函数为： qj=（a- qj-ci）/2 或具体写成： q1=(a-q2-c1)/2 q2=(a-q1-c2)/2 (2)当 0＜ci＜a/2 时，我们根据上述两个厂商的反应函数，直接求出两个厂商的纳什均衡产量分别为： a − 2c1 + c 2 3 a + c1 − 2c 2 q2= 3 (3)当 c1＜c2＜a，但 2c2＞a+ c1 时,根据反应函数求出来的厂商 2 产量 q2＜0。这意味着厂商 2 不会生产，这时厂商 1 成了垄断厂商，厂商 1 的了优产量选择是利润最大化的垄断产量 a − c1 q1=q* = 2 因此这种情况下的纳什均衡为[（a- c1）/2, 0]。 q1=

博弈论与信息经济学部分课后习题答案

解：（1）成为先行者意味着 3 点：1.企业可以赚取比古诺状态下更多的利润，否则没有动机成为先行者；2.追随企业没有办法威胁先行企业，即选取产量使己方产量为正，它方产量为负 3.如果另一企业成为先行者，该企业可以成功威胁另一企业max 1q1, q2 100 0.5q1 0.5q2 q1 5q1 q1先求古诺均衡：q195 0.5q2max 2 q1, q2 100 0.5q1 0.5q2 q2 0.5q22q2q1 80, q2 30,因此为满足条件 1，对于任何先行动者来说，必须有 q1 80, q2 30 （否则追随者可以选取产量，使价格等于古诺价格，此时先行者利润低于古诺均衡时情况）a．如果企业 2 成为领导者，观察企业 1 能否采取威胁战略使己方利益为正，对方利益为负： 1 q1, q2 100 0.5q1 0.5q2 q1 5q1 0即： 2 q1, q2 100 0.5q10.5q2 q20.5q2 20 200 2q2 q1 190 q2对于企业 2 的任何产量先行决策 q2 10 ，只要企业 1 威胁其产量 q1 将满足上式，则企业 2 将不敢先行动若 q2 10 ，与先行动者的 q2 30 矛盾。

因此企业 2 不会是先行者b.考虑企业 1 能否成为先行者，由 a 已经知道企业 1 可以成功在企业 1 先行时成功威胁企业 2。

故只需考虑如果企业 1 先行，企业 2 能否威胁企业 1当企业 1 先行动时，企业 2 决策max 2 q1, q2 100 0.5q1 0.5q2 q2 0.5q22 q2 q2 50 0.25q1企业 1 决策：max 1q1, q2 100 0.5q1 0.5q2 q1 5q1 q1 max 70 0.375q1 q1 q1 q1 380 93.33 3因此企业 1 的产量决策范围为 80 q1 93.33而企业 2 要惩罚企业 1 为领导者必须满足2 q1, q2 1 q1, q2 100 0.5q1100 0.5q1 0.5q2 0.5q2q2q1 0.5q22 5q1 00 190 q1 q2 100 0.5q1 q1 180这与 80 q1 93.33 矛盾。

博弈论教程答案

博弈论教程答案【篇一：《经济博弈论》课后答案、补充习题答案】 2345篇二：经济博弈论(谢织予)课后答案及补充习题答篇三：博弈论课后习题么是博弈？博弈论的主要研究内容是什么？2、设定一个博弈模型必须确定哪几个方面？3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、“囚徒的困境”的内在根源是什么？举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法，有哪些主要的类型？6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的：你决定开，则0.35的概率你讲收益300万元（包括投资），而0.65的概率你将全部亏损；如果你不开，则你能保住本钱但也不会有利润，请你（a）用得益矩阵和扩展形式表示该博弈；（b）如果你是风险中性的，你会怎样选择？（c）如果你是风险规避的，且期望得益的折扣系数为0.9，你的策略选择是什么？(d)如果你是风险偏好的，期望得益折算系数为1.2，你的选择又是什么？7、一逃犯从关押他的监狱中逃走，一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢，但一旦被抓住则要加刑10年；看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈，并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么？2、为什么说纳什均衡是博弈分析中最重要的概念？3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质，对博弈分析有什么不利影响？5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡？博弈的结果是什么？6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则：双方同时提出自己要求的数额s1和s2，,如果s1+s2≤10 000，则两博弈方的要求都得到满足，即分别得到s1和s2，但如果是s1+s2＞10 000,则该笔钱就被没收。

经济博弈论(谢织予)课后答案及补充习题答案汇编

虽然调查显示我们的创意计划有很大的发展空间，但是各种如“漂亮女生”和“碧芝”等连锁饰品店在不久的将来将对我们的创意小屋会产生很大的威胁。
送人□有实用价值□装饰□
附件（二）：
动漫书籍□化“自助化”
大学生购买力有限，即决定了要求商品能价廉物美，但更注重的还是在购买过程中对精神文化爱好的追求，满足心理需求。
送人□有实用价值□装饰□
虽然调查显示我们的创意计划有很大的发展空间，但是各种如“漂亮女生”和“碧芝”等连锁饰品店在不久的将来将对我们的创意小屋会产生很大的威胁。
精明的商家不失时机地打出“自己的饰品自己做”、“DIY(Do It Yourself)饰品、真我个性”的广告，推出“自制饰品”服务，吸引了不少喜欢标新立异、走在潮流前端的年轻女孩，成为上海的时尚消费市场。其市场现状特点具体表现为：
2003年，全年商品消费价格总水平比上年上升1%。消费品市场销售平稳增长。全年完成社会消费品零售总额2220.64亿元，比上年增长9.1%。

演化博弈论__谢识予答案

dy/dt dy/dt
x=0
1
x
x=0
1
x
两群体复制动态的关系和稳定性
y 1
1/2
0
1
x
5.4.2 非对称鹰鸽博弈的进化分析
博弈方2
鹰
鸽
鹰博鸽弈方 1
非对称鹰鸽博弈博弈方1群体复制动态相位图
dx/dt dx/dt
dx/dt
1
x
y>5/6
y=5/6
x 1
y<5/6
1x
非对称鹰鸽博弈博弈方2群体复制动态相位图
第五章有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。完全理性在现实中很难满足，当社会经济环境和决策问题较复杂时，人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响，有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心，以进化稳定策略为基本均衡概念的进化博弈分析，包括基本方法、概念和各种经典模型等。
x——鸣叫雄蛙比例复制动态方程
可能的不动点： x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
1
x
dx/dt
(m-z)/(1-P)<0
(m-z)/(1-P)
1x
0<(m-z)/(1-P)<1
(m-z)/(1-P)>1
1x
5.4 复制动态和进化稳定性：两人非对称博弈
A
B
A
B
BA
AB
B
B
B
B

博弈论参考答案

博弈论参考答案博弈论参考答案博弈论是一门研究决策制定的学科，它涉及到多个参与者之间的相互作用和决策过程。

在博弈论中，参与者的目标是最大化自己的利益，但是他们的决策又会受到其他参与者的影响。

因此，博弈论提供了一种分析决策制定的工具和方法。

博弈论的基本概念是博弈，它是指参与者根据一定的规则进行决策的过程。

在博弈中，每个参与者都有自己的策略和目标，他们通过不同的决策来达到自己的目标。

博弈论研究的重点是分析参与者之间的相互作用和决策过程，以及他们的策略选择和结果。

在博弈论中，最常见的博弈形式是零和博弈和非零和博弈。

零和博弈是指参与者的利益完全相反，他们的利益总和为零。

在这种情况下，一个参与者的利益的增加必然意味着其他参与者的利益的减少。

非零和博弈则是指参与者的利益可以同时增加或减少，他们的利益总和不一定为零。

博弈论中的一个重要概念是纳什均衡，它指的是在一个博弈中，每个参与者选择的策略都是最优的，即使其他参与者的策略发生改变也不会改变自己的策略。

纳什均衡是博弈论中的一个重要解概念，它帮助我们理解参与者之间的相互作用和决策过程。

除了纳什均衡，博弈论还有其他一些解概念，如帕累托最优解和博弈树。

帕累托最优解是指在一个博弈中，存在一种策略选择使得每个参与者的利益都得到最大化，而没有其他策略可以使任何一个参与者的利益得到进一步增加。

博弈树则是一种图形化的表示方式，它将博弈的过程和决策树结合起来，帮助我们分析和理解博弈的过程和结果。

博弈论在许多领域都有应用，如经济学、政治学、生物学等。

在经济学中，博弈论被广泛应用于分析市场竞争、价格战略等。

在政治学中，博弈论被用来分析国际关系、选举策略等。

在生物学中，博弈论被用来分析动物行为、进化策略等。

总之，博弈论是一门研究决策制定的学科，它提供了一种分析决策制定的工具和方法。

通过博弈论的研究，我们可以更好地理解参与者之间的相互作用和决策过程，为决策制定提供参考和指导。

博弈论在许多领域都有应用，它对我们理解和解决实际问题具有重要的意义。

经济博弈论(第三版)复习题及答案%20谢识予著

1
自然赚（35%）我开不开开不开亏（65%）
（300）（100）
（0）Байду номын сангаас（100）
（b）如果我是风险中性的，那么根据开的期望收益与不开收益的比较： 0.35×300+0.65×0=105＞100 肯定会选择开。（c）如果成功的概率降低到 0.3，那么因为这时候开的期望收益与不开的收益比较： 0.30×300+0.70×0=90＜100 因此会选择不开，策略肯定会变化。（d）如果我是风险规避的，开的期望收益为： 0.9×（0.35×300+0.65×0）=0.9×105=94.5＜100 因此也会选择开。（e）如果我是风险偏好的，那么因为开的期望收益为： 1.2×（0.35×300+0.65×0）=1.2×105=126＞100 因此这时候肯定会选择开。 10、首先需要注意的是，在该博弈方的得益单位不同，逃犯得到的是增加或者减少的刑期（年），而看守得到的则是奖金（元），因此除非先利用效用概念折算成相同的单位，否则两博弈方的得益相互之间不能比较和加减。直接采用单位不同的得益，该博弈的得益矩阵如下：看路线一 -10，1000 10，0 守路线二 10，0 -10，1000
其实，根据该得益矩阵不难得到与上述动态博弈相同的结论，仍然是工人会选择偷懒和老板会选择克扣。这个博弈实际上与囚徒的困境是相似的。
第二章复习题
4，5，5，7，9，10
第二章参考答案
4、多重纳什均衡不会影响纳什均衡的一致预测性质。这是因为一致预测性不是指各个博弈方有一致的预测，而是指每个博弈方自己的策略选择与自己的预
逃犯
路线一路线二
该博弈的扩展形表示如下：
逃犯路线一看守路线一路线二路线一路线二路线二

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?（见教材）2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品，那么他们每家将获得利润400万元；如果只有一家企业推出新产品，那么它将获得利润700万元,没有推出新产品的企业亏损600万元；如果两家企业都不推出该产品，则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? （见教材）4. 产生“囚犯困境”的原因是什么？你能否举出现实经济活动中囚徒困境的例子？原因：个体理性与集体理性的矛盾。

例子：厂商之间的价格战，广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? （见教材）2. 剔除以下规范式博弈中的严格劣策略，再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知，该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解：设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线，如下图，图中粗的折线，就是F(x)的图象由图可知，纳什均衡点与β1无关，所以原问题化为新的2*2矩阵博弈：由公式计算得：。

复旦大学谢识予经济博弈论

0.1*[20-w(S)] +0.9*[10-w(S)]<0
23
四、有不确定性且不可监督的委托人—代理人博弈
1
委托
不委托
只能根据成果付酬，w是成果函数，而非努力程度函数。不确定性对代理人利益、选择有影响。
2
接受
[0，0]
拒绝
高产 (0.9)
2
努力
偷懒
0
低产高产 (0.1) (0.1)
[10-w(10), w(10)-E]
[R(S)-w(S), w(S)-S] [R(0),0]
委托： R(S)-w(S) > R(0) 不委托： R(S)-w(S) < R(0)
21
数值例子
R(E)10EE2
E=2, S=1, W(E)=4, w(S)=2
1
委托
不委托
2
接受
[0,0] 拒绝
2
努力
[0,0] 偷懒
[12, 2]
[7，1]
第二阶段是博弈方3和博弈方4的选择阶段，他们在看到博弈方1和博弈方2的选择 a 1 和 a 2 以后，同时在各自的
可选策略（行为）集合 A3 和 A4 中分别选择 a 3 和 a 4
各博弈方的得益都取决于所有博弈方的策略 a1,a2,a3,a4 即博弈方i的得益是各个博弈方所选择策略的多元函数 ui ui(a1,a2,a3,a4)
30
3.5.2 间接融资和挤兑风险
客不存户 1 存款
客户2 不存存款 1， 1 1， 1 1， 1 第1下.2二一，阶阶1段段.2
第一阶段
客户2 提前到期客提前 0.8，0.8 1，0.6 户 1 到期 0.6，1 1.2，1.2

《博弈论》阅读及答案

“博弈论”阅读及答案阅读下面文字，完成6-8题。

“博弈论”是运筹学的一个分支，它是钻研个体如何在扑朔迷离的相互影响中得出最公道的策略的一种理论。

“博弈”这一说法是从棋弈、扑克和战争等带有比赛、抗衡和决策性质的问题中借用的术语，听上去有点玄奥，实际上却拥有首要现实意义。

博弈论巨匠看经济社会问题如同棋局，往往寓深入道理于游戏当中。

所以，博弈论多从咱们日常生活中的凡人小事入手，娓娓道来，其实不乏味。

在博弈论中，有一个著名的“阶下囚窘境”博弈模型。

假定一名富翁在家中被杀，财物被盗。

警方抓到两个犯罪嫌疑人，并从他们的住处搜出赃物。

然而，他们矢口否认曾杀过人。

因而警方将两人隔离落后行审判。

检察官给出以下条件：因为你们的偷窃罪已有确实的证据，所以可以判你们一年刑期。

然而，如果你单独坦白杀人的罪恶，我只判你三个月的监禁，但你的同伙要被判十年刑。

如果你拒不坦白，而被同伙检举，那末你就将被判十年刑，他只判三个月的监禁。

然而，如果你们两人都坦白交待，那末，你们都要被判五年刑。

两个囚犯面临着两难的选择——坦白或抵赖。

明显最好的策略是双方都抵赖，结果是大家都只被判一年。

然而因为两人在隔离的情况下没法串供，所以，每一个人都从利己的目的动身，选择坦白交待这一最好策略。

因为坦白交待可以指望得到最短的监禁，但条件是同伙抵赖，这明显比自己抵赖坐十年牢要好。

这种策略是损人利己的策略。

不仅如斯，坦白还有更多的益处。

如果对方坦白了而自己抵赖了，那自己就得坐十年牢。

因而，在这种情况下仍是应当选择坦白交待，即便两人同时坦白，最多也只判五年。

所以，两人公道的选择是坦白，本来对双方都有益的策略（抵赖）和终局（被判一年刑）就不会呈现。

在这个“阶下囚窘境”中，每一个局中人选择了自己的最优策略，从而使自己利益最大化。

所有局中人的策略形成了一个最优的策略组合，没有人有足够理由打破这种均衡。

这种由所有局中人（也称当事人、参与者）的最好策略形成的战略组合，被称为“非合作博弈均衡”，也叫“纳什均衡”①。

博弈论最全完整-讲解

Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。但真正起作用的是你的朋友是否使用同样的
逻辑，或者认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然；反之，是否她认为这一选择对你同样显然。……以此类推。也就是说，需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。
例3：为什么教授如此苛刻？
问题是，一个好心肠的教授如何维持如此铁石心肠的承诺？
他必须找到某种使拒绝变得强硬和可信的方法。
拿行政程序或者学校政策来做挡箭牌在课程开始时做出明确和严格的宣布通过几次严打来获得“冷面杀手”的声
誉
导论
博弈均衡与一般均衡博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型主要参考文献
即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个局中人的得益。
“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识（common knowledge）。
据“共同知识”的掌握分为完全信息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束，然后以精心策划的方式选择自己的行为，按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。

谢识予：经济博弈论4——重复博弈

0 0
考虑如下的触发策略：
厂商在第一阶段给工资率 w ，在第t阶段，如果前面t-1 阶段结果都是( w , y) 则继续给 w * ，否则从此永远是w 0 。工人的策略是如果 w w 则接受，否则宁愿作个体户得到 w ，并在以前各期结果都是( w , y) 和当前工资率为 w * 时努力工作，否则偷懒。
-1，-1
（-5，-5）囚徒2 坦白不坦白囚坦白 -10，-10 -5，-13 徒 -13，-5 -6，-6 1 不坦白（-10，-10）
有限次重复削价竞争博弈
寡头2 高价
寡高价头 1 低价 100，100 150，20
低价
20，150 70，70
有唯一纯策略纳什均衡（70，70）有限次重复的结果仍然是（低价，低价）
2
4 1
当
4.5 4 5.0625 即 9 17 1 1
上述策略是厂商2对厂商1的同样触发策略的最佳反应，否则偏离是最佳反应。
4.3.4 有效工资率
模型设定：首先厂商选择工资率为 w ，然后工人选择接受或拒绝。如果拒绝，则他作个体户得到收入 w 小于 w ，如果接受 w ，则工人选择努力工作（负效用 e ）还是偷懒（无负效用）。厂商只能看到产量高低，高产量为 y 0 ，低产量0。工人努力工作时一定是高产量 y ，不努力时却并不一定是0，而是高产量 y 的概率为 p ，低产量0的概率为 1 p 。工人努力工作时，厂商得益为 y w ，工人得益为 w e ；工人偷懒时，厂商期望得益为 py w ，工人得益为 w 。
削价竞争博弈
4.2.3多个纯策略纳什均衡博弈的有限次重复博弈
厂商2
厂商 1

博弈论基础吉本斯课后习题答案

∴ U2 (S + B) 会增加，因为（*）式，U2 (S + B) 增加的幅度比U1(I1 − S ) 减小的幅度大，所以
孩子的收益效用增大了，同时家长的收益效用也增大了。
2.3 根据Shaked和Sutton的研究发现，我们可以把无限博弈截开（见Gibbons教材55页），首先分
析前三阶段：假设在第三阶段参与人1提出S，参与人2接受1-S，则解决方案为（S，1-S）。
目要求，即 ( qc , qc )是唯一的纳什均衡，并且在纳什均衡下，每一企业的福利都要比他们相
互合作时低，但两个企业都没有严格劣战略。 1.6
当 0 < c1, c2 < a / 2 时，易求均衡产量 q1* = (a + c2 − 2c1) / 3 ， q2* = (a + c1 − 2c2 ) / 3 。而当
时，生产 qm / 2 的一方的利润为 π 2 = 5(a − c)2 / 48 ，生产 qc 的一方的利润为
π3 = 5(a − c)2 / 36 ；双方都生产 qc 时，每一方的利润都为 π 4 = (a − c)2 / 9 。以标准式表示
如果有两个候选人，唯一的纯战略纳什均衡为 x1* = x2* = 0.5 ，即两候选人集聚于中点，平
分全部选票。下面简单证明：无论两候选人都在中点右侧，都在中点左侧，还是分居中点两侧，每一候选人都倾向于比另一候选人更接近中点以获得超过半数的选票，所以没有稳定的均衡；都在中点时，每个人都有 1/2 的胜出概率，而偏离必定输掉选举，所以没有人会偏离中点。由此得证上述均衡为唯一的纯战略纳什均衡。如果有三个候选人，可以用类似于上面的方法证明不存在纯战略纳什均衡：无论三个候选人的相对位置如何，都不会形成稳定的均衡。所以题目要求的是混合纳什均衡。具体方法请参见 Hotelling, H. (1929) “Stability in Competition”, Economic Journal 39: 41-57.

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第四章参考答案
、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。

这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者较长期的关系。

从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次
重复博弈中无法直接运用，因为没有最后一次重复。

因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。

此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。

两类重复博弈民间定理的差异也说明了这一点。

最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。

、用画线法容易找出该博弈的两个纯策略纳什均衡（，）和（，）。

这两个纳什均衡的得益都帕累托劣于（，）。

一次性博弈中效率较高的（，）不可能实现。

但该博弈的结构表明存在双方合作的利益，在两次重复博弈中也有构造惩罚机制的条件，因此我会考虑运用试探合作的触发策略争取部分实现（，），提高博弈的效率。

我作为博弈方会采用这样的触发策略：第一次重复采用；第二次重复时，如果前一次的结果是（，），则采用，如果前一次的结果是其他，则采用。

如果另一个博弈方有同样的分析能力，或者比较有经验，那么他（或她）也会采用相似的触发策略：在第一次重复时采用；第二次重复时，如果前一次的结果是（，），则采用，否则采用。

双方采用上述触发策略构成一个子博弈完美纳什均衡，因此是稳定的。

这时候前一次重复实现了（，），提高了博弈的效率。

当然，上述触发策略也是有风险的，因为当另一个博弈方不理解和没有采用上述策略时，我的得益会较低。

当然如果考虑到人们具有学习进步的能力，而且缺乏分析和学习能力，采用效率较低策略的博弈方长期中会逐步被淘汰掉，那么采用上述触发策略的合理性就得到了进一步的支持。

、
可以消去，消去博弈方的策后四个策略组合中不存在纯策略纳什均衡。

根据混合策略纳什均衡的计算方法，不难算出混合策略纳什均衡为：博弈方概率分布（，）在和中随机选择，博弈方则以概率分布（，）在和中随机选择。

由于上述静态博弈是没有纯策略纳什均衡的严格竞争博弈，因此在有限次重复博弈和无限次重复博弈中，两博弈方的均衡策略都是简单复重原博弈的混合策略纳什均衡。

补充习题：
. 判断下列表述是否正确，并简单讨论：
) 有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的
一个纳什均衡。

参考答案：正确。

因为最后一次重复就是动态博弈的最后一个阶段，根据子博弈完美纳什均衡的要求，博弈方在该阶段的选择必须构成纳什均衡。

因为最后一次重复就是原博弈本身，因此该纳什均衡就是原博弈的一个纳什均衡。

) 无限次重复博弈均衡解的得益一定优于原博弈的均衡解的得益。

参考答案：
错误。

对于严格竞争的零和博弈，或者不满足合作条件的其它许多博弈来说，无限制重复博弈并不意味着效率的提高，得益不一定高于原博弈的得益。

. 寡头的古诺产量博弈中，如果市场需求，边际成本且没有固
定成本，贴现因子δ，如果该市场有长期的稳定性，问两个厂商能否维持垄断产量？
参考答案：因为市场有长期稳定性，因此可以把两寡头之间的产量博弈看作无限次重复博弈，讨论能否构造双方在垄断产量上合作的子博弈完美纳什均衡。

首先分析上述产量博弈的一次性博弈的纳什均衡。

根据假设，两个厂商
的利润函数为：
利用反应函数法不难求出纳什均衡产量（古诺产量）为
此时两个厂商的利润为
现在分析垄断产量。

市场总利润函数是：。

博弈论谢识予第四五章参考答案

基础博弈论课后习题答案

博弈论谢识予第四五章参考答案

2019年“博弈论”阅读及答案-范文模板 (3页)

博弈论各章节课后习题答案 (5)

博弈论第四章

演化博弈论__谢识予__ppt

经济博弈论(第三版)复习题及答案%20谢识予著

博弈论与信息经济学部分课后习题答案

博弈论教程答案

经济博弈论(谢织予)课后答案及补充习题答案汇编

演化博弈论__谢识予答案

博弈论参考答案

经济博弈论(第三版)复习题及答案%20谢识予著

博弈论习题及解答

复旦大学谢识予经济博弈论

《博弈论》阅读及答案

博弈论最全完整-讲解

谢识予：经济博弈论4——重复博弈

博弈论基础吉本斯课后习题答案

演化博弈论谢识予ppt