《博弈与社会》第次作业参考答案
张维迎《博弈论与信息经济学》讲义-第01章-博弈与社会
导论:个人理性与社会效率
张维迎 教授 北京大学光华管理学院
本章目录
• • • • 社会问题; 理性人行为; 效率标准; 外部性与科斯定理。
社会的两个基本问题
• 社会是什么? • 协调(coordination) • 合作(cooperation)
协调问题:以交通为例
B
靠左行
靠 左 行
– Cognitive ability(limited computational skill and serious flawed memories)
• 有限毅力(bounded willpower);
– Present-biased preference
• 有限自利(bounded self-interest)
Homo economicus vs. Homo sociologicus
• Adam Smith vs. Emile Durkheim • Rational, outcome-oriented; social normoriented, not outcome-oriented:
• “the former is supposed to be guided by instrumental rationality, while the behavior of the latter is dictated by social norms. The former is „pulled‟ by the prospect of future rewards, whereas the latter is „pushed from behind by quasi-inertial forces.
社会问题及其解决办法
《博弈与社会》第1次作业 (参考答案)
第2页
(3) 用延展式表示这一博弈。(2 分) 解:
2. 妈妈有 3 个孩子,A、B 和 C。一天妈妈发现客厅的台灯被打坏了,她知道只可能
是 3 个孩子在玩耍时,其中之一打坏的 —— 实际上的“罪魁祸首”是 A,但是妈妈不
知道这一点。
不过,比起惩罚打坏台灯的孩子,妈妈更关心事情的真相,她宣布所有 3 个孩子将
(f) 如果在参与人 1 做出选择之后游戏未立即结束,接下来轮到参与人 2 行动,随 后游戏结束;
(g) 如果参与人 1 选择“正面”并且游戏未立即结束,参与人 2 在这时可以选择“向 上 (U)”、“向下 (D)”或者“向一旁 (S)”三者之一:如果他选择“向上”,参与人 1 和 参与人 2 分别获得 9 单位和 6 单位支付;如果他选择“向下”,参与人 1 和参与人 2 分 别获得 3 单位和 1 单位支付;如果他选择“向一旁”,参与人 1 和参与人 2 分别获得 1 单位和 5 单位支付;
(北京航空航天大学校级通识课程 2018 年春季学期) (参考答案)
1. 考虑以下游戏: (a) 有两个参与人,分别记为“参与人 1”和“参与人 2”; (b) 参与人 1 首先行动,他选择“正面 (H)”、“背面 (T)”或者“中间 (M)”三者之
一; (c) 如果参与人 1 选择“正面”,其选择将被参与人 2 直接观察到;但是,参与人 2
(1) 将这一情境视为一个博弈,写出参与人 1 和参与人 2 的全部策略 (2 分)。 解:
参与人 1 只有 1 个信息集,即在游戏一开始时。在参与人 1 的该信息集上,参与人 1 有 3 个可选行动 —— “正面 (H)”、“背面 (T)”或者“中间 (M)”,因此参与人 1 有 3 个策略,分 别记为:
光华管理学院《博弈与社会》-第5章讨价还价与耐心
谈判与信息
• 谈判的过程实际上是信息揭示和窥探的 过程; • Screening and Signaling • (沈阳的砍价公司) • 由于信息不对称,谈判的结果并不总是 帕累托最优的;事实上,许多帕累托改 进没有被利用。
谈判中的社会规范
• Norm-free bargaining and norm-constrained bargaining; • Procedure norms and substance norms
N
W3 W1 W2
b
P
a
图示
(1)协议一定在边界上; (2)效用度量单位的改变 不会影响最后的协议; (3)去掉没有被选择的部分 也不会影响最后的协议。
纳什福利函数的解释
• (a,b)对最后的分配具有决定性的意义,可 以理解为“谈判砝码”(bargaining power); • h和k:是剩余价值的分配比例,又可以理解为 谈判力(bargaining strength),可能与个人的耐 心有关,或与个人的边际贡献(可替代性)有 关; • 纳什解:如果两个人是对称的(即可分配价值 以过(a,b)点的45度线对称),h=k=1/2
决定结果的关键因素
• • • • 谁先出价? 谈判有无最后时限? 谁最有耐心(时间偏好)? 谈判的固定成本多大?
变量说明
• 我们先考虑没有固定谈判成本的情况; • 假定
– x:A得到的份额; – y:B得到的份额;x+y=1 – s:A的贴现率;a=1/(1+s):A的贴现因 子; – r:B的贴现率;b=1/(1+r):A的贴现因 子;
举例
• 抗战后国共两党边谈判,边打仗; • 海峡两案军备; • WTO谈判; • 中美贸易冲突; • 劳资谈判;
博弈与社会第一次作业
美国纽约郊外某公寓前,一位叫朱诺比的女子在回家途中遇刺。其间,尽管她大声求救,并 且至少有 38 位目击者看到了犯罪经过或听到了呼救,但竟没有一人拨打电话。本题将通过 一个博弈模型来对这个案例进行分析。
街道上的顾客可以决定在哪一家购买奶茶。购买后,他获得的效用为 10-Pi-tx(i=1,2)。
其中 Pi 是奶茶的价格,tx 是交通成本(这里,x 是他距离进行消费的奶茶店的距离,t 是单 位交通成本)。 (i)假设城管规定奶茶 GG 和奶茶 MM 的摊位位置(a 和 1-b)必须是固定的。这时,他们 只能通过价格战来争取消费者。请求出他们各自面对的需求曲线(也就是奶茶价格和销售量 的关系)。在均衡状态下,两人的价格、消费量和利润。 (ii)城管决定放松对摊位的管理。这样,为了争夺市场,奶茶 MM 和奶茶 GG 都可以改变 设摊地点(即他们可以选择 a 和 b)。在给定设摊地点后,他们再同时决定奶茶售价 P1 和 P2。 请问:在均衡时,两人选择的设摊位置各是什么?有人说,对于有缘人,无论是向左走,还 是向右走,他们终究总会在一起。在我们的故事中,这种说法对吗?
3、Braess 悖论 在交通规划中,增加道路建设往往被视为缓解交通拥堵的有效方法。但在 1968 年的一
篇论文中,数学家 Dietrich Braess 却提出了一个令人惊讶的观点,即:在个人独立选择路径 的情况下,为某路网增加额外的通行能力,有时非但不能缓解拥堵,反而会导致路网整体运 行效率的降低。本习题将向你介绍这一著名的悖论。
2、一锤定音?ຫໍສະໝຸດ 新一代“江南才子”唐伯狮、文征白和祝枝海参加由华府组织的绘画大赛,他们提交的
《博弈与社会》第2次作业
《博弈与社会》第2次作业(北京航空航天大学校级通识课程2014年秋季学期)姓名:学号:成绩:1.假设某一产业内现由一个垄断的在位企业(I)供给全部产品,一个潜在的进入者(E)要决定是否进入该产业,并与在位的垄断者展开竞争。
要生产开产业产品,有一系列生产技术可供选择。
任何一家企业都可以不同的固定成本(相当于研发成本)-边际成本组合(相当于生产成本),(),F c,满足:[]=-∈154,1,3F c c也就是,任何一家厂商都可以自由地选择以较低的边际成本进行生产,代价是付出更高的固定成本。
一旦一家厂商选择了其生产技术,它将只能以这一技术进行生产(没有重新选择的机会)。
任何一家厂商选择的生产技术都会被其竞争对手观察到。
考虑一个两阶段问题。
在任何一个阶段,市场需求均为:()9==-q D p p在第一阶段,在位企业(I)作为垄断者需要选择其生产技术,并在该期独自生产和销售产品,获得利润。
在第二阶段,潜在的进入者(E)需要首先决定是否进入,并且,(1) 如果它决定进入,它需要选择一个生产技术,并与在位企业展开Cournot竞争;(2) 如果它决定不进入,则在位垄断者在第二阶段仍然是垄断者。
假设:潜在进入者只有在能够获得正利润的时候才会选择进入,在位垄断者的目标是最大化其两阶段利润之和,在位垄断者在两个阶段需要分别支付一次固定成本F。
(1) 假设没有潜在进入者的威胁,在为垄断者将会选择怎样的生产技术?(2分)(2) 如果在位垄断者确实选择了你在上问得到的生产技术,潜在进入者是否会进入?如果是,潜在进入者又将会选择怎样的生产技术?(2分)(3) 在位垄断者是否可能通过在第一阶段选择某种生产技术,阻止潜在进入者在第二阶段的进入?如果可能,在位垄断者能够实现这一目标的技术区间是什么?(2分)(4) 考虑到潜在进入者的进入威胁,在位垄断者的最优技术选择应该是什么(2分)?潜在进入者又将对此做出何种反应(2分)?。
博弈与决策作业1(答案)
博弈与决策 平时作业参考答案(1)一、名词解释1.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。
2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。
4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。
5.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。
6.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。
7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。
8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。
二、请用剔除劣势策略的方法寻找以下博弈的最优策略。
要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。
乙甲答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列; (3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]百事可乐答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列; (3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]员工乙员工甲答:(1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R ”所对应的列;(2)对员工甲而言,在员工乙剔除R 策略之后,C 策略是劣势策略,用横线划去“C ”所对应的行; (3)对员工乙而言,此时劣势的策略是L ,用竖线划去“L ”所对应的列; (4)对员工甲而言,此时劣势的策略是D ,用竖线划去“D ”所对应的行; (5)余下的策略组合是(U ,M ),这就是该博弈的最优结果。
博弈与社会第二次作业参考答案
左都御史:(不斩,B)
刑部 尚书
(斩,A) (斩,B) (不斩,A) (不斩,B)
(斩,A) 1,1,3 1,1,3 3,2,1 2,3,2
大理寺卿 (斩,B) (不斩,A) (不斩,B) 1,1,3 3,2,1 2,3,2 1,1,3 2,3,2 2,3,2 2,3,2 3,2,1 2,3,2 2,3,2 2,3,2 2,3,2
左都御史:(不斩,A)
刑部 尚书
(斩,A) (斩,B) (不斩,A) (不斩,B)
(斩,A) 1,1,3 1,1,3 3,2,1 3,2,1
大理寺卿 (斩,B) (不斩,A) (不斩,B) 1,1,3 3,2,1 3,2,1 1,1,3 3,2,1 2,3,2 3,2,1 3,2,1 3,2,1 2,3,2 3,2,1 2,3,2
刑部 尚书
(无罪,B) (无罪,C) (有罪,B) (有罪,C)
大理寺卿 (无罪,B) (无罪,C) (有罪,B) (有罪,C) 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 3,2,1 2,3,2 2,3,2 3,2,1 3,2,1 2,3,2 1,1,3
容易知道在整个博弈中, 有 15 个 Nash 均衡 (用粗体标出) 。 结合第二阶段应有的选择, 可知博弈共有 9 个精炼 Nash 均衡,用灰色标出。 这些结果中,哪一个更有可能出现呢?注意到,其实对于尚书大人来说, (无罪,B) 是一个弱占优战略,而对于左督御史来说(有罪,C)是一个弱占优战略。如果剔除了所有 弱被占优战略,那么唯一剩下的 Nash 均衡就是( (无罪,B) , (有罪,B) , (有罪,C) ) 。相 对于其他的战略,这个战略显然更靠谱,更容易出现。此时,一枝花将有罪,并被流放三千 里。 (2) 如果刑部尚书可以承诺在第二期必然选择 C, 则他有可能通过子博弈精炼均衡 ( (无 罪,C) , (无罪,C) , (有罪,C) )为一枝花脱罪。如前所述, (有罪,C)是左督御史的占 优战略。给定他采用这一战略,如果刑部尚书威胁说: “我认为一枝花无罪,如果他被判有 罪,那么我宁愿将其斩首! ”这时大理寺卿会作何感想呢? 如果他确认尚书真能遵守承诺, 那么(无罪,C)就能成为其最优反应战略。此时, 均衡( (无罪,C) , (无罪,C) , (有罪, C) )将会实现,此时一枝花将会被无罪释放。 但是如果博弈真进行到第二阶段,那么尚书将会更偏好将“一枝花”流放而非处斩。因 此他的上述威胁是不可置信的。 如果其他两位大人预料到了这点, 那么上述的结果就不可能 出现了。 (3)如果博弈顺序改为先决定是否问斩,然后决定是否有罪。如果有罪,他将被流放。 ”或“流放(B) ” 。 则仍然可以先考虑第二阶段。这一阶段,三位大人可以选择“无罪(A)
《博弈与社会》第2次作业 (参考答案)
这种情况下只能作为寡头企业之一)。在这种情况下,企业 B 将在 t 0 期直至 t 10 期 (共 11
期) 作为寡头企业之一存在于市场中,在 t 11 期直至 t 25 期 (共 15 期) 作为垄断者存在于市
场中,其将获得的累计利润总额为:
tB1,L ,25
10 B
t 1 t
t2511%tB
求解这一博弈的子博弈完美 Nash 均衡 (Subgame Perfect Nash Equilibrium)。(3 分) 解:
首先容易计算:即使企业 A 作为垄断者独自留在市场中,它最多停留到 t 20 期;即使企 业 B 作为垄断者独自留在市场中,它最多停留到 t 25 期。以上分别是两家企业停留在市场中
问求出的间接需求系统和直接需求系统,分别求解当两家企业之间展开 Cournot 竞争和 Bertrand
第2页
竞争时的均衡,在过程中,分别在 qA,qB 空间和 pA,pB 空间画出当两家企业之间展开 Cournot
竞争和 Bertrand 竞争时的反应函数。(2 分) 解:
考虑两家企业之间展开 Cournot 竞争的情况。企业 A 选择产量 qA 最大化利润:
的最长可能期间,如果不是作为垄断者而是作为两家寡头企业之一,任何一家企业停留在市场中 的期间只会更少。
与企业 A 作为垄断者的获利期间相比,企业 B 作为垄断者的获利期间要长出 5 个期间。这 意味着只要能够坚持到 t 20 期以后,那么在自 t 21期直至 t 25 期之间的这 5 个期间,企业 B 将肯定能够获得累计利润:
退出 (否则在该期就将亏损)。
综上,本博弈唯一的子博弈完美 Nash 均衡是:企业 A 将坚持到 t 10 期,然后在 t 11 期 退出市场;企业 B 一直坚持到 t 25 期,然后在 t 26 期退出市场。
博弈与社会——精选推荐
姓名: 学号: 年级专业: 成绩:1.两个年轻人在一个巷子里玩“迎面”游戏。
第一个转向的称为“小鸡”,而没有转向的则获得同伴的尊敬。
当然没有人转向,则两个人就会最终在碰撞中死掉。
“迎面”游戏的地报酬由下表给出:B 的策略转向 不转转向A 的策略不转(1) 给出这个博弈的纳什均衡。
(2) 如果B 知道了A 一定会选择“不转”这个事实,B 会怎么选择?如果B 不知道A的这个信息,结果又会如何?现在再来解释一下“狭路相逢勇者胜”的道理?(3) 从(2)中你得到什么启示?纯战略纳什均衡是(转向,不转)和(不转,转向),括号里前面一个表示A 的战略,后面一个表示B 的战略。
而(1,3)和(3,1)是均衡的结果,不是均衡。
如果还考虑混合战略纳什均衡,还有一个{(0.5,0.5),(0.5,0.5)},第一个小括号是A 的混合战略,第二个是B 的混合战略。
如果A 一定不转,而且B 知道,那么B 会选择“转向”这个战略,这个博弈会出现(3,1)这个结果,而如果B 不知道,那么仍然会像前面说的那样,具有多重均衡的特征,如果没有其他协调机制,混合战略均衡更可能成为最终的结果。
勇气是一种承诺,是一种可信的威胁,是一种置于死地而后生的气概。
一方面,对自己有利的信息一定要传递出去。
另外,勇气更要靠做,无论对手如何叫嚣自己勇敢,只要你用实际行动(比如把车的转向系统固定住,从技术上排除转向的可能),对手也会让步。
2.在一些帆船或长跑比赛中,领跑的运动员非常注意其后面参赛者的一些动作,而后面的运动员则总想出其不意,超过领跑者。
在股市分析员或经济预测员中,业绩较好的预测员往往是随大流的,而新手则会初出茅庐不怕虎,常有惊人之言。
在个人电脑市场中,IBM 的创新能力远不如将标准化的技术批量生产的本领,新概念更多来自于像苹果电脑、太阳电脑等新近创立的、在市场中处于劣势的企业。
试用博弈论理论解释这些现象。
【思路1】类似于一个“智猪博弈”,维持现状对于在位者而言至少是一个弱占优战略(就像小猪的等待),而对于挑战者来说则恰恰相反,与其坐以待毙,不如奋力一搏。
《博弈与社会》第 次作业 参考答案
假设当代理人获得一笔确定的收入 w 时,他因此获得的效用是:
uw w
而如果代理人面对不确定性的收入,则其效用函数具有 von Neumann-Morgenstern 期望效用函数
的形式。也就是,如果代理人以概率分布 p p1, p2 ,L , pm 获得收入 w w1, w2 ,L , wm , 其中 pi 0,1 表示代理人获得收入 wi 的概率,满足:
subject to :
1
2 w
42 w
1 w
5 w
3
3
33
3
3
1
2
41
2
8
w w w w
3
3
32
2
5
1
2
4
w w 0
3
3
3
简化和整理约束条件,这一最大化问题等价于:
第5页
12 maxw,w 3 w 3 w
subject to : w w 1
2w w 4
这时委托人获得的期望利润为:
2
2
5
其中前两条不等式关系是相互矛盾的。因此,代理人的努力程度 e2 是不可实现的。
(3) 如果委托人不能直接观察到 (或者不能证实) 代理人的努力水平,委托人应该提供怎样的工 资合同 (4 分)?这时委托人能够获得的期望利润是多少 (1 分)? 解:
由上问,当努力程度不可被观察时,委托人无法使代理人选择努力程度 e e2 ,因此只需要
e e1 ,
25 w w1 9
(2) 如果委托人不能直接观察到 (或者不能证实) 代理人的努力水平,证明代理人的努力程度 e2 是不可实现的 (2 分)? 解:
当代理人的努力程度 e 不可被观察时,委托人提供的工资合同无法将工资 w 直接写成努力 e 的函数,他因而将工资 w 写成产出 y 的函数:
2016博弈与社会第一次作业
参与人 − P R 战争 4 − P ,R k,k
请问,P 值需要怎样取值,才能让人们走出“战争”状态? U9V 尽管“利维坦”可能帮助人们走出战争状态,但人们为建立“利维坦”,需要放弃大量权利、
付出高昂成本。因此并不是在所有情况下,人们都有激励建立“利维坦”。我们可以考虑如下情
(1)假设如所上有图,司假机设的有目4标00都0 名是司通机行需时要间从最A小地化驶,往他们B 地同。时对选于择每行位驶司路机径,,都则有在两纳条什行均驶衡路下径, 他们可的选行:驶A-时C-间B 或将是A-多D 少–B?。其中,AD 图路R段, "和`2CbbB悖路论段的通行速度都不受车辆总数的影响, (2经)过现这在两政路个段府路的为时段了间都为缓必x解/须10交耗0。通时拥45堵分,钟决。定但在通过CDA之C 间路修段和建一DB条路通段路的。时经间过则这由条本通路路段,上司行机驶可 以从的C车点辆直决定达U。RDV 假具(设体为所来简有说司化机,其的如间目果标,路都假是段设通上行由行时驶C间最到的小车D化辆,的总他时们数间同为时为x选,0择)则行。通驶请路过问径路,,段则在在的此纳时条什间均通为衡路下x-/建10成0。后,纳 什均(衡1)将假发设他生所们怎的有行样司驶的机时改间的将目变是标?多都少通?是路通能行如时政间府最所小预化料,他的们那同样时,选缓择解行交驶通路拥径堵,则吗在?纳什均衡下,
他们茶同,时因选此斯择大Q自学就的己等计提算于供机两教的人授奶分S茶2别i2`数供6`量应ƺ?H的BQ+?1奶一和茶直Q奉数2行,量“以以之考求和试得。成绩两最最人大高生分的为产利一R润yy杯、。按奶请分茶问布的曲这成线次依本次竞都给争是出博c弈(的这纳里什
均衡c<是a)什,么他最?们终这的成绩决个”的策均政目衡策标是,都岂否料是可去利年以润秋由学最重期大,复化他剔。三除门课被程占的学优生战们略全体的在过期程末考达试到弃?考,以全员零分的
《博弈与决策》平时作业-学生1
《博弈与决策》平时作业学生姓名:学校名称:班级:《博弈与决策》第1次平时作业一、名词解释1. 博弈论:2. 完全信息:3. 静态博弈:4. 动态博弈:5. 非合作博弈:6. 纳什均衡:7. 纯策略:8. 纯策略纳什均衡:二、请用剔除劣势策略的方法寻找以下博弈的最优策略。
要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。
三、根据优势策略下划线法找出以下博弈的所有纳什均衡。
要求: (1)划出相应优势策略的下划线;(2)给出最优的博弈结果。
五、博弈分析假设你所在的公司现在的发展虽然还可以, 但是未来前景不容乐观, 所以老板只能对一个人加薪。
如果你和你的同事之间只有一个人提出来加薪的请求, 老板会考虑为提出要求的这个员工加薪, 当然不会对那个没有提出来的员工加薪了。
但是假如你和你的同事两个人一起提出来要加薪, 那么老板就只有选择同时辞退你们俩。
请给出这个博弈的矩阵分析图, 并解释你最优的策略。
《博弈与决策》第2次平时作业一、名词解释1. 不确定性:2. 最大期望收益法:3. 混合策略:4. 支付均等法:5. 子博弈:6. 逆向归纳法:二、请用最大期乙L R甲UD三、求解以下博弈的纳什均衡。
要求: (1)写出计算步骤;(2)给出所有纳什均衡策略。
四、请用逆向归纳法分析以下博弈的可能结果。
五、寻找可信的威胁。
假如有两个博弈参与者, 2号威胁1号说, 假如1号参与者对她使坏心, 他就会对1号参与者也使坏心。
那么在以下哪些博弈图中, 1号会相信2号的威胁?《博弈与决策》第3次平时作业一、名词解释1. 网络外部性:2. 大规模协调博弈:3. 重复博弈:4. 无名氏定理:5. 针锋相对策略:6. 冷酷策略:二、请分析以下重复博弈的合作与背叛问题。
1. 图3-1和乙好心坏心甲好心坏心乙好心坏心甲好心坏心三、分析以下博弈的结果及策略。
要求: (1)给出可能的博弈均衡;(2)写出应采取的行动策略。
二零零九年春季学期《博弈与社会》课程作业参考答案
一个区间都是合理的,本问请给出该区间的上下限。)这时的总福利W ∗ = π ∗ − d ∗ 是多少?
(4) 运用所学的外部性和科斯定理的有关原理解释以上三问结果。
解答:(要求:计算部分每问要写出过程和结果)
(1) 这时化工厂目标是最大化其利润:
max q
R
(
q
)
−
c
(
q
)
=
(10
−
q
)
⋅
q
−
1 16
假设该工厂生产者是该种化工产品的唯一生产者,其面临的市场需求曲线是
q ( p) =10 − p ,其中 p 表示产品价格, q 表示产品需求量。
该工厂的生产会产生污染,影响附近的一家农场。假设该工厂每生产 1 单位化工产品,
就会产生 1 单位污染物排放(因此,对农产产生负面影响的污染数量也用 q 表示),污染给
多少?
(2) 假设产权明确,除非得到额外补偿,化工厂可以不考虑其生产对农场产生的影响(化工 厂拥有污染农场的权利)。也就是说,如果要让化工厂产出低于其只考虑自身利润最大化时
的水平,农场必须要向化工厂支付“治污费”。这时经过双方谈判,化工厂最优的产出水平 q∗
应为多少?为此农场应向化工厂支付多少“治污费”?(提示:这时有一个区间都是合理的,
农场带来的损失(damage)为:
d
(q)
=
1 8
⋅
q2
。
(1) 假设化工厂不考虑其生产对农场产生的影响,并且由于产权不明,也不存在其他补偿机
制。这时化工厂最优产量 q∗ 是多少?(厂商决策的目标是利润 π 的最大化, π = R − c ,其
中 R 为销售收入。)其利润 π ∗ 是多少?农场蒙受的损失 d ∗ 是多少?总福利W ∗ = π ∗ − d ∗ 是
《博弈与社会》第3次作业 (参考答案)
e1 k 2
,
e2
k 4
w1
这时雇主获得的利润是:
k2 4
,
w2
k2 8
e1 , w1 ; e2 , w2 k e1 w1 1 k e2 w2
k k2 k k2 k 1 k 2 4 4 8
k 2 1
2 k 2 1 2 8 4 2
2
k 2 1
1 2 1 2 8 4 2
1 2
k 2 1 1 2 4
c2 e 2 2 e
U i e w ci e
其中 w 代表工人的工资收入。两种类型的工人的保留效用都等于 0。雇主收益与工人努力程度之 间的关系是:
e k e
假设雇主和工人都是风险中性的,也就是当面临风险时,他们都最大化各自的期望受益。 (1) 如果雇主对工人的信息完全了解,那么雇主的最大化问题是什么 (1 分)?这时雇主将激励工 人选择怎样的努力水平,并为此支付给工人多少工资 (1 分),雇主将获得多少利润 (1 分)? 解: 如果雇主对工人的信息完全了解,也就是可以直接区分第 1 类工人和第 2 类工人,那么雇 主的最大化问题是:
w2 2e2 2 0 ,
w1 e12 w2 e2 2
w2 2e2 2 ,
2 2 2 2 w1 e1 w2 e e e 2 1 2
带回到雇主的约束最大化问题,得到无约束最大化问题:
二零零九年春季学期《博弈与社会》课程作业(第2次)
二零零九年春季学期《博弈与社会》课程作业(第2次)1. 考虑下面这个博弈,注意:信息结构为Ⅰ时,只有图中标注为Ⅰ的直虚线;信息结构为Ⅱ时,只有图中标注为Ⅱ的弯虚线。
另外,双方的支付用上下的方式标出了,上面一个数字表示player 1的支付,下面一个表示player 2的支付(虚线连接表示被连接在一起的决策点的信息集是一样的。
以Ⅱ为例,虚线表示play2在做决定时只知道play1是否选择了A,至于选择B或C并不确定。
):Ⅱ(play1的payoff)40 5 0 1 0 0 0 3 (play2的payoff)(1)分别在Ⅰ、Ⅱ的情况下写出player 1和player 2的信息集,并写出两者各自的所有纯战略。
在Ⅰ的情况下,p1的信息集是最上面一个结点,p1知道自己的可选战略,但不知道p2的实际选择,p2的信息集是三个标注2的结点的组合,p2知道自己的可选战略,但不知道p1的实际选择。
此时,p1的所有纯战略为A、B、C,p2的纯战略为a、b、c在Ⅱ的情况下,p1的信息集是最上面一个结点,p1知道自己的可选战略,但不知道p2的实际选择,p2的信息集有两个,一个是最左边一个标注2的结点,一个是另外两个标注2的结点的组合,p2知道自己的可选战略,同时可以知道p1是否选择了A,但如果p1没有选择A,则不能分辨p1究竟是选择了B还是C。
此时,p1的所有纯战略为A、B、C,p2的所有纯战略为(a,a),(a,b),(a,c),(b,a),(b,b),(b,c),(c,a),(c,b),(c,c),括号里前一个数字表示当p1选择A时p2的行动,第二个数字表示当p1没有选择A时p2的行动。
(2)用标准式重新表示Ⅰ、Ⅱ型博弈,并求出纯战略纳什均衡,如果可以精炼,求出子博弈精炼纳什均衡。
对于ⅡPlayer 2Player 1 a,a a,b a,c b,a b,b b,c c,a c,b c,cA 4,4 4,4 4,4 0,0 0,0 0,0 0,5 0,5 0,5B 0,0 1,10,0 0,0 1,10,0 0,0 1,1 0,0C 5,0 0,0 3,35,0 0,0 3,35,0 0,0 3,3纯战略纳什均衡为{B,(b,b)}、{C,(b,c)}、{B,(c,b)}、{C,(c,c)}使用SPNE 的定义,在每个子博弈中必须都得是NE (本题中除了原博弈,只有一个子博弈,即p1选A 对应的那个结点开始的子博弈)。
《博弈与社会》第2次作业 (参考答案)
其中, 1 度量产品差异程度 ( 越大,两家企业生产产品的差异越大);qA 和 qB 分别表示代 表性消费者对企业 A 和企业 B 生产产品的消费。 (1) 根据间接需求系统,求解该市场的直接需求系统 (即将 qA 和 qB 表示为两家企业生产产品的 价格, pA 和 pB ,的函数)。(1 分)
两家企业之间展开两阶段博弈:在第一阶段,企业 A 和企业 B 同时行动,分别决定各自的产能 (capacity), xA 和 xB ;在第二阶段,企业 A 和企业 B 首先观察到彼此的产能 (他们当然也知道自 己的产能),然后它们同时行动,展开 Bertrand 竞争。假设企业 A 和企业 B 在博弈第一阶段设定
企业 B 选择产量 pB 最大化利润:
B pB , pA pB pA pB c
分别求解上述两个最大化问题,得到两家企业的反应函数:
pA pB
c 2
2
pB
,
pB
pA
c 2
2
pA
第3页
联立两家企业的反应函数,得 Bertrand 竞争均衡解 (即两家企业之间展开 Bertrand 竞争时,每家 企业的均衡策略):
采用逆向归纳法分析这时的博弈。
在博弈的第二阶段,两家企业的产能 xA 和 xB 已经给定。由于存在产能的限制,这时的反应
函数,不妨记作 p%A pB 和 p%B pA ,将成为什么形式?由于对称性,以下我们集中分析企业 A 在第二阶段的策略反应,即集中求解 p%A pB 。
p Bertrand A
2
c
4 2 2
北航《博弈与社会》第 次作业 参考答案
p1 e2 p2 h2 w2 h2 e2 a h1 e2 e2 a h2 e1 h2 w2 h2 e2
可以得到厂商 1 最大化问题的一阶 (必要) 条件 (F.O.C.),也就是反应函数:
第5页
h1 a e2 w1 2 , e1 a h2 w1 2
和厂商 2 最大化问题的一阶 (必要) 条件 (F.O.C.),也就是反应函数:
第3页
h2 a e1 w2 2 , e2 a h1 w2 2
联立厂商 1 和厂商 2 的反应函数,可以得到:
h1 e1 a 2w1 w2 3
可以得到两国工会最大化问题的一阶 (必要) 条件 (F.O.C.),也就是反应函数:
w1 w2 a 2w1 w2 4
联立得到:
w2 w1 a 2w2 w1 4 w1 5a 8w1 2w2 15
w2 5a 8w2 2w1 15
带入相关表达式,可以得到两国就业量:
这时,由于存在国际贸易,需要区别一国厂商生产并在本国销售的产品和出口到外国的产品。
不妨设厂商 1 生产并在国家 1 销售的产品数量为 h1 ,在国家 2 销售的产品数量为 e1 ;厂商 2 生产并在国家 1 销售的产品数量为 e2 ,在国家 2 销售的产品数量为 h2 。两家厂商分别在两国市
场上展开 Cournot 竞争。 用反向归纳的方法求解。
8 5a 6w2 3w1 5a 7w2 w1
2025
工会收益:
U1 w1 w1 L1 4 5a 7w1 2w2 5a 7w1 w2 15 45 4 5a 7w2 2w1 5a 7w2 w1
U 2 w2 w2 L2 15 45
国际贸易前后对比 (略)。
博弈与决策网上作业答案
博弈与决策网上作业答案第一次作业答案1.博弈当中通常包括下面的内容,除了(支付 ?? )。
2.博弈论中,局中人从一个博弈中得到的结果常被称为(损益 ? ? ? ? )3.一个博弈中,直接决定局中人损益的因素是(? 策略组合? ? ? )4.下列关于策略的叙述哪个是错误的(一个局中人在原博弈中的策略和在子博弈中的策略是相同的? ? ? )5.囚徒困境说明(?双方都独立依照自己的利益行事,则双方不能得到最好的结果???????? )6.在具有占优策略均衡的囚徒困境博弈中(?两个囚徒都会坦白???? )7.策略式博弈,正确的说法是(策略式博弈无法表明行动顺序? ? ?? )8.市场交易中普遍存在的讨价还价属于哪种博弈。
(完全信息动态博弈? ? ?? ? )9.公共物品的特征是(不用购买就可消费? ? ? ? )10.下面哪一项物品具有非排他性(?国防 ? ?? )11.在一个博弈中博弈方可以有很多个V12.在一个博弈中只可能存在一个纳什均衡。
X13.在博弈中知道越多的一方越有利。
X14.在博弈中纳什均衡是博弈双方能获得的最好结果。
X15.在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。
X16.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
V17.囚徒困境说明个人的理想选择不一定是集体的理想选择。
V18囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
X19.纳什定理说明在任何一个有n个博弈方存在的有限博弈中,都至少存在一个纳什均衡。
V20.根据参与人行动的是否同步来区分,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。
V21.在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。
X22.子博弈可以从一个多节点信息集开始。
X23.公共物品实际上就是公用的物品。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《博弈与社会》第3次作业
(北京航空航天大学校级通识课程 2018年春季学期)
(参考答案)
1. 假设一家雇主考虑与一名工人签约,雇主不确切知道工人的类型,只知道工人可能是两种类型,{}1,2i ∈,该率分别为π和1π-。
如果工人付出的“努力程度”是e ,那么两种类型的工人的“努力成本”(或“负效用”) 分别等于:
()21c e e =, ()222c e e =
任何一种类型的工人的效用函数都是:
()()i i U e w c e =-
其中w 代表工人的工资收入。
两种类型的工人的保留效用都等于0。
雇主收益与工人努力程度之间的关系是:
()e k e π=⋅
假设雇主和工人都是风险中性的,也就是当面临风险时,他们都最大化各自的期望受益。
(1) 如果雇主对工人的信息完全了解,那么雇主的最大化问题是什么 (1分)?这时雇主将激励工人选择怎样的努力水平,并为此支付给工人多少工资 (1分),雇主将获得多少利润 (1分)? 解:
如果雇主对工人的信息完全了解,也就是可以直接区分第1类工人和第2类工人,那么雇主的最大化问题是:
()()()()11221122max ,,1;e w e w k e w k e w ππ∏=⋅-+-⋅-
()()2
11111111
,0..:U w e w c e w e s t =-=-≥ ()()2
2222222
2,20U w e w c e w e =-=
-≥
注意由于雇主能够可以直接区分第1类工人和第2类工人,这里不需要激励相容约束,只需要参
与约束。
无论要激励工人选择怎样的努力水平,这时雇主向任何一类工人支付的工资都没有理由高于恰好使得该类工人获得保留效用的水平。
因此参与约束一定以等式成立:
()()211111111,0U w e w c e w e =-=-=
()()222222222,20U w e w c e w e =-=-=
⇒
211w e =, 2222w e =
带回到雇主的约束最大化问题,得到无约束最大化问题:
()()()()
22121122max ,12e e k e e k e e ππ∏=⋅-+-⋅-
⇒
12
k e *=
, 24
k e *
=
⇒
124
k w *
=
, 228
k w *
=
这时雇主获得的利润是:
()()()()
11221122,,1;e w e w k e w k e w ππ********∏=⋅-+-⋅-
()2212448k k k k k k ππ=⋅-+-⋅-⎛⎫⎛⎫
⎪ ⎪⎝⎭⎝⎭
()2
2
14
8
k k ππ-=+
22
8
k k π+=
(2) 假设如题干所述,雇主对工人的信息不确切了解,写出这时雇主的最大化问题及其约束条件
(2分)? 解:
如果雇主对工人的信息不确切了解,雇主的最大化问题及其约束条件是:
()()()()11221122
max ,,1;e w e w k e w k e w ππ∏=⋅-+-⋅-% ()()111
1,0..:U w e IR s t ≥
()()222
2,0U w e
IR ≥ ()()()111
1221,,U w e U w e IC ≥
()()()222
2112,,U w e
U w e IC ≥ 带入相关表达式,上述4个约束条件可以写成: ()2
1110w e IR -≥
()2
22220
w e IR -≥
()22
1122
1w e w e IC -≥-
()2
2
2211
222w e w e IC -≥-
(3) 求解第 (2) 问的最大化问题,得到雇主的最优合约 (3分),这时雇主将获得多少利润? 解:
第 (2) 问的最大化问题中,容易证明,当目标函数最大化时,2IR 和1IC 必定以等式成立,即:
22220w e -=, 221122w e w e -=-
⇒
2222w e =, 2222
11221
2
w e w e e e =+-=+ 带回到雇主的约束最大化问题,得到无约束最大化问题:
()()()()
2221211222
max ,12e e k e e e k e e ππ∏=⋅--+-⋅-% ⇒
12
k e *=
, ()2142k e ππ
*
⋅-=
-
⇒
()
()
12
222
1442k k w ππ*⋅-=
+
-, ()
()
22
22
2142k w ππ*
⋅-=
-
这时雇主获得的利润是:
()()()()
11221122
,,1;e w e w k e w k e w ππ********∏=⋅-+-⋅-% ()()()()()()22222221121124424242k k k k k k k ππππππππ⋅-⋅-⋅-=⋅--+-⋅----⎛⎫⎛⎫
⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭ ()()()()()2222112114424242k k k k k ππππππππ⋅-⋅-⋅-=-+-----⎛⎫⎛⎫
⎪ ⎪ ⎪⎝⎭⎝
⎭ ()
()
()
2
2
22124
42k k ππππ⋅--⋅=
+
- (4) 对比雇主知道和不知道工人私人信息的情况 (1分)? 解:
对比第 (2 问和第 (3) 问的结果,与信息对称的情况相比,如果雇主对工人的私人信息不确切了解,也就是雇主不知道工人的类型,那么均衡时:
(a) 第1类工人 (高能力工人) 的努力程度不变,但是能够得到更高的工资 —— 因此能够获得正的剩余 (而不是0) —— 这是因为为了防止其模仿第2类工人,雇主不得不让渡给其一部分价值;
(b) 第2类工人 (低能力工人) 的努力程度更低,得到的工资也更低,并且仍然只能获得0剩余;
(c) 雇主设计合同,放弃激励第2类工人执行(与对称信息情况下相同水平的)更大的努力程
度,也就意味着放弃了部分本可以通过激励第2类工人工作获得的利润,但其价值在于能够更大程度提高第1类工人模仿第2类工人的成本,雇主因而能够通过激励第1类工人工作实现更大的利润;
(d) 与信息对称的情况相比,在信息不对称的情况下,雇主能够获得最大利润显然更低:
()
()()
2
2
2222
124
842k k k k πππππ⋅--⋅+∏
-∏=+
--%
()
()()
()
2
2
22121842k k ππππ⋅--⋅-=
-- ()()()()2
2
1211842k ππππ--=⋅---⎡⎤
⎢⎥⎢⎥⎣⎦
()()()()
2
211214
22k ππππ⋅---=
--⎡⎤
⎢
⎥⎢⎥⎣
⎦
()21114
22k ππ
π⋅--=
--⎛⎫
⎪⎝⎭
()()
2104
22k πππ⋅--=
<-
这是因为在信息不对称的情况下,雇主通过设计合同识别不同类型的工人,并对工人进行激励以实现利润的最大化,需要付出相应的成本。