二零一零学年 春季学期 《博弈与社会》第1次习题课

合集下载

2016博弈与社会第一次作业

2016博弈与社会第一次作业

(2()(1)B(erCtr结oaun果rdn来o竞挑t 竞战争这争,一,或政或价策。产格教量竞授竞思争争考)再)奶三奶,茶茶称M赞MM了M学和生和奶们奶的茶茶团G结GG精G神都想,同通给时过了所奶喜有茶欢人的上。供了有应价网量友格来评战论进的行方P式K。,即
不是他选们择同产时说量选,而择这个自是事己选例提择是供人奶们的茶通奶的过茶合价作数格成量。功Q打这1破和下“囚Q可徒2困,乐境以坏”的求了尝得顾试最。客大另,有的他一利些们润网总。友是请惊呼光问,顾这这次价些同竞格学争更对博于低弈的的那纳家什店。 当然均,衡如是果什彼两么此家?而言价这真格个是均一最靠衡样谱是,的否顾队可友客。以就由会重任复选剔一除家被店占购优买战。略请的问过,程在达这到?个价格战 的博弈中,纳什
均衡又是什么?给出均衡时两家的产量,市场的价格,以及利润状况。这个均衡是否可以由
URV 请问,为什么 S2i2` 6`ƺ?HB+? 教授的给分策略会让学生陷入“囚徒困境”? UkV 你认为,在这个事件中,学生为什么可以打成合作,成功突破“囚徒困境”? UjV 如果 S2i2` 6`ƺ?HB+? 教授坚持想要用以上策略给分,那么你能否给教授支个招,让学生 自愿参加考试,重回“囚徒困境”?
9
博弈与社会第一次作业
请于 kyRe 年 9 月 Rk 日提交本次作业!
R、 U战争与和平V 假设两个博弈参与人生活在“丛林法则”之下,每一个参与人都可以选择“战争” 与“和平”,并且其支付矩阵如下所示:
参与人 k 和平 战争 参与人 和平 j,j R,9 R 战争 9,R k,k URV 请问,这个博弈类似于教材中提到的哪类博弈? UkV 这个博弈有几个纳什均衡?它是帕累托最优的吗? UjV 出于对“战争”状况下人民福祉的忧虑,霍布斯建议采用“利维坦”来终结战争状态,即“把 大家所有的权利和力量托付给某一个人或一个能通过多数人的意见把大家的意志化为一个意 志的多人组成的集体。”由于“利维坦”拥有惩罚“战争”的力量,因此可以协调人们走出战争,迎 来和平。我们假设,如果在上述博弈中,参与人们通过契约建立了“利维坦”。如果某人发动战 争,“利维坦”会对其施加惩罚,且惩罚力度为 P UP > 0V。因此,博弈变成了如下形式:

博弈与社会第次习题课

博弈与社会第次习题课

0.64×8+0.36×8= 8
0.64×8.053+0.36 ×8.053=8.053
0.64×8+0.36×8= 8
×9.71+0.36× 4.93=7.99
在状态平面上刻画风险问题
横轴表示第一种状态下的收入,比 如不出事的时候,纵轴对应于第二 种状态,比如出事的时候。
45度线上表示确定性情况,因为
恰当的区分点取决于低能力工人的可行选择
工资水平
低水平工人能否可 以主动选择不参加考试 是问题的关键,也就是 决定了低水平工人的保 留效用
34
圆周率百位数
如果可以放弃:6-(1+θ)=2,θ=3 本题标准答案:6-(1+θ)=1,θ=4
任何为难低能力工人的举动都会同时损 害高能力工人的利益
思考1:强者的自负
0.81×6.485+0.19 ×6.485=6.485
0.81×6.4+0.19×6 .4=6.4
0.81×9.43+0.19× 2.43=8.1
0.81×9+0.19×9 =9
0.81×8.053+0.1 9×8.053=8.053
0.81×8+0.19×8 =8
0.81×9.71+0.19 ×4.93=8.8
无论发生什么状态收入都相等。 如何画出风险中性的消费者与风险
状 态
规避的消费者的无差异曲线? 下
U线=上pu的(w点2)效+用(1水-p)平u(都w相1),同无(差等异于曲 一个常数),取全微分:
的 收 入
p风u险’(w中2)性dw者2+的(1效-p用)u函’(w数1是)d线w1性=0的,

第1章 博弈与社会

第1章 博弈与社会

以两人社会为例
B 的 收 入
X 。
X和Y都是帕累托最优状态, 但Z不是帕累托最优状态 。 Y
Z 。
A的收入
帕累托改进与帕累托标准
• 定义:一种变革没有使任何人的处境变坏,至 少有一个人的处境变好。 • 如果一种状态不是帕累托最优,意味着存在帕 累托改进的可能。 • 如果社会已经处在帕累托最优状态,就不可能 有帕累托改进的余地。 • 状态X帕累托优于状态Y,如果在状态X下,至 少有一个人的处境比状态Y下更好,而没有任 何人的处境比在状态Y下坏。
Homo economicus vs. Homo sociologicus
• Adam Smith vs. Emile Durkheim • Rational, outcome-oriented; social normoriented, not outcome-oriented:
• “the former is supposed to be guided by instrumental rationality, while the behavior of the latter is dictated by social norms. The former is „pulled‟ by the prospect of future rewards, whereas the latter is „pushed from behind by quasi-inertial forces.
靠右行
1, 1
-1, -1
A
靠 右 行
-1, -1
1, 1
协调与预测
• 协调问题的核心是预测(prediction):
– 预测其他人如何行为;
• 个人行为的基本规则是什么? • 信息:too little knowledge; too much knowledge; fail to use the knowledge; no knowledge can help.

《博弈与社会》第1次作业 (参考答案)

《博弈与社会》第1次作业 (参考答案)

第2页
(3) 用延展式表示这一博弈。(2 分) 解:
2. 妈妈有 3 个孩子,A、B 和 C。一天妈妈发现客厅的台灯被打坏了,她知道只可能
是 3 个孩子在玩耍时,其中之一打坏的 —— 实际上的“罪魁祸首”是 A,但是妈妈不
知道这一点。
不过,比起惩罚打坏台灯的孩子,妈妈更关心事情的真相,她宣布所有 3 个孩子将
(f) 如果在参与人 1 做出选择之后游戏未立即结束,接下来轮到参与人 2 行动,随 后游戏结束;
(g) 如果参与人 1 选择“正面”并且游戏未立即结束,参与人 2 在这时可以选择“向 上 (U)”、“向下 (D)”或者“向一旁 (S)”三者之一:如果他选择“向上”,参与人 1 和 参与人 2 分别获得 9 单位和 6 单位支付;如果他选择“向下”,参与人 1 和参与人 2 分 别获得 3 单位和 1 单位支付;如果他选择“向一旁”,参与人 1 和参与人 2 分别获得 1 单位和 5 单位支付;
(北京航空航天大学校级通识课程 2018 年春季学期) (参考答案)
1. 考虑以下游戏: (a) 有两个参与人,分别记为“参与人 1”和“参与人 2”; (b) 参与人 1 首先行动,他选择“正面 (H)”、“背面 (T)”或者“中间 (M)”三者之
一; (c) 如果参与人 1 选择“正面”,其选择将被参与人 2 直接观察到;但是,参与人 2
(1) 将这一情境视为一个博弈,写出参与人 1 和参与人 2 的全部策略 (2 分)。 解:
参与人 1 只有 1 个信息集,即在游戏一开始时。在参与人 1 的该信息集上,参与人 1 有 3 个可选行动 —— “正面 (H)”、“背面 (T)”或者“中间 (M)”,因此参与人 1 有 3 个策略,分 别记为:

博弈与社会第一次作业

博弈与社会第一次作业
5、38 个目击者 在美国的法制史上,有个被称为“38 个目击者”的著名案例:1964 年 3 月 13 日夜,在
美国纽约郊外某公寓前,一位叫朱诺比的女子在回家途中遇刺。其间,尽管她大声求救,并 且至少有 38 位目击者看到了犯罪经过或听到了呼救,但竟没有一人拨打电话。本题将通过 一个博弈模型来对这个案例进行分析。
街道上的顾客可以决定在哪一家购买奶茶。购买后,他获得的效用为 10-Pi-tx(i=1,2)。
其中 Pi 是奶茶的价格,tx 是交通成本(这里,x 是他距离进行消费的奶茶店的距离,t 是单 位交通成本)。 (i)假设城管规定奶茶 GG 和奶茶 MM 的摊位位置(a 和 1-b)必须是固定的。这时,他们 只能通过价格战来争取消费者。请求出他们各自面对的需求曲线(也就是奶茶价格和销售量 的关系)。在均衡状态下,两人的价格、消费量和利润。 (ii)城管决定放松对摊位的管理。这样,为了争夺市场,奶茶 MM 和奶茶 GG 都可以改变 设摊地点(即他们可以选择 a 和 b)。在给定设摊地点后,他们再同时决定奶茶售价 P1 和 P2。 请问:在均衡时,两人选择的设摊位置各是什么?有人说,对于有缘人,无论是向左走,还 是向右走,他们终究总会在一起。在我们的故事中,这种说法对吗?
3、Braess 悖论 在交通规划中,增加道路建设往往被视为缓解交通拥堵的有效方法。但在 1968 年的一
篇论文中,数学家 Dietrich Braess 却提出了一个令人惊讶的观点,即:在个人独立选择路径 的情况下,为某路网增加额外的通行能力,有时非但不能缓解拥堵,反而会导致路网整体运 行效率的降低。本习题将向你介绍这一著名的悖论。
2、一锤定音?ຫໍສະໝຸດ 新一代“江南才子”唐伯狮、文征白和祝枝海参加由华府组织的绘画大赛,他们提交的

博弈论习题及解答

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。

例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。

博弈论练习1答案.docx

博弈论练习1答案.docx

博弈论练习一答案一、名词解释博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略屮进行选择并加以实施,各自取得相应结果的过程。

零和博弈:所有博弈方在每种策略组合下的得益的总和始终为0的博弈。

完全信息静态博弈:纳什均衡:定义在博弃G = {Si,u\» ••• t }中•知果由各个博弈方的各一个策咯组成的某个策咯组合(对•…,§;)中,任一溥弈方i的策略彳• 都是对其余得弃方策略的组合(彳•・・・•对】,$二,・・・,<)的最佳对策,也即U t (si f V I 八:• $二1 ・•・・♦ $;)$如(斗♦心» $g,$二1 ,•••,$;)对任意%GS,都成立,则称〈sf ,•・•■$:)为G的一个絃纳什均#r w(Nash Equilibrium) 0 混合策略:定义在博弈G= {Si,S H M L▼・•・,%}中,博弈方:的策略空间为S t = {/]「・・,》}♦則博弈方i以概率分布pi =(加>随机在其k 个可选簞略中选择的“策略”,称为一个紀混合策略”,其中0W九<1对j = 1,…M都成止,且伽+…+如=1©纳什定理:无限次廛复博弈民间定理:设G是一个完全信息的赭态博弈。

用(€1»…,弘)记G的纳什均衡的得益■用(心刀表示G的任意可实现得益。

如果竝对任意博弈方i都成立,而5足够换近1,那么无限次重复博弃G(g. 6)中一定存在一个子博弈克美的纳什均衡,各博弈方的平均得益.就是(工],…,X M) o 动态博弈除了各博弈方同时决策的静态博弈以外,也有大量现实决策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前,可以看到其他博弈方的选择、行动,甚至还包括自己的选择和行动。

这种博弈无论在哪种意义上都无法看作同时决策的静态博弈,我们把这种博弈称为“动态博弈"(Dynamic Games)子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的, 有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一 部分,称为原动态博弈的一个“子博弈”。

博弈论课件习题_PPT课件

博弈论课件习题_PPT课件

(3)
博T 弈 方 1M
L
2,0 3,4
博弈方2 R
4,2
2,3
(4)
这个2×2博弈有两个纯策略纳什均衡(M,L) 和(T,R)。
由于两个纯策略纳什均衡之间没有帕累托效率 意义上的优劣关系,双方利益有不一致性,因 此如果没有其他进一步的信息或者决策机制, 一次性静态博弈的结果不能肯定。由于双方在 该博弈中可能采取混合策略,因此实际上该博 弈的结果可能是4个纯策略组合中的任何一个。
L
M
R
博2 U 3,1
2,2
5,3
M 2,3 1,3
4,1
B 4,5 2,3
3,4
注:首先用严格下策反复消去法简化博弈,其次分析 选择列策略的博弈2的策略;最后求该博弈的混合策略 NE。
10、找出下列得益矩阵表示静态博弈的纳什么均 衡。
博方2
L
M
R
博2 U 4,3
5,1
6,2
M 2,1 8,4
U(s1)= s1 = 10 000- s2。因此s1 = 10 000- s2就是博
弈方1的反应函数。
(3)
博弈方2与博弈方1的利益函数和策略选 择是完全相似的,因此对博弈方1所选择 的任意金额s1,博弈方2的最优反应策略, 也就是反应函数是s2=10 000- s1。
本博弈有无穷多个纳什均衡,所有满足 该反应函数,也就是s1+s2=10 000的数 组( s1,s2)都是本博弈的纯策略纳什 均衡。
开发
甲 公 司 不开发
本国公司利益,有什
么好的方法?
乙公司
开发
不开发
-10,-10
100,0
0,100
0,0

《博弈论习题》课件

《博弈论习题》课件

完全信息博弈
总结词
研究在所有参与者都拥有完全信息的状态下进行的博弈类型。
详细描述
完全信息博弈中,所有参与者都对其他参与者的策略和收益有完全的了解。这种情况下,参与者能够 准确地评估各种策略的优劣,并做出最优决策。完全信息博弈通常用于分析具有透明度和公正性的竞 争环境。
不完全信息博弈
总结词
研究在至少一个参与者拥有不完全信息的状态下进行的博弈类型。
详细描述
合作博弈强调参与者之间的合作与协商,通过达成协议或联盟来实现共同利益 的最大化。在合作博弈中,参与者通常会考虑对方的利益,寻求一种公平的解 决方案,以实现整体利益的最大化。
非合作博弈
总结词
研究参与者在不描述
非合作博弈强调参与者之间的竞争关系,每个参与者都试图 通过选择最优策略来实现自身利益的最大化。在非合作博弈 中,参与者通常不会考虑对方的利益,而是追求自身利益的 最大化,因此可能存在零和博弈的情况。
纳什均衡的应用实例
1 2
寡头市场
在寡头市场中,企业之间会形成纳什均衡,每个 企业都选择最优的产量策略来最大化自己的利润 。
拍卖
在拍卖中,竞拍者会根据对手的出价来调整自己 的出价,最终达到一个纳什均衡的状态。
3
劳资谈判
在劳资谈判中,工会和雇主会根据对方的策略来 调整自己的策略,最终达到一个纳什均衡的状态 。
博弈论的分类
合作博弈与非合作博弈、 完全信息博弈与不完全信 息博弈、静态博弈与动态 博弈。
博弈论的发展历程
博弈论的起源
博弈论的进一步发展
可以追溯到18世纪和19世纪初的零和 博弈,如国际象棋和围棋的策略。
20世纪50年代以后,博弈论不断拓展 到经济学、政治学、社会学等领域, 成为一门重要的学科。

光华管理学院《博弈与社会》电子教案 课件合集

光华管理学院《博弈与社会》电子教案 课件合集

PROSPECT UTILITY THEORY
• Reference-dependent utility:效用水平定义 在财富的变化上,而非财富的最终状态 上; • framing problem:认知心理学; • non-linear:风险(概率)是非线性的。
• 有限毅力(bounded willpower);
– 如一天工作不能超过2优选择由偏好和约束条件决定:人们 选择的不同可能是由于偏好不同,也可 能是由于面临的约束条件不同,如买 车; • 最优选择在个人边际成本等于边际收益 时达到; • 最优选择会随外生变量的变化而改变。
• 制度性约束:
– 如晚上12点必须熄灯;
关于理性人假设
• 理性人的定义:有一个很好定义的偏好 (well-defined preference);在给定约束下 追求偏好的最大化(maximization) • 偏好是如何形成的? • 关于偏好的假设:
– 完备性(completeness):任何两个可选择的 方案之间都是可比较的; – 传递性(transitivity):(偏好具有一致性)
偏好函数
• 如果偏好满足其他一些假设(特别是连 续性假设),可以定义一个偏好函数或 称效用函数(utility function);
Y
无差异曲线
U = f ( x, y )
• Lexicographic preferences • endowment effect.
A
B X
3
约束条件
• 技术性约束:
2
为什么学习博弈论?
• 博弈论是有关“互动行为”(interactive behavior)的科学
• “A sort of umbrella, or unified field theory for the rational side of social science. It develops methodologies that apply in principle to all interactive situations.”(Aumann and Hart, 1992) • “It provides solid micro-foundations for the study of social structure and social change.”(Jon Elster, 1982)

博弈与社会——精选推荐

博弈与社会——精选推荐

姓名: 学号: 年级专业: 成绩:1.两个年轻人在一个巷子里玩“迎面”游戏。

第一个转向的称为“小鸡”,而没有转向的则获得同伴的尊敬。

当然没有人转向,则两个人就会最终在碰撞中死掉。

“迎面”游戏的地报酬由下表给出:B 的策略转向 不转转向A 的策略不转(1) 给出这个博弈的纳什均衡。

(2) 如果B 知道了A 一定会选择“不转”这个事实,B 会怎么选择?如果B 不知道A的这个信息,结果又会如何?现在再来解释一下“狭路相逢勇者胜”的道理?(3) 从(2)中你得到什么启示?纯战略纳什均衡是(转向,不转)和(不转,转向),括号里前面一个表示A 的战略,后面一个表示B 的战略。

而(1,3)和(3,1)是均衡的结果,不是均衡。

如果还考虑混合战略纳什均衡,还有一个{(0.5,0.5),(0.5,0.5)},第一个小括号是A 的混合战略,第二个是B 的混合战略。

如果A 一定不转,而且B 知道,那么B 会选择“转向”这个战略,这个博弈会出现(3,1)这个结果,而如果B 不知道,那么仍然会像前面说的那样,具有多重均衡的特征,如果没有其他协调机制,混合战略均衡更可能成为最终的结果。

勇气是一种承诺,是一种可信的威胁,是一种置于死地而后生的气概。

一方面,对自己有利的信息一定要传递出去。

另外,勇气更要靠做,无论对手如何叫嚣自己勇敢,只要你用实际行动(比如把车的转向系统固定住,从技术上排除转向的可能),对手也会让步。

2.在一些帆船或长跑比赛中,领跑的运动员非常注意其后面参赛者的一些动作,而后面的运动员则总想出其不意,超过领跑者。

在股市分析员或经济预测员中,业绩较好的预测员往往是随大流的,而新手则会初出茅庐不怕虎,常有惊人之言。

在个人电脑市场中,IBM 的创新能力远不如将标准化的技术批量生产的本领,新概念更多来自于像苹果电脑、太阳电脑等新近创立的、在市场中处于劣势的企业。

试用博弈论理论解释这些现象。

【思路1】类似于一个“智猪博弈”,维持现状对于在位者而言至少是一个弱占优战略(就像小猪的等待),而对于挑战者来说则恰恰相反,与其坐以待毙,不如奋力一搏。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

“博弈论”习题及参考答案《博弈论》习题⼀、单项选择题1.博弈论中,局中⼈从⼀个博弈中得到的结果常被称为()。

A. 效⽤B. ⽀付C. 决策D. 利润2.博弈中通常包括下⾯的内容,除了()。

A.局中⼈B.占优战略均衡C.策略D.⽀付3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有⼀个囚徒会坦⽩B.两个囚徒都没有坦⽩C.两个囚徒都会坦⽩D.任何坦⽩都被法庭否决了4.在多次重复的双头博弈中,每⼀个博弈者努⼒()。

A.使⾏业的总利润达到最⼤B.使另⼀个博弈者的利润最⼩C.使其市场份额最⼤D.使其利润最⼤5.⼀个博弈中,直接决定局中⼈⽀付的因素是()。

A. 策略组合B. 策略C. 信息D. ⾏动6.对博弈中的每⼀个博弈者⽽⾔,⽆论对⼿作何选择,其总是拥有惟⼀最佳⾏为,此时的博弈具有()。

A.囚徒困境式的均衡B.⼀报还⼀报的均衡C.占优策略均衡D.激发战略均衡7.如果另⼀个博弈者在前⼀期合作,博弈者就在现期合作;但如果另⼀个博弈者在前⼀期违约,博弈者在现期也违约的策略称为()。

A.⼀报还⼀报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双⽅都获胜B.博弈双⽅都失败C.使得先采取⾏动者获胜D.使得后采取⾏动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当⼀个垄断竞争⾏业是由⼀个主导企业控制时B.当⼀个寡头⾏业⾯对的是重复博弈时C.当⼀个垄断⾏业被迫重复地与⼀个寡头⾏业博弈时D. 当⼀个寡头⾏业进⾏⼀次博弈时10.⼀个企业采取的⾏为与另⼀个企业在前⼀阶段采取的⾏为⼀致,这种策略是⼀种()。

A.主导策略B.激发策略C.⼀报还⼀报策略D.主导策略11.关于策略式博弈,正确的说法是()。

A. 策略式博弈⽆法刻划动态博弈B. 策略式博弈⽆法表明⾏动顺序C. 策略式博弈更容易求解D. 策略式博弈就是⼀个⽀付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中⼈选择的⼀套⾏动计划;B. 参与博弈的每⼀个局中⼈都有若⼲个策略;C. ⼀个局中⼈在原博弈中的策略和在⼦博弈中的策略是相同的;D. 策略与⾏动是两个不同的概念,策略是⾏动的规则,⽽不是⾏动本⾝。

《博弈与决策》平时作业-学生1

《博弈与决策》平时作业-学生1

《博弈与决策》平时作业学生姓名:学校名称:班级:《博弈与决策》第1次平时作业一、名词解释1. 博弈论:2. 完全信息:3. 静态博弈:4. 动态博弈:5. 非合作博弈:6. 纳什均衡:7. 纯策略:8. 纯策略纳什均衡:二、请用剔除劣势策略的方法寻找以下博弈的最优策略。

要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。

三、根据优势策略下划线法找出以下博弈的所有纳什均衡。

要求: (1)划出相应优势策略的下划线;(2)给出最优的博弈结果。

五、博弈分析假设你所在的公司现在的发展虽然还可以, 但是未来前景不容乐观, 所以老板只能对一个人加薪。

如果你和你的同事之间只有一个人提出来加薪的请求, 老板会考虑为提出要求的这个员工加薪, 当然不会对那个没有提出来的员工加薪了。

但是假如你和你的同事两个人一起提出来要加薪, 那么老板就只有选择同时辞退你们俩。

请给出这个博弈的矩阵分析图, 并解释你最优的策略。

《博弈与决策》第2次平时作业一、名词解释1. 不确定性:2. 最大期望收益法:3. 混合策略:4. 支付均等法:5. 子博弈:6. 逆向归纳法:二、请用最大期乙L R甲UD三、求解以下博弈的纳什均衡。

要求: (1)写出计算步骤;(2)给出所有纳什均衡策略。

四、请用逆向归纳法分析以下博弈的可能结果。

五、寻找可信的威胁。

假如有两个博弈参与者, 2号威胁1号说, 假如1号参与者对她使坏心, 他就会对1号参与者也使坏心。

那么在以下哪些博弈图中, 1号会相信2号的威胁?《博弈与决策》第3次平时作业一、名词解释1. 网络外部性:2. 大规模协调博弈:3. 重复博弈:4. 无名氏定理:5. 针锋相对策略:6. 冷酷策略:二、请分析以下重复博弈的合作与背叛问题。

1. 图3-1和乙好心坏心甲好心坏心乙好心坏心甲好心坏心三、分析以下博弈的结果及策略。

要求: (1)给出可能的博弈均衡;(2)写出应采取的行动策略。

二零零九学年春季学期博弈和社会第1次习题课

二零零九学年春季学期博弈和社会第1次习题课
• 科斯定理与福利效应:虽然不影响效率,但产权的初始配置显然会影响双方的福利分 配(公平),拥有初始产权的一方能够成为“合理的”受偿方,从而获得更大的利益。
2020/4/19
09 Spring,《Game and Society》
8
第1次习题课
思考:
• 第(2)、(3)两问的计算为什么可以分两步完成,即先通过总福利最大化计算 最优污染量,再计算支付区间?
剔除该策略后博弈的标准式简化为:

C1
C2
R1
10,5
5,3

R3
8,10
20,8
2020/4/19
09 Spring,《Game and Society》
14
第1次习题课
第5步:剔除“C2”
无论甲选择什么,“C2”这时都不是乙的最优反应,即因为乙知道甲知 道乙知道甲知道乙是理性的,所以乙不会选择“C2”。
张博 王磊 张骞 李沁 陈韦升 杨梦依 杨冉 赵淇 李阳 林国裕
00611034 00611113 00618030 00625002 00625043 00625092 00625110 00625120 00625162 00628039
薛智佳 金鑫
胡倩怡 王一丹
宋晨 郭雯雯
阎开 李雨涓 刘渤洋 胡文静
剔除该策略后博弈的标准式简化为:

C1
R1
10,5

R3
8,10
2020/4/19
09 Spring,《Game and Society》
15
第1次习题课
第6步:剔除“R3”
无论乙选择什么,“R3”这时都不是甲的最优反应,即因为甲知道乙知 道甲知道乙知道甲知道乙是理性的,所以甲不会选择“R3”。

奥鹏远程南开大学(本部)20春学期《初级博弈论》在线作业参考答案

奥鹏远程南开大学(本部)20春学期《初级博弈论》在线作业参考答案
B正确
【答案】:A
30.如果一个动态博弈中存在几个博弈方同时选择的情况,这时这些博弈方的同时选择构成一个阶段。()
【选项】:
A错误
B正确
【答案】:B
31.若对一个博弈运用严格下策反复消去法后,如果该博弈的策略组合中只有惟一一个幸存下来,这个策略组合就是该博弈的结果。
【选项】:
A错误
B正确
【答案】:B
南开大学(奥鹏)网络教育
《初级博弈论》在线作业
参考资料
20春学期(1709、1803、1809、1903、1909、2003)《初级博弈论》在线作业
1.如果一个博弈中每个博弈方的策略数都是有限的,则称为有限博弈。()
【选项】:
A错误
B正确
【答案】:B
2.严格下侧反复消去法既可以在同一个博弈方的策略空间中反复运用,但不可以在各个博弈方的策略空间上交叉运用()
【选项】:
A错误
B正确
【答案】:B
22.非对称博弈的ESS必须都是纯策略的()
【选项】:
A错误
B正确
【答案】:B
23.合作博弈就是博弈方采取相互合作态度的博弈()
【选项】:
A错误
B正确
【答案】:A
24.博弈方的策略空间必须是数量空间,博弈的结果必须是数量或者能够数量化()
【选项】:
A错误
B正确
【答案】:A
【选项】:
A错误
B正确
【答案】:A
36.子博弈必须从一个单节点信息集开始。()
【选项】:
A错误
B正确
【答案】:B
37.不允许存在有约束力协议的博弈称为非合作博弈()
【选项】:
A错误

二零零九年春季学期《博弈与社会》课程作业(第2次)

二零零九年春季学期《博弈与社会》课程作业(第2次)

二零零九年春季学期《博弈与社会》课程作业(第2次)1. 考虑下面这个博弈,注意:信息结构为Ⅰ时,只有图中标注为Ⅰ的直虚线;信息结构为Ⅱ时,只有图中标注为Ⅱ的弯虚线。

另外,双方的支付用上下的方式标出了,上面一个数字表示player 1的支付,下面一个表示player 2的支付(虚线连接表示被连接在一起的决策点的信息集是一样的。

以Ⅱ为例,虚线表示play2在做决定时只知道play1是否选择了A,至于选择B或C并不确定。

):Ⅱ(play1的payoff)40 5 0 1 0 0 0 3 (play2的payoff)(1)分别在Ⅰ、Ⅱ的情况下写出player 1和player 2的信息集,并写出两者各自的所有纯战略。

在Ⅰ的情况下,p1的信息集是最上面一个结点,p1知道自己的可选战略,但不知道p2的实际选择,p2的信息集是三个标注2的结点的组合,p2知道自己的可选战略,但不知道p1的实际选择。

此时,p1的所有纯战略为A、B、C,p2的纯战略为a、b、c在Ⅱ的情况下,p1的信息集是最上面一个结点,p1知道自己的可选战略,但不知道p2的实际选择,p2的信息集有两个,一个是最左边一个标注2的结点,一个是另外两个标注2的结点的组合,p2知道自己的可选战略,同时可以知道p1是否选择了A,但如果p1没有选择A,则不能分辨p1究竟是选择了B还是C。

此时,p1的所有纯战略为A、B、C,p2的所有纯战略为(a,a),(a,b),(a,c),(b,a),(b,b),(b,c),(c,a),(c,b),(c,c),括号里前一个数字表示当p1选择A时p2的行动,第二个数字表示当p1没有选择A时p2的行动。

(2)用标准式重新表示Ⅰ、Ⅱ型博弈,并求出纯战略纳什均衡,如果可以精炼,求出子博弈精炼纳什均衡。

对于ⅡPlayer 2Player 1 a,a a,b a,c b,a b,b b,c c,a c,b c,cA 4,4 4,4 4,4 0,0 0,0 0,0 0,5 0,5 0,5B 0,0 1,10,0 0,0 1,10,0 0,0 1,1 0,0C 5,0 0,0 3,35,0 0,0 3,35,0 0,0 3,3纯战略纳什均衡为{B,(b,b)}、{C,(b,c)}、{B,(c,b)}、{C,(c,c)}使用SPNE 的定义,在每个子博弈中必须都得是NE (本题中除了原博弈,只有一个子博弈,即p1选A 对应的那个结点开始的子博弈)。

二零一零学年春季学期博弈与社会1次习题课PPT共22页

二零一零学年春季学期博弈与社会1次习题课PPT共22页
剔除该策略后博弈的标准式简化为:

C1
C2
C3
R1
10,5
5,3
8,4
R2
4,5
2,10
15,5

R3
8,10
20,8
10,2
R4
0,20
15,15
0,100
2021/7/15
Quality,Trade and the Moving
11
Window: The Globalization
Process
双方合作时的效果(通过产权交易,消除外部性)。
2021/7/15
Quality,Trade and the Moving
8
Window: The Globalization
Process
“反垄断”意义何在?——一个视角
从这个例子中理解为什么要反垄断?是为了帕累托改进吗? ——消费者的权益在垄断的情况下少于在A和B竞争的情况下,反垄
剔除该策略后博弈的标准式简化为:

C1
R1
10,5

R3
8,10
2021/7/15
Quality,Trade and the Moving
15
Window: The Globalization
Process
第6步:剔除“R3”
无论乙选择什么,“R3”这时都不是甲的最优反应,即因为甲知道乙知 道甲知道乙知道甲知道乙是理性的,所以甲不会选择“R3”。
2021/7/15
Quality,Trade and the Moving
17
Window: The Globalization
Process
策略性相互依存——博弈论扩展了什么?

二零零九年春季学期《博弈与社会》课程期中考试(参

二零零九年春季学期《博弈与社会》课程期中考试(参

二零零九年春季学期《博弈与社会》课程 期中考试(参考答案)1. (25分)两个players博弈两期。

在第一期他们按照表(1‐1)进行博弈,在第二期按照表(1‐2)进行博弈。

假设第一和第二期不存在时间贴现的问题。

Players在第二期行动前能够观察到第一期对手的行动。

(表格中的数字,前者是player 1的支付,后这是player 2的支付)Player 2 Player 2L1 R1 L2 R2Player 1 U1 2,2 ‐10,xPlayer 1U2 8,8 3,3 D1 y,0 0,0 D2 3,3 4,4(表1‐1) (表1‐2)(1) 只考虑表1‐2中的一阶段博弈,求出所有的纯战略纳什均衡。

(2分)(2) 现在只考虑表1‐1中的一阶段博弈:在x和y取任意值时,哪组策略一定是纳什均衡;哪组策略一定不是纳什均衡?(4分)x,y满足什么条件时,(D1,L1)能成为一个纳什均衡?(2分)x,y满足什么条件时,(U1,L1)能成为一个纳什均衡?(2分)(3) 现在考虑动态博弈,表1‐1所示为第一期,表1‐2所示为第二期。

写出Player 2的所有纯战略,并画出此两阶段博弈的博弈书。

(6分)继续(3),当x = 5,y = 1时,写出三个纯战略精炼纳什均衡,用战略表示,并作简要说明。

(各阶段博弈纳什均衡可构成动态博弈的精炼纳什均衡)(9分)解答:(1)存在NASH均衡。

分别为:(U2,L2),(D2,R2)(2)(D1,R1)一定是NASH 均衡。

(U1,R1)一定不是Nash均衡。

2y≥成立时,(D1,L1)成为一个Nash均衡;2,2x y≤≤成立时,(U1,L1)成为一个Nash均衡。

(3)player 2:(L1,L2,L2,L2,L2),(L1,L2,L2,L2,R2),(L1,L2,L2,R2,R2),(L1,L2,R2,R2,R2)……,总共32个策略。

或者(L1,L2,L2),(L1,L2,R2)…总共8个策略重复博弈中,依赖于对方行动历史的战略表达方式和标准的表达方式得出的均衡结果是一样的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

乙 C1 甲 R1 10,5
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
15
个人理性——什么是经济学的基本问题? 什么是经济学的基本问题? 个人理性 什么是经济学的基本问题
——稀缺资源的优化配置 稀缺资源的优化配置 ——“经济人”的行为 “经济人” ——我们足够理性吗(关于 preference)? 我们足够理性吗( 我们足够理性吗 )?
9
第1步:剔除“C4” 步 剔除“ ” 无论甲选择什么, 无论甲选择什么,“C4”都不是乙的最优反应,即因为乙是理性的,所 ”都不是乙的最优反应,即因为乙是理性的, 以乙不会选择“ ” 以乙不会选择“C4”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
乙 C1 R1 R2 甲 R3 R4 8,10 0,20 20,8 15,15 10,2 0,100 10,5 4,5 C2 5,3 2,10 C3 8,4 15,5
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
18
博弈论最重要的解概念——纳什均衡 纳什均衡 博弈论最重要的解概念
——纳什均衡 纳什均衡 ——纳什均衡为什么重要? 纳什均衡为什么重要? 纳什均衡为什么重要 ——一个例子:古诺均衡 一个例子: 一个例子
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
19
自由提问及答疑
本课程使用以下公共邮箱发布部分材料: 本课程使用以下公共邮箱发布部分材料: E-mail: gameandsociety@ password:2010spring
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
乙 C1 R1 甲 R3 8,10 20,8 10,5 C2 5,3
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
13
第5步:剔除“C2” 步 剔除“ ” 无论甲选择什么, 无论甲选择什么,“C2”这时都不是乙的最优反应,即因为乙知道甲知 ”这时都不是乙的最优反应, 道乙知道甲知道乙是理性的,所以乙不会选择“ ” 道乙知道甲知道乙是理性的,所以乙不会选择“C2”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
乙 C1 R1 R2 甲 R3 R4 8,10 0,20 20,8 15,15 10,2 0,100 10,5 100,99 10,5 4,5 C2 5,3 2,10 C3 8,4 15,5 C4 5,3 20,5
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
6
对个体理性非效率的一个改进: “总体理性”(或合作解) ——对个体理性非效率的一个改进: 总体理性” 或合作解) 对个体理性非效率的一个改进
假设A和B的项目都是生产一种世界独有的产品,不可替代。如果A将B 收购,A将获得该产品垄断权。 此时A获得多少的利润? ——此时 获得 单位利润。 此时A获得 单位利润。 此时 获得4单位利润 为什么此时A的利润增加? ——通过收购,A成为垄断者,消除了与 竞争时的外部性,相当于 通过收购, 成为垄断者 消除了与B竞争时的外部性 成为垄断者, 竞争时的外部性, 通过收购 双方合作时的效果(通过产权交易,消除外部性) 双方合作时的效果(通过产权交易,消除外部性1,1
B
合作 不合作
2,2 3,0
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
5
个人理性和帕累托效率: 个人理性和帕累托效率:
该纳什均衡(同时也是占优策略均衡)不是帕累托最优的——可以改进 纳什均衡(同时也是占优策略均衡)不是帕累托最优的 可以改进 到(合作,合作)。 合作,合作)。 为什么——因为 的行为直接损害或增加 的收益,B也同样影响着 。 因为A的行为直接损害或增加 的收益, 也同样影响着 也同样影响着A。 为什么 因为 的行为直接损害或增加B的收益 存在外部性。 存在外部性。
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
8
2. 共同理性 (Common Knowledge of Rationality)
以下是一个博弈的标准式,用重复剔除占优策略(iterated elimination of strictly dominated strategy)的方法求解该博弈的解(预测该博弈的结果)。
A
合作 不合作 0,3 1,1
B
合作 不合作
2,2 3,0
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
4
纳什均衡和一致预期: 纳什均衡和一致预期:
纳什均衡是(不合作,不合作)。 纳什均衡是(不合作,不合作)。 一致预期体现在A认为在自己选择不合作情况下 选择不合作是理性的 一致预期体现在 认为在自己选择不合作情况下B选择不合作是理性的, 认为在自己选择不合作情况下 选择不合作是理性的, 所以, 的信念是合理的 同样B的信念也是合理的 的信念是合理的。 的信念也是合理的。 所以,A的信念是合理的。同样 的信念也是合理的。基于合理信念最终双 方均选择了不合作,一致预期成立并实现。 方均选择了不合作,一致预期成立并实现。
二零一零学年 春季学期
《博弈与社会》第1次习题课 博弈与社会》
Guanghua School of Management Peking University March 28, 2010
主要内容
· 作业(第1次) 作业( 次 · 从个人理性到策略性相互依存 · 提问及答疑
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
2
第1次作业 次作业
1. 理性选择与帕累托效率 (Rational Choices and Pareto Efficiency) )
2. 共同理性 ( Common Knowledge of Rationality )
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
乙 C1 R1 甲 R2 R3 10,5 4,5 8,10 C2 5,3 2,10 20,8 C3 8,4 15,5 10,2
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
11
第3步:剔除“C3” 步 剔除“ ” 无论甲选择什么, 无论甲选择什么,“C3”这时都不是乙的最优反应,即因为乙知道甲知 ”这时都不是乙的最优反应, 道乙是理性的,所以乙不会选择“ ” 道乙是理性的,所以乙不会选择“C3”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
17
博弈论的几个基本概念
——最重要的概念:策略(strategy) 最重要的概念:策略( 最重要的概念 ) ——策略的基础:信息集 策略的基础: 策略的基础 ——纯策略与混合策略 纯策略与混合策略 ——纳什均衡(一个例子:古诺均衡) 纳什均衡(一个例子:古诺均衡) 纳什均衡
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
7
“反垄断”意义何在?——一个视角 反垄断”意义何在? 一个视角
从这个例子中理解为什么要反垄断?是为了帕累托改进吗? ——消费者的权益在垄断的情况下少于在 和B竞争的情况下,反垄 消费者的权益在垄断的情况下少于在A和 竞争的情况下 竞争的情况下, 消费者的权益在垄断的情况下少于在 断不是帕累托改进,卡尔 希克斯改进 希克斯改进。 断不是帕累托改进,卡尔-希克斯改进。 ——通过反垄断,虽然垄断者的利润减少了,但是消费者的福利增加 通过反垄断,虽然垄断者的利润减少了, 通过反垄断 了,而且社会的总福利扩大了。 而且社会的总福利扩大了。
乙 C1 R1 甲 R2 R3 10,5 4,5 8,10 C2 5,3 2,10 20,8
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
12
第4步:剔除“R2” 步 剔除“ ” 无论乙选择什么, 无论乙选择什么,“R2”这时都不是甲的最优反应,即因为甲知道乙知 ”这时都不是甲的最优反应, 道甲知道乙是理性的,所以甲不会选择“ ” 道甲知道乙是理性的,所以甲不会选择“R2”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
10
第2步:剔除“R4” 步 剔除“ ” 无论乙选择什么, 无论乙选择什么,“R4”这时都不是甲的最优反应,即因为甲知道乙是 ”这时都不是甲的最优反应, 理性的,所以甲不会选择“ ” 理性的,所以甲不会选择“R4”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
16
策略性相互依存——博弈论扩展了什么? 博弈论扩展了什么? 策略性相互依存 博弈论扩展了什么
——博弈论研究什么? 博弈论研究什么? 博弈论研究什么 ——博弈论告诉我们什么(为什么博弈论是有用的)? 博弈论告诉我们什么(为什么博弈论是有用的)? 博弈论告诉我们什么 ——我们足够理性吗(关于 common rationality)? 我们足够理性吗( 我们足够理性吗 )? ——从“strategically interdependent”到“essentially 从 ” interdependent” ”
相关文档
最新文档