第三章__零和游戏与混合策略2010
第三章__零和游戏与混合策略
与反,这时博弈达到混和策略纳什均衡。
纳什定理与混合策略
“剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取 出“剪”、“布”还是“锤”的策略应当是随机的。因此,每个小 孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈 中,每个小孩各取三个策略的1/3是纳什均衡。
纳什定理与混合策略
故事还没有完。走着走着,乙忽然缓过神来了,对甲说: 不对阿,我们谁也没有挣到钱,却吃了两对狗屎……甲 也缓过神了,思考了一会儿说:可是,我们创造了200 万的GNP阿!
零和游戏
‚零和游戏‛之所以广受关注,主要是因为人们发现, 在社会的方方面面都有与‚零和游戏‛类似的局面,胜
利者的光荣后面往往隐藏着失败者的辛酸和苦涩。
赢家的诅咒
视频:《红男绿女》(18’28 ’) 在《红男绿女》中,赌棍斯凯·马斯特森想起父亲给自己提
的一个很有价值的建议: 孩子,在你的旅途中,总有一天会遇到一个家伙走上前 来,在你面前拿出一副漂亮的新扑克牌,连塑料包装纸都没 有拆掉的那种;这家伙打算跟你打一个赌,赌他有办法让梅 花J从扑克牌里跳出来,并把苹果汁溅到你的耳朵里。不过, 孩子,千万别跟这个家伙打赌,因为就跟你确确实实站在那 里一样,最后你确确实实会落得苹果汁溅到耳朵里的下场。 但斯凯从来没有认真听取过他父亲的教诲。一分钟后,他就 和内森打赌说内森不知道他的蝴蝶领结是什么颜色。如果内 森知道是什么颜色,他一定愿意打赌,并且取胜。结果是, 内森不知道什么颜色,所以他没有跟斯凯打赌。
两个不到十岁的小男孩,一起玩的时候发生争执,两人 商量用‘剪刀、石头、布’,谁赢就听谁的。下面是他 们的对话: 甲说:‚喂,咱们俩是好兄弟,非要分出胜负就太伤和 气了。待会儿咱们都出‘剪刀’就算了事了,好不?‛ 乙说:‚没问题,好兄弟嘛! ‛
混合策略纳什均衡例子
混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念,指的是各参与者选择一个概率分布作为他们的策略,从而达到一个稳定的状态。
在混合策略纳什均衡中,没有任何参与者可以通过单独改变自己的策略来获得更好的结果。
一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。
在这个游戏中,两个参与者(称为玩家1和玩家2)可以选择出岩石、剪刀或布中的任意一种。
每一种选择都有一定的胜负规则:岩石胜剪刀,剪刀胜布,布胜岩石。
假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1,玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。
两个玩家的利益可以用一个支付矩阵表示如下:| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中,每个玩家选择的概率分布必须使得对于每一种选择,玩家都不希望改变自己的概率分布。
在这个例子中,我们可以通过计算来找到混合策略纳什均衡。
假设玩家1选择出岩石的概率为p1,则选择剪刀的概率为q1=1-p1-0=1-p1,选择布的概率为r1=0-0=0。
同样地,玩家2选择出岩石的概率为p2,则选择剪刀的概率为q2=1-p2-0=1-p2,选择布的概率为r2=0-0=0。
为了找到混合策略纳什均衡,我们需要检查每一种选择,并确保玩家对于每一种选择都不希望改变自己的概率分布。
在这个例子中,无论玩家1选择什么概率分布,玩家2都可以通过选择相应的概率分布来获得更好的结果。
所以,不存在一个混合策略纳什均衡。
总结起来,混合策略纳什均衡是博弈论中一种稳定的策略选择状态,即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。
岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子,其中玩家的选择概率分布是关键因素。
零和博弈
零和博弈(重定向自零和游戏原理)零和博弈(Zero-sum Game),也称零和游戏、定和博弈[编辑]零和博弈简介零和博弈是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。
双方不存在合作的可能。
零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。
当你看到两位对弈者时,你就可以说他们正在玩“零和游戏”。
因为在大多数情况下,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输棋为-1分,那么,这两人得分之和就是:1+(-1)=0。
这正是“零和游戏”的基本内容:游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远是零。
零和游戏原理之所以广受关注,主要是因为人们发现在社会的方方面面都能发现与“零和游戏”类似的局面,胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。
从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的“零和游戏”场。
这种理论认为,世界是一个封闭的系统,财富、资源、机遇都是有限的,个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺,这是一个“邪恶进化论”式的弱肉强食的世界。
但20世纪人类在经历了两次世界大战,经济的高速增长、科技进步、全球化以及日益严重的环境污染之后,“零和游戏”观念正逐渐被“双赢”观念所取代。
人们开始认识到“利己”不一定要建立在“损人”的基础上。
通过有效合作,皆大欢喜的结局是可能出现的。
但从“零和游戏”走向“双赢”,要求各方要有真诚合作的精神和勇气,在合作中不要耍小聪明,不要总想占别人的小便宜,要遵守游戏规则,否则“双赢”的局面就不可能出现,最终吃亏的还是自己。
[编辑]零和博弈的例子零和博弈的例子有:赌博、期货等。
零和游戏
内容
意义
内涵扑克
交易
应用
笑话简介
原理
内容
意义
内涵 扑克
交易
应用
笑话
展开 编辑本段简介
零和游戏又被称为游戏理论或零和博弈,源于博弈论(game theory)。是指一项游戏中,游戏者有输有赢,一方所赢正是另一方所输,而游戏的总成绩永远为零。 零和博弈
编辑本段意义
对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈:好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。 在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) 零和博弈
,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解”或“平衡“,也就是对参与双方来说都最”合理“、最优的具体策略?怎样才是合理?应用传统决定论中的“最小最大”准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解”。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望,做最坏的打算”。 虽然零和博弈理论的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是有限的。零和博弈主要的局限性有二,一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大於零或小于零的净获利。对于后者,历史上最经典的案例就是“囚徒困境”。在“囚徒困境”的问题中,参与者仍是两名(两个盗窃犯),但这不再是一个零和的博弈,人受损并不等於我收益。两个小偷可能一共被判20年,或一共只被判2年。
管理定律零和游戏
团队合作案例
总结词
零和游戏在团队合作中的体现,如何通过合作实现共赢。
详细描述
团队合作中的零和游戏是指团队成员之间的合作关系,一方获得利益,另一方可 能遭受损失。为了实现共赢,团队成员需要建立良好的沟通机制、明确分工和协 作方式,以及建立共同的价值观和目标,从而在合作中取得更好的成果。
个人发展案例
转换
在一定条件下,零和游戏可以转化为非零和游戏, 反之亦然。
适用场景
零和游戏适用于竞争激烈、资源有限的场景;非 零和游戏适用于合作创新、资源共享的场景。
02 管理定律与零和游戏
彼得原理
01
彼得原理总结
彼得原理是指在一个层级组织中,员工常常被提拔到超出其能力范围的
职位,从而导致效率降低和失败。
02 03
资源争夺
人力资源
在零和游戏中,人力资源成为争夺的 焦点,团队成员可能会为了个人利益 而忽视团队整体利益,导致人才流失 或人才浪费。
物力资源
时间资源
在时间紧迫的情况下,团队成员可能 会为了赶工而忽视质量,或者为了个 人利益而延误项目进度,导致时间资 源的浪费。
有限的办公用品、设备等物力资源也 可能成为团队成员争夺的对象,导致 资源分配不公,影响工作效率。
恶性竞争
过度竞争
在零和游戏中,团队成员可能会 为了个人利益而过度竞争,不顾 团队整体利益,导致团队工作效
率下降。
破坏性竞争
恶性竞争可能导致团队成员采取 不正当手段,如诽谤、诬告等, 破坏团队的和谐氛围和正常秩序。
竞争失控
恶性竞争可能导致团队成员之间 的关系紧张,甚至出现敌对情绪,
影响团队的稳定性和发展。
04 如何打破零和游戏
建立信任与合作
混合策略纳什均衡
0 1/4 1 q 钟信德语) (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
德语 r
二、反应对应法:情侣博弈 反应对应法:
陈明 法语 1-r
钟信 德语 q 法语 1-q 2 1 3 1 0 3 0 2
反应对应曲线有三个交点:三个 : 反应对应曲线有三个交点:三个NE: r*=0, q*=0 纯策略(确定性) 纯策略(确定性)
(红) r 红 1 1/2 0 1/2 1 q (红) r*=R(q) q*=R(r)
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
作业:社会福利博弈。使用反应对应法找到纳什均衡。 作业:社会福利博弈。使用反应对应法找到纳什均衡。
流浪汉 寻找工作 游荡 救济 政府 不救济
s1
第四节 纳什均衡的存在性
问题:是否所有的博弈都存在 (纯的或混合的)? 问题:是否所有的博弈都存在NE(纯的或混合的)? (纯策略)纳什均衡的存在性定理(Debreu,1952; 纯策略)纳什均衡的存在性定理 ; Glicksberg,1952;Fan,1952): ; : 考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略 空间S 是欧氏空间中的非空、 闭而有界)的凸集, 空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支 付函数u 连续且对 拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。 均衡。 (混合策略)纳什均衡的存在性定理 (Glicksberg,1952): 混合策略) : 在n人策略式博弈中,如果每个参与人的纯粹策略空 人策略式博弈中, 是欧氏空间中的非空、 闭而有界)的凸集, 间Si是欧氏空间中的非空、紧(闭而有界)的凸集,如果 支付函数u 为连续函数 为连续函数, 支付函数 i(s)为连续函数,那么博弈至少存在一个混合策 Nash均衡 均衡. 略Nash均衡.
博弈论读后感
博弈论读后感博弈论读后感(一)博弈小术语:收益矩阵、均衡、纳什均衡、零和博弈论,也称互动的决策论。
它的基本假设之一是人是理性的。
但现实并非如此,人不可能具有完备的知识也不可能时时理性。
尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。
每一次的人际交往都可以简化成两个基本选择:合作或背叛。
比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。
当一次性博弈出现时,人们往往会选择背叛。
这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢?因为它知道候机的乘客不会是它的长期客户。
而当博弈的终点不可知时,就又是另一回事了。
在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。
至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。
现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。
当然,如果在开头就有一些善意的人出来表明合作态度对提高合作机会也是有帮助的,不管这些善意的人是出于何种目的。
一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。
至于时间的长短,关键是看博弈的终点是否明确。
这在上面也提到了,如果终点明确,人们就会倾向于在最后一次背叛。
而当大家都知道对方会这样想时,倒数第二次就会成为新的终点,新的背叛。
如此反复推演,合作从一开始就很难形成。
注意上面的论述是基于没有惩罚机制的基础。
有一个很有意思的实验,是由爱克斯罗德完成的。
这是一个计算机模拟竞赛,参赛的62位科学家递交了自己写的关于博弈策略的代码,同时加上爱克斯罗德本人写的一个随即策略代码,共63个。
结果表明,前15名中只有第8名是非善意的程序,最后15名只有一个善意的,夺魁的是一报还一报策略。
这个实力不凡的一报还一报策略就是对方选择什么我就回应什么,你合作我就合作,你背叛我也背叛。
哲理故事:零和游戏原理
哲理故事:零和游戏原理导读:哲理故事:零和游戏原理零和游戏原理源于博弈论。
博弈论的英文名为GAME THEORY,直译就是游戏理论。
一项游戏中,胜方所得与负方所失相同,两者相加,正负相抵,和数必为零,这就是所谓的零和。
零和游戏之所以广受关注,主要是因为人们发现,在社会的方方面面都有与零和游戏相类似的局面,胜利者的光荣后面往往隐蔽着失败者的辛酸和苦涩。
但20世纪以来零和游戏观念正逐渐被非零和游戏即负和或正和观念所代替。
负和游戏指,一方虽赢但付出了惨重的代价,得不偿失,可谓没有赢家。
赢家所得比输家所失多,或者没有输家,结果为双赢或多赢,称为正和。
在竞争社会中,人们开始认识到利已不一定要建立在损人的基础上。
有效合作,得到的是皆大欢喜的结局。
从零和走向正和,要求各方要有真诚合作的精神和勇气,遵守游戏规则,不要耍小聪明,不要总想占别人的小便宜,否则,双赢的局面就不会出现,吃亏的最终还是自己。
【启示】物质决定意识,要求我们做到一切从实际出发。
从实际出发,不是从单一的`因素出发,而是要从复杂的全面的实际出发,去具体分析每一个事实,这样才能真正做到一切从实际出发。
零和负和和正和是游戏结果的三种事实,过去人们只从零和这个单一事实出发,而不能从全面的实际出发,尤其是忽视了正和这一事实,从而导致了人们形成了错误的主观认识,给个人和社会带来了一定的损失。
【哲理故事:零和游戏原理】1.零和游戏原理的故事2.哲理故事:吃蛋原理3.原理网络游戏作文400字4.条件和仁心的哲理故事5.马和鹿的哲理故事及感悟6.保姆和保安的哲理故事7.痛苦和盐哲理故事8.爱和被爱的哲理故事上文是关于哲理故事:零和游戏原理,感谢您的阅读,希望对您有帮助,谢谢。
博弈论读后感
博弈论读后感博弈论读后感(一)博弈小术语:收益矩阵、均衡、纳什均衡、零和博弈论,也称互动的决策论。
它的基本假设之一是人是理性的。
但现实并非如此,人不可能具有完备的知识也不可能时时理性。
尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。
每一次的人际交往都可以简化成两个基本选择:合作或背叛。
比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。
当一次性博弈出现时,人们往往会选择背叛。
这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢?因为它知道候机的乘客不会是它的长期客户。
而当博弈的终点不可知时,就又是另一回事了。
在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。
至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。
现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。
当然,如果在开头就有一些善意的人出来表明合作态度对提高合作机会也是有帮助的,不管这些善意的人是出于何种目的。
一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。
至于时间的长短,关键是看博弈的终点是否明确。
这在上面也提到了,如果终点明确,人们就会倾向于在最后一次背叛。
而当大家都知道对方会这样想时,倒数第二次就会成为新的终点,新的背叛。
如此反复推演,合作从一开始就很难形成。
注意上面的论述是基于没有惩罚机制的基础。
有一个很有意思的实验,是由爱克斯罗德完成的。
这是一个计算机模拟竞赛,参赛的62位科学家递交了自己写的关于博弈策略的代码,同时加上爱克斯罗德本人写的一个随即策略代码,共63个。
结果表明,前15名中只有第8名是非善意的程序,最后15名只有一个善意的,夺魁的是一报还一报策略。
这个实力不凡的一报还一报策略就是对方选择什么我就回应什么,你合作我就合作,你背叛我也背叛。
博弈论 习题答案
博弈论习题答案博弈论习题答案博弈论是一门研究决策制定和策略选择的学科,它通常应用于经济学、政治学和生物学等领域。
在博弈论中,人们通过分析参与者之间的相互作用和利益冲突来预测他们的行为。
下面是一些常见的博弈论习题及其答案,希望能对读者有所帮助。
1. 零和游戏零和游戏是一种博弈论中的基本概念,指的是参与者的利益完全相反,一方的利益的增加必然导致另一方的利益减少。
一个经典的例子是赌博,赌徒的损失就是庄家的收益,反之亦然。
2. 囚徒困境囚徒困境是博弈论中的一个重要概念,描述了两个囚徒面临的决策问题。
假设两个囚徒被警察逮捕,警察缺乏直接证据,但有足够的证据定罪他们。
如果两个囚徒都保持沉默,他们只会被判轻罪;如果一个人供认而另一个人保持沉默,供认者将获得减刑而沉默者将被判重罪;如果两人都供认,他们将被判重罪。
在这种情况下,最理性的策略是保持沉默,但由于彼此之间的信任缺失,往往导致两人都供认,结果双输。
3. 纳什均衡纳什均衡是博弈论中的一个重要概念,指的是在参与者选择最佳策略的情况下,没有人可以通过单方面改变策略来获得更好的结果。
简单来说,就是每个人都在给定其他人的策略时,选择了自己的最佳策略。
纳什均衡在博弈论中具有重要的理论和实践意义。
4. 合作博弈与非合作博弈合作博弈是指参与者之间可以通过合作来获得更好结果的博弈情形,而非合作博弈则指的是参与者之间没有合作的情况。
在合作博弈中,参与者可以通过协商和合作来达成最优解,而在非合作博弈中,参与者通常会采取自私的策略,追求个人最大利益。
5. 混合策略混合策略是指在博弈中,参与者以一定的概率选择不同的策略。
通过采取混合策略,参与者可以增加对手的不确定性,从而获得更好的结果。
混合策略在博弈论中被广泛应用,例如在扑克牌游戏中,玩家可以通过随机选择不同的策略来增加对手的不确定性。
以上是一些常见的博弈论习题及其答案,博弈论作为一门复杂而有趣的学科,可以帮助我们更好地理解人类行为和决策制定过程。
管理定律零和游戏
14
1.定义现实情况 2.确立目的和目标 3.预测达成目标的 辅助因素和障碍 4.制定实现目的和 目标的行动计划 5.制定预算 6.履行计划 7.管h理计划
主讲教师:刘慧峰
制 订 最 佳 计 划 是 一 个 系 统 的 过 程
15
主讲教师:刘慧峰
第三节 计划工作的一般方法
第二篇 计划与决策
决策 计划工作
目标管理 战略管理
h
2
主讲教师:刘慧峰
开篇案例:唱 1、艺术家的职业生涯规划 2、演出地点 3、营销计划和宣传计划
注意:计划必须是灵活的,是指路的明灯,不 是一成不变的路径。
h
3
主讲教师:刘慧峰
第三章 计划
计划工作概述 计划工作程序 计划工作的一般方法
5.灵活性
6.创造性
h
7
主讲教师:刘慧峰
建立什么样组织结构
计划目标 如何实现
目标
配备什么样的员工 如何有效的指挥和领导
提供控制的标准
h
8
主讲教师:刘慧峰
计划的类型
1. 按计划的广度分类 : 2. 按计划覆盖的时间跨度分 3. 按计划的明确性分类 4. 按组织管理职能分类 5. 按计划内容的不同分类 6. 按计划内容的表现形式分类:
主讲教师:刘慧峰
管理定律——零和游戏
20世纪,人类经历两次世界大战、经 济高速增长、科技进步、全球一体化以及 日益严重的环境污染,“零和游戏”观念 正逐渐被“双赢”观念所取代。人们开始 认识到“利己”不一定要建立在“损人” 的基础上。通过有效合作,皆大欢喜的结 局是可能出现的。
h
1
主讲教师:刘慧峰
政策:为组织活动建立起一般指南。
游戏理论考试题目及答案
游戏理论考试题目及答案一、单项选择题(每题2分,共20分)1. 游戏理论中,非合作游戏的基本假设是()。
A. 参与者之间存在合作B. 参与者之间不存在合作C. 参与者之间存在竞争D. 参与者之间不存在竞争答案:B2. 在博弈论中,零和游戏是指()。
A. 参与者的总收益为零B. 参与者的总收益不为零C. 参与者的总收益为正数D. 参与者的总收益为负数答案:A3. 纳什均衡是指在非合作博弈中,每个参与者()。
A. 都选择最优策略B. 都选择次优策略C. 都选择非最优策略D. 都选择随机策略答案:A4. 囚徒困境中,如果两个参与者都选择合作,那么()。
A. 他们都会得到最好的结果B. 他们都会得到最坏的结果C. 他们中的一个会得到最好的结果D. 他们中的一个会得到最坏的结果答案:A5. 在博弈论中,混合策略是指参与者()。
A. 随机选择策略B. 总是选择最优策略C. 总是选择次优策略D. 总是选择非最优策略答案:A6. 博弈论中的完全信息博弈是指()。
A. 所有参与者都不知道其他参与者的策略B. 所有参与者都知道其他参与者的策略C. 至少有一个参与者不知道其他参与者的策略D. 至少有一个参与者知道其他参与者的策略答案:B7. 博弈论中的不完全信息博弈是指()。
A. 所有参与者都知道其他参与者的策略B. 所有参与者都不知道其他参与者的策略C. 至少有一个参与者不知道其他参与者的策略D. 至少有一个参与者知道其他参与者的策略答案:C8. 在博弈论中,动态博弈是指()。
A. 参与者同时做出决策B. 参与者依次做出决策C. 参与者随机做出决策D. 参与者在不同时间做出决策答案:B9. 博弈论中的重复博弈是指()。
A. 参与者只进行一次博弈B. 参与者进行多次博弈C. 参与者进行有限次博弈D. 参与者进行无限次博弈答案:B10. 在博弈论中,合作博弈与非合作博弈的主要区别在于()。
A. 参与者是否同时做出决策B. 参与者是否知道其他参与者的策略C. 参与者是否可以达成具有约束力的协议D. 参与者是否进行重复博弈答案:C二、多项选择题(每题3分,共15分)11. 以下哪些是博弈论中的基本元素?()A. 参与者B. 策略C. 收益D. 规则答案:ABC12. 以下哪些是博弈论中的主要类型?()A. 零和博弈B. 非零和博弈C. 完全信息博弈D. 不完全信息博弈答案:ABCD13. 以下哪些是博弈论中的主要概念?()A. 纳什均衡B. 混合策略C. 动态博弈D. 重复博弈答案:ABCD14. 以下哪些是博弈论中的重要应用领域?()A. 经济学B. 政治学C. 社会学D. 心理学答案:ABCD15. 以下哪些是博弈论中的重要理论?()A. 博弈论的演化B. 博弈论的合作C. 博弈论的非合作D. 博弈论的重复答案:ABCD三、判断题(每题2分,共20分)16. 非合作博弈中,参与者之间可以达成具有约束力的协议。
某某财经政法大学斯蒂格利茨《经济学》考试试卷1058
****财经政法大学斯蒂格利茨《经济学》课程试卷(含答案)__________学年第___学期考试类型:(闭卷)考试考试时间:90 分钟年级专业_____________学号_____________ 姓名_____________1、选择题(40分,每题1分)1. 下列哪一项不是消极政策支持者所持的观点?()A.经济的周期性波动是经济系统具有自我调节能力的反映,它对经济增长可能具有积极的意义B.与宏观经济政策相关的冗长而多变的时滞,使稳定经济的努力很可能以破坏稳定而结束C.未来经济状况的难以预期,削弱了决策者适时实施有效的宏观经济政策的能力D.消极政策支持者认为固定政策规则比斟酌处置政策更为有效答案:D解析:消极政策支持者认为政府应该对宏观经济政策采取无为而治的方法,不应该试图利用宏观经济政策去稳定经济。
2. 如果边际储蓄倾向为0.3,投资支出增加60亿元,可以预期,这将导致均衡水平GDP增加()。
A. 20亿元B. 60亿元C. 180亿元D. 200亿元答案:D解析:由Y=C+I+G=C0+bY+I+G得,ΔY=ΔI/(1-MPC)=ΔI/MPS,所以,ΔY=ΔI/MPS=60/0.3=200。
3. 一个有效的激励机制必须能够()。
A.使代理人参与工作的净收益不低于不工作也能得到的收益B.使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平C.尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突D.以上都是答案:D解析:由委托人-代理人问题而导致的效率损失需要通过设计有效的激励措施加以解决。
激励机制必须使代理人参与工作的净收益不低于不工作也能得到的收益,否则代理人就会选择不工作;使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平,尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突,否则代理人和委托人之间的利益就不一致,代理人仍然可能偏离委托人的目标行事,这样就不能完全解决委托代理问题。
[指南]双人零和博弈
一、双人零和博弈的概念零和博弈又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可能.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分.二、双人零和博弈的模型的建立建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记双人零和博弈中的两个局中人为A和B;局中人A的策略集为a1,…,am,局中人B的策略集为b1,…,bn;cij为局中人A采取策略ai、局中人B采取策略bj 时A的收益(这时局中人B的收益为- cij).则收益矩阵见下表表1那么下面我们通过例子来说明双人零和博弈模型的建立:例1甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,算和局,均不得分.试列出对儿童甲的赢得矩阵.解本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表2.表2例2 从一张红牌和一张黑牌中随机抽取一张,在对B 保密情况下拿给A 看,若A 看到的是红牌,他可选择或掷硬币决定胜负,或让B 猜.若选择掷硬币,当出现正面,A 赢p 元,出现反面,输q 元;若让B 猜,当B 猜中是红牌,A 输r 元,反之B 猜是黑牌,A 赢s 元.若A 看到的是黑牌,他只能让B 猜.当B 猜中是黑牌,A 输u 元,反之B 猜是红牌,A 赢t 元,试确定A 、B 各自的策略,建立支付矩阵.解 因A 的赢得和损失分别是B 的损失和赢得,故属二人零和博弈.为便于分析,可画出如图3的博弈树图.图3中,○为随机点,□分别为A 和B 的决策点,从图中看出A 的策略有掷硬币和让B 猜两种,B 的策略有猜红和猜黑两种,据此可归纳出各种情况下A 和B 输赢值分析的表格,见表4.图3抽到红牌正面反面抽到黑球○□□○□1/2掷硬币让B 猜1/21/2猜红猜黑猜黑猜红1/2让B 猜p-q-rst-u表4对表4中各栏数字可以这样来理解:因让A 看到红牌时或掷硬币或让B 猜.若A 决定选掷硬币这个策略,当出现正面,这时不管B 猜红或猜黑,A 都赢p 元;当出现反面,不管B 猜红或猜黑,A 都输q 元.同样A 选择让B 猜的策略后,他的输赢只同B 猜红或猜黑有关,而与掷硬币的正反面无关.又若抽到的牌是黑牌,A 的决定只能让B 猜,因而掷硬币策略对A 的胜负同样不起作用.考虑到抽牌时的红与黑的概率各为1/2,掷硬币时出现正反面的概率也各为1/2,故当A 采取“掷硬币”策略,而B 选择“猜红”策略时,A 的期望赢得为:⎪⎭⎫ ⎝⎛-q p 212121+t 21=()t q p 241+-当A 采取让B 猜策略,B 选择“猜红”策略时,A 的期望赢得为:()()⎪⎭⎫ ⎝⎛-+-r r 212121+t 21=()t r +-21相应可求得其他策略对A 的期望赢得值.由此可列出本例的收益矩阵,见表5.表5三、双人零和博弈的求解定理1(极小极大定理)在零和博弈中,对于给定的支付矩阵U ,如果存在混合战略1σ*=(1σ*1,…1σ*m )和2σ*=(2σ*1, (2)σ*n )以及一个常数v 满足,对任意j 有∑=mi i ij a 11*σ≥v ,对任意的i 有∑=nj j ij a 12*σ≤v ,那么战略组合(1σ*,2σ*)为该博弈的Nash 均衡.其中,v 为参与人1在均衡中所得到的期望支付,亦称该博弈的值.这个极小极大定理,其基本思想就是:参与人1考虑到对方使自己支付最小的最优反应,从中选择使自己最好的策略.参与人2也遵循同样的思路,这样才能满足Nash 均衡的互为最优反应的条件.这样我们就可以得到双人零和博弈Nash 均衡的计算方法了,如以下定理定理2 对于给定的零和博弈,如果博弈的值v 大于0,则博弈的Nash 均衡(1σ*,2σ*)为以下对偶线性规划问题的解Min ∑=mi ip 1s.t. ∑=mi i ij p a 1≥1 (j=1,…,n)i p ≥0 (i=1,…,m)和Max ∑=nj jq 1s.t. ∑=nj j ij q a 1≤1 (i=1,…,m)j q ≥0 (j=1,…,n)其中,Nash 均衡支付∑∑====nj jmi iqpv 1111Nash 均衡战略),,,,(1*1m i vp vp vp =σ,),,,(1*2n j vq vq vq =σ由于此定理只适用于v 大于0的情形,因此对于v 小于等于0的情形,该定理所给出的方法需做适当的修改.命题 如果支付矩阵U=m xn ij a )(的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v >0.定理3 如果支付矩阵U '=m xn ij a )('是由U=m xn ij a )(的每个元素都加上一个常数c 得到,即c a a ij ij +=',那么支付矩阵U 和U '所对应的零和博弈的Nash 均衡战略相同,博弈的值相差c.根据以上定理,可以得到如下求解一般零和博弈Nash 均衡的方法:(1) 若支付矩阵U 中的所有元素都大于零,则可以直接根据定理进行计算;若支付矩阵U 中有小于0的元素,可以通过加上一个常数使它们都大于0,然后再根据定理进行计算.(2) 求解定理中的两个对偶线性规划问题.下面通过实例来说明如何求解双人零和博弈的Nash 均衡.例3 求解下图中战略式博弈的Nash 均衡.参与人2L M RU参与人1 CD通 通过求解对偶线性规划问题求零和博弈的Nash 均衡解 根据前面的介绍,可知该博弈的支付矩阵为U=⎪⎪⎪⎭⎫⎝⎛224132312不难发现,该博弈的支付矩阵U=()33x ij a 的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v>0.设参与人1和参与人2的混合战略分别是1σ=(321,,vp vp vp )和2σ=(321,,vq vq vq ),利用对偶线性规划求解方法求解该战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++}s.t. 321422p p p ++≥132123p p p ++≥132123p p p ++≥11p ≥0,2p ≥0,3p ≥0和Max {321q q q ++}s.t. 32132q q q ++≤1 32132q q q ++≤1321224q q q ++≤11q ≥0,2q ≥0,3q ≥0求解第一个规划问题,得到1p =1/4, 2p =1/4, 3p =0,参与人1的支付v=2.因此,参与人1的混合战略1σ*=(1/2,1/2,0).同理,对对偶问题求解,得到1q =0,2q =1/4, 3q =1/4,参与人2的损失v=2,因此参与人的混合战略2σ*=(0,1/2,1/2).所以,该博弈存在一个混合战略Nash 均衡((1/2,1/2,0)(0,1/2,1/2),).例4 求解下图中的战略式博弈的Nash 均衡.参与人2L M RU参与人1 CD通过求解对偶线性规划问题求零和博弈的Nash 均衡解 该博弈的支付矩阵为U=⎪⎪⎪⎭⎫⎝⎛--203011122在上树支付矩阵U=33)(x ij a 中,12a <0, 21a <0.为了利用对偶线性规划模型求解博弈的解,构造支付矩阵U '=33')(x ij a ,其中a 'ij =ij a +c.令c=2,那么新构造的支付矩阵为U '=⎪⎪⎪⎭⎫⎝⎛425231304设参与人1和参与人2的混合战略分别是1σ=(v 'p 1, v 'p 2, v 'p 3)和2σ=(v 'q 1, v 'q 2 v 'q 3,),v 为原博弈的值,v '为新博弈的值,且v '=v+2,利用对偶线性规划求解方法求解新战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++}s.t. 32154p p p ++≥13223p p +≥1321423p p p ++≥11p ≥0, 2p ≥0, 3p ≥0Max {321q q q ++}s.t. 3134q q +≤132123q q q ++≤1321425q q q ++≤11q ≥0,2q ≥0,3q ≥0通过求解对偶问题,得到p=0,2p=3/13, 3p=2/13,参与人1的1支付v'=13/5,q=1/13, 2q=4/13, 3q=0,参与人2的损失v'=13/5.1因此,参与人1的混合战略σ*=(0,3/5,2/5), 参与人2 的混合战1略σ*=(1/5,4/5,0),原博弈的值v= v'-2=3/5.所以,博弈存在一个2混合战略Nash均衡((0,3/5,2/5),(1/5,4/5,0)).。
3 混合策略纳什均衡(1)
扩展:二人博弈标准型
n人参与的策略式博弈混合策略定义
• i 表示局中人 i 的混合策略空间
• p ( p1,..., pi ,..., pn ), pi i 表示博弈的一个混合策
略组合
• i ( p) i ( p1,..., pi ,..., pn ) 表示局中人 i 在混合策略 组合 p ( p1,..., pi ,..., pn ) 下的期望支付,它是混 合策略组合 p 的函数。
3-2 反应函数法
• 寻找同时决策有限博弈的混合策略纳什均衡
• B的混合策略设定为(q,1-q)时,A的最佳 反应函数是:
UA( p, q) 2 p(1 2q) (2q 1)
• A的混合策略设定为(p,1-p)时,B的最 佳反应函数是:
UB ( p, q) 2q(2 p 1) (2 p 1)
游戏; • 另外4名同学负责以下工作
– 1名同学记录A分别出锤子剪子布的次数; – 1名同学记录A输和赢的次数 – 1名同学记录B分别出锤子剪子布的次数; – 1名同学记录B输和赢的次数
• 共进行30次 • 每个小组写下实验报告,内容包括:A和B选 择不同策略的次数;输赢的次数;怎么才能赢?
3-1混合策略、混合纳什均衡与期望 支付
数学语言表达
• 如果主体人对确定性收益x的效用为u(x),那么主体 人对不确定性收益X的效用就为E(u(X))。
• E(u(X))称为X的期望效用,常记为EU(X)。将X看作 自变量, EU(X)称为期望效用函数。
• 如果不确定性收益X退化成确定性收益x,则EU(X)= u(x),所以EU(X)可以同时表达主体人对确定性收益 和不确定性收益的效用。
双人零和博弈
一、双人零和博弈的概念零和博弈又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可能.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分.二、双人零和博弈的模型的建立建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记双人零和博弈中的两个局中人为A和B;局中人A的策略集为a1,…,am,局中人B的策略集为b1,…,bn;cij为局中人A采取策略ai、局中人B采取策略bj 时A的收益(这时局中人B的收益为- cij).则收益矩阵见下表表1那么下面我们通过例子来说明双人零和博弈模型的建立: 例1甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,算和局,均不得分.试列出对儿童甲的赢得矩阵.解 本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表2.表2例2 从一张红牌和一张黑牌中随机抽取一张,在对B 保密情况下拿给A 看,若A 看到的是红牌,他可选择或掷硬币决定胜负,或让B 猜.若选择掷硬币,当出现正面,A 赢p 元,出现反面,输q 元;若让B 猜,当B 猜中是红牌,A 输r 元,反之B 猜是黑牌,A 赢s 元.若A 看到的是黑牌,他只能让B 猜.当B 猜中是黑牌,A 输u 元,反之B 猜是红牌,A 赢t 元,试确定A 、B 各自的策略,建立支付矩阵.解 因A 的赢得和损失分别是B 的损失和赢得,故属二人零和博弈.为便于分析,可画出如图3的博弈树图.图3中,○为随机点,□分别为A 和B 的决策点,从图中看出A 的策略有掷硬币和让B 猜两种,B 的策略有猜红和猜黑两种,据此可归纳出各种情况下A 和B 输赢值分析的表格,见表4.图3抽到红牌正面反面抽到黑球○□□○□1/2掷硬币让B 猜1/21/2猜红猜黑猜黑猜红1/2让B 猜p-q-rst-u表4对表4中各栏数字可以这样来理解:因让A 看到红牌时或掷硬币或让B 猜.若A 决定选掷硬币这个策略,当出现正面,这时不管B 猜红或猜黑,A 都赢p 元;当出现反面,不管B 猜红或猜黑,A 都输q 元.同样A 选择让B 猜的策略后,他的输赢只同B 猜红或猜黑有关,而与掷硬币的正反面无关.又若抽到的牌是黑牌,A 的决定只能让B 猜,因而掷硬币策略对A 的胜负同样不起作用.考虑到抽牌时的红与黑的概率各为1/2,掷硬币时出现正反面的概率也各为1/2,故当A 采取“掷硬币”策略,而B 选择“猜红”策略时,A 的期望赢得为:⎪⎭⎫ ⎝⎛-q p 212121+t 21=()t q p 241+- 当A 采取让B 猜策略,B 选择“猜红”策略时,A 的期望赢得为:()()⎪⎭⎫ ⎝⎛-+-r r 212121+t 21=()t r +-21 相应可求得其他策略对A 的期望赢得值.由此可列出本例的收益矩阵,见表5.表5三、双人零和博弈的求解定理1(极小极大定理)在零和博弈中,对于给定的支付矩阵U ,如果存在混合战略1σ*=(1σ*1,…1σ*m )和2σ*=(2σ*1,…2σ*n )以及一个常数v 满足,对任意j 有∑=mi i ij a 11*σ≥v ,对任意的i 有∑=nj j ij a 12*σ≤v ,那么战略组合(1σ*,2σ*)为该博弈的Nash 均衡.其中,v 为参与人1在均衡中所得到的期望支付,亦称该博弈的值.这个极小极大定理,其基本思想就是:参与人1考虑到对方使自己支付最小的最优反应,从中选择使自己最好的策略.参与人2也遵循同样的思路,这样才能满足Nash 均衡的互为最优反应的条件.这样我们就可以得到双人零和博弈Nash 均衡的计算方法了,如以下定理定理2 对于给定的零和博弈,如果博弈的值v 大于0,则博弈的Nash 均衡(1σ*,2σ*)为以下对偶线性规划问题的解Min ∑=mi i p 1s.t. ∑=mi i ij p a 1≥1 (j=1,…,n)i p ≥0 (i=1,…,m) 和Max ∑=nj j q 1s.t. ∑=nj j ij q a 1≤1 (i=1,…,m)j q ≥0 (j=1,…,n) 其中,Nash 均衡支付∑∑====nj jmi iqpv 1111Nash 均衡战略),,,,(1*1m i vp vp vp =σ,),,,(1*2n j vq vq vq =σ由于此定理只适用于v 大于0的情形,因此对于v 小于等于0的情形,该定理所给出的方法需做适当的修改.命题 如果支付矩阵U=mxn ij a )(的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v >0.定理3 如果支付矩阵U '=mxn ij a )('是由U=mxn ij a )(的每个元素都加上一个常数c 得到,即c a a ij ij +=',那么支付矩阵U 和U '所对应的零和博弈的Nash 均衡战略相同,博弈的值相差c.根据以上定理,可以得到如下求解一般零和博弈Nash 均衡的方法:(1) 若支付矩阵U 中的所有元素都大于零,则可以直接根据定理进行计算;若支付矩阵U 中有小于0的元素,可以通过加上一个常数使它们都大于0,然后再根据定理进行计算. (2) 求解定理中的两个对偶线性规划问题.下面通过实例来说明如何求解双人零和博弈的Nash 均衡.例3 求解下图中战略式博弈的Nash 均衡. 参与人2L M RU参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 根据前面的介绍,可知该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛224132312不难发现,该博弈的支付矩阵U=()33x ij a 的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v>0.设参与人1和参与人2的混合战略分别是1σ=(321,,vp vp vp )和2σ=(321,,vq vq vq ),利用对偶线性规划求解方法求解该战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++}s.t. 321422p p p ++≥1 32123p p p ++≥1 32123p p p ++≥1 1p ≥0,2p ≥0,3p ≥0 和Max {321q q q ++}s.t. 32132q q q ++≤1 32132q q q ++≤1 321224q q q ++≤1 1q ≥0,2q ≥0,3q ≥0求解第一个规划问题,得到1p =1/4, 2p =1/4, 3p =0,参与人1的支付v=2.因此,参与人1的混合战略1σ*=(1/2,1/2,0).同理,对对偶问题求解,得到1q =0,2q =1/4, 3q =1/4,参与人2的损失v=2,因此参与人的混合战略2σ*=(0,1/2,1/2).所以,该博弈存在一个混合战略Nash 均衡((1/2,1/2,0)(0,1/2,1/2),).例4 求解下图中的战略式博弈的Nash 均衡.参与人2L M R U 参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛--203011122 在上树支付矩阵U=33)(x ij a 中,12a <0, 21a <0.为了利用对偶线性规划模型求解博弈的解,构造支付矩阵U '=33')(x ij a ,其中a 'ij=ij a +c.令c=2,那么新构造的支付矩阵为U '=⎪⎪⎪⎭⎫ ⎝⎛425231304 设参与人1和参与人2的混合战略分别是1σ=(v 'p 1, v 'p 2, v 'p 3)和2σ=(v 'q 1, v 'q 2 v 'q 3,),v 为原博弈的值,v '为新博弈的值,且v '=v+2,利用对偶线性规划求解方法求解新战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++} s.t. 32154p p p ++≥13223p p +≥1 321423p p p ++≥11p ≥0, 2p ≥0, 3p ≥0Max {321q q q ++}s.t. 3134q q +≤1 32123q q q ++≤1 321425q q q ++≤1 1q ≥0,2q ≥0,3q ≥0通过求解对偶问题,得到1p =0,2p =3/13, 3p =2/13,参与人1的支付v '=13/5, 1q =1/13, 2q =4/13, 3q =0,参与人2的损失v '=13/5.因此,参与人1的混合战略1σ*=(0,3/5,2/5), 参与人2 的混合战略2σ*=(1/5,4/5,0),原博弈的值v= v '-2=3/5.所以,博弈存在一个混合战略Nash 均衡((0,3/5,2/5),(1/5,4/5,0)).。
双人零和博弈
一、双人零和博弈的概念零和博弈又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可能.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分.二、双人零和博弈的模型的建立建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记双人零和博弈中的两个局中人为A和B;局中人A的策略集为a1,…,am,局中人B的策略集为b1,…,bn;cij为局中人A采取策略ai、局中人B采取策略bj 时A的收益(这时局中人B的收益为- cij).则收益矩阵见下表表1那么下面我们通过例子来说明双人零和博弈模型的建立: 例1甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,算和局,均不得分.试列出对儿童甲的赢得矩阵.解 本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表2.表2例2 从一张红牌和一张黑牌中随机抽取一张,在对B 保密情况下拿给A 看,若A 看到的是红牌,他可选择或掷硬币决定胜负,或让B 猜.若选择掷硬币,当出现正面,A 赢p 元,出现反面,输q 元;若让B 猜,当B 猜中是红牌,A 输r 元,反之B 猜是黑牌,A 赢s 元.若A 看到的是黑牌,他只能让B 猜.当B 猜中是黑牌,A 输u 元,反之B 猜是红牌,A 赢t 元,试确定A 、B 各自的策略,建立支付矩阵.解 因A 的赢得和损失分别是B 的损失和赢得,故属二人零和博弈.为便于分析,可画出如图3的博弈树图.图3中,○为随机点,□分别为A 和B 的决策点,从图中看出A 的策略有掷硬币和让B 猜两种,B 的策略有猜红和猜黑两种,据此可归纳出各种情况下A 和B 输赢值分析的表格,见表4.图3抽到红牌正面反面抽到黑球○□□○□1/2掷硬币让B 猜1/21/2猜红猜黑猜黑猜红1/2让B 猜p-q-rst-u表4对表4中各栏数字可以这样来理解:因让A 看到红牌时或掷硬币或让B 猜.若A 决定选掷硬币这个策略,当出现正面,这时不管B 猜红或猜黑,A 都赢p 元;当出现反面,不管B 猜红或猜黑,A 都输q 元.同样A 选择让B 猜的策略后,他的输赢只同B 猜红或猜黑有关,而与掷硬币的正反面无关.又若抽到的牌是黑牌,A 的决定只能让B 猜,因而掷硬币策略对A 的胜负同样不起作用.考虑到抽牌时的红与黑的概率各为1/2,掷硬币时出现正反面的概率也各为1/2,故当A 采取“掷硬币”策略,而B 选择“猜红”策略时,A 的期望赢得为:⎪⎭⎫ ⎝⎛-q p 212121+t 21=()t q p 241+- 当A 采取让B 猜策略,B 选择“猜红”策略时,A 的期望赢得为:()()⎪⎭⎫ ⎝⎛-+-r r 212121+t 21=()t r +-21 相应可求得其他策略对A 的期望赢得值.由此可列出本例的收益矩阵,见表5.表5三、双人零和博弈的求解定理1(极小极大定理)在零和博弈中,对于给定的支付矩阵U ,如果存在混合战略1σ*=(1σ*1,…1σ*m )和2σ*=(2σ*1,…2σ*n )以及一个常数v 满足,对任意j 有∑=mi i ij a 11*σ≥v ,对任意的i 有∑=nj j ij a 12*σ≤v ,那么战略组合(1σ*,2σ*)为该博弈的Nash 均衡.其中,v 为参与人1在均衡中所得到的期望支付,亦称该博弈的值.这个极小极大定理,其基本思想就是:参与人1考虑到对方使自己支付最小的最优反应,从中选择使自己最好的策略.参与人2也遵循同样的思路,这样才能满足Nash 均衡的互为最优反应的条件.这样我们就可以得到双人零和博弈Nash 均衡的计算方法了,如以下定理定理2 对于给定的零和博弈,如果博弈的值v 大于0,则博弈的Nash 均衡(1σ*,2σ*)为以下对偶线性规划问题的解Min ∑=mi i p 1s.t. ∑=mi i ij p a 1≥1 (j=1,…,n)i p ≥0 (i=1,…,m) 和Max ∑=nj j q 1s.t. ∑=nj j ij q a 1≤1 (i=1,…,m)j q ≥0 (j=1,…,n) 其中,Nash 均衡支付∑∑====nj jmi iqpv 1111Nash 均衡战略),,,,(1*1m i vp vp vp =σ,),,,(1*2n j vq vq vq =σ由于此定理只适用于v 大于0的情形,因此对于v 小于等于0的情形,该定理所给出的方法需做适当的修改.命题 如果支付矩阵U=mxn ij a )(的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v >0.定理3 如果支付矩阵U '=mxn ij a )('是由U=mxn ij a )(的每个元素都加上一个常数c 得到,即c a a ij ij +=',那么支付矩阵U 和U '所对应的零和博弈的Nash 均衡战略相同,博弈的值相差c.根据以上定理,可以得到如下求解一般零和博弈Nash 均衡的方法:(1) 若支付矩阵U 中的所有元素都大于零,则可以直接根据定理进行计算;若支付矩阵U 中有小于0的元素,可以通过加上一个常数使它们都大于0,然后再根据定理进行计算. (2) 求解定理中的两个对偶线性规划问题.下面通过实例来说明如何求解双人零和博弈的Nash 均衡.例3 求解下图中战略式博弈的Nash 均衡. 参与人2L M RU参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 根据前面的介绍,可知该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛224132312不难发现,该博弈的支付矩阵U=()33x ij a 的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v>0.设参与人1和参与人2的混合战略分别是1σ=(321,,vp vp vp )和2σ=(321,,vq vq vq ),利用对偶线性规划求解方法求解该战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++}s.t. 321422p p p ++≥1 32123p p p ++≥1 32123p p p ++≥1 1p ≥0,2p ≥0,3p ≥0 和Max {321q q q ++}s.t. 32132q q q ++≤1 32132q q q ++≤1 321224q q q ++≤1 1q ≥0,2q ≥0,3q ≥0求解第一个规划问题,得到1p =1/4, 2p =1/4, 3p =0,参与人1的支付v=2.因此,参与人1的混合战略1σ*=(1/2,1/2,0).同理,对对偶问题求解,得到1q =0,2q =1/4, 3q =1/4,参与人2的损失v=2,因此参与人的混合战略2σ*=(0,1/2,1/2).所以,该博弈存在一个混合战略Nash 均衡((1/2,1/2,0)(0,1/2,1/2),).例4 求解下图中的战略式博弈的Nash 均衡.参与人2L M R U 参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛--203011122 在上树支付矩阵U=33)(x ij a 中,12a <0, 21a <0.为了利用对偶线性规划模型求解博弈的解,构造支付矩阵U '=33')(x ij a ,其中a 'ij=ij a +c.令c=2,那么新构造的支付矩阵为U '=⎪⎪⎪⎭⎫ ⎝⎛425231304 设参与人1和参与人2的混合战略分别是1σ=(v 'p 1, v 'p 2, v 'p 3)和2σ=(v 'q 1, v 'q 2 v 'q 3,),v 为原博弈的值,v '为新博弈的值,且v '=v+2,利用对偶线性规划求解方法求解新战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++} s.t. 32154p p p ++≥13223p p +≥1 321423p p p ++≥11p ≥0, 2p ≥0, 3p ≥0Max {321q q q ++}s.t. 3134q q +≤1 32123q q q ++≤1 321425q q q ++≤1 1q ≥0,2q ≥0,3q ≥0通过求解对偶问题,得到1p =0,2p =3/13, 3p =2/13,参与人1的支付v '=13/5, 1q =1/13, 2q =4/13, 3q =0,参与人2的损失v '=13/5.因此,参与人1的混合战略1σ*=(0,3/5,2/5), 参与人2 的混合战略2σ*=(1/5,4/5,0),原博弈的值v= v '-2=3/5.所以,博弈存在一个混合战略Nash 均衡((0,3/5,2/5),(1/5,4/5,0)).。
双人零和博弈
双⼈零和博弈⼀、双⼈零和博弈的概念零和博弈⼜称零和游戏,与⾮零和博弈相对,是博弈论的⼀个概念,属⾮合作博弈,指参与博弈的各⽅,在严格竞争下,⼀⽅的收益必然意味着另⼀⽅的损失,⼀⽅收益多少,另⼀⽅就损失多少,所以博弈各⽅的收益和损失相加总和永远为“零”.双⽅不存在合作的可能.⽤通俗的话来讲也可以说是:⾃⼰的幸福是建⽴在他⼈的痛苦之上的,⼆者的⼤⼩完全相等,因⽽双⽅在决策时都以⾃⼰的最⼤利益为⽬标,想尽⼀切办法以实现“损⼈利⼰”.零和博弈的结果是⼀⽅吃掉另⼀⽅,⼀⽅的所得正是另⼀⽅的所失,整个社会的利益并不会因此⽽增加⼀分.⼆、双⼈零和博弈的模型的建⽴建⽴双⼈零和博弈的模型,就是要根据对实际问题的叙述确定参与⼈(局中⼈)的策略集以及相应的收益矩阵(⽀付矩阵).我们记双⼈零和博弈中的两个局中⼈为A和B;局中⼈A的策略集为a1,…,am,局中⼈B的策略集为b1,…,bn;cij为局中⼈A采取策略ai、局中⼈B采取策略bj 时A的收益(这时局中⼈B的收益为- cij).则收益矩阵见下表表1那么下⾯我们通过例⼦来说明双⼈零和博弈模型的建⽴: 例1甲、⼄两名⼉童玩猜拳游戏.游戏中双⽅同时分别或伸出拳头(代表⽯头)、或⼿掌(代表布)、或两个⼿指(代表剪⼑).规则是剪⼑赢布,布赢⽯头,⽯头赢剪⼑,赢者得⼀分.若双⽅所出相同,算和局,均不得分.试列出对⼉童甲的赢得矩阵.解本例中⼉童甲或⼄均有三个策略:或出拳头,或出⼿掌,或出两个⼿指,根据例⼦中所述规则,可列出对⼉童甲的赢得矩阵见表2.表2例2 从⼀张红牌和⼀张⿊牌中随机抽取⼀张,在对B 保密情况下拿给A 看,若A 看到的是红牌,他可选择或掷硬币决定胜负,或让B 猜.若选择掷硬币,当出现正⾯,A 赢p 元,出现反⾯,输q 元;若让B 猜,当B 猜中是红牌,A 输r 元,反之B 猜是⿊牌,A 赢s 元.若A 看到的是⿊牌,他只能让B 猜.当B 猜中是⿊牌,A 输u 元,反之B 猜是红牌,A 赢t 元,试确定A 、B 各⾃的策略,建⽴⽀付矩阵.解因A 的赢得和损失分别是B 的损失和赢得,故属⼆⼈零和博弈.为便于分析,可画出如图3的博弈树图.图3中,○为随机点,□分别为A 和B 的决策点,从图中看出A 的策略有掷硬币和让B 猜两种,B 的策略有猜红和猜⿊两种,据此可归纳出各种情况下A 和B 输赢值分析的表格,见表4.图3抽到红牌正⾯反⾯抽到⿊球○□□○□1/2掷硬币让B 猜1/21/2猜红猜⿊猜⿊猜红1/2让B 猜p-q-rst-u表4对表4中各栏数字可以这样来理解:因让A 看到红牌时或掷硬币或让B 猜.若A 决定选掷硬币这个策略,当出现正⾯,这时不管B 猜红或猜⿊,A 都赢p 元;当出现反⾯,不管B 猜红或猜⿊,A 都输q 元.同样A 选择让B 猜的策略后,他的输赢只同B 猜红或猜⿊有关,⽽与掷硬币的正反⾯⽆关.⼜若抽到的牌是⿊牌,A 的决定只能让B 猜,因⽽掷硬币策略对A 的胜负同样不起作⽤.考虑到抽牌时的红与⿊的概率各为1/2,掷硬币时出现正反⾯的概率也各为1/2,故当A 采取“掷硬币”策略,⽽B 选择“猜红”策略时,A 的期望赢得为:-q p 212121+t 21=()t q p 241+- 当A 采取让B 猜策略,B 选择“猜红”策略时,A 的期望赢得为:()()??? ??-+-r r 212121+t 21=()t r +-21相应可求得其他策略对A 的期望赢得值.由此可列出本例的收益矩阵,见表5.表5三、双⼈零和博弈的求解定理1(极⼩极⼤定理)在零和博弈中,对于给定的⽀付矩阵U ,如果存在混合战略1σ*=(1σ*1,…1σ*m )和2σ*=(2σ*1,…2σ*n )以及⼀个常数v 满⾜,对任意j 有∑=mi i ij a 11*σ≥v ,对任意的i 有∑=nj j ij a 12*σ≤v ,那么战略组合(1σ*,2σ*)为该博弈的Nash 均衡.其中,v 为参与⼈1在均衡中所得到的期望⽀付,亦称该博弈的值.这个极⼩极⼤定理,其基本思想就是:参与⼈1考虑到对⽅使⾃⼰⽀付最⼩的最优反应,从中选择使⾃⼰最好的策略.参与⼈2也遵循同样的思路,这样才能满⾜Nash 均衡的互为最优反应的条件.这样我们就可以得到双⼈零和博弈Nash 均衡的计算⽅法了,如以下定理定理2 对于给定的零和博弈,如果博弈的值v ⼤于0,则博弈的Nash 均衡(1σ*,2σ*)为以下对偶线性规划问题的解Min ∑=mi i p 1s.t. ∑=mi i ij p a 1≥1 (j=1,…,n)i p ≥0 (i=1,…,m) 和Max ∑=nj j q 1s.t. ∑=nj j ij q a 1≤1 (i=1,…,m)j q ≥0 (j=1,…,n) 其中,Nash 均衡⽀付∑∑====nj jmi iqpv 1111Nash 均衡战略),,,,(1*1m i vp vp vp =σ,),,,(1*2n j vq vq vq =σ由于此定理只适⽤于v ⼤于0的情形,因此对于v ⼩于等于0的情形,该定理所给出的⽅法需做适当的修改.命题如果⽀付矩阵U=mxn ij a )(的每个元素都⼤于0,即ij a >0,那么博弈的值⼤于0,即v >0.定理3 如果⽀付矩阵U '=m xn ij a )('是由U=mxn ij a )(的每个元素都加上⼀个常数c 得到,即c a a ij ij +=',那么⽀付矩阵U 和U '所对应的零和博弈的Nash 均衡战略相同,博弈的值相差c.根据以上定理,可以得到如下求解⼀般零和博弈Nash 均衡的⽅法:(1) 若⽀付矩阵U 中的所有元素都⼤于零,则可以直接根据定理进⾏计算;若⽀付矩阵U 中有⼩于0的元素,可以通过加上⼀个常数使它们都⼤于0,然后再根据定理进⾏计算. (2) 求解定理中的两个对偶线性规划问题.下⾯通过实例来说明如何求解双⼈零和博弈的Nash 均衡.例3 求解下图中战略式博弈的Nash 均衡. 参与⼈2L M RU参与⼈1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解根据前⾯的介绍,可知该博弈的⽀付矩阵为U=224132312不难发现,该博弈的⽀付矩阵U=()33x ij a 的每个元素都⼤于0,即ij a >0,那么博弈的值⼤于0,即v>0.设参与⼈1和参与⼈2的混合战略分别是1σ=(321,,vp vp vp )和2σ=(321,,vq vq vq ),利⽤对偶线性规划求解⽅法求解该战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++}s.t. 321422p p p ++≥1 32123p p p ++≥1 32123p p p ++≥1 1p ≥0,2p ≥0,3p ≥0 和Max {321q q q ++}s.t. 32132q q q ++≤1 32132q q q ++≤1 321224q q q ++≤1 1q ≥0,2q ≥0,3q ≥0求解第⼀个规划问题,得到1p =1/4, 2p =1/4, 3p =0,参与⼈1的⽀付v=2.因此,参与⼈1的混合战略1σ*=(1/2,1/2,0).同理,对对偶问题求解,得到1q =0,2q =1/4, 3q =1/4,参与⼈2的损失v=2,因此参与⼈的混合战略2σ*=(0,1/2,1/2).所以,该博弈存在⼀个混合战略Nash 均衡((1/2,1/2,0)(0,1/2,1/2),).例4 求解下图中的战略式博弈的Nash 均衡.参与⼈2L M R U 参与⼈1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解该博弈的⽀付矩阵为U=--203011122 在上树⽀付矩阵U=33)(x ij a 中,12a <0, 21a <0.为了利⽤对偶线性规划模型求解博弈的解,构造⽀付矩阵U '=33')(x ij a ,其中a 'ij =ij a +c. 令c=2,那么新构造的⽀付矩阵为U '=425231304 设参与⼈1和参与⼈2的混合战略分别是1σ=(v 'p 1, v 'p 2, v 'p 3)和2σ=(v 'q 1, v 'q 2 v 'q 3,),v 为原博弈的值,v '为新博弈的值,且v '=v+2,利⽤对偶线性规划求解⽅法求解新战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++} s.t. 32154p p p ++≥13223p p +≥1 321423p p p ++≥11p ≥0, 2p ≥0, 3p ≥0Max {321q q q ++}s.t. 3134q q +≤1 32123q q q ++≤1 321425q q q ++≤1 1q ≥0,2q ≥0,3q ≥0通过求解对偶问题,得到1p =0,2p =3/13, 3p =2/13,参与⼈1的⽀付v '=13/5, 1q =1/13, 2q =4/13, 3q =0,参与⼈2的损失v'=13/5.因此,参与⼈1的混合战略1σ*=(0,3/5,2/5), 参与⼈2 的混合战略2σ*=(1/5,4/5,0),原博弈的值v= v '-2=3/5.所以,博弈存在⼀个混合战略Nash 均衡((0,3/5,2/5),(1/5,4/5,0)).。
【思维模式训练】富翁的思维方式:分享与双赢才是成功的关键
【思维模式训练】富翁的思维方式:分享与双赢才是成功的关键在博弈论中有一个重要的概念:零和游戏。
所谓“零和游戏”是这样一种概念:游戏者有输有赢,游戏参与各方得失总和为零。
有许多体育比赛中我们都可以看到这种现象。
当你看到两个打乒乓球的人时,你就可以说他们正在玩“零和游戏”。
因为他们最终总会一个赢,一个输。
如果我们把获胜计算为得1分,而输球为失1分,那么,这两人得分之和就是:1+-1=0这正是“零和游戏”的基本内容:游戏者有输有赢,但整个游戏的总成绩永远为零。
零和游戏就是角力的一种模式,也就是一种思维的方式。
惯于按零和游戏的模式考量问题,就可以指出对方的“输”就是自己的“赢”。
自古以来,人们便视赚钱为一个“你输我赢”的零和游戏,一种肮脏生意,恶毒的人拼命占便宜以搜刮钱财。
在但在千万富翁的眼中,他们相信一个人可以不靠肮脏手段而致富,你不用去抢别人的蛋糕来加大自己的蛋糕。
他们选择一种“双赢”的策略――追求“你活我也活”――讲求彼此的和谐与互助合作。
在与劲敌的竞争过程中,不可否认,许多大家都“看得出来”的机会,也就是大多数人既看看获得,也能够参予的机会,往往不一定就是最出色的机会。
当许多人都看得出来某一种营生或某一项投资存有挣钱的机会时,大家便可以自然纷纷资金投入,导致惨烈的竞争,也自然难以获得这种投资的收益。
所以,真正发家致富的良机往往是“人弃我取”。
人弃我取,或者应说道通常人会忽略的机会,其实在很多方面都在等候着能本领的人回去挖掘它。
千万富翁更懂得让赢得比赛者分享胜利的果实。
一般人通常只想到自己要成功,甚至不惜因此牺牲同事。
不管这种行为是出于太过专注于自己的努力,还是因为感受来自同事的竞争威胁,结果都会伤害到部门和公司的整体利益,不论就短期或长期而言,都对公司不利。
互动成果的另一个好处就是,大家因此明白,公司不挣钱时,可以互动的利润就增加,奖金也增加。
结果就是,因为大家的利益一致,所以方向一致,因此相互引导。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
零和游戏与混合策略
警察与小偷之间的博弈, 警察与小偷之间的博弈,所选策略应当是随 机的,不能让对方知道自己的策略, 机的,不能让对方知道自己的策略,哪怕是 倾向性”的策略。 “倾向性”的策略。 当博弈是零和博弈时, 当博弈是零和博弈时,即一方所得是另外一 方的所失时,对于任何一方来说, 方的所失时,对于任何一方来说,此时不可 能有纯策略的占优策略。 能有纯策略的占优策略。
零和游戏
两个经济学家散步,甲经济学家看见了一堆狗屎, 两个经济学家散步,甲经济学家看见了一堆狗屎,思索 着对乙说。你吃了这堆狗屎吧,我给你100万块钱。 100万块钱 着对乙说。你吃了这堆狗屎吧,我给你100万块钱。乙 犹豫了一会儿,但还是经受不住诱惑,吃了那堆狗屎。 犹豫了一会儿,但还是经受不住诱惑,吃了那堆狗屎。 当然,甲守信地给了他100万块钱。 100万块钱 当然,甲守信地给了他100万块钱。 过了一会,乙也看见了一堆狗屎,就对甲说: 过了一会,乙也看见了一堆狗屎,就对甲说:你吃了这 狗屎,我也给你100 100万 甲经济学家也经受不住诱惑, 狗屎,我也给你100万。甲经济学家也经受不住诱惑, 吃了那堆狗屎当然。 100万还了回去 万还了回去。 吃了那堆狗屎当然。乙把甲给他的 100万还了回去。 故事还没有完。走着走着,乙忽然缓过神来了,对甲说: 故事还没有完。走着走着,乙忽然缓过神来了,对甲说: 不对阿,我们谁也没有挣到钱,却吃了两对狗屎……甲 不对阿,我们谁也没有挣到钱,却吃了两对狗屎 甲 也缓过神了,思考了一会儿说:可是,我们创造了200 也缓过神了,思考了一会儿说:可是,我们创造了200 万的GNP GNP阿 万的GNP阿!
纳什定理案例——房地产开发博弈 纳什定理案例 房地产开发博弈
假定: 假定: A、B两个开发商都想在广州开发一定规模的房地产, A、B两个开发商都想在广州开发一定规模的房地产,但广州市的 两个开发商都想在广州开发一定规模的房地产 房地产市场需求有限,只能满足一个房地产商的开发量; 房地产市场需求有限,只能满足一个房地产商的开发量; 而且,每个开发商必须一次性开发这一定规模的房地产才能获利。 而且,每个开发商必须一次性开发这一定规模的房地产才能获利。 在这种情况下,A和B都不存在一种策略完全优于另一种策略,也不 在这种情况下,A和 都不存在一种策略完全优于另一种策略, ,A 存在一个策略完全劣于另一个策略。因为, 存在一个策略完全劣于另一个策略。因为, 如果A选择开发, 的最优策略是不开发; 如果A选择开发,则B的最优策略是不开发; 如果A选择不开发, 的最优策略是开发; 如果A选择不开发,则B的最优策略是开发; 类似地, 类似地, 如果B选择开发, 的最优策略是不开发; 如果B选择开发,则A的最优策略是不开发; 如果B选择不开发, 的最优策略是开发。 如果B选择不开发,则A的最优策略是开发。
赢家的诅咒
在《红男绿女》一片中,赌棍斯凯·马斯特森想起父亲给自 红男绿女》一片中,赌棍斯凯· 己提的一个很有价值的建议: 己提的一个很有价值的建议: 孩子,在你的旅途中, 孩子,在你的旅途中,总有一天会遇到一个家伙走上前 在你面前拿出一副漂亮的新扑克牌, 来,在你面前拿出一副漂亮的新扑克牌,连塑料包装纸都没 有拆掉的那种;这家伙打算跟你打一个赌, 有拆掉的那种;这家伙打算跟你打一个赌,赌他有办法让梅 从扑克牌里跳出来,并把苹果汁溅到你的耳朵里。不过, 花J从扑克牌里跳出来,并把苹果汁溅到你的耳朵里。不过, 孩子,千万别跟这个家伙打赌, 孩子,千万别跟这个家伙打赌,因为就跟你确确实实站在那 里一样,最后你确确实实会落得苹果汁溅到耳朵里的下场。 里一样,最后你确确实实会落得苹果汁溅到耳朵里的下场。 但斯凯从来没有认真听取过他父亲的教诲。一分钟后, 但斯凯从来没有认真听取过他父亲的教诲。一分钟后,他就 和内森打赌说内森不知道他的蝴蝶领结是什么颜色。 和内森打赌说内森不知道他的蝴蝶领结是什么颜色。如果内 森知道是什么颜色,他一定愿意打赌,并且取胜。结果是, 森知道是什么颜色,他一定愿意打赌,并且取胜。结果是, 内森不知道什么颜色,所以他没有跟斯凯打赌。 内森不知道什么颜色,所以他没有跟斯凯打赌。
第三章 零和游戏与混合策略
零和游戏
零和游戏——游戏者有输有赢,但整个游戏的 游戏者有输有赢, 零和游戏 游戏者有输有赢 总成绩永远为零。 总成绩永远为零。 零和游戏:博弈当中的参与者, 零和游戏:博弈当中的参与者,其利益可能严 格对立,一人所得永远等于另一人所失。 格对立,一人所得永远等于另一人所失。
零和游戏
“无毒不丈夫”也是零和博弈所致 无毒不丈夫” 无毒不丈夫
著名经济学家茅于轼曾说: 著名经济学家茅于轼曾说:“过去 的帝王与将相就是这样一种博弈,他可 的帝王与将相就是这样一种博弈, 以剥削你,抄你的家;你可以造他的反, 以剥削你,抄你的家;你可以造他的反, 夺他的天下。一方得利,一方受损, 夺他的天下。一方得利,一方受损,那 是零和博弈。 是零和博弈。事实上也正是因为这种零 和博弈反复上演, 和博弈反复上演,才使中国历史的每一 页都充满了阴谋与血腥,并且使‘ 页都充满了阴谋与血腥,并且使‘无毒 不狠非丈夫’ 不狠非丈夫’的文化观念深入到每一个 中国人的意识中。 中国人的意识中。”
零和游戏
“零和游戏”之所以广受关注,主要是因为人们发现, 零和游戏”之所以广受关注,主要是因为人们发现, 零和游戏 在社会的方方面面都有与“零和游戏”类似的局面, 在社会的方方面面都有与“零和游戏”类似的局面,胜 利者的光荣后面往往隐藏着失败者的辛酸和苦涩。 利者的光荣后面往往隐藏着失败者的辛酸和苦涩。 但20世纪以来,“零和游戏”观念正逐渐被“非零和游 20世纪以来, 零和游戏”观念正逐渐被“ 世纪以来 负和” 正和”观念所取代。 戏”即“负和”或“正和”观念所取代。 “负和游戏”指,一方虽赢但付出了惨重的代价,得不 负和游戏” 一方虽赢但付出了惨重的代价, 偿失,可谓没有赢家。 偿失,可谓没有赢家。 赢家所得比输家所失多,或者没有输家,结果为“双赢” 赢家所得比输家所失多,或者没有输家,结果为“双赢” 多赢” 称为“正和” 或“多赢”,称为“正和”。
案例——房地产开发博弈 案例 房地产开发博弈
根据纳什均衡含义:给定你的策略, 根据纳什均衡含义:给定你的策略,我的策略是最好的策 纳什均衡含义 给定我的策略,你的策略也是你最好的策略。 略;给定我的策略,你的策略也是你最好的策略。即双方 在对方给定的策略下不愿意调整自己的策略。 在对方给定的策略下不愿意调整自己的策略。 开发商博弈的纳什均衡点不止一个,而是两个: 开发商博弈的纳什均衡点不止一个,而是两个: 开发, 不开发 不开发); (A开发,B不开发); 开发 不开发, 开发 开发)。 (A不开发,B开发)。 不开发 在有两个或两个以上纳什均衡点的博弈中, 在有两个或两个以上纳什均衡点的博弈中,其最后结果难 以预测。我们无法知道,最后结果是A开发 开发, 不开发还是 以预测。我们无法知道,最后结果是 开发,B不开发还是 A不开发,B开发。 不开发, 开发 开发。 不开发
零和游戏
有人认为, 有人认为,双赢只不过是把负面隐藏到我们不能观及 的地方而已……也就是把危害转让到与自己利益无关 的地方而已 也就是把危害转让到与自己利益无关 的地方。 的地方。 “我们谁也没有挣到钱,却吃了两对狗屎。。。” 我们谁也没有挣到钱,却吃了两对狗屎。。。” 。。。 甲之所以给乙钱,是因为甲看见乙吃狗屎感到了快乐. 甲之所以给乙钱,是因为甲看见乙吃狗屎感到了快乐. 所以他们各吃了一堆狗屎,都没得到钱, 所以他们各吃了一堆狗屎,都没得到钱,但是都感到了 一次快乐。 一次快乐。
零和游戏与混合策略
假定中大只有一名警察, 假定中大只有一名警察,负责全校治 中大只有一个小偷,实施偷盗。 安。中大只有一个小偷,实施偷盗。 东区有一家士多,西区有一家银行。 东区有一家士多,西区有一家银行。 因分身乏术, 因分身乏术,警察一次只能在一个地 方巡逻;而小偷也只能去一地偷盗。 方巡逻;而小偷也只能去一地偷盗。 假定银行需保护的财产价格为2万元, 假定银行需保护的财产价格为2万元, 士多的财产价格为1万元。 士多的财产价格为1万元。若警察在 某地巡逻,而小偷也选择了该地, 某地巡逻,而小偷也选择了该地,就 会被警察抓住; 会被警察抓住;若警察没有巡逻的地 方而小偷去了,则小偷成功。 方而小偷去了,则小偷成功。 警察怎么巡逻才能使效果最好? 警察怎么巡逻才能使效果最好?
零和游戏
[拉封丹寓言]狐狸与狼的零和博弈 拉封丹寓言]
一晚,狐狸来到了水井旁,俯身看到井底的月亮圆圆的, 一晚,狐狸来到了水井旁,俯身看到井底的月亮圆圆的,以 为是块大奶酪。两只吊桶一上一下交替打水上来。 为是块大奶酪。两只吊桶一上一下交替打水上来。这只饿得发昏 的狐狸跨进一只水桶下到了井底,另一只水桶升到了井面。 的狐狸跨进一只水桶下到了井底,另一只水桶升到了井面。下得 井来,它才明白这圆月是吃不得的。 井来,它才明白这圆月是吃不得的。 第二天晚上,沮丧的狐狸正无计可施时, 第二天晚上,沮丧的狐狸正无计可施时,刚好一只口渴的狼 途经此地,狐狸不禁喜上眉梢,它对狼打招呼道: 途经此地,狐狸不禁喜上眉梢,它对狼打招呼道: “喂,伙计,我免费招待你一顿美餐吧。”它指着井底的月 伙计,我免费招待你一顿美餐吧。 亮对狼说, 这可是块十分好吃的干酪,我已吃掉了一半, 亮对狼说,“这可是块十分好吃的干酪,我已吃掉了一半,剩下 这半给你吧。你钻到我特意为你准备好的桶里下来吧。 这半给你吧。你钻到我特意为你准备好的桶里下来吧。” 这只狼可是个笨蛋,居然中计。狼下到井里, 这只狼可是个笨蛋,居然中计。狼下到井里, 它的重量使狐 狸升到了井口,这只被困两天的狐狸终于得救了。 狸升到了井口,这只被困两天的狐狸终于得救了。
佛罗伦萨“警察抓小偷” 佛罗伦萨“警察抓小偷”雕 塑
零和游戏与混合策略
警察的一个最好的做法是,抽签决定去银行还是士多。 警察的一个最好的做法是,抽签决定去银行还是士多。 因为银行的价值是士多的两倍,所以用所以用两个签代表银行, 比如如果抽到1 比如如果抽到1、2号签去银行,抽到3号签去士多。这 号签去银行,抽到3号签去士多。 样警察有2/3的机会去银行进行巡逻,1/3的机会去士多 2/3的机会去银行进行巡逻 的机会去士多。 样警察有2/3的机会去银行进行巡逻,1/3的机会去士多。 而小偷的最优选择是:以同样抽签的办法决定去银行还 而小偷的最优选择是: 是去士多偷盗,只是抽到1 号签去士多,抽到3 是去士多偷盗,只是抽到1、2号签去士多,抽到3号签 去银行,那么,小偷有l/3的机会去银行,2/3的机会去 l/3的机会去银行 去银行,那么,小偷有l/3的机会去银行,2/3的机会去 士多。 士多。