囚徒困境与纳什均衡

合集下载

博弈论纳什均衡

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。

两个囚徒互相揭发,就是一种纳什均衡。

对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。

也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。

这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。

博弈策略稳定,博弈结果也稳定。

之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。

之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。

2、纳什均衡意义重大。

纳什均衡提出,震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。

”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。

但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。

这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。

从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。

更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。

Q2:怎样运用纳什均衡?1、分析囚徒困境。

最新囚徒困境和纳什均衡

最新囚徒困境和纳什均衡

囚徒困境和纳什均衡当对手知道了你的决定之后,就能做出对自己最有利的决定------普林斯顿大学数学家约翰·纳什囚徒困境著名的“囚徒困境”,是纳什均衡理论的经典案例。

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供一下相同的选择:若有一人认罪并作证检控对方(背叛对方)而对方保持沉默,此人将立即获释,沉默者将判监禁十年。

若两人都保持沉默(互相合作)则两人同时被判监禁半年。

若两人都互相检举(互相背叛)则两人同时监禁两年。

如同博弈论的其他论证,囚徒困境假设每个囚徒都是利己的,激斗寻求自己的最大利益。

囚徒到底应该选择哪一项策略,才能将自己的刑期缩至最短?两名囚徒由于相互隔离监禁,并不知道对方的选择。

试想困境中两名理性的囚徒会如何选择:若对方沉默,背叛会让我获释,所以对方会选择背叛。

若对方背叛我,我也要指控对方才能得到较低的刑期,所以也是这样会选择背叛。

二人面对的情况一样,所以二人的理想思考会得到相同的答案----选择背叛。

背叛是两种策略之间的支配性策略。

因此这场博弈中唯一可能达到的纳什均衡就是两人选择同时背叛对方,结果两人同时服刑两年。

这场博弈的纳什均衡,显然不是最优的解决方案。

如果两人都选择沉默,两人都只会被判刑半年。

但根据以上假设,两人均为理性的个人,均衡状况回事两个囚徒都选择背叛。

这就是“困境”所在。

寻找“纳什均衡点”在现实生活中,纳什均衡理论影响着人们的行为。

比如,在有些国家,报亭既无管理人员也不上锁,买报纸的人在自行放下前后拿走报纸。

当然某些人可能取走报纸却不付钱(背叛)但由于大家意识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。

在商业活动中,也会出现各种各样的囚徒困境的例子。

两个公司相互竞争,他们的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。

但若二者同时期发出质量类似的广告,收入增加很少但成本增加。

第一章 囚徒困境与纳什均衡

第一章  囚徒困境与纳什均衡

政客的囚徒困境
1984年 1984年,美国联邦预算赤字实在太高 了。裁减必要的巨额开支在政治上并不 可行,因此,大幅增税应是不可避免的。 可行,因此,大幅增税应是不可避免的。 民主党总统候选人沃尔特·蒙代尔在竞 民主党总统候选人沃尔特 蒙代尔在竞 选中提出增税政策,却被罗纳德 里根打 罗纳德·里根 选中提出增税政策,却被罗纳德 里根打 得落花流水,因为里根许诺绝不加税。 得落花流水,因为里根许诺绝不加税。 这就是为什么美国是世界上最富有的 国家,却同时又是最大的债务国的原因。 国家,却同时又是最大的债务国的原因。
不巴结
(落选,升官) 落选,升官)
(升官或落选, 升官或落选, 升官或落选 升官或落选) 升官或落选) 三乌丛臣
巴结
不巴结
双方均巴结,则双方成本高;双方均不巴结,则双方成本 双方均巴结,则双方成本高;双方均不巴结, 低。然而“背叛”是双方的最佳的策略。 然而“背叛”是双方的最佳的策略。
囚徒与战士
约瑟夫·海勒《 22条军规》 约瑟夫·海勒《第22条军规》 条军规 的一个故事: 的一个故事: 第二次世界大战胜利在望, 第二次世界大战胜利在望,投 弹手尤塞里安不想成为胜利前夕最 后一批牺牲者, 后一批牺牲者,千方百计逃避执行 任务。他的上级军官问: 可是, 任务。他的上级军官问:“可是, 假如我方士兵都这么想呢? 假如我方士兵都这么想呢?”可尤 塞里安答道: 那我若是不这么想, 塞里安答道:“那我若是不这么想, 岂不就成了一个大傻瓜? 岂不就成了一个大傻瓜?”
经典案例——囚徒困境 囚徒困境 经典案例
就是说,对方背叛,你也背叛将会更好些。这意味着, 就是说,对方背叛,你也背叛将会更好些。这意味着, 无论对方如何行动,如果你认为对方将合作, 无论对方如何行动,如果你认为对方将合作,你背叛能 得到更多;如果你认为对方将背叛, 得到更多;如果你认为对方将背叛,你背叛也能得到更 你背叛总是好的。 多。你背叛总是好的。 于是两人都作出招供的选择,这对他们个人来说都是最 于是两人都作出招供的选择, 佳的,即最符合个体理性的选择。 佳的,即最符合个体理性的选择。 照博弈论的说法,这是本问题的惟一平衡点。 照博弈论的说法,这是本问题的惟一平衡点。只有在这 一点上,任何一人单方面改变选择, 一点上,任何一人单方面改变选择,他只会得到较差的 结果。这一点就是纳什均衡 纳什均衡( Equilibrium)。 结果。这一点就是纳什均衡(Nash Equilibrium)。

囚徒困境和纳什均衡

囚徒困境和纳什均衡

囚徒困境和纳什均衡当对手知道了你的决定之后,就能做出对自己最有利的决定------普林斯顿大学数学家约翰·纳什囚徒困境著名的“囚徒困境”,是纳什均衡理论的经典案例。

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供一下相同的选择:若有一人认罪并作证检控对方(背叛对方)而对方保持沉默,此人将立即获释,沉默者将判监禁十年。

若两人都保持沉默(互相合作)则两人同时被判监禁半年。

若两人都互相检举(互相背叛)则两人同时监禁两年。

如同博弈论的其他论证,囚徒困境假设每个囚徒都是利己的,激斗寻求自己的最大利益。

囚徒到底应该选择哪一项策略,才能将自己的刑期缩至最短?两名囚徒由于相互隔离监禁,并不知道对方的选择。

试想困境中两名理性的囚徒会如何选择:若对方沉默,背叛会让我获释,所以对方会选择背叛。

若对方背叛我,我也要指控对方才能得到较低的刑期,所以也是这样会选择背叛。

二人面对的情况一样,所以二人的理想思考会得到相同的答案----选择背叛。

背叛是两种策略之间的支配性策略。

因此这场博弈中唯一可能达到的纳什均衡就是两人选择同时背叛对方,结果两人同时服刑两年。

这场博弈的纳什均衡,显然不是最优的解决方案。

如果两人都选择沉默,两人都只会被判刑半年。

但根据以上假设,两人均为理性的个人,均衡状况回事两个囚徒都选择背叛。

这就是“困境”所在。

寻找“纳什均衡点”在现实生活中,纳什均衡理论影响着人们的行为。

比如,在有些国家,报亭既无管理人员也不上锁,买报纸的人在自行放下前后拿走报纸。

当然某些人可能取走报纸却不付钱(背叛)但由于大家意识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。

在商业活动中,也会出现各种各样的囚徒困境的例子。

两个公司相互竞争,他们的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。

但若二者同时期发出质量类似的广告,收入增加很少但成本增加。

纳什均衡与囚徒困境

纳什均衡与囚徒困境

交通拥堵中的纳什均衡
在交通拥堵中,如果所有驾驶员都选择走某一 条路,那么这条路就会变得非常拥堵。
如果一个驾驶员选择走另一条路,那么他可能 会更快地到达目的地,但其他驾驶员也可能会 效仿,导致另一条路也变得拥堵。
纳什均衡在交通拥堵中的表现为:所有驾驶员 都选择走同一条路,形成一种稳定的交通状态。
公共资源中的纳什均衡
建立信任
通过建立信任机制,让囚犯相 信对方不会出卖自己,从而都
选择抵赖。
引入第三方监管
由第三方监管机构介入,制定 规则并监督执行,确保双方都 遵守规则。
改变奖励机制
改变奖励机制,使得双方都选 择抵赖成为最优解,例如将坦 白惩罚变得更重。
增加沟通机会
让囚犯有更多的沟通机会,了 解对方的想法和处境,从而更
企业竞争中的囚徒困境
价格战
01
企业为了争夺市场份额,可能会采取降价策略,但这种策略可
能导致整个行业的利润下降。
技术研发
02
企业在研发新技术时面临投入不足或过度投入的困境,如何平
衡研发投入与市场收益是一大挑战。
广告策略
03
企业在广告投放上可能存在囚徒困境,过多的广告投入可能增
加品牌知名度,但也可能导致广告费用过高而降低利润。
01
02
03
公共资源是指那些不属于任何个 人或组织的资源,如海洋、森林、 空气等。
在公共资源的使用中,如果每个 人或组织都过度使用资源,那么 资源将会被耗尽或使用 资源,导致资源的过度消耗和破 坏,形成一种稳定的竞争状态。
05 囚徒困境的实例分析
促进学科发展
纳什均衡与囚徒困境的研究推动了博弈论和其他相关学科的发展,促进了学术交流和知识创新。

纳什均衡与囚徒困境

纳什均衡与囚徒困境

纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名,是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。

首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。

换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

纳什均衡(Nash equilibrium),无一参与者可以通过独自行动而增加收益的策略组合。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

纳什均衡可以分成两类:"纯战略纳什均衡"和"混合战略纳什均衡"。

纯战略是提供给玩家要如何进行赛局的一个完整的定义。

特别地是,纯战略决定在任何一种情况下要做的移动。

战略集合是由玩家能够施行的纯战略所组成的集合。

混合战略是对每个纯战略分配一个机率而形成的战略。

混合战略允许玩家随机选择一个纯战略。

混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。

因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。

案例:智猪博弈、囚徒困境、普通范式博弈(公司合作背叛)、饿狮博弈、硬币正反。

这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。

既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。

还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。

纳什均衡的例子

纳什均衡的例子

纳什均衡的例子
纳什均衡是博弈论中一种重要的概念,最早由约翰·福纳什提出。

它描述了在多方参与的竞争中,每个参与者根据其他人的策略选择了一种最优策略,使得再改变个体策略时,其他人已经无法获得更好的结果。

一个经典的例子是“囚徒困境”。

在这个例子中,有两个嫌疑犯被警方逮捕,并被关在不同的监狱。

检察官只有足够的证据起诉他们合谋犯罪,而不能成功起诉单独一个人。

如果两人都保持沉默,不揭发彼此,那么他们只会因为小罪名被判入狱一年。

如果其中一个人选择供出另一个人,而另一个人保持沉默,那么供出者将被免于刑罚,而另一个人将被判处十年监禁。

如果两人都选择供出对方,那么他们将被判处三年入狱。

在这个案例中,每个嫌疑犯面临着两个策略选择:合作(保持沉默)或者背叛(供出对方)。

无论对方选择什么策略,每个嫌疑犯都可以通过背叛来获得更轻的刑罚。

然而,当两人都背叛时,他们的总刑期最长。

这导致了一个纳什均衡:在这个案例中,两人都会背叛,因为无论对方选择什么策略,自己背叛都会获得更轻的刑罚。

这个例子揭示了纳什均衡的重要思想,即每个参与者都在预期其他人的行为的基础上做出最优的决策,以达到自己的最大利益。

纳什均衡在经济学、生物学、国际关系等领域都有广泛的应用,对于分析人类行为和决策提供了有力的理论基础。

两个纳什均衡解

两个纳什均衡解

两个纳什均衡解纳什均衡(Nash equilibrium)是博弈论中的一个重要概念,描述了多方参与者在无法单方面改变策略时所达到的最佳决策状态。

简单来说,如果每个参与者都已经选择了最佳策略,而且没有人有动机单独改变自己的策略,那么这种状态就被称为纳什均衡。

以下将介绍两个不同情境下的纳什均衡解。

情境一:囚徒困境囚徒困境是一种典型的博弈论情景,在这种情况下,两名犯罪嫌疑人被警方逮捕,在不互相沟通的情况下,警方给予了他们一定的定罪量刑选择。

假设两名嫌疑人分别有两种选择:合作(cooperate)和背叛(defect)。

如果两人都合作,他们会获得较轻的定罪和刑罚。

然而,如果其中一人选择了背叛,而另一人选择了合作,背叛方将获得较轻的定罪和刑罚,而合作方将面临较重的定罪和刑罚。

如果双方都选择了背叛,那么他们将分别获得相对较重的定罪和刑罚。

在这种情境下,纳什均衡解是双方选择背叛。

理由如下:- 如果A选择合作,那么B选择背叛可以得到相对较轻的定罪和刑罚。

因此,A会更倾向于选择背叛以避免较重的定罪和刑罚。

同样地,如果B选择合作,A选择背叛可以获得相对较轻的定罪和刑罚。

所以,B也会选择背叛。

- 如果A选择背叛,那么无论B选择何种策略,A都能获得相对较轻的定罪和刑罚。

同样地,如果B选择背叛,无论A选择何种策略,B都能获得相对较轻的定罪和刑罚。

情境二:价格竞争在价格竞争情境下,假设有两家公司A和B都在销售同一种产品。

他们可以独立地选择产品的价格。

两家公司的目标是最大化利润。

假设每家公司的利润函数都取决于自身价格和对方的价格。

公司A的利润函数为πA(PA,PB),公司B的利润函数为πB(PA,PB)。

其中,PA和PB分别表示A和B的价格。

理由如下:- 如果公司A选择了某个价格PA,并且公司B决定维持原先的价格PB,那么公司A的最佳策略是选择自己的价格来最大化利润。

因此,公司A的利润函数中的PA变量将达到最大值。

- 同理,如果公司B选择了某个价格PB,并且公司A决定维持原先的价格PA,那么公司B的最佳策略是选择自己的价格来最大化利润。

第2章 纳什均衡与囚徒困境

第2章 纳什均衡与囚徒困境

最优选择
• 这个博弈只要求一阶理性共识就可以预测均衡 结果: • 如果R相信C是理性的,R就知道C不会选择C3, 所以R的最优选择是R1; • 如果C相信R是理性的,C就知道R不会选择R2, 所以C的最优选择是C2。 • 但要C预期R不会选择R3,需要二阶理性共识; 要R不预期C会选择C1,需要三阶理性共识。
无论对方如何选择,每个人的最优选择:不提供。 所以,我们可以预测,结果将是(不提供,不提供)
公共产品与税收制度
• 比较私人产品与公共产品的不同:使用 上排他性; • 私人产品是志愿购买的,但公共产品可 能需要强制购买; • 税收制度就是保证公共产品的生产,解 决公共产品生产上的“囚徒困境”
“囚徒困境”的一般表示
战略 做广告
企业2
做广告 不做广告 4, 4 15 , 1 10 , 10
企业1
不 做 广 告 1 , 15
• 纳什均衡:(做广告,做广告)
利用纳什均衡寻租
• 考虑股票市场融资的例子:设想企业价值是 100,现在发行的流通股为100股,每股价值1 元。现在假定经理想筹集100元,投资价值只 有50元。有人买新股吗? • 假定每一股配4股,价格为0.25元。如果股东不 接受配股:原来一股1元的价值就变成0.3元 (=150/500);如果接受配股,他持有的股票 的价值是1.5元;因为配股的成本是1元,所以 他的最优选择是接受配股。
重复剔除占优均衡
• “重复剔除严格劣战略”(iterated elimination of strictly dominated strategy)的思路:首先找出博弈参与人的劣 战略(dominated strategy)(假定存在的话),把这个劣 战略剔除后,剩下的是一个不包含已剔除劣战略的新 的博弈;然后在剔除这个新的博弈中的劣战略;继续 这个过程,直到没有劣战略存在。如果剩下的战略组 合是唯一的,这个唯一的战略组合就是“重复剔除占 优均衡”(iterated dominance equilibrium)。 • 如果这样的解存在,我们说该博弈是“重复剔除占优 可解的”(iterated dominance solvable).

纳什均衡案例

纳什均衡案例

纳什均衡案例纳什均衡是博弈论中的一个重要概念,由美国数学家约翰·纳什提出。

它指的是在博弈过程中,每个参与者都假设其他参与者的策略保持不变的情况下,选择自己的最佳策略。

在这种情况下,每个参与者的策略都是最优的,没有人会因改变自己的策略而获得更好的结果。

纳什均衡的概念在经济学、政治学、生物学等领域都有广泛的应用。

一个经典的纳什均衡案例是《囚徒困境》。

在这个案例中,两个囚犯被捕,但警察缺乏直接证据定罪他们。

如果两人都保持沉默,他们都只会被判刑1年;如果其中一个人供出另一个人,供出的人将免于刑罚,而另一个人将被判刑3年;如果两人都供出对方,他们将被判刑2年。

在这个案例中,每个囚犯都要考虑另一个囚犯的选择来决定自己的最佳策略。

如果对方保持沉默,供出对方将是最优选择;如果对方供出自己,供出对方也是最优选择。

因此,最终的结果是两人都供出对方,导致最坏的结果出现。

另一个经典的纳什均衡案例是《合作博弈》。

在这个案例中,两个玩家可以选择合作或者背叛对方。

如果两个玩家都选择合作,他们将获得较好的回报;如果一个玩家选择背叛而另一个选择合作,背叛的玩家将获得最大的回报,而合作的玩家将获得最小的回报;如果两个玩家都选择背叛,他们将获得较差的回报。

在这个案例中,每个玩家都需要考虑对方的选择来决定自己的最佳策略。

最终的结果是两个玩家都选择背叛,导致最坏的结果出现。

纳什均衡在现实生活中也有许多应用。

比如在市场竞争中,每家企业都需要考虑其他企业的策略来决定自己的最佳策略;在国际关系中,每个国家都需要考虑其他国家的行为来决定自己的最佳行动。

在这些情况下,纳什均衡可以帮助人们理解和预测各种复杂的博弈情况。

总之,纳什均衡是博弈论中的重要概念,它可以帮助人们理解各种博弈情况下参与者的最佳策略。

通过分析每个参与者的选择和利益,可以找到博弈的最优解。

然而,纳什均衡并不一定是最好的结果,有时候参与者可以通过合作和协商来达到更好的结果。

纳什均衡案例

纳什均衡案例

纳什均衡案例
纳什均衡是指博弈论中的一种平衡状态,它是指在博弈中每个参与者都选择了最佳的策略并且没有人愿意改变自己的策略。

下面是几个纳什均衡的案例:
1. 餐馆竞争:假设有两家在同一地区经营相同类型餐馆的商家,他们都可以选择提供更好的餐饮服务或者降低价格来吸引更多的顾客。

如果两家商家都选择提供更好的餐饮服务,那么他们就会处于纳什均衡状态,因为如果其中一家降低价格,顾客可能会前往该店,但是该店会失去利润。

2. 囚徒困境:在这个案例中,两个囚犯被逮捕并被分开审讯。

如果他们都选择拒绝认罪,那么他们将面临较轻的刑罚,但如果其中一个人认罪并作证控告另一个人,那么被控告的人将面临更严重的刑罚。

在这种情况下,如果每个囚犯都选择认罪,那么他们就处于纳什均衡状态,因为即使其中一个人拒绝认罪,他也可能面临更严重的刑罚。

3. 投标竞争:在这个案例中,几个公司竞标一个项目,他们必须决定如何投标以获得合同。

如果所有公司都选择报一个高价,那么他们将失去竞标的机会,但如果所有公司都选择报一个较低的价格,那么获得合同的公司将无法盈利。

在这种情况下,如果每个公司都选择中等价格的投标,那么他们就处于纳什均衡状态,因为这样可以最大限度地获得合同并保持盈利。

- 1 -。

囚徒困境与纳什均衡的关系

囚徒困境与纳什均衡的关系

囚徒困境与纳什均衡的关系这两个概念都是博弈论中的概念,那什么是博弈论呢,博弈论是研究竞争现象的一种理论方法。

既然是理论方法就会有许多假设的前提,但在现实情况下,这些前提很可能不会同时存在。

所以所有理论方法,只是有助于你分析并理解现实世界,它只是一种方法,或者是一种思维工具而已,切不可生搬硬套。

博弈论在经济学、生物学、物理学、社会学、政治学中都有应用,所以博弈论是一种十分有用的分析框架。

先介绍一下囚徒困境,然后在囚徒困境中找到纳什均衡的局面,最后进行一下总结。

1.囚徒困境1.1两个犯罪嫌疑人都被抓了起来,并且这两个人都是理性、自利的,并且不能相互交流。

都被告知如下规则。

在这种情况下,两个人会做什么选择?答案是两个人都会选择背叛对方。

分析如下:甲想:如果乙沉默,我背叛的话,就会立即获释。

如果乙背叛,我沉默的话,就会判刑十年。

所以甲会选择背叛。

同理乙也会选择背叛。

最终两人都会服刑5年。

其实有一个最优解就是:甲乙都选择沉默。

这就是“困境”所在:个人的最优解,并不是全局的最优解。

1.2知道次数的囚徒困境。

比如限制十次经过上次的教训,甲知道了沉默是全局的最优解,但是最后一次,甲背叛,乙沉默的话,甲会立马获释。

所以前九次甲都会选择沉默,已获得对方的信任,最后一次会选择背叛。

同理乙也会这么想。

当双方都知道对方在最后一局选择背叛,那么会有人在第九局选择背叛,依次类推。

第一局双方都会选择背叛。

1.3不知道次数的囚徒困境经过多次博弈,背叛会受到惩罚,双方趋向于选择合作。

2.纳什均衡在博弈中会存在一个均衡,任何一方都不愿改变策略,因为这种状况下改变策略会不利于自己。

囚徒困境下的纳什均衡是:双方都背叛。

可以用排除法找到答案,如果两人都沉默的话,只要任何一方背叛,会立马获释。

这种双方都沉默的局面并不稳定。

如果一方沉默,另一方背叛的话。

没有人傻到自己沉默,所以这种情况也是不稳定的。

3.总结3.1局部最优解不是全局最优解。

3.2个人的理性选择,会造成全局的非理性。

纳什均衡和囚徒困境的关系

纳什均衡和囚徒困境的关系

纳什均衡和囚徒困境的关系
囚徒困境所形成的均衡解就是纳什均衡解,即两个囚徒从自身效用最大化的角度考虑都会选择坦白,但这并非帕累托最优状态。

纳什均衡由约翰•纳什于20世纪50年代在一系列有关博弈论的论文中提出。

他假设有n个局中人参与博弈,在给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。

所有局中人策略构成一个策略组合(StrategyProfile)。

纳什均衡就是指这样一种战略组合,这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

证明囚徒困境复制因子方程的稳定均衡为纳什均衡

证明囚徒困境复制因子方程的稳定均衡为纳什均衡

证明囚徒困境复制因子方程的稳定均衡为纳什均衡
囚徒困境复制因子方程是一种模型,用于描述两个个体之间的竞争或合作关系。

该模型中存在一个稳定均衡点,称为纳什均衡。

证明囚徒困境复制因子方程的稳定均衡为纳什均衡,需要先了解什么是囚徒困境。

囚徒困境是指两个犯罪嫌疑人被捕后,分别被关押在不同的房间里。

警方让他们各自交代出对方的罪行,如果两人都不说,那么两人各判刑1年;如果两人都说,那么两人各判刑3年;如果一个人说,一个人不说,那么说的人免罪,不说的人则判刑5年。

在囚徒困境中,两个人都想要尽可能地减轻自己的惩罚,但同时也要考虑对方的行为。

这就是典型的非合作博弈。

在复制因子方程中,每个人都有一个策略,即说或者不说。

每次博弈之后,双方的策略会根据结果进行复制,赢家的策略更容易被复制。

这就是复制因子方程的核心思想。

在囚徒困境复制因子方程中,存在一个稳定均衡点,即当两个人都选择不说的时候,这个状态稳定,即使有一方改变策略,也不会有太大的影响。

这个稳定均衡点就是纳什均衡。

为什么说这个稳定均衡点是纳什均衡呢?因为纳什均衡是指在
博弈中,每个人都选择了自己最优的策略,而不考虑对方的策略。

在囚徒困境中,两个人都选择不说的话,对于个体来说,这是最优的策略。

即使对方改变了策略,自己也不会受到太大的影响,因此这个稳定均衡点就是纳什均衡。

综上所述,囚徒困境复制因子方程的稳定均衡为纳什均衡的证明
就是这样的。

好的纳什均衡例子(一)

好的纳什均衡例子(一)

好的纳什均衡例子(一)好的纳什均衡什么是纳什均衡?纳什均衡是博弈论中的一个重要概念,指的是在博弈参与者之间形成的一种稳定和平衡的策略选择状态。

在纳什均衡下,任何一个参与者都无法通过改变自己的策略来获得更大的利益。

好的纳什均衡指的是存在多个纳什均衡时,其中某些纳什均衡比其他纳什均衡更为理想。

例子一:囚徒困境囚徒困境是博弈论中最经典的例子之一。

假设有两个犯人,他们因为涉嫌合谋犯罪被捕,警察只有有限的证据。

警察与每个犯人分别进行单独审讯,并给他们提供了合作和背叛两个选项,这两个选项对应于认罪和抵赖。

如果两个人都选择合作,即认罪,则每个人都会被判刑2年;如果两个人都选择背叛,即抵赖,则每个人都会被判刑5年;如果一个人选择合作而另一个选择背叛,则合作的人会被判刑6年,而背叛的人会被判刑1年。

在这个案例中,存在两个纳什均衡:互相背叛和互相合作。

然而,互相合作是更为理想的纳什均衡,因为如果两个人都选择合作,他们的总刑期将会最短,只有2年。

例子二:拍卖拍卖是另一个常见的博弈场景。

假设有两个竞拍者A和B,他们在一个拍卖会上竞价购买一件物品。

物品的最低价格为100元。

竞拍者A知道他的估值是200元,而竞拍者B知道他的估值是150元。

他们每次可以按照一定幅度加价,但不能超过自己的估值。

在这个案例中,存在两个纳什均衡:A出价200元,B不出价;B 出价150元,A不出价。

然而,对于卖家来说,A出价200元,B不出价是更好的纳什均衡,因为这样卖家可以以更高的价格售出物品。

例子三:价格战价格战是市场竞争中常见的博弈情景。

假设有两家公司A和B,它们在同一个市场上销售类似的产品。

它们可以根据自己的利润目标制定价格。

如果两家公司的价格相等,则它们将平分市场份额;如果一家公司的价格比另一家低,则它将获得更大的市场份额。

在这个案例中,存在两个纳什均衡:价格相等和一家公司的价格低于另一家。

然而,价格相等是更好的纳什均衡,因为这样两家公司可以共享更多的市场份额,并且避免因为价格战而导致的利润下降。

囚徒困境与纳什均衡

囚徒困境与纳什均衡

囚徒困境与纳什均衡
囚徒困境是两个囚犯之间的一个“博弈”,常用来说明不是最优性质的纳什均衡。

当然,囚徒困境的纳什均衡虽然不利于博弈的参与人,但却有利于整个社会。

事例基本内容是:张三和李四以前抢过银行,后来在一次偷汽车的时候被抓住了,警察对他们进行隔离审问,而且向他们每个人都提出了如下的交易:现在可以判你坐一年牢,但如果你承认你和你的同伙前不久抢过银行,我们就可以把你放了,而你的同伙则要坐20年牢;反之,如果你不承认,而你的同伙招供了,那你的同伙就可以自由,而你则要坐20年牢;如果你和你的同伙都承认了抢银行的事,你们2人要坐8年牢。

此时,张三会想:对我来说,最好的结果就是李四不坦白而我坦白,这样我就不用坐牢了;但李四也可能坦白,如果李四坦白了,我该怎么办呢?我最好还是坦白,因为如果我不坦白,就要坐20年牢,而坦白了只要坐8年牢;所以,不管李四坦白不坦白,我最好都要坦白。

当然,李四也会这么想,结果两人都坐8年牢。

由此可见,在有些情况下,每个参与人都追求自己的利益,可能既不能给自己带来好处,也不能给别人带来好处。

囚徒困境表明,合作是困难的,解决囚徒困境最经常的情况是:参与者的博弈不是一次性的而是多次的,而且参与者在开始合作时可以签订协议并规定如果一方违约将如何处理。

所以,只要参与者都非常关心自己未来的利益,他们就会放弃违规带来的一次性好处。

这样,在多次囚徒困境博弈中,参与者就可能达到合作性的结果。

纳什均衡与囚徒困境

纳什均衡与囚徒困境
• 许多的制度就是为解决“囚徒困境”而存在的;
2、现实中的“囚徒困境”
• 产品的价格战:家电企业的降价
• 军备竞赛:两国的选择:增加军备(背叛)、或是
达成削减武器协议(合作)。两国都无法肯定对方 会遵守协议,因此两国最终会倾向增加军备。
广告战 :增加广告开支
OPEC :私自增加石油产量
关税战 :私自提高关税
成绩博弈的战略表示
A
B同桌

a
b
a 0,0 -1,3
b 3,-1 1,1
纳什均衡的结果
占优策略
• 策略a严格优于策略b,如果从策略a中得到 的收益严格大于从策略b中得到的收益。
• 反之成为劣策略。 • 教训1:选择优势策略,放弃劣势策略。 • 教训2:理性的选择导致了次优的结果。
个人理性与集体理性的冲突
应用:工人下岗
• 让一部分工人下岗可以使企业提高效率, 更有竞争力,但对于下岗的人来说,利益 受到损害,显然,解雇工人不是帕累托最 优。
• 但如果其带来的企业效益的提高足以弥补 工人的损害,这就是一个卡尔多---希克斯改 进。如果给下岗工人足够的实际补偿,使 得他的收入比工作的时候并不变得更低。
科斯定理
• 但如果公平与否进入了人们的效用函数,这 种改进就不见得是帕累托改进。(收入差距 变大)
这就是心理成本。究竟应该给受损者补偿多少 才能使他觉得自己没有受损,很难有客观的 标准。
进一步
• 即使事后补偿实际上不会发生,变革不可能得 到一致的同意。但,如果在作出制度安排前每 个人成为赢家的机会均等,从事前角度看,卡 尔多—希克斯改进也是帕累托改进。
公共产品(public goods)
无论对方如何选择,每个 人的最优选择:不提供。

纳什均衡与囚徒困境的关系

纳什均衡与囚徒困境的关系

纳什均衡与囚徒困境的关系纳什均衡和囚徒困境是博弈论中两个重要的概念。

纳什均衡是指在一个博弈中,每个玩家都选择了最优的策略,而其他玩家也选择了最优的策略,这种情况下,每个玩家都无法通过单方面改变策略来获得更大的收益。

囚徒困境则是指,在一个博弈中,每个玩家都会倾向于选择自己的最优策略,但是这种最优策略对于其他玩家来说并不是最优的,导致所有玩家都会得到较差的结果。

那么,纳什均衡和囚徒困境有什么关系呢?首先,纳什均衡可以被用来解决囚徒困境。

在囚徒困境中,每个囚徒都会选择背叛对方,因为这是他们自己的最优策略。

但是,如果两个囚徒都选择合作,那么他们都能获得比背叛更好的结果。

这种情况下,囚徒困境的纳什均衡就是合作。

如果两个囚徒都选择合作,那么他们都不会通过单方面改变策略来获得更大的收益。

其次,囚徒困境可以被用来解释为什么人们会选择不合作的策略。

在现实生活中,人们经常会面临类似于囚徒困境的情况。

例如,在商业谈判中,每个公司都希望获得更多的收益,但是如果所有公司都选择了竞争,那么他们都会得到比合作更差的结果。

这种情况下,每个公司都可能会选择竞争,因为这是他们自己的最优策略。

但是,如果所有公司都选择了合作,那么他们都能获得比竞争更好的结果。

这种情况下,囚徒困境的纳什均衡就是竞争。

最后,纳什均衡和囚徒困境的研究对于社会科学和经济学有着重要的意义。

在社会科学中,博弈论被广泛应用于研究人类行为和社会互动。

在经济学中,博弈论被用来研究市场竞争、拍卖和合同等问题。

纳什均衡和囚徒困境作为博弈论的核心概念,对于解决这些问题具有重要的理论和实践意义。

总之,纳什均衡和囚徒困境是博弈论中两个重要的概念,它们之间有着密切的关系。

纳什均衡可以被用来解决囚徒困境,囚徒困境可以被用来解释为什么人们会选择不合作的策略。

这些研究对于社会科学和经济学具有重要的意义,为我们深入理解人类行为和社会互动提供了重要的理论基础。

证明囚徒困境复制因子方程的稳定均衡为纳什均衡

证明囚徒困境复制因子方程的稳定均衡为纳什均衡

证明囚徒困境复制因子方程的稳定均衡为纳什
均衡
证明囚徒困境复制因子方程的稳定均衡为纳什均衡,首先要理解
囚徒困境模型。

该模型假设两个参与者之间互相竞争,最优决策满足
以下条件:(1)参与者如果不采取最优决策,则会遭受惩罚;(2)
参与者需要考虑对方的行为;(3)参与者可以选择不采取任何行动。

根据这些条件,囚徒困境模型的最优决策为出分局,即双方皆不移动。

由此,囚徒困境复制因子方程可写为:
x₁(t+1)=αx₁(t).βx₂(t), x₂(t+1)=αx₂(t).βx₁(t)。

这是
一种基于零和博弈的种群演化模型,用来描述双方在复制和竞争驱动下,改变策略的群体动态。

纳什均衡是分析囚徒困境模型中的均衡点的方法。

它是一种等价
的决策,双方的益处将相等,使双方保持不变。

在这种情况下,它可
以定义为:αx₁(t).βx₂(t)=αx₂(t).βx₁(t)。

因此,纳什均衡是囚徒困境复制因子方程的稳定均衡点。

这意味着,当双方产生稳定的策略时,它们会相互保持不变,并保持均衡状态。

因此,纳什均衡是囚徒困境复制因子方程的稳定均衡点,可确保
双方益处永远相等。

纳什均衡例题

纳什均衡例题

纳什均衡的经典案例是“囚徒困境”。

在这个例子里,有两个小偷A和B联合犯事,被警方抓住并分别关在不同的房间里进行审讯。

警方对每个犯罪嫌疑人给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,那么证据确凿,两人都被判有罪。

如果另一个犯罪嫌疑人也坦白了罪行,那么两人各被判刑8年。

这个案例中,无论A还是B,最优策略都是坦白。

因为如果A选择坦白,B的最优策略也是坦白;如果A选择不坦白,B的最优策略也是坦白。

反之亦然。

因此,两人的最优策略是一致的——坦白。

这就是纳什均衡的一个体现。

在更复杂的情况下,例如狮群博弈中,总数是奇数和偶数时,狮子的策略会发生变化。

这同样可以通过纳什均衡来解释。

当狮子总数为奇数时,每只狮子都有可能成为狩猎者,因此它们会选择大胆去吃睡着的狮子;而当狮子总数为偶数时,没有狮子会成为狩猎者,因此它们会选择谨慎地不去吃睡着的狮子。

这也是纳什均衡的一个应用。

希望这个例子能够帮助你理解纳什均衡的概念和实际应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档