浅析博弈中的囚徒困境

合集下载

博弈论“囚徒困境”的四种形式

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”

摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信

息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词:博弈论囚徒困境经济

一、完全信息静态“囚徒困境”博弈

完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :

囚徒2

1

(表1)

假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。容易看出,由于对

于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈

博弈论的囚徒困境模型

博弈论的囚徒困境模型

博弈论的囚徒困境模型

引言

博弈论是研究决策制定者在多方面利益冲突下进行选择的一门学科。而囚徒困境模型是博弈论中最经典的模型之一,用于描述两个合作者之间存在利益冲突时可能出现的情况。本文将详细介绍囚徒困境模型的基本概念、策略和解决方法,并探讨其在现实生活中的应用。

1. 囚徒困境模型的基本概念

囚徒困境模型最早由美国数学家Melvin Dresher和Merrill Flood于1950年提出。它是一个非零和博弈模型,意味着合作者之间的利益不完全一致,他们可以选择合作或背叛对方,从而获得不同的收益。

在囚徒困境模型中,通常有两名犯人被关押在不同的牢房里,无法相互沟通。检察官给每个犯人提供了一个选择:如果两个人都保持沉默(即合作),那么他们将分别被判处较轻的刑期;如果其中一个人背叛(即不合作),而另一个人保持沉默,那么背叛者将被释放,而保持沉默者将被判处重刑;如果两个人都背叛,那么他们将各自被判处较重的刑期。

2. 囚徒困境模型的策略

在囚徒困境模型中,每个犯人都有两种基本策略:合作和背叛。根据对方的选择和自己的选择,可以得出四种不同的结果:互相合作、互相背叛、自己合作对方背叛、自己背叛对方合作。这些结果对应着不同的收益。

为了量化这些收益,通常使用一个称为支付矩阵的工具。支付矩阵是一个2x2的矩阵,其中每个元素表示在不同情况下每个合作者获得的收益。在标准囚徒困境模型中,支付矩阵可以表示为:

合作背叛

合作R,R S,T

背叛T,S P,P

其中R表示互相合作时的收益,T表示自己背叛对方合作时的收益,S表示自己合

经济学中的囚徒困境及其应对措施

经济学中的囚徒困境及其应对措施

经济学中的囚徒困境及其应对措施经济学中的囚徒困境(Prisoner’s Dilemma)是博弈论中的一种

典型模型,由于其简单和直观的表现形式,在经济学中一直被广

泛应用。囚徒困境模型主要讨论了类似合作与背叛的场景,在实

际生活中也存在着很多类似的问题。本文将从囚徒困境的定义、

特点、解决方法等方面进行探讨。

一、囚徒困境的定义

囚徒困境是博弈论中一个典型的非零和博弈模型。在该模型中,两名囚徒被关进同一个监狱中,警察给他们分别下达交待自己罪

行的指令,如果两人都交待自己的罪行,则两人都会被判处6个

月的监禁。如果其中一人交待,而另一人不交待,则交待的人将

被判处1年的徒刑,而不交待的人将被判处10年的徒刑。如果两

人都不交待,则两人都将被判处3个月的徒刑。

二、囚徒困境的特点

囚徒困境有以下几个特点:

1. 合作与背叛之间的博弈:囚徒困境是一个两个囚犯之间的博弈,每个囚犯可以选择“合作”或“背叛”,两个人的最终结果受到对方选择的影响。

2. 零和博弈:囚徒困境是一个零和博弈模型,即囚犯们的收益

和损失一直相对的,当一个囚犯获利时,另一个囚犯则会遭受损失,总收益和总损失相互抵消。

3. 完全信息博弈:囚徒困境是一种完全信息博弈,即双方都清

楚地知道对方的选择和结果,不会出现信息不对称的情况。

三、囚徒困境的应对措施

由于囚徒困境的特殊性质,协作往往不是两个囚犯的首选,因

此我们需要一些应对措施来协调两方的行为。

1. 形成合作共赢的利益:在囚徒困境中,形成合作共赢的利益

是解决问题的关键。双方需要理解,合作是最优选择,互相信任,才能够达到最有利的结果。因此,构建自信、信任、孕育互利的

囚徒困境(博弈论的经典案例)

囚徒困境(博弈论的经典案例)

囚徒困境(博弈论的经典案例)

学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例--囚徒困境,非常耐人回味。

囚徒困境,说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。

这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。----那么,这两个囚犯该怎么办呢?

是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上

意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。

博弈论囚徒困境案例

博弈论囚徒困境案例

博弈论囚徒困境案例

博弈论囚徒困境案例

引言

博弈论是研究人类决策行为的一门学科,它探讨的是在多个参与者之

间进行决策时,每个参与者的最优策略和最终结果。其中,囚徒困境

是博弈论中比较典型的案例之一。

一、什么是囚徒困境

囚徒困境是博弈论中的一个经典问题,它描述了两个犯罪嫌疑人被捕

后面临的选择问题。如果两个嫌疑人都保持沉默,则他们都会获得轻判;如果一个人供出另一个人,则供出者将获得免罪或轻判,而另一

个人则会被判重刑;如果两个人都供出对方,则他们都将被判重刑。

这种情况下,每个嫌疑人都会考虑自己的利益和对方可能做出的选择。

二、实际案例分析

1. 美苏核武器竞赛

美苏核武器竞赛可以看作是一个大规模的囚徒困境问题。在20世纪

50年代和60年代,美国和苏联都在积极研发核武器,这导致了一种

军备竞赛的局面。如果两个国家都不研发核武器,则两国都可以获得

和平和安全;如果一个国家研发核武器而另一个国家不研发,则前者

可以获得军事优势,后者则会处于劣势;如果两个国家都研发核武器,则两国都将处于危险之中。这种情况下,每个国家都会考虑自己的利

益和对方可能做出的选择。

2. 环保问题

环保问题也可以看作是一个囚徒困境问题。如果每个人都能够积极参

与环保行动,那么整个社会将会受益;但是,如果有些人不愿意参与

环保行动而其他人却积极参与,那么后者将付出更多的代价。这种情

况下,每个人都要考虑自己的利益和其他人可能做出的选择。

三、如何解决囚徒困境

1. 合作

合作是解决囚徒困境的最佳策略。在合作的情况下,两个嫌疑人都会

保持沉默,从而都能够获得轻判。在其他的囚徒困境问题中,合作也

囚徒困境(博弈论的经典案例)

囚徒困境(博弈论的经典案例)

囚徒困境(博弈论的经典案例)

学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例--囚徒困境,非常耐人回味。

囚徒困境,说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。

这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。----那么,这两个囚犯该怎么办呢?

是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上

意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。

穷徒困境博弈论

穷徒困境博弈论

穷徒困境博弈论

穷徒困境博弈论是一个经济学概念,用于描述当个体之间的合作受限或缺乏信任时所产生的困境。这种困境通常会导致互不合作和互相伤害的情况,从而阻碍了整个社会的发展。

在穷徒困境博弈中,个体会面临一个抉择:是追求自己的利益,还是与他人合作,以获得更大的利益。然而,由于缺乏信任和合作的保证,个体更倾向于追求自己的利益,从而导致整个群体无法实现最优结果。

穷徒困境博弈论的一个典型例子是“囚徒困境”。在这个例子中,两个被捕的罪犯面临选择合作还是背叛对方的抉择。如果两人都合作,他们将获得较轻的刑期;如果两人都背叛,他们将受到较重的惩罚;而如果一个人合作而另一个人背叛,合作的人将受到最严厉的惩罚。在这种情况下,由于彼此不信任和追求自身利益,两个罪犯往往会选择背叛对方,最终导致双方都受到较严厉的惩罚。

类似地,穷徒困境博弈也可以应用于社会问题。例如,在资源稀缺的情况下,个体往往会争夺有限的资源,而忽视了共同合作的好处。这导致了资源的不均衡分配和社会的紧张局势。此外,在环境保护方面,个体自私地追求自己的利益,而不考虑整体的生态环境。这种短视的行为使得自然资源逐渐枯竭,给整个社会和人类带来长期的损害。

为了解决穷徒困境博弈带来的问题,我们需要建立信任和合作的机制。首先,教育是培养合作和社会责任感的关键。通过教育,人们能够意识到他人的需求和整体利益的重要性,从而减少自私行为的发生。其次,政府和机构应该制定相应的法律和政策,以保护公共利益和资源分配的公平性。最后,个体也应该自觉地超越短期的利益追求,考虑到长远的发展和整体利益。

博弈论中的“囚徒困境”模型

博弈论中的“囚徒困境”模型

目录

1.引言…………………………………………………………………...2-3

2.经典困境……………………………………………………………....3-6

2.1.“囚徒困境”模型的解说……………………………………...3-4

2.2.占优战略…………………………………………………….5-6

3.经济管理中的“囚徒困

境”……………………………………………..6-7

4.如何走出囚徒困境 (7)

4.1.摆脱困境的条件

4.2.摆脱困境的措施

5.结论 (8)

6.参考文献 (8)

博弈论中的“囚徒困境”模型

摘要

“囚徒困境”的例子虽然简单到用一页纸就可以写完,但却对20世纪后半叶的社会

科学产生了深远的影响。它是博弈论最经典,最著名的博弈模型之一,虽然讲的是一

个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,

可以揭示市场经济的根本缺陷。由此可见,本文介绍新析博弈论中的经典模型“囚徒

困境”,引入经济领域“囚徒困境” 的最常见的现实案例,给出了解决“囚徒困境” 的依据。

关键词:囚徒困境,博弈论,走出囚徒困境,占优战略

1.引言

1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希

尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境” (prisoner's dilemma )。

囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、

囚徒困境博弈论的启示

囚徒困境博弈论的启示

囚徒困境博弈论的启示

囚徒困境博弈论是博弈论中的一个经典模型,它揭示了在特定条件下,个体理性选择可能导致整体结果的恶化。这一理论对于我们理解人类行为和社会问题具有重要启示。本文将围绕囚徒困境博弈论展开讨论,探讨其启示对于社会和个体的影响。

囚徒困境博弈论告诉我们,个体的理性选择并不一定能够带来最优结果。在囚徒困境中,两名犯人面临选择合作或背叛的抉择。如果两人都选择合作,都会得到较轻的惩罚;而如果两人都选择背叛,都会得到较重的惩罚;如果一人选择合作,而另一人选择背叛,则背叛者得到最小的惩罚,而合作者则得到最大的惩罚。在这种情况下,个体的最优选择是背叛,但整体结果却是双方都受到了惩罚。

这个例子告诉我们,在某些情况下,个体的自私行为可能会导致整体利益的损失。在现实社会中,这种情况也经常出现。例如,资源共享问题。如果每个人都追求自己的最大利益,可能导致资源的过度消耗,最终损害整个社会的利益。因此,囚徒困境博弈论提醒我们要考虑整体利益,而不仅仅是个体利益。

囚徒困境博弈论还告诉我们,合作是一种有效的策略。在囚徒困境中,如果两人都选择合作,都能够得到较轻的惩罚。这表明,通过合作可以实现双赢的结果。在现实生活中,合作也是解决许多问题的有效途径。例如,国际间的合作可以促进共同发展;在企业内部,

团队合作可以提高工作效率;在家庭中,夫妻之间的合作可以增进感情和家庭和谐。因此,囚徒困境博弈论启示我们,通过合作可以实现更好的结果。

囚徒困境博弈论还提醒我们,信任是合作的基础。在囚徒困境中,如果两人都互相信任,都会选择合作,从而得到较轻的惩罚。但如果彼此不信任,可能会选择背叛,导致双方都受到较重的惩罚。在现实社会中,信任的建立也是关键。没有信任,合作是难以实现的。因此,囚徒困境博弈论启示我们,要建立互信的关系,才能实现合作的最佳效果。

博弈经典案例解析

博弈经典案例解析

案例结论
• 这个博弈论案例揭示了一个重要的道理:在博弈中,有时 候选择等待比主动行动更为有利。
03 斗鸡博弈
案例概述
两只公鸡在独木桥上相遇,每只公鸡 都有两种选择:继续前行或退后。如 果两只公鸡都选择前行,那么它们将 互相碰撞并损失惨重;如果一只公鸡 选择前行而另一只选择退后,那么前 行的公鸡将获得胜利;如果两只公鸡 都选择退后,那么它们都不会得到任 何好处。
VS
这个博弈的焦点在于两只公鸡都认为 对方会选择退后,从而都选择前行, 结果发生碰撞。
案例分析
在斗鸡博弈中,每只公鸡都有两个纯 策略:前行和退后。每个策略都有两 种可能的结果:胜利或失败。
这个博弈的启示是:在竞争激烈的环 境中,应该尽量避免采取过于冒险的 行动,因为这可能导致双方都遭受损 失。
这个博弈的纳什均衡是两只公鸡都选 择退后,但这是一个不稳定的状态, 因为任何一只公鸡的微小偏离都可能 导致整个系统崩溃。
案例分析
1
从个体理性角度出发,坦白是每个囚徒的最佳选 择,因为这样可以避免较重的刑罚。
2
但从集体理性角度出发,两人都不坦白才是最优 解,因为这样两人都可以只被判一年。
3
由于囚徒之间无法沟通,因此无法达成集体理性 的最优解。
案例结论
囚徒困境揭示了个人理性和集体理性之间的矛盾,以及沟通在合作中的重要性。 在现实生活中,类似的情况也经常出现,如市场竞争、国际关系等。

博弈论之囚徒困境

博弈论之囚徒困境

博弈论之囚徒困境

展开全文

商业社会犹如丛林,生存就是一场肉弱强食的战争。强敌环伺、资源有限,而你,是带枪的猎手?还是待宰的猎物?忍耐就是毁灭,强攻只会负伤。聪明的做法,就是通过降维打击的方式,去到一个由我们说了算的丛林!大家好,我是雷彬。今天给大家聊聊囚徒困境。

1950年,美国数学家阿尔伯特·塔克,为了向一群心理学家们解释博弈论,编了一个叫“囚徒困境”的故事:

两名囚徒A和B被隔离审讯。如果两人彼此背叛,都坦白罪行,会都被判刑8年;但如果一人坦白,一人不坦白,坦白的人直接释放,不坦白的重判15年。如果两人合作,都不坦白呢?会因为证据不足,都只判1年。

囚徒应该怎么做?显然,“都不坦白”是最优策略,两人判得最轻。知道“纳什均衡”你就会明白,“都不坦白”是经不起考验的最优策略:我如果单方选择背叛,将立即获释,诱惑太大;而且就算我守口如瓶,万一他背叛了呢?我会被判15年,风险太高。在利益驱使下,“都不坦白”不是稳定的纳什均衡。

“都坦白”呢?那两人都获刑8年。这时,如果一名囚徒单方决定守口如瓶,他的8年刑期将立刻变为15年,而另一人则被释放。这

一点好处都没有,两名囚徒如果是理性的,都不会这么干。“都坦白”,是囚徒困境中唯一稳定的“纳什均衡”。

“好的不均衡,坏的却稳定”的囚徒困境,成了博弈论中最经典的案例。但是,我今天的目的不是讲故事,而是深刻理解“囚徒困境”的博弈论原理,并找到破解方法。

到底什么是囚徒困境?一个典型的囚徒困境,用数学的语言表述,其实就是满足两个条件的博弈:

第一,背叛诱惑> 合作报酬。在这里,合作报酬是判刑1年,背叛诱惑却是立即释放。这将导致“都不坦白”不构成稳定的纳什均衡;

囚徒困境博弈论理解

囚徒困境博弈论理解

囚徒困境博弈论理解

囚徒困境是博弈论中常见的问题之一,描述了两个囚犯在被捕后面临的选择。如果两个囚犯都保持沉默,他们将各自被判入狱一年;如果一个囚犯认罪而另一个保持沉默,认罪者将被判入狱三年,而沉默者将被判入狱十年;如果两个囚犯都认罪,他们将各自被判入狱七年。

在囚徒困境中,每个囚犯都想要最小化自己的刑期,但他们的决策受到对方囚犯的影响。如果一个囚犯认为对方会保持沉默,他会选择认罪以获得更轻的刑期;如果他认为对方会认罪,他会选择保持沉默。

最优策略对于每个囚犯来说是认罪,因为无论对方选择什么,认罪的囚犯的刑期都不会更长。然而,如果两个囚犯都采取最优策略,结果将会是两个人都被判七年的重刑,而不是他们都只被判入狱一年的结局。

囚徒困境展示了在博弈中最优决策可能导致一个不利的结果。这表明,在某些情况下,合作可能是更好的选择,即使这意味着放弃一些自己的利益。在囚徒困境中,如果两个囚犯在交流中建立了信任关系并选择合作,他们可以避免受到严重的处罚。

- 1 -

博弈论经典案例分析

博弈论经典案例分析

博弈论经典案例分析

博弈论作为一门独立的学科,研究的是决策者之间的相互作用和冲突。在现实

生活中,博弈论的应用非常广泛,涉及到经济、政治、军事等各个领域。本文将通过分析几个经典的博弈案例,来深入了解博弈论的基本原理和应用。

首先,我们来看一个经典的零和博弈案例,囚徒困境。在这个案例中,两名犯

人被关押在不同的牢房,警察向他们提出交代对方的证词的选择。如果两人都选择沉默,则会被判处较轻的刑罚;如果其中一人选择交代对方,而另一人选择沉默,则沉默的人将被判处重刑,而交代对方的人将获得自由;如果两人都选择交代对方,那么两人都将被判处较重的刑罚。在这个案例中,每个人的最佳选择是交代对方,但如果两人都这样选择,结果将是最糟糕的。这个案例展示了在零和博弈中,即使每个人都追求自己的最佳利益,最终的结果可能并不理想。

接下来,我们来看一个非零和博弈案例,围棋。围棋是一种非零和博弈,即双

方的利益并不完全对立。在围棋中,双方玩家都追求自己的利益,但他们的行动会直接影响对手的利益。围棋的策略非常复杂,需要考虑到整个棋局的局势和对手的反应。在这种非零和博弈中,玩家需要不断调整自己的策略,以应对对手的变化。围棋案例展示了在非零和博弈中,双方玩家需要考虑到对方的利益,寻求最优的策略。

最后,我们来看一个混合博弈案例,竞价拍卖。竞价拍卖是一种混合博弈,既

包括合作又包括对抗。在竞价拍卖中,每个竞拍者都希望以最低的价格获得物品,但他们也需要考虑到其他竞拍者的行为。竞价拍卖的策略涉及到出价的时间、出价的金额等多个因素,竞拍者需要综合考虑这些因素来制定自己的策略。竞价拍卖案例展示了在混合博弈中,竞拍者需要在合作和对抗之间找到平衡,以获得最大的利益。

囚徒的困境基本原理

囚徒的困境基本原理

囚徒的困境基本原理

囚徒的困境是博弈论中的一个经典问题,常用于描述两个囚徒面临合作或背叛的抉择。其基本原理如下:

1. 存在两个犯罪嫌疑人(囚徒),他们被关押在不同的监狱中,无法交流。

2. 警方缺乏足够的证据定罪,但有部分证据足以定罪处以轻判,并提供了一个合作的机会。

3. 如果两个囚徒都合作,承认罪行,那么他们都将受到较轻的定罪,比如2年的监禁。

4. 如果一个囚徒选择合作,承认罪行,而另一个囚徒选择背叛,否认罪行,那么背叛的囚徒将被宣告无罪,而合作的囚徒将被判处10年的监禁。

5. 如果两个囚徒都选择背叛,否认罪行,那么他们都将受到较重的定罪,比如5年的监禁。

基于以上原理,囚徒面临着一个博弈的决策问题。每个囚徒必须考虑对方的选择,并权衡合作和背叛的后果。尽管合作对于两个囚徒来说是最佳选择,但由于彼此之间的不信任和个体利益的考虑,通常导致两个囚徒最终都选择背叛,从而导致

双方都受到更重的定罪。囚徒的困境反映了合作与背叛之间的紧张关系,并揭示了博弈中合作的困难之处。

囚徒困境博弈的主要内容

囚徒困境博弈的主要内容

囚徒困境博弈的主要内容

犯人囚徒困境博弈(Prisoner's Dilemma)是一种有名的博弈,

可以模拟个人决策制定者之间在互利冲突下的合作行为。它可以用来

模拟一对合作者被当局拘捕时出现的某种情形,每个人犯案后必须要

决定自己是否配合当局,在做出自己的决定前,另一方也未作出决定。该游戏被当局用来阻止两名同谋在一个弅濉局面下合作,但它们也可

以用来模拟竞争环境中的任何可能存在的冲突。在犯人囚徒困境博弈中,两个参与者有其各自的利益,但是两者之间有一个博弈格局——

如果两者都照着各自的利益去决定,就会出现比自己先思考那么一步

的损失,也就是说如果当事两方在决定之前没有得到双方的协商,他

们都是不会受益的。最终的结果,取决于参与者怎么决定,他们获得

的利益最大化,还是只有其中一方获得利益?

博弈论囚徒困境

博弈论囚徒困境

博弈论囚徒困境

博弈论囚徒困境

2.他们可以采取的行动 (actions)

或策略(strategies)

博弈(game)的要素

1.参与人或者局中人 (players )

3.局中人可能得到的赢利(payoffs)。

每个局中人的目标:最大化其赢利

每个人的赢利不仅取决于自己如何

“出招”,也取决于别人如何“出招”。

博弈无处不在

公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但如果每人都这样,则人人都吃亏。

如每个人都守规矩,则一个不守规矩的就会获得好处,每个人都不守规矩,则人人都失利。

囚徒困境的提出

囚徒困境是博弈论中的一种矛盾,反映个人最佳选择并非团体最佳

选择。现实中的市场竞争、政治角逐、情场争锋等方面会频繁出现这样的情况。1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关悖论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

合作(不坦白)?背叛(坦白)?

囚徒困境模型

警方逮捕甲、乙两名嫌疑犯,但没有足够证

据指控二人入罪。于是警方分开囚禁嫌疑犯,

分别和二人见面,并向双方提供以下相同的选

择:若一人认罪并作证检控对方(相关术语称

“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。若二人都互相检举(互相“背叛”),则二人同样判监2年。

-2,-2

0,-10

背叛

-10, 0

-0.5,-0.5

合作

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浅析博弈中的囚徒困境

班级:

姓名:

学号:

摘要:囚徒困境是博弈论的非零和博弈中具代表性的例子,个人最佳选择并非团体最佳选择,个人理性有时会导致集体的非理性——机关算尽却因而作茧自缚,这就是囚徒困境所反映的问题。

一经典的囚徒困境

“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人隐瞒,则揭发者因为立功而立即获释,隐瞒者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑三年。

从集体上看,他们应当互相合作,都隐瞒,这样总服刑时间最短(为2年)。但他们会仔细考虑对方可能采取什么样的选择,并从自身利益出发做出选择。他们会意识到,如果同伙隐瞒而自己背叛,就能使自身利益最大化(0年)。但他也意识到,他的同伙也不傻,也会这样来设想,这样的话,他就更不可能让同伙得利(服刑0年)而自己受害(服刑5年)所以结论就是,唯一正确的选择就是背叛同伙,把一切都告诉警方,如果他的同伙保持隐瞒,那么他就会是那个获释出狱,服刑0年。而如果他的同伙也向警方交代了,那么,他只需服刑3年而不是5年。所以结果只能是两个囚犯都坐牢服刑3年,而不是都服刑1年。所以对于他们个人来说都是理性的,然而对集体来说却是非理性的。

二重复多次

如果囚徒困境的情况重复多次,会有什么新的变化?假设重复10次。我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也会指控对方。相反,如果第一次相反,如果第一次别人保持隐瞒,建立了互信的关系,你也会保持隐瞒,导致最优。当然,两个囚徒都会有相似的想法,在第一局保持隐瞒,以期望建立互信关系,所以双方都会保持隐瞒。第二局时,双方亦应有相似的想法,继续保持隐瞒,以期继续在互信的情况下进行第三局,

以此类推。

直到第十局时,互信的关系明显是没有意义的,因为十局已经完结,囚徒没有必要为维持互信的关系而隐瞒(没有第十一局),所以第十局囚徒一定会背叛对方的,理由和单次囚徒困境一样。

问题是,既然双方都知道在第十局,对方都会背叛自己,那么在第九局保持隐瞒也是没有意义的,因为,保持隐瞒(友好关系)的原因是为了下一局对方继续保持隐瞒,所以第九局双方又都会背叛对方的。然后是第八局,明知第九局对方会背叛自己,所以第八局保持隐瞒也是没有意思的,第七局亦然,如此类推,结果是十局都会互相背叛,建立互信关系又是没有可能的。

但是随着重复次数的增加,最后一局的比重降低,而且得出“纳什均衡”需要的思考次数增多,双方都选择隐瞒的几率也随之上升。

所以在囚徒困境的局数较多或者不确定的情况下,出现互相隐瞒的结果几率较大。

三典型案例

生活中,经常会遇到各种各样的价格战,比如前些时间的打车软件血拼,再比如支付宝与微信支付的各种优惠,普遍的各种促销等等。这些价格战的受益者是消费者。在这里,我们可以认为价格战是一个囚徒困境,而且价格战的结果是谁都没多少钱赚。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果对消费者是有利的,但对厂商而言是不利的。竞争削价促销的结果或“纳什均衡”可能导致一个有效率的极低利润结局。

如果不采取价格战,每一个企业都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。事实上,完全竞争的均衡就是“纳什均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了低利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是反垄断的原因所在。

四如何走出囚徒困境

1.进行多次重复博弈

在第二节中提到,随着重复次数的增加,最后一局的比重降低,而且得出“纳什均衡”需要的思考次数增多,双方都选择隐瞒的几率也随之上升。比如,在公共汽车上,两个陌生人会为一个坐位争吵,而两个互相认识的人,就会相互谦让。对于任何一个参与者的任何一次背叛都会招致对方在下一次博弈时的报复,这就使得当前的背叛相对于整个未来的接触过程来说不是那么有诱惑力,于是参与者更倾向于选择合作的策略。实际上,在无限次重复博弈的情况下,合作可能是稳固的。无限次重复囚徒困境或者让局中人认为该博弈将重复无限次,这样的话人们会更加倾向于合作,于是,囚徒困境就有可能被破解。

2.进行信息沟通

博弈各方可以进行有效的信息沟通来达成某种协议,将博弈双方变成一个整体,使博弈各方通过合作走出“囚徒困境”,从而实现双赢或多赢。这便将各方由原先的对立关系转化为合作关系。在这个过程中,将个体理性,逐渐向集体理性的方向调整。

3.借助外力

引进外力,对不合作者进行惩罚,这样能极大增强博弈各方之间的信任,从而使合作得以形成。这种外力一方面可以是法律。另一种外力可以是道德。通过外力对某些不合作行为进行惩罚。自私不合作的人会面临严重的后果,这样就会促使人们走向合作,帮助人们走出囚徒困境。

相关文档
最新文档