极大极小原理

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

极大极小原理

1在“假设发生如下事情”之前,祝福我们此生永不发生这类事情。

假设你外出时,遭遇绑架,该怎么办?有一位(国外的)自卫专家,给出了三个应对原则:1、不要跟他去第二个地点。如果你心怀侥幸,他可能将你带到偏僻的地方,为所欲为,甚至下毒手,然后掩藏他的罪恶痕迹。2、记住,他在撒谎。不管坏人说多好听,别相信。这位专家的观点是:

从一开始,每个谋杀犯,绑架犯,强奸犯,

他们都会用同一句话:“照我说的做,我就不

会伤害你。”然而,一旦你照他们说的做,最

后受伤最深的,还是你。

3、要在原地,用尽一切手段与之搏斗。这一点似乎有点儿让人疑惑,万一受伤呢?被人用刀抵住,拼命挣扎要是不幸丢了命,岂非不识时务?

然而,这位专家的洞见是:如果他们想在原地杀你,你早就已经死了。

所以:

•他们不想在原地杀你,他们希望带你去其他地方,或者先干点别的事。

•通过打乱他们的计划,你会成为他们最恐怖的噩梦。

•如果他们不想被抓,不想把事搞得太麻烦,他们可能就会直接逃跑了。

以上三点原则的所有原因,其实只有一个:

如果你进了他的车,或者跟着他们去了某个地方,你死定了。(以上经验仅供参考,不构成本文作者对遇到绑架的具体建议。)2以上是一个生动的博弈场景。由此引出我的一句“大脑碎片”:好的一手棋,是其令对手有不好的下一手,以及自己有好的下下一手

棋。我们姑且不讨论,在第1节里,专家应对绑架的三点原则的适用范围,以及如何根据情境调整策略。

本文的焦点是:

极大极小原理。绑架,是一场零和博弈。就像下棋,一个人赢,一个人输,即使和棋,也只是暂时的平静。双方没有合作的可能。对于这类博弈,冯·诺依曼提出了“极小极大原理”。《囚徒的困境》一书,用我们熟悉的分蛋糕来示例。

众所周知,公平的分法是:一个人切,一个人选。假如两个孩子都不是孔融,并且都想吃更多蛋糕,这其实是一个典型的零和博弈。

•第一个孩子(切蛋糕那个)的两个策略是:不均分和尽可能均分。

•第二个孩子(挑蛋糕那个)也有两个策略:选较大的那一块或选较小的那一块。

如下图。(请注意,表格里的4个结果,都是指切蛋糕的孩子的所得收益。)

切蛋糕的孩子貌似掌握了主动权,但他决策的关键点,取决于“然后呢?”--即对手的下一步会怎么做。显然,挑蛋糕的孩子,会追求让自己的蛋糕最大化,也就是让对手的蛋糕最小化。对应上面的表格,挑蛋糕的孩子总是会选左边一列,从而导致切蛋糕的得到左边一列的两个较小蛋糕的结果。于是切蛋糕的孩子要做的事情,就是:让挑蛋糕的孩子将要留给他的量小的那半块蛋糕极大化。因此,切蛋糕的孩子只能选择尽量均分蛋糕,以保证获得差不多的半块蛋糕。这个量,是行中极小值的极大值,被称为“极大极小”。也许有人会说,这么简单的道理,为什么要说这么啰嗦?德谟克利特早在公元前300多年前,就创立了“原子论”,认为每一种事物都是由原子所组成的。然而,这只是一种想法。

对比而言,爱因斯坦对原子的理解,才算是科学。

二者之间的区别在于:后者可实验,可计算,可运用。作为博弈论的创始人,冯·诺依曼说过:没有极小极大定理,就没有博弈论。《囚徒的困境》一书对极小极大定理总结道:

•在两个利益完全相反的人之间出现的有精确定义的冲突,总存在一种理性的解;

•所谓理性的解,就是在给定冲突性质的前提下,双方都确信他们不可能期望有更好的结果了。

3让我们回到绑架现场。即使被绑架者非常被动,但这仍然是一场博弈。要理解这一点,我们需要强调三个名词:

1、回合;

2、节点;

3、选择权。

回合

许多事情,都是连续决策的结果。

而零和博弈,是敌我双方轮流决策,由一个一个的回合叠加起来。

节点

上述每个回合,你都有一个属于自己的决策节点。然而,很多人要么忽视了节点,要么放弃了节点。选择权

在每个回合的决策节点,你其实是在做一个选择。

你有选择权,对手也有选择权。

敌我双方都试图让自己的选择收益最大化,让对方的收益最小化。

当你被绑架的时候,对手已经出招,现在轮到你走棋了。

(再次强调,本文不构成对绑架情境的具体实战建议。)你仍然有选择权:1、放弃抵抗,上对方的车;

2、大声呼救,拼命反抗。这个时候,大多数人会想,我抵抗的话,会有什么后果:

•会受伤吗?

•会激怒对方导致生命危险吗?

然而,从博弈思维来看,你仅仅纠结于当下的一步棋去想,毫无意义。

你应该去想:

我如果这样做,对手会如何回应呢?再然后我又该如何应对他的回应呢?

也就是说:

•你要计算下一步,以及下下一步。

•然后,再由此倒推,你现在这一步该如何做选择。

我将本文开头那个专家描述的场景图示如下:

如果“你”乖乖上了绑匪的车,如上图左分支(选择1)所示,可能导致如下结果:1、在第四个回合,你已经失去了选择权;

2、对手可以自由选择让自己利益最大化的做法;

3、绑架的许多目的是为了钱财,有些歹徒会先撕票再要钱;

4、未经核实的数据是,撕票比例高达10%;

5、据某地警方的经验,越是熟人绑架,撕票的可能性越高。所以,处在第二回合的“我”,要考虑的是,第三回合的对手会怎么做,以及自己会有怎样的第四回合。

《囚徒的困境》引用了卡尔维诺在《寒冬夜行人》一书中的一句话:“你知道,你所能期盼的最好结果就是避免最坏情况。”这句话,很好地说明了极小极大原理。还记得本文开头专家的第二条建议吗?记住,他在撒谎。从一开始,每个谋杀犯,绑架犯,强奸犯,他们都会用同一句话:“照我说的做,我就不会伤害你。”可是,如果罪犯真的不会伤害你,那么你反抗的时候他也不会伤害你。而且,即使起初罪犯没有太想伤害你,但是当你失去选择权的时候,他可能会萌发

相关文档
最新文档