爱情的“囚徒困境”学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
爱情的“囚徒困境”学
恋人,既是你的合作伙伴,也是你的对手,甚至敌人。在恋爱的这场不太好玩的“游戏”中,谁能熟练地驾御游戏或博弈规则,谁就是爱情的赢家。所以,要想成为赢家,就要学会与伙伴一样的恋人合作,还要学会与敌人一样的恋人周旋。
面对对手围追堵截的爱情围剿,要学会闪转腾挪的诸多反围剿的手段。实在不行了,再三十六计走为上:对不起,不陪你“玩”了!
几乎所有的博弈论书籍,都从经典的囚徒困境说起。虽然那是说一对纵火犯的,但其原理也照样适用于“纵火犯”。
本来也就是一场大火嘛。还是让我们看看纵火犯吧。在此,不能不引述一下“囚徒困境”的案,尽管众所周知。需要说明,公案的版本不一样,但道理是一样的。
一场火灾之后,两个嫌疑人A和B被囚禁,分别关在两个独立的不能互通信
的房间里。如果两人都承认,则各被扣留8年;如果一人承认另一人不承认,承认放走,并且得到奖赏,不承认的被扣留16年,并且被罚款;如果两人都不承认则证据不足各被扣留1年。
我们看到,假定A选择承认的话,B最好是选择承认,否则就要被严重处罚;假定A选择否认的话,B最好还是选择承认,因为这样不仅可以被放走,而且还可得到奖金。就是说,不管A什么态度,B的最佳选择都是承认。反过来,同样地,不管B什么态度,A的最佳选择也是承认。
结果,两个人都会选择承认。这就是有名的“囚徒困境”,所反映的问题是个人理性和集体理性的矛盾理性告诉被实验者,谁选择抵赖,谁就可能会大倒其霉,而对方却逍遥自在,受奖励。所以,这就出现了一个悖论,有时对同伙的忠诚,往往会把自己送上绝境,除非双方都能100%的忠诚,但,这是不可能的,谁能在巨大的利益诱惑面前永不动心呢?
恋人,也类似于走入了囚徒困境。如果双方都不变心,那是最好的局,在天愿为比翼鸟,在地愿为连理枝嘛;如果都变了心,效果也不坏,你走你的阳关道,我过我的独木桥嘛;如果一方变了心,另外找到了更好的情侣,一方却还乎乎地
忠贞不二,那么,另觅新欢的一方是最幸福的,比两人都不变心的结果还幸福,因为他找见了更好的情人,而被抛弃的一方是最不幸的,比两人都变心的结果更不幸,因为他承担的压力既来自于对方的太幸福,也来自于自己的太不幸福。
按照囚徒困境的分析结论,恋人最得意的选择是另觅新欢,最天真的选择天荒地老,最理性的选择是分道扬镳,最糟糕的选择是被另有新欢的对方无情弃。问题是,最得意的结局过于缺德,最天真的结局过于虚幻,最理性的结局过于残酷,最糟糕的结局又(让一方)过于心痛。
当然,囚徒困境模型给恋人最重要的提醒,是在应对策略上,最好要严格防范对方,就像一个囚徒防范另一个囚徒一样。但是,反关现实中的恋人,大都希望能够天荒地老,没有谁愿意回头是岸,甚至被对方抛弃了还不死心。
为什么会这样呢?因为恋人与纵火犯,其博弈状况有一个重大的不同。纵火犯被警方抓住之后,是隔离审查,因此无法订立功守同盟,即便能够订立,谁又能保证自己或对方永远不毁约呢?注意!这是囚徒困境模型的一个非常重要的条件,它往往被一些经济学家忽视了。
与纵火犯所处的这个重要条件相反,恋人被爱神抓住以后,一般并不是隔离
“审查”的,而是整天泡在一起。泡在一起做什么?除了发誓,还是发誓!人生发誓最多的时期,大概就是恋爱期。发什么誓呢?无非是什么非你不娶非你不嫁你是风儿我是沙啊的一类誓言罢了,目的只有一个,就是让对方相信自己能够天荒地老而此情不渝。他们希望彼此忠诚,从而换来一个好的博弈结果。
而且,为了防止对方变心,总要设法让对方相信,你遇到我是你三生有幸,而我遇到你也是万世不毁。
可是,世间没有什么誓约是永恒的。很多爱情的悲剧,往往都从背弃誓约开始,而天下又似乎没有没有誓约的爱情。
这是整天泡在一起的恋人的博弈情形。而对于天各一方的恋人来说,彼此就像被隔离审查的纵火犯一样,只不过不是被关在两间牢房,而是山高水阔知何处。按照博弈原则,他们除了违背誓约外,没有更好的选择。他们要想在恋爱中成为赢家,最好是不遵守爱的诺言,如此才能走出“囚徒困境”。
然而,这个结论在实际上是有问题的。因为,生活中恋爱成功的人并不少见,厮守一生一世的人也不少见,不能说他们都是勉强的。事实上,他们有的还的确生活得很幸福。
我相信,多数情侣的爱情生活过得还是可以的。那么,究竟是什么机制让他们能够信守誓约呢?
我一直在思考这个问题,但顺着博弈论的思路走下去,每次得出的答案似乎总与道德伦理有千丝万缕的联系。后来,偶尔看到一个试验,我猛然感到峰回路转林断山明了。
原来,存在于现实中的幸福的爱情生活,也可以从博弈论中找到答案。这应该感谢美国密西根大学的罗伯特?爱克斯罗德。他组织过一场计算机竞赛的试验。竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色,他们开始玩“囚徒困境”的游戏,每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次,这就是所谓的“重复的囚徒困境”,于是这就更逼真地反映了日常人际关系。这又是一个值得注意的条件,最简单的囚徒困境模型说的是一次性博弈,正是这一点加剧了囚徒做处坦白的决心。这正像不相识的一对男女,偶尔在旅游中相遇,接着在宾馆里春梦一场,第二天就各自扬长而去,谁也不会忠于谁的,彼此也不会为对方今后的不忠实而又任何不快,原因就在于这是一次性的博弈
(一次性的“博弈”和一次“性的博弈)。可是,如果男女双方互相认识,且今后还要常常碰面,那么他们彼此的忠心就会又不同程度的增加,原因在于他们还有机会重复博弈。
试验的结果使爱克斯罗德大为吃惊,因为竞赛的冠军获得者所采取的策略一点都不高深,而是非常简单:一报还一报。中国人把它叫做“以其人之道,还治其人之身”。
说穿了,所谓“一报还一报”的策略,就是胡萝卜加大棒的原则。它坚持永远不首先背叛对方,因此是十分“善意的”。它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。正所谓“人不犯我,我不犯人;人若犯我,我必犯人”。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是“简单明了的”。
后来,爱克斯罗德邀请了更多的人参加竞赛,结果试验来试验去,每次都是一报还一报者夺魁。