博弈中的“嵌套问题”-修订版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈中的“嵌套问题”
Phybi
Math group
Humanity group
Carridon University
1.无间道-谍中谍
参见电影《无间道-I,II》,这个希望后来者详细分析.
2.剪刀石头布
二人A,B博弈,策略空间维数都为3,且两空间相等.我们令其元素剪刀石头布为{a,b,c}收益空间均为{胜,平,负},我们用{1,0,-1}表示.很容易写出A,B两人的收益函数.
开始出拳应该是随机的,之后双方都会观察对方的出拳套路,如果允许的思考时间足够长,则其中会出现“嵌套问题”,比如:前手A出两次剪刀,B出两次石头;A就会猜测对方可能继续出石头,以及B则猜测对方继续出剪刀,我们称这
两个个现象为一阶嵌套.考虑A的一阶嵌套,则描述一阶嵌套的公式为fA1=fA(B)B的二阶嵌套为fB2=fB(fA1)=fB(fA(B))
而更复杂的是,A猜测:B猜测自己(A)要出剪刀,它必然出石头,于是A采取出布的策略.我们称此为“二阶嵌套”.简而言之,一阶嵌套就是“A猜(B 猜A),并且根据B因其对A的猜想,做出的获胜测量,采取恰当策略获胜”.这是一个三阶嵌套,用公式表示为:fA3=fA(fB2)=f(fB(fA(B)))
为了更好地理解嵌套的概念,我们最后举例说明“三阶嵌套”.A猜测,B已经猜测到了A能猜到自己B猜测A的策略,即A将出布,则B将出剪刀,于是A采取出石头的策略期望获胜.用公式表示为fA(fB(fA(B))).此种嵌套理论上可以无限循环下去,但现实意义不大,特别是多因素下,过高阶的嵌套是无意义的.
我们可以认为,有应用价值的嵌套,应该不超过5阶.
3.贾贵-黑藤嵌套
在抗日情景喜剧《地下交通站》某集中,有这样一个剧情.敌人(日伪和日军)(简称D)获得八路军(简称B)的情报(在高庄开会),如果B不知道D知道(自己开会的消息),则D可以成功攻击B.然而贾贵在黑藤的授意下,在鼎香楼散布D攻击B的消息.最终野尻依然下令按原计划,贾贵说,这难道不会扑空吗?野尻的逻辑是,既然八路知道了敌人要攻击的消息,并且敌伪知道自己走漏了消息,比如会认为敌伪不会攻击,因而放松警惕,照常开会;如果这样,攻击就能成功.
然而,石青山猜到了野尻的这个逻辑,设下伏击,大获全胜.下面我们就用嵌套公式来描述这个过程.先看敌军方面,一阶:敌人知道八路军开会的消息:
fD1=fD(B),三阶:敌人知道八路军知道自己知道八路军要开会的消息:fD3=fD (fB(fD(B)))于是采取按原计划攻击的策略,以为能获得成功.
对于八路军B,二阶嵌套:八路军知道敌人知道自己要开会的消息:嵌套公式为fB2=fB(f1D)=fB(fD(B)),四阶嵌套,八路军知道敌人知道,八路军知道,敌人知道,八路军知道(攻击计划泄露),嵌套公式为fB4=fB(fD3)=fB(fD(fB(fD (B)))),即八路军敌人在fD3的嵌套公式下,会按计划攻击,所以设下伏击.
从上面的演算可知,二维博弈中,嵌套公式可以用AB相互的低阶嵌套公式递推.即:A的高阶基于B的次一低阶嵌套.反之亦然,即B的高阶基于A的次一低阶嵌套.所以,我们很容易写出任何阶数的嵌套公式.递推公式为:
fA N=fA(fB N-1)
以及:
fB N=fB(fA N-1)
-phybi嵌套公式-
此处还有一个需要讨论的是,二人博弈的嵌套问题中,我们需要设置一个起点,可以是A,也可以是B,但是现实的状况是,可能会有自然的,确定的一个起点,比如上述例子中,八路军开会的消息,就很自然地成为嵌套的起点.而剪刀石头布案例中,游戏双方都可以作为分析起点——他们是等价的.将嵌套理论应用于博弈论,我们不知道起点的选择,是否会对决策和收益产生影响,后继的研究,留给后来者吧!
尾论
基于本小研究,我们认为博弈论应该纳入一个新空间:信息空间.而“嵌套问题”的研究,是这个信息空间结构的重要组成部分.希望有兴趣的研究者继续.此外,本研究只考虑了信息空间,由信息空间映射的决策空间,也存在嵌套现象,其代数结构也留给后继者.
2020.07.10