博弈论(部分英文版翻译)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论(部分英文版翻译)
博弈论
托马斯·S.Ferguson/translator:·xly
第一部分:公平组合游戏
1.外卖游戏
1.1简单的外卖游戏1.2什么是组合游戏?1.3 P状态和N状态1.4游戏1.5相关练习
2.尼姆游戏初步分析尼姆和多堆尼姆游戏布顿理论证明守财奴版尼姆游戏相关练习
3.图形游戏有向图形游戏SG函数
相关例子的一般图的SG函数
4.组合游戏和N图游戏及SG定理的相关应用
与休息游戏相关的练习
5.硬币游戏的例子
二维空间中的硬币旋转游戏尼姆复杂的网格游戏练习
6.绿色哈肯布什竹竿
树木上的绿色哈肯布什
普通根图练习的绿色引导
参考材料
第一部分:公平组合游戏1。
外卖游戏
组合游戏是两人游戏。
如果有足够的条件,当一方不能继续经营时,游戏的结果就会出来。
这个游戏的结果取决于一系列的状态,包括初
始状态和准备操作的玩家。
游戏双方轮流操作,直到达到最终状态。
最终状态意味着该状态不能再运行。
此时,结果已经出现分歧。
这里有两个关于组合游戏的主要材料。
一部是康威的《论数字与游戏》,学术出版社1976年出版。
这本书介绍了这一领域的许多基本思想,加速了这一领域今天的发展。
另一本更适合这门课的参考书是学术出版社于1982年出版的两卷本平装本,书名是《柏林坎普、康威和盖伊的数学游戏制胜之道》。
这本书介绍了许多有趣的游戏,学习数学的本科生可以理解。
这些理论可以分为两类。
公平游戏指的是任何给定的状态,游戏双方要采取的行动是相同的。
另一方面,游击队游戏意味着给定一个状态,游戏双方将采取不同的行动。
例如,国际象棋是一种游击队游戏。
在第一部分,我们只研究“公平竞争”。
公平组合游戏的介绍可以在理查德·盖伊写的公平游戏中找到(发表在1989年的COMAP数学探索系列中)。
让我们从一个简单的例子开始。
1.1一个简单的外卖游戏。
这是这个公平组合游戏的一些规则(从一堆筹码中取一些):
(1)有两个玩家,我们分别将他们标记为1号和2号;(2)桌上有一堆筹码,总共21个筹码;
(3)一次操作可以取1、2、3个筹码,至少要取一个筹码,最多要取3个筹码。
(4)轮流进行,从玩家1开始;
(5)拿最后一个筹码的玩家赢(不能继续的玩家输)。
我们如何分析这个游戏?玩家有获胜的策略吗?你喜欢成为第一名还是第二名?这是个好决定吗?
我们将从最终状态到初始状态对游戏进行分析。
这种方法有时被称为逆向归纳法。
如果只剩下1、2或3个筹码,那么下一个玩家可以一次全部拿走并获胜。
假设还剩4份薯条。
那么下一个玩家肯定会留下1、2或3个筹码,然后他的对手会赢。
因此,四个筹码的状态对于下一个玩家是失败的,而对于前一个玩家是赢的。
如果还剩5、6或7个筹码,那么下一个玩家可以拿4个筹码赢。
如果还有8个筹码,下一个玩家肯定会留下5、6或7个筹码,这样前一个玩家就可以赢了。
这样,我们希望能够将状态改为0、4、8、12、16并获胜。
现在让我们来分析一下以下21份薯条的状况。
因为21不能除以4,所以我们先赢了。
唯一最好的办法就是先吃一份炸薯条,这样XXXX竞赛就成了一个正方形的棋盘。
表单,初始化为空。
玩家可以选择一个空方块,并在上面写下S或O。
谁先写连续的SOS,谁就赢了。
如果没人能写出来,那么这场比赛就是平局。
(a)假设n=4,首先在第一个正方形上写s。
证明最后一手会赢。
证明当n=7时,第一个玩家获胜。
证明n=XXXX提出了一个广义的尼姆对策和精致定理,称为
尼姆(k).尼姆(K)游戏基本上与尼姆游戏相同,只是必须在一次操作中从K堆筹码中取出筹码(给定K,并且必须从一堆筹码中取出至少一个筹码)。
当K=1时,这是尼姆游戏。
摩尔定理指出(x1,x2?当且仅当x1到xn是按位(二进制)时,xn)是p 状态
模(k+1)运算的结果是0。
(a)考虑练习3的灵活游戏,但稍有变化,即玩家每次操作时可以移动1。
或者左边两个硬币。
请注意,这实际上是尼姆(k)游戏,其中k=2。
用摩尔定理证明练习3的状态是n状态,并找到一种方法把它变成p状态。
证明摩尔定理。
考虑一下米莎游戏的最佳解决方案。
(我已经在这个问题上给出了证明,你可以问你需要什么。
)
3.图表游戏
我们现在将给出有向图游戏中组合游戏的等价描述。
这包括第1章和第2章中描述的游戏。
这可以通过用有向图的节点表示状态,用有向图的边表示操作来实现。
接下来,我们将定义一个名为SG(Sprague-Grundy)的函数,它包含比P和N状态更多的信息。
3.1有向图游戏。
让我们首先给出有向图的数学定义。
定义.有向图G可以表示为(x,f),x是一组非空节点(即状态);F是x(x∈X)的函数,X是X的子集。
对于给定的X,F(x)表示从状态X 开始可以到达的状态(称为X的追随者)。
如果F(x)为空,则x为最终状态。
两人游戏可以在地图上进行,从x0(初始状态)开始,并遵循以下规
则:(1)玩家1从x0开始;(2)双方轮流操作;
(3)当处于x状态时,执行操作的玩家将其改变为状态y∈f(x);(4)如果在玩家操作之前游戏已经达到其最终状态,则判定玩家已经失败。
根据定义,图形游戏不能在无限制操作期间停止。
为了避免这种情况和其他问题,我们现在考虑这样一个图:无论从哪个x0状态,都有一个与x0相关的整数n,因此从x0开始的每条路的长度小于或等于n。
这样一个图被称为[渐进有界]。
如果x是一个有限集合,这意味着在这个图中没有环(环就是这样一条路径,x0,x1?在xm中,x0=xm,m>3)。
例如,我们在1.1节中分析的差集博弈,S={1,2,3}是一个图形博弈的代表。
让X={0,1,?,n}是状态集。
空堆是最终状态,所以F(0)是空集。
类似地,F(1)={0},F(2)={0,1 };2x}时。
事实上,这是一个非常愚蠢的游戏。
第一只手可以在第一次手术中拿走所有的薯条!计算SG函数有什么用?
这个问题将在下一章回答。
如果游戏考虑的是n堆而不是1堆的情况,那么游戏就不那么简单了。
下一章将要讨论的定理将告诉我们如何将nim-加法与SG函数相结合来解决多桩问题。
3.4更一般的SG功能。
让我们暂时看一下当图不再渐进有界或包含环时的问题。
首先,让我们假设渐进有界条件放宽到渐进有限(每条路都是有限长度)。
这个条件相当于我们所说的组合游戏的条件(6)(第1.2节)。
图中仍不允许出现环。
让我们举一个例子,它是进步的,而不是进步的。
这是一个渐进的有限图表,因为游戏将在有限的操作次数后结束。
然而,它不是一个渐进有界图,因为不是每条路的长度一开始就能知道它的上限。