取子游戏_博弈简单分析
博弈论取石子问题
博弈论取石子问题
博弈论取石子问题是一类经典的博弈问题,也被称为Nim游戏。
这个问题一般描述为:有一堆石子,两名玩家轮流从中取出若干个石子,每次取石子的数量有限制(例如,每次最多只能取1个或者2个),最终取光所有石子的玩家获胜。
在这个问题中,两位玩家都采取最优策略,并且可以假设每位玩家都会尽力阻止对方获胜。
这样,对于每一轮的取石子操作,可以通过数学的方法来判断哪位玩家有必胜策略。
一般来说,博弈论取石子问题可以通过异或运算来求解。
具体思路如下:
1. 通过异或运算计算出所有石子数量的异或和。
2. 如果异或和为0,表示当前状态下无论怎么取石子,都无法保证必胜,此时当前玩家必输。
3. 如果异或和不为0,表示当前状态下存在某种取法,可以保证必胜。
具体的取法是找到最高位上的1,然后将某一堆石子数量减去该最高位1的数量,使得新的异或和为0。
通过上述思路,可以快速计算出哪位玩家具有必胜策略。
当然,如果可以通过编程的方式来模拟和计算,会更加直观和方便。
博弈之取石子经典游戏
由poj 1067引发的——取石子游戏【转自各类博弈】(2011-07-25 23:46:54)[编辑][删除]分类:编程道路~标签:杂谈上次做poj 1067的取石子游戏,只用到了whthoff博弈,未涉及到取石子的异或方法,今天重新搜索,整理了一遍。
搜罗各种资料,加上自己整理,终于成篇啦!……噼里啪啦取石子问题有一种很有意思的游戏,就是有物体若干堆,可以是火柴棍或是围棋子等等均可。
两个人轮流从堆中取物体若干,规定最后取光物体者取胜。
这是我国民间很古老的一个游戏,别看这游戏极其简单,却蕴含着深刻的数学原理。
下面我们来分析一下要如何才能够取胜。
(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。
最后取光者得胜。
显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。
因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。
总之,要保持给对手留下(m+1)的倍数,就能最后获胜。
即,若n=k*(m+1),则后取着胜,反之,存在先取者获胜的取法。
n%(m+1)==0. 先取者必败。
这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。
从一堆100个石子中取石子,最后取完的胜。
(二)威佐夫博奕(Wythoff Game):有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。
这种情况下是颇为复杂的。
我们用(ak,bk)(ak ≤ bk ,k=0,1,2,...,n)表示两堆物品的数量并称其为局势,如果甲面对(0,0),那么甲已经输了,这种局势我们称为奇异局势。
组合游戏
所有的结束位置都是P位置; 从任意一个N位置出发,通过一步一定能到达某个P位 置。 从任意一个P位置出发,只移动一步所到达的只能是N 位置。
减法游戏-定义
用s表示一个正整数构成的集合,基于S所定义的 减法游戏可以描述如下: 有一个由n个石子组成 的石子堆,两名玩家轮流从中拿走石子,每次拿 走石子的个数只能是集合S中的数。拿走最后一 枚石子的玩家获胜。
Misère-Nim-解
当有两个或两个以上的堆中包含的石子数目大于1时:由于两个 人都不可能一下把多个石子数大于1的堆变为没有大于1 的堆, 所以肯定会有一个人拿玩石子后,只剩下一个大小大于1的堆, 这时下一个要拿石子的人将获胜。可以发现,只有一堆石子数目 大于1的时候,Nim-Sum肯定不为0,所以如果初始状态下的NimSum为0,那么先手必败,否则先手必胜。证明的思路是:如果 Nim-Sum为0,那么下一个人不论怎样拿,只要按照规则,一定 会使Nim-Sum不为0;如果Nim-Sum不为0,下一个人一定有一种 拿石子的方法可以让Nim-Sum变成0。
减法游戏-例
例:S = {1, 3, 4},如果在游戏的开始有100枚 石子,那么哪个玩家获胜?
减法游戏-例
使用向后归纳的方法,可以计算出游戏的P位置 和N位置如下: X: 0 1 2 3 4 ... Position: P N P N N N N P N P N ... N N 5 6 7 8 9 10 11 12
P位置和N位置的计算
在普通博弈游戏(Misère游戏类似)中,P位置 和N位置的计算方法如下:
把所有的结束位置标记为P位置; 把能够一步移动到P位置的位置标记为N位置; 把通过一步只能移动到N位置的位置标记为P位置; 如果在上一步没有位置被标记为P位置,算法结束; 否则,转到第二步。
博弈论入门-取石子游戏
博弈论⼊门-取⽯⼦游戏
引导游戏
1. 玩家:2⼈
2. 道具:23张扑克牌
3. 规则: - 游戏双⽅轮流取牌 - 每⼈每次仅限于取1张、2张或3张 - 扑克牌取光,则游戏结束 - 最后取牌的⼀⽅为赢家。
什么是组合游戏?
- 有两个玩家 - 游戏的操作状态是⼀个有限的集合(⽐如:限定⼤⼩的棋盘) - 游戏双⽅轮流操作 - 双⽅的每次操作必须符合游戏规定 - 当以放不能将游戏继续进⾏时,游戏结束,同时,对⽅为获胜⽅ - ⽆论如何操作,游戏总能在有限次操作后结束
概念:必胜点N和必败点P
必胜点(N):下⼀个选⼿将取胜的位置称为必胜点。
必败点(P):前⼀个选⼿将取胜的位置称为必败点。
必胜点N和必败点P属性:
- 所有终结点时必败点P - 从任何必胜点操作,⾄少有⼀种⽅法可以进⼊必败点 - ⽆论如何操作,从必败点都只能进⼊必胜点
取⼦游戏算法实现:
- 步骤⼀:将所有终结位置标记为必败点 - 步骤⼆:将所有⼀步操作能进⼊必败点的位置标记为必胜点 - 步骤三:如果从某个点开始的所有⼀步操作都只能进⼊必胜点,则将该店标记为必败点 - 步骤四:如果在步骤三未能找到新的必败点,则算法终⽌,否则返回步骤⼆。
-
栗⼦:
set:1 3 4
x:0 1 2 3 4 5 6 7 8 9 10 11 12 13
k:p n p n n n n p n p n n n n。
取石子游戏
从三道例题来看一类常见博弈问题的思维方法。
长郡中学金恺在博弈问题中,有一类最为一般与常见,概括来说满足4个基本要点:1、双人轮流取子,输赢只与当前的局面有关,而与之前怎么取的无关;2、取子的方法可以是多种不同的取法相结合。
13、某个人无法按规则取了就算输——即没有后继状态的状态为败局;4、石子越取越少,或者存在某种特殊的性质,使得状态不可能出现循环——状态存在拓扑顺序,能够采用递推的方法解决(但效率不高,因为没有利用走棋规则的特点);对于这类博弈题,我们往往希望根据走棋特点找到一种简单的性质,然后根据这个性质将Array所有状态进行划分:即将所有状态分为两部分W、L,满足性质A的状态划到集合L,不满足性质A的状态划到集合W:对于集合L中的状态l,证明l的后继状态都在W中;对于集合W中的状态w,证明w至少有一个后继在L中。
则W中的所有状态都是胜局,L中的所有状态都是败局。
对于输入的一个状态,只要判断它是否满足性质A即可以知道它是胜是败。
但是性质A可能非常隐蔽、复杂,要找到性质A可能却要花费很多时间和心智。
这类问题由于取子方法有很多很多,所以没有约定俗成的公式2。
抓住取子方法的特点、周密深入的分析、找到问题的本质是解决这类问题的最直接的办法。
在很多情况下,找规律也是一个不错的选择,因为大多数情况下性质A的形式是非常简单的(这正体现了数学中简单即美的最高境界),往往可以通过观察+猜想找到正确的结果。
而一旦找到了某个性质A对于小数据都成立(可用程序检测),那么用归纳法证明是比较简单的。
本文就通过几个例子,来探索解决这类问题的思维方法。
问题1:取火柴游戏题目来源:姚金宇原创题目描述:有三堆火材,分别为a,b,c根。
有两个人在做如下游戏:游戏者任意拿走其中一堆火柴,再在剩下的两堆里任取一堆任意分成两堆(每堆至少1根)。
两人轮流如此,谁无法这样做就算输了。
输入格式:有n组数据:每一行三个数a,b,c,满足1≤a,b,c≤1,000,000,000。
若干取石子问题
若⼲取⽯⼦问题⼏道取⽯⼦游戏【前⾔】取⽯⼦游戏是⼀类经典的博弈问题,也是博弈问题SG函数的基础所在。
⽽它也具有⼀般博弈题的思维难度较⼤、编程量⼩等特点,因此在⽐赛时的得分情况往往呈现出两边倒的情况。
⽽其游戏的结论却经常是浅显易懂但⼜难以捉摸的,往往在⽐赛结束后,经过别⼈的⼏句话就使⼈恍然⼤悟。
本⽂将对⼏道取⽯⼦的游戏进⾏讨论,并分析思维的过程,希望读者能从中获益。
⾸先我们先来回顾⼀下最原始的取⽯⼦游戏。
即:有N堆⽯⼦,每次可以从任意⼀堆中取出若⼲⽯⼦,不能不取,两⼈轮流⾏动,最先⽆⽯⼦可取的⼈输。
⽽解决此题的⽅法便是把这N堆⽯⼦的个数进⾏异或操作,得到的值为0即为先⼿必败,否则先⼿必胜。
关于这⼀问题可以参考相关⽂献。
但仅仅靠这个模型并不能满⾜我们的要求,⾯对⼀些进⾏过变形的题⽬需要我们灵活运⽤。
下⾯我们先来看⼀个例题。
【例题1】POIXVI Stage I Pebbles题⽬⼤意:有N堆⽯⼦,开始时⽯⼦个数为A1,A2…A N。
(从左到右编号)并满⾜A1≤A2≤…≤A N,即⽯⼦个数为⾮递减数列。
两⼈轮流取⽯⼦,每次可以在任意⼀堆中取任意多个,不能不取,并且必须保证每次取完后的⽯⼦个数仍为⾮递减。
最先不能取的输。
问题分析:很显然,这道题在普通的取⽯⼦游戏上加了⼀个限制,即必须保持⽯⼦数为⾮递减数列。
这样我们便不能直接⽤原来的性质,⽽状态数也⾮常⼤,只能考虑通过⼀步步分析把问题转化。
⾸先,我们先来研究⼀些简单的情况:显然N=1时先⼿必胜。
⽽N=2时,可以发现当A1= A2时,先⼿必败,因为此时先⼿不能取A2的⽯⼦,只能在A1中取x个⽯⼦。
⽽后⼿者只需跟随先⼿者,同样在A2中取出x个即可满⾜保持A1’= A2’。
当A1< A2时,则先⼿可以从A2中取⾛A2- A1个⽯⼦。
因此先⼿必胜。
经过这个简单的分析,我们可以感觉到,由于要保证⾮递减的性质,在相邻的两堆中,可能经常会有类似N=2时的博弈发⽣。
取石子问题
取石子问题有一种很有意思的游戏,就是有物体若干堆,可以是火柴棍或是围棋子等等均可。
两个人轮流从堆中取物体若干,规定最后取光物体者取胜。
这是我国民间很古老的一个游戏,别看这游戏极其简单,却蕴含着深刻的数学原理。
下面我们来分析一下要如何才能够取胜。
(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。
最后取光者得胜。
显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。
因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。
总之,要保持给对手留下(m+1)的倍数,就能最后获胜。
这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。
(二)威佐夫博奕(Wythoff Game):有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。
这种情况下是颇为复杂的。
我们用(ak,bk)(ak ≤ bk ,k=0,1,2,...,n)表示两堆物品的数量并称其为局势,如果甲面对(0,0),那么甲已经输了,这种局势我们称为奇异局势。
前几个奇异局势是:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,15)、(11,18)、(12,20)。
可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而bk= ak + k,奇异局势有如下三条性质:1。
任何自然数都包含在一个且仅有一个奇异局势中。
由于ak是未在前面出现过的最小自然数,所以有ak > ak-1 ,而bk= ak + k > ak-1 + k -1 = bk-1 > ak-1 。
取石子游戏
取石子游戏简介取石子游戏是一种古老且经典的游戏,通常在孩子们之间进行。
这个游戏的目标是通过每一步的策略来获得尽可能多的石子。
在这个游戏中,两个玩家轮流从一堆石子中取出石子,每次取的数量可以是任意正整数,但不能超过规定的最大值。
最后,拿到最多石子的一方将获胜。
游戏规则1.游戏开始时,准备一堆石子。
这种游戏一般使用小石子或棋子来代表石子。
2.两个玩家轮流进行操作,根据规定的规则取石子。
3.每一步,玩家可以从堆中取出任意数量的石子,但不能超过规定的最大值。
4.游戏继续直到没有石子可供取出。
5.最后,拿到最多石子的一方将获胜。
游戏策略在取石子游戏中,玩家之间进行的是一种全信息博弈。
这意味着玩家可以完全了解整个游戏状态,包括对手的策略和目标。
因此,玩家可以通过一定的策略来优化自己的收益。
基本策略保证胜利的策略如果游戏的规则允许,玩家可以通过以下策略保证胜利:1.规定每次取石子的数量为1个,那么先手的玩家总是可以取到最后一个石子,从而获胜。
2.如果规定每次取石子的数量有上限,而且堆中的石子数量是该上限的倍数加1,那么先手的玩家总是可以通过合理的策略来使得每一步的石子数量维持在上限倍数上,从而保证最后一个石子留给对方。
最优策略对于一般的取石子游戏,玩家可以通过数学方法找到最优策略。
最佳策略取决于堆中石子的数量和规定的最大取石子数量。
例如,假设堆中有13个石子,规定一次最多取5个石子。
通过计算,可以得出以下最佳策略:•如果堆中石子数量是5的倍数加1,先手的玩家会输。
•如果堆中石子数量是5的倍数,先手的玩家会赢。
通过数学分析,可以得出结论:对于先手玩家,在石子数量是(m×n+1)的情况下,先手玩家会输;在石子数量是m×n的情况下,先手玩家会赢。
其中m和n是任意正整数,n是规定的规则中每一次最大取石子的数量。
取石子游戏的变种取石子游戏有许多变种,可以根据玩家的喜好和游戏的目标来选择。
Nim游戏在Nim游戏中,有几堆石子,两个玩家轮流进行操作,每次可以从一堆石子中取出任意数量的石子。
智猪博弈破解方法
智猪博弈破解方法智猪博弈,又称“狼杀”,是一款两人轮流落子的抽象游戏,由日本游戏设计师仲田利三郎于2001年发表。
游戏规则简单,但谁能获胜却非常难解,是一个传统算法研究中的复杂问题。
智猪博弈所使用的棋盘由6行6列共36个格子组成,分成两个半边,每一行三个格子,每一列也有三个格子,其中包括四个角落格子。
每局游戏双方轮流在棋盘上落子,每次只能落一子,棋子可以落到任何没有其他棋子的格子上,谁落子形成6个棋子组成的连珠(即垂直、水平、斜对角的三种),谁就获胜。
解决智猪博弈的破解方法主要有三种:第一种方法是使用搜索树表示和维护游戏状态,其目的是构建给定的游戏状态的搜索树,然后根据其可行走的走子方式进行估值,并根据估值构建最佳下棋方案。
其次是使用全局搜索,通过使用一组全局搜索计算机程序来计算游戏胜负,这些计算机程序将当前棋盘状态表示为一个字符串,然后将其反复传递给评估函数,该函数从全局角度合理地评估当前游戏状态,并生成最优解。
最后是使用进化算法,这种算法引入了一种模拟进化的方式,模拟进化正好比算法更符合真实世界情况,它能有效处理复杂和非凸问题,为游戏找到最优解。
通过以上三种方法,可以很好地破解智猪博弈,使用不同的解决方法可以尽可能地预测和解决智猪博弈的落脚点,优化棋手的落子思路,有效提高游戏获胜的机会。
总的来说,智猪博弈是一种非常有趣的棋盘游戏,它同时也是一个非常困难的传统算法研究问题。
破解这个游戏的破解方法多种多样,不仅可以通过构建搜索树和使用全局搜索计算机程序来计算给定游戏状态的估值,还能够使用进化算法来探究、求解智猪博弈中复杂性与神秘性背后的规律。
破解智猪博弈非常有趣,人类可以通过合理的计算机算法与解决方案来预测、模拟这款游戏,以获取最佳结果。
组合博弈 取石子游戏.
博弈问题分析——取石子游戏实例解答<1>小红是个游戏迷,他和小蓝一起玩拿石子游戏。
游戏规则为2个人轮流拿石子。
一次可以拿1颗或3颗,规定谁取到最后一颗石子谁就胜出。
最后决定由小红先取。
两人都是游戏高手,该赢的绝不会输(表示不会失误)。
问在知道石子总数的情况下,怎样快速预测谁将会胜出。
分析:小红和小蓝各取一次共有三种情况:②共取走2颗石子(1,1)② 共取走4颗石子(1,3)③ 共取走6颗石子(3,3)设方案①取了N1次,方案②取了N2次,方案③取了N3次后,还剩下K(k<6,否则可以再取几轮,导致剩余量<6)个石子。
最后K的取值有三种情况:0,1,3。
这个要解释一下:剩下的石子个数总共有0,1,2,3,4,5几种可能,2可以再取一轮(1,1)剩下0,4可以再取一轮(1,3)或者两次(1,1)剩下0,5可以再取(1,1)、(1,3)等的组合剩下1或3个,所以综合是最终会剩下0、1、3三种可能。
设有石子S.则S=2*N1+4*N2+6*N3+K.其中2*N1+4*N2+6*N3=(1+1)*N1+(1+3)*N2+(3+3)*N3,说明取的过程为偶数次,所以剩下K时该最先取石子的人取。
K=1,3则先取方胜。
反之,另一方胜。
又2*N1+4*N2+6*N3=2*(N1+2*N2+3*N3)为偶数,所以S的奇偶性取决于K,当K为偶数时,后取方胜,反之,先取方胜。
总结:计算时可以先对6取余,如果余数为0、2、4,则K为0(偶数,后取者胜),如果余数为1、3、5则K为1或3(奇数,先取者剩)。
<2>有一种很有意思的游戏,就是有物体若干堆,可以是火柴棍或是围棋子等等均可。
两个人轮流从堆中取物体若干,规定最后取光物体者取胜。
这是我国民间很古老的一个游戏,别看这游戏极其简单,却蕴含着深刻的数学原理。
下面我们来分析一下要如何才能够取胜。
(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。
博弈问题总结(基础篇)
博弈问题总结(基础篇)博弈问题总结(基础篇)前⾔最近做的博弈问题的题⽐较多,所以我就汇总了⼀下博弈问题的⼏种题型,⽅便之后的做题博弈论定义博弈论就是指有若⼲个⼈进⾏⼀些对弈,并且默认每个⼈都是最聪明的,不会失误,都可以找到当前的最优解,然后来寻找有没有哪个⼈有必胜/必败的的策略。
A、尼姆博弈为什么叫尼姆博弈呢?因为这是尼姆(英⽂名:Nimm Game)发明的数学游戏。
博弈模型有n堆各若⼲个物品,两个⼈轮流从某⼀堆取任意多的物品,规定每次⾄少取⼀个,多者不限,最后取光者得胜。
分析我们先考虑简单的情况1、n=1这时先⼿必胜,因为他只需要把唯⼀的这⼀堆⽯⼦取⾛就可以了2、n=2若a[1]=a[2],先⼿必败,因为⽆论先⼿在哪⼀堆⽯⼦中取⾛⼏个,后⼿总能在另⼀堆⽯⼦中取⾛相同的个数若a[1]!=a[2],我们假设a[1]>a[2],此时先⼿必胜,因为先⼿可以在第⼀堆⽯⼦中取⾛a[1]-a[2]个,这时两堆⽯⼦的个数相同,下⼀次⽆论后⼿取⾛多少个,先⼿都可以在另⼀堆取⾛同样多个,因此先⼿必胜若a[1]<a[2],同上,先⼿必胜3、要是n=3或者更⼤呢?我们显然不能像上⾯⼀样去枚举每种情况,所以我们要得出⼀个更为⼀般的结论我们设总共有n堆⽯⼦,每⼀堆⽯⼦的个数分别为a[1]、a[2]、a[3]……a[n]若a[1] ^ a[2] ^ a[3] ^ …… ^ a[n] =0先⼿必败,反之先⼿必胜下⾯是证明如果异或和的最⾼位为i,那么必定有⼀堆⽯⼦的第 i 位为1我们设这⼀堆⽯⼦的个数为k,其它所有⽯⼦的异或和为m,总异或和为x则必定有k ^ m=x,我们把这⼀堆⽯⼦变成k^x(k ^ x) ^ m=0这时,所有⽯⼦的异或和都变成了0举个例⼦:11001 ^ 11100=00101,则有(11001 ^ 00101)^ 11100=0如果当前所有数字的异或和为0,那么下⼀次⽆论你怎么取⽯⼦,异或和⼀定不会为0这样我们可以得出结论:如果先⼿异或和不为0,可以⼀步让后⼿的情况为异或和为0;如果先⼿异或和为0,那么后⼿异或和就不为0这样,我们不断进⾏游戏,最终⼀定会达到所有的数都为0的情况,⽽最后⾯对这种情况的⼀定会输所以我们可以得出结论:若a[1] ^ a[2] ^ a[3] ^ …… ^ a[n] =0先⼿必败,反之先⼿必胜例题洛⾕P2197模板题(好裸的板⼦)题意甲,⼄两个⼈玩 Nim 取⽯⼦游戏。
POJ取石子游戏(威佐夫博弈)
POJ取⽯⼦游戏(威佐夫博弈)取⽯⼦游戏Time Limit : 2000/1000ms (Java/Other) Memory Limit : 20000/10000K (Java/Other)Total Submission(s) : 1 Accepted Submission(s) : 1Problem Description有两堆⽯⼦,数量任意,可以不同。
游戏开始由两个⼈轮流取⽯⼦。
游戏规定,每次有两种不同的取法,⼀是可以在任意的⼀堆中取⾛任意多的⽯⼦;⼆是可以在两堆中同时取⾛相同数量的⽯⼦。
最后把⽯⼦全部取完者为胜者。
现在给出初始的两堆⽯⼦的数⽬,如果轮到你先取,假设双⽅都采取最好的策略,问最后你是胜者还是败者。
Input输⼊包含若⼲⾏,表⽰若⼲种⽯⼦的初始情况,其中每⼀⾏包含两个⾮负整数a和b,表⽰两堆⽯⼦的数⽬,a和b都不⼤于1,000,000,000。
Output输出对应也有若⼲⾏,每⾏包含⼀个数字1或0,如果最后你是胜者,则为1,反之,则为0。
Sample Input2 18 44 7Sample Output1SourcePKU所谓威佐夫博弈,是ACM题中常见的组合游戏中的⼀种,⼤致上是这样的:有两堆⽯⼦,不妨先认为⼀堆有 10,另⼀堆有 15 个,双⽅轮流取⾛⼀些⽯⼦,合法的取法有如下两种:1、在⼀堆⽯⼦中取⾛任意多颗;2、在两堆⽯⼦中取⾛相同多的任意颗;约定取⾛最后⼀颗⽯⼦的⼈为赢家,求必胜策略。
两堆⽯头地位是⼀样的,我们⽤余下的⽯⼦数(a,b)来表⽰状态,并画在平⾯直⾓坐标系上。
和前⾯类似,(0,0)肯定是 P 态,⼜叫必败态。
(0,k),(k,0),(k,k)系列的节点肯定不是 P 态,⽽是必胜态,你⾯对这样的局⾯⼀定会胜,只要按照规则取⼀次就可以了。
再看 y = x 上⽅未被划去的格点,(1,2)是 P 态。
k > 2 时,(1,k)不是 P 态,⽐如你要是⾯对(1,3)的局⾯,你是有可能赢的。
博弈论原理与方法分析
绪论-几个典型模型
猜方
正面
猜硬币游戏
分析:
盖方
反面
正面
-1, 1
1, -1
反面
1, -1
-1, 1
在本博弈中,双方的利益是严格对立的,取
胜的关键是不能让另一方猜到自己的策略而
同时自己又要尽可能猜出对方的策略。
在一次博弈中结果取决于机会,在多次重复
中,如果双方决策都正确,则我们可求得平
and William F. Sharpe金融经济学原理。
1994年John Harsanyi, John F. Nash and
Reinhard es A. Mirrless and William Vickery
不对称信息条件下激励机制问题
绪论-博弈论的历史沿革
费效用最大化决策中的各种商品的购买量。根
据该集合是有限的还是无限的,可分为有限博
弈和无限博弈。
2001年Jeorge Akerlof、Michael Spence and
Joseph Stiglitz非对称信息市场分析
2002年丹尼尔·卡尼曼和弗农·史密斯心理和实
验经济学方面
2005年Thomas Schelling and Robert
Aumann合作博弈方面
博弈论在构成了微观经济学的基础性方法。
坦白”);
– 支付(payoffs):参与人在所选策略(策略组合,
the strategy profile)上的效用
例如如果A坦白,而B不坦白,A得0,B得-9
绪论-什么是博弈论
得益矩阵
列参与者
坦白
不坦白
巴什博奕规则范文
巴什博奕规则范文规则一:游戏的初始状态是一堆物品(通常用棋子或石头代表),这堆物品的数量可以是任意的,但不为零。
规则二:两名玩家轮流从这堆物品中拿走石子。
每次只能取1个、2个或3个石子。
规则三:玩家可以一次性取走全部石子。
但无法不取任何石子。
规则四:最后一颗石子被拿走的玩家即为输家。
以上就是巴什博弈的基本规则。
现在我们进一步深入了解一些关于巴什博弈的策略。
1.在巴什博弈中,理想的情况是由先手玩家决定。
如果初始状态的石子数量是4的倍数,那么先手玩家有一个必胜策略,即每次取走4-对手取走的石子数量。
这样无论对手怎么走,先手玩家总是可以使石子的数量维持在4的倍数,最终让对手取走最后一颗石子,从而获得胜利。
2.另一方面,如果初始状态的石子数量不是4的倍数,那么先手玩家没有必胜策略。
无论先手玩家怎么走,对手总是能够采取相同的策略使石子的数量保持4的倍数。
最终,对手取走最后一颗石子,先手玩家将输掉游戏。
3.当然,尽管先手玩家没有必胜的策略,但他仍可以利用一些策略尽量延长游戏的持续时间。
例如,假设初始石子数量是9,先手玩家可以选择取走2个石子。
这样一来,无论对手怎么走,先手玩家每次取走的石子数量都是对手所取石子数量的补数。
这样,游戏将持续下去,直到最后只剩下4个石子。
对手不得不取走最后4个石子,而先手玩家获得胜利。
4.上述策略可以简化为:无论初始石子数量是多少,先手玩家总是选择使得每次取走的石子数量加上对手所取石子数量等于4、这样,先手玩家可以确保自己始终处于有利位置。
巴什博弈是一个简单却有趣的博弈游戏,同时也是学习博弈论中一些基本概念和策略的良好起点。
通过深入理解博弈论和巴什博弈的规则和策略,我们可以在其他更复杂的博弈中更好地应用博弈论的原则。
东方博弈1213题解
东方博弈1213题解东方博弈是一种常见的思维训练游戏,也是数学中的一个经典问题。
今天我们来分析一道东方博弈的题目,题目编号为1213。
题目描述:有一堆石子,共有N个,两个人轮流从中取石子,每次可以取走1个、2个或3个石子,最后无法取石子的人视为失败者。
其中N是一个正整数。
要求:给定N,判断第一个取石子的人是否能够取胜。
解题思路:对于这道题目,我们可以使用递归的方法来解答。
首先,我们需要判断N的取值范围,因为如果N小于等于3时,无论第一个取石子的人如何取,最后都会取不到石子,所以第一个取石子的人必定失败。
因此,我们只需要考虑N 大于3时的情况。
接下来,我们可以观察到一个规律:当N为4的倍数时,无论第一个取石子的人如何取,最后都会剩下4个石子,轮到第二个人取时,无论取走几个,都会留下4个给第一个人,使得第一个人无法再取石子,最后第一个人失败。
当N不是4的倍数时,第一个取石子的人可以通过巧妙的策略来保证最后剩下4个石子给第二个人。
具体策略如下:1.第一个人取1个石子。
2.第二个人根据第一个人的取法,取相同的石子数量,使得石子的总数保持为偶数。
3.接下来,不论对手如何取石子,第一个人都可以保证剩下的石子总数为4的倍数。
因为第一个人取的数量与对手取的数量之和为3,所以第一个人取3个石子后,剩下的石子数量必定为4的倍数。
4.最后,当剩下4个石子时,无论对手如何取,第一个人都可以保证取到最后一个石子,从而获得胜利。
综上所述,对于这道题目,我们可以得出以下结论: - 当N是4的倍数时,第一个取石子的人必定失败。
- 当N不是4的倍数时,第一个取石子的人必定获得胜利。
总结:东方博弈1213题是一道经典的思维训练题,通过观察和分析石子的数量,我们可以找到一种巧妙的策略来保证第一个取石子的人获得胜利。
这道题目可以锻炼我们的逻辑思维能力和数学分析能力。
希望本文对你理解和解答东方博弈1213题有所帮助。
如果你对东方博弈和其他数学题目感兴趣,欢迎继续探索和学习。
组合数学
二分图
经典问题: 稳定婚姻 延迟认可算法
�
Nim取子游戏
Nim取子游戏是由两个人面对若干堆石子 进行的游戏.设有k ≤ 1堆石子, 各堆分别 含有n1, n2, …, nk个石子.游戏的目的就是 选择最后剩下的硬币.游戏法则如下: (1) 游戏人交替进行游戏 (2) 当轮到每个游戏人取子时,选择这些石子 堆中的一堆,并从所选的堆中取走至少一个 石子
Nim取子游戏变化题目(1)
此问题是一个更简单的问题,答案很明显, 我们发现游戏人II一定是赢家,因为他只需 要保持他和游戏人I放硬币的数和为5即可. 又由于100可以被5整除,所以游戏人II一 定是赢家.
Nim取子游戏变化题目(2)
有一棵树,高度为h(≤108),现在有 n(≤105)只猴子分别在树上n个不同的位置, 两个游戏人来玩这个游戏,在这种状态下, 两个玩家可以命令任何一只猴子往上爬至少 一个格子,当没有任何猴子有爬的空间时, 这个玩家算为输掉了游戏?请问如果事先告 诉你这些状态,你能判断出两个玩家的输赢 吗?
递推表达式:
Dn = (n 1)( Dn 2 + Dn 1 )
Catalan数
第n个Catalan数为:
C
n
1 2n = n +1 n 源自Catalan序列递推关系式:
4n 2 Cn = Cn 1 n +1 C1 = 1 (n ≥ 1)
Catalan数的经典问题
1. P=a1a2a3...an为n个数a1a2a3...an的乘积,依据乘 法的结合率,不改变其顺序,只用括号表示成对的乘 积.试问有几种不同的乘法方案? 2. n个1和n个0组成一2n位的2进制数,要求从左到 右扫描,1的累计数不小于0的累计数,试求满足 这条件的数有多少? 3. 设在圆上选择2n个(等间隔的)点.请问将这些 点成对的连接起来使得所得到的n条线段不相交的 方法数是多少?
取棋子必胜策略教案
《取棋子问题》讲题比赛讲稿有两堆棋子,黑子8颗、白子15颗。
现甲、乙两人轮流取棋子。
每次取棋的规则是:若一次只取一种颜色,则可取任意颗;若一次取两种颜色,则两种颜色取的颗数必须相等。
请研究这个游戏的获胜策略。
一、选题背景本题涉及到我国古代的博弈论思想。
Nim game(尼姆博弈)和Wythoff’s (威佐夫博弈)都是博弈论中典型的“双人动态”最优博弈,本题属于Wythoff Game(威佐夫博弈)的一个典型例题。
二、获胜规则Normol规则:谁最后取,谁胜。
Misère 规则:谁最后取,谁输。
此题,我们主要研究Normol规则。
三、题目分析1、难点:过程抽象,可能性很多,较难找到规律。
2、重点:找到必胜的局面。
四、思路分析1、倒推法,即从最后的结果出发。
2、排除法,逐步删去必败局面。
五、解法分析1、根据题意,甲不能留下以下2种局面:(1)只剩一种颜色的棋子(0,n)(2)剩余的不同颜色的棋子数目相同(n,n)这里的n表示黑子或白子。
可排除以下局面。
2、根据倒推法,讨论(1,2)。
甲留下(1,2)给乙,不管乙如何取,甲都可以获胜。
必胜局面(1,2)。
其实甲、乙双方,只要谁将(1,2)留给对方,谁就必胜。
3、讨论甲留下的局面含有1和2的局面。
如果甲留下(1,3)给乙,乙可取走3颗中的1颗,留下(1,2)的局面给甲,此时甲不能获胜。
(1,4)…(1,15)同样的道理。
如果甲留下(2,3)给乙,乙可取走3颗里面的2颗,留下(1,2)的局面给甲,此时甲不能获胜。
(2,4)…(2,15)同样的道理。
规律一:留下的局面不能重复必胜局面中的数字。
根据此规律可排除以下局面。
4、讨论(3,4)局面(3,4)的棋子之差与必胜局面(1,2)的相同,如果甲留下(3,4)这种局面,乙可在两边同时取走2颗,留下(1,2)的局面给甲,甲不能获胜。
规律二:留下的局面中两棋子数目之差不能与必胜局面相同。
根据此规律课排除以下局面。
取子游戏_博弈简单分析
一局游戏在两个游戏人之间如下交替进行:游戏从一空堆开始。
当轮到一个游戏人时,他可以往堆中加进1,2,3或4枚硬币。
往堆中加进第100枚硬币的游戏人为得胜者。
确定在这局游戏中是游戏人A还是游戏人B能够确保取胜。
取胜的策略是什么?在学术论坛有博士家园,组合图论论坛确保取足5个硬币即可例题:两个人玩移火柴的游戏,桌子上有1000根火柴,每个人每次可以拿走1-7根火柴,拿走桌子上最后那根火柴的算输,问第一个人第一次要拿多少根火柴才能保证赢7根。
以后对方拿几根,你都要拿够凑足8根的数。
1000根和8根性质是一样的。
从抢30到NIM游戏的取胜策略(一)倒推法抢30是我国民间的一个两人游戏,具有很强的对抗性和娱乐性。
抢30游戏通常有两种玩法。
(1)两人从1开始轮流报数,每人每次可报一个数或两个连续的数,谁先报到30,谁就为胜方。
(2)两人从1开始轮流报数,每人每次可报一个数或两个连续的数,同时把两个人报出的所有数累加,谁先使这个累加数最先达到30,谁就为胜方。
解决最个问题的一般策略是用倒推法。
以(1)为例,要抢到30,必须抢到27;要抢到27,必须抢到24。
如此倒推回去,可得到一系列关键数30、27、24、21、18、……9、6、3。
根据以上分析,抢30游戏本身并不是一个公平的游戏,初始数和先后顺序已经决定了最后的结果,因为只有后报数者才能抢到3的倍数,后报数者有必胜策略。
(二)关键因子所有这些关键数都是3的倍数。
3是两个报数者年内能够报出的最大数与最小数的和。
在类似游戏中,我们把游戏者所能用到的最大数和最小数之和称之为关键因子k,关键数就是k的倍数.。
在抢30的游戏中,关键因子k等于3。
又例如,抢100报数游戏中,如果每人可报数为1至9个连续的自然数,谁先报到100谁就是胜利者。
这里的关键因子k就是可报最大数9和可报最小数1的和,即k=10。
报数获胜的策略就是:(1)让对方先报数;(2)每次报数为关键因子减去对方所报数。
博弈游戏汇总
博弈游戏汇总1、巴什博弈⼀堆⽯⼦,有n个,两个⼈轮流取,每次⾄少取1个,⾄多取m个,拿⾛最后⼀个⽯⼦的⼈获胜假设⼀堆⽯⼦有 n=m+1 由于⼀次只能取m个,⽆论先⼿取多少个,后⼿总能拿⾛剩余的,这时⼀定是先⼿负于是找到取胜规则:⼀对⽯⼦ n=(m+1)*r+s对于先⼿应该先取⾛s个,设后⼿取⾛k个,先⼿再取⾛ m+1-k 剩余的⽯⼦个数为 (m+1)(r-1) 以后保持这样的取法,先取者获胜总之,就是要留给对⼿ m+1的倍数可以归结为: s=0时,后⼿胜s<>0时,先⼿胜2、简单的⽯⼦游戏有n堆⽯⼦,每次⾄少取⼀根,⾄多拿⾛整堆,两⼈轮流拿,每次限拿其中⼀堆,取⾛最后⼀根的获胜。
1902年获胜策略已由美国数学家C.L.Bouton分析完成,⽤到的是⼆进制和平衡状态概念。
其结论是:对于n堆⽯⼦,第i (1<=i<=n)堆⽯⼦的个数是Xi,该状态为必败状态当且仅当 X1 XOR X2 XOR……Xn=0。
看个例⼦:有4堆⽯⼦,数量分别为:7 9 12 15⼆进制形式为0111100111001111异或结果为:11011101^1001=0100=4 可以从第⼆堆拿⾛5个1101^1100=0001=1 也可以从第三堆拿⾛11个1101^1111=0010=2 或者从第四堆取⾛13个给定N堆⽯⼦,两⼈轮流取⽯⼦,必须先取完⼀堆⽯⼦才能取另⼀堆,⽽且另⼀堆⽯⼦的个数必须⽐之前取的那⼀堆⼩,每次只能取1个或者质数个⽯⼦。
如果没有⽯⼦可以取了,那么他就输了。
问先⼿是否有必胜策略。
其实对于这个游戏,我们只需要判断第⼀堆⽯⼦即可,也就是⽯⼦数⽬最少的那⼀堆代码:#include<iostream>#include<algorithm>#include<math.h>using namespace std;int isprime(int n){int s=(int)sqrt(n);if(n==1) return1;for(int i=2;i<=s;i++){if(n%i==0)return0;break;}return1;}int main(){int n,a[100000],x,i,j,t;while(cin>>n){for( i=0;i<n;i++)cin>>a[i]; //每堆⽯⼦的数⽬sort(a,a+n);for(j=1;j<=a[0];j++){if(isprime(j)&&j<=a[0])a[0]=a[0]-j;x=0;for(t=0;t<n;t++)cout<<"yes"<<endl;break;}elsea[0]=a[0]+j; //恢复⽯⼦数⽬}if(x!=0)cout<<"no"<<endl;}return0;}View Code3、Nim游戏有n堆⽯⼦,每堆⽯⼦的数量为 x1, x2, x3,x4......xn。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一局游戏在两个游戏人之间如下交替进行:游戏从一空堆开始。
当轮到一个游戏人时,他可以往堆中加进1,2,3或4枚硬币。
往堆中加进第100枚硬币的游戏人为得胜者。
确定在这局游戏中是游戏人A还是游戏人B能够确保取胜。
取胜的策略是什么?在学术论坛有博士家园,组合图论论坛确保取足5个硬币即可例题:两个人玩移火柴的游戏,桌子上有1000根火柴,每个人每次可以拿走1-7根火柴,拿走桌子上最后那根火柴的算输,问第一个人第一次要拿多少根火柴才能保证赢7根。
以后对方拿几根,你都要拿够凑足8根的数。
1000根和8根性质是一样的。
从抢30到NIM游戏的取胜策略(一)倒推法抢30是我国民间的一个两人游戏,具有很强的对抗性和娱乐性。
抢30游戏通常有两种玩法。
(1)两人从1开始轮流报数,每人每次可报一个数或两个连续的数,谁先报到30,谁就为胜方。
(2)两人从1开始轮流报数,每人每次可报一个数或两个连续的数,同时把两个人报出的所有数累加,谁先使这个累加数最先达到30,谁就为胜方。
解决最个问题的一般策略是用倒推法。
以(1)为例,要抢到30,必须抢到27;要抢到27,必须抢到24。
如此倒推回去,可得到一系列关键数30、27、24、21、18、……9、6、3。
根据以上分析,抢30游戏本身并不是一个公平的游戏,初始数和先后顺序已经决定了最后的结果,因为只有后报数者才能抢到3的倍数,后报数者有必胜策略。
(二)关键因子所有这些关键数都是3的倍数。
3是两个报数者年内能够报出的最大数与最小数的和。
在类似游戏中,我们把游戏者所能用到的最大数和最小数之和称之为关键因子k,关键数就是k的倍数.。
在抢30的游戏中,关键因子k等于3。
又例如,抢100报数游戏中,如果每人可报数为1至9个连续的自然数,谁先报到100谁就是胜利者。
这里的关键因子k就是可报最大数9和可报最小数1的和,即k=10。
报数获胜的策略就是:(1)让对方先报数;(2)每次报数为关键因子减去对方所报数。
这样自己每次所报数都是关键数。
如果对方一定要先报,你只能期待对方不懂策略或者大意出错了。
(三)不平衡因子在上述的抢30或者抢100的游戏中,最后数30是关键因子3的整数倍,最后数100是关键因子10的整数倍。
我们可以把这样的游戏称为平衡游戏,也就是最后报数与关键因子相除余数为0。
如果最后报数与关键因子相除有余数,这个游戏就可以称为不平衡游戏,其余数就是不平衡因子。
抢数不平衡游戏也是不公平的游戏,先报数者有必胜策略。
先报数者的获胜策略就是先消除不平衡因子,使其变成一个平衡游戏,先报数者随后就成为平衡游戏的后报数者。
例如,在抢30游戏中,两人从1开始轮流报数,每人每次可报1到3个连续的数,谁先报到30,谁就为胜方。
在这里,关键因子是4,不平衡因子是2。
又例如,抢100报数游戏中,如果每人可报数为1至10个连续的自然数,谁先报到100谁就是胜利者。
在这里,关键因子是11,不平衡因子是1。
在不平衡游戏中,如果先报数者不懂得游戏策略,懂得这个策略的后报数者需要不断计算不平衡因子,以便最后获胜。
(四)更多例子报数游戏里的最后数都是些比较小的数,因此用倒推法比较容易得到策略。
当我们把数变得大一些的时候,就变成了小学奥赛题。
如果掌握上述讨论中的关键因子和不平衡因子的计算,奥数题也变得迎刃而解了。
下面就是两个奥数例题。
(1)2008个空格子排成一排,第一格放有一个棋子。
两人做游戏,轮流移动这枚棋子。
每个人每次可前移1到5个格子,谁先把棋子移到最后一格,谁就是获胜者。
问怎样的策略才能保证获胜。
(2)桌上放着一堆火柴,共有5000根。
两个人轮流从中取火柴,每人每次取的火柴根数为1到8根,谁取了最后一根谁就输。
问怎样的策略才能保证获胜。
(五)进一步扩展到NIM游戏抢30的游戏是中国NIM游戏(也叫筹码游戏)的一种特例。
NIM游戏的一种经典表述为:有n堆火柴,每堆各有若干根。
两人轮流取出火柴,每次取出的根数不限但至少取1根,每次也只能从1堆里取火柴。
谁最后把火柴取完,谁就是获胜者。
问如何才能保证获胜。
获胜策略已由美国数学家C.L.Bouton分析完成,用到的是二进制和平衡状态概念。
其结论是:如果一开始火柴的总根数转化成二进制后各位数上的数字和都是偶数时,则是平衡状态,后取者必胜。
最简单的平衡态是(1,1),即2堆火柴,每堆各1根。
如果开始时火柴的状态处于不平衡状态,先取者必胜,其策略是取完后使火柴根数保持为平衡状态。
最简单的不平衡态是(1),即1根火柴。
例如,2堆火柴数都为2根,二进制记为(10,10),各位数之和为20,这是一个平衡态,则后取者必胜。
3堆火柴数分别为1根、2根、1根,二进制记为(1,10,1),各位数之和为12,这不是一个平衡态。
先取者先取掉中间一堆2根火柴,变成平衡状态(1,1),则先取者必胜。
下面的一道例题,可以用来练习NIM游戏的上述策略:有3堆火柴,根数分别为12、9、6.。
甲乙两人轮番从其中一堆中取出1根或几根火柴,取到最后一根者获胜。
先取者还是后取者有必胜策略,如何取胜?Nim游戏Nim游戏是博弈论中最经典的模型(之一?),它又有着十分简单的规则和无比优美的结论Nim游戏是组合游戏(Combinatorial Games)的一种,准确来说,属于“Impartial Combinatorial Games”(以下简称ICG)。
满足以下条件的游戏是ICG(可能不太严谨):1、有两名选手;2、两名选手交替对游戏进行移动(move),每次一步,选手可以在(一般而言)有限的合法移动集合中任选一种进行移动;3、对于游戏的任何一种可能的局面,合法的移动集合只取决于这个局面本身,不取决于轮到哪名选手操作、以前的任何操作、骰子的点数或者其它什么因素;4、如果轮到某名选手移动,且这个局面的合法的移动集合为空(也就是说此时无法进行移动),则这名选手负。
根据这个定义,很多日常的游戏并非ICG。
例如象棋就不满足条件3,因为红方只能移动红子,黑方只能移动黑子,合法的移动集合取决于轮到哪名选手操作。
通常的Nim游戏的定义是这样的:有若干堆石子,每堆石子的数量都是有限的,合法的移动是“选择一堆石子并拿走若干颗(不能不拿)”,如果轮到某个人时所有的石子堆都已经被拿空了,则判负(因为他此刻没有任何合法的移动)。
这游戏看上去有点复杂,先从简单情况开始研究吧。
如果轮到你的时候,只剩下一堆石子,那么此时的必胜策略肯定是把这堆石子全部拿完一颗也不给对手剩,然后对手就输了。
如果剩下两堆不相等的石子,必胜策略是通过取多的一堆的石子将两堆石子变得相等,以后如果对手在某一堆里拿若干颗,你就可以在另一堆中拿同样多的颗数,直至胜利。
如果你面对的是两堆相等的石子,那么此时你是没有任何必胜策略的,反而对手可以遵循上面的策略保证必胜。
如果是三堆石子……好像已经很难分析了,看来我们必须要借助一些其它好用的(最好是程式化的)分析方法了,或者说,我们最好能够设计出一种在有必胜策略时就能找到必胜策略的算法。
定义P-position和N-position,其中P代表Previous,N代表Next。
直观的说,上一次move的人有必胜策略的局面是P-position,也就是“后手可保证必胜”或者“先手必败”,现在轮到move的人有必胜策略的局面是N-position,也就是“先手可保证必胜”。
更严谨的定义是:1.无法进行任何移动的局面(也就是terminal position)是P-position;2.可以移动到P-position的局面是N-position;3.所有移动都导致N-position的局面是P-position。
按照这个定义,如果局面不可能重现,或者说positions的集合可以进行拓扑排序,那么每个position或者是P-position或者是N-position,而且可以通过定义计算出来。
以Nim游戏为例来进行一下计算。
比如说我刚才说当只有两堆石子且两堆石子数量相等时后手有必胜策略,也就是这是一个P-position,下面我们依靠定义证明一下(3,3)是一个P是一个P是一个P-position。
首先(3,3)的子局面(也就是通过合法移动可以导致的局面)有(0,3)(1,3)(2,3)(显然交换石子堆的位置不影响其性质,所以把(x,y)和(y,x)看成同一种局面),只需要计算出这三种局面的性质就可以了。
(0,3)的子局面有(0,0)、(0,1)、(0,2),其中(0,0)显然是P-position,所以(0,3)是N-position (只要找到一个是P-position的子局面就能说明是N-position)。
(1,3)的后继中(1,1)是P-position(因为(1,1)的唯一子局面(0,1)是N-position),所以(1,3)也是N-position。
同样可以证明(2,3)是N-position。
所以(3,3)的所有子局面都是N-position,它就是P-position。
通过一点简单的数学归纳,可以严格的证明“有两堆石子时的局面是P-position当且仅当这两堆石子的数目相等”。
根据上面这个过程,可以得到一个递归的算法——对于当前的局面,递归计算它的所有子局面的性质,如果存在某个子局面是P-position,那么向这个子局面的移动就是必胜策略。
当然,可能你已经敏锐地看出有大量的重叠子问题,所以可以用DP 或者记忆化搜索的方法以提高效率。
但问题是,利用这个算法,对于某个Nim游戏的局面(a1,a2,...,an)来说,要想判断它的性质以及找出必胜策略,需要计算O(a1*a2*...*an)个局面的性质,不管怎样记忆化都无法降低这个时间复杂度。
所以我们需要更高效的判断Nim游戏的局面的性质的方法。
直接说结论好了。
(Bouton's Theorem)对于一个Nim游戏的局面(a1,a2,...,an),它是P-position当且仅当a1^a2^...^an=0,其中^表示异或(xor)运算。
怎么样,是不是很神奇?我看到它的时候也觉得很神奇,完全没有道理的和异或运算扯上了关系。
但这个定理的证明却也不复杂,基本上就是按照两种position的证明来的。
根据定义,证明一种判断position的性质的方法的正确性,只需证明三个命题:1、这个判断将所有terminal position判为P-position;2、根据这个判断被判为N-position的局面一定可以移动到某个P-position;3、根据这个判断被判为P-position 的局面无法移动到某个P-position。
第一个命题显然,terminal position只有一个,就是全0,异或仍然是0。
第二个命题,对于某个局面(a1,a2,...,an),若a1^a2^...^an!=0,一定存在某个合法的移动,将ai改变成ai'后满足a1^a2^...^ai'^...^an=0。