三国杀中的博弈论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三国杀中的博弈论
摘要:博弈论的思想发展到现在已经深入到人们日常生活的方方面面。
而三国杀是近来流行的一个桌上游戏,想计较传统的象棋和围棋,他有跟多的人参与其中,游戏中分为主公,忠臣,反贼,内奸。
游戏中的每种势力,每个人之间都在进行着一种博弈,在游戏的最后,如果想获得最大的利益则不可避免要用到博弈论的理论。
关键词:博弈论三国杀
在三国杀中的博弈论之前呢,先简单提一下博弈论的发展历程。
博弈论亦称“对策论”。
所谓博弈是指决策主体在相互对抗中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合。
我国古代的《孙子兵法》就是一本有关博弈的军事著作。
但是博弈形成一门专门的理论学科却是在近代。
博弈论在近代的发展始于1944年冯·诺依曼和摩根斯坦发表著作《博弈论与经济行为》从而创立了博弈论。
1950~1951年纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础,创立了今天应用最为普遍的非合作博弈论。
1965年泽尔腾将动态分析引入了纳什均衡,建立了精炼的纳什均衡。
两年后,海撒尼将不完全信息引入博弈论。
1982年,克瑞普斯和威尔逊发表了动态不完全信息博弈的重要文章,建立了动态不完全信息博弈的理论。
从而使博弈论发展成为一门较为完善的理论学科,同时博弈论也成为经济学的基石。
博弈总体上可以分为合作博弈和非合作博弈两种。
其主要区别在
于参与博弈的双方是否有具有明确约束力,让双方合作的协议。
因为合作博弈较非合作博弈更为复杂,情况更为多变,所以我们暂时讨论的一般都是非合作博弈。
非合作博弈对于时间先后以及信息的完全程度问题又可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈四种类型。
所谓的信息是否完全就是指每一个参与人对其他参与人的特征、策略空间以及收益函数等都有准确的信息。
而静态与动态博弈的区别就是看博弈参与的双方是否同时选择或者后选择者是否知道前者所选的选项。
这就是博弈论的大致分类。
博弈论有许多经典的模型值得我们研究,但本文却不谈这些经典模型,谈一三国杀中发生的一些博弈以及三国杀中有些这这些。
三国杀是一个积分竞技游戏,主要规则是每个人都有自己的身份牌,而除了主公当你抽到身份牌时别人是不知道你的身份的,忠臣的任务是保护主公,反贼的任务是只需杀死主公。
而当内奸和反贼死亡时,则主公和忠臣胜利。
当主公死亡时则游戏亦结束。
最好的玩就是内奸了,内奸的终极目标是要除掉所有人,但是在除掉所有敌人之前,必须保护好主公,如果主公提前被反贼消灭的话,则意味着自己的任务失败。
也就是说,在干掉所有忠臣和反贼,必须同忠臣一起保护好主公不被反贼杀害,但同时主公是一定会杀内奸的,你又要处处防着主公,既不能让他强势太强大,也要保护他势力太薄弱,两难的选择。
为了简化分析,我们采用8人制局,一主公,两忠臣,四反贼,
一内奸,按照积分赛来算。
积分规则如下
内奸获胜:得分=4+游戏人数×2
主公/忠臣获胜:若与主公单挑后败北:得分=游戏人数×1 未和主公单挑败北:得分=0
反贼获胜:存活:得分=1 死亡:得分=0
主公得分如下:
主公/忠臣获胜:得分=4+获胜时忠臣存活数×2
反贼获胜:得分=0
内奸获胜:得分=1
忠臣得分如下:
主公/忠臣获胜:得分=5+获胜时忠臣存活数×1
反贼/内奸获胜:得分=0
反贼得分如下:
主公/忠臣/内奸获胜:得分=0
反贼获胜:得分=获胜时反贼存活数×3
另外还有个人加分:获胜的主公/忠臣每消灭1个反贼或内奸+1分
反贼每消灭一个忠臣或内奸+1分消灭主公的+2分而当你本局的队友从整个牌局来看也是你的敌人,从利益上人人都是内奸,只是为了追求自己的利益最大化,并没有盟友。
所以按照博弈论的理想模型,每个人都冷静理性的追求利益最大化,则这个利益不应该是胜利,而应该是(你的得分-其他人的平均得分)最大,
这样可以让你的积分最大化领先其余参与牌局的人,且总收益之和恒为0,不存在总收益之和最大的情况。
比如说主公最后单挑败内奸败北,主公得1分,内奸得20分,按照以上公式,主公获得的利益为A=1 - 21/8
而主公送反,如只有1反,则主公得0分,4反贼各得3分,内得1分,按照以上公式,主公获得的利益为B=0-(3*4+1)/7=-13/7而主公杀内送反,则主公得0分,4反贼各3分,内0分,主公收益为C=0-3*4/7=-12/7
B=A<C,所以从理论上讲,主公直接送反没有差别,但杀内却可以减少损失,当然因为三国杀涉及运气问题,实际应用中要加上概率,计算会更为复杂,而且进入单挑后即使再不利也有可能爆发,因为这概率带来的潜在收益则主公无论如何不该直接送反。
,但就个人的利益按照(自身得分-其他人平均得分计算),选择最优解。
这样的话如果是主反内三人残局可以推出很多有意思的东西
内奸胜利,内奸收益为18.375,主公收益为-1.625,忠臣收益为-2.625反贼收益为-2.86
主公胜利,内奸进行单挑,内奸收益为6,主公收益为1.43,忠臣收益为2.57,反贼收益为-3.14
主公胜利,内奸没进行单挑,内奸收益为-2,主公收益为2.57,忠臣收益为3.71,反贼收益为-2
反贼胜利,内奸存活,内奸收益为-0.71,主公收益为-1.86,忠臣收益为-1.86,反贼收益为1.57
反贼胜利,内奸阵亡,内奸收益为-1.71,主公收益为-1.71,忠臣收益为-1.71,反贼收益为1.71
可见假如主公几乎无法胜利,主公仍然是希望进单挑的,但忠臣们却希望主公送反,尤其是杀内送反
而假如主公有着1v2必胜的把握,主公应该选择先杀内再杀反,这样收益最大
而从反贼的角度考虑,反贼已知胜利无望,则他最不希望看到主公胜利而内奸进单挑的情况。
因此假如其实力尚可,内奸孱弱,主公极其强势,应选择直接击杀内奸。
而从内奸的角度分析,进入单挑,就已经意味着获得了极大的收益,单挑胜主甚至可以看作是一个额外的奖励,事实上比内奸单挑败北的收益更高的情况只有4反胜一种情况(无内6.86,有内6.71),主忠无论怎样大胜收益不可能超过内奸单挑败北,最好的情况是2忠主胜,主的收益为8-(2*7)/7=6与内奸单挑败北收益相等(单论得分也相等)。
按照这种利益模型,你会发现当控制到残局时,主公和内奸的1分在利益天平上相当重要,但当人多时,直接一分是极不明智的行为
经过这种利益模型的分析,可以发现三国杀是一个平衡性相当精妙的游戏,也可以发现很多很神奇的结论,在平常的面杀积分赛中适当应用(比如内奸尽量考虑活进单挑为第一要务,适当死忠未尝不可),也会取得一定的效果。
参考文献:
[1]姚国庆,博弈论[M]南开大学出版社
[2]余治国,江雨燕.生活中的博弈论[M] .世界图书出版公司,2007
[3]三国杀百度百科
[4]三国杀人人网公共主页。