基础博弈

合集下载

博弈论基础教程教学设计

博弈论基础教程教学设计

博弈论基础教程教学设计介绍博弈论是现代数学的重要分支之一,在社会科学和经济学中有着广泛应用。

博弈论是对战争、政治、经济和生物学等领域的分析和研究提供数学模型的一种数学理论。

本文旨在为博弈论基础教程教学设计提供参考,帮助教师更好地提高学生的学习效果和兴趣。

教材选择针对初学者,推荐使用《博弈论入门》这本书作为教材,它可以为学生提供一个循序渐进的博弈论教学体系。

教学内容主要包括博弈论中的基本概念和原理,以及常用方法和应用技巧。

在教学过程中,为了帮助学生理解和更好地掌握知识,可以通过问题练习等方式进行辅助教学。

教学内容基本概念博弈论中的基本概念包括博弈模型、策略、收益等概念。

学生需要了解这些概念的意义,并能正确运用概念进行博弈论问题的解决。

基本原理博弈论中的基本原理包括博弈的完备性原理、最小化原理、最大化原理等。

这些原理是博弈论研究的基础,学生需要理解并掌握这些原理,以便应用到实际博弈中。

常用方法博弈论中包含许多重要的方法,如纳什均衡、支配策略、迭代删除等。

学生需要理解这些方法的意义和适用范围,并能够正确应用到博弈问题中。

应用技巧博弈论在现实中有着广泛的应用,如在经济学中用来分析产业结构、竞争策略,用来解决博弈双方的合作与冲突问题,在生态学、生物学、计算机科学中也有着重要的应用。

学生需要了解这些应用,并能理解和应用博弈论相关的技巧。

教学方式讲授教师通过讲授来介绍博弈论的基本知识和概念,讲授内容可以结合教材和一些其他的参考资料,便于学生更好地理解和掌握相关的知识。

课堂互动学生在课堂上可以参与课堂互动和讨论,通过案例或问题分析来帮助学生更好地掌握博弈论知识。

实践操作学生需要根据讲授内容,进行实践操作,通过实际性问题和练习来更好地掌握博弈论知识并加深对概念和原理的理解。

作业教师可以布置一些作业来检测学生对博弈论知识的掌握情况,同时也可以为学生提供练习和巩固知识的机会。

总结本文围绕博弈论基础教程教学设计提供了一些参考意见,教师可以根据实际情况进行调整和补充。

博弈论的基本原理和策略分析

博弈论的基本原理和策略分析

博弈论的基本原理和策略分析博弈论,是一门研究决策和策略选择的学科,它以不同参与者之间的相互作用为研究对象,通过模型建立和分析,来帮助人们在冲突和合作的情境中做出最优化的决策。

博弈论发展至今已广泛应用于经济学、政治学、社会学等领域,成为解决现实问题的重要工具。

博弈论的基本原理包括参与者、策略和收益。

参与者是参与博弈的个体或组织,他们在博弈中通过选择不同的策略来争取最大的收益。

策略是参与者可选择的行动方式,通过策略选择可以实现不同的收益结果。

收益是参与者从博弈中获得的结果,包括直接的经济利益、社会声誉等。

在博弈论中,有两种基本的博弈形式:合作博弈和非合作博弈。

合作博弈是指博弈参与者之间存在着一定程度的合作和沟通,他们可以通过协商、合作达成一致,并分享协作带来的收益。

非合作博弈则是指博弈参与者之间不存在合作和沟通的限制,他们通过自利行动来争取最大的收益。

针对不同的博弈形式,博弈论提供了一系列的策略分析方法。

在合作博弈中,常见的策略分析方法有纳什均衡理论、核心和分配规则等。

纳什均衡理论是指在博弈中,当参与者都选择了自己最优策略时,整体状态将达到一种均衡状态,没有参与者能够通过改变策略来获得更多的收益。

核心是指合作博弈中一组合理的分配方案,对于该方案,没有参与者能够通过组成联盟来获得更多的收益。

分配规则则是用于确定合作博弈中收益的分配方式,常见的规则包括沙普利分配规则和核心分配等。

在非合作博弈中,常见的策略分析方法有占优策略、均衡与稳定策略等。

占优策略是指参与者在博弈中通过选择最优策略来争取最大的收益。

均衡则是指在博弈中参与者的策略选择相互映衬,没有参与者能够通过改变策略来获得更多的收益。

稳定策略是指参与者在博弈中的策略选择对于其他参与者的策略选择是一个稳定的反应。

博弈论的应用领域广泛,其中最为典型的应用是经济学中的市场竞争分析。

在市场竞争中,供求双方为了追求最大的利润,会通过定价、广告等手段展开博弈。

博弈论提供了一种分析框架,可以帮助理解市场竞争中的策略选择与结果,并为决策者提供指导。

【博弈论基础】(吉本斯)课后习题答案

【博弈论基础】(吉本斯)课后习题答案

qm/2 qc q’
π 1 , π1
π3 ,π2 π1 , π 5
π2 ,π3
π 5 , π1 π6 ,π7 π8 ,π8
π4 ,π4
π7 ,π6
其 中 , π 5 = ( a − c) /16 , π 6 = ( a − c) /18 , π 7 = ( a − c) /12 , π 8 = 0 。 此 博 弈 符 合 题
居 中 点 没 有 稳 有 人 会 个 候 选 体 方 法
猪 头 非 整 理 ebwf@
2
Gibbons《 博 弈 论 基 础 》 习 题 解 答 ( CENET)
第 一 章
1.9 略 1.10 按 照 求 解 混 合 战 略 纳 什 均 衡 的 方 法 去 解 这 些 博 弈 , 发 现 不 存 在 混 合 战 略 纳 什 均 衡 , 也 就 证 明 了 。 过 程 略 。 1.11 首 先 重 复 剔 除 严 格 劣 战 略 , 可 得 下 面 的 博 弈 : L T M 2, 0 3, 4 R 4, 2 2, 3
所 以 所 有 的 qi 都 相 等 。 由 此 , 将 Q =
* *
∑q
i
* i
= nqi* 代 入 ( 2) 式 , 可 得 :
qi* = (a − c) /(n + 1) , Q* = n(a − c) /(n + 1) , p* = (a + nc) /(n + 1) 。
当 n 趋 近 于 无 穷 时 , p* 趋 近 于 边 际 成 本 c, 市 场 趋 近 于 完 全 竞 争 市 场 。 1.5 双 方 都 生 产 qm / 2 时 , 每 一 方 的 利 润 都 为 π 1 = ( a − c ) / 8 ; 一 方 生 产 qm / 2 , 另 一 方 生 产 qc

博弈基础知识.doc

博弈基础知识.doc

一、博弈基础知识博弈的定义:一些个人、团队或其他组织,面对一定的环境条件、在一定的规则约束下,依靠所掌握的信息,同时或先或后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

博弈的构成要素:1、博弈要有2个或2个以上的参与者(Player) 。

2、博弈要有参与各方争夺的资源或收益(Resources或Payoff)。

3、参与者有自己能够选择的策略(Strategy)。

4、参与者拥有一定量的信息(Information)。

博弈的分类:1、分为合作博弈与非合作博弈。

如果各傅弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。

反之,就属于非合作博弈。

2、分为零和博弈、常和博弈与变和博弈。

零和博弈指的是所有博弈方的得益总和为零。

常和博弈则是指所有博弈方的得益总和等于非零的常数。

变和博弈则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。

3、分为静态附弈与动态附弈。

所有博弈方同时或讨看作同时选择策略,采取行动的博弈是静态博弈。

4、分为完全信息博弈与不完全信息博弈。

纳什均衡定义:在给定别人最优的情况下,自己最优选择达成的均衡。

二、囚徒困境两个共同偷窃的犯罪嫌疑人甲和乙被带进警察局。

警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个Array犯罪嫌疑人都无法观察同伴的选择。

警方怀疑他们作案,但手中并没有掌握确凿证据,于是明确地分别告知两名犯罪嫌疑人:对他们犯罪事实的认定及相应的量刑完全取决于他们自己的供认。

如果其中一方坦白,而另一方抵赖,供认方将不受惩罚,无罪释放,另一方会被重判10年;如果双方都供认,各被判5年;而如果双方均不认罪,因为警方找不到其他证据,则无罪释放。

体现囚徒困境基本精祌一一背叛形成囚徙困境的机制一一担心自己成为傻瓜(处于囚徙困境时,两害相权取其轻)启示:囚徒困境这个模型,儿乎是博弈论的代名词。

无名氏定理:博弈中双方合作时得益最大,但若一方不遵守合作约定,必定是另一方合作者吃亏。

基础博弈论大学英文讲义

基础博弈论大学英文讲义

Week 11: Game TheoryRequired Reading: Schotter pp. 229 - 260Lecture Plan1. The Static Game TheoryNormal Form GamesSolution Techniques for Solving Static Games Dominant StrategyNash Equilibrium2. Prisoner’s Dilemma3. Decision AnalysisMaximim CriteriaMinimax Criteria4. Dynamic One-Off GamesExtensive Form GamesThe Sub-Game Perfect Nash Equilibrium1. The static Game TheoryStatic games: the players make their move in isolation without knowing what other players have done1.1 Normal Form GamesIn game theory there are two ways in which a game can be represented.1st) The normal form game or strategic form game2nd) The extensive form gameA normal form game is any game where we can identity the following three things:1. Players:2. The strategies available to each player.3. The Payoffs. A payoff is what a player will receive at the endof the game contingent upon the actions of all players in the game.Suppose that two people (A and B) are playing a simple game. A will write one of two words on a piece of paper, “Top” or “Bottom”. At the same time, B will independently write “left” or “right” on a piece of paper. After they do this, the papers will be examined and they will get the payoff depicted in Table 1.Table 1If A says top and B says left, then we examine the top-left corner of the matrix. In this matrix, the payoff to A(B) is the first(Second) entry in the box. For example, if A writes “top” and B writes “left” payoff of A = 1 payoff of B = 2.What is/are the equilibrium outcome(s) of this game?1.2Nash Equilibrium Approach to Solving Static GamesNash equilibrium is first defined by John Nash in 1951 based on the work of Cournot in 1893.A pair of strategy is Nash equilibrium if A's choice is optimal given B's choice, and B's choice is optimal given A's choice. When this equilibrium outcome is reached, neither individual wants to change his behaviour.Finding the Nash equilibrium for any game involves two stages.1) identify each optimal strategy in response to what the other players might do.Given B chooses left, the optimal strategy for A isGiven B chooses right, the optimal strategy for A isGiven A chooses top, the optimal strategy for B isGiven A chooses bottom, the optimal strategy for B isWe show this by underlying the payoff element for each case.2) a Nash equilibrium is identified when all players are player their optimal strategies simultaneouslyIn the case of Table 2,If A chooses top, then the best thing for B to do is to choose left since the payoff to B from choosing left is 1 and the payoff from choosing right is 0. If B chooses left, then the best thing for A to do is to choose top as A will get a payoff of 2 rather than 0.Thus if A chooses top B chooses left. If B chooses left, A chooses top. Therefore we have a Nash equilibrium: each person is making optimal choice, given the other person's choice.If the payoff matrix changes as:Table 2then what is the Nash equilibrium?Table 3If the payoffs are changed as shown in Table 32. Prisoners’ dilemm aPareto Efficiency: An allocation is Pareto efficient if goods cannot be reallocated to make someone better off without making someone else worse off.Two prisoners who were partners in a crime were being questioned in separate rooms. Each prisoner has a choice of confessing to the crime (implicating the other) or denying. If only one confesses, then he would go free and his partner will spend 6 months in prison. If both prisoners deny, then both would be in the prison for 1 month. If both confess, they would both be held for three months. The payoff matrix for this game is depicted in Table 4.Table 4The equilibrium outcome3. Decision AnalysisLet N=1 to 4 a set of possible states of nature, and let S=1 to 4be a set of strategy decided by you. Now you have to decide which strategy you have to choose given the following payoff matrix.Table 5S=YouN=OpponentIn this case you don't care the payoff of your opponent i.e. nature.3.1 The Maximin Decision Rule or Wald criterionWe look for the minimum pay-offs in each choice and then maximising the minimum pay-offLet us highlight the mimimum payoff for each strategy.3.2 The Minimax Decision Rule or Savage criterionOn this rule we need to compute the losses or regret matrix from the payoff matrix. The losses are defined as the difference between the actual payoff and what that payoff would have been had the correct strategy been chosen.Regret/Loss = Max. payoff in each column – actual payoffFor example of N=1 occurs and S=1 is chosen, the actual gain = 2 from Table 3. However, the best action given N=1 is also to choose S=1 which gives the best gain = 2. For (N=1, S=1) regret = 0.If N=1 occurs but S=2 is chosen, the actual gain = 1. However, the best action given N=1 is also to choose S=1 which gives the best gain = 2. For (N=1, S=2) regret = 2-1.Following the similar analysis, we can compute the losses for each N and S and so can compute the regret matrix.Table 6: Regret MatrixAfter computing the regret matrix, we look for the maximum regret of each strategy and then taking the minimum of these.Minimax is still very cautious but less so than the maximin.4. Dynamic one-off GamesA game can be dynamic for two reasons. First, players may be ableto observe the actions of other players before deciding upon theiroptimal response. Second, one-off game may be repeated a number of times.4.1 Extensive Form GamesDynamic games cannot be represented by payoff matrices we have touse a decision tree (extensive form) to represent a dynamic game.Start with the concept of dynamic one-off game the game can beplayed for only one time but players can condition their optimal actions on what other players have done in the past.Suppose that there are two firms (A and B) that are considering whether or not to enter a new market. If both firms enter the market,then they will make a loss of $10 mil. If only one firm enters the market, it will earn a profit of $50 mil. Suppose also that Firm B observes whether Firm A has entered the market before it decides what to do.Any extensive form game has the following four elements in common:Nodes: This is a position where the players must take a decision.The first position is called the initial node, and each node is labelled so as to identify who is making the decision.Branches: These represent the alternative choices that the person faces and so correspond to available actions.Payoff Vectors: These represent the payoffs for each player, with the payoffs listed in the order of players. When we reach a payoffvector the game ends.In period 1, Firm A makes its decisions. This is observed by Firm B which decides to enter or stay out of the market in period 2. In this extensive form game, Firm B’s decision nodes are the sub-game. This means that firm B observes Firm A’s action before making its own decision.4.2 Subgame Perfect Nash EquilibriumSubgame perfect Nash equilibrium is the predicted solution to a dynamic one-off game. From the extensive form of this game, we can observe that there are two subgames, one starting from each of Firm B’s decision nodes.How could we identify the equilibrium outcomes?In applying this principle to this dynamic game, we start with the last period first and work backward through successive nodes until we reach the beginning of the game.Start with the last period of the game first, we have two nodes. At each node, Firm B decides whether or not entering the market based on what Firm A has already done.For example, at the node of “Firm A enters”, Firm B will either make a loss of –$10mil (if it enters) or receive “0” payoff (if it stays out); these are shown by the payoff vectors (-10, -10) and (50, 0). If Firm B is rational, it will stays outThe node “Firm A enters” can be replaced by the vector (50, 0).At the second node “Firm A stays out”, Firm A h as not entered the market. Thus, Firm B will either make a profit of $50mil (if it enters) or receive “0” payoff (if it stays out); these are shown by the payoff vectors (0, 50) and (0, 0). If Firm B is rational, it will enter thus we could rule out the possibility of both firms stay outWe can now move back to the initial node. Here Firm A has to decide whether or not to enter. If Firm B is rational, it is known that the game will never reach the previously “crossed” vectors. Firm A also knows that if it enters, the game will eventually end at (A enters, B stays out) where A gets 50 and B gets 0. On the other hand, if Firm A stays out, the game will end at (A stays out, B enters) where A gets 0 and B gets 50 Firm A should enter the market at the first stage. The eventual outcome is (A enters, B stays out)How to find a subgame perfect equilibrium of a dynamic one-off game?1. Start with the last period of the game cross out the irrelevant payoff vectors.2. Replace the preceding nodes by the uncrossed payoff vectorsuntil you reach the initial node.3. The only uncrossed payoff vector(s) is the subgame perfect Nash equilibrium.。

《博弈论基础》读书笔记(一)博弈标准式与纳什均衡

《博弈论基础》读书笔记(一)博弈标准式与纳什均衡

《博弈论基础》读书笔记(⼀)博弈标准式与纳什均衡在之前⼀个⽼师的安利下,还是开了这个博弈论的坑。

书是:这本书本⾝写的⾮常棒,⽽且很易懂,强烈安利。

顺便⾃⼰记录下读书的笔记和⼀些想法,同时也把书中⽐较难理解的地⽅⽤⾃⼰的理解说⼀下,希望能帮到⼤家。

第⼀章 1完全信息静态博弈在本章,我们来讨论如下简单形式的博弈(包含如下特点):1. 静态博弈:所有游戏的参与者同时选择⾏动,然后根据⾏动每个参与者得到各⾃的结果2. 完全信息博弈:即每⼀个参与者的收益函数在所有参与者之间是共同知识,即不存在信息的不对称性,也就是说每个参与者对游戏规则以及游戏演化机理完全明⽩。

关于本章的结构:在1.1节中我们先会介绍两个问题:1. 如何描述⼀个博弈问题2. 如何求得博弈问题的解在1问题中我们定义了博弈的标准式表述和严格劣战略的概念,在2问题中我们根据前⾯的介绍引出了纳什均衡的概念。

在1.2节中我们会运⽤前⾯的⼯具来分析古诺(Cournot,1838)的不完全竞争模型,使⽤纳什均衡的⽅式对之进⾏求解,之后我们将重回理论知识,我们将会定义混合战略,它可以理解为⼀个参与者并不能确定其他参与者会如何⾏动时应该选的战略,之后会引出纳什定理。

1.1节博弈的标准式和纳什均衡1.1.A 博弈的标准式表述⾸先举⼀个⼤家都⽐较熟悉的、很经典的例⼦:囚徒困境警⽅逮捕甲、⼄两名嫌疑犯,但没有⾜够证据指控⼆⼈⼊罪。

于是警⽅分开囚禁嫌疑犯,分别和⼆⼈见⾯,并向双⽅提供以下相同的选择:若⼀⼈认罪并作证检控对⽅(相关术语称“背叛”对⽅),⽽对⽅保持沉默,此⼈将即时获释,沉默者将判监10年。

若⼆⼈都保持沉默(相关术语称互相“合作”),则⼆⼈同样判监1年。

若⼆⼈都互相检举(相关术语称互相“背叛”),则⼆⼈同样判监8年。

对于这个博弈我们可以来使⽤如下矩阵来进⾏描述对于这个矩阵,其横纵轴分别为囚徒1、2所对应的选择。

⽅框⾥的值第⼀项代表在此选择下,囚徒1 的收益情况,第⼆项代表囚徒2的收益情况。

博弈论基础之sg函数与nim

博弈论基础之sg函数与nim

博弈论基础之sg函数与nim 在算法竞赛中,博弈论题⽬往往是以icg。

通俗的说就是两⼈交替操作,每步都各⾃合法,合法性与选⼿⽆关,只与游戏有关。

往往我们需要求解在某⼀个游戏或⼏个游戏中的某个状态下,先⼿或后⼿谁会胜利的问题。

就⽐如经典的:⼏堆⽯⼦,两⼈可以分别拿若⼲个,⼀次只能选择⼀个⽯⼦堆操作,问给定状态下,先⼿胜利还是后⼿胜利? ⽽nim与sg函数就是对于这类问题的解法,在我的理解看来,sg函数和nim分别对应不同阶段的决策:前者对于单个游戏决策,后着是将这些单个游戏综合起来的整体决策。

⼀、状态与转移 icg游戏往往可以分为两个部分,规则与局⾯。

⽽这两个分别对应了转移与状态。

规则决定了状态转移的合法性,状态是转移的基本。

什么是状态?状态是⼀个静态的局⾯。

就好⽐当下棋时的局⾯⼀样。

在游戏的每个阶段,不论是开始,中间,或是结束。

每⼀个局⾯都对应了⼀种状态。

什么是状态的转移?单个分开的局⾯⽆法构成⼀个完整的游戏,所以就需要从某⼀个状态转移到另⼀个状态,来进⾏⼀次操作。

举个例⼦:有5个⽯⼦放在⼀堆。

5个⽯⼦就是⼀种状态,在不受限制下,你可以改变这个状态。

例如:取⾛4个⽯⼦。

就是将5个⽯⼦这个状态转移到1个⽯⼦这个状态,操作就是取⾛4个⽯⼦。

⽽这个操作的合法性取决于游戏的规则。

例如:⼀次最多取3个⽯⼦。

那么上条操作取4个⽯⼦就是⼀次不合法的操作,意味着你不能从5这个状态直接转移到1这个状态。

那么对于5个⽯⼦,每次最多取三个,从中我们可以得到如下状态转移的图(有向)⼆、sg函数 概念 ⾸先,引⼊mex值的概念。

mex是指不属于集合中整数的最⼩正整数。

⽽sg值就是不属于后继集合的最⼩正整数。

例如上图中:0没有后继元素所以最⼩正整数为0,sg(0)=0; 1后继元素只有0,不属于后继集合的最⼩正整数为1,sg(1)=1; 同理可得sg(2)=2;sg(3)=3; 到4的时候,情况就发⽣了变化。

博弈论基础

博弈论基础

博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

参见:行为生态学(behavioral ecology)。

约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

博弈问题总结(基础篇)

博弈问题总结(基础篇)

博弈问题总结(基础篇)博弈问题总结(基础篇)前⾔最近做的博弈问题的题⽐较多,所以我就汇总了⼀下博弈问题的⼏种题型,⽅便之后的做题博弈论定义博弈论就是指有若⼲个⼈进⾏⼀些对弈,并且默认每个⼈都是最聪明的,不会失误,都可以找到当前的最优解,然后来寻找有没有哪个⼈有必胜/必败的的策略。

A、尼姆博弈为什么叫尼姆博弈呢?因为这是尼姆(英⽂名:Nimm Game)发明的数学游戏。

博弈模型有n堆各若⼲个物品,两个⼈轮流从某⼀堆取任意多的物品,规定每次⾄少取⼀个,多者不限,最后取光者得胜。

分析我们先考虑简单的情况1、n=1这时先⼿必胜,因为他只需要把唯⼀的这⼀堆⽯⼦取⾛就可以了2、n=2若a[1]=a[2],先⼿必败,因为⽆论先⼿在哪⼀堆⽯⼦中取⾛⼏个,后⼿总能在另⼀堆⽯⼦中取⾛相同的个数若a[1]!=a[2],我们假设a[1]>a[2],此时先⼿必胜,因为先⼿可以在第⼀堆⽯⼦中取⾛a[1]-a[2]个,这时两堆⽯⼦的个数相同,下⼀次⽆论后⼿取⾛多少个,先⼿都可以在另⼀堆取⾛同样多个,因此先⼿必胜若a[1]<a[2],同上,先⼿必胜3、要是n=3或者更⼤呢?我们显然不能像上⾯⼀样去枚举每种情况,所以我们要得出⼀个更为⼀般的结论我们设总共有n堆⽯⼦,每⼀堆⽯⼦的个数分别为a[1]、a[2]、a[3]……a[n]若a[1] ^ a[2] ^ a[3] ^ …… ^ a[n] =0先⼿必败,反之先⼿必胜下⾯是证明如果异或和的最⾼位为i,那么必定有⼀堆⽯⼦的第 i 位为1我们设这⼀堆⽯⼦的个数为k,其它所有⽯⼦的异或和为m,总异或和为x则必定有k ^ m=x,我们把这⼀堆⽯⼦变成k^x(k ^ x) ^ m=0这时,所有⽯⼦的异或和都变成了0举个例⼦:11001 ^ 11100=00101,则有(11001 ^ 00101)^ 11100=0如果当前所有数字的异或和为0,那么下⼀次⽆论你怎么取⽯⼦,异或和⼀定不会为0这样我们可以得出结论:如果先⼿异或和不为0,可以⼀步让后⼿的情况为异或和为0;如果先⼿异或和为0,那么后⼿异或和就不为0这样,我们不断进⾏游戏,最终⼀定会达到所有的数都为0的情况,⽽最后⾯对这种情况的⼀定会输所以我们可以得出结论:若a[1] ^ a[2] ^ a[3] ^ …… ^ a[n] =0先⼿必败,反之先⼿必胜例题洛⾕P2197模板题(好裸的板⼦)题意甲,⼄两个⼈玩 Nim 取⽯⼦游戏。

中央与地方政府基础设施投资的博弈分析

中央与地方政府基础设施投资的博弈分析

中央与地方政府基础设施投资的博弈分析引言基础设施是一个国家经济发展的重要支撑,对于促进经济增长、提高生产力和改善居民生活质量都起着关键作用。

在中国,基础设施建设是中央与地方政府共同参与的领域。

然而,由于中央与地方政府间利益的差异,基础设施投资往往涉及到博弈与权衡。

本文旨在通过对中央与地方政府基础设施投资的博弈分析,探讨双方的利益冲突和协作,以期为政府决策提供参考。

中央政府的权力与目标作为国家的最高权力机构,中央政府在基础设施投资中具有重要的决策权。

中央政府的目标通常是促进全国经济的均衡发展,提高国家整体竞争力,并维护国家的统一和稳定。

中央政府在基础设施投资中的主要关注点包括国家重点项目、交通基础设施等。

中央政府的优势在于控制着各种资源和资金,可以通过制定政策、调控资金流动等手段来影响地方政府的投资决策。

然而,中央政府也面临着一些限制和挑战。

一方面,中央政府需要平衡各地方政府之间的利益分配,避免引发地方政府的不满和抵制。

另一方面,中央政府的资金和资源有限,需要谨慎选择投资项目,确保能够取得最大的经济效益和社会效益。

地方政府的权力与利益与中央政府相比,地方政府在基础设施投资中更加了解本地区的实际情况和需求。

地方政府的目标通常是推动地方经济发展,吸引投资和人才,提高本地区的竞争力和发展潜力。

地方政府在基础设施投资中的主要关注点包括地方重点项目、基础设施建设等。

地方政府的优势在于对本地经济和社会环境的了解更加深入,可以更好地满足本地区的需求和促进发展。

地方政府在基础设施投资中也有一定的自主权,可以根据本地区的需求和特点进行合理的决策。

然而,地方政府也面临着一些限制和挑战。

一方面,地方政府的资金和资源相对较少,往往需要依赖中央政府的支持和调配。

另一方面,地方政府在投资决策中需要考虑本地区的利益,避免给本地区带来不必要的经济和社会负担。

中央与地方政府的利益冲突与协作中央与地方政府在基础设施投资中存在着一定的利益冲突和博弈。

博弈论基础知识汇总

博弈论基础知识汇总

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。

一种是“进化博弈论方法”。

它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。

另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

博弈论看法博弈论的基本假设:参与人追求利润最大化。

博弈模型扩展式 -回复

博弈模型扩展式 -回复

博弈模型扩展式-回复什么是博弈模型扩展式?博弈模型扩展式是指在传统的博弈模型基础上,通过增加相关规则、参与者或策略等因素,对博弈模型进行扩展和延伸的一种理论框架。

扩展式的博弈模型可以更好地描述现实世界中的复杂决策场景,使得博弈论在经济学、管理学、政治学等领域的应用更为广泛。

一、基础的博弈模型在介绍博弈模型扩展式之前,我们先简要回顾一下基础的博弈模型。

基础的博弈模型主要由参与者、策略和收益函数构成。

参与者根据收益函数和其他参与者的策略来选择自己的策略,并且最终根据收益函数来分配收益。

传统的博弈模型包括纳什均衡、博弈矩阵和博弈树等。

但是这些模型在描述现实中一些复杂情况时存在局限性。

二、增加的参与者在博弈模型中,我们可以通过增加参与者的数量来扩展博弈模型。

通常,博弈模型中的参与者被视为独立决策实体,他们根据自己的利益来选择策略。

然而,在现实生活中,存在许多博弈模型中没有考虑到的共同利益或合作关系。

因此,将更多的参与者纳入博弈模型可以更好地反映出现实情况中的决策情景。

例如,在环境保护领域的博弈中,传统模型只考虑了公司在追求利润最大化的同时对环境的影响。

然而,在现实中,政府和非政府组织等参与者对环境保护同样关注。

因此,我们可以通过增加政府和非政府组织等参与者,构建一个多参与者博弈模型,以更好地分析环境保护政策的制定和实施。

三、引入动态策略除了增加参与者,我们还可以通过引入动态策略来扩展博弈模型。

在传统的博弈模型中,参与者只能在某个时刻选择自己的策略,并且这个选择是一次性的,不可更改的。

然而,在现实生活中,很多决策是连续的,参与者可以根据其他参与者的策略变化来调整自己的策略。

例如,在股市投资中,投资者的决策往往是连续的,他们会根据市场走势和其他投资者的行为来调整自己的投资策略。

因此,我们可以通过引入动态策略,构建一个连续时间博弈模型,以更好地分析股市中的投资决策。

四、考虑不完全信息博弈模型扩展式还可以考虑参与者之间的信息不对称问题。

基础博弈 (1)

基础博弈 (1)

• 例题:HDU 1849
本次课程结束,谢谢
• 总结:
• 当n=(m+1)*r+s(s!=0)时,即n%(m+1)!=0,先手必 胜 • 当n=(m+1)*r+s(s==0)时,即n%(m+1)==0,后手必 胜 如果结果改为最后取完的人输呢? 当(n-1)%(m+1)!=0时,先手必胜。 当(n-1)%(m+1)==0时,后手必胜。
例题:HDU 1846
基础博弈
by:Miki
博弈问题 • 1.博弈模型为两人轮流决策的非合作博弈。 即两人轮流进行决策,并且两人都使用最优 策略来获取胜利。 • 2.博弈是有限的。即无论两人怎样决策,都 会在有限步后决出胜负。 • 3.公平博弈。即两人进行决策所遵循的规则 相同。 • 4.当一方无法将游戏继续进行时,游戏结束 ;同时,对方为获胜者。 • 5.双方采取最优策略。
巴什博奕(Bash Game)
• 问题模型:只有一堆n个的物品,两个人轮流从这 堆物品中取出物品,规定每次至少取一个,最多 取m个,最后取完物品者获胜。
假设n=(m+1)r+s。 1.当s不等于0时,先手要拿走s个物品,此时后手 处于在剩余(m+1)r个物品的状态进行取物品。假 设后手取k个物品(1<=k<=m),则先手应该采取的 决策是取走m+1-k个,此时让后手处于(m+1)(r-1) 个物品的状态,如此下去,先手就可以去到最后 一个物品,并获得胜利。 当s等于0时,后手采用1中的方法使得自己获胜。
使得非平衡状态变成平衡状态的取物品方法: 若全部堆异或的结果为X(X>0)。X的二进制表示下 最右边的1在第k位,则在全部堆一定存在一个第k位 为1的子堆。假设这堆物品为Y,则只要将这堆拿成 Z=Y xor X(xor:异或)个 。

博弈论基础 本讲要点博弈论的基本思想,博弈的构成要素,简单博弈的

博弈论基础 本讲要点博弈论的基本思想,博弈的构成要素,简单博弈的

博弈论基础本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。

重点:博弈论的基本思想,纳什均衡的概念,信息不对称。

难点:博弈的构成要素,纳什均衡的概念。

讲授时间:6学时一、博弈的基本要素1、博弈论与古典经济学的区别古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。

博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。

两者的根本区别:是否考虑对方的行为。

古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。

消费者A不会考虑消费者B的影响。

古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。

厂商A不会考虑厂商B的影响。

古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。

国家A不会考虑国家B的影响。

博弈论:每个人要考虑别人的行为怎样影响自己的选择。

扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。

下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。

高手与俗手的区别也就在此。

高手往往能够考虑10步甚至20步以后的变化。

总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。

2、博弈论简史博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and EconomicBehavior)一书,最早提出了博弈论的概念。

gibbons博弈论基础

gibbons博弈论基础

gibbons博弈论基础
《博弈论基础》是Robert Gibbons编著的一本书,博弈论是研究多人决策问题的理论,在经济学、管理学等领域有广泛应用。

在微观研究领域,交易机制的模型(诸如讨价还价模型和拍卖模型)就涉及博弈论;在中观经济研究中,劳动力经济学和金融理论都有关于企业要素投入品市场(而非寡头垄断模型中的产出品市场)的博弈论模型;从宏观的角度看,国际经济学中有关于国家间的相互竞争(或互相串谋),选择关税或其他贸易政策的模型;宏观经济学中也有货币当局和工资、价格制定者(厂商等微观单位)间的战略相互影响,最终决定了货币政策效果的模型。

博弈论在各个领域都有广泛的应用,学习《博弈论基础》可以帮助我们更好地理解和应对复杂的决策问题。

吉本斯《博弈论基础》课后习题答案

吉本斯《博弈论基础》课后习题答案
beckham232911net21在第二阶段企业2和企业3决策q2232102022cqqqqqamaxqmaxqmaxqmaxq????3332103033cqqqqqa????得反应函数????33c1312qaqqca2第一阶段企业1的决策1?qcaq11321cqqqqqamax?????01??将3132qcaqq??代入得21?632caqq?27采用逆向归纳法1第一阶段企业最大化其收益11?2102111?????????????nwanlnwallllwallwallwlalwlalinijjiijjiinjiinjii2第二阶段工会最大化其收益21waawnwanwawlwawmaxw?????所以企业数量不影响工会效用
对 于 2 来 说 , 4(1− p*) = 2 p* + 3(1− p*) , 得 p* = 1/ 3 。
则 原 博 弈 的 混 合 战 略 纳 什 均 衡 为 : { (1/3, 2/3, 0), (2/3, 0, 1/3) }。 1.12 按 照 1.11 的 解 法 , 可 得 混 合 战 略 纳 什 均 衡 为 : { (2/3, 1/3), (3/4, 1/4) }。 过 程 略 。 1.13 此博弈有两个纯战略纳什均衡、一个混合战略纳什均衡。 纯 战 略 纳 什 均 衡 为 :( 向 企 业 1 申 请 , 向 企 业 2 申 请 );( 向 企 业 2 申 请 , 向 企 业 1 申 请 )。 混合战略纳什均衡为:
为:
qm/2
qc
qm/2
π1 , π1
π2 ,π3
qc
π3 ,π2
π4 ,π4
因 为 π1 < π3 , π 2 < π 4 , 所 以 每 一 方 都 有 一 个 严 格 劣 战 略 , 即 qm/2, 从 而 最 后 的 均 衡 为

博弈基础实验

博弈基础实验

….
5.第2轮实验开始,出牌之前考虑2分钟,然
后亮出你的牌。出牌后不可以再更改。接下 来,由组织者宣布你和谁组成一组。 第3轮……实验也是重复第1轮实验的过程。 8轮实验结束后,做好相应的收益记录。 前8轮实验中,每轮实验两组成员都是随机 确定的。
6.8轮实验结束后,改变出牌的规则:
出牌情况汇总统计表(管理员填写)
时期 1 2 …… (红,红) (红,黑) (黑、黑)
四、奖励原则
此次实验奖励如下:
收益最大前30%的同学予以分级奖励
2元,你出黑牌,另一位同学出黑牌;
实验过程与前8轮的相同。
时期
你的牌 (红或 黑)
对手的 牌(红 或黑)
你的收 益

你在各期的总收益是: 姓名: 学号:
二、人员构成
1.实验参与者:
64人,分成两组;
2.管理员: 6人 3.如遇到实验中出牌对手缺席,则由管理员
代替缺席者进行随机抽牌。
4.出牌之前考虑2分钟,然后亮出你的牌。出
牌后不可以再更改。接下来,由组织者宣布 你和谁组成一组。
然后,由工作人员统计每组出牌的情况,即
(红牌,红牌)、(红牌、黑牌)、(黑牌、 黑牌)的数字。 实验参加者做好自己的收益记录。
时期
1
2 3
你的牌 对手的牌 你的收益 (红或黑)(红或黑)
博弈论实验
——博弈基础实验
一、实验过程介绍:
1.将一张红色和一张黑色扑克牌发给参加实
验的每位同学,牌上的数字和图案不重要, 关键看颜色; 2.参加实验的同学分成两组:A组和B组,两 组同学一一对应。相对应的同学即为你的对 手(对手关系在实验中临时决定) 。

吉本斯《博弈论基础》课后习题答案

吉本斯《博弈论基础》课后习题答案

对 于 2 来 说 , 4(1− p*) = 2 p* + 3(1− p*) , 得 p* = 1/ 3 。
则 原 博 弈 的 混 合 战 略 纳 什 均 衡 为 : { (1/3, 2/3, 0), (2/3, 0, 1/3) }。 1.12 按 照 1.11 的 解 法 , 可 得 混 合 战 略 纳 什 均 衡 为 : { (2/3, 1/3), (3/4, 1/4) }。 过 程 略 。 1.13 此博弈有两个纯战略纳什均衡、一个混合战略纳什均衡。 纯 战 略 纳 什 均 衡 为 :( 向 企 业 1 申 请 , 向 企 业 2 申 请 );( 向 企 业 2 申 请 , 向 企 业 1 申 请 )。 混合战略纳什均衡为:
{ } ((2w1 − w2 ) /(w1 + w2 ), (2w2 − w1) /(w1 + w2 )) ,((2w1 − w2 ) /(w1 + w2 ), (2w2 − w1) /(w1 + w2 ))
1.14
证 明 : 在 混 合 战 略 纳 什 均 衡 中 , 参 与 人 i 的 混 合 战 略 为 pi* , 其 中 选 择 第 j 个 纯 战 略 sij 的 概
目 要 求 , 即 ( qc , qc )是 唯 一 的 纳 什 均 衡 , 并 且 在 纳 什 均 衡 下 , 每 一 企 业 的 福 利 都 要 比 他 们 相
互合作时低,但两个企业都没有严格劣战略。 1.6
当 0 < c1, c2 < a / 2 时 , 易 求 均 衡 产 量 q1* = (a + c2 − 2c1) / 3 , q2* = (a + c1 − 2c2 ) / 3 。 而 当
为:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 必胜点&必败点概念 • 必败点(P点) :前一个选手(Previous player)将取胜的位置称为必败点。 • 必胜点(N点) :下一个选手(Next player) 将取胜的位置称为必胜点。 • (这概念太绕了) • 简单的描述 • P点: 即必败点,某玩家位于此点,只要 对方无失误,则必败; • N点: 即必胜点,某玩家位于此点,只要 自己无失误,则必胜。
• 威佐夫博奕(Wythoff Game) • 一样先看例题 • POJ 1067 取石子游戏 大意:有两堆石子,数量为A,B.两个玩家 轮流从中取石子,每次可从一堆中取若干 颗或从两堆中取相同数目石子, 最后取完者为胜,问先取者是否有必胜策 略?
• 先用之前学的分析下吧。 0 0 1 2 0 1 1 1 1 1 0 2 1 0 1 3 1 1 1 4 1 1 1 5 1 1 1
• 有了上面的理论支持和算法,自己思考下那题应 该怎么做吧。 • 课上具体讲解。 • 练习 • 1. /showproblem.php?pid= 1846 (brave game) • 2. /showproblem.php?pid= 2147 (kiki's game) • 3. /showproblem.php?pid= 2149 (public sale) • 4. /showproblem.php?pid= 2188 (选拔志愿者)
3
4 5
1
1 1
1
1 1
1
1 1
1
1 0
1
1 1
0
1 1
• 发现必败点(0,0)、(1,2)、(3,5)、(4,7)、 (6,10)、(8,13)、(9,15) (11,18)、(12, 20) 。 • 我们称这些叫做奇异局势,有多奇异呢? • 如下三条性质: • 1。任何自然数都包含在一个且仅有一个奇异局势中。 由于ak是未在前面出现过的最小自然数,所以有ak > ak-1 ,而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。所以 性质1。成立。 2。任意操作都可将奇异局势变为非奇异局势。 事实上,若只改变奇异局势(ak,bk)的某一个分量, 那么另一个分量不可能在其他奇异局势中,所以必然是非 奇异局势。如果使(ak,bk)的两个分量同时减少,则 由于其差不变,且不可能是其他奇异局势的差,因此也是 非奇异局势。
• 博弈王道——SG值 • 小菜对SG值理解很浅,那就简单介绍下 • 对每个局面和它的子局面连一条有向边来 抽象成这个“有向图游戏”。下 面我们就 在有向无环图的顶点上定义SpragueGarundy函数。首先定义mex(minimal excludant)运算,这是施加于一个集合的 运算,表示最小的不属于这个集合的非负 整数。例如mex{0,1,2,4}=3、 mex{2,3,5}=0、mex{}=0。 • SG值:一个点的SG值就是一个不等于它的 后继点的SG值且大于等于零的最小整数。
• 经过别人发现(不会证明) • 任何奇异局势(a,b,c)都有a^b^c =0。 • 显然如果要转化成奇异局势只要你拿完的 这一堆的数量和其他堆异或的结果一样, 就是c=a^b;因为你只能减少不能增加,所 以只要c>a^b;就能转移,就是必胜点。 (真的好神奇,后面的组合博弈也要用到 这个) • 证明在课件的那篇<由感性认识到理性认识 >里面有。
• 尼姆博奕(Nimm Game) • 先看一题例题(hdu1850) • 下面是一个二人小游戏:桌子上有M堆扑克 牌;每堆牌的数量分别为Ni(i=1…M);两 人轮流进行;每走一步可以任意选择一堆 并取走其中的任意张牌;桌子上的扑克全 部取光,则游戏结束;最后一次取牌的人 为胜者。 现在我们不想研究到底先手为胜还是为负, 我只想问大家: ——“先手的人如果想赢,第一步有几种 选择呢?”
• 这题是一题典型的组合游戏 • 神马是组合游戏? (1) 有两个玩家; (2) 游戏的操作状态是一个有限的集合(比如: 限定大小的棋盘); (3) 游戏双方轮流操作; (4) 双方的每次操作必须符合游戏规定; (5) 当一方不能将游戏继续进行的时候,游戏 结束,同时,对方为获胜方; (6) 无论如何操作,游戏总能在有限次操作后 结束;

这种情况最有意思,它与二进制有密切关 系,先看只有三堆的情况,我们用(a,b, c)表示某种局势,首先(0,0,0)显然 是奇异局势,无论谁面对奇异局势,都必 然失败。第二种奇异局势是(0,n,n), 只要与对手拿走一样多的物品,最后都将 导致(0,0,0)。仔细分析一下,(1,2, 3)也是奇异局势,无论对手如何拿,接下 来都可以变为(0,n,n)的情形。 (位 运算的强大啊,膜拜仙茂神牛)
基础博弈
by许一鸣
• 巴什博奕(Bash Game)
• 先看一题例题 各位勇敢者要玩的第一个游戏是什么呢? 很简单,它是这样定义的: 1、 本游戏是一个二人游戏; 2、 有一堆石子一共有n个; 3、 两人轮流进行; 4、 每走一步可以取走1…m个石子; 5、 最先取光石子的一方为胜;
如果游戏的双方使用的都是最优策略,请 输出哪个人能赢。
• 更简单的描述 • 在步骤允许的情况下,与前面一个必败点的差(也就是说 这个差是规定的、能走的、其中一个改变的值)! • 举例(hdu1847) • 作为计算机学院的学生,Kiki和Cici打牌的时候可没忘记 专业,她们打牌的规则是这样的: 1、 总共n张牌; 2、 双方轮流抓牌; 3、 每人每次抓牌的个数只能是2的幂次(即:1,2,4, 8,16…) 4、 抓完牌,胜负结果也出来了:最后抓完牌的人为胜者; 假设Kiki和Cici都是足够聪明(其实不用假设,哪有不聪 明的学生~),并且每次都是Kiki先抓牌,请问谁能赢呢? 当然,打牌无论谁赢都问题不大,重要的是马上到来的 CET-4能有好的状态。
• • • •
这题的SG值(从2开始) num: 2 3 4 5 6 7 8 9 10 sg值: 2 0 1 2 0 1 2 0 1 这里就很明白那个差值了。那么这个差值怎么算 呢? • 这个就有一种神奇的集合运算 • mex(minimal excludant)运算,这是施加于一个 集合的运算,表示最小的不属于这个集合的非负 整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、 mex{}=0。(不明白为什么这么算就是那个差值, 求解释,我只会记忆化搜那个差值)

3。采用适当的方法,可以将非奇异局势变为奇 异局势。 • 假设面对的局势是(a,b),若 b = a,则同 时从两堆中取走 a 个物体,就变为了奇异局势 (0,0);如果a = ak ,b > bk 那么,取走b bk个物体,即变为奇异局势;如果 a = ak , b < bk 则同时从两堆中拿走 ak - ab - ak个物体变为 奇异局势( ab - ak , ab - ak+ b - ak)如果a > ak ,b= ak + k 则从第一堆中拿走多余的数量a ak 即可;如果a < ak ,b= ak + k,分两种情况, 第一种,a=aj (j < k)从第二堆里面拿走 b - bj 即可;第二种,a=bj (j < k)从第二堆里面拿走 b - aj 即可。(证明直接可以看表格,这些公式 不知道怎么来的,不过知道到一点就可以了,非 奇异局面就是必胜点,因为可以转移到必败点)
• 对于n堆石头,设它们对应的顶点的SG值 分别为(a1,a2,…,an),再设局面 (a1,a2,…,an)时的Nim游戏的一种必胜策略 是把ai 变成k,那么原游戏的一种必胜策略 就是把第i枚棋子移动到一个SG值为k的顶 点。这听上去有点过于神奇——怎么绕了 一圈又回到Nim游戏上了。 • 对了,由SG值又回到了nim游戏上,那么 整个游戏的胜利与否就又回到了神奇的位 运算异或,所有SG值异或后就是这个局面 的结果了(这题数据太大,但SG值可以找 到规律)
• 最奇异的来了 • 那么任给一个局势(a,b),怎样判断它是不是 奇异局势呢?我们有如下公式: • ak =[k(1+√5)/2],bk= ak + k (k=0,1, 2,…,n 方括号表示取整函数) 奇妙的是其中出现了黄金分割数(1+√5)/2 = 1。 618…,因此,由ak,bk组成的矩形近似为黄金矩形, 由于2/(1+√5)=(√5-1)/2,可以先求出j=[a (√5-1)/2],若a=[(1+√5)/2],那么a = aj,bj = aj + j,若不等于,那么a = aj+1,bj+1 = aj+1+ j + 1,若都不是,那么就不是奇异局势。然后再 按照上述法则进行,一定会遇到奇异局势。
• P/N三定理 (1) 所有终结点是必败点(P点);
(2) 从任何必胜点(N点)操作,至少有一种 方法可以进入必败点(P点); (3)无论如何操作, 从必败点(P点)都只能 进入必胜点(N点).
• 算法实现
步骤1:将所有终结位置标记为必败点(P点);
步骤2: 将所有一步操作能进入必败点(P点) 的位置标记为必胜点(N点) 步骤3:如果从某个点开始的所有一步操作都 只能入必胜点(N点) ,则将该点标记 为必败点(P点) ; 步骤4: 如果在步骤3未能找到新的必败(P 点),则算法终止;否则,返回到步骤2。
• 以前师兄留的作业 • (前面几个应该秒杀) Poj 2975 Hdu 2176 Ural 1023 Poj 2505 Hdu 3032 Hdu 1536 Hdu 1907 Zoj 1024 Poj 1704 Poj 2425 Hoj 2849 Hoj 2654 Hoj 2533 Zoj 1913
• 最后看看组合博弈(SG值的运用) • hdu 3032 Nim or not Nim? • 给出n堆石头,每次能从一堆石头中取出任 意个石头 或者将一堆大于等于2的石头分成 两堆石头(不为0) • 谁最后无法决策了谁输 • 这是题简单的组合博弈题,有n个子问题但 这题子问题都一样,两种操作。 • 下面先看看组合博弈的一般算法
相关文档
最新文档