计算机博弈原理与方法学概述精品PPT课件
博弈论基础PPT精品课程课件全册课件汇总
自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。
博弈论讲义完整PPT课件
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
博弈论完整版PPT课件
ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
博弈论PPT资料整理
博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。
博弈论ppt课件
精选课件ppt
7
囚徒B 坦白
不坦白
囚徒A
坦白 -8,-8 0,-10
不坦白 -10,0 -1,-1
精选课件ppt
8
博弈的分类
ห้องสมุดไป่ตู้
1、从行动的先后次序来分,博弈可以分为 静态博弈 和 动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或虽非同 时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈指的是参与人的行动有先后顺序,且后行 动者能够观察到先行动者所选择的行动的博弈。
21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔
奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是
博弈。
精选课件ppt
6
著名的“囚徒困境”的例子
警察抓住了两个罪犯,但是警察局却缺乏足够的证据 指证他们所犯的罪行。如果罪犯中至少有一人供认犯 罪,就能确认罪名成立。为了得到所需的口供,警察 将这两名罪犯分别关押防止他们串供或结成攻守同盟, 并分别跟他们讲清了他们的处境和面临的选择:如果 他们两人都拒不认罪,则他们会被以较轻的妨碍公务 罪各判一年徒刑;如果两人中有一人坦白认罪,则坦 白者立即释放而另一人将重判10年徒刑;果两人都坦 白认罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放 弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说 比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分 配。这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0) 或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时 给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号) 来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己 的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号 能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分 给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2, 0)或(97,0,1,0,2)。
博弈论最全完整-讲解课件
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
学习交流PPT
17
约翰· 海萨尼 1920年 生于美 国
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
学习交流PPT
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和 美国人威廉-维克瑞(William Vickrey)
托马斯·谢林
学习交流PPT
24
导论
三、博弈论的基本类型
学习交流PPT
25
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding
agreement),强调团体理性,强调效率、公 正、公平 • 非合作博弈(non-cooperative game)
强调个人理性,其结果可能有效率,也可能 无效率。
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分 析”领域做出了重要贡献。
学习交流PPT
21
迈克尔·斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所
• 也就是说,需要的是对这样的情况下该选什么 的预期的收敛。这一使得参与者能够成功合作 的共同预期的策略被称为焦点。心有灵犀一点 通。
计算机博弈原理与方法学概述
精品课件
亚马逊(Yamazons)
• 1988, Walter Zamkauskas, Argentina 发明.
• 每方4个国际象棋的“后” • 每个着法包括移动和设障 • 各方争取更大的活动范围 • 也是一种憋死牛的游戏 • 无子可动一方判负
精品课件
华容道——滑块类游戏
过多的知识; 5. 变化无穷(很难走出同样的棋谱),激发创新,一种智
力游戏。
精品课件
中国象棋(Chinese Chess)
精品课件
• 棋盘 9×10 • 棋子:红黑各7
个兵种,16子
• 各兵种的行棋规 则和活动范围
• 胜负判定准则 • 长将、长拖… • 时间约束 • 60步不吃子判和
国际象棋(Chess)
•
国外的:点格棋,苏拉卡尔塔,亚马逊
• 单人游戏:华容道
精品课件
人们为什么喜欢下棋?
1. 目的在决出胜负,比出高低,并关联某种收获(物质的, 精神的);
2. 规则简单明确,成功与失败的判定标准简单; 3. 博弈过程透明、公平,不包含任何机会或偶然性(不公
平点——先手优势); 4. 智力和经验决定胜负,问题的解决在认识意义上不需要
精品课件
二虎棋
• 布阵之后双方轮流走子,开局 第一着棋由虎方先走。
• 犬方每次只走一个子到临近空 棋位。虎方同。
• 虎方可跳吃,每次只吃一子。 • 虎方吃够一定数量的犬方棋子
就算获胜; • 犬方以围困虎方为目的,当虎
方的全部棋子无法走动时才算 犬方获胜。
精品课件
三通棋
• 全盘含有64个小正三角 形,即64个棋位。
精品课件
六子棋(Connect 6)
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
《博弈论入门》PPT课件
在不同博弈中可供博弈方选择的策略或行为的数量 很不相同,在同一个博弈中,不同博弈方的可选策 略或行为的内容或数量也常不同,有时只有有限的 几种,甚至只有一种,而有时又可能有许多种,甚 至无限多种可选策略或行为。
精选PPT
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
某个综艺节目现场,女主持人气势咄咄的问一个男嘉宾,你 为什么那么在乎钱,男嘉宾说:“钱能买到一切!” 现场的观 众哗然了。
男嘉宾微笑的说:“我们做个测试吧。”
一个很简单的主题,你的一个仇人爱上了你的女友,现在
局中人所选择的策略构成的组合(招,招)被称为 博弈均衡。
精选PPT
21
参与人(Players)
即在所定义的博弈中究竟有哪几个独立决策、独立 承担结果的个人或组织。
对我们来说,只要在一个博弈中统一决策,统一行 动、统一承担结果,不管一个组织有多大,哪怕是 一个国家,甚至是由许多国有组成的联合国,都可 以作为博弈中的一个参加方。并且,在博弈的规则 确定之后,各参加方都是平等的,大家都必须严格 按照规则办事。
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有点
呆住了,一个女孩子站起来说:“如果一个男人肯出
五百万,我想我没有理由拒绝他。”沉默..................
精选PPT
26
男人选择了金钱,500万可以买一套房子,一部车子,全家 过上好曰子,甚至可以开始自己的事业。一个男人说:“他是 我的仇人,我有了这个500万,我可以含辛茹苦,我可以报仇 ,我可以计划我所有的未来,当个真正主宰自己的男人。”一 些女人看着身边的男人,若有所思。
计算机博弈算法初步ppt课件
博弈树的复杂度
讲解 卢俊楷
计算机博弈入门 Computer Game Primer
极大极小思想(Minimax)
极小极大思想是指:始终站在博弈一方的立场上给棋局估值,有利于 这一方的棋局给予一个较高的价值分数,不利于这一方(即有利于另 一方)的给予一个较低的价值分数,双方优劣不明显的局面给予一个 中间价值分数。在博弈一方行棋的时候,选择价值极大的儿子节点走 步,其对手方行棋则选择价值极小的儿子节点走步。这就是一个极大 极小过程。
讲解 卢俊楷
计算机博弈入门 Computer Game Primer
蒙特卡罗方法(Monte Carlo)
方法:向正方形内随机投掷针,计算投进圆内的针的数量与总投掷数 量的比例,即为圆的面积与正方形面积的比例。随着投掷数量的不断 上升,其精确度也不断提升。
蒙特卡罗方法于20世纪40年代美国在第二次世界大战中研制原子弹 的“曼哈顿计划”计划的成员S.M.乌拉姆和J.冯·诺伊曼首先提出。数 学家冯·诺伊曼用驰名世界的赌城—摩纳哥的Monte Carlo—来命名 这种方法,为它蒙上了一层神秘色彩。在这之前,蒙特卡罗方法就已 经存在。1777年,法国数学家布丰提出用投针实验的方法求圆周率π。 这被认为是蒙特卡罗方法的起源。
计算机博弈入门computergameprimer讲解蒙特卡罗方法实质上是对以当前局面为根节点的博弈树中的所有叶节点迚行随机抽样通过大量的抽样令抽样结果中的胜负概率不所有叶节点中的胜负概率大致相同幵以此作为决策的依据
计算机博弈算法初步
讲解 卢俊楷
Computer Games
计算机博弈入门 Computer Game Primer
极大极小思想(Minimax)
Minimax算法是一个零总和算法,即一方要在可选的选项中选择将其 优势最大化的选择,另一方则选择令对手优势最小化的方法。而开始 的时候总和为0。
博弈论原理课件
下
1,0 -1,3
混合策略
纯策略:参与者在他的策略空间中选取惟 一确定的策略。
混合策略:参与者采取的不是惟一的策略, 而是其策略空间上的一种概率分布。
混合策略是我们做“石头、剪刀、布”游 戏时,经常采取的策略。
囚徒困境
例子
A
坦白
抵赖
B
坦白
抵赖
-3,-3 0,-6
-6,0 -1,-1
重复博弈
实验证明针锋相对策略,可选择“有效 率” 的策略。
针锋相对策略成功的例子
实行卡特尔 机票定价
序贯博弈
序贯博弈是指在博弈中,一个参与者先于另一个 参与者行动。
例子:
B
左
右
A
上
1,9
1,9
下
0,0
2,1
假定先由A先行动,B观察到A行动后再行动
扩展形式
上面博弈的扩展形式
×
1,9×
A
A先选“下”,B再选 “右”
19190021扩展形式1921序贯博弈的例子遏制进入29博弈论应用博弈论几乎可以应用于所有社会科学当然最先应用于杀害人类自己同类的事业战21000012混合策略求解2313a的反应曲线b的反应曲线混合策略求解11002313即三个交点
博弈论
博弈论又被称为对策论,是研究互动决策的理论。 所谓互动决策,即各行动方的决策是相互影响的, 每个人在决策的时候必须将他人的决策纳入自己的 决策考虑之中,当然也需要把别人对于自己的考虑 也要纳入考虑之中……在如此迭代考虑情形进行决 策,选择最有利于自己的战略。
纳什均衡
纳什均衡指的是这样一种战略组合,在给定别人 策略的情况下,没有人愿意改变自己的策略。
例子(划线求解,纵支付纵比,横支付横比) :
博弈论最全完整ppt-讲解
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
2021/3/11
34
课程主要内容
第一章 完全信息静态博弈 第二章 完全信息动态博弈 第三章 不完全信息静态博弈 第四章 不完全信息动态博弈 第五章 委托-代理理论 第六章 逆向选择与信号传递
通过几次严打来获得“冷面杀手”的声 誉
2021/3/11
11
导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
2021/3/11
12
导论
一、博弈均衡与一般均衡
2021/3/11
13
案例:囚犯困境
支付
嫌疑 人B
嫌疑人A
抵赖
坦白
抵赖 -1,-1 0,-9
坦白 -9,0 -6,-6
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
2021/3/11
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
托马斯·谢林
24
导论
三、博弈论的基本类型
2021/3/11
25
合作博弈与非合作博弈
合作博弈(cooperative game)
达成有约束力的协议(binding agreement),强调团体理性,强调效 率、公正、公平
非合作博弈(non-cooperative game)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机博弈原理与方法学概述
徐心和 徐长明
2010.01
主要内容
2.1 棋类介绍与分类 2.2 计算机博弈的基本原理 2.3 棋局要素的数据结构 2.4 棋局评估 2.5 博弈树展开与分析 2.6 计算机博弈求解的基本搜索方法 2.7 开局库与残局库 2.8 结语
东北大学机器博弈研究室
原理与方法学涵义
values of the other pieces are approximately as follows: knight 3, bishop 3, rook 5, and queen 9.
东北大学机器博弈研究室
围棋(Go / I-Go)
• 棋盘 19×19 • 轮流下子,谁占
的地盘多谁胜。 • 先下手为强,贴
东北大学机器博弈研究室
华容道——滑块类游戏
• Chinese Sliding Block Puzzle。 • 在国外将华容道和魔方、
独粒钻石并列,被誉为 “智力游戏界三大不可思 最大 的方块)移动到下面中央 的箭头处。
东北大学机器博弈研究室
棋的分类
• 按参与人数分类(Player):
双人:象棋,围棋,五子棋…… 单人:华容道 多人:跳棋
• 双人弈棋占绝大多数 • 一般说来,参与人数越多, 对手就越多,情况就越发复杂。
目(5-7)。 • 规则最简单,计
算机博弈难度最 大。 • 当前侧重解决1/4 棋盘 Go 9×9
东北大学机器博弈研究室
五子棋( FIR-Five In A Row )
• 起源于中国 • 发展在日本(连珠棋) • Renju / Go-Moku • 棋盘 15×15 • 已被证明先手胜 • 禁手 • 换手 • 金球制改进球制
东北大学机器博弈研究室
六子棋(Connect 6)
• 吴毅成教授发明 • 棋盘 19×19 • 6子连珠为胜 • 先手下一子,然后每手
下两子,削减先手优势 • 复杂度显著提高 • 台湾已经盛行 • 欧洲也很关注
东北大学机器博弈研究室
一字棋
• 走子的距离不限,至少走一步,至多走到终点。不准逆行。可以走动 任何一个棋位上的一个或多个棋子。但是必须停留在同一个目标棋位 上。最后到达目的地的为胜(负).
东北大学机器博弈研究室
人们为什么喜欢下棋?
1. 目的在决出胜负,比出高低,并关联某种收获(物质的, 精神的);
2. 规则简单明确,成功与失败的判定标准简单; 3. 博弈过程透明、公平,不包含任何机会或偶然性(不公平
点——先手优势); 4. 智力和经验决定胜负,问题的解决在认识意义上不需要过
多的知识; 5. 变化无穷(很难走出同样的棋谱),激发创新,一种智力
• 全盘含有64个小正三角 形,即64个棋位。
• 双方棋子各32枚。 • 开局后双方轮流布子,
每方每着棋布子1枚。 • 乙方有一次(只有一次)
连续下两着棋的权利。 • 当一方首先实现三通的
时候终局并获胜。
东北大学机器博弈研究室
点格棋(Dots and Boxes)
• 将邻近的两点连成一边,四 边构成方格;
• 最后一个占边者获取这个格 子。并要再连一边。
• 最后占据方格多者为胜。 • 关注死格(dead box)
双环(double cross) 长链 (long chain) 短链 (short chain) 环(circle )等。
东北大学机器博弈研究室
苏拉卡尔塔( Surakarta)
• 双方轮流走棋,不可不 走;
• 研究“带有普遍性的、最基本的、可以作为其它规律基础 的规律,具有普遍意义的道理”,研究在计算机博弈“学 科上所采用的研究方式、方法的综合”。
• 这里还仅仅是局限于完全信息的棋类博弈。 • 这是一次探索性的归纳与提升,肯定还有不少缺陷与不足,
今后还需要不断地完善和补充。 • 由于目前国际象棋的资料比较丰富,有关方法学的内容主
东北大学机器博弈研究室
• 车:横冲直撞 • 马:不怕蹩腿 • 象:可以过河 • 王:每步一格,不受区域限制 • 王一旦被杀,即为输棋 • 后 = 车+象,威力最大 • 兵:第一步可以走两格,吃过路兵;之后前走斜吃 • 王车易位(长易位,短易位);兵升变 • 相对子力值 :Assigning the pawn a value of 1, the
东北大学机器博弈研究室
二虎棋
• 布阵之后双方轮流走子,开局 第一着棋由虎方先走。
• 犬方每次只走一个子到临近空 棋位。虎方同。
• 虎方可跳吃,每次只吃一子。 • 虎方吃够一定数量的犬方棋子
就算获胜; • 犬方以围困虎方为目的,当虎
方的全部棋子无法走动时才算 犬方获胜。
东北大学机器博弈研究室
三通棋
要还是来自国际象棋的计算机博弈。
东北大学机器博弈研究室
2.1 棋类介绍与分类
• 首先需要了解我们研究的对象——棋类 • 不含牌,棋牌性质有很大的区别 • 一般说来:棋类——完全信息动态博弈
牌类——不完全信息动态博弈
东北大学机器博弈研究室
典型棋类介绍
• 中国象棋 • 国际象棋 • 围棋 • 五子棋、六子棋 • 各种民间棋类 • 中国的:牛角棋,一字棋,二虎棋,三通棋 • 国外的:点格棋,苏拉卡尔塔,亚马逊 • 单人游戏:华容道
游戏。
东北大学机器博弈研究室
中国象棋(Chinese Chess)
• 棋盘 9×10 • 棋子:红黑各7
个兵种,16子 • 各兵种的行棋规
则和活动范围 • 胜负判定准则 • 长将、长拖… • 时间约束 • 60步不吃子判和
东北大学机器博弈研究室
国际象棋(Chess)
王King K(1)、后Queen Q(1)、 车Rook R(2)、 象Bishop B(2)、 马Knight N(2)、兵Pawn P(8)
• 除了吃子之外,每个棋 子每步只能走一格,可 以沿垂直或 对角方向;
• 沿着弧吃子,而且必须 经过一个完整的弧。
• 吃掉所有对方棋子一方 获胜。
东北大学机器博弈研究室
亚马逊(Yamazons)
• 1988, Walter Zamkauskas, Argentina发明.
• 每方4个国际象棋的“后” • 每个着法包括移动和设障 • 各方争取更大的活动范围 • 也是一种憋死牛的游戏 • 无子可动一方判负