人工智能之与或图搜索问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈树特点
(1)博弈的初始状态是初始节点; (2)博弈树的“与”节点和“或”节点是逐层交替出
现的; (3)整个博弈过程始终站在某一方的立场上,所以能
使自己一方获胜的终局都是本原问题,相应的节 点也是可解节点,所有使对方获胜的节点都是不 可解节点。
路漫漫其悠远
例 Grundy博弈:分配物品的问题
如果有一堆数目为N的钱币,由两位选手轮流进 行分配,要求每个选手每次把其中某一堆分成数 目不等的两小堆,直至有一选手不能将钱币分成 不等的两堆为止,则判定这位选手为输家。
ni
i个
• 解图:
初始节点
路漫漫其悠远
目标
目标
能解节点
终节点是能解节点 若非终节点有“或”子节点时,当且仅当
其子节点至少有一能解时,该非终节点才 能解。 若非终节点有“与”子节点时,当且仅当 其子节点均能解时,该非终节点才能解。
路漫漫其悠远
不能解节点
没有后裔的非终节点是不能解节点。 若非终节点有“或”子节点,当且仅当所
路漫漫其悠远
MAX
从MAX方的角度来看:
所有属于MAX方的节点都是或节点
好招
理由:
因为扩展MAX方节点时,MAX方可选择扩展最 有利于自己的节点,只要可扩展的子节点中有 一个对已有利, 则该节点就对已有利。
路漫漫其悠远
总之: 从MAX方来说,与节点、或节点交替出现;反之, 从MIN方的角度来看,情况正好相反。
n3(4) n6(2) n8
目标
1 n4(1)
n8(0)
n7(0)
红色:5
黄色:6
2.3 博弈树搜索
博弈 是一类具有竞争性的智能活动
双人博弈:即两位选手对垒,轮流依次走步,
其中任何一方都完全知道对方过去已经走过的 棋步和今后可能的走步,其结果是一方赢(而另 一方则输),或双方和局
路漫漫其悠远
博弈的例子: ➢ 一字棋 ➢ 跳棋 ➢ 中国象棋 ➢ 围棋 ➢ 五子棋
n1 n3 n6
n7目标
路漫漫其悠远
n0
初始节点
n0
初始节点
n2 n5
n1 5
n4 n2(4) n5(1) 2
n3(4) n6(2) n8
目标
n4(1) n8(0)
n7(0)
红色:5
黄色:6
n1 n3 n6
n7目标
路漫漫其悠远
n0
初始节点
n0
初始节点
n2 n5
n1 5
n4 n2(4) n5(1) 2
设:K连接符 的耗散值为K
n1 n3
n0
初始节点
n1(2)
n2
n4
n5
n6
n7目标
路漫漫其悠远
n8
目标
n0
初始节点
n4(1) n5(1)
红色:4 黄色:3
n1 n3 n6
n7目标
n0
初始节点
n0
初始节点
n2 n5
n1 5
n4 n2(4)
n3(4)
n5(1)
n4(1)
n8
目标
红色:4 黄色:6
路漫漫其悠远
(5,1,1,MIN)
(4,2,1,MIN)
(3,2,2,MIN)
(3,3,1,MIN)
(4,1,1,1,MAX) (3,1,1,1,1,MIN)
(3,2,1,1,MAX)
(2,2,2,1,MAX)
目标
目标
两个过程
图生成过程,即扩展节点
从最优的局部途中选择一个节点扩展
计算耗散值的过程
对当前的局部图从新计算耗散值
路漫漫其悠远
n1
n3 n6
n7 目标
路漫漫其悠远
AO*算法举例
n0 初始节点
n2
n4
n5
n8
目标
其中:
h(n0)=3 h(n1)=2 h(n2)=4 h(n3)=4 h(n4)=1 h(n5)=1 h(n6)=2 h(n7)=0 h(n8)=0
人工智能之与或图搜索 问题
路漫漫其悠远
2020/4/15
2.1 基本概念
与或图是一个超图,节点间通过连接符连 接。
K-连接符:
路漫漫其悠远
…... K个
耗散值的计算
k(n, N) = Cn+k(n1, N)+…+k(ni, N) 其中:N为终节点集
Cn为连接符的耗散值
n
路漫漫其悠远
…...
n1 n2
路漫漫其悠远
在博弈树中,先行一方的初始状态对应着树的根 节点,而任何一方获胜的最终格局为目标状态, 对应于树的终叶节点(可解节点或本原问题)。
但 是 , 从 MAX 的 角 度 出 发 , 所 有 使 MAX 获 胜 的 状态格局都是本原问题,是可解节点,而使MIN 获胜的状态格局是不可解节点。
路漫漫其悠远
路漫漫其悠远
用数字序列加上一个说明来表示一个状态: (3, 2, 1, 1, MAX)
数字序列:表示不同堆中钱币的个数 说明:表示下一步由谁来分,即取MAX或MIN
路漫漫其悠远
现在取 N=7 的简单情况,并由MIN先分
(7,MIN)
所有可能的分法
(6,1,MAX)
(5,2,MAX)
(4,3,MAX)
路漫漫其悠远
为什么与节点、或节点隔层交替出现?
假设博弈双方为:MAX和MIN 在博弈过程中,规则是双方轮流走步。在博弈 树中,相当于博弈双方轮流扩展其所属节点。
路漫漫其悠远
从MAX方的角度来看:
MIN
所有MIN方节点都是与节点
好招
Biblioteka Baidu理由:
因为MIN方必定选择最不利于MAX方的方式来 扩展节点,只要MIN方节点的子节点(下出棋 局 ) 中 有 一 个 对 MAX 方 不 利 , 则 该 节 点 就 对 MAX方不利,故为“与节点”。
路漫漫其悠远
2.3 博弈树搜索
博弈问题
双人对弈,对垒的双方轮流走步; 信息完备,对垒双方所得到的信息是一样的,
不存在一方能看到,而另外一方看不到的情况; 零和,即对一方有利的棋,对另一方肯定是不
利的,不存在对双方均有利或均无利的棋,对 弈的结果是一方赢,而另一方输,或者双方和 棋。
路漫漫其悠远
有子节点均不能解时,该非终节点才不能 解。 若非终节点有“与”子节点时,当至少有 一个子节点不能解时,该非终节点才不能 解。
路漫漫其悠远
普通图搜索的情况
s
路漫漫其悠远
n
f(n) = g(n) + h(n) 对n的评价实际是对从s到n这条路 径的评价
与或图: 对局部图的评价
初始节点
c
a b
路漫漫其悠远
博弈的特点:
双方的智能活动,任何一方都不能单独控制 博弈过程,而是由双方轮流实施其控制对策 的过程。
路漫漫其悠远
人工智能中研究的博弈问题:
如何根据当前的棋局,选择对自己最有利的 一步棋 ?
中国象棋
路漫漫其悠远
博弈问题(求解过程)的表示:
用博弈树来表示,它是一种特殊的与或树。节点 代表博弈的格局(即棋局),相当于状态空间中 的状态,反映了博弈的信息, 并且与节点、或节 点隔层交替出现。
相关文档
最新文档