人工智能知识表示与推理博弈树搜索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
✓ CLOSED:存放已扩展的节点,此时为堆栈, 即后扩展的节点先计算静态估价函数值
2021/2/15
实用文档
极大极小搜索过程为: 1、将初始节点 S 放入 OPEN 表中,开始时搜索
树 T 由初始节点 S 构成
2、若 OPEN 表为空,则转5
3、将 OPEN 表中第一个节点 n 移出放入CLOSED
2021/2/15
实用文档
MAX
从MAX方的角度来看:
所有属于MAX方的节点都是“或节点”好招
理由:
因为扩展MAX方节点时,MAX方可选择扩展最有
利于自己的节点,只要可扩展的子节点中有一
个对已有利, 则该节点就对已有利
2021/2/15
实用文档
总之 从MAX方来说,与节点、或节点交替出现;反之, 从MIN方的角度来看,情况正好相反
2021/2/15
实用文档
人工智能中研究的博弈问题:
如何根据当前的棋局,选择对自己最有利的一 步棋 ?!
2021/2/15
实用文档
博弈问题的表示:
用博弈树来表示,它是一种特殊的与或图。节点 代表博弈的格局(即棋局),相当于状态空间中 的状态,反映了博弈的信息。 与节点、或节点 隔层交替出现
2021/2/15
2021/2/15
实用文档
步2
Open为空,即已经扩展完节点
5 、 若 CLOSED 表 为 空 , 则 转 8 ; 否 则 取 出
2021/2/15
实用文档
在博弈树中,先行一方的初始状态对应着树的根 节点,而任何一方获胜的最终格局为目标状态, 对应于树的终叶节点(可解节点或本原问题)
但是,从MAX的角度出发,所有使MAX获胜的状态
格局都是本原问题,是可解节点,而使MIN获胜的
状态格局是不可解节点
2021/2/15
实用文档
例 Grundy博弈:分配物品的问题
2021/2/15
实用文档
② 对于给定的格局,MAX给出可能的走法,然后 MIN对应地给出相应的走法,这样重复若干次, 得到一组端节点(必须由MIN走后得到的,由MAX 下的棋局)。这一过程相当于节点扩展
注:博弈树深度或层数一定是偶数
2021/2/15
实用文档
③ 对于每一个端节点,计算出它们的静态估价函 数,然后自下而上地逐层计算倒推值,直到MAX 开始的格局。在MIN下的格局中取估值的最小值, 在MAX下格局中取估值的最大值
2021/2/15
实用文档
2.4.2 极大极小过程 对于复杂的博弈问题,要规定搜索深度与时间, 以便于博弈搜索能顺利进行
假设由MAX来选择走一步棋,问题是:
MAX如何来选择一步好棋?
2021/2/15
实用文档
极大极小过程的基本思路:
① 对于每一格局(棋局)给出(定义或者倒推) 一个静态估价函数值。值越大对MAX越有利,反之 越不利
人工智能
Artificial Intelligence (AI)
2021/2/15
实用文档
2.4 博弈问题的搜索技术
2.4.1 博弈问题的表达
2.4.2 极大极小搜索过

2.4.3 - 剪枝法
2021/2/15
实用文档
2.4.1 博弈问题的表达
博弈是一类具有竞争性的智能活动
Baidu Nhomakorabea
双人博弈:即两位选手对垒,轮流依次走步,
实用文档
为什么与节点、或节点隔层交替出现?
假设博弈双方为:MAX和MIN 在博弈过程中,规则是双方轮流走步。在博弈 树中,相当于博弈双方轮流扩展其所属节点
2021/2/15
实用文档
从MAX方的角度来看:
MIN
所有MIN方节点都是与节点
好招
理由:
因为MIN方必定选择最不利于MAX方的方式来扩 展 节 点 , 只 要 MIN 方 节 点 的 子 节 点 中 有 一 个 对 MAX 方 不 利 , 则 该 节 点 就 对 MAX 方 不 利 , 故 为 “与节点”
2021/2/15
实用文档
现在取N=7的简单情况,并由MIN先分
(7,MIN)
所有可能的分法
(6,1,MAX)
(5,2,MAX)
(4,3,MAX)
(5,1,1,MI N)
(4,2,1,MI N)
(3,2,2,MI N)
(3,3,1,MI N)
(4,1,1,1,MA X)
(3,1,1,1,1,M IN)
表的前端
2021/2/15
实用文档
4、若 n 可直接判定为赢、输、或平局,则令对
应的 e(n)=∞,-∞或 0,并转2;否则扩展 n, 产生 n 的后继节点集 { ni },将{ ni }放入
搜索树 T 中
2021/2/15
实用文档
(续)
此时,若搜索深度d{ ni }小于预先设定的深度 k,则将{ ni }放入OPEN表的末端,转2;否则, ni 达到深度k,计算e ( ni ),并转2
④ 取估值最大的格局作为MAX要走的一招棋
2021/2/15
实用文档
例:向前看一步的两层博弈树
2021/2/15
实用文档
定义静态函数e(P)的一般原则:
0 e(P)0
0
MAX占优,MIN不利 势均力敌
MAX不利,MIN占优
2021/2/15
实用文档
符号:
✓ OPEN:存放待扩展的节点,此时为队列,即 以宽度优先的策略扩展节点
(3,2,1,1,MAX)
(2,2,2,1,MAX)
(2,2,1,1,1,MI N)
(2,1,1,1,1,1,M
注:2021如/2/A15X果) MAX走红箭头的分实用法文档,必定获胜
对于比较复杂的博弈问题,只能模拟人的思维 “向前看几步”,然后作出决策,选择最有利自 己的一步。即只能给出几层走法,然后按照一定 的估算办法,决定走一好招
如果有一堆数目为N的钱币,由两位选手轮流进行 分配,要求每个选手每次把其中某一堆分成数目 不等的两小堆,直至有一选手不能将钱币分成不 等的两堆为止,则判定这位选手为输家
2021/2/15
实用文档
用数字序列加上一个说明来表示一个状态: (3, 2, 1, 1, MAX)
数字序列:表示不同堆中钱币的个数 说明:表示下一步由谁来分,即取MAX或MIN
其中任何一方都完全知道对方过去已经走过的
棋步和今后可能的走步,其结果是一方赢(而另
一方则输),或双方和局
2021/2/15
实用文档
博弈的例子:
➢ 一字棋 ➢ 跳棋 ➢ 中国象棋 ➢ 围棋 ➢ 五子棋
2021/2/15
实用文档
博弈的特点:
双方的智能活动,任何一方都不能单独控制 博弈过程,而是由双方轮流实施其控制对策 的过程
相关文档
最新文档