人工智能7
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
l1 … lk,
m1 … mn
l1 … li-1 li+1 … lk m1 … mj-1 mj+1 ...
归结规则的可靠性:
mn
li 真,則 mj 假 (m1 … mj-1 mj+1 ... mn)真
li 假, l1 … li-1 li+1 … lk真
归结规则的完备性:任何完备的搜索算法,只使用归结规则, 就可以生成命题逻辑中被任何知识库蕴涵的任何结论。
例如: WumpusAhead WumpusAlive可推导出 WumpusAlive
推理规则的应用序列--证明
(1) P1,1(2)B1,1(3)B2,1 (4)B1,1 (P1,2 P2,1) (5)B2,1 (P1,1 P2,2 P3,1)
1.双向蕴含消去:α β 代换为 (α β)(β α). 由语句(4)得:(B1,1 (P1,2 P2,1)) ((P1,2 P2,1) B1,1) --(6)
(B1,1 P1,2 P2,1) (P1,2 B1,1) (P2,1 B1,1) B1,1 P1,2
基本等值式:
α ≡ ß,当且仅当α╞ β 且β╞ α
交换律:p∧q ≡ q∧p p∨q ≡ q ∨ p
结合律: (p∨q) ∨r ≡ p∨ (q∨r) (p ∧ q) ∧ r ≡ p ∧ (q ∧ r)
分配率: p ∨(q ∧ r) ≡ (p ∨q) ∧ (p ∨ r) p ∧(q ∨ r) ≡ (p ∧ q) ∨ (p ∧ r)
则子句集: p ∨ q, q ,p
对子句集中的子句进行归结: (1) p ∨ q (2) q (3)p (4)q (1, 3归结) (5)空 (2, 4归结)
Wumpus世界的归结推理
KB = (B1,1 (P1,2 P2,1)) B1,1 α = P1,2 (B1,1 (P1,2 P2,1)) B1,1 P1,2 ≡
P1,2 (P2,2 P3,1) = true (true false) = true true = true
Wumpus世界的知识库
Pi,j :在[i, j]有陷阱 Bi,j :在[i, j]有微风
P1,1 B1,1 B2,1 陷阱使得其邻域方格有微风 B1,1 (P1,2 P2,1) B2,1 (P1,1 P2,2 P3,1)
逻辑推理--蕴含关系(entailment)
一个语句逻辑上跟随另一个语句而出现
α╞ β , 当且仅当在α为真的模型中, β也为真 (当α为真,β必定为真) 即β的真值包含于α的真值中
例如: x+y = 4 蕴含 4 = x+y KB ╞ α
模型检验
3个方格中的每个可能包含或不包含陷阱, 则存在8个可能的模型
执行器:向前移动,左、右转90度, Grab,shoot,
[None, None, None, None, None]
[None, Breeze, None, None, None]
[Stench, None, None, None, None]
[None,None, None, None, None]
逻辑和程序语言的对比
逻辑系统 逻辑符号 非逻辑符号 语句规则 语义规则 推理规则、公理和证明
程序语言
保留字或符号
用户自定义的符号(变量名, 函数名等) 构造一个程序的语句规则
定义程序做什么的规则
无
语义
▪ x+2 ≥ y 在x = 7, y = 1的世界中为真 ▪ ▪ x+2 ≥ y 在x = 0, y = 6 ▪ 的世界中为假 可能世界 — 模型 m是α的一个模型,表示语句α在模型m中为真
第三部分 知识和推理
命题逻辑 谓词逻辑 知识表示方法
第七章 逻辑智能体
7.1 基于知识的智能体 7.2 wumpus世界 7.3 逻辑 7.4 命题逻辑 7.5 命题逻辑的推理模式 7.6 基于命题逻辑的智能体
基于知识的智能体
知识库(Knowledge base,KB):语句的集合 TELL:将新语句添加到知识库,
合法性和可满足性
若语句α无成假赋值,则称α是合法的,称重言 式或永真式, 例如:True,A A, A A, (A (A B)) B
若α至少有一个成真赋值,则称α为可满足的 e.g., A B, C
若α无成真赋值,则称α为不可满足的,称矛盾式或永假式, 例如: AA
α是合法的,当且仅当α是不可满足的 α是可满足的,当且仅当α是不合法的
True永真命题,False永假命题 析取范式:仅由有限个简单合取式组成的析取式
p (p q) (p q)
合取范式:仅由有限个简单析取式组成的合取式
p (p q) (p q)
语义
语义定义了用于判定关于特定模型的语句真值的规则
例如:某模型下,P1,2 假
P2,2 P3,1 真假
逻辑连接符的真值表:指定了复合句在其组成部分的 真值的每种可能赋值情况下的真值。
[Stench, Breeze, Glitter, None, None]
逻辑
逻辑的历史 Aristotle:逻辑学 Leibnitz:数理逻辑 Gottlob frege:一阶谓词演算系统,《符号论》(19世纪) 20世纪30年代,数理逻辑广泛发展
逻辑系统
一个逻辑系统是定义语言和它的含义的方法。 逻辑符号集合:在所有该逻辑的逻辑理论中均出现的符号 非逻辑符号集合:不同的逻辑理论中出现的不同的符号 语句规则:定义什么样的符号串是有意义的 语义规则:定义符号串的语义 推理规则、公理和证明
命题表示
将陈述句转化为命题公式: 例如:设“下雨”为p,“骑车上班”为q 1.“只要不下雨,我就骑自行车上班”。
p是q的充分条件,可得命题公式: p q
2. “只有不下雨,我才骑自行车上班”。
p是q的必要条件,可得命题公式: q p
3. “应届毕业生,得过国家级竞赛一等奖或全班排名第一,保 送研究生” 设:p“应届毕业生”,q“保送研究生”,r“得过国家级竞赛一 等奖”,t“全班排名第一” 则有命题公式: p ∧(r t) q
原子命题:一个命题,且是不能再进一步分解成更简单语句。是 命题的基本单位。
一个原子命题可以用字母表示(命题符号)。 命题逻辑是由命题符号和逻辑连接符组成。
逻辑连接符
合取式:p与q,记为p∧q 析取式:p或q,记为p q 蕴含式:如果p则q,记为p q 等价式: p当且仅当q,记为p q 否定式:非,p 优先级: , ∧, , ,
2.语句(6)与消去: ((P1,2 P2,1) B1,1)
--(7)
语句(7)再根据α β ≡ β α (逆否命题)
得:(B1,1 ((P1,2 P2,1))
--(8)
3.由语句(8)和(2)根据分离规则得: ((P1,2 P2,1)) --(9)
4. 根据摩根律: P1,2 P2,1 ---(10)
其中li and m是互补文字(一个文字是另一个文字的否定式).
全归结规则 l1 … lk,
m1 … mn
l1 … li-1 li+1 … lk m1 … mj-1 mj+1 ... mn 其中li 和 mj 是互补文字
P1,3 P2,2, P2,2 P1,3
归并: (A B)和(A B)归结 得到A A,最终简化为A
2. 消去 :α β替换为α β. (B1,1 P1,2 P2,1) ((P1,2 P2,1) B1,1)
3. 根据摩根律移入: (B1,1 P1,2 P2,1) ((P1,2 P2,1) B1,1)
归结规则:
单元归结规则
l1 … lk,
m
l1 … li-1 li+1 … lk
推理的可靠性和完备性
KB ├i α: α通过推理算法i从KB中导出, 推理算法i从KB中导出α
推理算法i是可靠的:如果KB ├i α, 则KB╞ α 推理算法i是完备的:如果 KB╞ α, 则KB ├i α
命题逻辑
命题:能够分辨真假的陈述句。
例如:1+1=2 雪是绿色的 昆明是云南的省会
快点走吧! 到哪去?
归结
AB 反证法:证明A B是矛盾式(永假式) ▪ 建立子句集 合取范式:命题、命题或的与 例如:p (p q) (p q) 子句集S:合取范式形式下得子命题(元素)的集合 例如:上述命题公式的子句集S={p, p q, p q}
合取范式 B1,1 (P1,2 P2,1)
1. 消去 : α β替换为 (α β)(β α). (B1,1 (P1,2 P2,1)) ((P1,2 P2,1) B1,1)
已知A为真,无法用归结自动生成结论A B,但 可以用归结判断A B是否为真。
归结过程
1. 将命题写成合取范式 2. 求出子句集S 3. 对子句集使用归结推理规则 4. 归结式作为新子句参加归结 5. 归结式为空子句,S是不可满足的(矛盾),原命题成立
例如:证明公式( pq ) (q p) 证:将待证明公式转化为归结命题公式: ( pq ) (q p) 将该公式转化为合取范式 pq ≡ p ∨ q (q p) ≡ (q ∨p) ≡ q p ( pq ) (q p) ≡( p ∨ q) q p
α2 : P2,2
真值表枚举算法
真值表枚举算法,是可靠的、完备的 n个符号,存在2n个模型,时间复杂度O(2n) 用于命题逻辑的有效模型检验推理算法包括回溯(DPLL算 法)和局部搜索方法(WALKSAT算法)。
推理方法
演绎推理:从已知的一般性知识出发,推理出适合于某些 个别情况的结论的过程。
归纳推理:从大量的特殊事例出发,归纳出一般性结论的 推理过程。 默认推理:在知识不完全的情况下假设某些条件已经具备 所进行的推理。
推理的不确定性及其单调性
确定性推理:推理所用的证据、知识及结论都是可以精确表示 的,其真值不为真就为假,不会有第三种情况出现。 不确定性推理:推理所用的证据、知识及结论都是不确定的, 都是不可以精确表示的,其真值位于真和假之间。 单调性推理:由于新知识的加入和使用,使推理所得到的结论 会越来越接近目标。 非单调性推理:推理过程中某些新知识的加入和使用,不但没 有加强已经推出的结论,反而会否定原来已推出的结论。
基本等值式:
摩根律: (p∧q) ≡ p ∨ q (p∨q) ≡ p ∧ q
吸收律: p∨(p∧q) ≡ p p∧(p∨q) ≡ p
同一律: p∨ 0 ≡ p p∧1 ≡ p
蕴含等值式:p q ≡ p ∨ q (蕴含消去)
假言易位式: p q ≡ q p(逆否命题) 双向蕴含消去: pq ≡( p q) ∧ (q p)
模型检验
与智能体所知内容相矛盾的模型中,KB为 根据[1,1]无微风假,。则在任意[1,2]有陷阱的模型中,KB为假 仅3个模型使得KB为真。
α1:[1,2]无陷阱, α2:[2,2]无陷阱
模型检验
α1:[1,2]无陷阱
KB ╞ α1
模型检验
α2:[2,2]无陷阱
KB ╞ α2
模型检验: 枚举出所有可能的模型用于检验在KB中为真的所 有模型中α为真。
告诉知识库感知的信息 记录选择的行动 ASK:查询知识库,以获得应该执行的行动
部分可观察、确定性的、 延续式的、静态的、离散 的、单智能体环境。
Wumpus世界
性能度量: 金子+1000,死亡-1000 每次行动-1,用掉箭-10
环境:4*4网格,金子、陷阱、 wumpus
传感器:
Stench, Breeze, Glitter, Bump, Scream
反证法(归谬): KB ╞ α当且仅当(KB α)是不可满足的
推理规则
▪ 逻辑等价
▪分离规则: α β, α β
例如,已知(WumpusAhead WumpusAlive) shoot 和(WumpusAhead WumpusAlive),可推导出shoot
▪与消去(合取式推导出任何合取子句): α β α
推理的基本概念
推理:从已知事实出发,运用已掌握的知识,推导出 其中蕴含的事实性结论或归纳出某些新的结论的过程。
推理所用的事实:初始证据;中间结论。
初始Fra Baidu bibliotek证据
推理机 知识库
结论
目标是判断某些语句x,kB|=x是否成立。 模型检验:枚举出模型,验证x在KB为真的每个模型中为真
推理真值表
α1 : P1,2