逆向归纳法的认知基础
《博弈论》课程案例教学实践

《博弈论》课程案例教学实践支援,黄效白摘要:博弈论是高校经济学类课程中既重要又具有一定难度的课程,其教学难点在于如何引导学生掌握抽象的原理,并运用于实际分析决策之中。
基于课程学科特点,适宜运用案例教学法。
案例教学的机能在于启发认知、引导知识转化与运用,遵循学生主体、平等互动、理论联系实际的教学理念。
在实际教学中,案例选择要易于理解、符合实际,案例要有针对性,来源要多元化,以引导学生认真学习基础理论、牢记知识点,促其掌握基本技能和培养实践能力。
通过教学实验的实践证明,案例教学易于引导学生学习的兴趣,其所教授的内容易于学生接受,能有效提升学习效果和成绩,对学生的分析决策能力有积极、长效的影响。
关键词:博弈论;案例教学;理论与实践《博弈论》是高校经济学类的重要课程之一,又被称为对策论,是研究决策主体的行为及均衡状态问题的学科[5随着学科的发展,其在当今世界的经济、社会、政治、军事乃至计算机科学、生命科学等诸多领域均有广泛的应用,被认为是社会经济分析的最基本工具之一囱。
国内外众多高校在很多专业都开设了博弈论课程。
随着经济学、管理学的发展进步,可以预见,博弈论的教学将会进一步受到重视和推广。
然而,博弈论教学具有一定难度:它是应用数学的分支学科之一,由于其中一些原理、规律的数学描述较为抽象,很多学生在初次接触时会觉得抽象而高深难懂。
如果教师选择的教学方法不够丰富,只着重于对数学原理的罗列陈述而忽略学生的接受情况,容易使基金项目:贵州大学贵州省农林经济管理国内一流学科建设项目招标重点课题“基于虚拟水比较优势的区域产业升级机制研究”[GNYL(2017)002];教育部人文社会科学研究青年基金项目''虚拟水视角下的战略新兴产业水资源利用机制分析及节水调控研究”(16YJC790150):贵州省科学技术基金计划项目“基于虚拟水的产业用水结构分析及节水路径研究”(黔科合基础20161034).作者简介:支援,男,贵州贵阳人,博士,贵州大学经济学院副教授。
数学归纳法知识点

数学归纳法知识点数学归纳法是数学证明的一种强有力的方法,广泛应用于数论、组合数学、算法分析等多个领域。
它的基本思想是通过验证某个性质在初始情况下成立,以及证明当该性质对某个自然数n成立时,它对n+1也成立,从而可以推导出该性质对于所有自然数均成立。
数学归纳法不仅增强了数学论证的严谨性,还能帮助发现数学中的规律。
一、数学归纳法的基本步骤1.基础步:验证命题在n=1或其他小的自然数情况下成立。
通常此步被称为“基础案例”或“基础情况”。
它是数学归纳法的起始点,确保我们的论证是有基可依的。
2.归纳假设:假设当n=k时,命题成立。
这个假设是归纳法的核心,它允许我们利用这种假设来进行进一步的推导。
3.归纳步骤:在归纳假设的基础上,证明当n=k时,命题成立,则在n=k+1时也成立。
这一步表明了命题从一个自然数延续到下一个自然数。
1.自然数求和公式:通过数学归纳法可以简单地证明自然数求和的公式,即1+2+...+n=n(n+1)/2。
通过验证基础情况n=1和归纳步骤,可以得出这一结论。
2.组合计数:在组合数学中,许多计数问题都可以利用归纳法进行证明,例如证明C(n, k) + C(n, k-1) = C(n+1, k)。
3.算法复杂度:在算法分析中,归纳法用于证明递归算法的时间复杂度。
例如,可以对归纳法求解的递推公式进行严格的时间复杂度分析。
三、数学归纳法的性质1.简洁性:归纳法通过简单的基础案例和归纳步骤,减少了需要直接证明的情况,使得证明过程简单化。
2.广泛性:适用于多种数学命题,不仅限于数论,还适用于几何、组合等各个数学领域。
3.严谨性:归纳法提供了一种结构化的证明方式,使得结果更加严谨,易于理解与复现。
1.适用范围:并非所有命题都适用于数学归纳法,特别是涉及到非自然数的情况。
2.复杂命题:有些复杂命题的归纳步骤可能过于繁琐,难以为归纳假设提供强有力的支撑。
3.直观理解:对于某些初学者而言,归纳法的逻辑可能不易理解,容易造成错误。
用“逆向归纳法”教学英语语法

用“逆向归纳法”教学英语语法在英语语法教学中运用“逆向归纳法”就是通过“发现—归纳—运用”三个步骤来教学英语语法,改变以往“分析讲解规则—巩固运用规则”的以“教”为中心的教学方法。
“逆向归纳法”有以下四大特点:一是反转了语法教学的方向。
惯常的语法教学是以介绍规则为起点,操练运用为终点;而此方法是以实际体验范例为起点,发现规律为中转,总结运用为终点。
二是改变了思维方式的模式。
以往的语法教学是基于演绎的模仿运用,现在是基于归纳的自然运用。
三是转变了情感体验的方式。
变枯燥无味的规则记忆为栩栩如生的意义构建。
四是实现了知识能力的倒转。
从被动接受式的知识传递转化为主动发现式的能力提高。
经过如此的逆向反转,学生习惯了运用观察、分析、联想等发现问题和解决问题的方法,自主归纳出相应的规律,为创造性地使用语言打下了坚实的基础。
一、现象呈现,供学生发现规律现象呈现就是呈现与此语法相关的语言材料。
呈现的形式以书面材料为主,还可夹杂相关的视频、音频等材料,让学生在真实的语境中体验语法的实际应用。
如在教学分词时,放一段“美国总统奥巴马对全美中小学生的讲话”视频,其中有一段话:Young people like Jazmin Perez, from Roma, Texas. Jazmin didn’t speak English when she first started school. Neither of her parents had gone to college. But she worked hard, earned good grades, and got a scholarship to Brown University —is now in graduate school, studying public health, on her way to becoming Dr Jazmin Perez. 画线部分的studying为现在分词,作伴随状语。
归纳法的基本流程

归纳法的基本流程归纳法呀,那可是个很有趣的东西呢。
一、什么是归纳法。
归纳法简单来说呢,就是从个别事例或者现象中总结出一般性结论的方法。
就好像我们看到一只猫喜欢吃鱼,又看到另外几只猫也喜欢吃鱼,然后就得出猫都喜欢吃鱼这个结论。
这就是归纳法在日常生活中的一种很常见的体现啦。
不过呢,这个结论并不是绝对的哦,可能存在一些特殊的猫不喜欢吃鱼,但在我们所观察到的大部分情况里,这个结论是成立的。
二、观察收集事例。
这可是归纳法的基础呢。
我们得去看好多好多的具体事情。
比如说,我们想归纳出花朵在什么时候开放。
那我们就得去观察各种各样的花,早上看、中午看、晚上看,晴天看、阴天看。
像向日葵呢,我们就发现它老是朝着太阳的方向,而且在白天的时候,花瓣是张开的,到了晚上就会合拢起来。
还有百合花,它开放的时候会散发出一种淡淡的香味,开放的时间也有一定的规律。
我们把这些观察到的关于不同花朵的各种情况都收集起来,就像收集宝贝一样,这些都是我们后面归纳的素材。
三、寻找共同特征。
收集了好多事例之后呀,我们就要开始找它们的共同之处了。
还是拿花朵来说,我们观察了很多种花之后,发现大部分的花朵呢,都会在温度比较适宜的时候开放得更好。
像春天的时候,气温不冷不热,很多花就争奇斗艳地开了。
而且呀,花朵的开放好像和光照也有关系,有充足光照的花往往开得更鲜艳。
这些就是我们从不同花朵的事例中找到的共同特征。
这个过程就像是在一堆乱七八糟的珠子里找一样颜色或者一样形状的珠子,要很细心地去发现呢。
四、形成一般性结论。
找到共同特征之后,就可以得出一般性的结论啦。
根据我们对花朵的观察,我们就可以说,花朵的开放和温度、光照等因素密切相关。
这个结论就可以用来解释很多关于花朵开放的现象,也可以用来预测一些花在什么样的环境下会开得更好。
不过呢,我们要知道这个结论可能不是完美的,也许还有其他我们没发现的因素会影响花朵开放。
五、检验结论。
得出结论可不代表就万事大吉了哦。
我们还得检验这个结论是不是靠谱。
数学学习中的顺向与逆向观点

数学学习中的顺向与逆向观点在现实生活中,若把从甲地去往乙地的走路方向称为顺向,则从乙地返回甲地的方向就可以称为逆向。
这里所谓的顺向和逆向,指的是在问题解决过程中思维方向截然相反的两种顺序。
在数学学习过程中,我们会遇到许多成对的知识点,对于它们的认识都存在顺向和逆向思维的过程。
认识这一点,对于我们理解数学知识、解决相关问题具有十分重要的指导价值。
标签:数学学习顺向逆向在现实生活中,若把从甲地去往乙地的走路方向称为顺向,则从乙地返回甲地的方向就可以称为逆向。
在事物的认识过程中,思维也具有类似的方向性,所以人们常常把解决问题的思维程序叫做思路。
这里所谓的顺向和逆向,指的是在问题解决过程中思维方向截然相反的两种顺序。
一般地,认识事物过程中,首先认同的、适应了的、习惯性的思维顺序称为思维的顺向,反过来就是思维的逆向。
同走路一样,思维的顺向和逆向取决于认识的出发地(已知)和目的地(未知)。
在数学学习过程中,我们会遇到许多成对的知识点,对于它们的认识都存在顺向和逆向思维的过程。
例如,因式分解与整式乘法就是典型的顺向和逆向思维的过程的例子。
认识这一点,对于我们理解数学知识、解决相关问题,具有十分重要的指导价值。
现从以下几个方面予以说明:一、公式与法则的逆向运用在代数的学习中,公式与法则是十分重要的学习内容,它是进行数或式的计算、化简及其它变形的依据。
学习了一个公式或法则,首先要顺向用来解决相应的基本问题:对于符合公式、法则条件的数或式,依据公式、法则从一种形式变为另一种形式。
但是这还不够,要深刻理解和掌握公式、法则,还需要形成逆向思考和运用的意识及习惯。
例1.比较3555和5333的大小。
分析说明:在学习了幂的乘方法则(am)n=amn后,逆向运用法则,得到amn=(am)n,可以解决这个问题。
3555=35×111=(35)111=243111;5333=53×111=(53)111=125111;因为243>125,所以3555>5333。
归纳法基本流程

归纳法基本流程归纳法呀,那可真是个很有趣的方法呢。
一、什么是归纳法。
归纳法简单来说,就是从个别事例或者现象中总结出一般性的结论。
就像我们看到一只猫喜欢吃鱼,另一只猫也喜欢吃鱼,好多好多猫都喜欢吃鱼,我们就可以归纳出“猫喜欢吃鱼”这个结论。
这就像是我们收集好多小珠子,然后把它们串成一条漂亮的项链,这个项链就是我们归纳出来的结论。
二、归纳法的准备阶段。
1. 观察收集。
我们得先睁开我们好奇的小眼睛,去观察各种各样的事物。
比如说我们想归纳关于植物生长的规律,那我们就得去看看不同的植物,在不同的环境下是怎么长的。
是在阳光充足的地方长得好呢,还是在阴凉的地方也能茁壮成长。
这时候就像是个小侦探一样,到处寻找线索。
而且收集的资料要越多越好哦,就像我们收集小贴纸一样,越多我们能做的花样就越多。
如果只观察了一两种植物,那归纳出来的结论可能就不准确啦。
2. 选择合适的对象。
在收集的时候呢,也要注意选择合适的对象。
不能把风马牛不相及的东西放在一起。
比如我们不能把植物和汽车放在一起去归纳关于生长的规律,这不是乱套了嘛。
要选择那些有共同特征或者相关的事物。
比如说要归纳鸟类的习性,那就得选择各种各样的鸟,麻雀、喜鹊、啄木鸟之类的,而不是把鸟和虫子混在一起哦。
三、归纳法的实施阶段。
1. 找共同点。
当我们收集好资料之后,就开始找这些事物之间的共同点啦。
还是拿植物来说,我们发现好多植物都需要水分,都有绿色的叶子(大部分啦),都需要一定的土壤条件。
这些共同点就是我们归纳的关键。
就像我们找小伙伴们的共同爱好一样,大家都喜欢画画,那这个画画就是一个共同点。
我们要把这些共同点一个一个地找出来,这可是个需要耐心的活儿呢。
2. 概括总结。
找到共同点之后,就要进行概括总结啦。
把这些共同点综合起来,形成一个一般性的结论。
比如说我们发现很多植物都需要阳光、水分、土壤,那我们就可以总结出“植物生长需要阳光、水分和土壤”这样的结论。
这就像是我们把找到的小珠子按照一定的样式串成了项链,这个项链就是我们归纳法得出的成果。
博弈逻辑分析

Q2,模态逻辑对博弈的研究起什么作用?
这个问题又可以分解为这样两个问题: ?逻辑无用 ?逻辑到底有什么用,换句话说,逻辑到底能解决什么样的博弈问题,最好是 博弈论本身都没有解决的问题
Q2,模态逻辑对博弈的研究起什么作用?
)
1,博弈逻辑的语法,语义等
定理1:博弈逻辑对所有博弈模型是可靠的。 博弈逻辑对所有博弈模型是否完全,这仍然是一个待解决的问题。但我们有另 外两个较弱的完全性定理: d 定理2:不带有对偶算子 d 的博弈逻辑GL 对所有博弈模型完全。 定理3:不带有迭代算子 的博弈逻辑GL 对所有博弈模型完全。 对偶和迭代算子一起使得博弈逻辑有了不同与PDL的表达力。
d 。
c
Q1,逻辑和博弈的联系有哪些?
一,关于逻辑的博弈
对模态公式以及 -演算中的公式,我们同样能给出它们的赋值博弈语义 解释。
Q1,逻辑和博弈的联系有哪些?
一,关于逻辑的博弈
2,模型比较博弈 (model-comparison games)Ehrenfeucht(1957)Fraisse(1954) 初等等价 1930年,Tarski 给出了初等等价概念的形式表述(两个结构初等等价,当且 仅当它们满足相同的一阶句子,也就是说用一阶语言无法区分两个初等等价的 结构),后来Ehrenfeucht 和Fraisse根据博弈这一概念给出了两个结构初等 等价的条件,这样的博弈就被称为Ehrenfeucht-Fraisse博弈(EF for short),或者又叫back-and-forth game(versatile idea)。
Q1,逻辑和博弈的联系有哪些?
双仿 a a b c b
数学归纳法原理:【第二归纳法】【跳跃归纳法】【反向归纳法】

数学归纳法原理(六种):【第二归纳法】【跳跃归纳法】【反向归纳法】一行骨牌,如果都充分地靠近在一起(即留有适当间隔),那么只要推倒第一个,这一行骨牌都会倒塌;竖立的梯子,已知第一级属于可到达的范围,并且任何一级都能到达次一级,那么我们就可以确信能到达梯子的任何一级;一串鞭炮一经点燃,就会炸个不停,直到炸完为止;,, ,日常生活中这样的事例还多着呢!数学归纳法原理设P(n) 是与自然数n 有关的命题.若(I) 命题P(1) 成立;(∏)对所有的自然数k,若P(k)成立,推得P(k+1)也成立•由(I )、(∏)可知命题P(n)对一切自然数n成立.我们将在“最小数原理”一章中介绍它的证明, 运用数学归纳法原理证题的方法,是中学数学中的一个重要的方法,它是一种递推的方法,它与归纳法有着本质的不同.由一系列有限的特殊事例得出一般结论的推理方法, 通常叫做归纳法,用归纳法可以帮助我们从具体事例中发现一般规律,但是,仅根据一系列有限的特殊事例得出的一般结论的真假性还不能肯定,这就需要采用数学归纳法证明它的正确性.一个与自然数n 有关的命题P(n) ,常常可以用数学归纳法予以证明, 证明的步骤为:(I) 验证当n 取第1 个值no 时,命题P(no) 成立,这一步称为初始验证步.(∏)假设当n=k(k ∈N,后≥no)时命题P(k)成立,由此推得命题P(k+1)成立.这一步称为归纳论证步.(In )下结论,根据(I)、(∏)或由数学归纳法原理断定,对任何自然数(n ≥no)命题P(n)成立.这一步称为归纳断言步,为了运用好数学归纳法原理,下面从有关注意事项与技巧及运用递推思想解题等几个方面作点介绍.运用数学归纳法证题时应注意的事项与技巧三个步骤缺一不可第一步是递推的基础,第二步是递推的依据,第三步是递推的过程与结论.三步缺一不可.数学归纳法的其他几种形式还有:第二数学归纳法;跳跃数学归纳法;倒推数学归纳法(反向归纳法);分段数学归纳法二元有限数学归纳法;双向数学归纳法;跷跷板数学归纳法;同步数学归纳法等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
逆向归纳法的认知基础崔晓红1.引言逆向归纳法是博弈论中一个比较古老的概念,它的提出最早可以追溯到泽梅罗(1913)针对国际象棋有最优策略解的证明,后来人们将其推广到了更广泛的博弈中,例如,在有限完美信息扩展型博弈中,就是用逆向归纳法(BI)来证明子博弈完美均衡(SPE)的存在以及求解SPE,其基本思路是从动态博弈中的最后一个阶段开始,局中人都遵循效用最大化原则选择行动,然后逐步倒推至前一个阶段,一直到博弈开始局中人的行动选择,其逻辑严密性毋庸置疑。
然而,当从终点往前推到某一决策点时,BI完全忽略了到达该决策点的以往历史行动,而这一历史行动当然会影响处于该决策点的局中人有关其对手将来如何采取行动的信念,例如,一个局中人如果观察到对手在过去没有按照BI进行行动选择,那么他就有理由相信他的对手仍会采取同样的模式进行下去,但是通过这种信念修正以后所做的选择就会与BI矛盾。
为了达到均衡解,为了能按BI进行推理求解,我们需要对局中人的信念或者说知识增加一些限制性条件,也就是说在什么样的前提下,BI是合理的,显然,仅仅要求每个局中人都理性是不够的,所有的局中人都必须知道所有的局中人都是理性的,所有的局中人都必须知道所有局中人都知道所有局中人都是理性的……等等以至无穷,在这样的认知条件基础下,我们就不会偏离BI,即,“在完美信息扩展型博弈中,理性的公共知识蕴含了BI”(Aumann 1995)。
本文旨在通过构造完美信息扩展型博弈的认知模型来考察BI的这一认知条件。
文章第二部分先通过一些简单例子对一些问题进行非形式上的讨论;第三部分介绍Aumann结构如何表达知识和信念;第四部分给出完美信息扩展型博弈的认知模型并用形式化的方给出BI的认知条件。
2. 实例分析2.1 蜈蚣博弈图1是一个长度为3的蜈蚣博弈,博弈每前进一个阶段,桌子上就增加一美元,局中人1,2轮流采取行动,轮到某个局中人采取行动时,他可以拿走桌子上的钱,博弈结束,或者钱留在桌子上继续博弈,另外,局中人都是理性的,也就是说都遵循期望效用最大化原则。
如图所示:3图1 蜈蚣博弈1根据BI,此博弈有唯一子博弈完美均衡,那就是局中人1采取行动T1,拿走桌子上的一美元博弈结束。
假设局中人1采取的行动是L1,并且桌子上又增加了一美元,此时由局中人2开始行动,这时的局中人2会觉得很奇怪,他最初是确定局中人1会根据BI进行推理拿走桌上的钱的,但局中人1并没有那样做,局中人2就想局中人1可能不理性,如果再来一次的话,说不定会给他留下三美元,如此盘算之后,局中人2就会理性地选择行动L2,希望继续博弈。
现假设局中人1非常理性,并且认为局中人2也是理性人而且知道局中人2会对自己采取行动L1有如上分析的信念,那么局中人1一开始没有拿走那一美元是为了下一步行动能得到三美元。
那么在随后的博弈阶段即局中人1采取行动L1之后我们能不能假设存在有理性的公共信念,从而得到BI解呢?不可以。
局中人1行动L1之后理性的公共信念是不可能的:如果局中人2相信局中人1是理性的,行动L1之后,他会拿走桌上的二美元;如果局中人1一开始相信局中人2是理性的并且相信局中人2在她采取行动L1之后仍然相信局中人1是理性的,那么她一开始就会拿走一美元结束博弈,现在局中人1在她采取行动L1后对局中人2的信念并没有发生变化,这样的话就有两种可能:(a)局中人1不理性选择了行动L1,或者(b)局中人1是理性的,采取行动T1,但是相信如果她选择策略L1的话,局中人2是理性的并且相信局中人1也是理性的,(a)和(b)相互排斥,局中人2在观察到行动L1后不会同时相信这两种可能。
2.2 有限次重复囚徒困境博弈在一次性囚徒困境博弈中如图2所示,局中人各自从个人利益出发的理性选择结果(博弈解)就是(D,D)即(坦白,坦白),个体理性选择的结果并非帕累托最优,不符合集体理性的要求,囚徒陷入了理性的困境。
D图2 有限次重复囚徒困境博弈若这一博弈重复进行k 次,情况会有什么不同呢?假设局中人都知道重复的次数,并且能够观察到以往所有的博弈历史,即局中人在以往各阶段所实际采取的行动,且各阶段的支付如上图所示,显然这一博弈是完美信息扩展型博弈,且存在唯一子博弈完美均衡(SPE ):局中人均采用坦白策略。
这很容易由BI 推理得出:在最后一个阶段,局中人理性选择的结果就是囚徒困境唯一的纳什均衡,双方均“坦白”;这样,逆向归纳至前一阶段,局中人仍然以“坦白”策略为唯一理性选择。
依次类推,可以知道SPE 中,局中人在每一阶段均会采用“坦白”策略作为自己的唯一选择。
但是,经由BI 得到的SPE 很不符合直观,现实生活中处于如此情境的局中人更愿意采取“针锋相对”(tit-for-tat )策略,这一策略可以简述为:“你上次如何对我,我下次就怎么对你”,也就是说局中人都试图为了下次的博弈建立合作的声誉。
现在我们来分析如果局中人都是理性的,并且都具有理性的公共知识(CKR ),最终得到的博弈解是“针锋相对”还是SPE 。
现假设在CKR 基础上局中人采取策略C (合作)而不是D (对抗也即坦白),我们已经知道局中人采取合作的目的是为了下一次合作建立良好的声誉同时鼓励对方也这么做。
但在博弈的最后阶段,双方都知道这是最后一次博弈并且是理性的,这里的理性独立于对对手采取策略的信念,于是在这一阶段大家都没有合作的动机,都将采取对抗(占优策略),而且,由于CKR ,他们也知道对方也会采取D ;而在博弈的倒数第二个阶段,局中人为下次博弈建立合作声誉是没有用的,于是局中人仍会采用对抗策略,如此反复直至博弈的第一个阶段,对抗策略一直是博弈的最优策略。
3. 知识和信念的语义表达3.1 单个主体的知识和信念的表达我们先从单个主体的信念出发,首先假设要考察的对象是一系列状态(state )或可能世界,这里的状态或世界一般解释为局中人面对的所有与决策有关的外在因素的客观描述,记3,3 1,4 4,1 2,2C C D为ω∈Ω,其中为状态空间。
Ω的一个子集称为一个事件,用以描述博弈中发生的种种事件。
如果ΩE ⊆ΩE ω∈,我们就说事件E 在状态ω处发生了。
定义一个可能函数:P ΩΩ→2是将每个状态ω∈Ω映射为Ω的一个非空子集,表示局中人在状态ω处认为()P ω中的状态都是可能的,它应满足如下性质:性质3.1.1(1)()P ω≠∅(2)如果()P ωω′∈,那么()()P P ωω′⊆ (3)如果()P ωω′∈,那么()()P P ωω′⊆.定义3.1.1(信念框架)一个信念框架就是一个二元组F=,P Ω,其中状态集Ω≠,P 满足性质3.1的三条性质,它们分别又对应于关系的持续性,传递性以及欧性。
∅ 如果某一事件E 在局中人认为可能的状态()P ω中的每一状态都发生了,我们称局中人相信该事件,于是从可能函数P 就可以得到一个信念算子,定义为:22B Ω→Ω},{:()E BE P E ωω∀⊆Ω=∈Ω⊆,满足如下三条性质:性质3.1.2(1)B Ω=Ω (必然性) (2)()B E F BE BF =∩∩ (合取性) (3)如果,那么. (单调性) E F ⊆BE BF ⊆另外,对应于可能函数的三条性质,信念还有如下三条性质: 性质3.1.3(1) (一致性) ,E BE B ∀⊆Ω⊆¬¬E E BE E (2) (正内省) ,E BE BB ∀⊆Ω⊆ (3) (负内省),E BE B ∀⊆Ω¬⊆¬(这里的符号“¬”表示集合的补,即\E ¬=Ω)另外我们都知道局中人相信的事件不一定真的发生,也就是说局中人相信的也可能是一个假象,但他相信自己所相信的是正确的。
于是,我们说可能函数不具有自反性,但它具有二阶自反性:,,ωω′∀∈Ω如果(),P ωω′∈那么().P ωω′′∈于是也有:,()E B BE E ∀⊆Ω¬=Ω∪ 知识具有许多与信念相同的性质,但它们之间有一个显著的区别就是信念不必为真,而 所知道的一定是真的。
为了表达它们之间的不同,我们首先引入信息函数。
设为一个状态集,上的一个划分可以表示局中人的信息或者说知识,我们说函数ΩΩ:I ΩΩ→2是信息函数,如果它满足如下两条性质:性质3.1.4(1)()I ωω∈(2)如果()I ωω′∈,那么()()I I ωω′=注意如果I 是满足以上性质的信息函数,它就是Ω的一个划分,相反,任何的一个划分 Ω也会生成一个信息函数I 。
由信息函数I ,我们同样能得到知识算子:22K ΩΩ→定义为: {:()}KE I E ωω=∈Ω⊆于是我们有不同于信念的知识的性质:,E KE E ∀⊆Ω⊆又称为知识公理。
如果可能函数和信息函数有如下关系:,ωω′∀∈Ω 性质3.1.5(R1)()()P I ωω⊆(R2)如果()I ωω′∈,那么()()P P ωω′=我们就说此时的信念是以信息为基础,且仅仅依赖于信息。
从而有KB -框架; 定义3.1.2 :一个KB -框架(知识和信念的框架)是一个三元组F =,.I P Ω使得状态集,并且I 满足自反性,传递性和欧性,P 满足持续性,传递性和欧性且都 Ω≠∅满足性质(R1)和(R2).相应于性质(R1)和(R2),知识和信念算子满足下面两个性质: 性质3.1.6 (1) ,E KE B ∀⊆Ω⊆E E (2),E BE KB ∀⊆Ω⊆在KB -框架下,局中人相信的仍有可能不是真的,而且仍然相信自己所相信的是正确的,但 是否相信自己知道自己所相信的却不一定。
例如,设{,}ωω′Ω=,{}E ω′=,()(){}P P ωωω′′==,()(){,}I I ωωωω′′==,显然有BE ω∈,但BKE ω∉。
现假设这一条件成立,即 (C1) 成立,于是知识就坍塌成信念, ,E BE BK ∀⊆Ω⊆E E 即 (C2) ,E BE K ∀⊆Ω=这两个条件其实是等价的,我们现在给出证明。
命题3.1.1 (C1)等价于(C2)证 (1)(C1)⇒(C2)这个方向我们只需要证明,先假设BE KE ⊆ω∀∈Ω,如果BE ω∈,由(C1)可知BKE ω∈,由B 的定义,就有()P KE ω⊆,此时,ω′∀∈Ω,如果()P ωω′∈,则KE ω′∈,由K 的定义,有()I E ω′⊆,由性质3.1.5(R1)知()()P I ωω⊆,于是()I ωω′∈,再由 性质3.1.4(2)()()I I ωω′=,得到()I E ω⊆,从而有KE ω∈。
(2)(C2)(C1)⇒假设,ω∀∈Ω如果BE ω∈,由B 的定义,有()P E ω⊆,同时,由条件(C2),我们有KE ω∈, 再由K 的定义,有()I E ω⊆,现对()P ωω′∀∈,由性质3.1.5(R1)()I ωω′∈,再根据性 质3.1.4(2)有()()I I ωω′=,从而()I E ω′⊆,于是KE ω′∈,则()P KE ω⊆,再由B 的定义,就有BKE ω∈。