数据与知识工程练习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据与知识工程习题一
1.请分别用消解原理和Tableau 规则证明以下命题逻辑式子是重言式。
(1)R R Q R P Q P →→∧→∧∨))()()((
(2)P R R Q Q P ⌝→⌝∧∨⌝∧⌝∧⌝))()((
(3)P Q R S R Q P Q S ⌝→⌝→∧∨∧→∧⌝→))()()()((
2.请分别用消解原理和Tableau 规则证明以下谓词逻辑式子是重言式。
(1))))()(())()(((x Q x P z Q y P z y x →→→∀∀∃
(2)))()()(()))()()(())()()(((x R x P x x R x Q x x Q x P x →∀→→∀∧→∀
(3)))()()(()))()()(())()()(((x P x R x x R x Q x x Q x P x →∃→⌝→∀∧∨∀
(4))()())()())()()(())()()(((x P x x R x x R x Q x x Q x P x ∀→∀∧⌝→∀∧∨∀
3. 请用描述逻辑相关方法求解以下各题。
(1)用描述逻辑ALC 的Tableau 规则判断“∃R .A ⊓ ∃R .B ⊓ ∀R .C ”是否是可满足的。
(2)用描述逻辑SI 的Tableau 规则判断“∃S .C ⊓ ∀S .(⌝C ⊔ ⌝D ) ⊓ ∃R .C ⊓ ∀R .(∃⌝R .C )(其
中R 具有传递性)”是否是可满足的。
(3)给定的TBox 与ABox 如下
TBox:
ABox:
请运用Tableau 方法判断能否从该知识库推导出结论HappyMother(Wendy)。
4.请用消解原理求解以下各题。
(1)没有不守信用的人是可信赖的,有些可信赖的人是受过高等教育的。请根据以上信息
用消解原理证明“有些受过高等教育的人是守信用的”。
(2)Tony 、Mike 和John 都是Alpine 俱乐部的会员。在此俱乐部中,每个会员或者是一个
滑雪爱好者,或者是一个登山爱好者,或者都是;没有一个登山爱好者喜欢下雨;所有的滑雪爱好者都喜欢雪;Tony 喜欢的所有东西Mike 都不喜欢;Tony 不喜欢的所有东西Mike 都喜欢;Tony 喜欢雨和雪。请根据以上信息用消解原理证明“Alpine 俱乐
部存在这样一个会员,他是一个登山爱好者,但不是滑雪爱好者”。
(3)某人被盗,公安局派出5名侦察员去调查。研究案情时,侦察员A说:“赵与钱中至少有一人作案”;侦察员B说:“钱与孙中至少有一人作案”;侦察员C说:“孙与李中至少有一人作案”;侦察员D说:“赵与孙中至少有一人与本案无关”;侦察员E 说:“钱与李中至少有一人与本案无关”。假设这5个侦察员的话都是可信的,请根据以上信息用消解原理求出谁是盗窃犯。
(4)假设张三、李四和王五三人中有人从不说真话,也有人从不说假话。某人向这三人分别提出同一个问题:谁是说假话者?张三答:“李四和王五都是说假话者”;李四答:“张三和王五都是说假话者”;王五答:“张三和李四中至少有一人是说假话者”。请根据以上信息用消解原理求出谁是说真话者。
5.什么是数据工程?什么是知识工程?什么是数据挖掘?什么是KDD?KDD的主要流程及每阶段的思想是什么?(以下回答大部分参考《数据与知识工程导论》,胡运发著,“清华大学出版社”出版)
答:数据工程是设计和实现数据库系统以及数据库应用系统的理论、方法和技术,是研究结构化数据表示、数据管理和数据应用的一门学科。
知识工程是设计和实现知识库系统及知识库应用系统的理论、方法和技术,是研究知识获取、知识表示、知识管理和知识利用的一门学科。
数据挖掘是用模式识别、统计学、数学等方法过滤存储在数据库中大量的数据来发现新的、有意义的关系、模式和趋势的过程。
KDD英文全称是Knowledge Discovery in Databases,译为“知识发现”。KDD是从大量数据中提取出可信的、新颖的、有效的并能被人理解的模式的处理过程,这种处理过程是一种高级的处理过程。
KDD的主要流程及每阶段的思想为:(1)了解应用领域。了解KDD相关领域的有关情况,熟悉有关的背景知识,并弄清楚用户的要求;(2)创建目标数据集。根据用户的要求从数据库中提取与KDD相关的数据,KDD将主要从这些数据中进行知识提取,在此过程中,会利用一些数据库操作对数据进行处理;(3)数据清理和预处理。主要是对阶段(2)产生的数据进行再加工,检查数据的完整性及数据的一致性,对其中的噪音数据进行处理,对丢失的数据可以利用统计方法进行填补;(4)数据缩减和变换。对经过预处理的数据,根据知识发现的任务对数据进行再处理,主要通过投影或数据库中的其他操作减少数据量;(5)确定数据挖掘功能。根据用户的要求,确定KDD是发现何种类型的知识,进而确定数据挖掘应有的功能;(6)选择挖掘算法。根据阶段(5)所确定的功能,选择合适的数据挖掘算法,这包括选取合适的模型和参数,并使得数据挖掘算法与整个KDD的评判标准相一致;(7)数据挖掘。运用选定的数据挖掘算法,从数据中提取出用户所需要的知识,这些知识可以用一种特定的方式表示或使用一些常用的表示方式,如产生式规则等等;(8)模式评估和知识表示。经过评估,去掉已经存在冗余的或者无关的模式。如果模式不满足用户的要求,则需要回退到(2)阶段,如需要重新选择数据、采用新的数据变换方法、设定新的参数值、甚至换一种算法等等。另外还需要将挖掘出来的结果可视化,或者把结果转化成用户容易理解的表示方法;(9)运用发现的知识。运用KDD的知识以实现预想的目标。
6.什么是Web挖掘?Web挖掘有哪几种类型?各种类型的内容和作用分别是什么?
答:Web挖掘指的是应用数据挖掘技术对Web资源的内容、Web资源的结构和Web资源的使用进行挖掘。(Web mining is the application of data mining techniques to the content, structure, and usage of Web resources.)