《临床决策支持系统》复习提纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、基本观点
1、E.H.Shortliffe 等人从1972年开始研制的MYCIN 是用于诊断和治疗感染性疾病的专家系统。
2、 归结原理(又称消解原理)是Robinson 提出的一种证明子句集不可满足性,从而实现了定理证明的一种理论及方法。
子句集中各子句间的关系是合取关系,因此,子句集中只要有一个子句是不可满足的,则子句集就是不可满足的。
另外,空子句是不可满足的,所以只要子句集中包含有一个空子句,则此子句集就一定是不可满足的。
3、人们研究了许多归结策略,这些归结策略大致可分为两大类:一类是删除策略,另一类是限制策略。
其中第一类中包含纯文字删除法、重言式删除法和包含(孕)删除法
4、数据仓库的存储模型有维立方体、星形模型、雪花模型和星网模型等四种。
5、知识发现的主要步骤包括:数据准备、数据挖掘、结果表达与解释。
6、关联规则的基本形式:前提条件==>结论[支持度, 置信度]
7、Apriori 算法主要由连接和剪枝两步构成。
8、等价关系不需要满足自反性,对称性和一致性。
9、设:论域{1,2,3,4,5,6}U =,划分{{1,2},{3},{4,5,6}}UR =,集合{2,3,4}X =,请
写出X 的下近似为{3} 和上近似为{1,2,3,4,5,6}
10、对决策信息系统的相对约简是在保持系统决策能力不下降的前提下,获取尽可能少而有
意义的条件属性。
11、归结原理的应用主要有两个方面:进行定理证明的归结反演和求取问题的答案。
12、20世纪90年代兴起的数据仓库、联机分析处理和数据挖掘三项新技术为决策支持系统开辟了一条从数据中获取辅助决策信息的新路,称之为新决策支持系统。
13、多个等价关系的交集能够确定一个划分。
14、数据集市的结构: 从属数据集市、独立数据集市。
15、KDD 的主要步骤包括数据准备、数据挖掘和结果的表达与解释。
16、关联规则中的项集指的是在数据库中出现的属性值的集合。
关联规则挖掘就是从大量数据中发现项集之间有趣的关联。
17、产生式系统的基本结构
把一组产生式放在一起,让它们互相配合,协同作用,一个产生式生成的结论可以供另一个产生式作为已知事实使用,以求得问题的解,这样的系统称为产生式系统。
一个产生式系统由三个部分组成:规则库、综合数据库、控制系统(推理机)。
18、数据仓库具有面向主题、集成、稳定、随时间变化、数据量大、软硬件要求高等特点。
19、联机分析处理(OLAP)是在OLTP/联机事务处理基础上发展起来的,具有快速性、可分析性、多维性、信息性等特点。
20、决策树的剪枝策略有先剪枝/预剪枝和后剪枝两种。
21、决策支持系统是综合利用大量数据,有机组合众多模型,通过人机交互,辅助各级决策者实现科学决策的系统。
该定义与决策支持系统的结构是一致的。
DSS是在数据库系统的基础上,增加了模型库系统,使管理信息系统上升到了决策支持系统的新台阶上。
DSS使那些原来不能用计算机解决的问题逐步变成能用计算机解决。
22、决策支持系统的“三部件”结构是指其由对话部件(人机交互系统)、数据部件(数据库管理系统和数据库)和模型部件(模型库管理系统和模型库)三者的有机结合而组成的。
23、决策支持系统的“三系统”结构是指其由语言系统(LS)、问题处理系统(PPS)和知识系统(KS)三部分组成。
24、结构化程度是指对某一决策问题的决策过程、决策环境和规律,能否用明确的语言(数学的或逻辑学的、形式的或非形式的、定量的或定性的)给予说明或描述清晰程度或准确程度。
按照决策问题的结构化程度不同把决策问题分成结构化问题、半结构化问题和非结构化问题三种类型。
1).结构化决策问题
结构化决策问题相对比较简单、直接,其决策过程和决策方法有固定的规律可以遵循,能用明确的语言和模型加以描述,并可依据一定的通用模型和决策规则实现其决策过程的基本自动化。
早期的多数管理信息系统,能够求解这类问题,例如,应用运筹学方法等求解资源优化问题。
2).非结构化决策问题
非结构化决策问题是指那些决策过程复杂,其决策过程和决策方法没有固定的规律可以遵循,没有固定的决策规则和通用模型可依,决策者的主观行为(学识、经验、直觉、判断力、洞察力、个人偏好和决策风格等)对各阶段的决策效果有相当影响。
往往是决策者根据掌握的情况和数据临时做出决定。
3).半结构化决策问题
半结构化决策问题介于上述两者之间,其决策过程和决策方法有一定规律可以遵循,但又不能完全确定,即有所了解但不全面,有所分析但不确切,有所估计但不确定。
这样的决策问题一般可适当建立模型,但无法确定最优方案。
25、A.演绎推理的结论没有超出已知的知识范围,而归纳推理和类比推理的结论超出已知的知识范围。
演绎推理只能解释一般规律中的个别现象,而归纳推理和类比推理创造了新的知识,使科学得到新发展,是一种创造思维方式。
B.演绎推理中由于前提和结论有必然联系,只要前提为真,结论一定为真。
归纳推理和类比推理中前提和结论,不能保证有必然联系,具有或然性。
26、可信度推理方法中证据不确定性的表示。
二、概念
1、人机对话系统
是DSS中用户和计算机的接口,在操作者、模型库、数据库和方法库之间起着传送(转换)命令和数据的重要作用,其核心是人机界面。
2、IDSS
IDSS (intelligent decision support system,智能决策支持系统,是决策支持系统与人工智能技术,特别是专家系统相结合的产物,它既充分发挥了专家系统中知识及知识处理的特长,也充分发挥了传统决策支持中数值分析的优势,可定量、定性分析,有效解决半结构化和非结构化问题。
3、“三部件”结构
1980年由R.H.Spraque提出的“三部件结构”即由对话部件(人机交互系统)、数据部件(数据库管理系统和数据库)和模型部件(模型库管理系统和模型库)三者的有机结合。
4、Data Warehouse
“A warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management’s decision making process”.(DW是面向主题的、集成的、反映历史变化的、相对稳定的数据集合,用于管理决策过程支持。
)(英语、汉语回答都可以)
5、项集
关联规则中的项集指的是在数据库中出现的属性值的集合。
6、专家系统
是以计算机为工具,利用专家知识及知识推理等技术来理解与求解问题的知识系统。
将ES与传统DSS结合而形成IDSS。
7、GDSS
GDSS(Group Dession Support System,群体决策支持系统),是一种在DSS基础上利用计算机网络与通信技术,供多个决策者为了一个共同的目标,通过某种规程相互协作地探寻半结构化或非结构化决策问题解决方案的信息系统。
8、“三系统”结构
1981年R.H.由Bonczek等人提出的决策支技系统的三系统结构是由语言系统、知识系统和)问题处理系统三者的有机结合。
9、知识发现
答:Knowledge Discovery in Database(KDD)。
从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的高级处理过程。
10、频繁项集
答:满足最小支持度的项集称之为频繁项集,也称高频项集。
11、前束形范式:一个谓词公式,如果它的所有量词均非否定地出现在公式的最前面,且它的辖域一直延伸到公式之末,同时公式中不出现连接词→及↔,这种形式的谓词公式称为前束形范式。
12、Skolem标准型:从前束形范式中消去全部存在量词所得到的谓词公式称为Skolem标准型。
13、OLAP:
On-Line Analytical processing,是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面(维,即坐标)观察信息,以达到深入理解数据的目的。
简单定义:共享多维信息的快速分析。
(3分)
14、决策树:
决策树是用样本的属性作为结点(1.5分),用属性的取值作为分支的树结构(1.5分)。
15、支持集策略:1965年沃斯等人提出的一种归结策略。
核心为:每一次归结时,亲本子句中至少应有一个是由目标公式的否定所得到的子句,或者是它们的后裔。
支持集策略是完备的,若子句集是不可满足的,能归结到空字句。
16、非结构化决策问题
17、问题结构化程度
三、简答题
1、数据仓库中的元数据可分为哪四种类型?
2、阐述数据仓库的开发步骤。
3、简述对决策信息系统约简的意义。
4、简述粗糙集在医学信息领域应用的意义。
5、简述OLAP的基本功能。
6、简述数据仓库系统的组成。
7、简述决策树的基本思想。
8、影响数据挖掘质量的因素有哪些?
9、简述数据挖掘的方法与技术
10、简单阐述产生式系统的组成
四、知识表示与推理:实习题。