形式概念分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4节 模糊概念格
在这方面,国外已有了一些研究成果。例 如 Wolff(1998) 提出了一种基于模糊信息 的表示法,将传统的形式背景中的属性 用模糊语言变量值表示,依据标度分类 形式背景的对象,构造基于标度的格。 Burusco 和 Fuentes(1994) 讨论了 L- 模糊概 念集合的格结构,并给出了一个计算这 种格的方法。
O3=O1∪O2, ,D3=D1∩D2.
第2节 概念格的生成与运算
定义2.6 如果L(K1) 和L(K2)是两个同域且独立的概 念格,则定义L(K1)∪L(K2)是概念格L满足: 1 对于L(K1)中的任意概念C1=(O1, D1)和L(K2)中的 任意概念 C2=(O2, D2),令 D1∩D2 = D3,如果在 L(K1)中大于C1的任意概念C’1=(O’1, D’1)不存D3 D’1并且在L(K2)中大于C2的任意概念C’2=(O’2, D’2) 不存D3 D’2,则C1+C2L; 2 对于 L(K1) 中的任意概念 C1, 如果在 L(K2) 中不存 在等于或小于C1的概念,则C1L; 3对于L(k2)中的任意概念C2,如果在L(K1)中不存在 等于或小于C2的概念,则C2L; 4 上述3种情况之外的概念不属于L。
第2节 概念格的生成与运算
K1
第2节 概念格的生成与运算
K2
。
第2节 概念格的生成与运算
定理2.1 如果L(K1) 和L(K2)是同域且独立的 概念格,则L(K1)∪L(K2)=L(K1+K2)。 证明:略
第2节 概念格的生成与运算
(U1, Ф)
(156, a) (56, ab) (5, abc) (φ ,abcd)
第2节 概念格的生成与运算
• 2.1 批生成方法 • 现有的批处理概念格生成算法大多都是 先生成形式背景所对应的所有概念,然 后再决定概念之间的亚概念-超概念连 接关系。有的算法只生成所有的概念, 有的算法用来产生其Hasse图,也有的算 法既生成所有的概念,又同时形成其 Hasse图。
第2节 概念格的生成与运算
当支持度阈值和可信度阈值确定之后, 如果它们对于任何节点都是统一的,则 有下面定理。
第3节 概念格上的关联规则提 取
第3节 概念格上的关联规则提 取
第3节 概念格上的关联规则提 取
• 例1.3 对于下图中的形式背景和概念格, 规定支持度阈值=0.4和可信度阈值 =0.66,则符合阈值条件的节点序列 #2#4#8、#5#8和#6#8,只考虑每个序列两 端的节点对,即考虑#2#8、#5#8和#6#8, 得规则
第2节 概念格的生成与运算
B1 f ( g ) B1 • 步骤4、如果同时满足: B1 f ( g ) ; 和不存在(A1, B1)的某个父节点满足 B2 B1 f (g, ) 则要产生一个新节点 ( A1 {g}, B1 f ( g )) ; • 步骤5、对新产生的节点加入到L中,同时调 整节点之间的链接关系; • 步骤6、反复步骤2到步骤5,直至形式背景中 的对象处理结束; • 步骤7、输出概念格L。
第2节 概念格的生成与运算
• •
算法2.1 两个同域一致概念格的纵向合并算法 输入:两个概念格 L(K1) 和 L(K2) 输出:L(K1)∪L(K2)
BEGIN FOR L(K2)中每个概念按内涵的势的升序 DO 采用概念插入算法插入到L(K1) ENDFOR 更新的L(K1)就是L(K1)∪L(K2) END
第2节 概念格的生成与运算
• • • • • • 算法11.2 概念格的渐进式生成算法: 输入:形式背景 输出:概念格L 步骤1、初始化格L为{({},M)}; 步骤2、从G中取一个对象g; 步骤3、对于格L中的每个概念 C1 ( A1 , B , 1) 如果 B1 f ( g ) ,则把g并到 A1 中;
rules(C ) {R Intent (C ) R}
{ rules bce}(#2) {b e, e b}
第3节 概念格上的关联规则提 取
• 例4 在例3中形式背景所对应的概念格中,对 于每个概念,我们将以此计算出其蕴含集: • 概念#2的内涵为{be),它具有2个真内涵缩减 {b}和{e},因此 。 • 概念#3的内涵为,其内涵缩减也是,这并非 真内涵缩减,因此无规则需要生成。 • 概念#4的内涵为{bce},它具有2个真内涵缩 减{bc}和 {ce},因此 rules(#4) {bc e, ce b} 。
第1节 基本理论
• 定义1.1 (形式背景)一个形式背景 K=(G,M,I) 由集合 G 、 M 以及它们之间的 关系组成I,G的元素称为对象(Objects), M的元素称为属性(Attributes)。为了表示 一个对象o和一个属性m在关系I中,可以 写成 oIm 或 (o,m) ∈ I ,读成“对象 o 有属 性m”。
第2节 概念格的生成与运算
对于每次新增一个对象,都需和已 生成概念格中的概念进行比较,这时已 有的概念节点和新增的对象之间可以存 在三种关系:无关概念(Old Concept)、更 新概念(Modified Concept)和新增概念的 产生子概念(Generator Concept)。渐进式 构造主要是对更新概念和新增概念进行 不同处理后,再调整概念之间的相互关 系。
第2节 概念格的生成与运算
定义2.2 如果.. K1=(U1,A1,I1)和K2=(U2,A2,I2) 是同域且独立的,则 K1+K2=( U1∪U2,, A1∪A2, ,I 1∪,I 2)
第2节 概念格的生成与运算
定义 2.3 对于C1=(O1, D1)和C2=(O2, D2),如 果 D1=D2,则称 C1 内涵 等于 C2,简称 C1
• • • • • • 算法2.1概念格的批生成算法: 输入:形式背景 输出:概念格L 步骤1、初始化格; L {(G, f (G))} 步骤2、初始化队列; F {(G, f (G))} 步骤3、取出队列F中的一个概念C,产生出 它的每个子概念Cc; • 步骤4、如果某个子概念Cc以前没有产生过, 则加入到L中,加入队列F;
第2节 概念格的生成与运算
2.3 概念格并运算 定义2.1 如果形式背景K1=(U1,A1,I1)和 K2=(U2,A2,I2)满足U1U, U2U, A1A, A2A, 则称K1和K2是同域形式背景, L(K1) 和L(K2)是同域概念格.,如果K1和K2满足 U1∩U2 =ф,则称K1和K2、L(K1) 和L(K2)分 别是外延独立的,简称独立的。
第1节 基本理论
定义1.3 (概念格)对于概念(O1, D1)和(O2, D2).如果D2D1,则形式概念(O1, D1)是 形 式 概 念 ( O2, D2) 的 亚 概 念 , 记 为 ( O1, D1)(O2, D2).通过这个关系,我们得到 一个有序集CS(K)=(CS(K), ),这是一个 完全格,被称为形式背景 K 的概念格 , 记 为L(K).
形式概念分析
刘宗田 上海大学计算机学院,200072 ztliu@mail.shu.edu.cn
第1节 基本理论
人类在认知过程中,把所感觉到的具有 共同特点的事物抽取出来,加以概括, 称为概念。 在哲学中,概念被理解为由外延和内涵 两个部分所组成的思想单元。 基于概念的这一哲学思想,德国的R.Wille 教授于1982年首先提出了形式概念分析 理论 。
第1节 基本理论
第2节 概念格的生成与运算
概念格的构造问题是形式概念分析应 用的前提。由于概念格的时空复杂度随 着形式背景的增大而可能指数性的增大, 有关概念格的生成问题一直是形式概念 分析应用研究的一个重点。国内外的学 者和研究人员对此进行了深入的研究, 提出了一些有效的算法来生成概念格, 这些算法一般可分为两类:批生成算法 (Batch Algorithm) 和 渐 进 式 生 成 算 法 (Incremental Algorithm )。。
第2节 概念格的生成与运算
(U1∪U2,φ ) (156(1), a) (256(2),b) (35(2), c) (46(1), d)
(56, ab)
(6(wenku.baidu.com), ad)
(5(2), bc)
(5, abc) (φ ,abcd)
(6, abd)
这里U1={1 2 3 4 5 6}和U2={(1) (2)}
第3节 概念格上的关联规则提 取
1 基于先辈晚辈节点对的关联规则提取
第3节 概念格上的关联规则提 取
• 在概念格上提取规则,我们可以只关心 那些外延对象数大于等于支持度阈值的 节点,并且只关心晚辈外延对象个数与 先辈外延对象个数的比值大于等于可信 度阈值的节点对。
第3节 概念格上的关联规则提 取
第3节 概念格上的关联规则提 取
第3节 概念格上的关联规则提 取
• 2 基于内涵缩减的蕴含规则提取 • 定义1.16(内涵缩减)对于给定的概念 C=(A,B),如果属性集合R满足下述两个 条件
• 则它R被称为是C的一个内涵缩减。如 果 。则称是真内涵缩减。
第3节 概念格上的关联规则提 取
如果概念C有真内涵缩减R,则它对应的蕴 含规则集为
第2节 概念格的生成与运算
2.5 概念格交运算
第2节 概念格的生成与运算
第2节 概念格的生成与运算
第2节 概念格的生成与运算
第2节 概念格的生成与运算
第2节 概念格的生成与运算
第2节 概念格的生成与运算
第2节 概念格的生成与运算
(56, Ф)
(56, a) (56, ab)
(56, b)
(5, c)
(6, d)
(6, abd) (5, abc) (φ ,abcd)
L(K1)和 L(K2)的准交
第2节 概念格的生成与运算
第2节 概念格的生成与运算
• 2.6 概念格的运算定律
第2节 概念格的生成与运算
第3节 概念格上的关联规则提 取
概念的内涵与事务数据库中的项目集非常 类似,而且有更严格的限制,因此可以 在概念格上提取关联规则,而且比直接 在事务数据库上提取有更多的优势。
等于C2
第2节 概念格的生成与运算
定义2.4对于C1=(O1, D1)和C2=(O2, D2),如 果 D1D2,则称 C1 内涵 小于 C2,简称 C1 大于C2,或称C2小于C1
第2节 概念格的生成与运算
定 义 2.5 对 于 C1=(O1, D1), C2=(O2, D2) 和 C3=(O3, D3), 定 义 C1+C2 等 于 C3,, 如 果
第2节 概念格的生成与运算
• 步骤5、增加概念C和其子概念Cc的链接关系; • 步骤6、反复步骤3~步骤5,直至队列F为空; • 步骤7、输出概念格L。
第2节 概念格的生成与运算
• 2.2 渐进式生成方法 • Godin R.等在1995年提出的概念格生成算 法是最经典的一个渐进式生成算法,通 常称为Godin算法。该算法从空概念格开 始,通过将形式背景中的对象逐个插入 概念格来实现对概念格的渐进式构造。
第1节 基本理论
第1节 基本理论
定义1.2 (概念) 对于形式背景K,在G的幂集 和M的幂集之间可以定义两个映射f和g如下: •OG: f(O)={d|xO:(xId)} •DM: g(D)={x|dD:(xId)} 来自P(G)P(M)的二元组(O, D)如果满足两个条 件:O=g(D)及D=f(O),则它被称为是形式背景 K的一个形式概念,简称概念,,记为C=(O, D), 其中D 和 O分别被称为概念 C的内涵和外延. K 的所有形式概念的集合被标记为CS(K).
第4节 模糊概念格
• 1一种模糊概念格模型
第4节 模糊概念格
形式背景 K1 所对应的概念格 L(K1)
(256, b)
(35, c)
(46, d)
(6, abd)
第2节 概念格的生成与运算
(U2, Ф) ((1)56, a) ((2)56, b)
((1) 6, ad)
(56, ab)
((2)5, bc)
(6, abd) (φ ,abcd)
(5, abc)
形式背景 K2 所对应的概念格 L(K2)