基于概念格的组规则产生集的算法研究
一种基于概念矩阵的概念格生成算法
Ne Alo ih o ne a i g Con e tie Ba e n Co e - a rx w g rt m fGe r tn c ptLa tc s d o nc ptm ti
摘
要
概念格作 为形 式概念分析理论 中的核 心数据结构 , 在机 器学习和数 据挖掘等领域有 着广泛的应 用。构造 概
念格十分重要 , 针对此引入 了概 念矩 阵思想 , 出 了基 于概 念矩 阵的概念格 生成 算法 C G( o cp- ti B sd 提 MC C n et Mar ae x o cps nrt n 。该算法从格的顶端节点开始 构造 , 于概念矩 阵, 用属性的秩 为每 个 节点生成 它的所有 子 C ne t Geeai ) o 基 利 节点 , 完成子节点到父节点之 间的链接 , 并生成哈斯 图。给 出了这种 算法的理论依据 。最后提供 了这一 算法的伪码 ,
C N Z e Z HE hn HANG Na WAN S -n G uj g i
( l geo m p trSce c ndTehn lgy Jl ie st , Col fCo u e in ea c oo , in Unv r iy Cha g hu 3 01 Chna e i n c n 1 0 2, i )
第3 7卷 第 9 期 21 0 0年 9月
一
计
算
机
科
学
Co u e S in e mp t r c e c
基于概念格的分类规则提取算法及其应用
严形式背景中的对象个数为Ns/BEGINFOR概念格中的每J个节点C(A,a)eL球A>N+0佃NJUDGE2(C)IFRIGHT>N,+0THENB—cka=)cla为一条分类规则分类节点编号--Cu分类节点编号ENDIFENDEndMainJUDGE2(C)产从形式背景中选区一批训练数据,个数为N1+,FOR训练集中的每条记录TⅢtATTRIBUl耻ATHENRIG耵=RIGHT+lENDⅢNEXTTENDIFENDJUDGE2NEXTC从上面的分析可以得出从概念格FL中提取分类规则的步骤如下:构造分类概念格;选择一定度量上的概念格节点;将类标号属性从概念格中提取出来,剩余的属性作为分类规则的前件。
5在LAMOST中的应用在Pentiumm.1.0GCPU,256M内存,Windows2000操作系统,DBMS为ORACLE9i,用VisualBasic6.0实现了设计与实现了基于概念格的恒星光谱数据分类规则挖掘系统。
选用恒星光谱数据为数据集,经过以下预处理后构成该系统中的分类形式背景,1)选定间隔为20的200个波长3510,3530,…,8330A作为条件属性集,并依据流量、峰宽和形状,将每个波长离散化为十三种值;2)恒星分类的七种类别A、B、F、G、K、M、oY乍为类标号属性。
提取分类规则的方法如下:1)将离散化后的恒星天体光谱数据作为形式背景进行分类规则的提取,首先随机选择一部分数据构造分类概念格。
将分类概念格节点的内涵分为两部分:第一部分为类标号属性,作为分类规则的后件;第二部分为概念格节点出去类标号属性的部分,作为分类规则的前件。
2)类规则的精度通过选择剩余数据作为训练集合,通过将光谱的属性与规则的前件比较,选定一定支持度之上的分类规则,分类规则的正确性通过剩余的数据进行测试。
图2分类形式背景图3分类规则图2为该系统预处理后形成的分类形式背景,图3是分类支持度在3.10之问所提取出的分类规则,共提取出1738条。
一种基于概念格的规则提取方法及其应用_杨霁琳
( 满 足 X* =B, 且 X =B* , 则称( 是一个形式概 X, B) X, B) 简称概念 。 其中 , 念, X 称为概念的外延 , B 称为概念的内涵 。 ( 在形式背景 ( 的 概 念 之 间 可 以 定 义 序 关 系: U, A, I) X1 , 。 所有概念构 成 的 集 合 B X2 , B B ≤( X1 X1 ( B 1) 2) 1 2)
[ 1]
2 相关概念格的理论
) 概念格分 析 的 数 据 一 般 用 形 式 背 景 ( 来 f o r m a l c o n t e x t 表示 , 形式背景的定义如下 。
[ 8] 定义 1 为 一 个 形 式 背 景, 其中U={ U, A, I) x 称( 1,
。
概念格是知识的一 种 表 现 模 型 , 依据知识体在内涵和外 建 立 概 念 层 次 结 构。借 助 概 念 格 理 延上的依赖或因果 关 系 , 论可以对具有对象和属性的数据库进行分析, 通过概念的外 延与内涵可以发现规则性知识 。 目前国内外研究者已经提 出 了许多基于概念格的规则提取方法 , 主要有 : 等在其 G o d i n R. 提出的增量式建格算法基础上给出了由概念格来提取蕴涵 规
, A b s t r a c t o n c e t l a t t i c e i s a n e f f e c t i v e t o o l f o r r u l e s e x t r a c t i o n . F i r s t t h e r u l e s e t s a n d t h e e n e r a l a t t r i b u t e s e t s a r e C p g r e m i s e d e f i n e d u n d e r t h e o f t h a t a l l t h e c o n c e t s w e r e k n o w n a n d t h e l a t t i c e s t r u c t u r e n e e d n o t b e k n o w n i n a f o r m a l p p , c o n t e x t . T h e n a r u l e e n e r a t i n a l o r i t h m o f u n i v e r s a l a l i c a t i o n i s i v e n w h i c h i s a r u l e s e x t r a c t i o n m e t h o d f o r e a c h - g g g p p g , e n e r a l t e o f s a m l e s e t i n t h e r e d u n d a n t r u l e s s e t b a s e d o n t h e a t t r i b u t e s e t s . F u r t h e r m o r e t h e r e l a t e d r u l e s u b s e t s g y p p , , c a n b e e n e r a t e d . F i n a l l t h e m e t h o d i s u s e d i n r u l e s e x t r a c t i o n o f C b a n d r a d i o s i n a l a n d t h e e x e r i m e n t a l r e s u l t s - g y g p t h e m e t h o d i s f e a s i b l e a n d e f f e c t i v e . s h o w , , , K e w o r d s o n c e t l a t t i c e R u l e e x t r a c t i o n R u l e s e t K D D e n e r a t i n C - p g g y 方法提取出每一类信号的一个产生规则, 从而在冗余的规则 集中寻找到相应的普遍适用的规则子集 。
基于基集与概念格的关联规则挖掘算法
—34—基于基集与概念格的关联规则挖掘算法陈 湘,吴 跃(电子科技大学计算机科学与工程学院,成都 610054)摘 要:传统关联规则挖掘算法的挖掘效率较低,且挖掘结果中存在大量冗余。
针对该问题,提出一种基于概念格与基集的关联规则挖掘算法。
利用规定种子项分布范围的基集代替原始数据库以缩小挖掘源规模,从而建立概念格快速求解出关联规则。
实验结果表明,该算法在时间效率方面优于Base 和Apriori 算法。
关键词:数据挖掘;关联规则;概念格;基集Association Rule Mining AlgorithmBased on Base Set and Concept LatticeCHEN Xiang, WU Yue(School of Computer Science and Engineering, University of Electronic Science and Technology of China, Chengdu 610054, China)【Abstract 】Traditional association rule mining algorithm has low efficiency and it has a mount of redundant in mining results. Aiming at this problem, this paper presents an association rule mining algorithm based on base set and concept lattice. It replaces the original database with the base set which has seed item distribution range, and builds concept lattice to find association rules. Experimental results show that this algorithm has much superior to Base and Apriori algorithm on the performance of time efficiency. 【Key words 】data mining; association rule; concept lattice; base set计 算 机 工 程 Computer Engineering 第36卷 第19期Vol.36 No.19 2010年10月October 2010·软件技术与数据库· 文章编号:1000—3428(2010)19—0034—03文献标识码:A中图分类号:TP3931 概述关联规则是数据挖掘的重要模式之一。
于扩展概念格的分类规则获取算法
Oc 规 则获 取 算 法
王 燕 , 李 明 ( 兰州理 工大 学 计 算机 与通信 学院 , 州 705 ) 兰 300
( aga @sh . O ) w n yn o u Cr n
摘 要: 概念格是进行数据挖掘和规则提取的有力工具 , 通过 分析概念格 中概念 的特征 , 出了 提 扩展概念格以及基 于扩展概念格的分类规则获取算法。实验表明该算法能够生成 简洁并且 易于理解
的规 则集 。
关 键词 : 念 格 ; 概 扩展 概念 格 ; 分类规 则获 取 ; 颖性 新 中图分类 号 : P 1 . 3 T 3 111 文献标 志码 : A
Cl s i c to u e a qu sto s d o x e a sf a in r l c iii n ba e n e tnde o c ptl tie i d c n e a tc
p p sd o r o e .E p rme t e u t s o a h sag r h c u d o ti i l d u d r t d b e r l e . xe i n a r s s h w t t i o t m o b an smp e a n e sa a l u e s t l l h t l i l n n Ke r s o c p at e e t n e o c p at e l s i c t n r e a q ii o ;n v l y wo d :c n e tlt c ; x e d d c n e t t c ;c a sf ai d c u st n o et i l i i o i i y
Ab t a t o c p at e i a p wef lto rd t n n n d c ust n h o g n lzn h h r ce it so sr c :C n e t t c s o ru o lf aamii g a d r ea q ii o .T ru h a ay i g t e c a a tr i f l i o i i sc
基于约简概念格的关联规则挖掘算法
合, 而概 念 的外延 是 概 念 内涵 可 以确 定 的最 大 对象 集 合 , 个 一
概 念是 一个 完整 的二 元组 。 定 义 23 在 概 念 节 点 之 间 能 够 建 立 起 一 种 偏 序 关 系 。 对 _
大 . 掘 规 则 时 计 算量 偏 大 。本 文 对 G li 进 行 了 扩 展 , 提 高 挖 aos 格 在
根据 偏 序 关 系可 生 成概 念 格 的Has图 ,如 果 有C > , se 在 Has 图中将存 在 一条 边从C, se 到 , 。 c 的直 接超概 念 , C C是 2 C是 的 直接 子 概念 。形 式 背 景 T ( D, 中 , 足 直接 子 概念 一 - 0, R) 满 超 概 念关 系 的所 有概 念节 点 的集合 是一 个 完备 格 ,称 为G li概 ao s
概念格 的形 式化 描述 。
定义 21 一个 形 式 背景是 一 个 三元 组 ( D, , 中0 . 0, R) 其
求 。 面基 于Wie 下 l. l R概念 格 给 出约简概 念格 的定义 。可 以证 明
胡 的约 简概 念格 与下 面定 义 的格是 相 同 的。
是 对象 集合 , D是特 征 集合 , 0 尺是 和D之 间 的二元 关 系 ,即R
为进 一步 降低 概念格 对存 储 空 问的需 求 , 考虑 概念 格 的 可 简化形 式 。 胡学 钢首 先提 出 了 内涵 约 简概念 格 的思路 —— 在扩
展 概 念 格 的 基 础 上 去 掉 冗 余 内 涵 . 而 大 大 减 少 内 涵 的 存 储 需 从
映对象 与属 性之 间 的联 系以及 概念 泛化 与例 化关 系 。 面 给 出 下
基于概念格和Apriori的关联规则挖掘算法分析
An l s s o s o i to u e m i n l o ih s b s d o a y i f a s c a i n r l ni g a g r t m a e n t e c nc ptl ti e a he Ap i r l o ih h o e a tc nd t r o ia g r t m
W ANG - i g。 HU mg n II Xio p n , W ANG a De x n Xu a g。 U a — i g H o
( c o lo mp t ra dI f r t n,H ee ie st fTe h oo y,Hee 3 0 ,Chn S h o fCo u e n n o ma i o fiUn v riyo c n lg fi2 0 09 ia)
wh c v l e r m h o c p t ie b n r d c n q i a e c e a i n t s i t n in a d q a tt ih e o v s f o t e c n e tl tc y i t o u i g e u v l n e r l t o i n e so n u n i a o t y t t x e so c n b s d t i e t e a s ca i n r l s t e u e s a e i t r s e n I o a io o is e t n i n, a e u e o m n h s o i t u e h s r r n e e t d i . n c mp r s n o
Ab ta t A o c p a tc e r s n sk o e g y t e r l t n b t e h t n i n a d e t n i n o sr c : c n e tl tie r p e e t n wl d eb h e a i e we n t e i e so n x e so f o n a c n e ta d t e r l t n b t e h e e a ia i n a d s e i l a i n o o c p ,t u ti a p i d o c p n h e a i e we n t e g n r l to n p ca i t fa c n e t h si s p l o z z o e
基于包含度理论的概念格构造方法研究
Wi l l e R . 于1 9 8 2年 首先提 出 了形式概 念分 析 理论 ¨ J , 用 于概念 的发 现 、 排 序 和显 示 。形 式 背
景 与形式 概念 是形 式 概 念 分 析 的基 本 概 念 , 形 式
西北 大学学报( 自然科学版 ) 2 0 1 4年 2月 , 第4 4卷第 1期 , F e b . , 2 0 1 4 , V o 1 . 4 4 , N o . 1
J o u r n a l o f N o r t h w e s t U n i v e r s i t y( N a t u r a l S c i e n c e E d i t i o n
概念 是 由形式 背景 中的对 象集 和属性 集组 成 的统
一
体, 形 式 概 念 之 问 可 形 成 一 种 有 序 的层 次 结
构— —概 念格 , 概 念 格 的构 造 。 是 形 式 概 念 分 析理 论 的主要 研究 内容 之一 。 D u n t s c h和 G e d i g a把粗 糙 集 中 的上 、 下 近 似
c o n t e x t , o b j e c t ・ o r i e n t e d c o n c e p t l a t t i c e a n d p r o p e r t y — o r i e n t e d c o n c e p t l a t t i c e w h e n i n c l u s i o n d e g r e e t a k e s p a r t i —
念 格 的方法 可 以实现对 多种 概念 格构 造方 法 的统
Abs t r a c t:A ki n d o f o p e r a t o r b a s e d o n a f o r ma l c o n t e x t i s d e ine f d us i ng t he t h e o r y o f i n c l us i o n d e g r e e,a n d i t c a n b e d e mo n s t r a t e d t h a t t he ne w o p e r a t o r c a n i n d u c e c o n c e p t l a t t i c e,c o n c e p t l a t t i c e o f c o mp l e me n t f o r ma l
基于概念格的规则提取算法研究及改进
创 建 一 个 新 的 概 念 格 , 中 取 出 相应 的规 则 。 定 从 设 支 持 度 的 最 小 值 为A, 任 度 的最 小 值 为 B 信 。
作 者 简 介 : 凯 (9 1 )硕 士 , 教 , 究方 向 : 赵 18 一 , 助 研 网络 数 据 库 。
Co e tLa tc s d Rul t a to g rt m s a c nd I pr v m e t nc p ti eba e eEx r c i n Al o ih Re e r h a m o e n
zHA0 K
( ioV c t n l n tue Z b 5 3 4, hn ) Zb o a o a I s tt i 2 5 1 C ia i i , o
不小于指定的项 目集 。
( )在 事 务 数 据 库 找 出 的频 繁 数 据 项 目集 ,经 过 2
一
O a() ̄; mx = Y
J Y Y ; /集 合 X中的 新 项 目集 = —j / Fr lj J / 一 个 子 集 项 目作 为 最 大 生 成 器 o l a / 每
相 比 , 于 产 生 集 的规 模 大 大 减 少 了 , 由 由此 , 户 可 以 用
,做 为下 一 轮 的候 选 最 大生 成 器 /
很好地 理解相应的规则 , 更容易推导 出其他 的新规 则 , 避免 了大量的对用户来说无用 的新规则 的产 生 ,对 于
大型的数据库来说 , 也避免 了产生大量 的规则产 生集 。
但 是 该 算 法相 对 传 统 规 则 集 来 说 也 有 不 足 ,比如 新 的
收 稿 日期 :0 1 1 — 6 2 1- 0 2
0 1{ =l dl l+ ,0 E jj 卜‘ "Jl =0’j…J l j l j 0, -l I l" } V t 3 o …jJ j +
基本概念格的关联规则挖掘算法
( 2Y ) z , I的超概念 , 3 ,2是( lY ) 2 记做 C≤C 。若 C≤C 且 C≠ c , l 2 1 2 1 2则记做 c <C , l 2若不存在概念 C 2
=
.
( ,,满 足 C< C<C , 称 C ,Y ) 。 , 则 是 C 的父概 念 ( 。 或上覆 盖 )C 是 C ,。 z的子概 念 。令 功( M ,) 示 G, ,表
V0. 9 No 1 12 .
F b ,0 6 e .20
基本 概 念 格 的关联 规 则挖 掘 算 法
王 旭 , 马 垣
( 鞍山科技 大学 计算机科学与工程学院 , 辽宁 鞍 山 l44 ) 0 4 1
摘 要 : 在已有的基于概念格的关联规则挖掘算法中, 搜索频繁结点的范围太大, 从而导致花 费大量的时间
维普资讯
第1 期
王旭 , : 等 基本概 念格 的 关联规 则挖 掘 算法
・ 1・ 5
2 概念格和 索引链表 的构造算法
为了快速地找到所有的频繁结点 , 设计 了一个索引链表 Idx i , n eLs 用来辅助快速地找到所有频繁 t 结点。索引链表在概念格生成的同时被创建 , 的数据结构包含如下数据域 :o t 用来指 向概念结 它 pi e nr 点 ,xe i .u 用来 记 录所指 向 的概念 结 点 的外 延 数 量 ,et etn o nm s n nx 用来 指 向下 一个 索 引结 点 。索 引链 表 元素按照概念结点外延的个数由小到大排列 , 通过这个有序的索引链表 , 按照给定 的支持度阈值 , 可以 快速地找到所有的频繁结点 , 从而缩小了结点的搜索范围 , 降低了算法的复杂度。
关联 规则挖 掘 作为数 据挖 掘 中的核心 任务 之一 , 已经得 到 了广泛 而深 入的研 究 , 中基 于概念 格 的 其 关联规 则挖 掘方 法 已经 成 为 研 究 的热 点 。形 式 概 念 分 析 理 论 经 过 了 2 0多 年 的发 展 , 已经 在 知 识 发 现 ]软 件工 程 [ 、 卫、 3 信息 检索 【和信 息过滤 等众 多领域 取得 了成 功 的应 用 , 别是 在知识 发现 领域 的 J 4 5 J 特 应 用更 是 引人注 目。人 们 已经 看到 从 形式 背 景 的 概 念格 上 提 取 关联 规 则 , 著 名 的 A oi i 法 、 P 与 pr r算 o F 增长算 法 等相 比, 就具 有许 多 独特 的优点 。在 已有 的基 于概 念格 的关联 规则 提 取算 法l 中 , 6 由于使 用 了图的深 度优先 遍 历和广 度优 先遍 历来 寻找频 繁结点 , 多的 弹栈 、 栈或 出 队、 队这 样 的操 作 , 繁 压 进 花费 了大 量 的时 问。为 了加快 在概 念格 中挖掘 关联 规则 的速 度 , 本文 利 用 了“ 引链 表 ” 种 数据 结 构通 过 索 这 单 向链 表 的查找 操 作 , 可 以快 速地 找到所 有 的频繁 结点 , 而 缩小 了结点 的搜索 范 围 , 就 从 减少 了提取 关 联规 则所 用 的时问 , 降低 了算 法 的复杂度 。
基于形式背景级联运算的关联规则挖掘算法
定义 2 两个 函数 ) 对于一个对象集合 G, ( 定义 :
到 目前为止 , 基于概念格的关联规 则提取算 法 。都仅仅 是在 。
一 一
定义 3 形式背景的概 念和概念格 ) 形式背景 ( M,) ( G, , 的
个形式概念是 ( , , ,) 其中 G, CM, , y _ 满足 = (,而且 ,= g, ) ,
_ ) 叫做概念 x Y 的外延 , 厂 。 ( ,) Y叫做概念 ( Y 的内涵 。如果 ,)
k o e g h t od b t e e s v r l o ma o tx sc n b b an d b i meh d Mo e v r i i a e , i d x l k d l t i gv n, n wld e t a l ewe n t e e a r l n e t a eo ti e y t s h h f c h to . r o e , t sp p r “ n e -i e s” s i e n h n i a d t i d t t cu e i s d t e r h fral q e t o e a t t u e r n e o e r h n r e u n o e i e u e a d te c mp t g n h s aa sr t r u e o s a c l  ̄e u n d sf s ,h st a g fs a c i gf q e t d srd c d, h o u i u s o n h of r n n n c mp e i ft e a g rt m re t c ig a s cai n r l a e n c n e t at e i r d c d F n l ,h ai i ft e meh d si u t t d o l xt o h lo i y h f xr t s o it e b s d o o c p t c s e u e . ial te v ldt o t o si l s a e Байду номын сангаас o a n o u l i y y h l r
概念格的快速构造算法及其应用探讨
概念格是一种用于数据分析和知识发现的重要工具,它可以帮助人们在数据中快速发现潜在的规律和关联,进而为决策提供依据。
而快速构造算法是一种用于构建概念格的高效算法,它在处理大规模数据时具有较好的性能表现。
本文将探讨概念格的快速构造算法及其在实际应用中的价值和意义。
一、概念格的基本概念及应用场景1.1 概念格的概念概念格是由法国数学家Begrès在20世纪初提出的一种概念表示方法,它可以将数据集中的对象和属性转化为一个交互的概念结构。
概念格由概念和概念之间的关系组成,可以以图形的方式呈现出来,有助于理解和分析数据之间的关系。
1.2 概念格的应用场景概念格在数据挖掘、知识发现、决策支持等领域被广泛应用。
在医疗领域,可以利用概念格分析患者的病历数据,发现疾病之间的关联和规律;在金融领域,可以利用概念格分析客户的交易行为,识别潜在的欺诈风险。
二、概念格的快速构造算法2.1 基于属性增长的算法基于属性增长的算法是一种常见的概念格构造算法,它从数据集中逐步增加属性,构建概念格的过程中只考虑当前对象集合和属性集合的支撑关系,属于一种自底向上的构造方法。
2.2 基于对象约简的算法基于对象约简的算法是另一种常见的概念格构造算法,它从数据集中逐步约简对象,构建概念格的过程中只考虑当前属性集合和对象集合的支撑关系,属于一种自顶向下的构造方法。
2.3 快速构造算法的意义和价值快速构造算法可以大幅提高概念格构造的效率和性能,特别是在处理大规模数据时,传统的构造方法往往效率低下。
快速构造算法在实际应用中具有重要的意义和价值,可以帮助人们更快速地发现数据中的潜在关系和规律,为决策提供更可靠的依据。
三、概念格的快速构造算法在实际应用中的探索与应用3.1 概念格的快速构造算法在医疗领域的应用在医疗领域,概念格的快速构造算法可以帮助医生分析患者的病历数据,发现不同疾病之间的关联和规律,进而为临床诊断和治疗提供依据。
快速构造算法的高效性能可以帮助医生在较短的时间内分析大量的病历数据,为医疗决策提供及时支持。
以概念格为背景的关联规则可视化
⦾大数据与云计算⦾随着数据挖掘领域的发展,关联规则的可视化作为一种重要的知识发现和模式识别方法,已经成为一个重要的研究方向。
现有的机器学习方法虽然能够从大量的原始数据中提炼出关键信息,但是这些信息只有在经过人们的理解并产生最后的决策的时候才能真正体现它们的价值,而可视化恰恰能帮人们完成这最重要的一点。
数据可视化是通过可视化技术把原始数据之间不容易被人发现的数据关系给表示出让人易于发现的模式,关联规则作为一种重要的规则,表现数据之间的相关关系,帮助用户进行数据分析。
概念格是一种在海量数据中提取关联信息的工具,概念格的生成过程其实就是概念聚类的过程,通过生成Hasse图能够直观表示出以概念格为背景的关联规则可视化杨葛英1,2,沈夏炯1,2,史先进1,张磊1,21.河南大学计算机与信息工程学院,河南开封4750042.河南大学河南省大数据分析与处理重点实验室,河南开封475004摘要:传统的关联规则表示方法无法展示概念之间的本质关系,缺少对概念层面的认识,忽略了知识发现结果的共享等问题,而概念格作为一种能够生动简洁地体现概念之间泛化和例化关系的数据结构,在对关联规则可视化和发现潜在知识方面也有着独特的优势。
提出了以概念格为背景的关联规则可视化方法,以概念为查找单元,在概念格中寻找需要展示的关联规则路径,将属性之间的关联关系扩展到概念层面,并给出了相对应的多模式规则的可视化的策略与算法。
结合某校图书馆借书记录数据,进行关联规则分析与可视化实现。
实验结果表明,该可视化方法在知识发现和共享方面具有良好的效果。
关键词:概念格;关联规则;泛化和例化;知识发现;可视化文献标志码:A中图分类号:TP391doi:10.3778/j.issn.1002-8331.2002-0368Visualization of Association Rules in Context of Concept LatticesYANG Geying1,2,SHEN Xiajiong1,2,SHI Xianjin1,ZHANG Lei1,21.School of Computer and Information Engineering,Henan University,Kaifeng,Henan475004,China2.Henan Key Laboratory of Big Data Analysis and Processing,Kaifeng,Henan475004,ChinaAbstract:Traditional rule representation methods cannot show the nature of the relationship between concepts,the lack of understanding of the concept hierarchy,ignoring the problem such as sharing the results of knowledge discovery,and concept lattice as a data structure can succinctly vivid embodiment of generalization and instantiated in the relationship between the concepts,in terms of knowledge visualization and association rules found potential also has a unique advantage. This paper proposes an association rule visualization method with concept lattice as the background,takes concept lattice as the search unit,looks for the association rule path to be displayed in concept lattice,extends the association relation between attributes to the conceptual level,and gives the corresponding visualization strategy and algorithm of multi-pattern rules.Finally,the association rules are analyzed and visualized based on the library data.Experimental results show that the visualization method is effective in knowledge discovery and sharing.Key words:concept lattice;association rules;generalization and instantiated;knowledge discovery;visualization基金项目:国家自然科学基金(61402149);河南省科技厅科技攻关计划基金(182102110065,182102210238);河南省高等学校青骨干教师培养计划(2019GGJS040)。
三元组推理模型
三元组推理模型三元组推理模型是一种基于三元组关系的推理模型,主要用于自然语言处理和知识图谱等领域。
这种模型的主要思想是通过已知的三元组关系,推导出新的三元组关系,从而获取更多的信息和知识。
在三元组关系中,通常包括主体、谓词和客体三个元素,例如“主体-关系-客体”的形式。
这种三元组关系可以表示实体之间的关系,例如“北京-是-中国的首都”。
在三元组推理模型中,基于已知的三元组关系,通过规则、模板等方式实现推导新的三元组关系。
例如,根据“M->R1->E1, M->R2->A”这样的三元组关系,可以推导出“M->R2->A, M->R1->E1”这样的三元组关系。
具体来说,三元组推理模型的工作原理可以分为以下几个步骤:1.数据收集:首先需要收集大量的数据,这些数据通常来自于文本、网页、数据库等来源。
这些数据中包含大量的三元组关系,需要通过数据清洗和预处理等技术进行处理,提取出有价值的三元组关系。
2.建立模型:根据收集到的数据,可以建立一个或多个三元组关系的模型。
这些模型通常采用图模型或矩阵模型等形式表示,可以表示实体之间的关系以及它们之间的复杂联系。
3.推理规则:在三元组推理模型中,需要定义一些推理规则来推导新的三元组关系。
这些规则可以根据领域知识和语言学规则来制定,也可以通过机器学习等技术自动学习规则。
4.推理过程:基于定义好的推理规则,可以对已知的三元组关系进行推理,推导出新的三元组关系。
这个过程可以采用正向推理、反向推理或混合推理等方式进行。
5.结果评估与优化:推导出的新的三元组关系需要通过评估机制进行筛选和优化,以确保结果的准确性和可靠性。
评估机制可以采用准确率、召回率、F1值等指标进行评估,也可以采用人工评估等方式进行。
在实际应用中,三元组推理模型可以应用于以下领域:1.信息抽取:通过抽取文本中的三元组关系,可以构建知识图谱、问答系统等应用。
例如,从新闻报道中抽取事件类型、事件触发词、事件论元等三元组关系,形成事件知识图谱。
基于概念格的无冗余关联规则提取算法
基于概念格的无冗余关联规则提取算法翟悦;秦放【摘要】针对传统挖掘算法生成的关联规则存在大量冗余、难于理解和应用的问题,提出一种新的频繁闭项集概念格FCIL(Fre-quent Closed Itemsets Lattices),用于生成无冗余关联规则。
首先,对概念格理论进行研究,概念格节点间的泛化和例化关系非常适合规则提取;然后,结合频繁闭项集能有效减少规则数目的特点,构建一种新的FCIL;最后,给出FCIL构造算法和相应的规则提取算法。
实验表明,该方法能够高效地产生无冗余规则集。
%Association rules generated by traditional mining algorithm have a large number of redundancies,which are hard to be understood and applied.Aiming at this problem,we present a new frequent closed itemset concept lattice (FCIL),which can generate non-redundancy association rules.First,we study the theory of concept lattice,the generalisation and specialisation relations between the nodes of concept lattice are very suitable for rule extraction;then,we build a new FCIL in combination with the characteristic of frequent closed itemsets which can effectively reduce the number of rules;finally,we develop the FCIL construction algorithm and the corresponding rules extraction algorithm.Experiment shows that the proposed method can efficiently generate non-redundancy rules set.【期刊名称】《计算机应用与软件》【年(卷),期】2015(000)004【总页数】5页(P46-49,66)【关键词】频繁闭项集;FCIL;无冗余关联规则【作者】翟悦;秦放【作者单位】大连科技学院信息科学系辽宁大连116052;大连科技学院信息科学系辽宁大连116052【正文语种】中文【中图分类】TP301.06关联规则[1]的挖掘是数据挖掘研究的重要内容之一,它反映了大量数据中项目集之间的相关联系。
概念结构研究综述
第27卷第1期2010年1月计算机应用与软件ComputerApplicationsandSoftwareVoL27No.1Jan.2010概念结构研究综述贺文1危辉21(复旦大学计算机学院认知算法模型实验室上海200433)2(上海市智能信息处理重点实验室上海200433)摘要概念结构由概念之间的依赖关系构成,它是知识的核心,并且一直潜伏在后台发挥作用,人的认知能力皆来源于此。
因此对概念结构的研究有助于提高知识系统的问题求解能力,尤其是领域开放的问题求解。
对概念结构的研究要求解决三个问题,印概念结构如何表征与存储、概念结构如何逐步构建、概念结构如何运用于各种智能任务。
主要讨论概念结构的表示和构建问题,并对概念结构相关的知识表示方法及其应用作了比较系统的阐述。
关键词概念结构概念图概念格本体oVERVⅡ£WoFCoNCEPTUALSTRUCTUREHeWenWeiHui1(LabofA枷rithmfo,Cognit觇Models,SchoolofComputerScience,FudanUnwersuy,,qhanghai200433,China)2(Shanghai研LaboratoryofIntelligentInformationProcessing,Shanghai200433,China)AbstractConceptualstructureiscomposedofthedependentrelationshipbetweenconcepts,anditisthecoreofknowledge.People’Scog-nitiveabilitiesareallderivedfromconceptualstructure,whichalwaysplayaroleinthebackground.Therefore,thestudyofconceptualstruc-turecouldhelpUSimprovetheproblemsolvingabilityofknowledgesystem,especiallyforthedomain-openproblemsolving.Thestudyofcon—ceptualstructurerequiressolvingthreeproblems:howtOrepresentandStOl屯conceptualstructure,howtoconstructconceptualstructuregradu・ally,andhowtoapplyconceptualstructuretovariousintelligenttasks.Thispapermainlydiscussestherepresentationandconstructionofcon-ceptualstructure,anditalsoelaboratestherepresentationand印plicationofconceptualstructuresystematically.KeywordsConceptualstructureConceptualsraphConceptlatticeOmdogy0引言Et常生活中,一个看似简单的常识问题可能会涉及到很多复杂的概念关联,而这些概念以及概念间的关联是在人的认知发展过程中不断获得的。
基于属性的概念格渐进式构造原理与算法
基于属性的概念格渐进式构造原理与算法智慧来;智东杰【期刊名称】《计算机工程与应用》【年(卷),期】2012(048)026【摘要】In order to improve concept lattice construction efficiency, it proves that concept generation and inserting place only relate to newly generated concept instead of the entire concepts in the lattice. Accordingly, it presents the algorithm and carries out experiments, which show that new concepts are few and don't increase steadily with the growth of the lattice, and running time is reduced.%为了提高概念格生成的效率,证明了概念的生成及其插入位置只与最新生成的概念有关,与先前生成的大量概念无关.设计算法并编写程序,程序运行结果表明,在形式背景插入属性时,概念格中增加的新生概念数量较少,且不随概念格规模的增大而迅速增大,概念格生成时间明显缩短.【总页数】5页(P17-21)【作者】智慧来;智东杰【作者单位】河南理工大学计算机科学与技术学院,河南焦作454150;河南理工大学计算机科学与技术学院,河南焦作454150【正文语种】中文【中图分类】TP18【相关文献】1.基于对象和属性交叉的渐进式概念格生成算法 [J], 刘群;冷平;孙凌宇2.基于属性消减的模糊概念格渐进式构造算法 [J], 王黎明;姜琴;张卓3.基于属性的概念格快速渐进式构造算法 [J], 曲立平;刘大昕;杨静;张万松4.基于属性集合幂集的区间概念格◢L▲β△▼α▽◣的渐进式生成算法 [J], ZHANG Chun-ying;WANG Li-ya5.基于属性的概念格快速渐进式构造算法 [J], 杨凯;马垣;张小平因版权原因,仅展示原文概要,查看原文内容请购买。
基于基集与概念格的关联规则挖掘算法
基于基集与概念格的关联规则挖掘算法
陈湘;吴跃
【期刊名称】《计算机工程》
【年(卷),期】2010(036)019
【摘要】传统关联规则挖掘算法的挖掘效率较低,且挖掘结果中存在大量冗余.针对该问题,提出一种基于概念格与基集的关联规则挖掘算法.利用规定种子项分布范围的基集代替原始数据库以缩小挖掘源规模,从而建立概念格快速求解出关联规则.实验结果表明,该算法在时间效率方面优于Base 和Apriori 算法.
【总页数】3页(P34-36)
【作者】陈湘;吴跃
【作者单位】电子科技大学计算机科学与工程学院,成都,610054;电子科技大学计算机科学与工程学院,成都,610054
【正文语种】中文
【中图分类】TP393
【相关文献】
1.基于概念格和Apriori的关联规则挖掘算法分析 [J], 王德兴;胡学钢;刘晓平;王浩
2.一种基于概念格的关联规则挖掘算法 [J], 王甦菁;陈震
3.基于FP-tree和约束概念格的关联规则挖掘算法及应用研究 [J], FU Dong-mei;WANG Zhi-qiang
4.基于概念格的关联规则挖掘算法改进 [J], 刘贝玲;齐华;沈富强;许潜金
5.基于约简概念格的关联规则挖掘算法 [J], 李奇;赵超
因版权原因,仅展示原文概要,查看原文内容请购买。
概念格中的规则提取
概念格中的规则提取
苗茹;沈夏炯
【期刊名称】《光盘技术》
【年(卷),期】2006(000)001
【摘要】概念格已经被认为是一个非常有用的数据分析工具,它能够很好的应用于数据挖掘、机器学习以及知识发现、信息获取等领域.从概念格中可以提取关联规则、序列规则、分类规则.
【总页数】2页(P10-11)
【作者】苗茹;沈夏炯
【作者单位】河南大学计算机与信息工程学院,河南,开封,475004;河南大学计算机与信息工程学院,河南,开封,475004
【正文语种】中文
【中图分类】TP18
【相关文献】
1.模糊语言概念格及其规则提取 [J], 崔慧;曹仪铭;罗思元;邹丽
2.基于三支概念格合并的决策背景规则提取 [J], 王一宾;杨思春
3.中心概念及其在规则提取中的应用 [J], 温馨;闫心怡;陈泽华
4.三支概念格中的关联规则提取算法 [J], 刘美玉;祁建军;刘伟
5.基于面向对象(属性)概念格的三支规则提取 [J], 张呈玲;李进金;林艺东
因版权原因,仅展示原文概要,查看原文内容请购买。