空间关联规则挖掘
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间关联规则挖掘
如G1 ∧⋯∧Gm →H1 ∧⋯∧Hn (s%,c %) ,令G= G1 ∧⋯∧Gm 为规 则前件,H = H1 ∧⋯∧Hn 为规则后件。c %是此规则的可信度
如果谓词“G∧H”,在集合S 上是频繁的且规则“G→H/ S”的可信度较 高,则称“G→H/ S”为强规则。
G在集合S 中的支持度S 定义为满足G的对象数量与S 中对象 数量之比,记为б(G/ S) 。规则G→H 在集合S 中的可信度定义 为б(G∧H/ S) 与б(G/ S) 之比,记为φ(G→H/ S) 。
如果G的支持度不低于概念层次第k 层的最小支持 度阈值б’k , 则谓词G在集合S 的第k 层是频繁的, 且G的所有祖先在相应的概念层次上也较频繁。如 果可信度不低于相应层的可信度阈值φ’k ,则规 则”G→H/ S”在集合S 的第k层较高
空间关系
(1)空间拓扑关系 topology relation={disjoin,intersect,adjacent to,cover,covered by…}
案例
预测雷电频发区域中杆塔发生故障的规则。在雷电频 发区域中杆塔发生故障有以下情况: (1)由于杆塔被雷击引 起跳闸,发生故障;(2)由于杆塔污染严重,发生故障。
面向主题的空间关联规则挖掘
第一步: 对矢量数据图进行数据预处理(空缺数据填充,连续属性数据离 散…) 第二步:数据库->Task_DB->MBR谓词存贮在空间数据库Coarse_DB中 第三步:为Coarse_DB中的每个谓词计算支持度和可信度,过滤形成形 成数据库Frequent_coarse_DB。(1)使用最小边界矩形(MBR) 结构进行近似空间运算;(2)计算粗略的空间谓词) 第四步:采用MRR技术对第三步以后的进行检查,形成Fine_DB. 第五步: 采用Apriori算法在Fine_DB上抽取强空间关联规则并提取出关 联规则。
基于多个空间数据层的空间概念关系
在给定主题的空间关联规则挖掘中,要全面了解一个主 题的有关信息, 往往需要多个空间数据层的信息。
概念层次图
进行数据挖掘的数据表
关联规则
最小支持率6%和最小置信度75%
杆塔的故障率为规则后件,以其余属性为规则前件
规则1:距离植被较近∧植被较高∧杆塔雷击频率较高→故障率高 规则2:距离植被较近∧植被面积较大∧杆塔雷击频率较高→故障率高 规则3:距离道路较近∧车流量大∧杆塔雷击频率较高→故障率高 规则4:距离道路较近∧车流量大∧杆塔污染严重→故障率高 规则5:距离植被较远∧植被较低∧杆塔雷击频率较低→故障率低 规则6:距离植被较远∧植被面积较小∧杆塔雷击频率较低→故障率低 规则7:距离道路较远∧车流量小∧杆塔雷击频率较低→故障率低 规则8:距离道路较远∧车流量大∧杆塔污染轻微→故障率低
空间关联规则挖掘
姓名:徐博轩 学号:TS13160088 学院:环境与测绘学院
目 录
什么是GIS
空间关联规则挖掘
面向主题的空间关联规则挖掘 空间关联规则挖掘发展趋势
什么是GIS
地理信息系统是一种在计算机软件,硬件支持下,把 各种地理信息和环境参数按空间分布或地理坐标,以一定 格式输入,存储,检索,显示和综合分析应用的技术系统, 是多种学科交叉的产物。
常用算法的数据流程图
针对基本关联规则算法的改进
①基于时间复杂性的优化。
主要是针对减少 搜索频繁项集的 次数,以及如何有 效地对空间关系 进行概化。据此, 可将几种改进方 法分为:
时间复杂性主要是搜索计算频繁谓词的次数,有 效缩小搜索频繁项的频率,即降低算法的时间复 杂度
②基于空间复杂性的优化
基于规则模板的模型 基于模糊逻辑的近似区域表示模型
GIS基本概念
GIS与各学科关系
地理学
1、都是基于地理 信息的表达 2.Gis的重要数据 来源
1、理论基础 2、为空间分 析提供方法 空间数据的主要 采集手段,与 GIS互补
制图技术
GIS
遥感技术
计算机 科学
软件工程
数据库技术
计算机 图形学
CAD
专家系 统
GIS基础分析
这些GIS基本分析可以完成地形分析、路网分析 、城市规划绿地分析、社会经济分析等。
空间关联规则挖掘发展趋势
1
空间数据仓库与GIS有机集成,在多层,跨层上自动挖掘
2
Hale Waihona Puke Baidu
空间谓词的表达 多源、异构空间数据库的关联规则挖掘
3
4
空间关联规则挖掘的可视化
参考文献
[1] 陈叶.基于GIS和空间关联规则的警情研判分析系统的研究与设计.中国地质大学硕士学 位论文.20100501:11-16. [2] 李国峰.空间数据挖掘技术研究.西安电子科技大学硕士学位论文.20100101:26-45. [3] 陈江平,李平湘.一种面向主题的基于多层次空间概念关系的关联规则挖掘算法[J].遥感 学报.2006,10(3):289-293. [4] 吕曹芳,庞宇,罗永龙. 基于GIS 空间关联规则的挖掘综述[J].资源开发与市场.2007, 23(4):323-325. [5] 刘小生, 任海峰 , 陈 棉. 用空间分析方法进行空间关联规则提取[J].资源开发与市 场.2007,5:19-21. [6] 方钢. 基于空间布局约束的拓扑关联规则挖掘[J].计算机工程.2011,9:38-40. [7]孟凡荣,郑中珮,陈佩佩. 一种基于云理论的空间关联规则提取算法孟
(2)空间距离关系 确定区域距离是一个复杂的工作,因为要充分考虑空间对象自身的 大小在距离度量上的重要性。 Distance={close_to,far-away…} (3)方向关系 Direction={left,right,north,east,northeast…}
例:is_a(X,”housel”)^close_to(X,”beach”)=>is_expensive(X)[85%,90%]
可视化分析
叠加分析
地统计分析
缓冲分析
数据挖掘
距离和密度分析 其它二维分析
案例: 北京市就业结构统计分析
北京就业密度三维图
1996-2004年就业密度变化图
案例: 长三角城市聚类分析
按照城市化发展水平(共21个指标)使用聚 类分析。
空间关联规则挖掘
空间数据挖掘和知识发现(SDMKD)兴起于20世纪90年代,本质是从 空间数据库中提取不明确和隐含的知识、空间关系等,目的是发现、 解释或预测空间现象或事件,其中空间关联规则是空间数据挖掘的重 要知识内容。 空间关联规则( spatial association rules) 指的是空间实体间相邻、 相连、共生和包含等空间关联规则,发现的知识通常用关联规则或频繁 项集的形式表示。