数据挖掘

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一,数据挖掘:数据挖掘是从大型数据集(可能是不完全的,有噪声的,不确定性的,各种存储形式的)中,挖掘隐含在其中的,人们事先不知道的,对决策有用的知识的完整过程。从狭义的观点上出发,我们可以定义数据挖掘是从特定形式的数据集中提炼知识的过程。

二,关联规则:描述如下:设I={i1.i2,...,im}是一个项目集合,事务数据库D={t1,t2,...,tm}是由一系列具有唯一标识TID的事务组成,每个事务ti(i=1,2,...,n)都对应I上的一个子集。

三,web挖掘:针对包括web页面内容,页面之间的结构,用户访问信息,电子商务信息等在内的各种web数据,应用数据挖掘方法以帮助人们从www中提取知识,为访问者,站点经营者以及包括电子商务在内的基于因特网的商务活动提供决策支持。

四,知识发现(KDD):KDD是从数据中辨别有效地,新颖的,潜在有用的,最终可理解的模式的过程。

五,时间序列:所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。

六,聚类:聚类就是将数据对象分组成为多个类或簇,划分的原则是在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。

七,序列模式挖掘:是指从序列数据库中发现蕴含的序列模式。

相关文档
最新文档