PAM聚类算法的分析与实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

毕业论文(设计)论文(设计)题目:PAM聚类算法的分析与实现

系别:

专业:

学号:

姓名:

指导教师:

时间:

毕业论文(设计)开题报告系别:计算机与信息科学系专业:网络工程

研究工作的进度安排

2010年11月20号-11月29号,与指导老师沟通交流,完成毕业论文选题;

2010年11月29号-12月31号,收集整理资料,完成文献综述和开题报告;

2011年01月—2011年03月,继续整理资料;

2011年03月—2011年04月,完成初稿;

2011年04月—2011年05月,对初稿进行检查和修改;

2011年05月—2011年06月,完成(论文)撰写、装订,参加答辩

目录

摘要 (1)

关键词 (1)

Abstract (1)

Key words (1)

引言 (1)

1 PAM聚类算法分析 (2)

1.1 数据挖掘相关知识 (2)

1.1.1 数据挖掘简介 (2)

1.1.2 聚类 (2)

1.1.3 聚类分析概述 (3)

1.2 PAM算法分析 (5)

1.2.1 PAM算法详细论述 (5)

1.2.2 PAM算法描述 (7)

1.2.3 PAM算法性能分析 (7)

2 PAM聚类算法的实现 (7)

2.1简要说明 (7)

2.2 matlab简介 (8)

2.2.1 matlab基本功能 (8)

2.3 算法实现 (8)

2.4 PAM聚类算法在学生成绩中的应用 (13)

3 小结 (14)

致谢 (14)

参考文献 (14)

PAM聚类算法分析与实现

网络工程专业高华荣指导教师:吴启明

[摘要]“物以类聚,人以群分”。当有一个分类指标时,分类比较容易。但是当有多个指标,要进行分类就不是很容易了。对于多指标分类,由于不同的指标项对重要程度或依赖关系是相互不同的,所以也不能用平均的方法,因为这样会忽视相对重要程度的问题。所以需要进行多元分类,即聚类分析。本文主要介绍一种聚类分析算法,它就是PAM聚类算法。首先是数据挖掘简介包括数据挖掘的基本概念,说明聚类是数据挖掘的一个很重要的功能。同时进一步解释什么是聚类分析。然后详细分析PAM聚类算法,最后给出了一个实现PAM聚类算法的例子。

[关键词]:PAM聚类算法;中心点;聚类分析;代价

PAM Clustering Algorithm Analysis and

Implementation

Major:Network engineering Gao Huarong Supervisor:Wu Qiming

[Abstract] Birds of a feather flock together.When there is a classification index,classification is easier.But when more than one index, want to undertake classification is not very easy.For multi-index classification, due to the different index study of important degree or dependent relationship is mutual different, so also cannot use average method, because that will ignore the relative importance.So the need of multiple classification, namely clustering analysis.This paper mainly introduces a kind of the cluster analysis algorithm, it is PAM clustering algorithm.First introduces the basic concept of data mining that clustering is an important data mining the function.And further explained what clustering analysis is. Then detailed analysis of PAM clustering algorithm, and finally presents a realizing examples of PAM clustering algorithm.

[Key words] PAM clustering algorithm;center;Clustering analysis;cost

引言

如今数据挖掘的理论越来越广泛的应用在商业、制造业、金融业、医药业、电信业等等许多领域。数据挖掘的目标之一是进行聚类分析。聚类就是把一组个

体按照相似性归成若干类别,它的目的是使得属于同一类别的个体之间的差别尽可能的小,而不同种类别上的个体间的差别尽可能的大。PAM聚类算法是众多聚类算法的之一。PAM算法的优势在于:PAM算法比K-平均算法更健壮,对“噪声”和孤立点数据不敏感;它能够处理不同类型的数据点;它对小的数据集非常有效。

1 PAM聚类算法的分析

1.1 数据挖掘相关知识

1.1.1数据挖掘简介

数据挖掘是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学、知识工程、面向对象方法、信息检索、高性能计算以及数据可视化等最新技术的研究成果。经过十几年的研究,产生了许多新概念和新方法。特别是最近几年,一些基本概念和方法趋向于清晰,它的研究正向着更深入的方向发展。

数据挖掘之所以被称为未来信息处理的骨干技术之一,主要在于它以一种全新的概念改变着人类利用数据的方式。20世纪,数据库技术取得了决定性的成果并且已经得到广泛的应用。但是,数据库技术作为一种基本的信息储存和管理方式,仍然以联机事务处理为核心应用,缺少对决策、分析、预测等高级功能的支持机制。众所周知,随着数据库容量的膨胀,特别是数据仓库以及Web等新型数据源的日益普及,联机分析处理、决策支持以及分类、聚类等复杂应用成为必然。面对这一挑战,数据挖掘和知识发现技术应运而生,并显示出强大的生命力。数据挖掘和知识发现使数据处理技术进入了一个更更高级的阶段。它不仅能对过去的数据进行查询,并且能够找出过去数据之间的潜在联系,进行更高层次的分析,以便更好地做出理想的决策、预测未来的发展趋势等。通过数据挖掘,有价值的知识、规则或高层次的信息就能从数据库的相关数据集合中抽取出来,从而使大型数据库作为一个丰富、可靠的资源为知识的提取服务。

1.1.2 聚类

聚类是把一组个体按照相似性归成若干类别,它的目的是使得属于同一类别的个体之间的差别尽可能的小,而不同类别上的个体间的差别尽可能的大。数据

相关文档
最新文档