数据挖掘实验三

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Southwest university of science and technology 数据挖掘课程报告

实验三

学院名称计算机科学与技术学院专业名称信息安全

学生姓名王奕

学号**********

指导教师吴珏老师

二〇一六年十一月

一、实验原理

算法基本思想:

K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。

二、实验目的:

1、利用R实现数据标准化。

2、利用R实现K-Meams聚类过程。

三、实验内容

1、依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。对其进行标准差标准化并保存后,采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。编写R程序,完成客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数

四、实验步骤

依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。

确定数据变量以及输出数据情况

对其进行标准差标准化并保存

采用k-means算法完成客户的聚类

五、思考与分析

1、使用不同的预处理对数据进行变化,在使用k-means算法进行聚类,对比聚类的结果。

得到结果如图。

相关文档
最新文档