信用卡用户大数据分析报告实验报告材料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信用卡分析试验报告

2010-6-12

信用卡用户数据分析实验报告

目录

信用卡用户数据分析实验报告 (2)

目录 (2)

实验目的: (2)

实验内容: (3)

信用卡分析: (3)

K-means分析: (5)

Kohomen分析: (8)

异常分析: (14)

关联分析: (17)

散点图分析: (18)

集合分析: (20)

多重散点图分析: (22)

直方图分析: (23)

实验目的:

1、熟悉Clementine软件从数据导入到结果输出的全过程。

2、复习Clementine 软件中聚类方法。

3、复习Clementine 软件中的关联分析方法

实验内容:

在Clementine 中建立信用卡数据分析模型;

聚类分析:使用K-Means、Kohonen、两步法,进行聚类,并简单给出结论;异常点分析:使用“异常”节点进行异常分析,并简单给出结论;

关联规则分析:对其中感兴趣的字段进行关联分析,画出网络图,并简单给出结论。

信用卡分析:

打开操作区,选择“可变文件”,将之拖入操作区,编辑“可变文件”

,打开位于E盘中的“信用卡交易-Data.csv”数据源,如图所示:

在“类型”中将各个字段的值读入,如图所示:

然后进行各项分析。

K-means分析:

创建K-means结点,编辑使用定制设置,选择所要进行分析的字段名,如图:

选择“执行”,执行之后在右侧区域形成K-means模型,如图:

将K-means模型拖入操作区并与数据源相连:

单击模型进行分析:

点击“查看器”:

分析结果:

在对各项的字段进行分析中,对强制停卡记录、性别、都市化程度分成三个聚类,得出的结果是强制停卡记录、以及都市化程度的重要性均大于0.95,而性别的重要性则为0.00,说明强制停卡记录以及都市化程度对聚类的影响程度很大,而性别的影响程度几乎为0。

Kohomen分析:

创建Kohomen分析结点,选择相应的要分析的字段:

编辑完毕之后点击“执行”:

点击模型查看分析结果:

在查看器的分析结果中,三个字段的重要性均大于0.95,这说明个人月收入、婚姻、瑕疵户、三项因素对聚类的影响程度都很大。

两步聚类分析:

创建“两步”聚类分析结点,并进行编辑:

点击“执行”生成两步聚类分析模型,如图:

点击查看分析结果:

在分析结果中发现,学历、宗教信仰、月刷卡额字段的重要程度均大于0.95,说明这些因素对于聚类的影响程度都很高。

异常分析:

创建“异常分析”结点并与源文件相连;

在编辑结点中,选择所要分析的字段,如图所示:

点击“执行”后,形成异常分析的模型,然后点击查看:

为了更好的查看异常用户的异常情况,创建一张表,用来显示异常用户的基本信

息。然后对表进行排序,将正常用户与异常用户隔离开来。如图所示:

分析结果如图所示:

在字段“O-Anomaly”中,若字段值为“F”,则为正常用户,若字段值为“T”,

则为异常用户,如编号为14号的用户,即为信用卡异常的用户。关联分析:

散点图分析:

在散点图结点中,要分析“都市化成都”以及“个人月收入”这两者之间的相关程度,故选择X字段以及Y字段分别为“都市化成都”和“个人月收入”。如图:

点击“执行”,结果如下图所示:

分析:

由上如的分析结果可以看出,生活在“都市”的居民人数最多,而收入高的人群也比生活在“都”以及“城”的居民多。其次是生活在“都”的居民个人月收入次之,最后是生活在“城”的居民。

集合分析:

利用集合分析来研究月刷卡额与年龄之间的关系,如图:

分析:

月刷卡额最多的群体是20——24的年轻群体;

其次是15——19和25——29岁之间的群体; 30——34岁之间的群体月刷卡额也在6000以上;35——39岁之间的群体月刷卡额接近6000;

随着年龄的增长,月刷卡额也在下降。

多重散点图分析:

分析:

由图可以看出:对于个人月收入,各个学历的阶层都分布在10000元以下及60000元以上各个层次;

对于个人月开销,各个学历阶层都分布在10000元以下及40000元以上这些层次上。

直方图分析:

利用直方图分析年龄与信用卡使用量的关系:

分析:

持卡量最多的群体是20——24的年轻群体;

其次是15——19和25——29岁之间的群体;

30——34岁之间以及35——39岁之间的群体持卡量也很大;40岁以上的群体持卡量较年轻群体较少;

相关文档
最新文档