连锁超市销售管理系统数据分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《数据仓库与数据挖掘》课程设计报告题目:连锁超市销售管理系统数据分析

班级:

学号:

姓名:

指导教师:

日期:

连锁超市销售管理系统数据分析

1需求分析与数据理解

1.1需求分析

随着社会经济的发展,人们的生活水平有着明显的提升,对物质和精神的生活的追求也在不断提升。在这个竞争的市场上,超市的竞争也进入到了一全新的领域,竞争已不再是规模竞争,而是技术的竞争,管理的竞争,人才的竞争。技术的提升和管理的提升是连锁超市的竞争核心。零售领域呈现多元化发展趋势,多种业态:连锁超市、便利店、专卖店、存储店等等相互并存。如何在激烈的竞争中扩大销售额,减少经营成本,成为超市经营者努力追求的目标。因此,要对大量的数据进行分析,采用不同的挖掘算法和挖掘软件。这样我们就可以从结果中提取正确有用的信息,以便于我们在竞争中获得更多的机会。

超市管理系统需要完成的功能包括:

(1)各种商品信息的输入、查询、修改、删除等功能

(2)供应商信息的输入、查询、修改、删除等功能

(3)商品库的关系模式的完整性实现

(4)系统管理的管理员登陆

(5)连锁超市的各个超市的信息,包括地址,销售额等

(6)连锁超市的各个超市的管理系统

1.2 数据理解

本次聚类分析主要采用的是数据库的数据,主要的数据表包括:

连锁超市综合数据表1(超市编号,超市名称,地址,员工人数,商品总额,销售总额,采购费),其中输入的数据要有一定的代表性而且要有一定的可对比性。

连锁超市综合数据表2(超市编号,超市名称,地址,员工人数,商品总额,销售总额,采购费),可用命令将数据表1中的数据归一化处理之后重新导入到数据表2中,这样数据表2可得到新的数据,用于聚类分析处理。

2挖掘数据准备

连锁超市综合数据表1

连锁超市综合数据表2

3 数据挖掘过程

1. 创建“数据挖掘”数据库。

2.在数据挖掘数据库中建立“连锁超市综合数据表1”,输入的数据要有一定的代表性。

3.对数据进行预处理,处理结果存入“连锁超市综合数据表2”中。

4.聚类分析首先创建一个名称为“城市聚类分析”的项目,并定义数据源、定义数据源视图。

数据源视图为:

5.创建聚类挖掘结构,设置相关参数。

6.建立聚类挖掘模型。

3.1挖掘算法与挖掘软件选择

挖掘算法:聚类分析

挖掘软件:Microsoft Visual Studio 2005

3.2 数据预处理

数据预处理可包括非数值数据的数值化和数值数据的归一化。非数值数据的数值化是指将字符等非数值数据,在保持其原有的含义和相互之间的区别的基础上,转化成数值型数据。归一化是指为了属性之间的比较和运算,需要将不同属性的取值范围换成统一范围,避免结果发生扭曲。此时可采用极差归一化处理过程。例如:销售总额=(销售总额–销售总额最小值)/( 商销售总额最大值–销售总额最小值)。其他属性列可采用同样的方法进行预处理。

3.3挖掘过程说明

1. 创建“数据挖掘”数据库。

2.在数据挖掘数据库中建立“连锁超市综合数据表1”,设置相应的数据类型。所建立的表中的列包括:超市编号,超市名称,地址,员工人数,商品总额,销售总额及采购费。

3.向各表中输入部分数据。注意:输入的数据要有一定的代表性而且要有一定的可对比性。例如:全国各地个大型连锁超市的数据,发达地区及不发达地区的连锁超市的数据。

4.应用数值化、归一化等数据预处理方法,可采用的预处理公式如下,例如:商品总额=(商品总额–商品总额最小值)/( 商品总额最大值 - 商品总额最小值)。对数据进行预处理,处理结果存入“连锁超市综合数据表2”中,该表与“连锁超市综合数据表1”的属性个数相同,但部分列的类型需要调整要将其修改为float类型。

5.聚类分析首先创建一个名称为“连锁超市分析”的项目,在项目中建立数据源、建立数据源视图命名为数据挖掘。

6.创建聚类挖掘结构,设置相关参数。设置的参数值为8。

7.建立聚类挖掘模型。

8.查看挖掘结果。

4 结果展示与评价

挖掘结构图:

挖掘结构预测图:

连锁超市分类剖面图:

连锁超市分类特征:

5总结

本次数据仓库课程设计通过实际的数据仓库与数据挖掘应用课题设计与研究(连锁超市销售管理系统数据分析),巩固数据仓库与数据挖掘理论知识,进一步熟悉数据仓库与数据挖掘的设计与分析技术,提高自己的动手能力以及分析问题和解决问题的能力。这次课程设计是通过分组的形式,同一小组不同成员运用不同的挖掘方法共同完成一个课题。这样可以使我们从不同的角度对数据进行分析总结,从而得到不同的结果。

本次课设我们小组讨论的是连锁超市销售管理系统数据分析,我运用的是聚类分析法分析数据。首先我创建“数据挖掘”数据库。在数据挖掘数据库中建立“连锁超市综合数据表1”,输入有一定的代表性的数据。对数据进行预处理,处理结果存入“连锁超市综合数据表2”中。聚类分析首先创建一个名称为“城

市聚类分析”的项目,并定义数据源、定义数据源视图。在这个过程中我遇到了一些问题,将原表中的数据插入到新表时属性漏写导致两个表不一致,归一化处理时由于失误导致结果为实现数据的归一化等等。最后就是创建城市聚类分析项目,并定义数据源、数据源视图,创建聚类挖掘结构,设置相关参数,建立聚类挖掘模型,查看挖掘结果。同样在这个过程中我也遇到了相应的问题,例如:设置的相关参数太小或超出范围导致无法生成关系图;数据挖掘模型有误等等。在课程设计中的这些问题也暴露了自己知识上的不足,我及时地查阅资料或者询问老师、同学解决了自己的疑问。现在我对数据挖掘有了更深刻的理解。

这次数据仓库课程设计我获益匪浅,我完成了对连锁超市综合数据的数据挖掘,学会了运用数据挖掘算法中的聚类分析法,也了解了关联分析法、分类分析法等挖掘算法。这些方法在许多应用场合都可以得以引用。虽然我建立的数据库的数据较少,但达到了聚类分析的目的。我想这次课设对我今后的学习工作会有很大的帮助,在以后的工作当中我就会很容易地去掌握数据挖掘。

参考文献

参照下面格式写:

[1] 陈志泊等.数据仓库与数据挖掘.北京:清华大学出版社,2009.

[2] 朱德利.SQL Server2005数据仓库与商业智能完全解决方案.北京:电子工业出版社,2007.

[3]李慧,闻豪.基于数据仓库的OLAP技术的研究[J].电脑知识与技术,2008(2).

相关文档
最新文档