企业实践报告-
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
企业实践报告
( 2017-- 2018年度第1学期)
数据挖掘在电子商务中的应用
专业
物联网工程 学生姓名 班级 学号 指导教师 完成日期 2017.12.6
目录
目录 (2)
1 概述 (3)
1.1 企业实践目的 (3)
1.2 企业实践内容与要求 (3)
1.3 相关开发技术与开发环境搭建 (3)
2 系统需求分析 (4)
2.1 系统目标 (4)
2.2 系统功能需求 (4)
3 系统概要设计 (5)
3.1 系统的功能模块划分 (5)
3.2 系统流程 (5)
4 系统详细设计 (6)
4.1 模块流程 (6)
5 代码调试 (7)
5.1 遇到的问题及其解决方法 (7)
6 软件运行与测试 (8)
6.1 软件运行流程 (8)
6.2 软件测试 (8)
7 小结 (10)
企业实践(2017)
1 概述
1.1 企业实践目的
1.为了将自己所学知识运用在实践中,在实践中巩固自己的知识,调节理论与实践之间的关系,培养实际工作能力和分析能力,以达到学以致用的目的。
2.获得更多与自己专业相关的知识,扩宽知识面,增加社会阅历。
3.接触更多的人,在实践中锻炼胆量,提升自己的沟通能力和其他社交能力。
4.培养更好的职业道德,树立好正确的职业道德观
1.2 企业实践内容与要求
这几年伴随移动互联网的转型发展,传统的贸易下经历一次重大的变革,电子商务显示出巨大的市场价值和发展潜力。电子商务是商业领域的一种新兴商务模式,它是以网络为平台、现代信息技术为手段、以经济效益为中心的现代化商业运转模式,其最终目标是实现商务活动的网络化、自动化与智能化。这几年中国互联网迎来了理性数据驱动和价值回归之年。于是,在这个数据爆炸却又用户增量趋于饱和的时代,如何借助智能数据挖掘、商务智能等大数据技术,充分利用数据价值解决现实问题、制定企业日常决策,在现有流量基础上真正实现“存量掘金”成为了企业亟需解决的的重要命题。数据分析的目的:一方面是发现问题,并且找到问题的根源,最终通过切实可行的办法解决存在的问题;另一方面,基于以往的数据分析,总结发展趋势,为网络营销决策提供支持。
1.3 相关开发技术与开发环境搭建
Python的安装
主要介绍了电子商务及关联规则中的经典算法—Apriofi算法,以及Apriofi算法的代码和执行过程,指出了Apriori算法的瓶颈和改进方法。
随着数据库管理系统的广泛应用,各个领域的数据和信息量急剧增加,为了更好地利用这些数据,就要对这些数据进行更深层次的分析,从中挖掘出有价值的数据信息。由于缺乏挖掘数据背后隐藏知识的技术,导致了数据爆炸。于是,人们尝试用成熟的数据库管理系统来存储数据,用机器学习的方法来分析数据,这两者的结合促成了数据库中的知识发现的产生,并且成为人工智能和数据库应用等领域近年来的研究热点。历史上,从数据中发现模式的提法很多,如知识发现、知识提取、信息收割、数据采集等等。在数据库领域一般称为数据挖掘,而在机器学习领域则更多地称作知识发现。数据挖掘是随着数据库技术的发展而出现的一种全新的信息技
修改为题目
术。
2 系统需求分析
2.1 系统目标
电子商务是信息和知识经济时代的宠儿,充满无限商机。在电子商务时代,企业竞争成功的关键是要了解客户、与客户保持稳固的关系。利用数据挖掘技术帮助企业进行动态分析和调整分析在挑战中就有可能获胜。本文对面向电子商务的数据挖掘技术进行研究和分析。
2.2 系统功能需求
电子商务的大数据
数据挖掘的研究融合了多个不同学科领域的技术与成果,使目前的数据挖掘出现多种
多样的技术。利用这些技术方法可以检查那些异常形式的数据,利用各种统计模型和数学
模型对这些数据进行解释,找出隐藏在这些数据背后的市场规律和商业机会[17][18]。
企业实践(2017)
3 系统概要设计
3.1 系统的功能模块划分
3.2 系统流程
1.数据层。数据挖掘的对象是数据。为了便于挖掘,各种来源的数据经过预处理(
据的清洗、数据的集成、数据的过滤等)以后,都将存于一个统一模式的数据库或者数仓库内。这个模式的设计综合考虑挖掘任务、实施算法、数据的特点等各种因素,可以挖掘能够最优化。
2.数据挖掘引擎。数据挖掘引擎内集成了数据挖掘的算法。它根据知识库、挖掘
据库或者数据仓库中的数据得到许多模式,然后对这些模式进行评估、筛选,最终可以到有意义的且用户感兴趣的模式。
3.用户界面。用户界面是人机交互的界面。用户界面将这些模式用直观的且易于
户理解的方式表现给用户。另外,用户可以(有时也必须)通过用户界面指导模式评估挖掘引擎、数据的组织模式。
修改为题目
4 系统详细设计
4.1 模块流程
数据挖掘是一个多步骤的处理过程,该过程从大型数据库中挖掘先前未知的、有效的可实用的信息,并使用这些信息做出决策或丰富知识。这个过程是交互和迭代的,其中多过程需要用户的参与。
数据挖掘过程主要包括四个步骤如图2-2所示:问题定义/确定业务对象、数据准备数据挖掘、结果表达和分析。虽然我们把各个步骤按顺序排列,但数据挖掘过程并不是性的。要取得好的结果就要不断反复和重复这些步骤。
图2-2数据挖掘视为知识发现过程的一个步骤
1.问题定义清晰地定义业务问题和认清数据挖掘的目标是进行数据挖掘的第一步,也是最重要步。要想充分发挥数据挖掘的价值,首要的条件是要对用户的目标有一个清晰明确的定义因此,在挖掘之前要明确业务的目标和需求。
2.数据准备确定好挖掘目标后,就要开始为挖掘准备相关的数据。准备数据就是根据挖掘需求集资料,并建立可挖掘的数据库。准备数据所花费的时间在整个数据挖掘过程中是最多的这一阶段主要分为两步:第一步根据挖掘目标建立合理的数据库模式即数据选取;二步是对数据进行预处理。根据用户的挖掘目标,搜索所有与业务对象相关的内部和外部数据信息,并从数据中提取与挖掘相关的数据。它与对数据进行采样和选择预测变量是有区别的,这里只是略的除去一些冗余或无关的数据。为了进一步的分析数据,提高挖掘效率,去除无用或关的信息,