快速数据挖掘平台RapidMiner
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
快速数据挖掘平台RapidMiner
作为一门学科,数据挖掘对于世人来说在很大程度上是透明的。我们在大多数时间都从未注意到它的发生。但每当我们办理商店购物卡、使用信用卡购物或在网上冲浪时,都在创建数据。这些数据以大数据集形式存储在我们每天与之打交道的公司所拥有的功能强大的计算机上。存在于这些数据集之内的便是模式 - 表明我们的兴趣、习惯和行为。数据挖掘可让人们找到并解读这些模式,从而帮助人们做出更明智的决策,并更好地为客户服务。
本培训旨在向您介绍数据挖掘方面的常见概念和做法。主要目标读者除了大学生之外,还有希望通过挖掘数据,使用信息系统和技术解决业务问题,但在计算机科学方面没有正式相关背景或教育经历的业务专家。尽管数据挖掘融合了应用统计、逻辑、人工智能、机器学习和数据管理系统,但您不需要在这些领域具有很强的背景即可参加本次培训,来学会使用RapidMiner。虽然学过统计学和数据库方面的初级大学课程将会有所帮助,但本培训中对成功学习如何挖掘数据需要了解的概念和技术进行了解释。
RapidMiner原名Yale,它是用于数据挖掘、机器学习、商业预测分析的开源计算环境。根据KDnuggets在2013年的一次投票显示,从使用率来看该软件比之R语言还要略胜一筹。因为其具备GUI特性,所以很适合于数据挖掘的初学者入门。投票信息:
/polls/2013/analytics-big-data-mining-data-sc ience-software.html
《快速数据挖掘平台RapidMiner》课程内容:
第一课:数据挖掘基本知识RapidMiner工具介绍
第二课:数据准备:导入、预处理、导出
第三课:数据挖掘模型和方法
第四课:K-Means 聚类与辨别分析
第五课:线性回归与逻辑回归
第六课:决策树与神经网络
第七课:文本挖掘
第八课:WEB挖掘
第九课:协同过滤、推荐
第十课:时间序列分析
第十一课:离群点分析
第十二课:模型评估-交叉验证与模型优化化
第十三课:过程控制
第十四课:数据转换与执行命令
本课程各章节围绕实际挖掘分析业务需求,对挖掘工作中常用的各种算法应用方式、过程都做了阐述,各章节所需试验数据也专门打包,可供读者下载使用。
授课对象:
本课程适合已经有一定的IT基础,但对数据挖掘领域尚不了解的朋友进修学习。如果您具备统计学和数据库方面的初级基础技能会更好。课程同样适用于数据分析师、IT系统架构设计及研发人员,通过简单灵活的挖掘模型定制,带领您探索发现隐藏在海量数据背后的新知识。
学习收获预期:
算法有一定的了解,有一定的使用RapidMiner工具解决问题的能力,能够熟练地使用RapidMiner提供的典型挖掘算法进行挖掘分析。
授课讲师:
TEKKEN,从事IT行业十余年,有丰富的数据分析挖掘领域知识经验。对数据清
洗转换集成、数据挖掘分析、数据可视化展现等内容有丰富的产品/项目实践经验。曾独立开发完成集成了各种仪表盘、图表、数据挖掘组件在一起的Flex仪表盘设计器(/stylereport/article/details/7078345)。现任某数据分析挖掘公司产品总监。