大数据挖掘入门教程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据挖掘入门教程
大数据时代的来临,给人们生活带来了巨大变化。对于中国而言,大数据产业起步晚,发展速度快。物联网、移动互联网的迅速发展,使数据产生速度加快、规模加大,迫切需要运用大数据手段进行分析处理,提炼其中的有效信息。千锋教育,经过多年的洗礼,在大数据培训中取得了不错的成绩。
下面是千锋教育对于大数据入门教程的步骤:
1)数据挖掘概述与数据:
讲解了数据挖掘技术的起源、应用场景以及基本的处理方法,并对于数据集、数据等基本的概念做了阐释。
2)可视化与多维数据分析:
讲解了数据可视化的基本方法,并分别演示了Excel数据透视表与SQLServerAnalysisService对于多维数据的可视化处理。
3)分类器与决策树:
讲解了分类器的基本概念与应用方法,并具体分析了分类器经典算法之一决策树的实现方法。
4)其他分类器:
讲解了另外两种经典的分类器算法:基于规则的分类器与基于距离的分类器和其他一些常见的分类器算法,如基于距离的分类器的改良算法、贝叶斯分类器、人工神经网络、支持向量机与组合方法等。
5)决策树的应用:
演示了利用WekaExplorer、KNIME、Tanagra等开源工具进行的数据挖掘处理。演示中对比了几类数据挖掘算法,如Cart决策树、C4.5决策树、KNIME决策树、简单贝叶斯分类、组合方法、人工神经网络、基于规则的分类等。
6)关联分析:
讲解了关联分析的常见算法,即Apriori算法与FP增长算法。
7)购物车数据分析:
主要演示了利用微软的解决方案来进行购物车数据的关联分析,包括SQLServiceAnalysisService的关联分析与Excel结合SSAS外接程序等方法。最后还利用WekaKnowledgeFlow工具来进行关联分析,以便对比第六章的实践。
8) 聚类算法:
讲解了聚类算法的基本原理与常见算法,包含K均值算法、层次聚类、基于密度的聚类算法。
大数据是未来的趋势,选择千锋教育,助力人生!