第1章 大数据分析师考试大纲7-13

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第1章大数据分析师考试大纲

大数据分析师是一个随着大数据兴起而崛起的新兴的工作岗位,是专门从事行业数据搜集、整理、分析,并依据数据能制作业务报告、提供决策、管理数据资产、评估和预测的专业人员。

一、考试目标

随着大数据时代的到来,企业管理者对数据价值的重视度越来越高,他们渴望从企业内部数据、外部数据中获得更多的信息财富,并以此为依据,帮助自己做出正确的战略决策。如今在数据分析师的岗位上,大多数员工都是非统计出身,远远达不到专业数据分析水平,如何能够最快找到突破口,帮助对数据分析有兴趣的人员全面掌握数据分析技巧,是本考试的目标。

本大数据分析师考试旨在测查应试者在职业情景下是否具备大数据分析基础知识,是否了解数据分析工作流程及数据分析技术,是否具备利用数据分析知识解决实际业务问题的能力。

二、考试对象

专科学历以上(含大专毕业)文化程度的即将就业和已就业人群。

三、考试基本要求

本考试侧重考查考生对大数据分析知识的掌握和应用情况,考察考生使用分析工具(R、Python、Excel、SPSS等)解决企业实际数据分析任务的能力。具体要求如下:

❑了解大数据的产生背景。

❑理解大数据的定义、特点、原理、作用,了解大数据相关技术、应用和发展趋势,掌握“大数据”和“小数据”的内涵。

❑掌握大数据分析基本过程:采集、预处理、分析和可视化、建模与挖掘。

❑理解大数据分析师的基本技能要求和素养要求,理解懂业务、懂管理、懂分析、懂工具、懂设计。

❑理解数据及数据分类,能够熟练正确运用数学思维、统计思维、逻辑思维和数据思维方法分析问题。

❑了解或掌握R语言基本语法。

❑了解或理解R语言生态:工作空间、脚本、R包。

❑了解或掌握帮助信息获取方法。

❑了解或熟练掌握R语言数据结构:向量、矩阵、数据框,数组、因子、列表。

❑掌握R语言控制结构:选择结构、循环结构和自定义函数。

❑了解或掌握Python基本语法和数据分析包的使用。

❑了解或掌握利用Excel进行数据分析的过程。

❑了解或掌握使用SPSS进行数据分析的原理。

❑能用一种工具导入文本、Excel、数据库数据

❑能用一种工具导出数据

❑能用R或Python实现网页爬虫编程。

❑掌握数据缺失值、异常值、重复值的处理方法,并能用一种工具实现之。

❑能用一种工具对数据标准化、类型转换等数据变换操作。

❑能用一种工具实现重构数据、添加新变量、分组汇总等数据整合操作

❑了解数据可视化概念和作用

❑理解可视化建议

❑了解图表的作用:成分关系图表(柱图、饼图)、对比关系图表(时序图、折线图、面积图)、相关关系图表(散点图、气泡图)、多维比较图表(雷达图、圆环图)❑熟练掌握“散点点图”“折线线图”“直方图”“柱状图”“饼图”“箱线图”“密度图”

“直线图”的绘制方法

❑了解“地图”“交互图”等绘制方法

❑理解数据认知及其作用。

❑掌握概率分析方法:概率分布、常用统计量、假设检验等。

❑理解集中趋势及分布形态的统计含义。

❑理解离散趋势及分布形态的统计含义。

❑掌握横向比较、纵向比较方法。

❑掌握相关分析原理和方法。

❑掌握交叉分析原理和方法。

❑了解层次分析原理和步骤

❑理解特征工程的作用。

❑理解特征选择和特征提取原理及分类。

❑掌握PCA方法。

❑掌握因子分析过程。

❑理解数据建模概念和作用。

❑理解神经网络构成、作用、工作原理。

❑理解决策树概念和原理。

❑理解关联分析原理及Apriori算法。

❑掌握回归分析基本思想。

❑理解时间序列特点。

❑理解模型评估的意义。

❑理解训练集、测试集和验证集。

❑理解混淆矩阵;能熟练根据混淆矩阵计算准确率、召回率、敏感度等指标。

❑理解效用、效用曲线、风险图。

❑理解ROC曲线、ROC曲线作用,能够熟练绘制ROC曲线。

❑理解数据的价值。

❑了解数据分析报告概念、分类。

❑掌握数据分析报告写作原则、写作要点、写作目的。

❑掌握数据分析报告结构

❑了解撰写数据分析报告注意事项

❑能根据具体应用场景给出数据分析基本思路

四、考试题型和试卷结构

五、组织机构与成绩认证

JYPC全国职业资格考试认证中心负责组织考试培训、命题、考试、阅卷和认证工作,并有来自相关行业及高校的专家组成专家委员会,知道考试和认证工作。通过考试中心认证资质认证的各地高等学校和教育培训机构可以申请设立考点,考试中心对各地考点实行年审和动态管理。

考试为闭卷考试,考试时间为120分钟,分值为100分,成绩60以上(含60分)为通过。笔试考试通过可获得JYPC全国职业资格考试认证中心颁发的大数据分析师从业资格证书。

六、考试内容

考点涉及正确的数据思维观、统计基础、编程基础、数据导入/导出、数据预处理、数据认知、数据可视化、数据建模、模型优化、分析报告撰写等技术及熟悉典型的业务场景认知。

1、大数据基础

(1)大数据的产生背景

(2)大数据的定义、特点、原理、作用

(3)大数据相关技术、应用和发展趋势

(4)大数据分析基本过程

(5)大数据分析师的基本技能要求和素养要求

(6)正确的数据思维观

2、数据分析工具

(1)R语言基本语法

(2)R语言环境:工作空间、脚本、R包

(3)获取帮助信息

(4)R语言数据结构:向量、数组、矩阵、数据框、因子、列表

(5)R语言控制结构:选择结构、循环结构和自定义函数

(6)其它数据分析工具简介

3、数据准备

(1)文本、Excel、数据库数据导入

相关文档
最新文档