大数据常见面试题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据常见面试题
经历了水深火热的大数据学习,终于拨开云雾见天明了,但你离成功总是还差了一步,那就是拿到大数据工程师的Offer。
在电脑旁奋斗了无数个日夜,代码敲了无数遍,项目整改了无数遍,只为了得到一份自己满意的高薪资高待遇的Offer。但这个收获不仅仅需要你学到娴熟的大数据技术,还需要在面试之前精心准备,了解自己要应聘的企业发展状况、自己应聘岗位的技术要求等等,除此之外,多看一些大数据面试题也是很有必要的,给自己涨涨经验。
千锋小编虽然不能帮你调查你理想企业的发展状况,但大数据常见面试题早已经为你准备好了,需要的尽快收入囊中吧!
1.scala 语言有什么特点,什么是函数式编程?有什么优点
2.scala 伴生对象有什么作用
3.scala 并发编程是怎么弄得,你对actor 模型怎么理解有何优点
4.Spark如何处理结构化数据,Spark如何处理非结构话数据?
5.Spark性能优化主要有哪些手段?
6.对于Spark你觉得他对于现有大数据的现状的优势和劣势在哪里?
7.对于算法是否进行过自主的研究设计?
8.简要描述你了解的一些数据挖掘算法与内容
9.怎么用spark做数据清洗
10.跟我聊聊spark的应用,商场里广告投放,以及黄牛检测
11.spark读取数据,是几个Partition呢?hdfs几个block 就有几个Partition?
12.Mogodb和hbase的区别
13.开发中遇到的问题
14.HIVE的优化
15.linux的启动顺序
16.编译好的scala程序,运行时还需要scala环境吗
17.Write a java program to implement Stack in java.
18.Linkedlist和ArrayList的区别
19.hadoop中combiner的作用
20.用mr设计一个分组排重计数算法
21.用MapReduce找出存在公共好友的两个人
22.hdfs存储机制
23.MapReduce原理
24.hadoop运行原理
25.hadoop 的namenode 宕机,怎么解决
26.Hbase 的特性,以及你怎么去设计rowkey 和columnFamily ,怎么去
建一个table
27.Redis,传统数据库,hbase,hive 每个之间的区别(问的非常细)
28.说下对hadoop 的一些理解,包括哪些组件
29.详细讲解下你流式实时计算的项目部署以及收集的结果情况
30.实时流式计算框架,几个人,多长时间,细节问题,包括讲flume ,kafka ,storm 的各个的组件组成,你负责那一块,如果需要你搭建你可以完成么?
需要更多大数据学习或者面试资料的同学,来千锋教育免费领取了!