大数据常见面试题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对于刚参加大数据培训学习毕业的学员来说,找一份好的大数据开发工作是必要的,但是大多数学员在找工作的时候会遇到各种各样的问题,那么下边就给大家介绍一下参加大数据培训毕业学员在找工作时常遇到的问题。

1、scala 隐函数关键字

implicit

2、val x=y=1结果

1)x、y都是var,x变为Unit

2)都是val,报错

3、java内存模型

堆内存、栈内存、方法区

栈内存:保存局部变量

堆内存:存储数组和对象

方法区:代码区、字符串常量池、静态区

4、用mr设计一个分组排重计数算法

输入文件格式:二级域名,一级频道,二级频道,访问ip地址,访问者id

需求:按照二级域名,一级频道,二级频道分组,计算pageview数,计算独立ip数和独立访问者id数

5、hadoop中combiner的作用

当map生成的数据过大时,带宽就成了瓶颈,怎样精简压缩传给Reduce的数据,有不影响末了的结果呢。有一种方法就是使用Combiner,Combiner号称本地的Reduce,Reduce zui终的输入,是Combiner的输出

6、Linkedlist和ArrayList的区别

ArrayList是使用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢。LinkedList使用双向链表实现存储,

按序号索引数据需要进行前向或后向遍历,但是插入数据时只需要记录本项的前后项即可,所以插入速度较快。

7、http安全问题

1)重要信息:MD5,AES加密

2)不太重要的数据:用签名

3)登录态:

8、linux的启动顺序

通电后读取ROM的BIOS程序进行硬件自检,自检成功后把计算机控制权交给BIOS中BOOTsequence中的下一个有效设备,读取该设备MBR找到操作系统,载入linux的bootloader,一般是grub。之后载入kernel,执行

/etc/rc.d/sysinit ,开启其他组件(/etc/modules.conf),执行运行级别,执行/etc/rc.d/rc.local ,执行/bin/login,末后shell启动。

在这里希望上边的内容可以帮助大数据培训毕业学员可以找到一份满意的工作。

相关文档
最新文档