百度数据挖掘研发工程师实习笔试面试

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

百度数据挖掘研发工程师实习笔试面试
百度2011数据挖掘研发工程师实习笔试面试
笔试题:
一、简答题30分
1.extern”C”{}的作用和应用场景;
2.写出两者你熟悉的设计模式,及应用场景,可以给出伪代码;
3.TCP中time_wait是表示那种状态,及应用场景,以及起好处和坏处;
二、算法题40分文章1.有一个任务执行机,任务数N<1000,该机器每次只能执行一个任务,而任务之间存在依赖关系,
但是任务之间没有循环依赖,请给出适当的任务执行顺序,
2.编写函数,统计在某段英文文本中完整句子的数目,文本中只包括大小写字母,空格,点好(.),逗号(,)。

完整的句子必须包含至少一个字母并以点号,结束。

要求:完整的代码,达到目标;高效;简洁;
三、系统架构30分
有一个监控系统,有大量的数据记录包括{url,用户访问ip,时间},要对这个监控系统进行维护,并提供查询。

设计一个能存储和维护1000亿条记录,实时监控,并支持一下两种查询:
1.指定任意一个时间段(精确到分钟)和某个url,查处这个时间段内的所有url的访问总量。

2.指定任意一个时间段(精确到分钟)和某个ip,查询这个时间段内的ip访问总量。

面试一1.自我介绍;结合自己的简历简单地介绍一下,
2.项目介绍;结合自己做主要的项目,以及带的项目介绍资料,互动式地讲解;面试官关系的是机器学习相关的问题。

3.算法题;二叉树的非递归实现前序遍历;
4.算法设计题;如何去掉重复页面;
面试二
1.自我介绍;(同上)
2.项目介绍;(同上)
3.算法题;(略)问到了一个TTest;
4.算法设计题;如何对Query进行分类;
面试三
1.自我介绍;
2.项目介绍;
3.算法题两道;
1>一串首尾相连的.珠子(m个),有N种颜色(N《=10),设计一个算法,取出其中一段,要求包含所有N中颜色,并使长度最短。

并分析时间复杂度与空间复杂度。

2>从1到1亿,所有出现的数字的和(125=1+2+5),手工计算机出来;
我的感受:
2.自己的算法题的解答能力有待提高,面试的时候遇到的题目其实都很常见,估计在网上多看看就都能答得很好了;
3.百度笔试+三面的流程,大致和网上讲的差不多,前二次面试是类似的,三面可能是补充,并且往往会问道一些你职业规划上的一些问题;。

相关文档
最新文档