2018百度校招研发岗笔试题
Baidu面试笔试题 解答答案
Baidu面试笔试题解答答案专家回答:第一题简评百度的主要业务是搜索,搜索的基本原理如下1.编写爬虫程序到互联网上抓取网页海量的网页。
2.将抓取来的网页通过抽取,以一定的格式保存在能快速检索的文件系统中。
3.把用户输入的字符串进行拆分成关键字去文件系统中查询并返回结果。
由以上3点可见,字符串的分析,抽取在搜索引擎中的地位是何等重要。
因此,百度的笔试面试题中,出现这样的题就变得理所当然了。
以下是该题的java实现,代码如下:程序代码程序代码import .*;import java.io.*;import java.util.*;/** * @author tzy * 在j2sdk1.4.2下测试通过 */public class FileNameStat{private String srcPath;//要统计的文件路径private Map statMap;//用于统计的mappublic FileNameStat(String srcPath){this.srcPath=srcPath; 软件开发网 statMap=new TreeMap();}/*获得要统计的URL的文件名*/public String getFileName(String urlString){URL url=null;String filePath=null;String fileName=null;try{url=new URL(urlString);filePath=url.getPath();int index=0;if ((index=stIndexOf("/"))!=-1) {fileName=filePath.substring(index+1);}else{fileName="";}}catch(MalformedURLException e){}return fileName;}/*统计指定文件名的个数*/public void stat(String filename){Integer count=null;if(statMap.get(filename)!=null){count=(Integer)statMap.get(filename);count=new Integer(count.intValue()+1);}else{count=new Integer(1);}statMap.put(filename,count);}/*统计的主方法*/public void start() throws FileNotFoundException,IOException{BufferedReader bfin=new BufferedReader(new FileReader(this.srcPath)); String temp=null;while((temp=bfin.readLine())!=null){stat(getFileName(temp));}}/*输出统计结果*/public void result(){Iterator it=statMap.entrySet().iterator();while(it.hasNext()){Map.Entry entry=(Map.Entry)(it.next());System.out.println((entry.getKey().equals("")?"空文件名":entry.getKey()) + "的个数是" + entry.getValue());}}public static void main(String[] args) throws Exception{FileNameStat fns=new FileNameStat("src.txt");//指定成待统计文件fns.start();fns.result();}}第二题简评:这道题也与百度的业务有关,百度现在除了搜索外,还有贴吧,知道,博客等重要产品。
百度笔试题及答案
第一题简答题1.多线程和多进程模式有什么区别?在用两种模型开发服务程序时,分别有什么优缺点?采用长连接和短连接模式有什么区别?分别有什么优缺点?采用同步和异步模式有什么区别?分别有什么优缺点。
(1)启动进程的时候,操作系统会为进程分配资源,其中最主要的资源是存空间,因为程序是在存中运行的。
在进程中,有些程序流程块是可以乱序执行的,并且这个代码块可以同时被多次执行。
实际上,这样的代码块就是线程体。
线程是进程中乱序执行的代码流程。
当多个线程同时运行的时候,这样的执行模式成为并发执行。
对于一个进程中的多个线程来说,多个线程共享进程的存块,当有新的线程产生的时候,操作系统不分配新的存,而是让新线程共享原有的进程块的存。
因此,线程间的通信很容易,速度也很快。
不同的进程因为处于不同的存块,因此进程之间的通信相对困难。
线程切换快,但实现稍复杂。
进程易实现,较稳定,但性能与线程相比较差。
(2)所谓长连接,指在一个TCP连接上可以连续发送多个数据包,在TCP连接保持期间,如果没有数据包发送,需要双方发检测包以维持此连接,一般需要自己做在线维持。
短连接是指通信双方有数据交互时,就建立一个TCP连接,数据发送完成后,则断开此TCP连接,一般银行都使用短连接。
长连接多用于操作频繁,点对点的通讯,而且连接数不能太多情况,。
每个TCP 连接都需要三步握手,这需要时间,如果每个操作都是先连接,再操作的话那么处理速度会降低很多,所以每个操作完后都不断开,次处理时直接发送数据包就OK了,不用建立TCP连接。
而像WEB的http服务一般都用短,因为长连接对于服务端来说会耗费一定的资源,而像WEB这么频繁的成千上万甚至上亿客户端的连接用短连接会更省一些资源,如果用长连接,而且同时有成千上万的用户,如果每个用户都占用一个连接的话,那可想而知吧。
所以并发量大,但每个用户无需频繁操作情况下需用短连好。
(3)同步:调用方调用一个程序,等待返回,然后再继续下面的程序处理异步: 调用方调用一个程序,不等待返回,继续执行下面的程序。
百度校园招聘笔试题及答案
⼀、选择题:15 分共 10 题1. 在排序⽅法中,关键码⽐较次数与记录地初始排列⽆关的是:A. Shell 排序B. 归并排序C. 直接插⼊排序D. 选择排序选择 A2. 以下多线程对 int 型变量x的操作,哪⼏个需要进⾏同步:A. x=y;B. x++;C. ++x;D. x=1;选择 B, C3. 代码void func(){static int val;…}中,变量 val 的内存地址位于:A. 已初始化数据段B.未初始化数据段C.堆D.栈选择 A4. 同⼀进程下的线程可以共享以下:A. stackB. data sectionC. register setD. thread ID选择 A, B5. TCP 和 IP 分别对应了 OSI 中的哪⼏层?A. Application layerB. Data link layerC. Presentation layerD. Physical layerE. Transport layerF. Session layerG. Network layer选择 EG6. short a[100],sizeof(a) 返回?A. 2B. 4C. 100D. 200E. 400选择 D7. 以下哪种不是基于组件的开发技术_____。
A. XPCOMB. XPC. COMD. CORBA选择 B8. 以下代码打印的结果是(假设运⾏在 i386 系列计算机上):字串2struct st_t{int status;short *pdata;char errstr[32];};st_t st[16];char *p = (char *)( st[2].errstr + 32 );printf( "%d", ( p - (char *)(st) ) );A. 32B. 114C. 120D. 1112选择 C,因为st[2]的起始地址⽐st[0]的起始地址⾼80位,st[2].errstr的起始地址⽐st[2]的起始地址⾼8位再加上32位就等于 120.9. STL 中的哪种结构是连续形式的存储:A. mapB. setC. listD. vector选择 D10. ⼀个栈的⼊栈序列是 A,B,C,D,E,则栈的不可能的输出序列是:A. EDCBAB. DECBAC. DCEABD. ABCDE选择 C⼆、简答题:20 分,共 2 题1. (5 分)重复多次 fclose ⼀个打开过⼀次的 FILE *fp 指针会有什么结果,并请解释。
2018百度校招研发岗笔试题
2018百度校园招聘数据挖掘工程师笔试题一、简答题(本题共30分)1. 【C/C++】Const作用域变量、函数、类分别有什么特性。
(10分)2. 内存分配中堆和栈的区各是指什么?在什么时候会分配?(10分)3. 如何判定训练出的模型过拟合?(10分)二、算法与程序设计题(本题共45分)1. 假设有一个数组,里面有10个元素inta[10]={0, 1, 2, 3, 4, 5, 6, 7, 8, 9}。
请写一个算法,得到a数组的一个随机排列。
要求时间复杂度尽量小,可以使用random函数。
例如输出的随机序列可以是:3 6 2 4 5 1 9 8 0(15分)2. 对于logistic regession问题(prob(t|x)=1/(1+exp(w*x+b))且label y=0或1)请给出loss function和权重w的更新公式及推导(15分)三、系统设计题(本题共25分)假设我们有三个箱子,分别是红色,蓝色和绿色。
在红色箱子中有3个苹果,4个橘子,3个柠檬。
在蓝色箱子中有1个苹果,1个橘子和0个柠檬,在绿色箱子中有3 个苹果,3 个橘子和4 个柠檬。
如果我们选择箱子的概率是红色0.2,蓝色0.2,绿色0.6,并且选择一个箱子后,以均匀的概率随机移除一个水果。
那么移除苹果的概率是多少?请给出步骤(10 分)如果我们发现移除的水果是橘子,那么这个橘子来自绿色箱子的概率是多少?请给出步骤(15 分)2018百度校招笔试题-数据处理工程师时间:2018-10-12地点:北京、上海职位:数据处理工程师一、基础题:1.GIS的组成部分2.简述墨卡托投影3.简述矢量地图与栅格地图的特点和区别二、简答题1.地图中POI三个率你认为……忘了,反正就是POI三个率,两个小题,基本问概念2.如果你需要做春运专题,请问你需要哪些数据、采用什么数据分析方法以及如何保证精度?3.你认为街景图是如何制作的?三、素质题1.你的方案得不到leader响应怎么办?2.如果你和你的同事被分配到一个任务的两个模块,他没有完全理解他的模块,并且如果换你做他的模块又会很高效很快完成,你会怎么做?(有点绕,就是你同事做不好,你还挺会做他的那部分,咋办~)3.说说“时钟”和“地图”的共同点。
百度校园招聘云计算研发工程师笔试题目
百度校园招聘云计算研发工程师笔试题目
百度校园招聘云计算研发工程师笔试题目
一、简答题(本题共30分)
1.简述数据库以及线程死锁产生的原理及必要条件,简述如何避免死锁,。
2.请列举面向对象设计的三个基本要素及五种主要设计原则。
3.简述windows内存管理的.几种方式以及优缺点。
二、算法与程序设计(本题共45分)
1.公司组织一次羽毛球比赛,采用淘汰制,假设公司共有1001个人,如果要评出"公司羽毛球第一高手"的称号,至少需要进行多少场比赛?请简述设计过程,并编写代码模拟比赛过程(语言不限,可以使用伪代码)。
2.一百个灯泡排成一排,第一轮将所有灯泡打开;第二轮每隔一个灯泡关掉一个,即排在偶数的灯泡都被关掉,第三轮每隔两个灯泡,将开着的灯泡关掉,关掉的灯泡打开。
以此类推,第100轮结束的时候,还有几盏灯泡亮着?
3.有一个nxn的方格代表的迷宫,黑色格子表示无法通过,白色格子表示可用通过,人只可以在上下左右方向的可以通行的白色格子之间移动,假如人处于迷宫总某个位置,如何用最短的时间找出一条最短的路径,以便从迷宫中走出来?
三、系统设计题(本题25分)
设计一个日访问量大约百万级别类似这样的社交分享类的网站,(写消息或写文章请求数):(浏览请求数)的比率小于1/5。
请给出你系统的架构设计。
如果日访问量达到10亿,那系统架构设计需要哪些优化,来保证服务7*24小时稳定运行。
百度校招笔试部分题型
企业笔试题——百度校招笔试部分题型一、运维笔试1、传说中的int a; int* a; int** a; int (*a)[10]; int (*a)(int)的那个。
给描述写变量定义。
2、程序题:(1)写一个程序,求出一个数组中连续数之和最大的,返回和,如{-1,1,2,0,3},最大的和为7=1+2+0+3.(2)返回求单链表倒数第N个节点。
3、算法题:(1)linux 系统中,写命令时,写第一个字母,系统就自动填充其余的字母,描述其算法。
(2)字典排序,很多歌字符串,如zcfgrgh,aotu,bidcfhu,abcd,gtysdsj,等排序之后结果应为abcd,aotu,bidcfhu,gtysds,zcfgrghj。
二、用户研究笔试题1第一题:比较移动互联网和传统互联网的差异,列举,并且说明用户研究上应该做哪些调整。
第二题是关于百度新首页的,题干讲了下百度新首页添加的功能模块:导航、实时热点、应用以及新鲜事,以及节选了一段李彦宏的讲话,一共四个小问题(1)新首页是针对那个用户群体推出的(2)如果请你从四个功能模块里删除一个,删哪个,为什么?(3)如果请你再添加一个,你会添加什么?为什么?(4)不考虑资金和时间,请设计一个研究对新首页进行调查,不仅限于产品可用性和用户满意度第三题是关于百度公益方面的吧,留守儿童存在很多成长过程中由于关注度不够而导致的问题,问互联网能帮助些什么,哪些是百度擅长的第四题是假设你有一名死党,他某次偶然看上一位美女,立誓非她不娶,你作为狗头军师,请为他出谋划策:(1)如何知道美女的信息(仅知道她是哪个专业的,好像是这个意思)(2)如何去搭讪又不被反感?之前要准备些什么?为什么?(3)如果女生有男朋友,请你为你的死党设计策略,找到突破口,使死党成功追到美女。
第五题是关于为小米设计上市海报的,先讲了下小米的特点以及销售模式为线上销售,设计海报并说明营销策略三、产品运营师1、简要分析用户通常习惯在手机上用哪些方式阅读新闻,针对这些方式采取怎样的做法满足需求?简述理由2、针对吧主,制定一套运营管理机制,你会做哪些,理由3、发布微博的时候支持插入内容,比如音乐、图片和视频,作为产品负责人,会根据哪些条件确定是否增加这些功能4、百度拟推出一个用户相互分享、推荐音乐的新产品,请设计首页并挑选三个你认为最重要的模块说明理由四、商业业务分析笔试1、一道英文出的计算题,其实就是说两个人开车到目的地,A 是去的时候开了九十米,B完剩下的路程,回来的时候A开了前段,B 开完了剩下的100 米,问A和B 谁开的路程最多3、桌上有20 个硬币横向排放着,你和另一个人轮流取硬币,最后币值相等或大于对方就获胜,你先取硬币,要采取什么策略能保证获胜。
百度校园招聘笔试题目
百度校园招聘笔试题目(最新版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本编精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!Download tips: This document is carefully compiled by this editor.I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!正文内容百度校园招聘笔试题目分享:1、找到满足条件的数组给定函数d(n)=n+n的各位之和,n为正整数,如d(78)=78+7+8=93。
这样这个函数可以看成一个生成器,如93可以看成由78生成。
定义数A:数A找不到一个数B可以由d(B)=A,即A不能由其他数生成。
现在要写程序,找出1至10000里的所有符合数A定义的数。
回答:申请一个长度为10000的bool数组,每个元素代表对应的值是否可以有其它数生成。
开始时将数组中的值都初始化为false。
由于大于10000的数的生成数必定大于10000,所以我们只需遍历1到10000中的数,计算生成数,并将bool数组中对应的值设置为true,表示这个数可以有其它数生成。
最后bool数组中值为false的位置对应的整数就是不能由其它数生成的。
2、实现一个函数,对一个正整数n,算得到1需要的最少操作次数。
百度校园招聘笔试题及答案解析
百度校园招聘笔试题及答案解析百度校园招聘笔试题及答案一:简答题(30)1:数据库以及线程发生死锁的原理及必要条件,如何避免死锁(操作系统书上有)2:面向对象的三个基本元素,五个基本原则(继承,封装,多态,基本原则没答上)3:windows内存管理的机制以及优缺点(分页,分段,虚拟内存管理....) 二:程序设计题(40)1:公司里面有1001个员工,现在要在公司里面找到最好的羽毛球选手,也就是第一名,每个人都必须参赛,问至少要比赛多少次才能够找到最好的羽毛球员工。
(含伪代码)--------(个人觉得,两两比赛,分成500组剩下一人,类似于归并排序的方式,比出冠军后,让冠军之间再比,主要是要想想多余的那一个选手如何处理,必然要在第一次决出冠军后加入比赛组)2:现在有100个灯泡,每个灯泡都是关着的,第一趟把所有的灯泡灯泡打开,第二趟把偶数位的灯泡制反(也就是开了的关掉,关了的打开),第三趟让第3,6,9....的灯泡制反.......第100趟让第100个灯泡制反,问经过一百趟以后有多少灯泡亮着-----(觉得这个应该是最好做的编程题了,首先定义一个数组vist[100],初始化为0,我们假设已经达到第i个灯泡了,要判断第i个灯泡最后是开着还是灭了的,要要知道它被开关了多少次用temp存放,也就是说是偶数还是奇数,偶数显然最后是关着的,奇数则开着,让i除以比它小的数字,如果余数为0就躺temp++,最后再根据temp的值确定vist[i是0还是1,最后扫描整个vist数组)3:有20个数组,每个数组有500个元素,并且是有序排列好的,现在在这20__500个数中找出排名前500的数(可以用归并排序,最后找到500个元素的值,也可以这样首先找到每个数组的.最大值和最小值,然后存放在一个结构体里面,如果一个数组里面的最小值大于某一个数组的最大值,那么某一个数组就被kill掉,然后提取剩余数组的最大值----当然每个数组的元素放生变化了,因为每次提取走了最大值,然后改变结构体里面的最大值和最小值,重复以上操作,直到找到前五百个数)三:系统设计题(30)现在有一个手机,手机上的键盘上有这样的对应关系,2对应“abc”,3对应“def”.....手机里面有一个userlist用户列表,当我们输入942的时候出来拼音的对应可能是“xia”,“zha”,“xi”,“yi”等,当我们输入9264的时候出来是yang,可能是“样”,“杨”,“往”等,现在我们输入一个字符串数字,比如926等,要在电话簿userlist中查找出对应的用户名和电话号码并返回结果,---------(个人觉得用哈希表来查找,并用链表来处理冲突,如a[2]依次对应abc,可以在匹配字符的时候定义一个char(/__P)[4]的指针,每个指针指向最多四个char类型的字符串,并且用遍历的方式依次匹配)百度校招什么时候开始一般是在2月到4月春招的高发期是在3月到4月,当然也有更早的提前招录,在12月到1月,这个时间段是企业为了争夺优秀生源,提前招聘时间;还有5月份的补录,但这时候只有少数企业开通补录通道。
百度招聘笔试真题题及答案
百度招聘笔试真题题及答案
1、请实现两棵树是否相等的比较,相等返回,否则返回其他值,并说明算法复杂度。
数据结构为:
typedefstruct_TreeNode{
charc;
TreeNode*leftchild;
TreeNode*rightchild;
}TreeNode;
函数接口为:intpTree(TreeNode*tree1,TreeNode*tree2);
注:A、B两棵树相等当且仅当Root-c==RootB--c,而且A和B的左右子树相等或者左右互换相等。
2、写一段程序,找出数组中第k大小的数,输出数所在的位置。
例如{2,4,3,4,7}中,第一大的数是7,位置在4。
第二大、第三大的数都是4,位置在1、3随便输出哪一个均可。
函数接口为:intfind_orderk(constint*narry,constintn,constintk)
2、已知一个字串由GBK汉字和ansi编码的数字字母混合组成,编写c语言函数实现从中去掉所有ansi编码的字母和数字(包括大小写),要求在原字串上返回结果。
函数接口为:intfilter_ansi(char*gbk_string)
注:汉字的GBK编码范围是0x8140-0xFEFE
百度笔试题(感谢网友lihan提供)
shury发表于2005-12-517:05:00
1)此题10分
对任意输入的正整数N,编写C程序求N!的尾部连续0的个数,并指出计算复杂度。
如:18!=6402373705728000,尾部连续0的个数是3。
(不用考虑数值超出计算机整数界限的问题)。
百度校园招聘在线笔试题及答案
百度校园招聘在线笔试题及答案第1题:用C语言实现一个公用库函数void * memmove(void *dest,const void *src,size_t n)。
该函数的功能是拷贝src所指的内存内容前n个字节到dest所指的地址上。
注意,作为公用库函数,请注意安全检查,注意处理内存区重合的情况。
第2题:已知一个字串由GBK汉字和ansi编码的数字字母混合组成,编写C语言函数实现从中去掉所有ansi编码的的数字和字母(包括大小写),要求在原字串上返回结果。
函数接口为:int filter_ansi(char* gbk_string)。
注:汉字的GBK编码范围是0x8140 - 0xFEFE第3题:芯片测试。
有2k块芯片,已知好芯片比坏芯片多。
请设计算法从其中找出一片好芯片,并说明你所用的比较次数上限。
其中:好芯片和其它芯片比较时,能正确给出另一块芯片是好还是坏;坏芯片和其它芯片比较时,会随机的给出好或是坏。
------------------------------------------------------------在这里填写答案:-------------------------------------------------第1题:用C语言实现一个公用库函数void * memmove(void *dest,const void *src,size_t n)。
该函数的功能是拷贝src所指的内存内容前n个字节到dest所指的地址上。
注意,作为公用库函数,请注意安全检查,注意处理内存区重合的情况。
void* memmove(void * dest, const void * src, size_t n){void* temp = dest;if (dest <= src || (char *)dest >= ((char *)src + n)) //无内存地址重叠{while (n--){*(char *)dest = *(char *)src;dest = (char *)dest + 1;src = (char *)src + 1;}}else //有内存地址重叠{dest = (char *)dest + n - 1;src = (char *)src + n - 1;while (n--){*(char *)dest = *(char *)src;dest = (char *)dest - 1;src = (char *)src - 1;}}return (temp);}-------------------------------------------------第2题:已知一个字串由GBK汉字和ansi编码的数字字母混合组成,编写C语言函数实现从中去掉所有ansi编码的的数字和字母(包括大小写),要求在原字串上返回结果。
百度技术研发笔试题目
百度技术研发笔试题目
*百度面试题
*有一根27厘米的细木杆,在第3厘米、7厘米、11厘米、17厘米、23厘米这五个位置上各有一只蚂蚁。
*木杆很细,不能同时通过一只蚂蚁。
开始时,蚂蚁的头朝左还是朝右是任意的,它们只会朝前走或调头,
*但不会后退。
当任意两只蚂蚁碰头时,两只蚂蚁会同时调头朝反方向走。
假设蚂蚁们每秒钟可以走一厘米的距离。
*编写程序,求所有蚂蚁都离开木杆的最小时间和最大时间。
*
*
*分析:题目中的蚂蚁只可能相遇在整数点,不可以相遇在其它点,比如3.5cm处之类的,也就是可以让每只蚂蚁走1秒,然后
*查看是否有相遇的即可.
*
*这样我的程序实现思路就是,初始化5只蚂蚁,让每只蚂蚁走1秒,然后看是否有相遇的,如果有则做相应处理.当每只蚂蚁都
*走出木杆时,我就记录当前时间.这样就可以得到当前状态情况下,需要多久可以走出木杆,然后遍历所有状态则可以得到所胡*可能.
*/
packagebaidu;
publicclassAnt{
privatefinalstaticintstep=1;
privateintposition;
privateintdirection=1;
publicvoidwalk(){
if(isOut()){
thrownewRuntimeException("theantisout");
}
position=position+this.direction*step; };
publicbooleanisOut(){ returnposition<=0||position>=27;
}。
2018-百度201X校园招聘技术研发笔试题目-word范文模板 (1页)
2018-百度201X校园招聘技术研发笔试题目-word范文模板
本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!
== 本文为word格式,下载后可方便编辑和修改! ==
百度201X校园招聘技术研发笔试题目
我非985,非211,二本专业一枚,有幸获得度娘的照顾,有个笔试机会,当然抱着重在参与的心态,把所有题目copy回来了。
说来惭愧,做的不好,给需要的同学参考参考吧。
一、简答题
1.静态链接库和动态链接库的优缺点。
2.轮询式任务调度和抢占式任务调度的区别
3.数据库中有哪些锁,叙述其应用场合。
二、算法与程序设计
1.给定任意一正整数,求大于它的最小非“重复数”。
所谓“重复数”是指一个数中相邻的位相同的状况,例如“1123”是重复数,“1231”则不是。
2.有一个长度为N(N很大)的字符串,求其最大回文字符串。
(好像是回文。
)
3.在数轴上有a[0],a[1],a[2],.....,a[n-1]个点,有一根长度为L 的尺子,最多能覆盖多少个点?
三、系统设计(题目太长,大意如下)
设计一个分布式缓存系统,满足一下三个条件:
1.单个缓存服务器故障无法工作,服务器集群可正常工作。
2.充分利用每一个服务器容量,按照比例,均衡负载。
3.如果某一服务器故障,保证迁移的缓存文件数据量最小。
百度校招笔试题范文
(笔试时间120分钟)一、简答题(本题共30分)1.列出至少6中内部排序算法,并说明复杂度及稳定性。
(10分)2.多线程同步互斥的方法有哪些?(10分)3.进程间通信方式有哪些?哪种通信方式速度最快?(10分)二、算法与程序设计题(本体共45分)1.设计一个算法,快速查找二叉树上任意两个节点的最近共同父节点,请给出算法描述和代码实现(15分)2.给定一个有序链表,删除所有重复的元素,仅保留至出现一次的元素,请给出算法描述和代码实现(15分)3.给定一颗二叉树,判断其是否为平衡二叉树(左右子树之差的绝对值不超过1)(15分)三、系统设计题(本体共25分)1.一个分布式检索服务系统(500台服务器),不同query的检索处理时间相差很大(比如有的query需要十几亳秒,有的需要上百亳秒甚至更多),现在发现线上很多检索由于该服务的处理超时(处理超时是指处理时间超过了上游模块设置的最大的等待处理时间。
这里我们假定为200ms)而查询失败。
为了解决这个问题,需要为这个服务设计一个内存级CaChe功能,要求如下:(1)、最大限度的降低服务超时率;(2)、如果原数据有变化,尽量展现最新数据;(3)、尽量提高CaChe的命中率;为了实现上述要求,除了设计CaChe内部逻辑以外,你可以提出具体调整查询请求在分布式系统中的分派规则。
求职面试的注意事项:(1)不要低估自己的能力面试时要避免说这样的话:“我只有六个月的工作经验”;“虽然我没接触过此类工作,蛤我可以边做边学。
”可以谈谈你大学时的专业成绩或从事过的实习经历,哪怕这些工作经历并不令你骄傲。
(2)不要过于自信自信在很多情况下是优点,但如果你的应聘条件确实不足以令人信服,你最好不要在面试的时候对自己的能力渲染太多。
一旦考官觉得你所说的和你短暂出入太大,会认为你不诚实。
(3)适时入座在主考官没有请你坐下来时,切忌急于坐下,否则会被视为傲慢无礼。
主考官让你坐下时,应表示谢意,在主考官指定的位置上坐下,保持良好的坐姿。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018百度校园招聘数据挖掘工程师笔试题
一、简答题(本题共30分)
1. 【C/C++】Const作用域变量、函数、类分别有什么特性。
(10分)
2. 内存分配中堆和栈的区各是指什么?在什么时候会分配?(10分)
3. 如何判定训练出的模型过拟合?(10分)
二、算法与程序设计题(本题共45分)
1. 假设有一个数组,里面有10个元素inta[10]={0, 1, 2, 3, 4, 5, 6, 7, 8, 9}。
请写一个算法,得到a数组的一个随机排列。
要求时间复杂度尽量小,可以使用random函数。
例如输出的随机序列可以是:3 6 2 4 5 1 9 8 0(15分)
2. 对于logistic regession问题(prob(t|x)=1/(1+exp(w*x+b))且label y=0或1)请给出loss function和权重w的更新公式及推导(15分)
三、系统设计题(本题共25分)
假设我们有三个箱子,分别是红色,蓝色和绿色。
在红色箱子中有3个苹果,4个橘子,3个柠檬。
在蓝色箱子中有1个苹果,1个橘子和0个柠檬,在绿色箱子中有3 个苹果,3 个橘子和4 个柠檬。
如果我们选择箱子的概率是红色0.2,蓝色0.2,绿色0.6,并且选择一个箱子后,以均匀的概率随机移除一个水果。
那么移除苹果的概率是多少?请给出步骤(10 分)
如果我们发现移除的水果是橘子,那么这个橘子来自绿色箱子的概率是多少?请给出步骤(15 分)
2018百度校招笔试题-数据处理工程师时间:2018-10-12
地点:北京、上海
职位:数据处理工程师
一、基础题:
1.GIS的组成部分
2.简述墨卡托投影
3.简述矢量地图与栅格地图的特点和区别
二、简答题
1.地图中POI三个率你认为……忘了,反正就是POI三个率,两个小题,基本问概念
2.如果你需要做春运专题,请问你需要哪些数据、采用什么数据分析方法以及如何保证精度?
3.你认为街景图是如何制作的?
三、素质题
1.你的方案得不到leader响应怎么办?
2.如果你和你的同事被分配到一个任务的两个模块,他没有完全理解他的模块,并且如果换你做他的模块又会很高效很快完成,你会怎么做?(有点绕,就是你同事做不好,你还挺会做他的那部分,咋办~)
3.说说“时钟”和“地图”的共同点。