6个公司的大数据岗位的面试经验
大数据工程师岗位面试自我介绍
![大数据工程师岗位面试自我介绍](https://img.taocdn.com/s3/m/d86508010812a21614791711cc7931b765ce7b11.png)
大数据工程师岗位面试自我介绍
大家好,我是XXX,很高兴能有机会在这里进行自我介绍。
我是一名大数据工程师,有XXX年的相关工作经验。
在过去的工作中,我参与并负责了多个大数据项目的设计、开发和实施。
我熟悉Hadoop、Spark、Hive等大数据技术和工具,能够熟练地使用它们来处理大规模数据,提取有价值的信息。
我对数据分析和挖掘有着浓厚的兴趣,能够运用统计学和机器学习算法来解决实际问题。
在以往的工作中,我曾经使用机器学习算法建立了一个预测模型,通过对历史数据的分析和训练,能够准确预测出未来的销售趋势,为企业的决策提供了有力的支持。
我还具备良好的沟通能力和团队合作精神。
在项目中,我善于与不同部门的人员进行有效的沟通,以确保项目的顺利进行。
我也很愿意分享自己的知识和经验,帮助团队中其他成员提高技能。
我对大数据领域充满了热情,并且积极追求新技术的学习和应用。
我相信自己的技术和能力能够为贵公司的发展带来巨大的价值。
谢谢大家!这就是关于我作为一名大数据工程师的自我介绍。
希望能有机会与贵公司共同发展。
谢谢!。
数据运营专员岗位面试题及答案(经典版)
![数据运营专员岗位面试题及答案(经典版)](https://img.taocdn.com/s3/m/70bdcd36773231126edb6f1aff00bed5b9f373e0.png)
数据运营专员岗位面试题及答案1.请简要介绍您的数据运营经验和工作背景。
回答:我拥有X年的数据运营经验,之前在ABC公司担任数据运营专员职务。
我的主要职责包括数据收集、清洗、分析和报告,以支持业务决策。
我曾成功协助团队提高数据质量,实施数据自动化流程,并为公司节省成本。
2.您在数据收集和整合方面有何经验?回答:在数据收集和整合方面,我有丰富的经验。
我曾负责创建数据收集计划,确保数据源的完整性和准确性。
举例来说,在上一家公司,我建立了一个自动化的数据抽取和转换流程,将多个数据源的信息整合到一个集中式仓库中,提高了数据可用性和可访问性。
3.如何确保数据的准确性和一致性?回答:为确保数据准确性和一致性,我会采用多种方法。
首先,我会实施数据验证和校验规则,自动检测和修复数据错误。
其次,我会建立数据字典和数据质量标准,以确保数据的一致性。
此外,定期的数据审计也是确保数据质量的重要步骤。
4.请描述一次您在数据清洗中遇到的挑战,并如何解决的。
回答:在一次数据清洗中,我们面临了大量的重复数据和缺失值的问题。
为了解决这个挑战,我首先使用数据去重技术来识别和删除重复记录。
然后,我采用插补方法填补缺失值。
最后,我建立了一个数据清洗流程,定期监测数据质量,以确保问题不再出现。
5.您如何确定数据的关键绩效指标(KPIs)?回答:确定关键绩效指标是基于业务目标的。
我会与业务部门合作,了解他们的需求和目标。
然后,我会确定可以量化和衡量的KPIs,以帮助评估业务绩效。
例如,在电子商务领域,关键绩效指标可能包括销售额、转化率和购物车放弃率。
6.您如何分析数据以提供业务见解?回答:我使用多种分析方法来提供业务见解。
首先,我进行描述性分析,以了解数据的基本特征。
然后,我进行趋势分析和关联分析,以识别模式和关系。
最后,我建立预测模型和机器学习算法,以预测未来趋势和提供业务建议。
例如,在零售业务中,我使用时间序列分析来预测季节性销售趋势。
大数据架构师面试题
![大数据架构师面试题](https://img.taocdn.com/s3/m/8acd8a72ef06eff9aef8941ea76e58fafab04500.png)
大数据架构师面试题随着大数据技术的不断发展和普及,对于大数据架构师的需求也越来越大。
作为一个大数据架构师,不仅需要拥有扎实的技术功底,还需要具备丰富的实践经验和解决问题的能力。
以下是一些常见的大数据架构师面试题,希望能够帮助你对自己的技能进行评估和准备。
1. 请简要介绍什么是大数据架构?大数据架构是指在处理大规模数据时所采用的硬件和软件的整合方式。
它包括数据的收集、存储、处理和分析等方面的技术和流程,旨在提高数据的价值和利用效率。
2. 请列举一些你熟悉的大数据处理框架和技术。
大数据处理框架和技术有很多,以下是一些常见的:- Hadoop: 一个开源的分布式计算框架,包括HDFS(分布式文件系统)和MapReduce(分布式计算模型)等组件。
- Spark: 一个快速而通用的大规模数据处理引擎,支持内存计算和迭代计算等,具有高效和强大的处理能力。
- Hive: 基于Hadoop的数据仓库基础设施,提供了类似SQL的查询语言,方便使用和管理大规模数据。
- HBase: 一个面向列的分布式数据库,适合存储和处理大量结构化和半结构化数据。
- Cassandra: 一个高度可扩展的分布式数据库,具有良好的容错性和可用性,适合处理海量数据。
3. 请解释一下什么是数据湖(Data Lake)?数据湖是指将各种结构化和非结构化数据存储在一个统一的存储系统中,提供给各种分析和处理工具使用的概念。
与传统的数据仓库相比,数据湖不要求事先对数据进行预处理和建模,可以对任意类型和格式的数据进行存储和分析。
4. 请描述一下大数据处理的流程。
大数据处理一般包括以下步骤:- 数据收集:从不同的数据源(数据库、传感器、日志文件等)中采集数据,并进行数据清洗和预处理。
- 数据存储:将处理后的数据存储在分布式存储系统(如HDFS、S3等)中,以便后续的处理和分析。
- 数据处理:使用分布式计算框架(如MapReduce、Spark等)对存储在分布式存储系统中的数据进行计算和分析。
数据岗位招聘面试题与参考回答
![数据岗位招聘面试题与参考回答](https://img.taocdn.com/s3/m/9745294b876fb84ae45c3b3567ec102de2bddfdc.png)
招聘数据岗位面试题与参考回答面试问答题(总共10个问题)第一题题目:请您描述一下您对数据分析师这一岗位的理解,以及您认为作为一名优秀的数据分析师应该具备哪些核心能力?答案:作为一名数据分析师,我认为我的主要职责是从大量数据中提取有价值的信息,通过数据挖掘、统计分析等方法,帮助公司或团队做出更加明智的决策。
以下是我认为优秀的数据分析师应具备的核心能力:1.数据分析技能:熟练掌握至少一种数据分析软件(如Excel、SPSS、R、Python等),能够进行数据清洗、数据预处理、数据分析、数据可视化等工作。
2.统计知识:具备扎实的统计学基础,能够正确运用各种统计方法,如描述性统计、推断性统计、假设检验等。
3.业务理解:对所从事的行业有深入的理解,能够将数据分析与业务需求相结合,提出有针对性的分析建议。
4.沟通能力:能够清晰、准确地表达分析结果,无论是通过书面报告还是口头汇报,都要确保信息传递的有效性。
5.解决问题的能力:面对复杂的问题时,能够运用逻辑思维和创造性思维找到解决方案。
6.持续学习:数据分析和统计方法在不断进步,优秀的数据分析师应具备持续学习的态度,不断更新自己的知识库。
解析:这一题旨在考察应聘者对数据分析师岗位的理解程度,以及对所需能力的自我评估。
优秀的数据分析师不仅需要具备扎实的技术能力,还需要具备良好的业务敏感度和沟通技巧。
答案中提到的各项能力都是数据分析师岗位的关键要求,通过这样的回答,面试官可以初步判断应聘者的专业背景和综合素质。
第二题题目:请描述一下您在过去的工作或项目中,如何处理过一次数据清洗的难题?您遇到了哪些挑战,又是如何克服这些挑战的?答案:在过去的一个项目中,我负责对一家大型电商平台的用户数据进行清洗和分析。
在数据清洗过程中,我遇到了以下挑战:1.数据质量问题:原始数据中存在大量的缺失值、异常值和重复数据。
2.数据格式不一致:不同来源的数据格式不统一,给数据整合带来了困难。
大数据面试3分钟自我介绍_大数据开发工程师面试主要面试内容
![大数据面试3分钟自我介绍_大数据开发工程师面试主要面试内容](https://img.taocdn.com/s3/m/2789cd6e905f804d2b160b4e767f5acfa1c783c3.png)
大数据面试3分钟自我介绍_大数据开发工程师面试主要面试内容大家好,我是一名大数据开发工程师,很高兴有机会在这里进行自我介绍。
我是一位有着丰富经验和专业知识的大数据开发者,并且对数据分析和数据处理有着浓厚的兴趣。
首先,让我来介绍一下我的教育背景。
我本科毕业于XX大学计算机科学与技术专业,期间主要学习了数据结构、算法、数据库等基础课程。
随后,我进入研究生阶段,攻读了数据科学与大数据技术专业,通过学习深化了在大数据领域的知识,掌握了Spark、Hadoop、Hive等常用的大数据技术和工具。
在我的职业生涯中,我曾经在一家大型互联网公司实习,并参与了一个大型的电商平台的大数据项目。
我负责为数据科学团队开发数据处理和数据分析的工具,以帮助他们提高数据的采集和分析效率。
通过这个项目,我不仅加深了对大数据生态系统的了解,还掌握了数据仓库的基本设计和优化技巧,进一步提升了我的大数据开发能力。
除此之外,我也参与了一些个人项目,根据客户需求,使用Python编写了数据清洗和数据处理脚本,并使用Spark进行大规模数据处理和分析。
通过这些项目,我进一步熟悉了数据挖掘和数据分析的流程,提高了我的编程能力和问题解决能力。
在面对大数据开发工程师的面试时,主要的面试内容通常包括技术和项目经验方面的问题。
对于技术方面,常见的问题包括:对Hadoop、Spark等大数据技术的了解程度,熟悉的数据处理和分析工具,了解的数据挖掘算法等。
对于项目经验方面,可能会问到我参与的大数据项目的具体内容,我的具体职责以及我在项目中遇到的挑战和解决方案。
作为一名大数据开发工程师,我非常关注数据的质量和效率。
我具备扎实的编程基础和良好的数据分析能力,善于解决问题并能够快速适应新技术和工具。
我期待能够为贵公司提供我的技能和经验,与团队一起努力,为实现数据驱动的决策和业务创新做出贡献。
谢谢大家!这就是我关于大数据开发工程师的自我介绍。
面试数据营运岗面试题目(3篇)
![面试数据营运岗面试题目(3篇)](https://img.taocdn.com/s3/m/bd7095e0b8d528ea81c758f5f61fb7360b4c2bce.png)
第1篇一、自我介绍及职业规划1. 请简单介绍一下自己,包括教育背景、工作经历等。
解析:通过这个问题,面试官想了解你的基本情况,考察你的表达能力。
在回答时,要突出自己的优势和特长,与数据运营岗位的相关性。
2. 你为什么选择数据运营岗位?解析:这个问题考察你对数据运营岗位的理解和兴趣。
你可以从个人兴趣、职业发展、行业前景等方面进行回答。
3. 你对自己的职业规划是什么?解析:这个问题考察你的职业目标和规划能力。
在回答时,要展示出你对未来职业发展的明确规划和目标。
二、数据基础知识4. 请简述数据分析的基本步骤。
解析:这个问题考察你对数据分析流程的了解。
在回答时,要涵盖数据收集、数据预处理、数据分析、数据可视化和报告撰写等步骤。
5. 请列举几种常用的数据分析方法。
解析:这个问题考察你对数据分析方法的掌握程度。
在回答时,可以列举描述性统计分析、回归分析、聚类分析等常用方法。
6. 什么是数据挖掘?请简述数据挖掘的基本流程。
解析:这个问题考察你对数据挖掘的理解。
在回答时,要解释数据挖掘的概念,并阐述其基本流程,如数据预处理、特征选择、模型训练、模型评估等。
三、数据运营技能7. 请简述数据运营的工作内容。
解析:这个问题考察你对数据运营岗位的理解。
在回答时,要涵盖数据收集、数据分析、数据产品化、数据优化等环节。
8. 请举例说明你如何利用数据分析来优化产品。
解析:这个问题考察你的实际操作能力。
在回答时,可以结合具体案例,说明你如何通过数据分析发现问题、提出解决方案并优化产品。
9. 请简述数据可视化的重要性,并列举几种常用的数据可视化工具。
解析:这个问题考察你对数据可视化的认识。
在回答时,要阐述数据可视化在数据运营中的重要性,并列举常用的工具,如Tableau、Power BI、Excel等。
10. 请简述如何进行用户画像分析。
解析:这个问题考察你对用户画像的理解。
在回答时,要解释用户画像的概念,并阐述如何通过数据分析构建用户画像。
大数据项目经理招聘面试题与参考回答(某大型央企)2025年
![大数据项目经理招聘面试题与参考回答(某大型央企)2025年](https://img.taocdn.com/s3/m/b336da57591b6bd97f192279168884868662b86a.png)
2025年招聘大数据项目经理面试题与参考回答(某大型央企)(答案在后面)面试问答题(总共10个问题)第一题1.项目背景与目标;2.项目团队的组织与分工;3.项目实施过程中的关键控制点及应对策略;4.项目风险管理及应对措施;5.项目成果评估及经验总结。
第二题请结合您过往的工作经验,详细描述一次您在大数据项目管理中遇到的技术难题,以及您是如何解决这个问题的。
第三题题目:请描述一次您在项目管理中遇到的重大挑战,以及您是如何应对并解决问题的。
请详细说明以下方面:1.挑战的具体内容;2.您的分析和评估过程;3.您采取的具体措施;4.最终的结果和经验教训。
第四题题目:请描述一次您在项目中成功解决大数据处理瓶颈的经验。
具体说明您是如何识别问题的、采取的措施以及最终的结果。
第五题题目:请描述一次您在项目管理中处理团队冲突的经历。
您是如何识别冲突的,采取了哪些措施来化解冲突,最终结果如何?第六题题目:请您谈谈大数据在您所在行业中的应用现状以及未来发展趋势。
结合您对大数据的理解,分析大数据项目在实施过程中可能遇到的关键挑战,并提出相应的解决方案。
第七题题目:请详细描述一次您在项目管理中遇到的最大挑战,以及您是如何克服这个挑战的。
在这个过程中,您认为大数据技术如何帮助您解决了问题?第八题题目:请您谈谈大数据项目在实施过程中,如何确保数据质量和数据安全?结合您过往的经验,具体阐述您所采取的措施。
第九题题目:请结合您过往的项目管理经验,详细描述一次您在项目实施过程中遇到的最大挑战,以及您是如何应对这个挑战并最终解决问题的。
第十题题目:请您描述一次您在大数据项目管理中遇到的一个挑战,包括挑战的具体情况、您采取的应对措施以及最终的结果。
2025年招聘大数据项目经理面试题与参考回答(某大型央企)面试问答题(总共10个问题)第一题1.项目背景与目标;2.项目团队的组织与分工;3.项目实施过程中的关键控制点及应对策略;4.项目风险管理及应对措施;5.项目成果评估及经验总结。
大数据专员面试题目(3篇)
![大数据专员面试题目(3篇)](https://img.taocdn.com/s3/m/8894873ebf23482fb4daa58da0116c175f0e1ee1.png)
第1篇一、基础知识与概念理解1. 题目:请简述大数据的基本概念及其与普通数据的主要区别。
解析:考察应聘者对大数据基本概念的理解。
应聘者应能够解释大数据的规模(大量、多样、快速)、价值密度低、处理和分析的技术和方法等特点,并说明大数据与普通数据在数据量、处理方式、分析目标等方面的区别。
2. 题目:大数据的五个V指的是什么?解析:考察应聘者对大数据特征的理解。
大数据的五个V分别是Volume(数据量)、Velocity(数据速度)、Variety(数据多样性)、Veracity(数据真实性)和Value(数据价值)。
应聘者应能够解释每个V的具体含义。
3. 题目:请简述Hadoop生态系统中的主要组件及其功能。
解析:考察应聘者对Hadoop生态系统的了解。
应聘者应能够列举Hadoop生态系统中的主要组件,如Hadoop分布式文件系统(HDFS)、Hadoop YARN、Hadoop MapReduce、Hive、Pig、HBase等,并解释每个组件的基本功能和作用。
4. 题目:请简述数据仓库和数据湖的区别。
解析:考察应聘者对数据仓库和数据湖的理解。
应聘者应能够解释数据仓库和数据湖在数据存储、处理、查询等方面的差异,以及它们在数据分析中的应用场景。
二、数据处理与分析5. 题目:请简述ETL(提取、转换、加载)过程在数据处理中的作用。
解析:考察应聘者对ETL过程的了解。
应聘者应能够解释ETL在数据预处理、数据清洗、数据转换等方面的作用,以及ETL工具在数据处理中的应用。
6. 题目:请描述数据切分、增量同步和全量同步的方法。
解析:考察应聘者对数据同步的理解。
应聘者应能够解释数据切分、增量同步和全量同步的概念,并举例说明在实际应用中的具体操作方法。
7. 题目:请简述数据挖掘中的分类、聚类和预测方法。
解析:考察应聘者对数据挖掘方法的了解。
应聘者应能够列举数据挖掘中的分类、聚类和预测方法,如决策树、K-means、支持向量机、神经网络等,并解释每种方法的基本原理和应用场景。
大数据开发工程师招聘面试题与参考回答(某大型集团公司)
![大数据开发工程师招聘面试题与参考回答(某大型集团公司)](https://img.taocdn.com/s3/m/a01e1a4ff08583d049649b6648d7c1c708a10bd9.png)
招聘大数据开发工程师面试题与参考回答(某大型集团公司)(答案在后面)面试问答题(总共10个问题)第一题题目:请简述大数据技术在现代企业中的应用及其对企业竞争力的影响。
第二题问题:您在过往的工作中,是否遇到过数据量极大,导致数据处理和分析效率低下的问题?如果是,您是如何解决这个问题的?第三题题目:请描述一下您在以往项目中使用大数据技术解决过的一个具体问题。
详细说明问题背景、您采用的大数据技术、实施过程以及最终取得的成果。
第四题题目:请解释什么是MapReduce,并描述一个场景,在这个场景中使用MapReduce可以极大地提高数据处理效率。
请同时指出在这个场景中Map和Reduce两个阶段是如何工作的,并说明这样做的优势。
第五题题目:请描述一下您在以往项目中遇到的大数据开发过程中最复杂的技术挑战,以及您是如何解决这个问题的。
第六题题目:请解释什么是MapReduce,并描述一个实际场景,在该场景中使用MapReduce可以有效地处理大数据集。
请同时指出MapReduce模型中的主要步骤,并简要说明每个步骤的作用。
第七题题目:请描述一次您在项目中遇到的大数据处理挑战,包括挑战的具体内容、您是如何分析问题的、以及您最终采取的解决方案和效果。
第八题题目:请解释什么是MapReduce,并且举例说明在一个大数据处理场景中如何使用MapReduce来解决实际问题。
在您的解释中,请务必涵盖MapReduce的主要组成部分及其工作流程。
1.Map(映射)阶段:在这个阶段,原始的大数据集被分成若干个小块分发到不同的节点上。
每个节点上的程序对分配给自己的数据进行处理,产生中间键值对。
这些键值对随后会被排序并且传递到下个阶段。
2.Reduce(规约)阶段:在这个阶段,来自Map阶段的数据被重新组织,使得相同键的所有值都被组合在一起。
接下来,reduce函数会处理这些键对应的多个值,并将它们转化为最终的结果输出。
1.Map阶段:首先,系统将整个购买记录数据集分割成多个片段,并将这些片段发送到不同的Map任务中。
数据分析、大数据岗位常见面试问题
![数据分析、大数据岗位常见面试问题](https://img.taocdn.com/s3/m/3937f4a7aef8941ea76e058a.png)
偏统计理论知识1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率。
C(4,2)*C(50,25)*C(2,2)*C(25,25) / C(54,27)*(C27,27)=(27*13)/(53*17)2.男生点击率增加,女生点击率增加,总体为何减少?•因为男女的点击率可能有较大差异,同时低点击率群体的占比增大。
如原来男性20人,点击1人;女性100人,点击99人,总点击率100/120。
现在男性100人,点击6人;女性20人,点击20人,总点击率26/120。
即那个段子“A系中智商最低的人去读B,同时提高了A系和B系的平均智商。
”3. 参数估计用样本统计量去估计总体的参数4.矩估计和极大似然估计矩估计法:矩估计法的理论依据是大数定律。
矩估计是基于一种简单的“替换”思想,即用样本矩估计总体矩。
矩的理解:在数理统计学中有一类数字特征称为矩。
首先要明确的是我们求得是函数的最大值,因为log是单调递增的,加上log后并不影响的最大值求解。
为何导数为0就是最大值:就是我们目前所知的概率分布函数一般属于指数分布族(exponential family),例如正态分布,泊松分布,伯努利分布等。
所以大部分情况下这些条件是满足的。
但肯定存在那种不符合的情况,只是我们一般比较少遇到。
极大似然估计总结似然函数直接求导一般不太好求,一般得到似然函数L(θ)之后,都是先求它的对数,即ln L(θ),因为ln函数不会改变L的单调性.然后对ln L(θ)求θ的导数,令这个导数等于0,得到驻点.在这一点,似然函数取到最大值,所以叫最大似然估计法.本质原理嘛,因为似然估计是已知结果去求未知参数,对于已经发生的结果(一般是一系列的样本值),既然他会发生,说明在未知参数θ的条件下,这个结果发生的可能性很大,所以最大似然估计求的就是使这个结果发生的可能性最大的那个θ.这个有点后验的意思5. 假设检验参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。
应用大数据面试题目(3篇)
![应用大数据面试题目(3篇)](https://img.taocdn.com/s3/m/03b72478a200a6c30c22590102020740bf1ecd12.png)
第1篇随着大数据技术的飞速发展,越来越多的企业开始重视大数据的应用,并将其作为提升企业竞争力的重要手段。
为了帮助求职者更好地准备应用大数据的面试,以下将提供一系列面试题目,涵盖大数据的核心概念、技术架构、数据处理、分析应用等多个方面。
一、大数据核心概念1. 请简要介绍大数据的五个V(Volume、Velocity、Variety、Veracity、Value)及其对大数据处理的影响。
2. 什么是Hadoop?请列举Hadoop的主要组件及其功能。
3. 解释MapReduce编程模型的工作原理,并说明其在处理大数据时的优势。
4. 什么是数据仓库?请描述数据仓库的基本架构和功能。
5. 什么是数据湖?它与数据仓库有什么区别?二、大数据技术架构1. 请列举大数据技术栈中常用的开源框架,并简要介绍它们的作用。
2. 什么是Spark?请说明Spark的架构和主要特性。
3. 什么是Flink?请描述Flink与Spark的主要区别。
4. 什么是Hive?请介绍Hive的架构和功能。
5. 什么是Kafka?请说明Kafka在数据处理中的作用。
三、数据处理与分析1. 请描述数据清洗的步骤和常见方法。
2. 什么是数据脱敏?请列举几种数据脱敏技术。
3. 什么是数据压缩?请介绍几种常用的数据压缩算法。
4. 什么是数据挖掘?请列举几种常见的数据挖掘算法。
5. 什么是机器学习?请介绍几种常见的机器学习算法。
四、大数据应用场景1. 请举例说明大数据在金融行业的应用场景。
2. 请举例说明大数据在医疗行业的应用场景。
3. 请举例说明大数据在零售行业的应用场景。
4. 请举例说明大数据在交通行业的应用场景。
5. 请举例说明大数据在政府领域的应用场景。
五、大数据项目经验1. 请描述你参与过的最大规模的大数据项目,包括项目背景、目标、技术选型、实施过程和成果。
2. 请描述你在项目中遇到的技术难题及其解决方案。
3. 请描述你在项目中如何进行数据治理和质量管理。
福建大数据集团面试题目
![福建大数据集团面试题目](https://img.taocdn.com/s3/m/5c61de37f56527d3240c844769eae009581ba281.png)
福建大数据集团面试题目福建大数据集团面试题目一、专业知识与技能测试1. 请简要介绍您的专业背景和工作经验。
2. 请解释什么是大数据?大数据的应用场景有哪些?3. 在大数据处理中,如何处理数据的清洗和去重?4. 请简要介绍一下 Hadoop 框架以及它的优缺点。
5. 如何对大数据进行分析和建模?请介绍一种常用的大数据分析方法。
6. 请解释什么是数据挖掘(Data Mining)以及它的应用价值。
7. 运用 Python/Java/R 等编程语言,请编写代码实现对文本进行词频统计。
8. 请解释什么是机器学习(Machine Learning)以及它的应用场景。
9. 请解释什么是深度学习(Deep Learning)以及它与机器学习的区别。
10. 在数据分析中,如何处理缺失值和异常值?11. 请简要介绍一种常用的数据可视化工具,并说明其应用场景。
二、实践能力测试1. 请编写代码实现对一张图片进行边缘检测。
2. 请解释如何对一段音频进行特征提取。
3. 请描述一下大数据平台的架构,包括数据采集、存储、处理和展示等环节。
4. 在大数据平台中,有哪些常用的数据存储方式?请简要介绍各种方式的优缺点。
5. 在大数据处理过程中,如何解决数据的安全性和隐私性问题?6. 请解释什么是数据湖(Data Lake)以及它的优势。
7. 当处理海量数据时,如何提高数据的处理速度和性能?8. 在大数据分析中,有哪些常用的机器学习算法?请简要介绍每种算法适用的场景。
9. 请描述一下使用神经网络进行图像识别的基本流程。
10. 请介绍一种常用的时间序列分析方法,并说明其应用场景。
三、综合能力测试1. 在实际工作中,您是如何提高数据分析的效率和质量的?2. 请举例说明一次您成功解决某个复杂数据问题的经历。
3. 在面对大量数据时,您是如何进行有效的数据筛选和处理的?4. 在团队协作中,您是如何担任领导角色并推动项目顺利进行的?5. 在面对高压工作和紧急情况时,您是如何保持冷静并做出正确的决策的?6. 请解释一下数据驱动的决策(Data-Driven Decision Making)以及它的优势。
数据主管面试题目(3篇)
![数据主管面试题目(3篇)](https://img.taocdn.com/s3/m/09661579fe00bed5b9f3f90f76c66137ef064f71.png)
第1篇1. 请您简单介绍一下自己,包括您的教育背景、工作经历以及您在数据领域的研究方向。
2. 您在数据领域有哪些专业特长?您认为自己在数据行业有哪些优势?3. 您对未来的职业发展有何规划?您希望在数据领域达到什么样的成就?二、数据管理与分析1. 请简要描述您对数据管理的理解,包括数据采集、存储、处理、分析和应用等方面。
2. 您如何保证数据质量?请举例说明您在数据清洗、去重、去噪等方面的经验。
3. 请谈谈您在数据分析方面的经验,包括常用的数据分析方法和工具。
4. 您如何处理大规模数据集?请举例说明您在处理海量数据时的经验和技巧。
5. 请谈谈您在数据可视化方面的经验,包括常用的可视化工具和技巧。
三、数据挖掘与机器学习1. 请简要介绍数据挖掘的基本概念和常用算法。
2. 您在机器学习方面有哪些经验?请举例说明您在特征工程、模型选择、模型调优等方面的经验。
3. 您如何评估机器学习模型的性能?请谈谈您在模型评估方面的经验和技巧。
4. 请谈谈您在深度学习方面的经验,包括神经网络结构、训练方法和应用场景。
5. 您如何处理过拟合和欠拟合问题?请举例说明您在模型正则化、交叉验证等方面的经验。
四、大数据技术与架构1. 请简要介绍大数据技术的基本概念和常用技术架构。
2. 您在分布式系统设计方面有哪些经验?请举例说明您在数据分区、负载均衡、容错机制等方面的经验。
3. 您对Hadoop、Spark等大数据平台有哪些了解?请谈谈您在这些平台上的应用经验。
4. 请谈谈您在数据仓库设计方面的经验,包括数据模型、ETL过程、数据仓库优化等方面。
5. 您如何处理实时数据流?请举例说明您在实时数据处理、流计算等方面的经验。
五、数据安全与隐私保护1. 请谈谈您对数据安全与隐私保护的理解,包括数据加密、访问控制、审计等方面。
2. 您在处理敏感数据时有哪些经验?请举例说明您在数据脱敏、数据脱库等方面的经验。
3. 您如何应对数据泄露风险?请谈谈您在数据安全防护、安全意识培训等方面的经验。
大数据工程师面试题及答案
![大数据工程师面试题及答案](https://img.taocdn.com/s3/m/da5e7d6a11661ed9ad51f01dc281e53a5802519d.png)
大数据工程师面试题及答案在当今数字化时代,大数据工程师成为了热门职业之一。
为了帮助求职者更好地准备面试,以下是一些常见的大数据工程师面试题及答案。
一、基础知识1、什么是大数据?答:大数据是指无法在一定时间内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
2、列举一些常见的大数据处理框架。
答:常见的大数据处理框架包括Hadoop、Spark、Flink、Kafka 等。
Hadoop 是一个分布式系统基础架构,用于大规模数据存储和处理;Spark 是一个快速通用的大数据计算引擎;Flink 是一个分布式流处理框架;Kafka 是一种高吞吐量的分布式发布订阅消息系统。
3、解释 Hadoop 的核心组件。
答:Hadoop 的核心组件包括 HDFS(Hadoop 分布式文件系统)、MapReduce(分布式计算框架)和 YARN(资源管理框架)。
HDFS 用于存储大规模数据,具有高容错性和可扩展性;MapReduce 用于大规模数据的并行处理;YARN 负责管理集群资源的分配和调度。
二、数据存储1、介绍一下 HBase 的特点和适用场景。
答:HBase 是一个基于 Hadoop 的分布式列式数据库,具有高可靠性、高性能、可扩展性强等特点。
适用于需要随机读写、海量数据存储和实时查询的场景,比如物联网数据、用户行为数据等。
2、对比 Hive 和 MySQL 的区别。
答:Hive 是基于 Hadoop 的数据仓库工具,适合处理大规模数据的批处理操作,查询延迟较高;MySQL 是传统的关系型数据库,适用于事务处理和对实时性要求较高的查询操作。
Hive 数据存储在HDFS 上,而 MySQL 数据通常存储在本地磁盘。
3、什么是数据分区?为什么要进行数据分区?答:数据分区是将数据按照一定的规则划分成多个区域存储的技术。
这样做可以提高数据查询和处理的效率,减少数据扫描的范围,便于数据管理和维护。
大数据工程师常见面试题
![大数据工程师常见面试题](https://img.taocdn.com/s3/m/7915a366590216fc700abb68a98271fe910eafa0.png)
大数据工程师常见面试题在当今数字化的时代,大数据工程师成为了热门职业之一。
当你准备应聘大数据工程师的岗位时,了解常见的面试题可以帮助你更好地应对面试,展现自己的专业能力。
以下是一些大数据工程师常见的面试题:一、基础理论知识1、什么是大数据?大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
2、请简要介绍 Hadoop 生态系统。
Hadoop 生态系统是一系列用于处理大数据的开源框架和工具的集合。
其中包括HDFS(Hadoop 分布式文件系统)用于存储大规模数据,YARN(Yet Another Resource Negotiator)用于资源管理和调度,MapReduce 用于分布式计算等。
此外,还有 Hive 用于数据仓库和查询处理,HBase 用于大规模的分布式数据库,Sqoop 用于在关系型数据库和 Hadoop 之间进行数据迁移等。
3、解释一下 CAP 定理。
CAP 定理指出,在一个分布式系统中,一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三个特性最多只能同时满足其中两个。
一致性指的是在分布式系统中,所有节点在同一时刻看到的数据是相同的;可用性指的是系统能够在正常响应时间内提供服务;分区容错性指的是系统在遇到网络分区等故障时仍能继续工作。
4、什么是数据仓库和数据集市?数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
数据集市则是数据仓库的一个子集,通常面向特定的业务部门或主题,规模较小,更专注于满足特定用户的需求。
二、数据处理与分析1、谈谈你对数据清洗的理解以及常见的数据清洗方法。
数据清洗是指处理和纠正数据中的错误、缺失值、重复值和不一致性等问题,以提高数据质量。
数据运营经理岗位面试题及答案(经典版)
![数据运营经理岗位面试题及答案(经典版)](https://img.taocdn.com/s3/m/07be4813f11dc281e53a580216fc700abb6852f8.png)
数据运营经理岗位面试题及答案1.请简要介绍一下您的数据运营经理背景和经验。
回答:我有超过10年的数据运营经验,曾在ABC公司担任数据运营经理一职,负责数据分析、报告生成和数据策略的制定。
我领导了一个团队,成功推动了数据驱动决策的文化,并在提高收入、减少成本等方面取得了卓越的成绩。
2.数据运营在公司中的角色是什么?回答:数据运营在公司中的角色是收集、分析和解释数据,以帮助企业做出更明智的决策。
我们负责确保数据的准确性、可用性和安全性,并将其转化为洞察,以支持业务目标的实现。
3.请举例说明您如何建立和维护数据质量标准?回答:我会确保数据来源的质量,采取数据清洗和去重措施。
使用数据验证工具,制定数据入库规则,监控异常值,并定期进行数据审计,以保持数据的高质量。
4.您如何制定数据分析策略,以满足公司的战略目标?回答:首先,我会与业务部门密切合作,了解他们的目标和需求。
然后,我会确定需要的数据类型和来源,并制定分析计划,以解决关键问题,支持决策制定。
我会跟踪指标,确保策略的有效性。
5.请描述一次您成功推动公司实施数据驱动决策的经验。
回答:在ABC公司,我建立了一个全新的数据仓库,使数据更容易访问和理解。
我们还培训了员工,使他们能够自主进行数据分析,并为他们提供了可视化工具。
这导致了更快速的决策制定和更好的绩效。
6.您如何管理大规模数据集?请提供一些示例。
回答:我会使用大数据技术,如Hadoop和Spark,来处理大规模数据集。
例如,在ABC公司,我们处理了每日数百万个交易记录,使用分布式计算来加速数据处理,确保及时的分析和报告生成。
7.如何评估数据运营团队的绩效?回答:我会制定关键绩效指标(KPIs),如数据准确性、分析速度和对业务的影响。
我还会定期进行团队评估和回顾,以确保团队在持续改进中。
8.请描述一次您处理数据安全性问题的经验。
回答:在XYZ公司,我建立了数据安全策略,包括数据加密、访问控制和监控。
数据专员的面试题目(3篇)
![数据专员的面试题目(3篇)](https://img.taocdn.com/s3/m/4dd68a21b207e87101f69e3143323968001cf40a.png)
第1篇一、基础知识部分1. 请简要介绍数据专员的工作职责和日常工作内容。
2. 数据专员在数据处理过程中,需要掌握哪些基本技能?3. 什么是数据清洗?请列举至少三种数据清洗的方法。
4. 什么是数据挖掘?请简述数据挖掘的基本步骤。
5. 请解释什么是数据仓库,以及数据仓库的主要作用。
6. 请简述大数据与云计算的关系,以及它们在数据管理中的应用。
7. 请说明什么是数据可视化,以及数据可视化在数据分析中的作用。
8. 什么是数据治理?请列举数据治理的几个关键点。
9. 请简述数据安全的基本原则,以及如何确保数据安全。
10. 请解释什么是数据质量,以及如何评估数据质量。
二、SQL编程部分1. 请使用SQL语句查询“员工表”中年龄大于30岁的男性员工的姓名和职位。
2. 请使用SQL语句查询“销售表”中,销售金额最高的前5名产品及其销售金额。
3. 请使用SQL语句查询“客户表”中,客户所在城市为“北京”的客户数量。
4. 请使用SQL语句查询“订单表”中,订单日期为“2023-11-01”的订单详情。
5. 请使用SQL语句查询“员工表”中,部门名称为“财务部”的员工姓名和邮箱。
6. 请使用SQL语句查询“销售表”中,每个销售人员的销售总额和销售数量。
7. 请使用SQL语句查询“客户表”中,客户名称包含“科技”的客户所在城市。
8. 请使用SQL语句查询“订单表”中,订单日期在“2023-01-01”到“2023-12-31”之间的订单详情。
9. 请使用SQL语句查询“员工表”中,职位为“经理”的员工姓名、年龄和所在部门。
10. 请使用SQL语句查询“销售表”中,销售金额最高的前10名产品及其销售员姓名。
三、数据分析与统计部分1. 请简述如何通过数据分析发现业务问题。
2. 请解释什么是相关性分析,以及如何进行相关性分析。
3. 请简述如何通过数据分析进行客户细分。
4. 请解释什么是时间序列分析,以及时间序列分析在数据分析中的应用。
数据专员面试题目(3篇)
![数据专员面试题目(3篇)](https://img.taocdn.com/s3/m/dc6864fa50e79b89680203d8ce2f0066f53364d3.png)
第1篇一、基础知识部分1. 题目:请简述数据专员在日常工作中需要掌握的数据处理工具和技术。
解析:此题考察应聘者对数据处理工具和技术的了解程度。
应聘者应能够列举出至少三种数据处理工具(如Excel、SQL、Python等)及其基本功能,并简要说明其在数据分析和处理中的应用。
2. 题目:什么是数据清洗?请列举三种常见的数据清洗方法。
解析:此题考察应聘者对数据清洗概念的理解和实际操作能力。
数据清洗是指对原始数据进行预处理,消除数据中的错误、缺失和不一致等问题。
应聘者应能够列举出至少三种数据清洗方法,如删除重复数据、填补缺失值、处理异常值等。
3. 题目:简述数据可视化在数据分析中的作用。
解析:此题考察应聘者对数据可视化概念的理解。
数据可视化是将数据以图形、图像等形式呈现,有助于人们更好地理解数据背后的信息。
应聘者应能够说明数据可视化在数据分析中的作用,如直观展示数据趋势、发现数据规律、辅助决策等。
4. 题目:什么是数据挖掘?请列举三种常用的数据挖掘方法。
解析:此题考察应聘者对数据挖掘概念的理解。
数据挖掘是指从大量数据中提取有价值的信息和知识的过程。
应聘者应能够列举出至少三种常用的数据挖掘方法,如分类、聚类、关联规则挖掘等。
5. 题目:什么是数据仓库?请简述其作用。
解析:此题考察应聘者对数据仓库概念的理解。
数据仓库是一个集中存储和管理企业数据的系统,用于支持数据分析和决策。
应聘者应能够说明数据仓库的作用,如数据整合、数据质量管理、数据挖掘等。
二、实际应用部分1. 题目:请结合实际案例,阐述数据专员在数据采集、数据清洗、数据分析、数据可视化和数据挖掘等方面的具体工作内容。
解析:此题考察应聘者对数据专员实际工作内容的了解。
应聘者应结合自身经验或实际案例,详细描述在数据采集、数据清洗、数据分析、数据可视化和数据挖掘等方面的具体工作内容,如数据来源、数据清洗方法、数据分析工具、可视化方法等。
2. 题目:假设您所在的公司需要分析用户购买行为,请您提出一个数据分析方案,并简要说明您将使用哪些工具和技术。
大数据与会计专业的面试稿自我介绍
![大数据与会计专业的面试稿自我介绍](https://img.taocdn.com/s3/m/216a412b1611cc7931b765ce050876323112749f.png)
大数据与会计专业的面试稿自我介绍下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!1. 引言您好,我是XXX,很高兴有机会在这里向您介绍我自己。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6个公司的大数据岗位的面试经验本人住在有人间天堂之称的城市,6年多开发经验,最近2年主要在做大数据相关的开发,最近考虑换工作,基本也只考虑大数据相关岗位。
作者:雪姬来源:36大数据|2016-11-10 09:26收藏分享本人住在有人间天堂之称的城市,6年多开发经验,最近2年主要在做大数据相关的开发,最近考虑换工作,基本也只考虑大数据相关岗位。
目前新工作已经找好,但想分享一下最近面试的失败一些经历(成功的那些就不讲了),吐槽吐槽,跟广大吃瓜群众分享一下过程中的经历心得,我的语文体育老师教的,还请大家莫怪。
1.公司:国内知名电信运营商,其下面的大数据研究院,面两轮一面:技术人员面,先自我介绍,项目经验相关介绍,问比较细,问了一些Hadoop、HBase的问题,JAVA基础,JVM 内存分配小于32G原因,G1和CMS对比,问关系型数据库事务级别,脏读、幻读意思。
问题回答情况:其中G1与CMS区别我只讲了G1比CMS更耗CPU,但回收更快效果更好,两者内存划分设计不同,G1更适合大内存等,具体原因及细节没讲清;脏读、幻读只回答出跟数据库事务有关,面试当时忘记了具体什么叫脏读,什么叫幻读,有点分不清。
这两个好像都没有答好,然后面试官问了我待遇期望。
二面:隔了4天,打电话过来让我去二面,是部门经理面,其也是做技术的。
上来让我自我介绍,然后就围绕我讲的开始问。
讲到之前项目中通过hbase的coprocessor的endpoint方式在服务端通过jni调用c++写的算法库实现数据计算过滤功能,然后这位经理就问为什么你们图像识别相关的CV算法不用JAVA写,要用C++?我感觉有点懵逼,惊叹怎么会有这么小白的问题,但面上不能表现出来,简单回答说现在大部分算法都是通过C/C++写的,JAVA因为JAVA是完全面向对象的特性及jvm的关系,不适合做这么底层的事情,性能会有损耗。
但似乎对方没有理解和听懂,表情带着不理解和质疑,半天从他嘴里吐出一个结论:你们不用JAVA写算法是因为你们公司搞算法那帮人只用C/C++去搞。
我当时有点无语,不知道该怎么跟这种对CV算法一无所知的人解释(或许我该说很多算法库都是C/C++写的,让你用JAVA调用cuda的库你累不累),但对方又接着问下一个问题,你怎么看待大数据领域接下来的发展趋势?这个问题我从来也没想过,脑袋里突然冒出前阵子参加的云栖大会有个分会上讲得一些片段,糊里糊涂的瞎说了几句,说spark很热,使用的人非常多,后续也会集成流处理技术的一些新特性,另外说现在很多集群完全部署在云上,将来网络瓶颈解决有可能会往云上和云下自己管理的集群结合的这种方式发展。
这个答得的确不好,有点以偏概全了,对方显然对我这个回答很不满意,又问你认为磁盘IO性能会是瓶颈吗?我回复说这个是目前大数据领域集群的主要瓶颈,但这个问题还好,应该会被克服改善(我想说可以把冷、热数据分离,热数据用速度快的SSD之类存储,但我没说出来)。
对方的目光有点嘲弄的感觉,不是很友好,后来就是问一些期望待遇及让我提问之类的环节。
结果:over,好吧,无所谓了,安慰自己,本来就不是很想去那边,因为自己偏实干型怕活太少(有点自虐),大概了解到的是对方的员工都过得偏安逸。
2.公司:某跨境电商企业,为一些国家和地区的特色产品做电商服务。
先跟他们HR聊,HR人不错,说话比较客气礼貌。
接着是技术面,一共4个面试官,分4轮面。
第1个哥们人挺逗,先让我自我介绍,看我简历上写着对CV相关算法有一定了解,好像跑了题似开始不断问我CV相关问题,我跟他说我工作早几年自己研究过一段时间这方面的东西,但不是很擅长,很长时间也没研究了,只是相比没接触过这方面的人来说要厉害一些,我也没有研究过Spark MLLib。
不知道他哪根筋不对,问我你们公司深度学习相关的程序你有没有研究过,我说没,他又问我通常图像识别的一些流程,我大概说了一下,说得不是很细,他不停的惋惜的说道,哎呀,你这相比其他人没有特别的优势呀,你要是精通算法这方面再加上大数据就有亮点。
我非常纳闷,心想难道你们公司是传说中人工智能和大数据结合的非常好的公司吗,莫非还是把无监督机器学习自我优化集成到你们的大数据系统中了吗?不应该呀,看你们的样子好像还没有那么NB,再说现在搞大数据的有几个会深度学习算法的,大多还是偏框架数据采集存储挖掘方面的。
第2个哥们,是搞大数据相关的,不过他基本不像是在面试我,反而是在跟我吐槽他们公司,说自己也是刚来了3个月,公司哪里流程不对,自己意愿无法左右其他团队等,不过就简单跟我说了这么一通就完了。
第3个哥们,具体是负责哪方面技术不是很清楚,感觉有点偏算法,就问了我一个题目,像是脑筋急转弯的编程题,题目是N个人围成一圈,从第1个人开始报数,第一个人报1,第二个人报2,依次下去,报到数字X的人退出圈子,下面的人继续报,请写个程序问最后留下的哪个人。
我说这好像有一个便捷的方法或公式能计算最后一个人,不过我脑子想不出来,只能想一个简单的递归函数去实现,他说行,然后我就写了一个,写得马马虎虎。
第4个,是他们CTO面,这人阴沉板着一副脸,还没说话就感觉气氛不对,估计他觉得我看着比较年轻竟敢要那么高薪水,这种人的表情我也没少见。
语气有点冷,先让我自我介绍,我介绍的比较简单,然后又说了一些项目中的情况,产品数据流之类的。
我们的产品的数据源是从ORACLE数据库里面定时去拿的,这个模块叫数据获取服务,流程很简单,就是定时读取数据后交给另一个模块,然后他说问怎么把这个数据获取服务拆分成两个模块,我很无语,说这个就是这么简单的去拿数据,没有可以再拆分的,他说就是要拆分成2个模块,我表示不知道他脑袋里怎么想的,说不知道。
然后问了我做的一些架构经验,我说自己设计写过过一个分布式实时计算框架,是借助了一个RPC中间件去实现的,整体各模块有点类似Hadoop MapReduce,但更像Impala,不需要每次创建启动Job。
我跟他简单说了一下这个RPC中间件,说了一些优缺点,例如它的消息发布订阅机制没有像Kafka那样有很好的持久化机制,程序退出了,这些消息就没了。
他一脸的质疑,说怎么可能没有持久化,他问我那个中间件的名字,然后百度去搜,搜出来某个帖子上有人说的那个中间件的一些特性,讲到一个模块是专门做持久化的,然后他就拿来阴沉着脸质疑我说,你看,这不是持久化吗?我看他那样表情,不想再多解释什么,想说艹尼玛,有点常识好不,那帖子讲得完全不是一个东西,那个持久化不是指消息发布订阅的持久化,这中间件我好歹也用了小半年,你这么百度一搜就敢理直气壮质疑我,这水平真是CTO?结果:他们HR后来还打电话问我跟CTO聊完感觉怎么样,我感觉自己脾气太好了,没有抨击一下那个CTO,就说他不太清楚我做的东西。
HR把我的期望压得很低问我愿不愿意去,我直接说不去了。
见过这么奇葩的CTO,就算加薪让我去,我还得重新考虑。
3.公司:某视频监控安防行业的知名公司,面试其下的大数据研究院的一个大数据开发岗位。
面试我的是他们的一个技术主管和另外一个技术人员,上来先自我介绍,详细问了一些项目相关的信息,然后问了很多Hadoop、HBase的一些原理,项目中rowkey和分区设计,问了spark streaming 并发度、createDirectStream和createDStream 的区别,一段时间内分别生成了几个RDD,问了Kafka分区各副本是如何在集群各台机器上分布的等。
有好几个问题没回答清楚,感觉自己表现和准备不是很好。
结果:等通知。
后来隔了好多天通知我去HR面,鉴于我当时已经收到其他offer,而且面试情况不是很好,估计会被压offer,就委婉放弃了。
4.公司:国内知名互联网公司,Hadoop研发工程师岗位。
电话面试:面试了25分钟左右,问了很多大数据的基础的技术问题。
如Map Reduce相关,Reduce时如何Sort,HBase 优缺点,LSM相关,前面基本上全部答出来了,但是最后问到有没有做过用Map Reduce处理数据join,因为我之前做的项目大数据框架比较简单,没有多表关联的查询,当时对join概念也有点反应不过来,就说没做过,然后又问Map Reduce join有几种方式,也没答出来。
结果:电面没过,就因为最后两个跟join有关的没答出来,就over了,尽管回去后恶补了这方面的知识。
5.公司:某做数据营销广告大数据服务的公司,大数据研发岗位。
面试我是的他们做大数据架构团队的主管,先自我介绍,讲了一些项目的东西,然后对方觉得我之前做得项目大数据架构比较简单,态度比较桀骜,然后又问了一些JAVA基础的东西,比如BIO与NIO特点与区别,问我有没有用过,我答得不是很好,但应该还过得去,然后又问Concurrent包下面有哪些类,ConcurrentHashMap与HashMap区别等等。
我感觉他有点轻视我,不是一个公正的眼光在问我。
然后又问我Linux命令熟不熟,吧唧吧唧问了好一些,我基本都答出来了。
最后他冒出一句,我们现在这边大数据开发的岗位都基本招满了,还缺一个大数据运维的,除了部署维护大数据集群,还要写一下oracle的udf。
我问他这跟开发工作关系密切吗,他说关系非常密切,只是他们大数据的研发都偏向于写代码,不愿干这活。
感情他是在逗我,QTMD。
结果:然后就没有然后了。
6.公司:某车贷互联网金融公司,大数据研发岗位。
先是电话面试:面试了25分钟左右,问了Hadoop Map Reduce资源配置、ElasticSearch原理的一些问题,问得比较简单,基本都没问题,问道Lucence如何实现对一个字段索引的时候,其实只要答倒排索引就好了,我比较二,把倒排索引怎么实现的大概讲了一下,细节还讲得不是很好。
过了几天,然后是直接面试,这次面的内容还是比较简单,面试官人感觉不错,就是有点二,怎么说呢,理解能力不太好,比如问我HBase 不同colomn family跟关系型数据库中的列的区别,我答说colomn family在物理上是独立的store file,可以只查询某个column faimily,而关系型数据库一条记录是整行数据,查询的时候,需要整行数据都读出来,然后吧唧吧唧又扯出好多。
结果你猜怎么着,他说我还是没有回答到点上,说column family是面向列的。
我有点无语,我都把它怎么是面向列的底层存储结构都讲出来了,你竟然还说我没答出来。
问了很多问题都基本答出来了,就是面试官总觉得我没有答到点上,说自己貌似明白我的意思了,问我是不是平常很少沟通问题。
这种人真是活久见,明明一个意思,我答得更详细清楚,他非说我没答出那个标准答案名称,面试这么多次,这种情况真是第一次碰到。