简述mapreduce的工作过程
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简述mapreduce的工作过程
简述MapReduce的工作过程
MapReduce是一种用于编程模型,用于解决在数据集中对数据进行处理和可视化的问题,并且可以利用大量的处理机进行并行处理。
MapReduce的工作过程主要包括以下几个步骤:
1. 对输入数据进行分片:首先,将输入数据集分割成多个小块,并把它们分发到多个节点上;
2. 执行Map函数:每个节点执行Map函数,把数据集中的每个
小块映射到一个中间的键/值对;
3. 执行Shuffle函数:将中间的键/值对按照相同的键进行分组,然后把它们分发到不同的节点上;
4. 执行Reduce函数:每个节点接收一组相同的键/值对,然后
执行Reduce函数,把它们转换成一个输出结果。
最后,MapReduce把所有节点上计算的结果进行汇总,输出最终的结果。
- 1 -。