基于hadoop的分布式存储平台的搭建与验证
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
毕业设计(论文)
中文题目:基于hadoop的分布式存储平台的搭建与验证
英文题目:Setuping and verification distributed storage platform based on hadoop
学院:计算机与信息技术
专业:信息安全
学生姓名:
学号:
指导教师:
2018 年06 月01 日
1
任务书
题目:基于hadoop的分布式文件系统的实现与验证
适合专业:信息安全
指导教师(签名):
毕业设计(论文)基本内容和要求:
本项目的目的是要在单独的一台计算机上实现Hadoop多节点分布式计算系统。
基本原理及基本要求如下:
1.实现一个NameNode
NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。
它负责管理文件系统名称空间和控制外部客户机的访问。
NameNode 决定是否将文件映射到 DataNode 上的复制块上。
实际的 I/O 事务并没有经过 NameNode,只有表示 DataNode 和块的文件映射的元数据经过 NameNode。
当外部客户机发送请求要求创建文件时,NameNode 会以块标识和该块的第一个副本的 DataNode IP 地址作为响应。
这个 NameNode 还会通知其他将要接收该块的副本的 DataNode。
2。
实现若干个DataNode
DataNode 也是一个通常在 HDFS 实例中的单独机器上运行的软件。
Hadoop 集群包含一个 NameNode 和大量 DataNode。
DataNode 通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。
Hadoop 的一个假设是:机架内部节点之间的传输速度快于机架间节点的传输速度。
DataNode 响应来自 HDFS 客户机的读写请求。
它们还响应来自NameNode 的创建、删除和复制块的命令。
NameNode 依赖来自每个DataNode 的定期心跳(heartbeat)消息。
每条消息都包含一个块报告,NameNode 可以根据这个报告验证块映射和其他文件系统元数据。
如果DataNode 不能发送心跳消息,NameNode 将采取修复措施,重新复制在该节点上丢失的块。
具体设计模块如下:。