基于hadoop的分布式存储平台的搭建与验证

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

毕业设计(论文)
中文题目:基于hadoop的分布式存储平台的搭建与验证
英文题目:Setuping and verification distributed storage platform based on hadoop
学院:计算机与信息技术
专业:信息安全
学生姓名:
学号:
指导教师:
2018 年06 月01 日
1
任务书
题目:基于hadoop的分布式文件系统的实现与验证
适合专业:信息安全
指导教师(签名):
毕业设计(论文)基本内容和要求:
本项目的目的是要在单独的一台计算机上实现Hadoop多节点分布式计算系统。

基本原理及基本要求如下:
1.实现一个NameNode
NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。

它负责管理文件系统名称空间和控制外部客户机的访问。

NameNode 决定是否将文件映射到 DataNode 上的复制块上。

实际的 I/O 事务并没有经过 NameNode,只有表示 DataNode 和块的文件映射的元数据经过 NameNode。

当外部客户机发送请求要求创建文件时,NameNode 会以块标识和该块的第一个副本的 DataNode IP 地址作为响应。

这个 NameNode 还会通知其他将要接收该块的副本的 DataNode。

2。

实现若干个DataNode
DataNode 也是一个通常在 HDFS 实例中的单独机器上运行的软件。

Hadoop 集群包含一个 NameNode 和大量 DataNode。

DataNode 通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。

Hadoop 的一个假设是:机架内部节点之间的传输速度快于机架间节点的传输速度。

DataNode 响应来自 HDFS 客户机的读写请求。

它们还响应来自NameNode 的创建、删除和复制块的命令。

NameNode 依赖来自每个DataNode 的定期心跳(heartbeat)消息。

每条消息都包含一个块报告,NameNode 可以根据这个报告验证块映射和其他文件系统元数据。

如果DataNode 不能发送心跳消息,NameNode 将采取修复措施,重新复制在该节点上丢失的块。

具体设计模块如下:。

相关文档
最新文档