基于hadoop的分布式存储平台的搭建与验证

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

毕业设计（论文）
中文题目:基于hadoop的分布式存储平台的搭建与验证
英文题目:Setuping and verification distributed storage platform based on hadoop
学院：计算机与信息技术
专业：信息安全
学生姓名：
学号：
指导教师：
2018 年06 月01 日
1
任务书
题目：基于hadoop的分布式文件系统的实现与验证
适合专业：信息安全
指导教师（签名）：
毕业设计（论文）基本内容和要求：
本项目的目的是要在单独的一台计算机上实现Hadoop多节点分布式计算系统。

基本原理及基本要求如下：
1.实现一个NameNode
NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。

它负责管理文件系统名称空间和控制外部客户机的访问。

NameNode 决定是否将文件映射到 DataNode 上的复制块上。

实际的 I/O 事务并没有经过 NameNode，只有表示 DataNode 和块的文件映射的元数据经过 NameNode。

当外部客户机发送请求要求创建文件时，NameNode 会以块标识和该块的第一个副本的 DataNode IP 地址作为响应。

这个 NameNode 还会通知其他将要接收该块的副本的 DataNode。

2。

实现若干个DataNode
DataNode 也是一个通常在 HDFS 实例中的单独机器上运行的软件。

Hadoop 集群包含一个 NameNode 和大量 DataNode。

DataNode 通常以机架的形式组织，机架通过一个交换机将所有系统连接起来。

Hadoop 的一个假设是：机架内部节点之间的传输速度快于机架间节点的传输速度。

DataNode 响应来自 HDFS 客户机的读写请求。

它们还响应来自NameNode 的创建、删除和复制块的命令。

NameNode 依赖来自每个DataNode 的定期心跳（heartbeat）消息。

每条消息都包含一个块报告，NameNode 可以根据这个报告验证块映射和其他文件系统元数据。

如果DataNode 不能发送心跳消息，NameNode 将采取修复措施，重新复制在该节点上丢失的块。

具体设计模块如下：。