分布式文件系统Hadoop HDFS与传统文件系统Linux FS的比较与分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6苏州大学学报(工科版)第30卷
图1I-IDFS架构
2HDFS与LinuxFS比较
HDFS的节点不管是DataNode还是NameNode都运行在Linux上,HDFS的每次读/写操作都要通过LinuxFS的读/写操作来完成,从这个角度来看,LinuxPS是HDFS的底层文件系统。
2.1目录树(DirectoryTree)
两种文件系统都选择“树”来组织文件,我们称之为目录树。文件存储在“树叶”,其余的节点都是目录。但两者细节结构存在区别,如图2与图3所示。
一二
Root
\
图2ItDFS目录树围3LinuxFS目录树
2.2数据块(Block)
Block是LinuxFS读/写操作的最小单元,大小相等。典型的LinuxFSBlock大小为4MB,Block与DataN-ode之间的对应关系是固定的、天然存在的,不需要系统定义。
HDFS读/写操作的最小单元也称为Block,大小可以由用户定义,默认值是64MB。Block与DataNode的对应关系是动态的,需要系统进行描述、管理。整个集群来看,每个Block存在至少三个内容一样的备份,且一定存放在不同的计算机上。
2.3索引节点(INode)
LinuxFS中的每个文件及目录都由一个INode代表,INode中定义一组外存上的Block。
HDPS中INode是目录树的单元,HDFS的目录树正是在INode的集合之上生成的。INode分为两类,一类INode代表文件,指向一组Block,没有子INode,是目录树的叶节点;另一类INode代表目录,没有Block,指向一组子INode,作为索引节点。在Hadoop0.16.0之前,只有一类INode,每个INode都指向Block和子IN-ode,比现有的INode占用更多的内存空间。
2.4目录项(Dentry)
Dentry是LinuxFS的核心数据结构,通过指向父Den姆和子Dentry生成目录树,同时也记录了文件名并
指向INode,事实上是建立了<FileName,INode>,目录树中同一个INode可以有多个这样的映射,这正是连
分布式文件系统Hadoop HDFS与传统文件系统Linux FS的比较
与分析
作者:许春玲, 张广泉, Xu ChunLing, Zhang Guangquan
作者单位:许春玲,Xu ChunLing(苏州大学计算机科学与技术学院,江苏,苏州,215006), 张广泉,Zhang Guangquan(苏州大学计算机科学与技术学院,江苏,苏州,215006;中国科学院软件研究所计算
机科学国家重点实验室,北京,100080)
刊名:
苏州大学学报(工科版)
英文刊名:JOURNAL OF SUZHOU UNIVERSITY(ENGINEERING SCIENCE EDITION)
年,卷(期):2010,30(4)
1.John Howard.Michael Kazar.Sherri Menees Scale and performance in a distributed file system 1988(1)
2.Luiz A Barroso.Jeffrey Dean.Urs H¨olzle Web search for a planet:the Google cluster architecture 2003(2)
本文链接:/Periodical_szscgxyxb201004002.aspx