基于Hadoop平台的搭建及应用研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Na me n o d e Da t a n o d e
Da t a n o d e
集群 中各 结点需要通过密码进行登陆 , 这 给访 问数据和传
递信 息 带来 了不 便 。 因此, 需要配置 S S H 无 密码 验 证 的设 置 , 释 放各 结 点对 文 件 的控 制 权 限 。 ( 1 ) 在终端生成密钥。
: 堕 …鱼 一 皇…照
UJl AN C OM PUTER
D O I : 1 0 . 1 6 7 0 7  ̄ . c n k i . f j p c . 2 0 1 7 . 0 3 . 0 7 1
基于 H a d o o p平 台的搭建及应用研究
李 晓佳 ,董延华
( 吉林 师范大学计算机学院 吉林 四平 1 3 6 0 0 0 )
的硬 件 平 台等 优 化 方 面 具 有 十 分 重 要 的 意 义 。 1 、 Ha d o o p平 台 结构
h o s t n a m e
S l a v e结 点 的设 置 参 照 以上 设 置 即 可 。 ( 2 ) 网络 环 境 具体 文本 内容 配 置 如 下 :
g e d i t/ e t e / h o s t s 1 9 2 . 1 6 8 . 0 . 1 0 0 1 9 2 . 1 6 8 . 0 . 1 0 1 1 9 2 . 1 6 8 . 0 . 1 0 2 ma s t e r s l a v e l s l a v e 2
#查看修改结果
H a d o o p的 实 现 依 靠 分 布 式 文件 系 统 HD F S和 Ha d o o p — Ma p R e d u c e两个组件。 HD F S有着较高 的容错性特 点,可 以将 平台设计在廉价的 硬件集群 上, 并且 可 以保证提供高吞吐量 的数据访 问。它采用 主从 结构设计 ,集 群中主要 由名字结 点 N a m e n o d e和数据结点
是实验顺利进行的重要保障。
Ma p R e d u c e 是 H a d o o p平 台的最核心组件 ,将数 据集 的大 规模操作划分为 多个数 据块 , 通过主 结点分发给 网络上 的每个 结点 , 每个数据 块 即为一个待 处理信 息, 并 自动调度 计算结 点
来 处 理相 应 的 数据 信 息 。 2 、 H a d o o p集 群 的搭 建
【 摘 要】 本文针对 Ha d o o p平 台的结构和特 点 , 介 绍 了 Ha d o o p集群 的搭 建过 程 , 采用 V mwa r e 虚拟化 方法通过合 理 配置建立虚拟硬件 资源支持上 的 L i n u x虚拟 结点集群 , 通过 结点网络 的配置实现 各结点间的无密码通信 , 并在该平 台
上 实现 数 据 的采 集应 用 , 从 而验 证 了 Ha d o o p平 台 的可 行 性 。
【 关键词 】 H a d o o p集群 ; 虚拟化 ; 无 密码通信
引 言 H O S T N AM E = m a s t e r #主机 名
H a d o o p是一个 能够对 大量数据进 行分布式处 理的软件框
1 所示。
表 1 结点参数设置
保存退 出。
操作系统 结点用途
Ce n t OS 6 Ce n t OS 6
Ce n t OS 6
主机名
Ma s t e r S l a v e 1
S l a v e 2
I P 地址
1 92 . 1 68 . 0. 1 0 0 1 92 . 1 6 8 . 0. 1 0 1
e t h 0 , 配置 I P A D D R参数, 并 将 HWAD D R修改成原 m a c 地 址 并
t h O相 关 行 注释 。 由于 H a d o o p采取主从结 点的架 构, 集群 的搭建过程 中, 配 e
置一 台主 结点 Ma s t e r , 两 台从 结点 S l a v e , 具体的 部署情况如表
1 92 . 1 6 8 . 0. 1 0 2
子 网掩码
2 5 5 . 2 5 5 . 2 5 5 . 0 2 5 5. 2 5 5. 2 5 5. 0
2 5 5 . 2 5 5 . 2 5Βιβλιοθήκη Baidu5 . 0
( 3 ) 重 启 网络 服 务 , / s b i r d s e r v i c e n e t w o r k s t a r t 。 2 _ 3 S S H 无 密 码 验 证 配 置
D a t a n o d e 来构成 。
按 照 以上 方 法 设 置 后 , 确 保 在 局 域 网 范 围 内使 用 主 机 名 能 够互 p i n g成功 即可 。
2 . 2配置过程 中的常见问题 正常的情况下 L i n u x 在识别 网卡时第一张会是 e t h 0 ,第二 张才是 e t h l 。但使用虚拟机克隆技术后 网卡 的信 息就会改变 , 新克 隆出来 的虚拟 主机 网卡名字可能变为 e t h l , 解 决这个 问题
h o s t n a m e ma s t e r
#修 改 生 效命 令
架, 采用并行 的方式 , 以一种可靠 、 高效、 可伸缩 的方式进行数
据处理 。利用 H a d o o p分布式技术解决多个终端 间的数据存储 与传输 问题 , 对有效处 理空间开销、 节 约计 算时间、 适用于低廉
( 1 ) 在 文本编辑器 中修改/ e t c / u d e v / r u l e s . d / 7 0 一 p e r s i s t e n t — n e t . r u l e s 文件 ,将 P C I d e v i c e中的 n a me 更改为 e t h O ,并将 原有的 ( 2 )修 改网卡配置 文件 , e t c / s y s c o n f i g / n e t w o r k — s e r i p t s / i f c f g —