MapReduce并行计算技术发展综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ke y wo r ds : Ma p Re d uc e ; Ha d o o p; pa ra l l e l c o mp u t i n g; bi g d a t a p r o c e s s i n g
2 0 0 6年 8月, G o o g l e 在搜索 引擎大会上首次提 出 “ C l o u d C o mp u t i n g ” 的概念 . 经 过几年 的高速 发展,工 业 界 已经实现 了多个云计算实例[ 1 ] , 例如 :A ma z o n的
年 间, H a d o o p已经成为大数据领域事实上的标准, 有
E C 2 、微 软 的 A z u r e 、I B M 的“ 蓝 云 ” 、阿里 巴 巴的“ 飞
Ha d o o p Ma p R e d u c e两个 核心 部件组成 ,二者分别 是 G F S和 G MR ( G o o g l e Ma p R e d u c e ) 的开源实现. 短短几
r e p r e s e n t e d b y T wi t t e r St o r m ,g r a p h c o mp u t i n g ra f me wo r k a s r e p r e s e n t e d b y Apa c h e Ha ma ,c o mp u t i n g r e s o u r c e s
Ab s t r a c t : Wi t h t h e r a p i d d e v e l o p me n t o f r e c e n t y e a r s , s o me i mp r o v e d ra f me wo r k o f Ma p Re d u c e p a r a l l e l p r o g r a mmi n g mo d e l a p p e a r e d . T h e y a r e c o r r e c t i o n a n d r e c o d i n g a g a i n s t l a c k o f MRv 1 . T h i s p a p e r d e s c r i b e s a n d a n a l y z e s t h i s r e s e a r c h
摘
要: 经过几年 的发展,并行编程模型 Ma p R e d u c e 产生 了若干个改进框架, 它们都是针对传统 Ma p R e d u c e 的不
足进行 的修正或重 写. 本文 阐述 和分析 了这些研 究成果,包括:以 H a L o o p 为代表 的迭 代计算框架 、以 T w i t t e r
n e g o t i a t i o n p l a t f o r m a s r e p r e s e n t e d b y Ap a c h e Y AR N . T h e s e s p e c i a l s y s t e ms p l a y a v i t a l r o l e i n Bi g Da t a i f e l d s .
Sur v e y o f De v e l o pm e nt s o f Ma p Re duc e Pa r a l l e l Co m pu t i ng Te c h no l o g y
Y1 N G Yi . LI U Ya — J u n ,
( C o l l a n d T e c h n o l o g y , S a n j i a n g U n i v e r s i t y , Na n j i n g 2 1 0 0 1 2 , C h i n a ) ( S c h o o l o f C o m p u t e r S c i e n c e a n d E n g i n e e r i n g , S o u t h e a s t U n i v e r s i t y , N a n j i n g 2 1 0 0 9 6 , C h i n a )
S t o n n为代表的实时计算框架 、以 A p a c h e H a m a为代 表的图计算框 架 以及 以 A p a c h e Y AR N 为代表 的框架 管理平 台.这些专用系统在大数据领域发挥着越来越重要 的作用.
关键 词: Ma p R e d u c e ; H a d o o p ;并行计算;大数据处理
a c h i e v e me n t s , i n c l ud i n g i t e r a t i v e c o mp u t i ng ra f me wo r k a s r e p r e s e n t e d b y Ha Lo o p, r e a l — t i me c o mp ut i n g ra f me wo r k a s
2 0 1 4年 第 2 3卷 第 4 期
h t t p : l l ww w. C — S — a . o r g . c n
计 算 机 系 统 应 用
Ma p R e d u c e 并行计算技术发展综述①
应 毅 。刘 亚 军 l ’
( 三江学 院 计算机 科学与工程学院,南京 2 1 0 0 1 2 ) f 东南大学 计算机 科学与工程学院,南京 2 1 0 0 9 6 )
2 0 0 6年 8月, G o o g l e 在搜索 引擎大会上首次提 出 “ C l o u d C o mp u t i n g ” 的概念 . 经 过几年 的高速 发展,工 业 界 已经实现 了多个云计算实例[ 1 ] , 例如 :A ma z o n的
年 间, H a d o o p已经成为大数据领域事实上的标准, 有
E C 2 、微 软 的 A z u r e 、I B M 的“ 蓝 云 ” 、阿里 巴 巴的“ 飞
Ha d o o p Ma p R e d u c e两个 核心 部件组成 ,二者分别 是 G F S和 G MR ( G o o g l e Ma p R e d u c e ) 的开源实现. 短短几
r e p r e s e n t e d b y T wi t t e r St o r m ,g r a p h c o mp u t i n g ra f me wo r k a s r e p r e s e n t e d b y Apa c h e Ha ma ,c o mp u t i n g r e s o u r c e s
Ab s t r a c t : Wi t h t h e r a p i d d e v e l o p me n t o f r e c e n t y e a r s , s o me i mp r o v e d ra f me wo r k o f Ma p Re d u c e p a r a l l e l p r o g r a mmi n g mo d e l a p p e a r e d . T h e y a r e c o r r e c t i o n a n d r e c o d i n g a g a i n s t l a c k o f MRv 1 . T h i s p a p e r d e s c r i b e s a n d a n a l y z e s t h i s r e s e a r c h
摘
要: 经过几年 的发展,并行编程模型 Ma p R e d u c e 产生 了若干个改进框架, 它们都是针对传统 Ma p R e d u c e 的不
足进行 的修正或重 写. 本文 阐述 和分析 了这些研 究成果,包括:以 H a L o o p 为代表 的迭 代计算框架 、以 T w i t t e r
n e g o t i a t i o n p l a t f o r m a s r e p r e s e n t e d b y Ap a c h e Y AR N . T h e s e s p e c i a l s y s t e ms p l a y a v i t a l r o l e i n Bi g Da t a i f e l d s .
Sur v e y o f De v e l o pm e nt s o f Ma p Re duc e Pa r a l l e l Co m pu t i ng Te c h no l o g y
Y1 N G Yi . LI U Ya — J u n ,
( C o l l a n d T e c h n o l o g y , S a n j i a n g U n i v e r s i t y , Na n j i n g 2 1 0 0 1 2 , C h i n a ) ( S c h o o l o f C o m p u t e r S c i e n c e a n d E n g i n e e r i n g , S o u t h e a s t U n i v e r s i t y , N a n j i n g 2 1 0 0 9 6 , C h i n a )
S t o n n为代表的实时计算框架 、以 A p a c h e H a m a为代 表的图计算框 架 以及 以 A p a c h e Y AR N 为代表 的框架 管理平 台.这些专用系统在大数据领域发挥着越来越重要 的作用.
关键 词: Ma p R e d u c e ; H a d o o p ;并行计算;大数据处理
a c h i e v e me n t s , i n c l ud i n g i t e r a t i v e c o mp u t i ng ra f me wo r k a s r e p r e s e n t e d b y Ha Lo o p, r e a l — t i me c o mp ut i n g ra f me wo r k a s
2 0 1 4年 第 2 3卷 第 4 期
h t t p : l l ww w. C — S — a . o r g . c n
计 算 机 系 统 应 用
Ma p R e d u c e 并行计算技术发展综述①
应 毅 。刘 亚 军 l ’
( 三江学 院 计算机 科学与工程学院,南京 2 1 0 0 1 2 ) f 东南大学 计算机 科学与工程学院,南京 2 1 0 0 9 6 )