数据中心网络高效数据汇聚传输算法_陆菲菲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9期
陆菲菲等 :数据中心网络高效数据汇聚传输算法
1 7 5 1
i n n e t w o r k a r e a t i o n f o r a s s o c i a t e d t r a f f i c a n d a r a l l e l i z e t h e s h u f f l e a n d r e d u c e h a s e s . I t c a n - g g g p p , s i n i f i c a n t l r e d u c e c o n s u m i n t h e r a r e e a s t e s t n e t w o r k r e s o u r c e a n d a v o i d l o n l a t e n c t i m e -w g y g g y h a s e o b s . I R S- r o o s e d r o d u c e d b t h e s h u f f l e i n M a R e d u c e b a s e d a l o r i t h m c u r r e n t l h a s p j p p p y p g y , l i m i t a t i o n s .T o s o l v e t h i s e f i r s t b u i l t a m o d e l f o r i n c a s t m i n i m a l t r e e w i t h c e r t a i n r o b l e m w p , , r o o s B C u b e a r e r e s e n t a t i v e s e r v e r c e n t r i c n e t w o r k i n s t r u c t u r e f o r f u t u r e d a t a c e n t e r s a n d p - p p e g , , t w o a r o x i m a t e i n c a s t t r e e c o n s t r u c t i o n m e t h o d s n a m e d M I B b a s e d a n d MC b a s e d r e s e c t i v e l - - p p p y s o l e l b a s e d o n t h e l a b e l s s e n d e r s a n d t h e d a t a c e n t e r t o o l o .M I B b a s e d m e t h o d i s a l i e d t o - y p g y p p t h e c a s e o f h i h l c o r r e l a t i v e s e n d e r s . I t c a n b u i l d a n i n c a s t m i n i m a l t r e e b m a k i n a n e n d e a v o r g y y g a r e a t e t h e h i h l e v e l s e n d e r s t o l o w l e v e l s e n d e r s .MC b a s e d m e t h o d i s a l i e d t o t h e c a s e t o - - - g g g g p p o f l o o s e a s s o c i a t i v e s e n d e r s . I t c a n b u i l d a n i n c a s t m i n i m a l t r e e b a r e a t i n n o d e s a s f a r a s y g g g g a n d i n c r e a s i n t h e l e a s t n o d e s .T h e n w e c o m b i n e d t w o m e t h o d s a n d f u r t h e r r o o s e d o s s i b l e g p p p M 2 b a s e d m e t h o d f o r a n c a s e . I t r o v e d t h a t t h e m e t h o d w e r o o s e d c a n m e e t t h e d e m a n d o f - y p p p t h e i n c a s t t r e e o n l i n e b c a l c u l a t i n t h e t i m e c o m l e x i t o f t h e M 2 b a s e d i n c a s t t r e e b u i l d i n - y g p y g , b u i l d i n m e t h o d .A t l a s t w e a n a l z e d t h e a d a t a b i l i t o f M 2 b a s e d t o o t h e r d a t a c e n t e r - g y p y , r i n c i l e o b s t r u c t u r e s a n d t h e o f i n n e t w o r k a r e a t i o n i n r e d u c i n t h e e x e c u t i o n t i m e .T h e - p p g g g g j , ,M s c a l e e x e r i m e n t a l r e s u l t s s h o w t h a t i n t h e d i f f e r e n t s i z e o f d a t a c e n t e r 2 b a s e d s a v e s s m a l l - - p ,a t h e n e t w o r k t r a f f i c b 3% o n a v e r a e c o m a r e d t o I R S- b a s e d n d s h o r t e n s a b o u t t w o t h i r d - y g p w a i t i n t i m e o f a o b i n t h e s h u f f l e a n d r e d u c e h a s e c o m a r e d t o t h e e x i s t i n m e t h o d w h i c h d o e s g j p p g , n o t t h e i n n e t w o r k a r e a t i o n. I n t h e d i f f e r e n t s i z e o f i n c a s t t r a n s f e r M 2 b a s e d s a v e e r f o r m - g - s g g p , n e t w o r k t r a f f i c b 1 9% o n a v e r a e c o m a r e d t o I R S- b a s e d a n d s h o r t e n s a b o u t t h r e e f o r t h t h e - y g p w a i t i n t i m e o f a o b i n t h e s h u f f l e a n d r e d u c e h a s e c o m a r e d t o t h e e x i s t i n m e t h o d . g j p p g ; ; K e w o r d s a t a c e n t e r d a t a a r e a t i o n; i n n e t w o r k a r e a t i o n; s h u f f l e t r a n s f e r i n c a s t t r e e d - g g g g g g y ) 个数据流的混 洗 ( 传 输 过 程, 大量工作节点 s h u f f l e
,d A b s t r a c t I n d a t a c e n t e r s i s t r i b u t e d c o m u t i n s s t e m s l i k e M a R e d u c e r o d u c e m a s s i v e p p g y p a m o u n t o f t r a f f i c a c r o s s s u c c e s s i v e s t a e s .S u c h s h u f f l e t r a n s f e r s m a k e e a s t e s t r o c e s s i n -w g p g , n e t w o r k r e s o u r c e b e c o m e a b o t t l e n e c k. I n m a n c o mm o n l u s e d w o r k l o a d s d a t a f l o w s f r o m a l y l y s e n d e r s t o e a c h r e c e i v e r a r e t i c a l l h i h l c o r r e l a t e d .M a n s t a t e- o f t h e- r a c t i c e s s t e m s t h u s - y p y g y y p y a l a r e a t i o n f u n c t i o n s a t t h e r e c e i v e r s i d e o f a s h u f f l e t r a n s f e r t o r e d u c e t h e o u t u t a l r e a d y p p y g g g p , d a t a s i z e . T o l o w e r d o w n t h e n e t w o r k t r a f f i c a n d e f f i c i e n t l u s e n e t w o r k b a n d w i d t h w e i n t r o d u c e y
) T h e P L A I n o r m a t i o n E n i n e e r i n U n i v e r s i t Z h e n z h o u 4 5 0 0 0 2 f g g y, g
3) (
, ) K e L a b o r a t o r o n I n o r m a t i o n S s t e m E n i n e e r i n N a t i o n a l U n i v e r s i t o D e e n s e t e c h n o l o C h a n s h a 4 1 0 0 7 3 y y f y g g( y f f g y) g
1) (
) ,)




) o r S t a t e K e L a b o r a t o r M a t h e m a t i c a l E n i n e e r i n a n d A d v a n c e d C o m u t i n W u x i, J i a n s u 2 1 4 1 2 5 y y f g g p g, g
第3 9卷 第9期 2 0 1 6年9月
计 算 机 学 报 CH I N E S E J OUR NA L O F C OMP UT E R S
V o l . 3 9 N o . 9 S e t . 2 0 1 6 p
数据中心网络高效数据汇聚传输算法
陆菲菲
, 1) 2)
; 收稿日期 : 在 线 出 版 日 期: 本课题得到国家“ 九 七 三” 重点基础研究发展规划项目青年科学家专题项目 2 0 1 5 0 3 2 6 2 0 1 5 1 1 0 3. - - - - ( ) 、 ) 、 ) 、 国家自然科学基金优秀青年基金 ( 国家自然科学基金 ( 国家 “ 八六三 ” 高技 术 研 究 发 展 计 划 项 目 2 0 1 4 C B 3 4 7 8 0 0 6 1 4 2 2 2 1 4 9 1 4 3 0 2 1 4 ) 基金 ( 资助 . 陆菲菲 , 女, 博士研究生 , 工程师 , 中国计算 机 学 会 ( 会员, 主要研究方向为分布式计算和数 2 0 1 3 AA 0 1 A 2 1 3 1 9 8 1 年生 , C C F) : 据中心网络 . 郭得科 , 男, 博士 , 副研究 员 , 国家自然科学基金 优 秀 青 年 基 金 获 得 者, 中国计算 E-m a i l l u. f e i f e i e a c s k l . c n. 1 9 8 0 年生 , @m - 机学会 ( 会员 , 主要研究方向为分布式计算 、 数据中心网络 和 无 线 通 信 系 统 . 方 兴, 男, 博 士, 助 理 研 究 员, 中国计算机 C C F) 1 9 8 0年 生, 学会 ( 会员 , 主要研究方向为计算机系统结构和高速模拟电路 . 谢向辉 , 男, 研究员, 博士生导师, 中国计算机学会( C C F) 1 9 5 8年 生, C C F) 高级会员 , 主要研究领域为计算机系统结构 、 网络和分布式计算 . 罗兴国 , 男, 教授 , 博士生导师 , 主要研 究 领 域 为 无 线 通 信 、 软 1 9 5 1 年生 , 件无线电和高性能计算 .
郭得科 方
3)
Biblioteka Baidu
兴 谢向辉 罗兴国
1) 1)
2)
1) ( 数学工程与先进计算国家重点实验室
) 1 4 1 2 5 江苏 无锡 2 ) 5 0 0 0 2 郑州 4 ) 1 0 0 7 3 长沙 4
2) ( 解放军信息工程大学国家数字交换系统工程技术研究中心 3) ( 信息系统工程国防科技重点实验室 ( 国防科学技术大学 )
2) (
N a t i o n a l D i i t a l S w i t c h i n S s t e m E n i n e e r i n &T e c h n o l o i c a l R e s e a r c h C e n t e r, g g y g g g
E f f i c i e n t D a t a A r e a t i o n T r a n s f e r s i n D a t a C e n t e r N e t w o r k s g g g
1 2 3 1 1 2 L U F e i F e i D e-K e ANG X i n I E X i a n u i UO X i n u o - GUO F -H L -G g X g g
摘 要 在数据中心中 , 类M 令数据中心的东西向 a R e d u c e的分布式计算系统在数据 的 混 洗 阶 段 产 生 巨 大 流 量 , p 将这些高度相关的数据流在接收 端 进 行 聚 合 是 分 布 式 计 算 的 通 用 处 理 方 式 , 为了降低网络通 网络资源成为瓶颈 . 文中采用网内关联性流量的汇聚传输策略 , 将混洗和汇聚 并 行 化 , 达到进一步降低东西向网 信量并有效利用带宽 , 络资源消耗 、 缩短混洗阶段延迟的目的 . 目前提出的 I 为了解决这一问 R S- b a s e d算 法 在 适 用 场 景 上 有 一 定 局 限 性, 文中首先 在 以 服 务 器 为 中 心 的 代 表 结 构 B 分别提出 M 题, C u b e上 建 立i n c a s t最 小 树 模 型, I B b a s e d算法和 - 仅根据已知拓扑结构和发送节 点 编 号 即 可 快 速 生 成 一 棵 近 似 的 最 小 代 价 i MC b a s e d 算法 , n c a s t树 . M I B b a s e d算 - - 使高层发送节点尽 可 能 汇 聚 到 已 有 的 低 层 发 送 节 点 构 建 i 法针对发送节点强关联的情况 , n c a s t树 ; MC b a s e d算 法 - 针对发送节点松散关联的情况 , 将节点进行最大程度上的聚合 , 通过 增 加 最 少 的 汇 聚 点 完 成 i 随后 n c a s t树 的 构 建 . 将上述两种算法结合起来进一步提出适用于各种 场 景 的 M 通过推算时间复杂度证明该算法能够满 2 b a s e d算 法, - 最后 , 详细分析了 M 足在线构建i n c a s t树的需求 . 2 b a s e d 算法对其他数据 中 心 网 络 结 构 的 适 应 性 以 及 网 内 汇 聚 传 - 输能够减少作业完成时间的原理 . 小规模实验结果表明 , 在不同网络规模下 , M 2 b a s e d比I R S- b a s e d节 省 了 网 络 中 - / 整个作业在混洗和 R 在不同传输节点规模 约 3% 的数据量 , e d u c e阶段的 等 待 时 间 比 不 采 用 网 内 汇 聚 缩 短 约 2 3; 下, 整个作业在混洗和 R M 2 b a s e d 比I R S- b a s e d 节省了网络中约 1 9% 的数据量 , e d u c e阶段的等待时间比不采用网 - / 内汇聚缩短约 3 4. 关键词 数据中心 ; 数据汇聚 ; 网内聚合 ; 混洗传输 ; i n c a s t树 / 中图法分类号 T P 3 9 3 D O I号 1 0. 1 1 8 9 7 S P. J . 1 0 1 6. 2 0 1 6. 0 1 7 5 0
相关文档
最新文档