浪潮云海大数据一体机介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5
大数据时代即将来临
• 大数据具有无可预估的数据价值
– – – – 体量Volume:巨大的数据量 多样性Variety:半结构化、非结构化 速度Velocity:指数级别的增长 价值密度Value:蕴含大财富 IDC:到2020年,大数据的支出将超过2000亿美元 以上 麦肯锡:未来全球范围内大数据带来的价值将达 20000亿美元

大数据具有无可预估的数据价值


粗放式
精细化
基于大数据的分析、挖掘,为商业决策提供依据
大数据生态链
应用
最终用户 服务技术提供商 数据分析技术提供商 数据服务提供商 数据分析者
分析 及可 视化
数据 处理 数据 存储
数据处理技术提供商 软件平台(数据库、数据仓库、分布式处理技术 等)提供商
基础硬件(服务器、存储、交换)厂商 数据采集技术提供商
半结构化/非结 构化数据 结构化数据
个人数据 物质世界 数据
社会数据
挑战2:如何提供规模和性能的同步扩展
IDC统计数据发现随着系统规模增加,延迟变得无 法忍受 需要解决规模和性能的同步拟线性增长问题
10000
5000 传统分布式处理系统 100 200 300 400 500 600 700 800 900 1000
7.9 0.8 2009 1.2 2010 1.8 2011 2.7 2012 2015 2020
全球数据存储量(ZB)
现状:传统的数据库存储模式无法应对数据量井喷式的增长
面临的重大挑战
挑战1:如何解决各种类型数据融合的问题
随着互联网的兴起,涌现出大量音频、视频等半结构化、 非结构化数据,传统数据库不能有效应对 需要新型数据处理体系结构进行高效的存储和管理数据
数据处理者
数据 收集 数据源
数据采集者
数据拥有者
目录
一、背景简介
二、产品介绍 三、成功案例
产品形态
数据节点:
• • 2U,2路存储服务器 单节点支持12块3.5寸或者24 块2.5寸数据盘
控制台:
• 本地可视化管理平台
管理节点:
• • • • • 高端4路/8路服务器 HA 千兆以太网 万兆网络 IB网络
浪潮云海大数据一体机介绍
目录
一、背景简介
二、产品介绍 三、成功案例
时代背景
40
数据规模转向TB/PB级别 2012年全球数据总量2.7ZB,现在两天的数据 量,等于人类起源~2003年所有数据的总和
暴涨50多倍
2011年全球上网用户达23亿,到2016年,预 计达到34亿,届时将产生海量的新型数据
高性能型平台配置:
管理节点:CPU2*4CORE、内存128G DDR3-1600 ECC系列 硬盘 4*2.5 480GB SSD 10000 940 ifniband 数据节点:CPU E5-2600系列、内存128G DDR3-1600 ECC系列 硬盘 24*2.5 480G SSD 7200 ifniband 单台服务器理论值:裸容量11.25T,吞吐量读2400MB/S,写2000MB/S,IOPS 960000
网络:
产品市场定位
目标应用
面向图片、视频、音频等非结构化数据的海量存储和处理 面向海量数据的在线查询 面向关系型数据的数据分析和挖掘,结合传统的数据仓库
目标行业
金融、政法、电信、交通、卫生、广电、通信
产品配置
针对不同应用,提供系列化产品,满足客户需求。
处理器核心
管理节点 64Core
平衡型平台配置:
管理节点:CPU E5-2600系列、内存128G DDR3-1600 ECC系列 硬盘 4*2.5 600GB SAS 10000 940 10GB*2 数据节点:CPU E5-2600系列、内存64G DDR3-1600 ECC系列 硬盘 12*3.5 2TB SAS 7200 940 10GB*2 单台服务器理论值:裸容量24T,吞吐量读600MB/S,写400MB/S,IOPS 1200
内存
128GB
网卡
1*单口万兆网口
RAID
512M缓存高性能 raid卡
硬盘
系统盘2*300GB SATA/SAS/SSD 数据盘4*600GB SATA/SAS/SSD 系统盘2*300GB SATA/SAS/SSD 系统盘10*2TB SATA/SAS/SSD
数据节点 软件平台 相关配件
12Core
0
4
面临的重大挑战
挑战3:如何控制数据存储和数据处理的性价比
传统数据仓库的数据存储和处理成本约为1万/GB 对于低密度价值的大数据,如何控制其存储和处理的性 价比尤为重要
挑战4:如何满足大并发、海量数据查询要求
IDC统计数据发现随着系统规模增加,延迟变得无 法忍受 需要解决规模和性能的同步拟线性增长问题
CPU
CPU
CPU
32GB
1*单口万兆网口
512M缓存高性能 raid卡
浪潮云海大数据一体机系统软件节点授权 N个万兆交换机、N个千兆交换机、N个四合一切换器、N个机柜
理论最佳配置
高容量型平台配置:
管理节点:CPU E5-2600系列、内存64G DDR3-1600 ECC系列 硬盘 4*2.5 600GB SAS 10000 千兆网卡 数据节点:CPU E5-2600系列、内存48G DDR3-1600 ECC系列 硬盘 12*3.5 3TB SATA 7200 千兆网卡 单台服务器理论值:裸容量36T,吞吐量读600MB/S,写400MB/S,IOPS 1200
软件体系结构-数据本地化
数据本地化(计
算随数据分布)是指
并行计算框架智能地 将计算任务指派到存 储着该任务所需数据 的节点,从而避免传 Job Map
CPU CPU CPU CPU
CPU CPU CPU CPU
NameNode JobTrHale Waihona Puke Baiducker






DataNode
CPU CPU CPU CPU
DataNode
CPU CPU CPU CPU
统分布式计算中严重
的数据传瓶颈。






DataNode
DataNode
软件体系结构-业务连续性保证
业务连续性保证 是传统分布式计算中最为复杂的开发目标。通常当系统规
模扩展至百节点以上时,就必须应对计算单元失效,显式地保存和恢复失败任
务。浪潮大数据一体机能够智能识别失败任务,自动将其转移到备份数据节点。
相关文档
最新文档