大数据及在驱动技术趋势中的角色(PDF 27页)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
约 18 天
只是基因组测序阶段 的计算问题
目前 2周
需要加速 100 倍 才能实现目标 - 并行性
- 新硬件/软件合 同
- 协处理器
黄金时代 1978
100 倍加速?
功率有限的时代
2004
2012
4 小时到 一天
目标
目前
基因组 测序
分析确定癌症病因
个性化 治疗 的发展
患者
需要几个月/年; 仍
到达
处于研究的初期阶
数据中心
7
最佳方法
抓住能源机遇:
…在平台层面
服务器平台的电力故障
3%5%2%1% 11%
31%
26%
22%
CPUs Planar & VRs Memory PSUs Fans HDD PCI+GFX
VR、内存和电源
大约占据
60% 的
平台能耗
优化风扇速度, 满定特定需求
减少
卸掉风扇,
PSU+ 中的损失, 减少泄露
nm
µm
mm
cm
m
10 m 100 m
晶体管
逻辑模块
芯片
平台
机架
数据中心
8
+PSU: 电源设备
抓住能源机遇:
…在芯片层面
高
NTV
能源 效率
阈下
正常 运行 范围
处理器
大约占据
5 倍 30% 的
显示
低
平台能耗
减小 电压,实现最大能效
近阈值电压
零
电压
最大值
NTV: 近阈值电压运行
仅完成工作所需的 功率
基于内存的使 用
…广泛的 可调范围
功耗
使用常用编程模式探索节点平台,以克服操作系统、内存和可扩展性的限 制
10
Relative
I/O 机遇:
数据移动成wk.baidu.com高昂
计算与片上互联能源 的比较 (每毫米)
1.2
1
Compute Energy
0.8
On Die IC Energy
0.6
与内存
0.4
0.2
0
90 65 45 32 22 14 10 7
以连通并丰富整个人类的生活。
4
从该数据中获取洞察将需要“可动态调整的平衡系统”
计算
环境和 地点
优化的
传输
软件
分析带来洞察
存储
生成
5
保护
通过各种
经过良好优化的技术“共同协作”
从“大数据”中 提取知识带来的机遇
高效率 新一代技术和架构,旨在通过
的捕捉、发现和/或分
析能力经济地 从类型复杂、数量庞大的数据中提取
技术解析: 大数据及在驱动技术趋势中的角色
Steve Pawlowski
英特尔高级院士 CTO – 数据中心及互联系统事业部
SPCS004
议程
• “大数据”— 是什么? 我们为什么应该关心? • 明确大数据机遇(以进行创新) • 如何实现这些机遇 • 大数据为什么将取得成功…
2
大数据重要事实
1 PB
资料来源: 英特尔Technology (nm)
• 互联能源的扩展速度比计算要慢
• 片上数据移动能源将开始占据主导地 位
片外互联能源 和数据速率
40
Energy, pJ/bit 30
不到一天
一星期以上 + 精度问
段
题
~ $2000
$$$
$$$$$
愿景: 个性化治疗
“…10 年以后,每位癌症患者都希望获得他们的癌症基因组分析,并根据该信 息得到个性化治疗。”
癌症基因组图谱 (TCGA) 董事,《时代》杂志,2011 年 6 月 13 日
英特尔的愿景
在这十年当中,我们将开发并扩展计算技术,
=
大概 5 年 全球观测的系统数据 大概 10 年 连续观看的高清视频+
1 秒 欧洲核子研究中心 (CERN) 每
产生 1 PB
高效率 新一代技术和架构,旨在通过
的捕捉、
发现和/或分析能力经济地 从类型复杂、
数量庞大的数据中提取出色的价值。
细分市场的大数据机遇
资料来源: IDC
http://pcbunn.cithep.caltech.edu/presentations/giod_status_sep97/tsld013.htm
出色的价值。
资料来源: IDC
• “经济” - 能源机遇 • “提取价值与分析” - 计算机遇 • “捕捉数量庞大的数据” - 内存和存储机遇 • “类型复杂”- 软件与安全性机遇 • “高效”- 网络与 I/O 机遇
6
抓住能源机遇:
在数据中心层面...
需要的操作 英特尔重点
在机架层面 最大限度地 降低能耗
+假定每 2 小时的高清视频为 25G
3
http://www.v3.co.uk/v3-uk/news/2081263/cern-experiments-generating-petabyte
测序时间
那么,大数据有什么重要意义?
数据分析可以为社会带来变革
比如…健康与医疗的未来
约 500 年!
10000 倍加速
能源之星*
在节点层面 测量并限制功率
每隔 16 个月将 能效提高一倍
需要的 操作
改进 风扇速度
算法
高效 电源
液体 冷却
英特尔® 节点 管理器
SPECpower* 标准 跟踪
英特尔 重点
电源
管理
粒度
1.00E-06 1.00E-05 1.00E-04 1.00E-03 1.00E-02 1.00E-01 1 1.00E+01 1.00E+02 1.00E+03 1.00E+04 1.00E+05
英特尔® 数据中心 管理器
1.00E-06 1.00E-05 1.00E-04 1.00E-03 1.00E-02 1.00E-01 1 1.00E+01 1.00E+02 1.00E+03 1.00E+04 1.00E+05
电源
nm
µm
mm
cm
m
10 m 100 m
管理
粒度
晶体管
逻辑模块
芯片
机架
平台
芯片
1.00E+01 1.00E+02 1.00E+03 1.00E+04 1.00E+05
cm
m
10 m 100 m
平台
机架
数据中心
9
性能
抓住计算机遇:
一些大数据工作负载“横向扩展”… 一些需要“低延迟” ,还有一些需要结合“二者”!
采用两全其美的异构技术
按需提供性能, 在您不需要的时候功耗降到最低…
根据需要 均衡 性能
在轻负载环境下 提高能效
P 状态, 内核与 内存频率更新 动态 I/O 链路
封装 C 状态
宽度变化
动态 VR 切
相
需要的 操作
英特尔 重点
1.00E-06 1.00E-05 1.00E-04 1.00E-03 1.00E-02 1.00E-01 1
电源
nm
µm
mm
管理
粒度
晶体管
逻辑模块
开数放据式 中心计算BKM*
实机验架室
减少 过度冷却
环境与 自由 冷却
高效的数据中心能耗
Servers
Network/ Storage Building/ Lighting CRACs, UPS, etc.
更少 转换步骤
380Vdc 电源 架构
测量 与跟踪性能的方式
开发 PUE
查看完整的 DC 能耗
只是基因组测序阶段 的计算问题
目前 2周
需要加速 100 倍 才能实现目标 - 并行性
- 新硬件/软件合 同
- 协处理器
黄金时代 1978
100 倍加速?
功率有限的时代
2004
2012
4 小时到 一天
目标
目前
基因组 测序
分析确定癌症病因
个性化 治疗 的发展
患者
需要几个月/年; 仍
到达
处于研究的初期阶
数据中心
7
最佳方法
抓住能源机遇:
…在平台层面
服务器平台的电力故障
3%5%2%1% 11%
31%
26%
22%
CPUs Planar & VRs Memory PSUs Fans HDD PCI+GFX
VR、内存和电源
大约占据
60% 的
平台能耗
优化风扇速度, 满定特定需求
减少
卸掉风扇,
PSU+ 中的损失, 减少泄露
nm
µm
mm
cm
m
10 m 100 m
晶体管
逻辑模块
芯片
平台
机架
数据中心
8
+PSU: 电源设备
抓住能源机遇:
…在芯片层面
高
NTV
能源 效率
阈下
正常 运行 范围
处理器
大约占据
5 倍 30% 的
显示
低
平台能耗
减小 电压,实现最大能效
近阈值电压
零
电压
最大值
NTV: 近阈值电压运行
仅完成工作所需的 功率
基于内存的使 用
…广泛的 可调范围
功耗
使用常用编程模式探索节点平台,以克服操作系统、内存和可扩展性的限 制
10
Relative
I/O 机遇:
数据移动成wk.baidu.com高昂
计算与片上互联能源 的比较 (每毫米)
1.2
1
Compute Energy
0.8
On Die IC Energy
0.6
与内存
0.4
0.2
0
90 65 45 32 22 14 10 7
以连通并丰富整个人类的生活。
4
从该数据中获取洞察将需要“可动态调整的平衡系统”
计算
环境和 地点
优化的
传输
软件
分析带来洞察
存储
生成
5
保护
通过各种
经过良好优化的技术“共同协作”
从“大数据”中 提取知识带来的机遇
高效率 新一代技术和架构,旨在通过
的捕捉、发现和/或分
析能力经济地 从类型复杂、数量庞大的数据中提取
技术解析: 大数据及在驱动技术趋势中的角色
Steve Pawlowski
英特尔高级院士 CTO – 数据中心及互联系统事业部
SPCS004
议程
• “大数据”— 是什么? 我们为什么应该关心? • 明确大数据机遇(以进行创新) • 如何实现这些机遇 • 大数据为什么将取得成功…
2
大数据重要事实
1 PB
资料来源: 英特尔Technology (nm)
• 互联能源的扩展速度比计算要慢
• 片上数据移动能源将开始占据主导地 位
片外互联能源 和数据速率
40
Energy, pJ/bit 30
不到一天
一星期以上 + 精度问
段
题
~ $2000
$$$
$$$$$
愿景: 个性化治疗
“…10 年以后,每位癌症患者都希望获得他们的癌症基因组分析,并根据该信 息得到个性化治疗。”
癌症基因组图谱 (TCGA) 董事,《时代》杂志,2011 年 6 月 13 日
英特尔的愿景
在这十年当中,我们将开发并扩展计算技术,
=
大概 5 年 全球观测的系统数据 大概 10 年 连续观看的高清视频+
1 秒 欧洲核子研究中心 (CERN) 每
产生 1 PB
高效率 新一代技术和架构,旨在通过
的捕捉、
发现和/或分析能力经济地 从类型复杂、
数量庞大的数据中提取出色的价值。
细分市场的大数据机遇
资料来源: IDC
http://pcbunn.cithep.caltech.edu/presentations/giod_status_sep97/tsld013.htm
出色的价值。
资料来源: IDC
• “经济” - 能源机遇 • “提取价值与分析” - 计算机遇 • “捕捉数量庞大的数据” - 内存和存储机遇 • “类型复杂”- 软件与安全性机遇 • “高效”- 网络与 I/O 机遇
6
抓住能源机遇:
在数据中心层面...
需要的操作 英特尔重点
在机架层面 最大限度地 降低能耗
+假定每 2 小时的高清视频为 25G
3
http://www.v3.co.uk/v3-uk/news/2081263/cern-experiments-generating-petabyte
测序时间
那么,大数据有什么重要意义?
数据分析可以为社会带来变革
比如…健康与医疗的未来
约 500 年!
10000 倍加速
能源之星*
在节点层面 测量并限制功率
每隔 16 个月将 能效提高一倍
需要的 操作
改进 风扇速度
算法
高效 电源
液体 冷却
英特尔® 节点 管理器
SPECpower* 标准 跟踪
英特尔 重点
电源
管理
粒度
1.00E-06 1.00E-05 1.00E-04 1.00E-03 1.00E-02 1.00E-01 1 1.00E+01 1.00E+02 1.00E+03 1.00E+04 1.00E+05
英特尔® 数据中心 管理器
1.00E-06 1.00E-05 1.00E-04 1.00E-03 1.00E-02 1.00E-01 1 1.00E+01 1.00E+02 1.00E+03 1.00E+04 1.00E+05
电源
nm
µm
mm
cm
m
10 m 100 m
管理
粒度
晶体管
逻辑模块
芯片
机架
平台
芯片
1.00E+01 1.00E+02 1.00E+03 1.00E+04 1.00E+05
cm
m
10 m 100 m
平台
机架
数据中心
9
性能
抓住计算机遇:
一些大数据工作负载“横向扩展”… 一些需要“低延迟” ,还有一些需要结合“二者”!
采用两全其美的异构技术
按需提供性能, 在您不需要的时候功耗降到最低…
根据需要 均衡 性能
在轻负载环境下 提高能效
P 状态, 内核与 内存频率更新 动态 I/O 链路
封装 C 状态
宽度变化
动态 VR 切
相
需要的 操作
英特尔 重点
1.00E-06 1.00E-05 1.00E-04 1.00E-03 1.00E-02 1.00E-01 1
电源
nm
µm
mm
管理
粒度
晶体管
逻辑模块
开数放据式 中心计算BKM*
实机验架室
减少 过度冷却
环境与 自由 冷却
高效的数据中心能耗
Servers
Network/ Storage Building/ Lighting CRACs, UPS, etc.
更少 转换步骤
380Vdc 电源 架构
测量 与跟踪性能的方式
开发 PUE
查看完整的 DC 能耗