超级计算机技术在生物医药领域的应用与发展

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。




21
2、典型应用:生物大分子研究
分子动力学及第一性原理计算
– HIV与硫酸茚地那韦相互作用机制
息 网
– Hartree-Fock自洽场迭代(SCF)
院 信
– 模拟2938原子,基函数阶数27394
华 医
– 使用8100结点 ,共156 万核,并行效率

达70%
20
生物大分子结构
– 核糖体结构的建模和动态结构模拟
– 高性能计算:是科学研究的三大手段之一
网 络 大
– 大数据处理:正成为科学研究的第四范式
世界各国争相角逐超级计算机系统的主导地位
医 院 信 息
20
16



3
1、超算中心介绍
天河二号超级计算机系统
• 国家863计划和核高基重大专项的 标志性成果,2013年6月研制成 功,位列世界超算Top500排行榜 第一位
4. 人工智能医生
– 协助医生提供个性化的 癌症治疗方案
大 会
– 病历、影像、文献分析

– 广泛应用于癌症治疗、 产前检查等
16 中 华 20 医 院

2、目前应用概况—超算与生物医药
主要应用
络 20 16 中 华 医 院 信 息 网
– 健康医疗 – 生物信息学 – 生物分子动力学模拟
总体情况

超算在生物医药领域的应用

01
OUTLINE 主要内容
超算中心介绍
16

20

04

03




02

目前应用概况
国家超级计算广州中心
NATIONAL SUPERCOMPUTER CENTER IN GUANGZHOU

未来拓展方向
总结

2
1、超算中心介绍
超级计算机对科学发现、技术创新、产业革命的重要作用
– 建立百万人级别的数据库

•基因数据



– 基于这些数据开展研究

•药物基因组学,用合适的药物、
合适的剂量治疗病人
•生物样本
16 中

•电子健康记录
•设定新的治疗和预防疾病目标 •测试移动设备以鼓励健康行为 •寻找更多疾病的科学基础
•生活饮食信息
20



4、总结

中 华 医 院 信 息 网 络 大 会
– 宏基因组分析 – 全基因组DNA甲基化测序
人类全基因组重测序
– 2000人基因组 30X深度测序 – 8小时完成原来8个月的工作量



18
2、典型应用:生物信息学
基因调控网络
– 通过贝叶斯法构造高等植物(鼠
网 息 络 信
耳芥)的全基因组调控网络 – 全基因组调控网络有助于从基因

组尺度理解基因调控作用
20 16 中
– 支持数据的可视化支持数据共享功 能
– 支持自定义工具的添加


20
2、典型应用:生物大分子研究
分子动力学及第一性原理计算
– 离子液体溶解真实纤维素的分子动力学
息 网 20 16 中 华 医 院 信
模拟的纤维素初始及结束构象
模拟
– 问题规模:320000+ atoms
– Gromacs 5.0.4单精度 22ns/day – Gromacs 5.0.4双精度 12ns/day – 得到了初步的溶解过程,探索了阴阳离 子的作用机制
SW M SW M SW M SW M

BTM
BTM
BTM
BTM
TH-Net

APM
机框
(16 x cn)
服务处理 系统
服务 结点 登录 结点

BTM
SW M
BTM
SW M
BTM
SW M
BTM
SW M
NRM
NRM
NRM
NRM
NRM
NRM
NRM
NRM
32个计算节点
32个计算节点 机柜0
32个计算节点
32个计算节点
20
– 医学前沿技术
16





3、未来应用拓展方向:精准医疗
精准医疗的短期目标:癌症治疗
– 研究多种药物的联合疗法的有效性
信 络 大
– 针对不同人群的靶向抗肿瘤药物的试验

– 研究抗药性产生的原因和克服方法
医 院 息
20
16



3、未来应用拓展方向:精准医疗
精准医疗的长期目标:健康管理

2、目前应用概况—超算与生物医药
1. 组织器官的模拟
– 心脏瓣膜跟血液的相互作用
信 息 络 大
– 腹主动脉瘤

2. 药物研发
– 使用分子对接技术发现HIV-1 蛋白酶抑制剂
20
16





2、目前应用概况—超算与生物医药
3. 人类基因组相关研究
– 基因组装
– 全基因组重测序及相关 应用
网 息
华 医
– 8192 结点、160 万核,2.2亿单 元规模的科学应用运行3小时
蛋白组学研究
– 质谱,代谢组 – 翻译后修饰
20
16



19
2、典型应用:生物信息学
Galaxy生物信息分析平台
络 网 华 医 院 信 息
– 基于WEB的开放性生物信息分析平 台。 – 支持多种数据上传方式 – 支持多款生物信息分析相关的工具 – 支持工作流的创建、历史记录功能 – 支持用户管理功能



制冷
密闭水风冷

17.8 MW (1902MFlops/W)
TH-2 系统
机柜
32个计算节点


(8 x 机框)
机柜63 32个计算节点 32个计算节点 32个计算节点 32个计算节点 32个计算节点 机柜124 32个计算节点 32个计算节点 NRM NRM NRM NRM NRM NRM NRM NRM 576端口交换机0 576端口交换机i 576端口交换机j 576端口交换机12
32个计算节点
32个计算节点 机柜62
32个计算节点
32个计算节点

16
计算主板
ION
自主cpu阵列 飞腾计算结点 飞腾计算结点
商用cpu计算阵列 计算结点 计算结点
商用cpu计算阵列
IO增强 计算结点
20
IO增强 计算结点
...
飞腾计算结点 飞腾计算结点 IO服务结点
...
计算结点 计算结点 IO服务结点
• 广东省、广州市、国防科技大学 、中山大学联合共建
• 2015年8月20日,经广州市委常 委会审议通过,由中山大学负责 广州超算中心的运行管理
20
16
• 2014年4月对外试运行




国家超级计算广州中心






4
1、超算中心介绍
性能 系统 机柜 能耗 54.9PFlops / 33.86PFlops 16000结点, 1.4PB内存 125+8+13+24=170 (720m2)
医 院 信 息 网 20 16 中 华 络 大 会
– DNA甲基化数据分析以及ChIP-seq数 据分析
应用
– 完成500 对大肠癌患者样本(癌组织
和对照)的全基因组/外显子组测序和 分析
16
2、典型应用:健康医疗
生物医药文献挖掘
– 生物医学文献库PubMed包含超过两千万 – 使用MEDLINE摘要和PMC Open – 构建“肿瘤-基因-药物”关系数据
20
16
2016 列入 国家重点 研发计划
3、未来应用拓展方向:精准医疗
精准医疗技术背景

– 基因测序技术的飞速发展


生物医学数 据分析技术
– 大数据存储、分析技术的广 泛使用 – 生物医学数据分析技术

• 基因组 • 蛋白质组
信ቤተ መጻሕፍቲ ባይዱ
大数据存 储、分析 的软硬件 技术 基因测序技术、 医疗数据电子化
– 生物医药领域用户数量目前已超过160家 – 主要集中在药物研发、健康医疗、生物信息学,以及生物分子动 力学相关的模拟上,分别占比16%、27%、26%和14%,其他还 有一些跟微生物、生物与环境相互影响等研究


– 药物研发
2、典型应用:药物研发
基于受体的药物虚拟筛选
拉病毒蛋白VP35的对接
1、超算中心介绍
天河二号的创新
– 自主定制互连网络 – 层次式加速存储架构 – 高效自治的软件栈
医 息 网 中 华 院 信 大 络 会
– 异构多态体系结构
– 高密度高精度结构工艺
2013.6~至今 2014.6~至今
世界超级计算机Top500排行榜 “六连冠”
世界共轭梯度HPCG排行榜“四连冠”
...
IO增强 计算结点 IO增强 计算结点
Phi #48000 IVB #32000 FT-1500 #4096
...
登录 结点 管理 结点
分 布 式 本 地 化 存 储
IO存 存 存 存
加速存储 IP存 存 存 存 IB存 存 存 存
CPM
共享 共享 存储 存储
大规模混合层次式并行存储系统
12.4PB
20
16
6
1、超算中心介绍
目标与定位:具有中国特色的世界一流超算中心
会 大 网 络
大科学
大工程
院 信 息
新产业
科学研究平台
16 中 华
技术创新平台
交流合作平台
学科建设平台
20

人才培养平台
7
2、目前应用概况
1. 面向学术前沿基础研究
– 大科学重大创新成果
信 息
2. 面向国家重大发展战略


华南地区(天气尺度)
– 心肌钙动力学研究对心脏疾病
院 信
诊疗具有重要科学意义

– 4096 结点,共 80 万核,实测

性能 1.27 Pflops
20
– 首个大规模CPU/MIC异构并行 心肌钙动力学真实应用
16




15
2、典型应用:健康医疗
肿瘤信息学数据分析平台
– 全基因组重测序 – 外显子组测序 – 转录组数据分析
基于配体的药物虚拟筛选
– 提供化学结构数据库查询管理
络 信 息 网 大
化学结构查询
– 中大药学院研发的药物设计平台 – 基于配体的药物虚拟筛选

– 基于WEGA的药物重定位与靶标探索
华 医
20
16


14
2、典型应用:健康医疗
病理研究
– 心脏亚细胞钙离子动力学模拟
息 网
左-肌纤维节, 右-钙离子释放单元
22
16



2、典型应用:组织器官模拟
兔子心脏电传播模拟
– 模拟了在心脏底部进行电激励后,心脏内部的电传播情况
息 网 20 16 中 华 医 院 信 络 大 会
23
2、典型应用:三维重构
神经内部结构三维重建
– 天河二号上重建后的神经三维立体图像
息 网 络
– 无论神经大体结构还是精细结构,均清晰可见
院 信
20
16





24
3、未来应用拓展方向:精准医疗
精准医疗
新兴方法。
信 息 网 络 医 院 大
– 将个人基因、环境与生活习惯差异考虑在内的疾病预防与处置的

– 在美、英等多国获得国家层面的支持 – 中国也开始了精准医疗部署
中 华
2015.2. 国家 成立中国精 准医疗战略 专家组
2015.3. 科 技部召开国 家首次精准 医学战略专 家会议
20 16


29
4、总结
高性能计算与大数据处理融合发展趋势


– 大力支持生物医药大数据
网 络 大
– 构建支撑精准医疗的基础设施和服务平台
信 息


20
16




30
谢 谢
20 16 中 华 医 院 信 息
开放、合作、创新、发展




31
– 160万CPU和MIC核协同计算 埃博拉病毒药物筛选 选
16 中 华 医 院 信 络 息 网 大
– 使用分子对接技术,针对与埃博
– 一天完成4000万分子化合物的抗 – 国际上目前最快的已知化合物筛 – 为应对爆发性恶性传染病的应急
20
药物快速研发提供了强大的计算
模拟保障
13

2、典型应用:药物研发

大工程重大应用突破
中 华
3. 面向地方经济社会发展

产业转型升级新动力
20
16




8
2、目前应用概况
应用分类
– 云计算应用
络 20 16 中 华 医 院 信 息 网 大
– 高性能计算应用
– 大数据应用
总体情况
– 用户数量目前已超过1200家 – 支撑国家级课题超过400项 – 广东省/广州市课题超过80项
中 院 信 网 络
篇文献摘要及超过百万篇的全文 Access 全文进行并行挖掘

其他相关应用
期预警
20
– 使用心电大数据研究心脏性猝死早
– 基于大数据的临床抗菌药物合理使 用
17
16




2、典型应用:生物信息学
基因组学分析
– 全基因组重测序,外显子,SNP
息 网 20 16 中 华 医 院 信
相关文档
最新文档