超级计算机技术在生物医药领域的应用与发展
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
络
大
会
21
2、典型应用:生物大分子研究
分子动力学及第一性原理计算
– HIV与硫酸茚地那韦相互作用机制
息 网
– Hartree-Fock自洽场迭代(SCF)
院 信
– 模拟2938原子,基函数阶数27394
华 医
– 使用8100结点 ,共156 万核,并行效率
中
达70%
20
生物大分子结构
– 核糖体结构的建模和动态结构模拟
– 高性能计算:是科学研究的三大手段之一
网 络 大
– 大数据处理:正成为科学研究的第四范式
世界各国争相角逐超级计算机系统的主导地位
医 院 信 息
20
16
中
华
会
3
1、超算中心介绍
天河二号超级计算机系统
• 国家863计划和核高基重大专项的 标志性成果,2013年6月研制成 功,位列世界超算Top500排行榜 第一位
4. 人工智能医生
– 协助医生提供个性化的 癌症治疗方案
大 会
– 病历、影像、文献分析
络
– 广泛应用于癌症治疗、 产前检查等
16 中 华 20 医 院
信
2、目前应用概况—超算与生物医药
主要应用
络 20 16 中 华 医 院 信 息 网
– 健康医疗 – 生物信息学 – 生物分子动力学模拟
总体情况
网
超算在生物医药领域的应用
络
01
OUTLINE 主要内容
超算中心介绍
16
中
20
华
04
医
03
信
息
网
络
02
院
目前应用概况
国家超级计算广州中心
NATIONAL SUPERCOMPUTER CENTER IN GUANGZHOU
大
未来拓展方向
总结
会
2
1、超算中心介绍
超级计算机对科学发现、技术创新、产业革命的重要作用
– 建立百万人级别的数据库
信
•基因数据
医
息
网
– 基于这些数据开展研究
络
•药物基因组学,用合适的药物、
合适的剂量治疗病人
•生物样本
16 中
院
•电子健康记录
•设定新的治疗和预防疾病目标 •测试移动设备以鼓励健康行为 •寻找更多疾病的科学基础
•生活饮食信息
20
华
大
会
4、总结
病
中 华 医 院 信 息 网 络 大 会
– 宏基因组分析 – 全基因组DNA甲基化测序
人类全基因组重测序
– 2000人基因组 30X深度测序 – 8小时完成原来8个月的工作量
络
大
会
18
2、典型应用:生物信息学
基因调控网络
– 通过贝叶斯法构造高等植物(鼠
网 息 络 信
耳芥)的全基因组调控网络 – 全基因组调控网络有助于从基因
院
组尺度理解基因调控作用
20 16 中
– 支持数据的可视化支持数据共享功 能
– 支持自定义工具的添加
大
会
20
2、典型应用:生物大分子研究
分子动力学及第一性原理计算
– 离子液体溶解真实纤维素的分子动力学
息 网 20 16 中 华 医 院 信
模拟的纤维素初始及结束构象
模拟
– 问题规模:320000+ atoms
– Gromacs 5.0.4单精度 22ns/day – Gromacs 5.0.4双精度 12ns/day – 得到了初步的溶解过程,探索了阴阳离 子的作用机制
SW M SW M SW M SW M
院
BTM
BTM
BTM
BTM
TH-Net
华
APM
机框
(16 x cn)
服务处理 系统
服务 结点 登录 结点
医
BTM
SW M
BTM
SW M
BTM
SW M
BTM
SW M
NRM
NRM
NRM
NRM
NRM
NRM
NRM
NRM
32个计算节点
32个计算节点 机柜0
32个计算节点
32个计算节点
20
– 医学前沿技术
16
华
医
院
息
络
3、未来应用拓展方向:精准医疗
精准医疗的短期目标:癌症治疗
– 研究多种药物的联合疗法的有效性
信 络 大
– 针对不同人群的靶向抗肿瘤药物的试验
网
– 研究抗药性产生的原因和克服方法
医 院 息
20
16
中
华
会
3、未来应用拓展方向:精准医疗
精准医疗的长期目标:健康管理
会
2、目前应用概况—超算与生物医药
1. 组织器官的模拟
– 心脏瓣膜跟血液的相互作用
信 息 络 大
– 腹主动脉瘤
网
2. 药物研发
– 使用分子对接技术发现HIV-1 蛋白酶抑制剂
20
16
中
华
医
院
会
2、目前应用概况—超算与生物医药
3. 人类基因组相关研究
– 基因组装
– 全基因组重测序及相关 应用
网 息
华 医
– 8192 结点、160 万核,2.2亿单 元规模的科学应用运行3小时
蛋白组学研究
– 质谱,代谢组 – 翻译后修饰
20
16
中
大
会
19
2、典型应用:生物信息学
Galaxy生物信息分析平台
络 网 华 医 院 信 息
– 基于WEB的开放性生物信息分析平 台。 – 支持多种数据上传方式 – 支持多款生物信息分析相关的工具 – 支持工作流的创建、历史记录功能 – 支持用户管理功能
网
络
大
制冷
密闭水风冷
会
17.8 MW (1902MFlops/W)
TH-2 系统
机柜
32个计算节点
信
息
(8 x 机框)
机柜63 32个计算节点 32个计算节点 32个计算节点 32个计算节点 32个计算节点 机柜124 32个计算节点 32个计算节点 NRM NRM NRM NRM NRM NRM NRM NRM 576端口交换机0 576端口交换机i 576端口交换机j 576端口交换机12
32个计算节点
32个计算节点 机柜62
32个计算节点
32个计算节点
中
16
计算主板
ION
自主cpu阵列 飞腾计算结点 飞腾计算结点
商用cpu计算阵列 计算结点 计算结点
商用cpu计算阵列
IO增强 计算结点
20
IO增强 计算结点
...
飞腾计算结点 飞腾计算结点 IO服务结点
...
计算结点 计算结点 IO服务结点
• 广东省、广州市、国防科技大学 、中山大学联合共建
• 2015年8月20日,经广州市委常 委会审议通过,由中山大学负责 广州超算中心的运行管理
20
16
• 2014年4月对外试运行
中
华
医
院
国家超级计算广州中心
信
息
网
络
大
会
4
1、超算中心介绍
性能 系统 机柜 能耗 54.9PFlops / 33.86PFlops 16000结点, 1.4PB内存 125+8+13+24=170 (720m2)
医 院 信 息 网 20 16 中 华 络 大 会
– DNA甲基化数据分析以及ChIP-seq数 据分析
应用
– 完成500 对大肠癌患者样本(癌组织
和对照)的全基因组/外显子组测序和 分析
16
2、典型应用:健康医疗
生物医药文献挖掘
– 生物医学文献库PubMed包含超过两千万 – 使用MEDLINE摘要和PMC Open – 构建“肿瘤-基因-药物”关系数据
20
16
2016 列入 国家重点 研发计划
3、未来应用拓展方向:精准医疗
精准医疗技术背景
大
– 基因测序技术的飞速发展
网
会
生物医学数 据分析技术
– 大数据存储、分析技术的广 泛使用 – 生物医学数据分析技术
中
• 基因组 • 蛋白质组
信ቤተ መጻሕፍቲ ባይዱ
大数据存 储、分析 的软硬件 技术 基因测序技术、 医疗数据电子化
– 生物医药领域用户数量目前已超过160家 – 主要集中在药物研发、健康医疗、生物信息学,以及生物分子动 力学相关的模拟上,分别占比16%、27%、26%和14%,其他还 有一些跟微生物、生物与环境相互影响等研究
大
会
– 药物研发
2、典型应用:药物研发
基于受体的药物虚拟筛选
拉病毒蛋白VP35的对接
1、超算中心介绍
天河二号的创新
– 自主定制互连网络 – 层次式加速存储架构 – 高效自治的软件栈
医 息 网 中 华 院 信 大 络 会
– 异构多态体系结构
– 高密度高精度结构工艺
2013.6~至今 2014.6~至今
世界超级计算机Top500排行榜 “六连冠”
世界共轭梯度HPCG排行榜“四连冠”
...
IO增强 计算结点 IO增强 计算结点
Phi #48000 IVB #32000 FT-1500 #4096
...
登录 结点 管理 结点
分 布 式 本 地 化 存 储
IO存 存 存 存
加速存储 IP存 存 存 存 IB存 存 存 存
CPM
共享 共享 存储 存储
大规模混合层次式并行存储系统
12.4PB
20
16
6
1、超算中心介绍
目标与定位:具有中国特色的世界一流超算中心
会 大 网 络
大科学
大工程
院 信 息
新产业
科学研究平台
16 中 华
技术创新平台
交流合作平台
学科建设平台
20
医
人才培养平台
7
2、目前应用概况
1. 面向学术前沿基础研究
– 大科学重大创新成果
信 息
2. 面向国家重大发展战略
医
网
华南地区(天气尺度)
– 心肌钙动力学研究对心脏疾病
院 信
诊疗具有重要科学意义
医
– 4096 结点,共 80 万核,实测
中
性能 1.27 Pflops
20
– 首个大规模CPU/MIC异构并行 心肌钙动力学真实应用
16
华
络
大
会
15
2、典型应用:健康医疗
肿瘤信息学数据分析平台
– 全基因组重测序 – 外显子组测序 – 转录组数据分析
基于配体的药物虚拟筛选
– 提供化学结构数据库查询管理
络 信 息 网 大
化学结构查询
– 中大药学院研发的药物设计平台 – 基于配体的药物虚拟筛选
院
– 基于WEGA的药物重定位与靶标探索
华 医
20
16
中
会
14
2、典型应用:健康医疗
病理研究
– 心脏亚细胞钙离子动力学模拟
息 网
左-肌纤维节, 右-钙离子释放单元
22
16
络
大
会
2、典型应用:组织器官模拟
兔子心脏电传播模拟
– 模拟了在心脏底部进行电激励后,心脏内部的电传播情况
息 网 20 16 中 华 医 院 信 络 大 会
23
2、典型应用:三维重构
神经内部结构三维重建
– 天河二号上重建后的神经三维立体图像
息 网 络
– 无论神经大体结构还是精细结构,均清晰可见
院 信
20
16
中
华
医
大
会
24
3、未来应用拓展方向:精准医疗
精准医疗
新兴方法。
信 息 网 络 医 院 大
– 将个人基因、环境与生活习惯差异考虑在内的疾病预防与处置的
会
– 在美、英等多国获得国家层面的支持 – 中国也开始了精准医疗部署
中 华
2015.2. 国家 成立中国精 准医疗战略 专家组
2015.3. 科 技部召开国 家首次精准 医学战略专 家会议
20 16
人
药
29
4、总结
高性能计算与大数据处理融合发展趋势
会
人
– 大力支持生物医药大数据
网 络 大
– 构建支撑精准医疗的基础设施和服务平台
信 息
病
药
20
16
中
华
医
院
30
谢 谢
20 16 中 华 医 院 信 息
开放、合作、创新、发展
网
络
大
会
31
– 160万CPU和MIC核协同计算 埃博拉病毒药物筛选 选
16 中 华 医 院 信 络 息 网 大
– 使用分子对接技术,针对与埃博
– 一天完成4000万分子化合物的抗 – 国际上目前最快的已知化合物筛 – 为应对爆发性恶性传染病的应急
20
药物快速研发提供了强大的计算
模拟保障
13
会
2、典型应用:药物研发
–
大工程重大应用突破
中 华
3. 面向地方经济社会发展
–
产业转型升级新动力
20
16
院
络
大
会
8
2、目前应用概况
应用分类
– 云计算应用
络 20 16 中 华 医 院 信 息 网 大
– 高性能计算应用
– 大数据应用
总体情况
– 用户数量目前已超过1200家 – 支撑国家级课题超过400项 – 广东省/广州市课题超过80项
中 院 信 网 络
篇文献摘要及超过百万篇的全文 Access 全文进行并行挖掘
息
其他相关应用
期预警
20
– 使用心电大数据研究心脏性猝死早
– 基于大数据的临床抗菌药物合理使 用
17
16
华
医
大
会
2、典型应用:生物信息学
基因组学分析
– 全基因组重测序,外显子,SNP
息 网 20 16 中 华 医 院 信