2019年加快基因组学发现以实现精准医疗大数据报告(完整版)图文
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• GPU 计算 • 高速网络连接 • 快速存储 • 使用方面的政策和程序
通过逐步了解 MGH & BWH 临床数据科学 (CCDS) 中心的典型项目工作流,本论文探究了 建立该本地系统的原因、必须解决的挑战、以及关于在整个项目周期内如何利用该工具的 案例研究。我们的目标是当其它团队设法在医院环境中实施深度学习时,帮助他们快速 启动其硬件工作。
开发医院深度学习模型: 关于临床数据科学中心的案例研究
Neil A.Tenenholtz* R.Winston Larson* Adam McCarthy*†
Robert Keating‡
Thomas Schultz*
Mark H.Michalski*
1 简介
随着医学深度学习领域从研究发展到临床应用,实际方面的考量迅速成为运营领导层首要 关注的问题。硬件基础设施,虽然是关键要素,但是出现了临床领域的独特挑战。所必须 的组成包括:
疑难病例 我们的经验建议是,用深度学习方法打造临床影响需要的不仅仅是前沿算法。关键组成包括:
• 临床医生从项目开端即参与进来,以明确高价值的使用情况 • 可访问带注解的临床数据集 • 开发机器学习模型 • 整合到临床工作流中 • 模型部署的基础设施 • 在真实世界临床环境中进行验证
专门的硬件基础设施对于多个阶段的成功非常关键,包括促进数据访问、启动模型开发、 为部署及继续改善投入使用的那些模型提供动力。临床实施深度学习的硬件基础设施必须 能够满足深度学习的计算要求,同时也满足为医院投入使用的临床系统设置的严格标准。 在美国,复杂的监管环境(例如,HIPAA)推动了管理患者数据的保守型方法。由于只要 出现一个错误即会造成天文数字般庞大的成本代价,从责任和辜负患者信赖方面来说, 许多医疗保健机构对使用第三方 IT 基础设施非常谨慎,因此,迫使他们建立自己的基础 设施。 大部分医院在高性能计算基础设施方面的经验有限,从而更加加重了这些挑战的困难程度。 传统临床系统的计算需求比较有限。因此,高性能 GPU、高速网络连接、高性能存储和训 练神经网络所需的宽带接入模式均超出了医院 IT 团队的能力范围,其倾向于专门研究高度 可靠、正常运行时间长的系统,符合更适度的计算和数据访问要求。 我们已制定了解决这些问题的解决方案并将继续进行完善。贯穿本论文的其余部分,我们 将简要介绍典型的项目周期(图 1),重点突出硬件的重要作用和经验总结,这也能应用 于其它临床环境中。
团队结构:根据我们的经验,由临床倡导者、临床创新研究员、软件工程师和机器学习 科学家组成的团队能提供模型开发和部署的高效方法。
3.1.1 保护患者数据
应用案例和团队确立后,向机构审查委员会 (IRB) 提交申请,以获取查询相关数据的许可。 在所有 CCDS 项目中,患者隐私最让人关注,且决定了项目工作流。除了关于使用受保护 的健康信息 (PHI) 的复杂监管环境外,在更基本的层面上,医院将自己视为所有患者的 医疗数据的管理员并非常认真对待隐私问题。作为该承诺的一部分,数据不得泄露出机构之 外,包括云计算平台上的存储或计算数据。此外,所有数据保存在数据中心的服务器上, 不得下载到当地设备或工作站中。通过用户权限控制数据访问,映射到已获批的 IRB 申请上 所列的人。此数据访问划分确保了个人科学家只能查看执行他或她的获批项目所需的 数据,还保证了所有项目团队成员均接受了处理患者数据的培训,这是 IRB 批准的先决条件。
2 背景
医学深度学习应用最近已引起了研究界的重大关注,发表研究工作的一阵热潮证明了患者 诊断方面的神经网络潜在价值。可是,在医院日常运营中执行这些算法的活动非常有限。 MGH & BWH 临床数据科学 (CCDS) 中心专注于开发深度学习模型,然后将其整合成临床 工作流,设法增强临床医生的诊断能力。我们的任务是,通过打造对临床疗效、治疗成本 和患者结果有影响的产品,加速医学深度学习的应用。 凭借计算机视觉方面的新近进展,我们的前期努力针对于将最新方法应用于医学成像。 专注于该放射学和病理学的最初焦点之后,我们打算扩展至其它类型的临床数据,包括 电子病历 (EMR)、医院运营和遗传学。在 CCDS,我们的项目集中于与临床医生共同合作, 建立能在诊所中产生即时影响的机器学习模型。并非要取代临床医生,我们而是要设法 提高临床医生高效有效地各尽其职的能力,即为其提供一套更全面的工具由其随意使用。 在放射科,这包括但不限于:
图 1:以下详细讨论,CCDS 的典型项目周期是以放射科医生的持续输入以及对近期研究的 频繁评估这些临床反馈为基础的。
2
图 2:理想的应用案例以任务为目标,该任务应具有临床相关性、能提供放射科医师的 工作流价值、且进行的次数足够多以便能够提供网络培训数据。
3 模型百度文库发
3.1 应用案例定义
在早期,我们在 CCDS 意识到从项目启动时纳入临床医生的重要性。尤其是放射科工作流 对不精通工作流做法的人来说不够直观,存在各种各样重要而微小的细节,未花足够时间 阅读了解清楚的人可能会忽略这些细节。因此,为了确保临床相关解决方案的制定,主治 医生作为每个项目的临床倡导者,帮助明确高层次项目愿景、具体说明产品要求和在需要 时提供放射学专业知识。 虽然由机器学习科学家和 软件工程师组成的技术团队直接与临床倡导者共事,日常活动中 会经常出现问题,这些问题不需要时间宝贵的临床倡导者的专业技能来解决。为了应付 部分工作,团队还包括有临床创新研究员,通常是具有定量研究背景的初级医生,其能够 提供一般的临床情境并作为产品所有者,发出顾客的呼声。临床创新研究员还通过量化 各种不同放射科测试的频次和探究潜在市场影响,协助确定项目优先级。
*美国马萨诸塞州波士顿 MGH & BWH 临床数据科学中心 †英国牛津市牛津大学计算机科学系 ‡美国加利福尼亚州圣克拉拉县 Nvidia(英伟达)公司
1
• 工作明细优先优先级:识别危重病例,减少治疗时间或在高入住率时清理床位 • 分割影像:重点突出关注的区域,以提高诊断质量和减少每次读取影像的时间 • 计算量:提高测量的准确性和效率 • 建议报告文本:自动生成报告,提高效率 • 自动操作普通任务:加快完成耗时但又必需的任务,从而让临床医生专注于复杂的
通过逐步了解 MGH & BWH 临床数据科学 (CCDS) 中心的典型项目工作流,本论文探究了 建立该本地系统的原因、必须解决的挑战、以及关于在整个项目周期内如何利用该工具的 案例研究。我们的目标是当其它团队设法在医院环境中实施深度学习时,帮助他们快速 启动其硬件工作。
开发医院深度学习模型: 关于临床数据科学中心的案例研究
Neil A.Tenenholtz* R.Winston Larson* Adam McCarthy*†
Robert Keating‡
Thomas Schultz*
Mark H.Michalski*
1 简介
随着医学深度学习领域从研究发展到临床应用,实际方面的考量迅速成为运营领导层首要 关注的问题。硬件基础设施,虽然是关键要素,但是出现了临床领域的独特挑战。所必须 的组成包括:
疑难病例 我们的经验建议是,用深度学习方法打造临床影响需要的不仅仅是前沿算法。关键组成包括:
• 临床医生从项目开端即参与进来,以明确高价值的使用情况 • 可访问带注解的临床数据集 • 开发机器学习模型 • 整合到临床工作流中 • 模型部署的基础设施 • 在真实世界临床环境中进行验证
专门的硬件基础设施对于多个阶段的成功非常关键,包括促进数据访问、启动模型开发、 为部署及继续改善投入使用的那些模型提供动力。临床实施深度学习的硬件基础设施必须 能够满足深度学习的计算要求,同时也满足为医院投入使用的临床系统设置的严格标准。 在美国,复杂的监管环境(例如,HIPAA)推动了管理患者数据的保守型方法。由于只要 出现一个错误即会造成天文数字般庞大的成本代价,从责任和辜负患者信赖方面来说, 许多医疗保健机构对使用第三方 IT 基础设施非常谨慎,因此,迫使他们建立自己的基础 设施。 大部分医院在高性能计算基础设施方面的经验有限,从而更加加重了这些挑战的困难程度。 传统临床系统的计算需求比较有限。因此,高性能 GPU、高速网络连接、高性能存储和训 练神经网络所需的宽带接入模式均超出了医院 IT 团队的能力范围,其倾向于专门研究高度 可靠、正常运行时间长的系统,符合更适度的计算和数据访问要求。 我们已制定了解决这些问题的解决方案并将继续进行完善。贯穿本论文的其余部分,我们 将简要介绍典型的项目周期(图 1),重点突出硬件的重要作用和经验总结,这也能应用 于其它临床环境中。
团队结构:根据我们的经验,由临床倡导者、临床创新研究员、软件工程师和机器学习 科学家组成的团队能提供模型开发和部署的高效方法。
3.1.1 保护患者数据
应用案例和团队确立后,向机构审查委员会 (IRB) 提交申请,以获取查询相关数据的许可。 在所有 CCDS 项目中,患者隐私最让人关注,且决定了项目工作流。除了关于使用受保护 的健康信息 (PHI) 的复杂监管环境外,在更基本的层面上,医院将自己视为所有患者的 医疗数据的管理员并非常认真对待隐私问题。作为该承诺的一部分,数据不得泄露出机构之 外,包括云计算平台上的存储或计算数据。此外,所有数据保存在数据中心的服务器上, 不得下载到当地设备或工作站中。通过用户权限控制数据访问,映射到已获批的 IRB 申请上 所列的人。此数据访问划分确保了个人科学家只能查看执行他或她的获批项目所需的 数据,还保证了所有项目团队成员均接受了处理患者数据的培训,这是 IRB 批准的先决条件。
2 背景
医学深度学习应用最近已引起了研究界的重大关注,发表研究工作的一阵热潮证明了患者 诊断方面的神经网络潜在价值。可是,在医院日常运营中执行这些算法的活动非常有限。 MGH & BWH 临床数据科学 (CCDS) 中心专注于开发深度学习模型,然后将其整合成临床 工作流,设法增强临床医生的诊断能力。我们的任务是,通过打造对临床疗效、治疗成本 和患者结果有影响的产品,加速医学深度学习的应用。 凭借计算机视觉方面的新近进展,我们的前期努力针对于将最新方法应用于医学成像。 专注于该放射学和病理学的最初焦点之后,我们打算扩展至其它类型的临床数据,包括 电子病历 (EMR)、医院运营和遗传学。在 CCDS,我们的项目集中于与临床医生共同合作, 建立能在诊所中产生即时影响的机器学习模型。并非要取代临床医生,我们而是要设法 提高临床医生高效有效地各尽其职的能力,即为其提供一套更全面的工具由其随意使用。 在放射科,这包括但不限于:
图 1:以下详细讨论,CCDS 的典型项目周期是以放射科医生的持续输入以及对近期研究的 频繁评估这些临床反馈为基础的。
2
图 2:理想的应用案例以任务为目标,该任务应具有临床相关性、能提供放射科医师的 工作流价值、且进行的次数足够多以便能够提供网络培训数据。
3 模型百度文库发
3.1 应用案例定义
在早期,我们在 CCDS 意识到从项目启动时纳入临床医生的重要性。尤其是放射科工作流 对不精通工作流做法的人来说不够直观,存在各种各样重要而微小的细节,未花足够时间 阅读了解清楚的人可能会忽略这些细节。因此,为了确保临床相关解决方案的制定,主治 医生作为每个项目的临床倡导者,帮助明确高层次项目愿景、具体说明产品要求和在需要 时提供放射学专业知识。 虽然由机器学习科学家和 软件工程师组成的技术团队直接与临床倡导者共事,日常活动中 会经常出现问题,这些问题不需要时间宝贵的临床倡导者的专业技能来解决。为了应付 部分工作,团队还包括有临床创新研究员,通常是具有定量研究背景的初级医生,其能够 提供一般的临床情境并作为产品所有者,发出顾客的呼声。临床创新研究员还通过量化 各种不同放射科测试的频次和探究潜在市场影响,协助确定项目优先级。
*美国马萨诸塞州波士顿 MGH & BWH 临床数据科学中心 †英国牛津市牛津大学计算机科学系 ‡美国加利福尼亚州圣克拉拉县 Nvidia(英伟达)公司
1
• 工作明细优先优先级:识别危重病例,减少治疗时间或在高入住率时清理床位 • 分割影像:重点突出关注的区域,以提高诊断质量和减少每次读取影像的时间 • 计算量:提高测量的准确性和效率 • 建议报告文本:自动生成报告,提高效率 • 自动操作普通任务:加快完成耗时但又必需的任务,从而让临床医生专注于复杂的