大数据与精准医学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“I want the country that eliminated polio and mapped the human genome to lead a new era of medicine – one that delivers the right treatment at the right time…... Tonight, I'm launching a new Precision Medicine Initiative to bring us closer to curing diseases like cancer and diabetes – and to give all of us access to the personalized information we need to keep ourselves and our families healthier.” State of the Union Address (国情咨文2015) Tuesday, January 20, 2015
HiSeq X Ten由10台HiSeq X测序仪组成,是定位为“测序工厂”模式的系统,适合运行 于大型基因组测序中心,为各类生命科学和生物医学研究提供海量、高效率的测序服 务。该测序仪每台每次运行仅需要3天时间,即可产出高达1.8Tb的数据,数据产出效 率为现主流测序仪HiSeq 2000的12倍。整套系统每年可完成18,000 人全基因组测序
Applied Biosystems ABI 3730XL 1 Mb /day
Roche / 454 Genome Sequencer FLX 1000 Mb/run
Illumina / Solexa/HiSeq2500 Genetic Analyzer 800 Gb/run
Applied Biosystems Ion Proton 12 Gb/run
consulting report
See of biological data
???
Hypothesis/ knowledge
Outline
• Concept and Background • Driven by genomics technology
Fra Baidu bibliotek
• Insight into biomedical big data
Outline
• Concept and Background • Driven by genomics technology
• Insight into biomedical big data
• Challenge and opportunity • Bioinofrmatics is a key
Philips与Illumina合作将基因组数据解释临床化
• 此次合作旨在结合Illumina世界级的DNA测序技术、BaseSpace Sequence Hub和飞利浦基于云端的创新基因组学平台,获取、分析并解释癌症研究 中的基因组学数据,并将基因组学连接到日常的医疗保健中,此过程将 会整合患者数据,嵌入到临床路径中,并由实效证据和医疗补偿模式所 支持。 • 整合Illumina用于大规模分析遗传变异与功能的测序系统和飞利浦的 IntelliSpace Genomics临床信息学平台,飞利浦将与Illumina合作开发全新 的解决方案,旨在从肿瘤学病例中获得、分析、注释与解释基因组学数 据。这些数据将会从与仪器相连的Illumina BaseSpace®Sequence Hub中获 得,然后通过飞利浦针对肿瘤学的IntelliSpace Genomics系统进行处理。 • 这样一个解决方案会从包括放射学、免疫组织化学、数字病理学、医疗 记录以及实验室检测等多个渠道整合数据,然后在一个控制面板视图中 显示出来。这个系统让研究人员更加高效地获取有价值信息,最终降低 医疗成本,改善治疗效果。
IntelliSpace Genomics & BaseSpace® Sequence Hub
IntelliSpace Genomics是一个飞利浦数字健康平台驱动的生态系统, 安全、基于云端技术,包括系统、临床应用以及数字化工具,具有 大数据管理、预测分析、人工智能和物联网(IoT)功能,帮助临床
Illumina NovaSeq6000测序仪
100$可实现一个人的全基因组测序
在2017年1月10号的摩根 大通医疗健康年会上 Illumina 公布了 2016 年的 市场表现和进入百美元 基因组测序时代的最新 测 序 仪 NovaSeq 。 其 中 NovaSeq6000 型 号 的 测 序仪满负荷 40 小时内可 以产出6TB的测序数据, 即可实现200个人的样本 的全基因组测序。每年 可完成43800个人的全基 因组测序,测序能力是 HiSeq X Ten 的单台机器 的将近 2.5 倍。测序价格 也许很快降到HiSeqX Ten 的价格的十分之一左右。
2016年7月,在华盛顿举行的“癌症登月计划” (Cancer Moonshot)高峰会上,美国副总统拜登宣布了 一系列推动提早终结癌症的新举措。其中10大重点方向:
1、建立一个能让患者直接参与的癌症研究数据合作网络
2、建立一个专注于癌症免疫疗法临床试验合作网 3、研发克服肿瘤抗药性的方法 4、建立一个全国性的癌症数据生态系统 5、加强对于儿科癌症主要致病因素的研究 6、尽量减少癌症疗法使机体衰弱的副作用 7、扩大使用已被批准的癌症预防和早期诊断方法
Clinical Application & Demonstration
Project 5:Biomarker & Drug Target Discovery
Project 6:Integrated Clinical Application & Demonstration Platform
美国国家“癌症登月计划”与大数据
Project 3: Data Center & Technology Infrastructure TCGA& ICGC like Data Repository
Project 4: Precision Protocol & Diagnosis Route for the Treatments of Diseases
Chinese version of Precision Medicine
Basic Researches & General Technologies Project 1: Integrated “Omics” Technologies
Project 2: Precision Medicine Initiative Cohort Program (PMI-CP)
IBM与Illumina合作将基因组数据解释智能化
• 2017年1月9日——IBM Watson健康和 Illumina公司宣布达成合作意向,将 整合基因组学智能计算平台Watson for Genomics与Illumina的BaseSpace Sequence Hub(Illumina cloud-based genomics computing environment for next-generation sequencing (NGS) data management and analysis )以及肿 瘤测序流程来扩展对基因组数据的解释。希望能够促进简化基因组数据 解释的流程并将其标准化。 • Watson for Genomics嵌入Illumina的新一代测序平台以后,使用Illumina癌 症基因组测序panel的研究人员将会迅速获得基因变异相关的功能和临床 意义信息,这有助于解释由TruSight Tumor 170(170个基因的实体瘤基因 检测panel)生成的一系列变异数据。 • Watson for Genomics可在短短几分钟内读取TruSight Tumor 170生成的基因 突变数据,同时对大量专业指南、医学印刷品、临床试验手册以及其他 知识来源进行梳理,然后提供每个基因组变异的相关信息,并生成一份 可供研究人员使用的报告——这一过程通常会花费一周以上的时间才能够 完成。Watson for Genomics每个月可以解读大约10000篇左右科学论文以 及100项新临床试验数据。
关键是生物医学大数据的整合、挖掘与知识发现与管理
基于大数据的精准的临床应用 持续推动临床诊疗进步
药物基因组学检测 能够帮助我们确定
诊断和治疗的遗传检测
能够帮助我们确定 Familial screening for disease Improve prognostic evaluation Therapeutic decisions
BioMedical Big Data and Precision Medicine
Yixue Li
yxli@sibs.ac.cn CAS-MPG Partner Instititut of Computational Biology Shanghai Center for Bioinformation Technology
8、通过挖掘过去的患者数据以预测未来患者的疗效
9、开发肿瘤三维图谱 10、开发新的癌症相关检测技术
大数据时代人的智力 受到巨大挑战!
See of web-text data
Google
Hypothesis/ knowledge
See of Bio-medical data
Clinical pathway/
肿瘤基因图谱可以 指导靶向治疗 Clinically actionable results Comprehensive coverage Detects all types of cancer causing mutations
The Right Drug
The Right Dose The Right indication
精准医疗概念
在大样本研究获得疾病分子机制的知识体系 基础上,以生物医学特别是组学数据为依据,根 据患者个体在基因型、表型、环境和生活方式等 各方面的特异性,应用现代遗传学、分子影像学、
生物信息学和临床医学等方法与手段,制定个性
化精准预防、精准诊断和精准治疗方案。
精准医疗背后是大数据!!!
精确医学与个体为中心的数据知识网络以及疾病分类关系
NovaSeq 6000 系统
新一代测序技术可以干什么?
• • • • • •
目标序列捕获测序技术(Targeted Resequencing) 循环肿瘤DNA/细胞测序(ctDNA/ctcDNA) 免疫组库测序 (IR-SEQ) 单细胞转录因子结合位点测序(scATAC-seq) 大规模单细胞转录组测序(Drop-seq) ……
• Challenge and opportunity • Bioinofrmatics is a key
新一代基因组技术的发展和应用
The Next Generation Sequencing Machine
PacificBio™ Single Molecule Sequencer 3.5Gb /run
医生在第一时间作出正确的决定。上述功能让飞利浦IntelliSpace
Genomics能够随时随地为医生和专家提供关于治疗方案的可行信息。 BaseSpace® Sequence Hub是一个基于云端的平台,延伸了Illumina仪
器获取并分析基因组数据的功能,能够管理测序运行和Illumina测序
精准医疗研究已成为新一轮国家之间科技 竞争热点和引领国际发展潮流的战略制高点
Precision Medicine Initiative USA 美国精准医学计划
“我希望这个消灭小儿痲痺与绘制人类基因组图谱的国家,能领导医 学新纪元,能够在正确的时间为患者提供正确的治疗。……今晚我要发起 新‘精准医学计划’,让我们离治愈癌症、糖尿病与其他疾病更近一步, 并让我们所有人能获得让自己与家人更健康所需要的个性化信息。”
平台并优化操作体验。一系列超值的Illumina与生态系统分析应用都 可以在该平台上共享基因组数据。
HiSeq X Ten由10台HiSeq X测序仪组成,是定位为“测序工厂”模式的系统,适合运行 于大型基因组测序中心,为各类生命科学和生物医学研究提供海量、高效率的测序服 务。该测序仪每台每次运行仅需要3天时间,即可产出高达1.8Tb的数据,数据产出效 率为现主流测序仪HiSeq 2000的12倍。整套系统每年可完成18,000 人全基因组测序
Applied Biosystems ABI 3730XL 1 Mb /day
Roche / 454 Genome Sequencer FLX 1000 Mb/run
Illumina / Solexa/HiSeq2500 Genetic Analyzer 800 Gb/run
Applied Biosystems Ion Proton 12 Gb/run
consulting report
See of biological data
???
Hypothesis/ knowledge
Outline
• Concept and Background • Driven by genomics technology
Fra Baidu bibliotek
• Insight into biomedical big data
Outline
• Concept and Background • Driven by genomics technology
• Insight into biomedical big data
• Challenge and opportunity • Bioinofrmatics is a key
Philips与Illumina合作将基因组数据解释临床化
• 此次合作旨在结合Illumina世界级的DNA测序技术、BaseSpace Sequence Hub和飞利浦基于云端的创新基因组学平台,获取、分析并解释癌症研究 中的基因组学数据,并将基因组学连接到日常的医疗保健中,此过程将 会整合患者数据,嵌入到临床路径中,并由实效证据和医疗补偿模式所 支持。 • 整合Illumina用于大规模分析遗传变异与功能的测序系统和飞利浦的 IntelliSpace Genomics临床信息学平台,飞利浦将与Illumina合作开发全新 的解决方案,旨在从肿瘤学病例中获得、分析、注释与解释基因组学数 据。这些数据将会从与仪器相连的Illumina BaseSpace®Sequence Hub中获 得,然后通过飞利浦针对肿瘤学的IntelliSpace Genomics系统进行处理。 • 这样一个解决方案会从包括放射学、免疫组织化学、数字病理学、医疗 记录以及实验室检测等多个渠道整合数据,然后在一个控制面板视图中 显示出来。这个系统让研究人员更加高效地获取有价值信息,最终降低 医疗成本,改善治疗效果。
IntelliSpace Genomics & BaseSpace® Sequence Hub
IntelliSpace Genomics是一个飞利浦数字健康平台驱动的生态系统, 安全、基于云端技术,包括系统、临床应用以及数字化工具,具有 大数据管理、预测分析、人工智能和物联网(IoT)功能,帮助临床
Illumina NovaSeq6000测序仪
100$可实现一个人的全基因组测序
在2017年1月10号的摩根 大通医疗健康年会上 Illumina 公布了 2016 年的 市场表现和进入百美元 基因组测序时代的最新 测 序 仪 NovaSeq 。 其 中 NovaSeq6000 型 号 的 测 序仪满负荷 40 小时内可 以产出6TB的测序数据, 即可实现200个人的样本 的全基因组测序。每年 可完成43800个人的全基 因组测序,测序能力是 HiSeq X Ten 的单台机器 的将近 2.5 倍。测序价格 也许很快降到HiSeqX Ten 的价格的十分之一左右。
2016年7月,在华盛顿举行的“癌症登月计划” (Cancer Moonshot)高峰会上,美国副总统拜登宣布了 一系列推动提早终结癌症的新举措。其中10大重点方向:
1、建立一个能让患者直接参与的癌症研究数据合作网络
2、建立一个专注于癌症免疫疗法临床试验合作网 3、研发克服肿瘤抗药性的方法 4、建立一个全国性的癌症数据生态系统 5、加强对于儿科癌症主要致病因素的研究 6、尽量减少癌症疗法使机体衰弱的副作用 7、扩大使用已被批准的癌症预防和早期诊断方法
Clinical Application & Demonstration
Project 5:Biomarker & Drug Target Discovery
Project 6:Integrated Clinical Application & Demonstration Platform
美国国家“癌症登月计划”与大数据
Project 3: Data Center & Technology Infrastructure TCGA& ICGC like Data Repository
Project 4: Precision Protocol & Diagnosis Route for the Treatments of Diseases
Chinese version of Precision Medicine
Basic Researches & General Technologies Project 1: Integrated “Omics” Technologies
Project 2: Precision Medicine Initiative Cohort Program (PMI-CP)
IBM与Illumina合作将基因组数据解释智能化
• 2017年1月9日——IBM Watson健康和 Illumina公司宣布达成合作意向,将 整合基因组学智能计算平台Watson for Genomics与Illumina的BaseSpace Sequence Hub(Illumina cloud-based genomics computing environment for next-generation sequencing (NGS) data management and analysis )以及肿 瘤测序流程来扩展对基因组数据的解释。希望能够促进简化基因组数据 解释的流程并将其标准化。 • Watson for Genomics嵌入Illumina的新一代测序平台以后,使用Illumina癌 症基因组测序panel的研究人员将会迅速获得基因变异相关的功能和临床 意义信息,这有助于解释由TruSight Tumor 170(170个基因的实体瘤基因 检测panel)生成的一系列变异数据。 • Watson for Genomics可在短短几分钟内读取TruSight Tumor 170生成的基因 突变数据,同时对大量专业指南、医学印刷品、临床试验手册以及其他 知识来源进行梳理,然后提供每个基因组变异的相关信息,并生成一份 可供研究人员使用的报告——这一过程通常会花费一周以上的时间才能够 完成。Watson for Genomics每个月可以解读大约10000篇左右科学论文以 及100项新临床试验数据。
关键是生物医学大数据的整合、挖掘与知识发现与管理
基于大数据的精准的临床应用 持续推动临床诊疗进步
药物基因组学检测 能够帮助我们确定
诊断和治疗的遗传检测
能够帮助我们确定 Familial screening for disease Improve prognostic evaluation Therapeutic decisions
BioMedical Big Data and Precision Medicine
Yixue Li
yxli@sibs.ac.cn CAS-MPG Partner Instititut of Computational Biology Shanghai Center for Bioinformation Technology
8、通过挖掘过去的患者数据以预测未来患者的疗效
9、开发肿瘤三维图谱 10、开发新的癌症相关检测技术
大数据时代人的智力 受到巨大挑战!
See of web-text data
Hypothesis/ knowledge
See of Bio-medical data
Clinical pathway/
肿瘤基因图谱可以 指导靶向治疗 Clinically actionable results Comprehensive coverage Detects all types of cancer causing mutations
The Right Drug
The Right Dose The Right indication
精准医疗概念
在大样本研究获得疾病分子机制的知识体系 基础上,以生物医学特别是组学数据为依据,根 据患者个体在基因型、表型、环境和生活方式等 各方面的特异性,应用现代遗传学、分子影像学、
生物信息学和临床医学等方法与手段,制定个性
化精准预防、精准诊断和精准治疗方案。
精准医疗背后是大数据!!!
精确医学与个体为中心的数据知识网络以及疾病分类关系
NovaSeq 6000 系统
新一代测序技术可以干什么?
• • • • • •
目标序列捕获测序技术(Targeted Resequencing) 循环肿瘤DNA/细胞测序(ctDNA/ctcDNA) 免疫组库测序 (IR-SEQ) 单细胞转录因子结合位点测序(scATAC-seq) 大规模单细胞转录组测序(Drop-seq) ……
• Challenge and opportunity • Bioinofrmatics is a key
新一代基因组技术的发展和应用
The Next Generation Sequencing Machine
PacificBio™ Single Molecule Sequencer 3.5Gb /run
医生在第一时间作出正确的决定。上述功能让飞利浦IntelliSpace
Genomics能够随时随地为医生和专家提供关于治疗方案的可行信息。 BaseSpace® Sequence Hub是一个基于云端的平台,延伸了Illumina仪
器获取并分析基因组数据的功能,能够管理测序运行和Illumina测序
精准医疗研究已成为新一轮国家之间科技 竞争热点和引领国际发展潮流的战略制高点
Precision Medicine Initiative USA 美国精准医学计划
“我希望这个消灭小儿痲痺与绘制人类基因组图谱的国家,能领导医 学新纪元,能够在正确的时间为患者提供正确的治疗。……今晚我要发起 新‘精准医学计划’,让我们离治愈癌症、糖尿病与其他疾病更近一步, 并让我们所有人能获得让自己与家人更健康所需要的个性化信息。”
平台并优化操作体验。一系列超值的Illumina与生态系统分析应用都 可以在该平台上共享基因组数据。