1-秦晓峰-组学大数据平台在肿瘤精准医疗中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
辅助诊断
确 诊
辅助科研
• 致病基因 • 肠道菌群 • 药物代谢/靶标
• 肿瘤驱动基因
用药指导
患者
治 疗
医生
药品
• 药物推荐 • 联合用药指导 • 药物不良反应评估
疾 病 史 分 析
效果 分析
合 理 用 药
改进
研 发
疾病
用药效果分析 表型—药效关系
药品
组学大数据平台与精准医疗
数据资源库 (Data Base)
癌症专家助手
阅读和记忆学习医
疗文献、临床指导和 医学指南
将病人和临床试验 方案进行匹配
持续不断的学习
从不断增加的病人的 组学数据和临床数据 中不断学习
依据最新用药指 导推荐潜在的治
疗选择方案
Watson医生
• 由IBM公司开发
• 人工智能系统 • 询问病人的病征、病史 • 人工智能技术 • 自然语言的处理和分析技术 • 从各个渠道搜集到的信息和数据 • 迅速给出诊断提示和治疗意见
左侧鼻腔 腹部B超 胸 片
将自然语言描述的电子病历转化成结构化、标准化的电子病历
覆盖各种可能的组学
组学数据 • 基因组学数据 • 转录组学数据 • 蛋白组学数据
Phenomics Systerms Biology Metabolic Networks Proteomics Metagenomics GWAS Microarray
欧洲分子生物学实验室
• DDBJ 日本DNA数据库 • 日本研究机构
• ICGC 国际癌症基因组联盟
• Oncomine肿瘤基因芯片数据库 • CGAP癌症基因数据库
• BIGD 生命与健康大数据中心
北京科学院北京基因研究所
• MethylCancer DNA甲基化与癌症数据库
• ……
• ……
组学数据分析处理流程
DOI: doi:10.1038/srep45235影响因子:4.259
PMID: 28327601 文章发表于2017年ScientificReports
方便生物医学工作者,对关注的基
因进行检索,从差异表达分析、生存分 析、共表达分析、KEGG代谢通路等多 个层次进行分析并可视化展示。
辅助识别乳腺癌的调控和驱动基因,
组学大数据平台在肿瘤精准医疗中的应用
Chinese Academic of Medical Science Center of System Medicine
秦晓峰
中国医学科学院医学生物信息大数据中心苏州系统医学研究所
SuZhou Institute of System Medicine
医疗行业产生大量数 • •
发表时间:2017.11
实验设计:249 名接受过抗PD-1免疫疗法的肺癌、肾癌等多种 不同的癌症;免疫治疗前69名患者接受了抗生素的治疗; 研究技术:粪便宏基因组测序 验证:无菌小鼠FMT(粪菌移植)验证; 结果:1)抗生素治疗的患者,癌症很快出现复发,生存时间也 更短; 2 )恢复较好的患者体内, Akkermansiamuciniphila 的益生菌丰度更高,对癌症免疫疗法还有促进作用; 3)接受了“起效者”粪便的小鼠对于PD-1抑制剂的 反应要明显优于接受了“无效者”粪便的小鼠,后者在口服
针对个人进行纵向密集数据收集可以揭示分子疾病标志物
• • • • • • •
• • • • •
前瞻性 108个人 全基因组测序分析 临床检测分析 蛋白质组学分析 代谢组学分析 微生物群落分析(对16S rRNA进行 测序) 参与者配戴活动跟踪器监测日常活动 创立相关性网络 关联分析 鉴定已知和候选标志物 Meta分析
组学大数据平台在肿瘤精准医疗中的应用
知识图谱 临床数据
文献收集 临床指南 诊断路径 用药指导
年龄 性别 过敏情况 药物测试 疾病详情 家族史 药物接受和排斥 曾使用剂量水平 生存率诊断测试 手术
数据脱敏 标准化结构化
临床数据
预测生存期 发现新疗法 治疗方案 预后方案
辅助诊疗
知识库
深度学习
致病基因 肠道菌群 药物代谢/靶标 肿瘤驱动基因
案例成果
网址:/bcancer/ 文章: BCIP: a gene-centered platform for identifying
乳腺癌数据库平台网站
potential regulatory genes in breast cancer[J]. Scientific Reports, 2017, 7.
最佳诊疗 方案推荐
医生初步检查
辅助诊疗
疾病知识图谱
“统计关联网络”
动态辅助诊断
主诉: XXX 现病史: XXX 家族史:
病历系统
• 预测生存期 • 发现新疗法 • 治疗方案
检测系统
病史 采集
组学
病史
诊疗
疾病
症状
用药
患病概率 低于阈值
• 预后方案
检验
预后
诊断 模型
推荐采集 更多信息
患者候选疾病:
患病概率 高于阈值
辅助科研
组学检测数据
基因组 转录组 蛋白组 代谢组 表观组 微生物组 暴露组 组学数据分析 注释整合
Pipleline
TCGAICGCGOKEGG ParmGKBGEODO
公共数据库整合
数据库
数据模型
药物推荐 联合用药指导 药物不良反应评估
用药指导
辅助诊疗
根据类似患者信息,精确匹配最佳诊疗方案,快速诊断、准确用药、提高诊疗水平。
…….标准 主题库

化 数 据 中 心
统 计 分 析 互 联 互 通
可 视 化 呈 现
深 度 挖 掘
搜 索 导 航
清洗与标 准化服务 数据比对
… …
专题统计库
管理主题库
数据清洗
标准化处理
专题分析库
专题应用定制服务
外部文件
数据存储
……主题库
专题应用库
深度挖掘分析服务
医学术语标准化
例如: 左侧中央型肺鳞癌并纵膈淋巴结转
Price N D, Magis A T, Earls J C, et al. A wellness study of 108 individuals using personal, dense, dynamic data clouds[J]. Nature Biotechnology, 2017, 35(8):747.
16s rDNA测序, 宏基因组测序 其他微生物组学
宏基因组深度挖掘
挖掘组间物种、功能差异
样品聚类分析(肠型)
拷贝数变异:挖掘功能变化
从宏基因组数据中组装单菌
CAG/MGS/MLG分析:从种或菌株层级挖掘物种变化
菌群、表型、临床数据关联分析
耐药基因挖掘
多组学联合分析
微生物组在肿瘤免疫治疗中的应用
• 临床数据来源:
年龄 性别 过敏情况 药物测试 疾病详情 家族史 药物接受和排斥 曾使用剂量水平生存率诊断测试 手术
• 临床数据分析:
生存分析 预测
组学数据来源和分析
患 者 技 术 数据分析
点突变 全基因组 全外显子组/靶向测序 小插入/缺失 拷贝数变异 突变的功效分析
数据整合及解读
结构变异
差异分析 转录组 mRNA测序 融合基因 可变剪切 RNA编辑 蛋白质组学 磷酸化组学 差异分析 磷酸化位点分析 新生/新肽段分析 甲基化组学测序 ChiP-seq测序 甲基化位点 组蛋白修身 转录因子结合位点 物种及功能组成 物种差异分析 功能差异分析 与疾病的关联分析 整合分析 功能,网络和通路 分析 理解病 理机制 并应用 于临床
深度挖掘
数据分析平台 (PipeLine)
数据中心
知识库 (KnowledgeBase) 精准医疗平台 (组学数据 + 临床数据)
检测方案
• 荧光定量PCR、基因芯片 、SNP分型、 二代测序
乳腺癌组学数据分析与可视化平台BCIP
平台简介
建立了以基因为中心的乳腺癌数据分析 平台。 分析处理了来自TCGA、metabric、 GEO三大数据库中的30个数据集的数 据,包含9000多个组织样本。样本的 临床数据包括癌症分型、分期、是否绝 经、预后、ER+/-、PR+/-、 Her2+/-、P53突变、年龄等。
左肺小细胞癌广泛期 1
移 1.诊断名称: 肺癌
原发性支气管肺癌左上肺中央型
2
3 4
肺癌
2.部位分型:
3.病理类型: 4.病灶部位: 5.转移部位:
中央型
鳞癌 左侧 纵膈淋巴结
原发性支气管肺癌左下肺腺癌
左侧中央型肺鳞癌并纵膈淋巴结转移
将不同描述的诊断转化成统一的标准化诊断,并且保留诊断中的重要信息。
临床数据结构化
基因组 转录组 蛋白组 代谢组 表观组 微生物组 暴露组 组学数据分析 注释整合
Pipleline
TCGAICGCGOKEGG ParmGKBGEODO
公共数据库整合
数据库
数据模型
药物推荐 联合用药指导 药物不良反应评估
用药指导
医疗大数据来源
医院数据来源
医院业务系统 及数据源
HIS 系统 EMR 系统 LIS 系统 PACS 系统 ….. 系统 临床数据智 能采集系统
组学大数据平台与精准医疗
数据资源库 (Data Base)
深度挖掘
数据分析平台 (PipeLine)
数据中心
知识库 (KnowledgeBase) 精准医疗平台 (组学数据 + 临床数据)
检测方案
• 荧光定量PCR、基因芯片 、SNP分型、 二代测序
组学大数据平台在肿瘤精准医疗中的应用
知识图谱 临床数据
医院数据中心
数据汇聚整 合服务 非标准化 临床数据中心
医院标准化数据中心
非结构化 抽取服务 结构化处理
医院级
A病种标准 主题库
医疗大数据 应用服务
常规共享应用服务
数据汇聚 医院业务 数据 数据抽取 临床主题库 非结构化 电子病历 数据整合 经营主题库 数据关联 备份库(ODS)

数据转换
B病种标准 主题库
文献收集 临床指南 诊断路径 用药指导
年龄 性别 过敏情况 药物测试 疾病详情 家族史 药物接受和排斥 曾使用剂量水平 生存率诊断测试 手术
数据脱敏 标准化结构化
临床数据
预测生存期 发现新疗法 治疗方案 预后方案
辅助诊疗
知识库
深度学习
致病基因 肠道菌群 药物代谢/靶标 肿瘤驱动基因
辅助科研
组学检测数据
Chlp-Seq
DNA-Seq RNA-Seq Exome-Seq
• 表型组学数据
• 代谢组学数据 • 微生物组学数据 • ……
Repli-Seq
Small RNA-Seq Population Genetics
组学数据格式
fasta/fastq/vcf/sa m/bam/gff3/gff2/
gtf/bed/ …
找到乳腺癌研究和治疗的潜在的生物标 志物。
临床特征抽提
• • • • • • • • • • • • • • • •
15个临床特征 三阴/非三阴型 PAM50型 组织学分级 病理分期 转移状态 淋巴结转移 ER+/- PR+/- Her2+/- TP53突变 是否绝绝经 年龄 肿瘤大小 疗效 预后
非结构化文本 病案记录 检查报告 手术记录 病历报告
结构化文本
病案首页 医嘱
图像
照片等二维图像 病理学切片扫描 CT、MRI等三维图像
视频
显微镜视频信号 内镜视频信号 24小时脑电检测视频
电生理数据 无创脑电图 术中脑电监护 SEEG
组学数据 微生物组 基因组 代谢组 蛋白组 表型组
临床数据来源和分析
在癌症治疗中的联合用药
• 不同癌症分期的医学研究 • 基因和分子诊断 • 肿瘤信息学
• 传统中药
• 数学分析 • 治疗毒性评价 • 个性化用药
利用深度学习和关联规则挖掘预抗癌药物反应
• 数据来源:药物基因组689个癌症细 胞系和139种抗癌药物。来自CCLP和 GDSC. • 规则关联挖掘 • 深度学习 • 预测药物反应
Akkermansiamuciniphila后,能恢复对免疫疗法的反应。
医生目前面临决策的信息维度大大增加
Hawgood S, Hook-Barnard IG, O’Brien TC, Yamamoto KR. Precision medicine: Beyond the inflection point. Science translational medicine 2015;7:300ps17.
现有电子病历检查描述 患者不慎摔伤,伤后神 志不清约30余秒,后可 唤醒,体温正常 (36.5℃),感头痛明显,
处理后的结构化检查描述 指标名称 摔 伤 结果 有 30余秒
神志不清




36.5℃
明显 少量流血 未见明显异常 未见明显异常
左侧鼻腔内有少量鼻血。
于我院行腹部B超及胸片, 未见明显异常。入院体 格检查:肠鸣音正常, 约4次/分。
组学数据来源
检测
• 荧光定量PCR • 基因芯片
• SNP分型
• 二代测序 • ……
组学数据汇集
组学数据来源
综合数据库
肿瘤相关数据库
• NCBI美国国家生物技术信息中心
美国国家健康研究所、国家医学图书馆 • EBI欧洲生物信息研究所 • TCGA 癌症基因信息的数据库 • TGDB 肿瘤基因数据库
相关文档
最新文档