营养基因组学数据库及生物统计和复杂数据分析ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
典型生物库的特征
❖ 知情同意与血液样本来自单一点源,尽 管知情同意可能是一个多步骤过程。
❖ 知情同意使电子病例自动化和持续开发 成为可能,包括支付记录及实验室检查 结果。
❖ 数据收集表格来源于样本采集现场,或 通过与一部分受试者进一步的联系及辅 助研究获得。
❖ 收集血液样本并提取基因组DNA,再进 行存储。
❖ 一个特定的样本可能会带有其他来自辅助或后续 研究的相关信息,这些信息根源都将进行追踪和 审核。
典型生物库的特征
❖ 根据装载条形码或ID号,重新准确确认DNA 样品与存储至生物库的基因型信息的一一对 应。为了重新确立对应性,甚至对在生物库 内的基因分型或测序同从工作流水线和审核 处而来的样本作相同处理。
caBIG(cancer Biomedical Informatics Grid)
❖ 建立一系列以互用为目的的推荐规范或标准, 为肿瘤研究团队提供基础科学和临床转化研 究的国家信息交换平台。
个体化医疗(personalized medicine)
❖ 将某个个体的基因型与一系列临床及流行 病学信息(包括饮食记录及营养相关内容) 联系起来,能够为医疗的发现、预测和干 预开辟新的道路。
❖ 审查系统中任何数据的获取。
❖ 系统中任何数据的获取都需安全认证。
❖ 获取系统中任何数据都需经过注册,获取某 一特定数据资料需该个体通过适当的身份认 证。
典型生物库的特征
❖ 系统中的变量都有详细的元数据;这些变量 可能来源于公共数据元件、系统限定的标准 词汇(如NCI公司词汇系统、NCI caDSR、 ICD-10、SNOMED、HL7)和其他信息或 数据交换格式。
❖ 对重新确认的信息进行关联性研究与分析。
典型生物库的特征
❖ 依据临床、流行病以及遗传信息选择样本及注释。 保留样本注释,如有证据表明某些样本不具备或 可能不具备某种条件,这些样本可用作对照。这 种样本和注释的选择,其本质是对缺失临床数据 的可能性估计。即如果一个特定病例仅有几项临 床数据,很难排除该病例未患有某种疾病。相反, 倘若支付或电子病历资料显示该个体已接受过初 步治疗,且这些资料是若干年前记录的,则缺少 诊断资料,表明该对象未患病。
genome transcriptome
genomics
ຫໍສະໝຸດ Baiduproteome
proteomics
metabolome
metabolomics
physiome
physiomics
系统生物学(systems biology)
❖ A field that identifies and analyzes gene and protein networks to gain an understanding of intracellular regulation of metabolism, intra- and intercellular communication, and complex interactions within, between, and among cells.
典型生物库的特征
❖ DNA样本将被用于产生遗传基因信息,这些信息 将会以DNA序列、SNP标记、单体型形式出现, 这些信息是生物信息库的组成部分。
❖ DNA提取过程的质量可被监控。
❖ 所有的样本处理,调研表格及知情同意表格均给 予独立编号,受试者身份要予以保密,可追踪工 作流程。
❖ 所有的试管,包括血液样本管、DNA提取过程所 用管、DNA样本管、样本等分管、存储管都将被 编码并进行位置跟踪以方便身份确认、审计跟踪 及保证质量。
生物数据库(Biobank)
❖ 合理地为每一个参与者收集和注释疾病和 营养信息,为发现性生物库设计知情同意 和程序,指导以遗传学为基础的生物库处 理伦理道德规范、经费、知识产权分歧问 题,以及挖掘医疗记录的复杂性,确保患 者的信心,提供强大的样本处理与追踪及 强有力的表型挖掘工具,分析基因型与表 型间关系……
Required Reading
1.祁鸣,朱心强译:营养基因组学:发现通 往个性化营养的途径 第十六、十七章,杭 州:浙江大学出版社,2011年。
2.Kaput J, et al. Consensus statement understanding health and malnutrition through a systems approach: the ENOUGH program for early life. Genes Nutr. 2014; 9(1):378.
典型生物库的特征
❖ 从医疗卫生附属机构电子病历中自动获取临 床、饮食的及流行病学相关信息变动。
❖ 自报信息资料收集表格可能同时包含普及性 及临床为基础的信息。
❖ 受试者的实验室数据的自动获取及整合。
❖ 所有的数据获取将会历经清理和重新确认过 程。确认过程排除了健康隐私信息,但将临 床、账单、饮食和流行病数据与DNA样本相 结合关联。这些信息将被保留,但已移除健 康隐私信息。
❖ 系统生物学是所有“组学”科学的超级数据 集。
营养基因组学数据集
❖ 营养基因组学的长远目标是开发出一个高度 相互衔接的数据库构成的网络模型。
美国西北大学基因库工程(NU基因)
❖ 一个以人群为基础的大型DNA库。
❖ 生物库的设计以及相关的信息与NIH的目标—— 将人类基因组序列转化成临床相关疾病信息, 造福人类健康——一致。
❖ NU基因将DNA样本集中收集和存储系统与广泛 式知情同意相结合,使其通过电子病例的周期 性数据更新对受试者的健康状况进行校正。目 的是提供不同种族或民族不同疾病状况的人群 样本及相关医学信息,以利于建立特定基因变 体与疾病和治疗结果的相关性。相关数据可包 括饮食和营养变量。
❖ 用疾病本体论注释疾病表现型,并进行相关 证据的追踪、审核。
营养基因组学中的 生物统计和复杂数据分析
张咸宁
zhangxianning@zju.edu.cn Tel:13105819271; 88208367 Office: A705, Research Building
2014/04
The ‘-omics’ vocabulary