TCGA癌症数据库介绍专题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

http://cancergenome.nih.gov/
02 数据产生历程
http://www.biocloudservice.com/
http://cancergenome.nih.gov/abouttcga/overview
TCGA数据的产生历程: 1. 组织样本和临床数据来源网站 (TSS)收集的数据发送到 Biospecimen核心资源(BCRs)。 2. BCRs提交临床数据和元数据到 数据协调中心(DCC)和测序中心 (GSCs),获取组织变异数据,然后 提交给DCC。 3. GSCs提交跟踪文件,序列比对 后文件到癌症基因组学中心 (CGHub)。 4. 提交给DCC和CGHub的数据可 供研究团队和基因组数据分析中 心(GDACs)使用。 5. 分析pipeline以及由GDACs产 生的数据结果通过DCC保存到研 究社区(community)中。
4
ns of Interest
(ROI)
Байду номын сангаас
Molecular abnormalities
Sample characteristics
Clinical variables
量化关联类的样本
两个或多个的关联 分子水平的异常 样本特性 临床变异
注意: 低水平的测序数据存储在CGHub https://cghub.ucsc.edu/, 申请下 载时需要DUNS number. The Cancer Genomics Hub (CGHub) is a secure repository for storing, cataloging, and accessing cancer genome sequences, alignments, and mutation information from the Cancer Genome Atlas (TCGA) consortium and related projects.
TCGA数据库介绍专题
http://www.biocloudservice.com/
上海尔云-云生信团队 2015.9.20
目录
1. 前言 2. 数据产生历程 3. barcode 4. Data types and data levels 5. 目前已有的癌症种类 6. 数据下载解读
01 前言
Interpreted for presence or absence of specific molecular abnormalities 解释异常的个体
Aggregate of processed data from single sample
单个样本整合在了一起
3
Segmented/ Interpreted
http://www.biocloudservice.com/
TCGA- THE CANCER GENOME ATLAS
Genome
Proteome
cancer
Transcript ome
Epigenome
Clinic
癌症种类丰富,样本量大 34 kinds of cancer 325 samples on average
DATA TYPES
DATA LEVLES
Data Level 1
2
Level Type Raw
Processed
Description Low-level data for single sample Not normalized Normalized single sample data
单个样本的低级数据 未标准化 标准化的单个样本
05
目前已有的癌症种类
癌症种类丰富,样本量大 34 kinds of cancer 325 samples on average
详细见: TCGA publication guideline, http://cancergenome.nih.gov/publications/publicationguidel nes
临床数据解读
CDE:Common Data Elements https://tcga-data.nci.nih.gov/docs/dictionary/
THANKS
http://www.biocloudservice.com/
06
数据下载及解读
http://www.biocloudservice.com/
最简单的方法: https://tcga-data.nci.nih.gov/tcga/tcgaHome2.jsp
Step4
第1封邮件通知下载申请已经提交 第2封给出下载链接
Step 4 文件内容
File_manifest.txt,对所下载文件的说明
03
BARCODE解读
http://www.biocloudservice.com/
详细请见:https://wiki.nci.nih.gov/display/TCGA/TCGA+barcode
04
DATA TYPES AND LEVELS
http://www.biocloudservice.com/
Grouped by probed loci to form larger contiguous regions (in some cases) 根据probe的位置分组
Quantified association across classes of samples
Summary/Regio Associations based on two or more
相关文档
最新文档