肿瘤基因检测的解读流程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

从临床进入基因检测流程是入口,检测结果结合临床信息进行合理解读是出口,这一入一出之间需经历检测前临床咨询部分、实验室部分、信息分析部分、临床解读部分共四个环节。其中的策四部分临床解读部分即是根据检测结果、患者信息、医生共识综合判断,临床和遗传咨询有效衔接、充分沟通,最终出具临床解读报告。

在做成临床解读报告之前,首先需要将解读的各个环节进行明确,包括解读的步骤流程,解读的技术细节。这样才有可能真正的做到解读的规范化,使解读过程有据可依,有章可循,才能出具一份好的临床解读报告,基因检测才能更好的服务患者和临床医生。从大的框架讲,基因检测数据解读可分为三个步骤:原始数据T分析数据、基于数据库的解读-与患者个体表征/临床病例结合的解读。

1、读懂原始数据

将测序的原始序列数据(FASTQ )去除接头及低质量序列,经BWA软件比对至GRCh37/38 (NCBI 版本)或hgl9/hg38 (UCSC版本)人类基因组参考序列上;Picard去除重复序列使用GATK 检测SNV与Indel变异使用ANNOVAR 进行变异注释。最后获得一份.vcf文件(图1)。

Ph«*e 1

primary processing

R*w

(FQW)

图1从测序的原始序列数据到vcf文件的流程—份vcf文件包含如下基本信息。

CI LT Start End Ref Alt

Func. re

fGenc

Gene, re

fGcno

GeneDotail.

refGone

ExonicFunc. /

efGeno ofGone

Chr:变异所在的染色体

Start :变异在染色体上的起始位置

End :变异在染色体上的结束位置

Ref :参考基因组的序列

Alt:检测样本基因组的序列

Func.refGene :变异所处参考基因的功能区(exonic Jntronic ,UTR3 ,UTR5 , splicing , upstream , downstream , intergenic )(此处的exonic 特扌旨夕卜显子编码氨基酸区,不包括外显子的UTR区)

Phas« 2: variant detection Phase 3: variant annotation

Gene.refGene :变异所处参考基因名称(如果是基因间,则是两侧的基因)

GeneDetail.refGene :非外显子区处于特定转录本中的具体位置(如果是基因间,则是距离两侧的基因的距离)

ExonicFunc.refGene :外显子区的变异类型(frameshift insertion , frameshiftdeleti on , stopgai n , stoploss , non frameshift insertio n , nonframeshiftdeletion , synonymous SNV , nonsynonymous SNV ),如果这一栏是一个"・”的话,就说明该变异不在外显子区

AAChange.refGene :氨基酸水平的改变(同一个基因可能具有多个转录本,氨基酸改变的位置在不同的转录本中有可能不一样)

经注释后的vcf文件还会包含如下信息:

CLINSIG :该变异在ClinVar数据库中的临床意义(Benign , Likely benign ,

Un certain sign ificance , Likelypathoge nic , Pathogenic , Drug-response ) CUNDBN :该变异所弓I起的疾病名称

CLINACC :该变异的登记号和版本号(VariantAccession and Versions )

CUNSDB :该变异所引起疾病所在数据库名称

CUNSDB :该变异所引起疾病所在数据库中的ID

PopFreqMax :该变异人群中的最大等位基因频率

1000_AII :该变异在千人基因组计划数据库中的人群等位基因频率

1000.AFR :该变异在干人基因组计划数据库中非洲人群的等位基因频率

1000.AMR :该变异在千人基因组计划数据库中美国人群的等位基因频率

1000.EAS :该变异在干人基因组计划数据库中东亚人群的等位基因频率

1000.EUR :该变异在千人基因组计划数据库中欧洲人群的等位基因频率

1000_SAS :该变异在千人基因组计划数据库中南亚人群的等位基因频率

Snpl38 :该变异在dbSNP数据库中的ID

Cosmic70 :该变异在癌症体细胞突变数据库COSMIC中的ID

ESP6500siv2_ALL :该变异在美国国家心月市血液硏究所的ESP6500数据库中的人群等位基因频率

ESP6500siv2_AA :该变异在美国国家心肺血液研究所的ESP6500数据库中的

非洲裔人群等位基因频率

ESP6500siv2_EA :该变异在美国国家心肺血液研究所的ESP6500数据库中的

欧洲裔人群等位基因频率

ExAC_AII :该变异在ExAC数据库中的人群等位基因频率

ExAC_AFR :该变异在ExAC数据库中非洲人群的等位基因频率

ExAC_AMR :该变异在ExAC数据库中美国人群的等位基因频率

ExAC_EAS :该变异在ExAC数据库中东亚人群的等位基因频率

ExAC_FIN :该变异在ExAC数据库中芬兰人群的等位基因频率

ExAC_NFE :该变异在ExAC数据库中非芬兰欧洲人群的等位基因频率

ExAC.OTH :该变异在ExAC数据库中除已指走人群之外的人群等位基因频率

ExAC_SAS :该变异在ExAC数据库中南亚人群的等位基因频率

OG46 ICGC-Id ICCC_Occirrence ncl60 Interpro.domaln dbs c Slf/_ziEA_SCORE dbscSNV_RF_ SCORE omlmtKny

CG46 :该变异在CG46数据库中的人群等位基因频率。CG46是由

CompleteGenomics( BGI公司对46个样本的全基因组测序而建立的数据库,

截止2017年,他们巳经对超过20000个样本进行了全基因组测序和分析。

相关文档
最新文档