肿瘤基因检测的解读流程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
从临床进入基因检测流程是入口,检测结果结合临床信息进行合理解读是出口,临床这一入一出之间需经历检测前临床咨询部分、实验室部分、信息分析部分、患者信其中的第四部分临床解读部分即是根据检测结果、解读部分共四个环节。息、医生共识综合判断,临床和遗传咨询有效衔接、充分沟通,最终出具临床解读报告。包括解读的步在做成临床解读报告之前,首先需要将解读的各个环节进行明确,使解读过程解读的技术细节。这样才有可能真正的做到解读的规范化,骤流程,基因检测才能更好的服有章可循,才能出具一份好的临床解读报告,有据可依,原始数基因检测数据解读可分为三个步骤:务患者和临床医生。从大的框架讲,临床病例结合的解读。据→分析数据、基于数据库的解读→与患者个体表征/ 、读懂原始数据1软件比对至经BWA)将测序的原始序列数据(FASTQ 去除接头及低质量序列,版本)人类基因组参考序列UCSC版本)或NCBIhg19/hg38(GRCh37/38(ANNOVAR使用与SNVIndel变异,检测使用Picard上,去除重复序列,GATK 1.vcf进行变异注释。最后获得一份文件(图)。. .
图1 从测序的原始序列数据到vcf文件的流程
一份vcf文件包含如下基本信息。
Chr:变异所在的染色体
Start:变异在染色体上的起始位置
End:变异在染色体上的结束位置
Ref:参考基因组的序列
Alt:检测样本基因组的序列
.
.
Func.refGene:变异所处参考基因的功能区(exonic,intronic,UTR3,UTR5,splicing,upstream,downstream,intergenic)(此处的exonic特指外显子编码氨基酸区,不包括外显子的UTR区)
Gene.refGene:变异所处参考基因名称(如果是基因间,则是两侧的基因)GeneDetail.refGene:非外显子区处于特定转录本中的具体位置(如果是基因间,则是距离两侧的基因的距离)
ExonicFunc.refGene:外显子区的变异类型(frameshift insertion,frameshiftdeletion,stopgain,stoploss,nonframeshift insertion,nonframeshiftdeletion,synonymous SNV,nonsynonymous SNV),如果这一栏是一个“.”的话,就说明该变异不在外显子区
AAChange.refGene:氨基酸水平的改变(同一个基因可能具有多个转录本,氨基酸改变的位置在不同的转录本中有可能不一样)
经注释后的vcf文件还会包含如下信息:
CLINSIG:该变异在ClinVar数据库中的临床意义(Benign,Likely benign,Uncertain significance,Likelypathogenic,Pathogenic,Drug-response)CLINDBN:该变异所引起的疾病名称
CLINACC:该变异的登记号和版本号(VariantAccession and Versions)
.
.
:该变异所引起疾病所在数据库名称CLINSDBID
:该变异所引起疾病所在数据库中的CLINSDB :该变异人群中的最大等位基因频率PopFreqMax :该变异在千人基因组计划数据库中的人群等位基因频率1000_All :该变异在千人基因组计划数据库中非洲人群的等位基因频率
1000_AFR 1000_AMR:该变异在千人基因组计划数据库中美国人群的等位基因频率1000_EAS:该变异在千人基因组计划数据库中东亚人群的等位基因频率:该变异在千人基因组计划数据库中欧洲人群的等位基因频率1000_EUR :该变异在千人基因组计划数据库中南亚人群的等位基因频率1000_SAS
ID
dbSNP数据库中的:该变异在Snp138ID
中的Cosmic70:该变异在癌症体细胞突变数据库COSMIC数据库中的
ESP6500:该变异在美国国家心肺血液研究所的ESP6500siv2_ALL 人群等位基因频率.
.
数据库中的ESP6500ESP6500siv2_AA:该变异在美国国家心肺血液研究所的
非洲裔人群等位基因频率数据库中的ESP6500ESP6500siv2_EA:该变异在美国
国家心肺血液研究所的欧洲裔人群等位基因频率ExAC数据库中的人群等位基因频率ExAC_All:该变异在ExAC数据库中非洲人群的等位基因频率
ExAC_AFR:该变异在数据库中美国人群的等位基因频率ExACExAC_AMR:该变异在数据库中东亚人群的等位基因频率ExAC_EAS:该变异在ExAC 数据库中芬兰人群的等位基因频率:该变异在ExACExAC_FIN 数据库中非芬兰欧洲人群的等位基因频率:该变异在ExACExAC_NFE ExAC数据库中除已指定人群之外的人群等位基因频率ExAC_OTH:该变异在数据库中南亚人群的等位基因频率:该变异在ExAC_SASExAC
是由CG46CG46数据库中的人群等位基因频率。CG46:该变异在个样本的全基因组测序而建立的数据库,46BGI()公司对CompleteGenomics 200002017截止年,他们已经对超过个样本进行了全基因组测序和分析。.
.
ICGC_Id:国际癌症基因协作组中各研究的ID
ICGC_Occurrence:该变异在ICGC数据库中的发生情况。该栏数据结构如COCA-CN|1|187|0.00535,指中国结直肠癌的研究(https:///),在187例患者中有1例发生突变,突变比例为0.00535
Nci60:该变异在nci60数据库中的等位基因频率。Nci60是被广泛用于药物筛选的人类60种肿瘤细胞系组合,已经进行了全外测序。随着研究的进步,美国癌症研究所NCI在2016年宣布NCI-60细胞系“退休”,PDX新模型“上任”。Interpro_domain:InterPro算法预测的突变所处的保守结构域
(/interpro/)
dbscSNV_ADA_SCORE:基于adaptive boosting预测变异对剪接位点改变的