snpEff结果解读

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ANN fields

ANN 下⾯⼀共有16个fields,分别为:

1. Allele(or ALT)

突变后的碱基

2. Annotation

(aka. effect) 突变造成的影响

3. Putative_impact

突变的影响程度,有HIGH, MODERATE, LOW, MODIFIER

4. Gene Name

基因名(HGNC

5. Gene ID

基因ID

6. Feature type

特征类型,有transcript, motif, miRNA等

7. Feature ID

特征ID

8. Transcript biotype

转录⼦类型,有Coding 和Noncoding

9. Rank/total

外显⼦或内含⼦的次序/总的外显⼦或内含⼦数量

10. HGVS.c

HGVS标注的基因变异(DNA⽔平)

11. HGVS.p

HGVS标注的蛋⽩质变异

12. cDNA_position/cDNA_len

变异在cDNA中的位置/cDNA的⻓度

13. CDS_position/CDS_len

变异在编码区的位置/编码区的⻓度(包括起始和终⽌密码⼦)

14. Protein_position/Protein_len

突变蛋⽩质位点/蛋⽩质的⻓度

15. Distance to feature

此处所有内容都是可选的,与注释程序的参数有关,所以这个field很有可能是空⽩的。

16. Errors,Warnings or Information messages:

可选的,⼀般都是留空的

更详细的说明请访问官⽅⽂档

COSMIC注释解读

COSMIC在线查询地址: /cosmic

COSMIC注释⼀般是通过COSMIC的VCF⽂件来注释的,⽽COSMIC有两个VCF⽂件,分别是CosmicCodingMuts.vcf 和CosmicNonCodingVariants.vcf. 两个⽂件差不多,除了VCF共有的⼏列外,注释信息信中的INFO列⾥⾯和ID列。

ID列⾥⾯是COSMIC号,编码区的变异以COSM开头,⾮编码区的变异以COSN开头,后⾯是⼀串数字,这是该注释最重要的信息,每个COSMIC号对应着该突变的影响程序,及相关的证据,耐药信息等,可以通过该COSMIC号进⾏进⼀步的检索

INFO列⾥⾯,⼀共有⼏个Field,1-5是CosmicCodingMuts特有的,6是CosmicNonCodingVariants特有的

1. GENE基因名

2. STRAND链(+ or -)

3. CDS CDS注释(形如c.146A>C),相当于是HGVS.c

4. AA蛋⽩质肽链的注释(形如:p.H49P),相当于是HGVS.p

5. CNT出现该变异的样品数

6. SNP有该field说明该突变是SNP,没有则不是

Clinvar注释解读

clinvar下载地址: ftp:///pub/clinvar/vcf_GRCh37/

clinvar在线查询:https:///clinvar/

Clinvar数据库的vcf⽂件包括了dbSNP中与临床症状相关的变异

ID列中是rs开头+⼀串数字,即Reference SNP ID

INFO列中包括以下⼏个field

1. RS Reference dbSNP ID

2. RSPOS在染⾊体中的位置,不包含染⾊体编号

3. dbSNPBuildID该SNP⾸次出现的dbSNP版本

4. SSR突变嫌疑原因码

0-未指定,

1-旁系同源,

2-byEST,

4-oldAlign,

8-Para_EST,

16-1kg_failed,

1024-other

5. SAO变异起源(0-未指定,1-Germline, 2-Somatic, 3-Both)

6. VP变异属性,⼀串24位的16进制数字,解释参⻅

7. GENEINFO基因名+基因ID,形式为(GENE:ID)

8. WGT Map Weight(00-unmaped,1-map to 1, 2-map to 2, 3-map to 3 or more)

9. VC变异分类(SNV,DIV,STR,Mixed,MNV etc.)参考

10. CLNHGVS HGVS形式的注释,(NC_000001.10:g.978856G>A)

11. CAF每⼀个Ref和Alt的频率

12. COMMON是不是常⻅突变,1 or 0 (频率>1%,且频次>2称为常⻅)

13. CLNALLE CLN突变位点来⾃ref或ALT列??(0-REF,1-first ALT)

14. CLNSRC Variant Clinical Chanels,变异临床频道?

15. CLNORIGIN ALT来源

0 - unknown;

1 - germline;

2 - somatic;

4 - inherited;

8 - paternal;

16 - maternal;

32 - de-novo;

64 - biparental;

128 - uniparental;

256 - not-tested;

512 - tested-inconclusive;

1073741824 - other

16. CLNSRCID Variant Clinical Channel IDs

17. CLNSIG突变的临床重要性

0 - Uncertain,

1 - not provided,

2 - Benign,

3 - Likely benign,

4 - Likely pathogenic,

5 - Pathogenic,

6 - drug response,

7 - histocompatibility,

255 - other

18. CLNSDB Variant disease database name,突变的疾病数据库名

19. CLNSDBID Variant disease database ID,突变的疾病数据库ID

20. CLNDBN Variant disease name,突变疾病名

21. CLNREVSTAT Review状态(no_assertion,no_criteria,single,mult,conf,exp,guideline)

22. CLNACC Variant Accession and Versions,注册号及版本(CLNACC=RCV000247794.1)

23. ⼀系列Flag

RV

RS orientation is reversed

RS⽅向相反

INT

In Intron FxnCode = 6

在内含⼦中

PM

Variant is Precious(Clinical,Pubmed Cited)

有临床和Pubmed引⽤,可靠

R3

In 3' gene region FxnCode = 13

在3’基因区

TPA

Provisional Third Party Annotation(TPA) (currently rs from PHARMGKB who will give phenotype

相关文档
最新文档