snpEff结果解读
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ANN fields
ANN 下⾯⼀共有16个fields,分别为:
1. Allele(or ALT)
突变后的碱基
2. Annotation
(aka. effect) 突变造成的影响
3. Putative_impact
突变的影响程度,有HIGH, MODERATE, LOW, MODIFIER
4. Gene Name
基因名(HGNC
5. Gene ID
基因ID
6. Feature type
特征类型,有transcript, motif, miRNA等
7. Feature ID
特征ID
8. Transcript biotype
转录⼦类型,有Coding 和Noncoding
9. Rank/total
外显⼦或内含⼦的次序/总的外显⼦或内含⼦数量
10. HGVS.c
HGVS标注的基因变异(DNA⽔平)
11. HGVS.p
HGVS标注的蛋⽩质变异
12. cDNA_position/cDNA_len
变异在cDNA中的位置/cDNA的⻓度
13. CDS_position/CDS_len
变异在编码区的位置/编码区的⻓度(包括起始和终⽌密码⼦)
14. Protein_position/Protein_len
突变蛋⽩质位点/蛋⽩质的⻓度
15. Distance to feature
此处所有内容都是可选的,与注释程序的参数有关,所以这个field很有可能是空⽩的。
16. Errors,Warnings or Information messages:
可选的,⼀般都是留空的
更详细的说明请访问官⽅⽂档
COSMIC注释解读
COSMIC在线查询地址: /cosmic
COSMIC注释⼀般是通过COSMIC的VCF⽂件来注释的,⽽COSMIC有两个VCF⽂件,分别是CosmicCodingMuts.vcf 和CosmicNonCodingVariants.vcf. 两个⽂件差不多,除了VCF共有的⼏列外,注释信息信中的INFO列⾥⾯和ID列。
ID列⾥⾯是COSMIC号,编码区的变异以COSM开头,⾮编码区的变异以COSN开头,后⾯是⼀串数字,这是该注释最重要的信息,每个COSMIC号对应着该突变的影响程序,及相关的证据,耐药信息等,可以通过该COSMIC号进⾏进⼀步的检索
INFO列⾥⾯,⼀共有⼏个Field,1-5是CosmicCodingMuts特有的,6是CosmicNonCodingVariants特有的
1. GENE基因名
2. STRAND链(+ or -)
3. CDS CDS注释(形如c.146A>C),相当于是HGVS.c
4. AA蛋⽩质肽链的注释(形如:p.H49P),相当于是HGVS.p
5. CNT出现该变异的样品数
6. SNP有该field说明该突变是SNP,没有则不是
Clinvar注释解读
clinvar下载地址: ftp:///pub/clinvar/vcf_GRCh37/
clinvar在线查询:https:///clinvar/
Clinvar数据库的vcf⽂件包括了dbSNP中与临床症状相关的变异
ID列中是rs开头+⼀串数字,即Reference SNP ID
INFO列中包括以下⼏个field
1. RS Reference dbSNP ID
2. RSPOS在染⾊体中的位置,不包含染⾊体编号
3. dbSNPBuildID该SNP⾸次出现的dbSNP版本
4. SSR突变嫌疑原因码
0-未指定,
1-旁系同源,
2-byEST,
4-oldAlign,
8-Para_EST,
16-1kg_failed,
1024-other
5. SAO变异起源(0-未指定,1-Germline, 2-Somatic, 3-Both)
6. VP变异属性,⼀串24位的16进制数字,解释参⻅
7. GENEINFO基因名+基因ID,形式为(GENE:ID)
8. WGT Map Weight(00-unmaped,1-map to 1, 2-map to 2, 3-map to 3 or more)
9. VC变异分类(SNV,DIV,STR,Mixed,MNV etc.)参考
10. CLNHGVS HGVS形式的注释,(NC_000001.10:g.978856G>A)
11. CAF每⼀个Ref和Alt的频率
12. COMMON是不是常⻅突变,1 or 0 (频率>1%,且频次>2称为常⻅)
13. CLNALLE CLN突变位点来⾃ref或ALT列??(0-REF,1-first ALT)
14. CLNSRC Variant Clinical Chanels,变异临床频道?
15. CLNORIGIN ALT来源
0 - unknown;
1 - germline;
2 - somatic;
4 - inherited;
8 - paternal;
16 - maternal;
32 - de-novo;
64 - biparental;
128 - uniparental;
256 - not-tested;
512 - tested-inconclusive;
1073741824 - other
16. CLNSRCID Variant Clinical Channel IDs
17. CLNSIG突变的临床重要性
0 - Uncertain,
1 - not provided,
2 - Benign,
3 - Likely benign,
4 - Likely pathogenic,
5 - Pathogenic,
6 - drug response,
7 - histocompatibility,
255 - other
18. CLNSDB Variant disease database name,突变的疾病数据库名
19. CLNSDBID Variant disease database ID,突变的疾病数据库ID
20. CLNDBN Variant disease name,突变疾病名
21. CLNREVSTAT Review状态(no_assertion,no_criteria,single,mult,conf,exp,guideline)
22. CLNACC Variant Accession and Versions,注册号及版本(CLNACC=RCV000247794.1)
23. ⼀系列Flag
RV
RS orientation is reversed
RS⽅向相反
INT
In Intron FxnCode = 6
在内含⼦中
PM
Variant is Precious(Clinical,Pubmed Cited)
有临床和Pubmed引⽤,可靠
R3
In 3' gene region FxnCode = 13
在3’基因区
TPA
Provisional Third Party Annotation(TPA) (currently rs from PHARMGKB who will give phenotype