可变剪切结果说明文件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、events of exon skipping
1. 结果一(跳过一个exon):
a)首先是psl文件(一共是21列,具体每一列的格式见说明1,主要利用了第10列转录本id,第14列染色体id,第19列转录本的每个exon的长度,第21列转录本的每个exon在染色体的起始位置):
转录本NM_004749的psl结果如下(只有一行,多行显示只为方便):
0 0 0 0 0 0 0 0 - NM_004749:45106223-45117842 0 0
0 chr7 0 45106223 45117842
11 327,115,112,246,145,111,158,172,324,461,76,
0,0,0,0,0,0,0,0,0,0,0,
45106223,45107381,45107626,45107948,45108470,45109456,45110222,45110661,45111564,45114950,451177 66,
因为psl结果的位置信息是从0开始的,所以每个起始位置需要加上1,结合每个exon的大小,我们可以知道这个转录本每个exon的在染色体具体位置:
exon1:45106224-45106550(45106224=45106223+1, 45106550=45106224+327-1)
exon2:45107382-45107496
exon3:45107627-45107738
exon4:45107949-45108194
exon5:45108471-45108615
exon6:45109457-45109567
exon7:45110223-45110380
exon8:45110662-45110833
exon9:45111565-45111888
exon10:45114951-45115411
exon11:45117767-45117842
b)其次在junctions的结果里有:
chr7 45109567 45110223 junction1
chr7 45109567 45110662 junction2
chr7 45110380 45110662 junction3
所以从junction1可以知道来exon6和exon7存在连接,从junction3可以知道exon7和exon8存在连接,从junction2可以知道来exon6和exon8存在连接(跳过了exon7),因此exon6(45109457-45109567)、exon7(45110223-45110380)、exon8(45110662-45110833)存在exon skipping,如下图:
在结果文中显示如下,9238为转录本NM_004749所对应的基因id(用基因id替换转录本id的原因见说明2):
gene chromsome strand constitutive exon inclusive exon constitutive exon (表头)
9238 chr7 - 45109457-45109567 45110223-45110380 45110662-45110833
2. 结果二(跳过多个exon):
a) 转录本NM_001039887的psl结果如下:
0 0 0 0 0 0 0 0 + NM_001039887:40940883-40951917 0 0 0
chr19 0 40940883 40951917
11 84,97,203,128,104,83,143,188,263,82,772,
0,0,0,0,0,0,0,0,0,0,0,
40940883,40942114,40942529,40944759,40944993,40947594,40947774,40949508,40950544,40950896,409511 45,
可以知道这个转录本每个exon的具体位置:
exon1:40940884-40940967
exon2:40942115-40942211
exon3:40942530-40942732
exon4:40944760-40944887
exon5:40944994-40945097
exon6:40947595-40947677
exon7:40947775-40947917
exon8:40949509-40949696
exon9:40950545-40950807
exon10:40950897-40950978
exon11:40951146-40951917
b)其次在junctions的结果里有:
chr19 40940967 40942115 junction1
chr19 40940967 40944760 junction2
chr19 40942211 40942530 junction3
chr19 40942732 40944760 junction4
所以从junction1可以知道exon1和exon2有连接,从junction3可以知道exon2和exon3有连接,从junction4可以知道exon3和exon4有连接,从junction2可以知道exon1和exon4有连接(跳过了exon2和exon3),因此exon1(40940884-40940967)、exon2(40942115-40942211)、exon3(40942530-40942732)、exon4(40944760-40944887)存在exon skipping,见下图:
结果显示如下,148137为转录本NM_001039887的基因id:
gene chromsome strand constitutive exon inclusive exon constitutive exon (表头)148137 chr19 + 40940884-40940967 40942115-40942211,40942530-40942732 40944760-40944887