可变剪切结果说明文件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、events of exon skipping

1. 结果一(跳过一个exon):

a)首先是psl文件(一共是21列,具体每一列的格式见说明1,主要利用了第10列转录本id,第14列染色体id,第19列转录本的每个exon的长度,第21列转录本的每个exon在染色体的起始位置):

转录本NM_004749的psl结果如下(只有一行,多行显示只为方便):

0 0 0 0 0 0 0 0 - NM_004749:45106223-45117842 0 0

0 chr7 0 45106223 45117842

11 327,115,112,246,145,111,158,172,324,461,76,

0,0,0,0,0,0,0,0,0,0,0,

45106223,45107381,45107626,45107948,45108470,45109456,45110222,45110661,45111564,45114950,451177 66,

因为psl结果的位置信息是从0开始的,所以每个起始位置需要加上1,结合每个exon的大小,我们可以知道这个转录本每个exon的在染色体具体位置:

exon1:45106224-45106550(45106224=45106223+1, 45106550=45106224+327-1)

exon2:45107382-45107496

exon3:45107627-45107738

exon4:45107949-45108194

exon5:45108471-45108615

exon6:45109457-45109567

exon7:45110223-45110380

exon8:45110662-45110833

exon9:45111565-45111888

exon10:45114951-45115411

exon11:45117767-45117842

b)其次在junctions的结果里有:

chr7 45109567 45110223 junction1

chr7 45109567 45110662 junction2

chr7 45110380 45110662 junction3

所以从junction1可以知道来exon6和exon7存在连接,从junction3可以知道exon7和exon8存在连接,从junction2可以知道来exon6和exon8存在连接(跳过了exon7),因此exon6(45109457-45109567)、exon7(45110223-45110380)、exon8(45110662-45110833)存在exon skipping,如下图:

在结果文中显示如下,9238为转录本NM_004749所对应的基因id(用基因id替换转录本id的原因见说明2):

gene chromsome strand constitutive exon inclusive exon constitutive exon (表头)

9238 chr7 - 45109457-45109567 45110223-45110380 45110662-45110833

2. 结果二(跳过多个exon):

a) 转录本NM_001039887的psl结果如下:

0 0 0 0 0 0 0 0 + NM_001039887:40940883-40951917 0 0 0

chr19 0 40940883 40951917

11 84,97,203,128,104,83,143,188,263,82,772,

0,0,0,0,0,0,0,0,0,0,0,

40940883,40942114,40942529,40944759,40944993,40947594,40947774,40949508,40950544,40950896,409511 45,

可以知道这个转录本每个exon的具体位置:

exon1:40940884-40940967

exon2:40942115-40942211

exon3:40942530-40942732

exon4:40944760-40944887

exon5:40944994-40945097

exon6:40947595-40947677

exon7:40947775-40947917

exon8:40949509-40949696

exon9:40950545-40950807

exon10:40950897-40950978

exon11:40951146-40951917

b)其次在junctions的结果里有:

chr19 40940967 40942115 junction1

chr19 40940967 40944760 junction2

chr19 40942211 40942530 junction3

chr19 40942732 40944760 junction4

所以从junction1可以知道exon1和exon2有连接,从junction3可以知道exon2和exon3有连接,从junction4可以知道exon3和exon4有连接,从junction2可以知道exon1和exon4有连接(跳过了exon2和exon3),因此exon1(40940884-40940967)、exon2(40942115-40942211)、exon3(40942530-40942732)、exon4(40944760-40944887)存在exon skipping,见下图:

结果显示如下,148137为转录本NM_001039887的基因id:

gene chromsome strand constitutive exon inclusive exon constitutive exon (表头)148137 chr19 + 40940884-40940967 40942115-40942211,40942530-40942732 40944760-40944887

相关文档
最新文档