野生稻OrufipogonW19431888条全长cDNA序列的数据分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
野生稻O. rufipogon W1943 1888 条全长cDNA序列的数据分析
NCGR 2008-09-03
背景
• 野生稻O. rufipogon(AA genome)是与栽培 稻关系最近的祖先水稻品种1,2。
• 具有许多优于栽培稻的农艺性状,比如耐旱、耐 盐等等3,4;
• 公共数据库中有大量栽培稻的基因组序列信息5,6, 同时也有大量的cDNA资源7,8;
AK070131 CT834800 AK064050
-
CT841712
GTP-binding protein
ring-box protein
-
-
Bowman Birk trypsin inhibitor
CU405768
CU405675
CU406202 CU406924 CU405898
CU406582 Contig000444 AK107776
name
93-11 contigs
CT842002 CT842007 CU405940
Contig005912 Contig008507 Contig001402
ESTs or mRNA hits AK241925 CT856206 AK103326
protein
-
name
CU406895 CU861744 CU405657
• 定义:未能定位到O. sativa japonica Nipponbare genome sequences,但与籼稻93-11基因组序 列有同源或与水稻ests序列有同源或与其它禾本科ests序列有同源。 且去除与细菌有同源的基因
• 解释:或者落于粳稻基因组测序gap中,或者籼稻特有的基因,或者野生稻特有基因。
99
CU861795 475
99
CU406355 837
100
CU406396 520
Chr location 05 09
12
02
Identity(%) Antisense protein
99
CA764081 DNA-directed RNA polymerase 3
79
CT858901 -
97
AK107125 AP2 domain, putative
• 解释:水稻新基因。或者在栽培稻中表达量过低难于克隆,或者野生稻特有。
nHale Waihona Puke Baidume
Len(bp)
CU406910 656 CU406138 568 CU406022 543 CU405757 477
Chr location 10 02
12
04
Identity(%) name
Len(bp)
99
CU405785 727
protein
ring-box protein -
-
CA766528
-
-
CT836656
60S ribosomal
protein L7A
-
CA756235
60S ribosomal
protein L17
-
NM_001063334
-
-
AC145809
-
-
CN130755.1
ribulose-
(Sorghum bicolor) bisphosphate
99
AK103485 -
CU406921 414
02
100
CU406535 389
02
100
CU406832 530
10
92
CU406871 458
01
84
CU861804 383
06
99
CU861721 554
01
100
CT841800 941
11
99
AK121962 patatin, putative
carboxylase
-
BE429292.1
-
(Triticum turgidum)
-
FF534517.1
-
(Manihot esculenta)
-
EH277383.1
-
(Spartina
alterniflora)
二、水稻新基因
• 定义:能定位到栽培稻基因组序列的同源,但无任何已知水稻表达序列的同源。 与rice MPSS搜索比较几乎没有找到匹配片段。
• 解释:或只是尚未克隆到该AS表达方式;或为野生稻所独具。
name CT841942 CU406810 CT841893 CT841874 CU405853 CU405923 CU406279 CU406025 CT841561 CU406579 CU406935 CU406600 CU405570 CU406091 CU406134
1888 W1943 cDNAs BLAST against cultivated rice genomic sequences and cDNAs
1888 W1943 cDNAs SSR comparison with indica and japonica cDNAs
一、未匹配粳稻基因组之基因
CU861688 693
08
99
AK109182 -
CT841937 1552
08
98
AK106713 -
注:该17个基因均没有找到任何蛋白同源匹配。右侧的7个基因与已知的 水稻表达序列成反义RNA对。
三、W1943特有剪切方式基因
• 定义:与栽培稻japonica基因组序列完全一致(100% identity),同时与栽培稻表达序列同 源但剪切方式独有(独特的AS剪切方式)。
-
CU406778
CU406596 Contig001277 AK242711
-
CU861677
CT842008 Contig008507 CT856206
--
CT841912
93-11 contigs
Contig003011 Contig000750 -
ESTs or mRNA hits CT859459 AK099287 CT856885
CU406172 Contig014596 CT842006 Contig000383
AK242967 AK111647
CU861753 Contig000750 AK099287
CU406308 Contig000444 CT841996 Contig002576 CU406568 Contig003848
• 极少野生稻的序列和克隆资源,比较成规模的是 Oryza minuta (BBCC genome) 5,211条叶片 ests9。
现状与目的
• NCGR野生稻资源:克隆并精确测序了1,888个 unique的O. rufipogon W1943 cDNA克隆。
• 期望通过W1943 cDNA序列与籼、粳稻cDNA序 列的比较: 汇总一些水稻新基因、潜在野生稻特有的基因、 W1943特有剪切方式基因、组织特异性高表达的 基因和与microRNA相关的基因; 提供一些线索,供有兴趣者作进一步研究之用。
NCGR 2008-09-03
背景
• 野生稻O. rufipogon(AA genome)是与栽培 稻关系最近的祖先水稻品种1,2。
• 具有许多优于栽培稻的农艺性状,比如耐旱、耐 盐等等3,4;
• 公共数据库中有大量栽培稻的基因组序列信息5,6, 同时也有大量的cDNA资源7,8;
AK070131 CT834800 AK064050
-
CT841712
GTP-binding protein
ring-box protein
-
-
Bowman Birk trypsin inhibitor
CU405768
CU405675
CU406202 CU406924 CU405898
CU406582 Contig000444 AK107776
name
93-11 contigs
CT842002 CT842007 CU405940
Contig005912 Contig008507 Contig001402
ESTs or mRNA hits AK241925 CT856206 AK103326
protein
-
name
CU406895 CU861744 CU405657
• 定义:未能定位到O. sativa japonica Nipponbare genome sequences,但与籼稻93-11基因组序 列有同源或与水稻ests序列有同源或与其它禾本科ests序列有同源。 且去除与细菌有同源的基因
• 解释:或者落于粳稻基因组测序gap中,或者籼稻特有的基因,或者野生稻特有基因。
99
CU861795 475
99
CU406355 837
100
CU406396 520
Chr location 05 09
12
02
Identity(%) Antisense protein
99
CA764081 DNA-directed RNA polymerase 3
79
CT858901 -
97
AK107125 AP2 domain, putative
• 解释:水稻新基因。或者在栽培稻中表达量过低难于克隆,或者野生稻特有。
nHale Waihona Puke Baidume
Len(bp)
CU406910 656 CU406138 568 CU406022 543 CU405757 477
Chr location 10 02
12
04
Identity(%) name
Len(bp)
99
CU405785 727
protein
ring-box protein -
-
CA766528
-
-
CT836656
60S ribosomal
protein L7A
-
CA756235
60S ribosomal
protein L17
-
NM_001063334
-
-
AC145809
-
-
CN130755.1
ribulose-
(Sorghum bicolor) bisphosphate
99
AK103485 -
CU406921 414
02
100
CU406535 389
02
100
CU406832 530
10
92
CU406871 458
01
84
CU861804 383
06
99
CU861721 554
01
100
CT841800 941
11
99
AK121962 patatin, putative
carboxylase
-
BE429292.1
-
(Triticum turgidum)
-
FF534517.1
-
(Manihot esculenta)
-
EH277383.1
-
(Spartina
alterniflora)
二、水稻新基因
• 定义:能定位到栽培稻基因组序列的同源,但无任何已知水稻表达序列的同源。 与rice MPSS搜索比较几乎没有找到匹配片段。
• 解释:或只是尚未克隆到该AS表达方式;或为野生稻所独具。
name CT841942 CU406810 CT841893 CT841874 CU405853 CU405923 CU406279 CU406025 CT841561 CU406579 CU406935 CU406600 CU405570 CU406091 CU406134
1888 W1943 cDNAs BLAST against cultivated rice genomic sequences and cDNAs
1888 W1943 cDNAs SSR comparison with indica and japonica cDNAs
一、未匹配粳稻基因组之基因
CU861688 693
08
99
AK109182 -
CT841937 1552
08
98
AK106713 -
注:该17个基因均没有找到任何蛋白同源匹配。右侧的7个基因与已知的 水稻表达序列成反义RNA对。
三、W1943特有剪切方式基因
• 定义:与栽培稻japonica基因组序列完全一致(100% identity),同时与栽培稻表达序列同 源但剪切方式独有(独特的AS剪切方式)。
-
CU406778
CU406596 Contig001277 AK242711
-
CU861677
CT842008 Contig008507 CT856206
--
CT841912
93-11 contigs
Contig003011 Contig000750 -
ESTs or mRNA hits CT859459 AK099287 CT856885
CU406172 Contig014596 CT842006 Contig000383
AK242967 AK111647
CU861753 Contig000750 AK099287
CU406308 Contig000444 CT841996 Contig002576 CU406568 Contig003848
• 极少野生稻的序列和克隆资源,比较成规模的是 Oryza minuta (BBCC genome) 5,211条叶片 ests9。
现状与目的
• NCGR野生稻资源:克隆并精确测序了1,888个 unique的O. rufipogon W1943 cDNA克隆。
• 期望通过W1943 cDNA序列与籼、粳稻cDNA序 列的比较: 汇总一些水稻新基因、潜在野生稻特有的基因、 W1943特有剪切方式基因、组织特异性高表达的 基因和与microRNA相关的基因; 提供一些线索,供有兴趣者作进一步研究之用。