生物信息学习题集
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学课堂操作练习
一、生物信息学科的发展和研究内容
通过下列internet上的自教课程,初步了解不同的数据库和分析工具
/2can
/Education
二、生物数据库
1. 熟悉各种数据库。
2. 重点了解GenBank和SWISS-PROT所包含的各种功能和适用范围。
三、关键词或词组为基础的数据库检索
1. 熟练掌握Entrez检索体系。
2. 查找与水稻抗病基因Xa21有关的资料
(1) 由多少碱基构成?编码多少个氨基酸?
(2) exon和intron的位置?
(3) 是否有3-D structure数据?
1) 由多少碱基构成?编码多少个氨基酸?
4623b.p., 1025A.a.;
2) exon和intron的位置?
Exon: 24~2700,3543~3943 intron: remaining;
3) 是否有3-D structure数据?
没有.
3. 查找C. elegans基因组的资料。
(1) chromosome I的测序是否已完成?
(2) 已知的chromosome I的序列有多少碱基?序列发表在哪份杂志上?期号和页码?
1) chromosome I的测序是否已完成?
完成.
2) 已知的chromosome I的序列有多少碱基? 序列发表在哪份杂志上? 期号和页码? 15.0724Mb.p.(15072421b.p.), Science 1999 Jan 1;283(5398):35.
4. 查看人类基因组第1染色体上基因的分布。
/mapview/maps.cgi?ORG=hum&MAPS=ideogr,est,loc&LINKS= ON&VERBOSE=ON&CHR=1
5. 查看Arabidopsis的系谱树,以及Arabidopsis第1染色体上的序列。
比较Arabidopsis基因组的资料提供形式与人类基因组有什么不同
(/Taxonomy/Browser/wwwtax.cgi?id=3701,
/mapview/maps.cgi?taxid=3702&chr=1)
貌似没什么区别……
比较Arabidopsis基因组的资料提供形式与人类基因组有什么不同。
6. 与retrotransposon有关的文献资料有多少篇?
5774, (在pubmed中直接查找关键词, 2009‐3‐28)
与rice retrotransposon有关的文献有多少篇?
214, (在pubmed中直接查找关键词, 2009‐3‐28)
7 检索我校在2009年1月发表的被PubMed收录的科研论文
Huazhong Agricultural University,29
7. 熟悉SRS检索体系。
8. 熟悉DBGET检索体系。
四、核苷酸和蛋白质序列为基础的数据库检索
1. 了解BLAST Frequently Asked Questions的答案。
2. 以大麦Mlo基因(Z83834)为查询序列
(1) 用Blastn能检索到多少条与Mlo同源的序列?
与Mlo同源的序列:共找到63条与Mlo同源的序列
(2) 在使用Blastn 检索中,如改变E value的阈值,能检索到多少与Mlo同源的序列?
将E value (Expect threshold)由默认的10改为1时,仍有63条同源序列。
若将E 值改为5e-19时可以找到61条同源序列。
(3) 怎样去掉alignment过程中出现的小写字母?
这里所说的小写字母就是出现重复序列时被算法筛选后出现的n。
将Algorithm parameters中的Filters and Masking选项里的Low complexity regions前的勾去掉就可以去掉比对过程中出现的小写的n。
(4) 用PSI-BLAST检索到的与Mlo蛋白同源的序列与用Blastp检索到的同源序列是否有差别?
PSI-BLAST的特色是每次用profile搜索数据库后再利用搜索的结果重新构建profile,然后用新的profile再次搜索数据库,如此反复直至没有新的结果产生为止。
PSI-BLAST先用带空位的BLAST搜索数据库,将获得的序列通过多序列比对来构建第一个profile。
PSI-BLAST自然地拓展了BLAST方法,能寻找蛋白质序列中的隐含模式,有研究表明这种方法可以有效的找到很多序列差异较大而结构功能相似的相关蛋白,甚至可以与一些结构比对方法,如threading相媲美。
PSI-BLAST服务可以在NCBI的BLAST主页上找到,还可以从NCBI的FTP服务器上下载PSI-BLAST的独立程序。
首先得到Mlo的蛋白质序列:CAB06083.1;然后用blastp检索。
选中PSI-BLAST。
第一次检索得到100个同源序列,再以这些序列为基础,再次检索,得到标有new的序列。
第三次检索,已经没有含有new的序列,检索结束。
(5) 熟悉PHI-BLAST 检索方法。
(6) 用Mlo基因序列检索蛋白质数据库能找到多少同源序列?
使用BLASTX,输入accession number :Z83834,找到100个同源序列
3. 从以Mlo基因的氨基酸序列检索到的同源序列中任取两条序列,
用BLAST 2 sequences作分析,看它们之间是否存在同源序列。
Mlo基因氨基酸序列号:CAB06083
选取两条为:P93766、AAK94905
可以看到具有较高的同源性。
Identities = 397/432 (91%), Positives = 412/432 (95%)
五、多序列对位排列分析和系谱分析
1.用大麦Mlo基因(Z83834)编码的蛋白质序列在数据库中检索同源序列,找出与Mlo同源程度最高的另外9条序列。
对位排列这10条序列,确定这些同源序列的保守区段;分析这些保守区段是否组成已知结构域(domain)或模体(motif)。
1. 在NCBI中的nucleotide数据库中输入Z83834,点击链接到蛋白质序列,用FASTA格式输出,复制该蛋白序列
2. 进入NCBI的BLAST,选择protein blast,粘贴所复制的蛋白序列,进行blast
3. 在结果中选中同源度最高的10条结果,点击get selected sequences
4. 在display中选则FASTA,send to 中选则text,复制有内容。
5. 在EBI的ClustaW分析网页粘贴序列,点击run
2.练习使用各种修饰功能修饰对位排列上述10条序列。
1. Boxshade功能
在多序列对位排列结果网页复制序列排列结果
在“Boxshade”网页(ttp:///software/BOX_form.html)粘贴序列,在“Input sequence format”栏目选择“ALN”,在“Output format”栏目选择“RTF_new”
在结果网页点击“here is your output number 1”,得结果。
2. 颜色修饰功能
“ClustalW Results”网页展示多序列对位排列结果
点击“Show Colors”用不同颜色的字母展示对位排列结果
3.根据系谱分析,上述10条序列中哪两条序列的同源程度最高?
1. “ClustalW Results”网页展示多序列对位排列结果
2. 点击“Show as Phylogram Tree”展示Phylogram Tree,可据此判断同源程度。
4.用大麦Mlo基因(Z83834)序列检索数据库,找出与Mlo同源程度最高的另外
4条序列。
对位排列这5条序列,确定这些同源序列的保守区段;分析这些保守区段是否组成已知结构域(domain)或模体(motif)。
1.进入NCBI的BLAST, 选择nucleotide blast,粘贴基因序列号Z83834,进行
blast
2.在结果中选中同源度最高的5条结果,点击get selected sequences
3.在display中选则FASTA,send to 中选则text,复制所有内容。
4.在EBI的ClustaW分析网页粘贴序列,点击run
六、基因结构分析
1. 从核苷酸数据库中选择DNA序列,试用不同的分析工具分析真核生物和原核生物的基因结构,
并将分析结果与核苷酸数据库中的结果相比较。
2. 掌握GenScan和GeneFinding中的各种分析方法。
七、蛋白质结构分析
1. 从数据库中任选一蛋白质的序列作分析对象,熟悉分析蛋白质的一级和二级结构的方法。
以猪leptin蛋白为例,在ncbi上查找到其序列,再转至EXPasy 网站
http://www.expasy.ch/ 一级结构
1:PI 、Mw 、氨基酸组成http://www.expasy.ch/tools/protparam.html
2:疏水性http://www.expasy.ch/tools/protscale.html
3:重复序列http://www.embl-heidelberg.de/~andrade/papers/rep/search.html
二级结构/~nomi/nnpredict.html(貌似这个网站不能搜)http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html
2. 大麦Mlo基因(Z83834)编码的蛋白质是膜镶嵌蛋白质还是膜附着蛋白质?
先搜出mlo蛋白的序列,输入http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html 网站,由图形看出是膜镶嵌蛋白,跨膜六次。
3.水稻抗病基因Xa21的产物位于细胞的什么部位?
基因Xa21:U37133.1/nuccore/1122442
在ncbi中输"xa21" [gene]”Oryza sativa”,找到xa21序列。
输入/
得到plas的得分最高,说明该蛋白在细胞膜上
4. Xa21基因产物是否糖蛋白?什么类型的糖蛋白?
分析是否是糖蛋白在http://www.cbs.dtu.dk/services/NetOGlyc/
和http://www.cbs.dtu.dk/services/NetNGlyc/
说明是N-连接的糖蛋白
5. Xa21蛋白的亲水性和疏水性如何?
Grand average of hydropathicity (GRAVY): 0.049
亲水性分析http://www.expasy.ch/tools/protscale.html
Hydropathicity>0 ,疏水强<0, 亲水强。
说明xa21蛋白有轻度疏水性
八、农业类数据库的利用
1. 熟悉各种农业类基因组数据库,重点以Gramene、GrainGenes和ArkDB数据库为例,
掌握各种内容的查询方法。
2. 分子标记ARKMKR00050536位于火鸡的第几号染色体?它在这条染色体上的遗传位置?ARKMKR00050536位于火鸡第一号染色体,遗传位置是125.800 /arkdb/do/getMarkerDetail?accession=ARKMKR00050536
3. 水稻的JRGP RFLP 2000分子标记遗传连锁图的3号染色体上定位了多少个分子标记?覆盖了多少遗传距离?有32个分子标记,覆盖166.40CM
/db/cmap/viewer?mapMenu=&featureMenu=&corrMenu=&displayMenu =&advancedMenu=&ref_map_accs=jrgp-rflp-2000-3&sub=Draw+Selected+Maps&ref_map_start =&ref_map_stop=&ft_centromere=2&ft_est=2&ft_gene=2&ft_genomic-dna=2&ft_marker=2&ft _rapd=2&ft_rflp=2&ft_sts=2&prev_ref_species_acc=rice&prev_ref_map_accs=&ref_map_set_ac c=jrgp-rflp-2000&ref_species_acc=rice&data_source=Gramene
4. 水稻11号染色体上定位的标记CDO534属于什么类型的分子标记?来源于什么物种?.CDO534属于RFLP分子标记,来源于Avena sativa物种
/db/markers/marker_view?marker_id=21514745
5. 水稻分子标记RG101所在的染色体位点是否有QTL信息?什么类型的QTL?
RG101所在的染色体位点有QTL信息
有多种类型的QTL,例如seed number,spikelet density,plant height,spikelet number /db/cmap/feature?feature_acc=AQCG005
6 水稻5号染色体上定位的标记C1018属于什么类型的分子标记?来源于什么组织?序列是否已知?
C1018属于RFLP类型的分子标记, 来源于callus组织. 序列已知。
/db/markers/marker_view?marker_id=21512166
7 水稻分子标记RM172所在的染色体位点是否有QTL信息?什么类型的QTL?
有culm length
/db/markers/marker_view?marker_id=24986341
九、核酸序列的其他分析方法
1. 大麦Mlo基因(Z83834)的CG含量是多少?58.89%
2. 如何获得Z83834的反向互补序列?sequence/Nuleic Acid/Reverse Complement
3. Mlo基因不包含哪种限制性内切酶位点?
/NEBcutter2/cutshow.php?name=6da5d381-Z83834
4. DNA序列AC004765位于几号染色体的什么位点?
5.推测Z83834的ORF和翻译产物。
/projects/gorf/orfig.cgi
生物信息学课程考试样卷
提示:(1)2小时答题时间;(2)课堂开卷,独立完成;(3)答题简明扼要1.请查询有关OsPK7基因的资料,回答下列问题:
1.OsPK7基因的注册号?它来源于什么物种?(6分)
2.OsPK7编码的蛋白质包含有多少个氨基酸?是否为跨膜蛋白?该蛋白可
能位于细胞的什么部位? (7分)
3、分离克隆OsPK7基因的工作发表在什么杂志上?杂志卷号、页码、年份?
(7分)
1. 答题要点:
(1)AB011968,来源自水稻。
(2)520 aa;不是跨膜蛋白;可能是位于细胞外的可溶性蛋白。
(3)文章发表在Mol. Gen. Genet.;2000年263期359-366页。
详细:
方法:NCBI主页——nucleotide中输入基因名——查找注册号(ACCESSION为AB011968)及来源(ORGANISM为Oryza sativa (rice))——查找其蛋白质注册号即点击protein_id(结果为BAA83689)——点击PubMed即可得到发表该基因的文章: (Mol Gen Genet. 2000 Mar;263(2):359-66.)(或在PubMed上面一排的JOURNAL JOURNAL就可以得到发表文章)
是否为跨膜蛋白,方法:
1、ExPASy主页(http://www.expasy.ch/)
选择topology prediction
2、在“Topology prediction”栏目选择“SOSUI”分析工具
3、在SOSUI主页选择分析“SOSUI”分析软件
4、在SOSUI:Submit a protein sequence网页粘贴序列(将display改为fasta
格式在复制粘贴,可能有时候粘贴时要不粘第一排)
5、分析结果(This amino acid sequence is of a SOLUBLE PROTEIN)
蛋白质定位:
1、ExPASy 主页选择topology prediction
2、在“Topology prediction”栏目选择“PSORT”软件分析蛋白质在细胞中的定位
3、在PSORT网页选择分析方法,如选择WoLF PSORT
4、选择物种,粘贴序列(将display改为fasta格式在复制粘贴,可能有时候粘
贴时要不粘第一排)
5、分析结果
2.任选一种分析工具,分析序列AY066019的基因结构及其编码产物的化学性质。
请注明分析工具的名称,以及是否采用某一物种的数据作为参照。
1.根据你所选用的分析方法,这条序列编码多少个基因?编码序列的位
点?分析结果与事实是否相符合?(7分)
2.预测的基因位于哪条DNA链上?(6分)
3.预测基因之一(请注明是第几个基因)编码的蛋白质的分子量和等电点
是多少?该蛋白质中哪一种氨基酸的含量最高?(7分)
2. 答题要点:
(1)采用FGENESH分析方法,选择Human参照。
该序列包含一个基因,其编码序列是770-955 bp,1562-1607 bp,1795-1842 bp,2144-2565 bp;
分析结果与事实符合。
(2)预测的基因位于正链上。
(3)采用ProtParam分析方法,基因编码产物的分子量:25644.4;等电点:
6.44;亮氨酸(L)的含量最高。
(4)本题也可以采用不同于(1)-(3)的
分析方法回答。
详细:
3. C1018是水稻分子标记遗传连锁图(TTU IRIR 2000)上的一个分子标记,请回答下列有关问题:
1.这个分子标记被定位于水稻第几号染色体?属于什么类型的分子标记?
(6分)
2.与这个分子标记紧密连锁(两侧)的分子标记的名称是什么?(5分)
3.这个分子标记的DNA序列是否已知?如果序列已知,它在数据库中的注
册号是什么?这条序列来源于什么物种的什么组织?(7分)
3. 答题要点:
(1)5号染色体;RFLP标记。
(2)R2289和PC17M14。
(3)序列已知,注册号:D28215;来源于水稻的愈伤(callus)组织。
方法:进入禾本科植物比较基因组数据库主页:Gramene 数据库()——在species下拉栏中选择RICE——在find anything中选择maker,后面空格中输入C1018,然后搜索——在得到的收索结果中选择maker第一条——type一栏显示为RFLP,Details 中的source tissue 一栏显示为callus(愈伤组织)——点击sequance可以看到序列说明序列已知,并且在序列的最前段可以看到序列号为D28215,来源于水稻。
4.分析五条DNA序列(X55152、AY888608、X57321、M64087、X66539)的同源性并回答下列问题:
1.哪两条序列的进化亲缘关系最近?它们之间的同源性是多少?(10分)
2.哪一条序列与上述其他四条序列均表现出较低的同源性?(10分)
4.答题要点:
(1)X55152和X57321的进化亲缘关系最近,它们的同源性是83%。
(2)M64087与其它四条序列均表现出较低的同源性。
5.你从实验中获得一条由250个氨基酸组成的蛋白质的序列。
你想了解该蛋白质的三维结构是否已知。
根据你从“生物信息学”课中学到的知识,该如何寻找答案?(20分)
5. 答题要点:
(1)采用BLAST分析方法,用这条DNA序列检索PDB结构数据库。
本题也可以采用不同于(1)的分析方法回答。
1.请查询有关OsPK7基因的资料,回答下列问题:
OsPK7基因的注册号?它来源于什么物种?(6分)
OsPK7编码的蛋白质包含有多少个氨基酸?是否为跨膜蛋白?该蛋白可能位于细胞的什么部位? (7分)分离克隆OsPK7基因的工作发表在什么杂志上?杂志卷号、页码、年份?(7分)1)AB011968,来源自水稻。
(2)520 aa;不是跨膜蛋白;可能是位于细胞外的可溶性蛋白。
(3)文章发表在Mol. Gen. Genet.;2000年263期359-366页。
2.任选一种分析工具,分析序列AY066019的基因结构及其编码产物的化学性质。
请注明分析工具的名称,以及是否采用某一物种的数据作为参照。
根据你所选用的分析方法,这条序列编码多少个基因?编码序列的位点?分析结果与事实是否相符合?(7分)
预测的基因位于哪条DNA链上?(6分)
预测基因之一(请注明是第几个基因)编码的蛋白质的分子量和等电点是多少?该蛋白质中哪一种氨基酸的含量最高?(7分)
(1)采用FGENESH分析方法,选择Human参照。
该序列包含一个基因,其编码序列是770-955 bp,1562-1607 bp,1795-1842 bp,2144-2565 bp;分析结果与事实符合。
(2)预测的基因位于正链上。
(3)采用ProtParam分析方法,基因编码产物的分子量:25644.4;等电点:6.44;亮氨酸(L)的含量最高。
(4)本题也可以采用不同于(1)-(3)的分析方法回答。
3. C1018是水稻分子标记遗传连锁图(TTU IRIR 2000)上的一个分子标记,请回答下列有关问题:
这个分子标记被定位于水稻第几号染色体?属于什么类型的分子标记?(6分)
与这个分子标记紧密连锁(两侧)的分子标记的名称是什么?(5分)
这个分子标记的DNA序列是否已知?如果序列已知,它在数据库中的注册号是什么?这条序列来源于什么物种的什么组织?(7分)
(1)5号染色体;RFLP标记。
(2)R2289和PC17M14。
(3)序列已知,注册号:D28215;来源于水稻的愈伤(callus)组织。
4.分析五条DNA序列(X55152、AY888608、X57321、M64087、X66539)的同源性并回答下列问题:
哪两条序列的进化亲缘关系最近?它们之间的同源性是多少?(10分)
哪一条序列与上述其他四条序列均表现出较低的同源性?(10分)
(1)X55152和X57321的进化亲缘关系最近,它们的同源性是83%。
(2)M64087与其它四条序列均表现出较低的同源性。
5.你从实验中获得一条由250个氨基酸组成的蛋白质的序列。
你想了解该蛋白质的三维结构是否已知。
根据你从“生物信息学”课中学到的知识,该如何寻找答案?(20分)(1)采用BLAST分析方法,用这条DNA序列检索PDB结构数据库。
本题也可以采用不同于(1)的分析方法回答。
1教学网站/kech/swxxx/
2 Internet /Education /2can/home.html
3 SQL
4 GenBank /
5 dbEST (Database of Expressed Sequence Tags) /dbEST/index.html
6 UniGene 数据库/UniGene/
7 dbSTS (Database of Sequence Tagged Sites) /dbSTS/index.html
8 dbGSS (Database of Genome Survey Sequences)
/dbGSS/index.html
9 HTG (High-Throughput Genomic Sequences) /HTGS/
10 基因组数据库/sites/entrez?db=genome
11 dbSNP单核苷酸多态性数据库
/sites/entrez?db=snp
12 EMBL /embl
13 DDBJ http://www.ddbj.nig.ac.jp/Welcome-e.html
14 EPD (Eukaryotic Promoter Database) http://www.epd.isb-sib.ch/
15 蛋白质数据库SWISS-PROT /swissprot
16 TrEMBL (Translation of EMBL)
17 PIR (Protein Information Resource)
18 PRF (Protein Research Foundation) http://www.prf.or.jp/en/os.html
19 Prosite /prosite
20 PDB (Protein Data Bank)
21 SWISS-3D IMAGE http://www.expasy.ch/sw3d/
22 酶和代谢数据库KEGG主页http://www.genome.ad.jp/kegg/
23 PKR (Protein Kinase Resource) /pkr/Welcome.do
24 系谱数据库Taxonomy /Taxonomy/taxonomyhome.html
25 文献数据库PubMed /PubMed
26 OMIM /sites/entrez?db=OMIM
27 美国农部农业图书馆的数据库Agricola /
28 Entrez检索体系/Entrez
29 SRS 检索体系/
30 DBGET检索体系http://www.genome.ad.jp/dbget/
31 BLAST (Basic Local Alignment Search Tool) 检索/
32 Primer-BLAST /tools/primer-blast
33 FASTA 检索/fasta33/index.html
34 Blitz 检索/searches/blitz.html
35 BLAST 2 sequences /
36 ExPASy http://www.expasy.ch
37 多序列比对ClustaW分析网页(/clustalw/index.html)
38 Boxshade 突出相同或相似位点/software/BOX_form.html
39 ESPript 多种修饰功能http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi
40 基因预测Gene Finding Softberry (/berry.phtml)
41基因预测GenScan(/GENSCAN.html)
42 基因预测GeneMark(/GeneMark/)
43 Gene Feature Searches (BCM )
44 比较基因组预测基因Twinscan/N-SCAN (/software/twinscan/)
45 美国农部农业图书馆主页
46 禾本科植物比较基因组数据库
47 SoyBase 主页(/)
48 GrainGenes ()
49 RMD数据库()
50家畜、家禽基因组数据库ArkDB ()
51 从美国微生物系的网页(/BioEdit/bioedit.html
52 ORF finder /projects/gorf/
53 SRS检索主页()
54 Primer3(/)
55 electronic PCR(e-PCR)功能定位DNA序列(/projects/e-pcr/)56NEBcutter /NEBcutter2/index.php
>gi|1405|emb|X55152.1| O.aries mRNA for tumor necrosis factor alpha (TNF-alpha) GGCCAAGAGAGAGACAAGCAGCTGCAGAACCCCCTGGAGATAACCTCCCAGACAACACACCCCCGAGAGA CAGCCAGGCAACTTGCTCTCTCATACACCCTGCCACAAGGCTCTCCTGTCTCCCGTCTGGACTTGGATCC TTCTGAAAAAGACACCATGAGCACCAAAAGCATGATCCGGGATGTGGAGCTGGCGGAGGAGGTGCTCTCC AACAAAGCAGGGGGCCCCCAGGGCTCCAGAAGTTGCTGGTGCCTCAGCCTCTTCTCCTTCCTCCTGGTTG CAGGAGCCACCACGCTCTTCTGCCTGCTGCACTTCGGGGTAATCGGCCCCCAGAGGGAAGAGCAGTCCCC AGCTGGCCCCTCCTTCAACAGGCCTCTGGTTCAGACACTCAGGTCATCTTCTCAAGCCTCAAATAACAAG CCGGTAGCCCACGTTGTAGCCAACATCAGCGCTCCGGGGCAGCTCCGATGGGGGGACTCGTATGCCAATG CCCTCATGGCCAACGGCGTGGAGCTGAAAGACAACCAGCTGGTGGTGCCCACTGACGGGCTTTACCTCAT CTACTCGCAGGTCCTCTTCAGGGGCCACGGCTGCCCTTCCACCCCCTTGTTCCTCACCCACACCATCAGC CGCATTGCAGTCTCCTACCAGACCAAGGTCAACATCCTCTCTGCCATCAAGAGCCCTTGCCACAGGGAGA CCCTAGAGGGGGCTGAGGCCAAGCCCTGGTACGAACCCATCTACCAGGGAGGGGTCTTCCAGCTGGAGAA GGGAGATCGCCTCAGTGCTGAGATCAACCTGCCGGAATACCTGGACTATGCCGAGTCTGGGCAGGTCTAC TTTGGGATCATCGCCCTGTGAGGGCGCAGGACATGCATCCTCTCCCACCTCAGTTACCTTATTATTTACT CCTTCAGACCCTCCTCATCCCCTTCTGGTTTAGAAAGGGAATTAGGGGCTCAGGGCTGGGCTCCAAGCGT CCAACTTTAAACAACAGCTGCACTTAGAAATTAGGGATGTAGGGAAGTGAGGCCTGGACAATGGGCCACC AACCATCACCAAGGACTGGAACTGGAACTTCCAGAACTCCTCGGGTCCACAAGTTTGGGTTCCCGGATGC AACCTGGGACACCCAGAATGCAAGGGCCAGGGTTCTTACCGGAATACTTCGCAACGTTCCTTGAGAAGAT CTCACCTAGAACTTGACATGGGTGGGCTTCAACTCTCCCTTCCTGCCAATGTTTCCAGATTCCCCTGAGG TGGGAAGCCCAGCCCCAACCCCACTGGGCCAACTCCCTCTGTTTATGTTTGCACTTATGATTATTTATTA TTTATTTATTATTTATTTATTTACTAATGAATGTATTTATTCAGGAGGTCAAGGTGTCCTGGGAGACACA AACTAAGGGCTGCCTTGGCTCAGATGTGTTTTCTGTGAAAACGGAGCTGAACTGCAGGTTGCTCCCACCA TGCCTCCTGGCCTTTGTGCCTCCTTTTGCTTATGTTTTTTAAAAAATATTTATGTGATCAAGTTGTCTAA ATGATGCTGATTTGGTGACTGATTTGTCGCTACATCACTGAACCTCCGCTCCCCAGGGGAGTCATGCCTG TAACCGCCCTACTGGTCAGTGGCGAGAAATAAAGTGTCCTGAGAAAAGAAAAAAAAAAA
>gi|61358333|gb|AY888608.1| Synthetic construct Homo sapiens clone FLH118283.01X tumor necrosis factor (TNF) mRNA, complete cds ATGAGCACTGAAAGCATGATCCGGGACGTGGAGCTGGCCGAGGAGGCGCTCCCCAAGAAGACAGGGGGGC CCCAGGGCTCCAGGCGGTGCTTGTTCCTCAGCCTCTTCTCCTTCCTGATCGTGGCAGGCGCCACCACGCT CTTCTGCCTGCTGCACTTTGGAGTGATCGGCCCCCAGAGGGAAGAGTTCCCCAGGGACCTCTCTCTAATC AGCCCTCTGGCCCAGGCAGTCAGATCATCTTCTCGAACCCCGAGTGACAAGCCTGTAGCCCATGTTGTAG CAAACCCTCAAGCTGAGGGGCAGCTCCAGTGGCTGAACCGCCGGGCCAATGCCCTCCTGGCCAATGGCGT GGAGCTGAGAGATAACCAGCTGGTGGTGCCATCAGAGGGCCTGTACCTCATCTACTCCCAGGTCCTCTTC
AAGGGCCAAGGCTGCCCCTCCACCCATGTGCTCCTCACCCACACCATCAGCCGCATCGCCGTCTCCTACC AGACCAAGGTCAACCTCCTCTCTGCCATCAAGAGCCCCTGCCAGAGGGAGACCCCAGAGGGGGCTGAGGC CAAGCCCTGGTATGAGCCCATCTATCTGGGAGGGGTCTTCCAGCTGGAGAAGGGTGACCGACTCAGCGCT GAGATCAATCGGCCCGACTATCTCGACTTTGCCGAGTCTGGGCAGGTCTACTTTGGGATCATTGCCCTGT
AG
>gi|2137|emb|X57321.1| S.scrofa TNF-alpha mRNA for tumor necrosis factor alpha CAAGCCACTCCAGGACCCCCTAGAAATAACCTCTCAGAAGACACACCCCCGAACAGGCAGCCGGACGACT CTCTCCCTCTCACACGCTGCCCCGGGGCGCCACCATCTCCCAGCTGGACCTGAGCCCCTCTGAAAAAGAC ACCATGAGCACTGAGAGCATGATCCGAGACGTGGAGCTGGCGGAGGAGGCGCTCGCCAAGAAGGCCGGGG GGCCCCAGGGCTCCAGGAGGTGCCTGTGCCTCAGCCTCTTCTCCTTCCTCCTGGTCGCAGGAGCCACCAC GCTCTTCTGCCTACTGCACTTCGAGGTTATCGGCCCCCAGAAGGAAGAGTTTCCAGCTGGCCCCTTGAGC ATCAACCCTCTGGCCCAAGGACTCAGATCATCGTCTCAAACCTCAGATAAGCCCGTCGCCCACGTTGTAG CCAATGTCAAAGCCGAGGGACAGCTCCAATGGCAGAGTGGGTATGCCAATGCCCTCCTGGCCAACGGCGT GAAGCTGAAAGACAACCAGCTGGTGGTGCCGACAGATGGGCTGTACCTCATCTACTCCCAGGTCCTCTTC AGGGGCCAAGGCTGCCCTTCCACCAACGTTTTCCTCACTCACACCATCAGCCGCATCGCCGTCTCCTACC AGACCAAGGTCAACCTCCTCTCTGCCATCAAGAGCCCTTGCCAGAGGGAGACCCCCGAGGGGGCCGAGGC CAAGCCCTGGTACGAACCCATCTACCTGGGAGGGGTCTTCCAGCTGGAGAAGGATGATCGACTCAGTGCC GAGATCAACCTGCCCGACTATCTGGACTTTGCTGAATCTGGGCAGGTCTATTTTGGGATCATTGCCCTGT GAGGGGGCAGGACATCCGTTCCCTCCCCTGTCCATCCCTTTATTATTTTACTCCTTCAGACCCCCTCACG TCCTTCTGGTTTAGAAAGAGAATGAGGGGCTGGGGACTGGGCTCCAAGCTTAAAACTTTAAACAACAACA GCAACACTTAGAAATCAGGGATTCAGGGATGTGTGGCCTGGACAACCAGGCACTGACCACCACCAAGAAT TGGAACTGGGGCTTCCAGACTCGCTGGGGTCCTTGGGTTTGGATTCCTGGATGCAACCTGGGACATCTGG AATGTGGCTGCCAGGGAAGCTTGGGTTCCAATCGGAATACTTCAGAACATTCCTTGAGAAGATTTCACCT CAATCTTGATGACTTTTTAGGCTTCCCTTTCTTCCAATTTTCCAGACTTCCCTGGGATGGGGAGCCCAGC CCCAAACCCCACAGGCCAGCTCCCTCTTATTTATATTTGCACTTGGCATTATTATTTATTTATTTATTTA TTATTTATTTACTAGTGAATGTATTTATTCAGGAGGGCGAGGTGTCCTGGGAGACCCAGCATAAGGGCTG CCTTGGTTCAGATGTGTTTTCTGTGAAAACGGAGCTGAACTGTAGGTTGCTCCCACCTGGCCTCCTAGCC TCTGTGCCTCCTTTTGCTTATGTTTTTAAAAACAAATATTTATCTGATCGAGTTGTCTAAATAATGCTGA TTTGGGTGACTAACTTGTCGCTACATCGCTGAACCTCTGCTCCCCAGGGGAGTTGTGTCTGTAACCGCCC TACTGGTCAGTGGCGAGAAATAAAAGCGTGTTTAGAAAAG
>gi|164244|gb|M64087.1|HRSTNFA Equus caballus tumor necrosis factor-alpha gene, complete cds GCGAATTCGGTTTCTCCACCAAGGAAGTTTTCCGCTGGTTGAATGAGAGCCTTTCCCCGCCCTCCTCTCG CCTCGGGCTTATAAATGCAGCTGTTTGCACACCCAGCCAGCAGAAGCTCCCTCAGCAAGGGCAACAGGGG ACCAGCCAGGAGAGAGAGAAGCAACTTCAGAGACCCCTGGAAATAACCTCTCAGAGGACACACCTCTGGA TAAACAGCCAGGCGATTTTCTCCCTCGCATGCCCCAGGGCTCGACCATCTCCCAGCTGGACTTGAGCCCC TCTGGAAAGGACATCATGAGCACTGAAAGCATGATCCGAGATGTGGAGCTGGCAGAGGAGGAGCTCGCCA AGAAGGCAGGGGGCCCCCAGGGCTCCAGACGGTGCTTGTGCCTCAGCCTCTTCTCCTTCCTCCTTGTCGC AGGAGCCACCACGCTCTTCTGCCTGCTGCACTTTGGGGTGATCGGCCCCCAGAGGGAAGAGGTGAGTGCC TTGCCAGCCTTGGCTCATTCTCCTACCCAGAGAGAAATAGGGGAGAAAGAGGGCGAGAGACAGGATTGGG GAAAGAGGTGTGCTGATGAGGAGGGTGGGAGGGAAAACTTGGAGAAAGATGGAGAGGCAGAATGAGATGT AGAGAGAGATGGAGGAAGAGAGAGAAGGATGGACAGATGGGGGGGCTTGGCACATGGAAGGTGCTCACTA AACGTTTGTTGAATGAATGAATGAGCAAGCAGATATACGTCTATAAAGAGAGATGTGGGGTGTGAGTAGA GAGATGAGGGGGAAGTCATATGAATAAAGATGGTCAGACAGAAAGAGAAATGGAAGATATGAAAGAGAGA
TAAGGAGAGAGATGAGGGAAAGAGATAAGGAAAGATGAAGATAGGATGTCTGGTACATGGAAGGAGCTGA ATGAAAGAGTTGCTGAATGGATGGAGGGATGAATAAATGGATGAATGGAGAGAGAAAACTAGACACATCA GGACAGAGAGGACAGGCTAGATAAGCAGCCTGGCTGTTTTTCCTGTAGGGATGACTTGCTCTGATGCTAA TCCTCTCTCTTCTCCCCAGCAGTTACCGAATGCCTTCCAGTCAATCAACCCTCTGGCCCAGACACTCAGT AAGTGTCTCCAAAACCTCTCTCCTAATTCTGGGTTGGGATGGGGGTGGGGGTTAATTCTGGGATGGAAAC GGTGGGGGAAATTTAGAGTTTTGGCTTTGGGGGAGGAGGAATGGAGGTCACAGTAGTGAGATATTTTCTG CAAAGCTTAAGGGTCTCACCTTTTTCTTTCCTTTTTCCTCCTCAGGATCATCTTCTCGAACCCCAAGTGA CAAGCCTGTAGCCCATGTTGTAGGTAAGAGTGCTGAGGATGTGTTTGGGGGATAAAGAAGCAGATGGGAT GTGGAGGAATAGGATTTGGGGGCTGAACCTAGGCTGAGGGTAGACAGGTCTTGGGGACAGTGTGACAAGA GCTCACTGAGCTCCAGGGGAGGGTGGAGGAACAGCACAGGCCTTGAGGGGGTACTGAGAACCTCATGGCC AGATGGGATGTGGAAAGACAGACAGGGGACAGGAACCGGATGTGGGAGGTGGGCAGAACTTGAGGGCCAG GATGTGGAGAGTGGAACTGACAGGATCACACTGACTCACCCCTCCCTCTTTCTCTCCCTCCCTCCAGCAA ACCCCCAAGCCGAGGGGCAGCTCCAGTGGCTGAGTGGGCGTGCAAATGCCCTCCTGGCCAATGGCGTGAA GCTGACAGACAACCAGCTGGTGGTACCATTGGATGGGCTGTACCTCATCTACTCCCAGGTCCTCTTCAAA GGCCAAGGCTGCCCTTCCACCCATGTGCTCCTCACCCACACCATCAGCCGCTTAGCTGTCTCCTACCCGT CCAAGGTCAACCTCCTCTCTGCCATCAAGAGCCCTTGCCACACGGAGTCCCCAGAGCAGGCTGAAGCCAA GCCCTGGTATGAGCCCATCTACCTGGGAGGAGTCTTCCAGCTGGAGAAGGGTGATCAACTCAGCGCTGAG ATCAATCAGCCCAACTATCTCGACTTTGCGGAGTCCGGGCAGGTCTACTTTGGGATCATTGCCCTGTGAG GGGGGTACGTCCGTCCTCGCCCACCTCAATCCCTTTATTATCTGCTCCTTCAGAACCCTCTCATCCCCTT CTGAGGTTTAGAAAGGGAATGAAGGGCTCAGGGCCGGGCCCCAAACTCAGAACTTGAAACAACAACAACA CTTAGAAACCTAGAATGCAGGGATGTGTGACCTGGACAACGGGGCACCGGTCACCACCAAGAATTCAAAC TGGGGCTTCCAGAACTCACTGGGGGCCTCAGATTTGGATCCCTGAATGCAGCCTGGGACACCTGGAACGT GGGGGCCAGGAAACCTTTGGTTCTGGCCAGAACACTTCAGAACATCCGTTGAGAAGATCTCACCCAGAAC TTGATGAGAGTGGACCACAGGTCTCCCTTTTTTCAAATGTTTCCAAACTCTTCCCCGAGTTGTAGAGCCC AGGCCCTCCGCCATGGGGCCGGCTCCCTCTATTTATGTCTGCACTTGAGATTATTTATTATTTATTTATT ATTTATTTATTTGGATCCCG
>gi|395369|emb|X66539.1| R.norvegicus mRNA for tumor necrosis factor-alpha ATGAGCACAGAAAGCATGATCCGAGATGTGGAACTGGCAGAGGAGGCGCTCCCCAAAAAGATGGGGGGCC TCCAGAACTCCAGGCGGTGTCTGTGCCTCAGCCTCTTCTCATTCCCGCTCGTGGCGGGGGCCACCACGCT CTTCTGTCTACTGAACTTCGGGGTGATCGGTCCCAACAAGGAGGAGAAGTTCCCAAATGGGCTCCCTCTC ATCAGTTCCATGGCCCAGACCCTCACACTCAGATCATCTTCTCAAAACTCGAGTGACAAGCCCGTAGCCC ACGTCGTAGCAAACCACCAAGCAGAGGAGCAGCTGGAGTGGCTGAGCCAGCGTGCCAACGCCCTCCTGGC CAATGGCATGGATCTCAAAGACAACCAACTGGTGGTACCAGCAGATGGGCTGTACCTTATCTACTCCCAG GTTCTCTTCAAGGGACAAGGCTGCCCCGACTATGTGCTCCTCACCCACACCGTCAGCCGATTTGCCACTT CATACCAGGAGAAAGTCAGCCTCCTCTCCGCCATCAAGAGCCCTTGCCCTAAGGACACCCCTGAGGGAGC TGAGCTCAAGCCCTGGTATGAGCCCATGTACCTGGGAGGAGTCTCCCAGCTGGAGAAGGGGGACCTGCTC AGCGCTGAGGTCAACCTGCCCAAGTACTTAGACATCACGGAGTCCGGGCAGGTCTACTTTGGAGTCATTG CTCTGTGA。