生物信息学考试
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010级硕士研究生生物信息学考试试题
专业:生物化学与分子生学学号:姓名:
1、经实验从某生物个体中获得一段cDNA序列,测序结果如下:
TCACGCGTCGAATCGCGCGGCGACTCGATGAAATGGCCCGCGACGACGTCCCAATCCGCTTCCGCGCG CAGATCGGTGGTCTGCGCGGGCCAATGCTCGCGCGCTCGCGCGACGAACGCGGTGCGATAGGCCCAGC GCCGCGCGGGCAGGAGGTCGCCGTTGTGCGCGGCGACGAGGACACCCTCA TCCGGACGCAGCGCGAG GA TA TCGGCCGTGCGCAGGTACGCTTCGGGCGTCGGCTTGTACGCCTGCGCCACCGTCGCGCCGAGGAT CGCGTCCCACGGCAGCCAACGGCGCTTGGCCA TGTCGA TCA TCAGGATCACGTTGCCGTTCGACAGCG GCGCGA TGA TGTAATGCGCCTTCAGCCGCGTGAGCCCCGCGACCGAATCGGGCCACGGATCGAGCCGG TGCCATGCGGGTATCAGCGCGTCGAGA TCGGCGTCGGCCACGCTCGTGCGA TCGATGCCGAACGCGGG CAGCAGCGCGTCGAGA TTCTCCCGATGCAGAAGGTCGAGCCGCGTGAACGGCCGGCGGCCGCTGATGC CCTCCTCCA TCGCGGGCGAA TAGCCCGCGCGCCACGCATCCGCGAACGCGGCCGGATCGGCTCCCGCG CCGCCGTACTTCGCGAGGAACGGCGTCGCGTCGCGAATGACGCCGGAACGCCAGTCGACCACGGTGC CGAACACGTCGAATACCAA TGCCTTCACGCCAAGCGTCTGCA T
请应用生物信息学的原理和方法解析以下几个问题:
(1)对该基因序列的特征进行分析,如碱基组成、限制性内切酶EcoRV和PleI酶切位点等;
利用BioEdit软件,打开题目所给的RNA序列,选中序列后依次点击Sequence→Nuclei Acid→Nucleotide Composition
碱基组成:
DNA molecule: 序列1
Length = 722 base pairs
Molecular Weight = 221052.00 Daltons, single stranded
Molecular Weight = 441319.00 Daltons, double stranded
G+C content = 69.39%
A+T content = 30.61%
Nucleotide Number Mol%
A 119 16.48
C 255 35.32
G 246 34.07
T 102 14.13
2.限制性内切酶酶切位点:
选中所要分析的序列依次点击,Sequence→Nucleic Acid→Restriction Map→Generate map即可以形成如下的分析结果:
BioEdit version 7.0.9.0 (6/27/07) Restriction Mapping Utility
(c)1998, Tom Hall
序列1 Restriction Map
2011-1-5 AM 10:36:12
722 base pairs
Translations: none
Restriction Enzyme Map:
1 TCACGCGTCGAATCGCGCGGCGACTCGATGAAATGGCCCGCGACGACGTCCCAATCCGCTTCCGCGCGCAGATCGGTGGT 80
1 AGTGCGCAGCTTAGCGCGCCGCTGAGCTACTTTACCGGGCGCTGCTGCAGGGTTAGGCGAAGGCGCGCGTCTAGCCACCA 80
PleI
81 CTGCGCGGGCCAATGCTCGCGCGCTCGCGCGACGAACGCGGTGCGATAGGCCCAGCGCCGCGCGGGCAGGAGGTCGCCGT 160
81 GACGCGCCCGGTTACGAGCGCGCGAGCGCGCTGCTTGCGCCACGCTATCCGGGTCGCGGCGCGCCCGTCCTCCAGCGGCA 160
161 TGTGCGCGGCGACGAGGACACCCTCATCCGGACGCAGCGCGAGGATATCGGCCGTGCGCAGGTACGCTTCGGGCGTCGGC 240
161 ACACGCGCCGCTGCTCCTGTGGGAGTAGGCCTGCGTCGCGCTCCTATAGCCGGCACGCGTCCATGCGAAGCCCGCAGCCG 240
EcoRV
241 TTGTACGCCTGCGCCACCGTCGCGCCGAGGATCGCGTCCCACGGCAGCCAACGGCGCTTGGCCATGTCGATCATCAGGAT 320
241 AACATGCGGACGCGGTGGCAGCGCGGCTCCTAGCGCAGGGTGCCGTCGGTTGCCGCGAACCGGTACAGCTAGTAGTCCTA 320
321 CACGTTGCCGTTCGACAGCGGCGCGATGATGTAATGCGCCTTCAGCCGCGTGAGCCCCGCGACCGAATCGGGCCACGGAT 400
321 GTGCAACGGCAAGCTGTCGCCGCGCTACTACATTACGCGGAAGTCGGCGCACTCGGGGCGCTGGCTTAGCCCGGTGCCTA 400
401 CGAGCCGGTGCCATGCGGGTATCAGCGCGTCGAGATCGGCGTCGGCCACGCTCGTGCGATCGATGCCGAACGCGGGCAGC 480
401 GCTCGGCCACGGTACGCCCATAGTCGCGCAGCTCTAGCCGCAGCCGGTGCGAGCACGCTAGCTACGGCTTGCGCCCGTCG 480
481 AGCGCGTCGAGATTCTCCCGATGCAGAAGGTCGAGCCGCGTGAACGGCCGGCGGCCGCTGATGCCCTCCTCCATCGCGGG 560
481 TCGCGCAGCTCTAAGAGGGCTACGTCTTCCAGCTCGGCGCACTTGCCGGCCGCCGGCGACTACGGGAGGAGGTAGCGCCC 560
561 CGAATAGCCCGCGCGCCACGCATCCGCGAACGCGGCCGGATCGGCTCCCGCGCCGCCGTACTTCGCGAGGAACGGCGTCG 640
561 GCTTATCGGGCGCGCGGTGCGTAGGCGCTTGCGCCGGCCTAGCCGAGGGCGCGGCGGCATGAAGCGCTCCTTGCCGCAGC 640
641 CGTCGCGAATGACGCCGGAACGCCAGTCGACCACGGTGCCGAACACGTCGAATACCAATGCCTTCACGCCAAGCGTCTGC 720
641 GCAGCGCTTACTGCGGCCTTGCGGTCAGCTGGTGCCACGGCTTGTGCAGCTTATGGTTACGGAAGTGCGGTTCGCAGACG 720
721 AT 722
721 TA 722
Restriction table:
Enzyme Recognition frequency Positions
__________________________________________________________________________
EcoRV GAT'ATC 1 207
PleI GAGTCnnnn'n_ 1 17
Enzymes that cut five or fewer times