生物信息学习题

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1、基序（motif）：通过多序列比对，将同源序列收集在一起，以得到保守区域。这些保守区域称为基序(motifs)

2、可读框（ORF）：没有终止密码子（TGA,TAA或TAG）打断的阅读框。

3、剪切变体：从同一DNA，转录得到不同mRNA，并最终翻译成不同的蛋白质称为剪接变体

4、表达标签序列（EST）：是从cDNA文库中生成的一些很短的序列(300—500bp)，它们代表在特定组织或发育阶段表达的基因，有时可代表特定的cDNA.

5、系统发生学：通过比较五种的特征，认为特征相似的五种在遗传学上相近，研究五种之见的进化关系

二、填空题（共20分，每空1分）

l、列举至少2种权威的核酸序列数据库Genbank 、EMBL 等。

2、列举至少3种权威的蛋白质序列数据库PIR 、Swiss-prot 、MIPs 等。

3、核酸序列比对使用的得分矩阵类型有等价矩阵、BLAST 、和转换-颠换矩阵等。

4、蛋白质结构分类数据库主要有SCOP 和CAH 和PDBsum 等。

5、构建系统树的主要方法有UPGMA法、邻近归并法、Fitch-Margoliash法、最小进化法（ME）、最大似然法（ML）、等。

6、列举至少4中NCBI的服务功能Pubmed 、Entrez 、BLAST 和OMIM 等。

1、为什么说Swiss-Prot是重要的蛋白质序列数据库?

SwissProt数据库中的所有序列条目都经过有经验的分子生物学家和蛋白质化学家通过计算机工具并查阅有关文献资料仔细核实。SIB和EBI共有70多人的研究队伍，专门从事蛋白质序列数据的搜集、整理、分析、注释、发布，力图提供高质量的蛋白质序列和注释信息。

SwissProt数据库的每个条目都有详细的注释，包括结构域、功能位点、跨膜区域、二硫键位置、翻译后修饰、突变体等。该数据库中还包括了与核酸序列数据库EMBL/GenBank/DDBJ、蛋白质结构数据库PDB以及Prosite、PRINTTS等十多个二次数据库的交叉引用代码。

特别值得一提的是，专门聘请了由200多位国际知名生物学家组成的网上专家评审团，并将SwissProt数据库中的蛋白质分成200多个类别，每个类别由1位或2位评审专家负责，通过计算机网络进行审核。网站上列出了这些评审专家的姓名、电子邮件地址和他们所负责评审蛋白质种类。用户若对某个蛋白质条目有疑义，可以直接和相应的评审专家取得联系。

2、下面是Genbank中一条记录，是解释其主要含义

序列识别码:AJ627251，长度159930bp，环状DNA分子，植物类，2005年4月15日建立

睡莲叶绿体全基因组

参考文献显示作者、论文标题、期刊年卷期页等信息及于Pubmed链接

外显子位于159465-159895，基因名rpl2

详细序列顺序

3、构建蛋白质二级数据库的主要方法有哪些?

单基序法、多基序法和全域对位排列法

4、概括总结序列比较的主要用途。

1). 用于系统发育分析(phylogenetic analysis) 通过序列比对，可以寻找序列间的同源性(相似性)，这种同源相似性是序列间进化关系的一种反映，所构建的数据矩阵成为系统发育分析的基础。

2). 结构预测(structure prediction)

将新获得的序列与已知结构的蛋白质序列进行比对，可以通过序列同源性来粗略地推测其结构的相似性。

3). 序列基序鉴定(sequence motif identification)

局部排列可以鉴定蛋白质和核苷酸序列中潜在的序列和功能基序。

4). 功能预测（function prediction)

蛋白质序列间的高度相似性通常意味着同源序列间的功能相似性。

5). 数据库搜索(database search)