《生物信息学》课程期末报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《生物信息学》
1.描述NCBI或ExPASy主页结构和主要容
NCBI数据库介绍
下面按照检索框上的顺序分别介绍各数据库。
Nucleotide
该数据库由国际核苷酸序列数据库成员美国国立卫生研究院GenBank、日本DNA数据库(DDBJ)和英国Hinxton Hall的欧洲分子生物学实验室数据库(EMBL)三部分数据组成。这三个组织联合组成国际核苷酸序列数据库协作体,每天交换各自数据库中的新增序列记录实现数据共享。其中的序列数据也通过与基因组序列数据库(GSDB)合作获取;专利序列数据通过与美国专利与商标局、国际专利局合作获取。
Genome
即基因组数据库,提供了多种基因组、完全染色体、Contiged序列图谱以及一体化基因物理图谱。
Structures
即结构数据库或称分子模型数据库(MMDB),包含来自X线晶体学和三维结构的实验数据。MMDB的数据从PDB(Protein Data Bank)获得。NCBI已经将结构数据交叉到书目信息、序列数据库和NCBI的Taxonomy中运用NCBI的3D结构浏览器和Cn3D,可以很容易地从Entrez 获得分子的分子结构间相互作用的图像。
Taxonomy
即生物学门类数据库,可以按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等。
PopSet
包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列。PopSet既包含核酸序列数据又包含蛋白质序列数据。
Entrez 功能强大,在于它的大多数记录可相互,既可在同一数据库,也可在数据库之间进行。当运用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行相
似性检索时,则会涉及到蛋白质库或核苷酸库的库。库间发生在核苷酸数据库的记录与PubMed库中已发表序列的引文间的,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的。
NCBI数据库检索
NCBI数据库的检索方法很简单,在检索框中输入检索词,检索词间默认逻辑关系为AND,检索规则基本同PubMed。
可以通过下拉菜单选择记录的显示格式,通常选择GenBank Report格式或FASTA Report 格式。当选择GenBank Report格式后,屏幕显示较完整的基因记录,其容包括:基因位点(Locus)、基因定义(Definition)、基因存取号(Accession)、核酸编号(NID )、关键词(Keywords)、来源(Source)、组织分类(Organism)、参考文献(Reference)、著者(Author)、题目(Title)、期刊Journal)、Medline存取号(Medline)、序列特征(Features)、基因(Gene)、CDS(cDNA)、等位基因(Allele) 对等的肽(Mat-Peptide )、计算碱基数(Base Count)、原序列(Origin)。而FASTA Report格式仅包括检出序列的简要特征描述。
2.Search the human preproinsulin sequence from the NCBI dat
abases.Describe your searching process and results.
评论:此项目是由组装并取代先前的入口
一些序列和功能数据已经改编自洛杉矶洛斯阿拉莫斯序列数据库录入HUMINS1。该基因的直接翻译产物是前胰岛素原。该信号肽促进胰岛素的膜转运前体,并在此过程中被切割掉。在产生的胰岛素原分子,肽链A和B由接合连接肽C,这被认为是在形成的,以帮助需要胰岛素的二硫键。
来自于人类第1到110个前胰岛素原的氨基酸序列,第1到24个氨基酸是信号肽,第25到54个氨基酸是胰岛素原肽B,第55到89个氨基酸是胰岛素原肽C,第90到110个氨基酸是胰岛素原肽A。
3.将人,猪,牛,狗,鼠,羊,马,兔的胰岛素制成进化树。
4.structure of human preproinsulin position of -s-s-
A链的第六个和第十一个半胱氨酸中的巯基形成二硫键。
A链的第七个和B链的第七个半胱氨酸中的巯基形成二硫键。
A链的第二十个和B链的第十九个半胱氨酸中的巯基形成二硫键。