生物信息学第三次上机作业_电子科大

合集下载

生物信息学习题(2010-7)

生物信息学习题(2010-7)

生物信息学练习题(2009-2010学年第2学期)姓名:性别:班级:学号:说明:(1)此作业主要是让大家熟悉一下生物信息学的基本知识点,并真正练习一下生物信息软件的使用。

(2)此作业将作为我们的成绩,不交者将没有成绩,请认真对待;(3)作业统一用A4纸打印,并装订;(4)在7月10日前,各班学委收起后,交到新生化大楼C615房间;(5)如有问题可与我联系,一.问答题:1. 当今世界上主要的三大生物数据库是指哪些数据库?答:当今世界上主要的三大生物数据库是美国国家生物技术信息中心NCBI(National Center for Biotechnology Information),EBI(European Bioinformatics Institute)欧洲生物信息研究所,DDBJ(DNA Data Bank of Japan)日本核酸数据库2. 人类基因组计划的完成将绘制出“四张图“,请问这四张图是指哪些图?答:人类基因组计划的完成将绘制出“四张图“是指:1遗传图谱,又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组。

2物理图谱,是以一段已知核酸序列的片段STS序列为路标,以碱基对数目的多少为图距来表示两个遗传标记之间的物理距离[基本单位是Mb、kb、bp]的图谱。

3序列图谱,是分别将各染色体全部碱基序列绘制的图谱。

包括转录序列和非转录序列。

4转录图谱谱也叫基因表达图谱,以表达序列标签(expressed sequence tag , EST )为位标,反映基因在不同条件下的表达情况的图谱。

3. 生物信息学的定义有狭义与广义之分,请问狭义的生物信息学定义是什么?答:目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。

《生物信息学》试卷(A)

《生物信息学》试卷(A)

武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(A)及答案一、翻译下列名词并解释。

(每题5分,共25分)1. EST2. ORF3. BLAST4. ANN5. HGP二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有和二维核磁共振技术。

2、BLAST对序列格式的要求是常见的格式。

3、系统发育树由一系列和组成,其中每个代表一个分类单元,而代表物种之间的进化关系。

、、等。

6. 目前已经是最广泛使用的系统发育程序。

三、解释说明: 请按要求对下列GenBank文件作解释说明。

(每小题4分,共20分)1、LOCUS行中的第3项mRNA linear表示,这里是。

2、DEFINITION行在GenBank记录中用以3 ACCESSION 是,是从数据库中检索一个记录的主要。

4. FEATURES后面部分是,直接表达了记录的生物背景知识,5 CDS 30…533 表示。

四、问答。

(共35分)1简述国际上有哪几个著名的核酸序列数据库?(10分)2何谓序列比对的相似性和同源性,它们之间有何联系和区别(10分)3试述发现基因的一般过程(15分)《生物信息学》试卷(A)答案一、翻译下列名词并解释。

(每题5分,共25分)1. EST expressed sequence tag 表达序列标签2. ORF Open Reading Frame, 开放阅读框3. BLAST Basic Local Alignment Search T ool 局部相似性基本查询工具4. ANN Artificial Neural Network, 人工神经网络5. HGP Human genome project 人类基因组计划二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有X射线晶体衍射法和二维核磁共振技术。

2、BLAST对序列格式的要求是常见的FASTA格式。

3、系统发育树由一系列节点和分支组成,其中每个节点代表一个分类单元,而节点之间的连线代表物种之间的进化关系。

生物信息学题库

生物信息学题库

■一、选择题:1.以下哪一个是mRNA条目序列号:A.J01536■.NM_15392C.NP_52280D.AAB1345062.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■.UnigeneB.EntrezC.LocusLinkD.PCR3.—个基因可能对应两个Unigene簇吗?■可能B.不可能4.下面哪种数据库源于mRNA信息:■dbESTB.PDBC.OMIMD.HTGS5.下面哪个数据库面向人类疾病构建:A.ESTB.PDB■.OMIMD.HTGS6.Refseq和GenBank有什么区别:A.Refseq包括了全世界各个实验室和测序项目提交的DNA序列B.GenBank提供的是非冗余序列■.Refseq源于GenBank,提供非冗余序列信息D.GenBank源于Refseq7.如果你需要查询文献信息,下列哪个数据库是你最佳选择:A.OMIMB.Entrez■PubMedD.PROSITE8.匕比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪附说法正确:A.因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B.搜索结果很可能一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/YB.Q/W/YC.F/W/YD.Q/N/W10.直系同源定义为:■不同物种中具有共同祖先的同源序列B.具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的并且通常是冗余的功能的同源序列11.下列那个氨基酸最不容易突变:A.丙氨酸B.谷氨酰胺C.甲硫氨酸■半胱氨酸12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变:A.1%B.20%■.80%D.250%13.下列哪个句子最好的描述了两个序列全局比蘇□局部匕比对的不同:A.全局匕比对通常用于比寸DNA序列,而局部匕比对通常用于比寸蛋白质序列B.全局比寸允许间隙,而局部比对不允许C.全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列14.假设你有两条远源相关蛋白质序列。

生物信息学上机指南3

生物信息学上机指南3

《生物信息学》上机指南(三)实验三、分子系统发育分析 2学时教学要求:1、了解系统发育分析原理、步骤、方法。

2、掌握phylip、Mega等软件的下载与使用。

3、学习进化树结果分析。

重点掌握phylip、Mega的使用。

实验步骤:1.基于细胞色素c氨基酸序列的真核生物系统发育分析细胞色素c(cytochrome c)是一种含血红素的电子转运蛋白,它存在于所有真核生物的线粒体中,参加呼吸作用。

细胞色素c的氨基酸顺序分析资料已经用来核对各个物种之间的分类学关系,以及绘制进化树。

本实验利用Mega软件,采用邻位相接法,构建43种真核生物细胞色素c系统进化树。

类群中文名称拉丁学名蛋白质登录号哺乳类人Homo sapiens P99999黑猩猩Pan troglodytes P99998恒河猴Macaca mulatta P00002大袋鼠Macropus giganteus P00014家兔Oryctolagus cuniculus P00008小家鼠Mus musculus CAA25899 马Equus caballus P00004绵羊Ovis aries P62896牛Bos taurus P62894野猪Sus scrofa P62895狗Canis familiaris P00011南象海豹Mirounga leonina P00012长翼蝠Miniopterus schreibersii P00013河马Hippopotamus amphibius P00007鸟类鸸鹋Dromaius novaehollandiae P00018 鸵鸟Struthio camelus P00019 原鸡Gallus gallus P67881 火鸡Meleagris gallopavo P67882企鹅Aptenodytes patagonicus P00017 家鸽Columba livia P00021绿头鸭Anas platyrhynchosP00020爬行类拟鳄龟Chelydra serpentina P00022 两栖类牛蛙Rana catesbeiana P00024硬骨鱼类长鳍金枪鱼Thunnus alalunga P81459 太平洋鲣鱼Katsuwonus pelamis P00025 斑马鱼Danio rerio Q6IQM2软骨鱼类角鲨Squalus sucklii P00027 圆口类七鳃鳗Entosphenus tridentatus P00028 棘皮动物红海星Asterias rubens P00029 环节动物赤子爱胜蚓Eisenia fetida P00030昆虫沙漠蝗Schistocerca gregaria P00040 烟草天蛾Manduca sexta P00039 眉纹天蚕蛾Samia cynthia P00037 铜绿蝇Lucilia cuppina P00036植物小麦Triticum aestivum P00068水稻Oryza sativa BAA02159 向日葵Helianthus annuus P00070菠菜Spinacia oleracea P00073银杏Ginkgo biloba P00074芝麻Sesamum indicum P00054真菌毕赤酵母Pichia anomala P00042 白色念珠菌Candida albicans P53698 粗糙脉胞菌Neurospora crassa P000481.1.序列获取(1) 用记事本将蛋白质登录号粘进去,每个登录号占一行,存为Sequence_ID.txt。

生物信息上机作业

生物信息上机作业

生物信息学上机作业上机一生物信息数据库信息检索上机内容:1、了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。

2、了解北大生物信息学中心等几大中文生物信息学网站。

3、了解一些生物论坛中有关生物信息学的部分。

如:Biooo和Bioon。

4、利用NCBI的Entrenz查询系统和EBI的SRS检索文献和核酸或蛋白质序列。

(phyA)并对照所学复习各字段的含义。

5、将所得记录的ID或Accession记录下来备用。

作业:1、记录相关网站及论坛网址(或如何查询到该网址的方法)。

(1)NCBI :/(2)DDBJ :http://www.ddbj.nig.ac.jp/(3)EMBL :/(4)北大生物信息学中心 /chinese/(5)中科院计算所智能信息处理重点上机室生物信息学:/index.php(6)北大生物信息中心:/chinese/documents/bioinfor/overview/web1/1.html (7)生物谷生物信息学:/bioinfo.htm(8)中国生物论坛:/(9)中国生物谷论坛:/(10)生物谷:/2、找到编码拟南芥(arabidopsis)phyA(光敏色素A)基因的核酸序列编号。

并记录查找过程。

上机二核酸及蛋白质序列的比对一、上机内容利用检索出的蛋白质和核酸序列进行序列比对并进行分子进化树分析。

二、作业1、绘制分子进化树,并标明各个物种phyA蛋白之间的序列相似性。

2、根据你所学生物分类的知识,试解释该分子进化树的合理性。

3、找出一条可能的保守序列(多条蛋白共同的氨基酸序列)。

上机三核酸序列分析(一)一、上机内容1、使用DNAstar进行核酸基本信息分析2、ORF分析二、作业1、记录拟南芥phyA NM_100828序列的序列组成2、记录拟南芥phyA NM_100828序列最长的ORF的起止区间。

上机四核酸序列分析(二)一、上机内容1、PCR引物设计2、核酸序列的电子基因定位二、作业1、记录拟南芥phyA NM_100828序列最长的ORF的起止区间。

生物信息学上机实验4 用DNAMAN软件进行引物设计

生物信息学上机实验4 用DNAMAN软件进行引物设计

生物信息学上机实验四用DNAMAN软件设计PCR引物一、目的要求DNAMAN 是一种常用的核酸序列分析软件。

由于它功能强大,使用方便,已成为一种普遍使用的DNA序列分析工具。

通过本实验,使学生掌握PCR引物的设计方法。

二、实验准备DNAMAN的使用说明书(word文档)一份、DNAMAN软件5.2.2版本、实验分析所用的4个序列见下面。

三、实验内容1、将待分析4个序列装入4个Channel,熟悉Channel的使用方法2、显示“序列(2)”的反向互补序列、互补序列、反向序列3、分析“序列(3)”的限制性酶切位点4、设计一对引物扩增“序列(1)”中的微卫星重复区域四、作业将上述前5项操作所得结果保存到电脑桌面,发到xiaopingjia@(1)CCAGA TGAGCGTGCGTTCGTTCCACGTACGTGTGCTGTGTGAGACGACACA TCT GCACCTGCACGTCAGCACGTACGTGCACCCGGTA TGTGTGCGCGTGTACTTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTCTGAGA TGAGGCCGGA TTCAGGA GCTGCGAGCTCA TAGGCCACAGTCACAGAA TTGCAACGGTACTTCAGTTCAGTCA TCTCCTAGTCCTTGAGAG(2)GGAAAAAAGA TACGTA TGTACA TA TACGTGTACGTGTGTGTGTGTGTGTGTGTGT GTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGAAGCAAAGACA TTGA TA TTGTTGCTGGTGGCGAGGTTGA TGCGCACAGCTCACTCCCGCGCTGACTGACACG(3)GGTCAGCAGAAAGCA TGCCGTAGTCAAACGA TCGACCTAGCTAGTAGCAGTGTG TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCAAAAACCTAGACCTTAGCAGCCTAG(4)CCTGA TTTGGA TCCAACAAAA TGCA TTTGACCA TA TAGTGTGTGTGTGTGTGTGTG TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTCACAGTCACAGAA TTGCAACGGTACTTCAGTTCAGTCA TCTCCTAGTCCTTGAGAG(2)题 SEQ DNAMAN2: 172 bp;Composition 57 A; 62 C; 22 G; 31 T; 0 OTHERPercentage: 33.1% A; 36.0% C; 12.8% G; 18.0% T; 0.0%OTHERMolecular Weight (kDa): ssDNA: 52.42 dsDNA: 106.04COLOURSsequence = 1features = 0ORIGIN1 CGTGTCAGTC AGCGCGGGAG TGAGCTGTGC GCATCAACCT CGCCACCAGC AACAATATCA 61 ATGTCTTTGC TTCACACACA CACACACACA CACACACACA CACACACACA CACACACACA 121 CACACACACA CACACACACG TACACGTATA TGTACATACG TATCTTTTTT CCSEQ DNAMAN2: 172 bp;Composition 57 A; 62 C; 22 G; 31 T; 0 OTHERPercentage: 33.1% A; 36.0% C; 12.8% G; 18.0% T; 0.0%OTHERMolecular Weight (kDa): ssDNA: 52.42 dsDNA: 106.04COLOURSsequence = 1features = 0ORIGIN1 CCTTTTTTCT ATGCATACAT GTATATGCAC ATGCACACAC ACACACACAC ACACACACAC 61 ACACACACAC ACACACACAC ACACACACAC ACACACACAC TTCGTTTCTG TAACTATAAC 121 AACGACCACC GCTCCAACTA CGCGTGTCGA GTGAGGGCGC GACTGACTGT GCSEQ DNAMAN2: 172 bp;Composition 31 A; 22 C; 62 G; 57 T; 0 OTHERPercentage: 18.0% A; 12.8% C; 36.0% G; 33.1% T; 0.0%OTHERMolecular Weight (kDa): ssDNA: 53.79 dsDNA: 106.04COLOURSsequence = 1features = 0ORIGIN1 GCACAGTCAG TCGCGCCCTC ACTCGACACG CGTAGTTGGA GCGGTGGTCG TTGTTATAG T 61 TACAGAAACG AAGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT 121 GTGTGTGTGT GTGTGTGTGC ATGTGCATAT ACATGTATGC ATAGAAAAAA GG(3)题 Restriction analysis on DNAMAN3Methylation: dam-No dcm-NoScreened with 180 enzymes, 19 sites foundAluI AG/CT 1: 40BbvI GCAGCNNNNNNNN/ 1: 151BsaOI CGRY/CG 1: 32Bst71I GCAGCNNNNNNNN/ 1: 151DdeI C/TNAG 1: 135DpnI GA/TC 1: 31Fnu4HI GC/NGC 1: 140MaeI C/TAG 4: 37, 41, 129, 144MboI /GATC 1: 29NlaIII CATG/ 1: 17NspI RCATG/Y 1: 17PvuI CGAT/CG 1: 32Sau3AI /GATC 1: 29SphI GCATG/C 1: 17TaqI T/CGA 1: 32XorII CGAT/CG 1: 32List by Site Order17 NlaIII 31 DpnI 37 MaeI 140 Fnu4HI17 SphI 32 TaqI 40 AluI 144 MaeI17 NspI 32 PvuI 41 MaeI 151 BbvI29 Sau3AI 32 BsaOI 129 MaeI 151 Bst71I 29 MboI 32 XorII 135 DdeINon Cut EnzymesAatII Acc65I AccI AccII AccIII AclIAcyI AflII AflIII AgeI AhaIII Alw26IAlw44I AlwNI ApaBI ApaI ApaLI AscIAsp718I AsuI AsuII AvaI AvaII AvrIIBalI BamHI BanI BanII BbeI BbvIIBclI BglI BglII Bpu1102I BsaHI Bsc91IBsiI BsmI Bsp1286I Bsp1407I BspHI BspMIBspMII BssHII BstD102I BstEII BstNI BstXIBsu36I Cfr10I CfrI ClaI Csp45I CspICvnI DraI DraII DraIII DrdI EagIEam1105I Ecl136II Eco31I Eco47III Eco52I Eco56IEco57I Eco72I EcoHI EcoICRI EcoNI EcoRIEcoRII EcoRV EheI EspI FnuDII FokIFseI HaeII HaeIII HgaI HgiAI HhaIHindII HindIII HinfI HinP1I HpaI HpaIIHphI I-PpoI KpnI MaeII MaeIII MboIIMfeI Mlu113I MluI MnlI MscI MseIMspA1I MspI MstI MstII NaeI NarINcoI NdeI NheI NlaIV NotI NruINsiI NspBII PacI PflMI PinAI PleIPmaCI PmeI PpuMI PssI PstI PvuIIRleAI RsaI SacI SacII SalI SapISauI ScaI SciI ScrFI SduI SfaNISfiI SgrAI SmaI SnaBI SpeI SplISpoI SrfI SspI SstI SstII StuIStyI SunI SwaI ThaI Tth111I Tth111IIVspI XbaI XcmI XhoI XhoII XmaIXmaIII XmnIRestriction sites on DNAMAN3MaeIAluIMaeIXorIIBsaOIPvuITaqINspI DpnISphI MboINlaIII Sau3AI1 GGTCAGCAGAAAGCATGCCGTAGTCAAACGATCGACCTAGCTAGTAGCAGTGTGTGTGTGCCAGTCGTCTTTCGTACGGCATCAGTTTGCTAGCTGGATCGATCATCGTCACACACACAC61 TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTTACACACACACACACACACACACACACACACACACACACACACACACACACACACACAAAAMaeIMaeI DdeI Fnu4HI121 GCAAAAACCTAGACCTTAGCAGCCTAGCGTTTTTGGATCTGGAATCGTCGGATC(4)题Primer List29 CGTGTGCTGTGTGAGAC 51.9癈 and 224 GGAGATGACTGAACTGAAG 50.1癈30 GTGTGCTGTGTGAGACG 51.9癈 and 224 GGAGATGACTGAACTGAAG 50.1癈32 GTGCTGTGTGAGACGAC 50.7癈 and 224 GGAGATGACTGAACTGAAG 50.1癈。

《生物信息学》大作业参考模板-2016

《生物信息学》大作业参考模板-2016

《生物信息学》大作业 参考答案
芍药 ACS 基因的生物信息学分析
姓名: 班级: 学号: 2016 年 4 月 11 日
一、芍药 ACS 基因序列及其编码的蛋白的功能 乙烯是存在于植物体内的唯一的一种气态植物激素,调控植物花、果和叶片的衰老进程。乙烯的合成 主要在转录水平上受到 ACS(ACC synthase,ACC 合酶)和 ACC 氧化酶的调控,ACS 将 SAM(S-adenosyl
a r t i c l e i n f o
Article history: Received 17 November 2015 Accepted 23 November 2015 Available online 26 November 2015 Keywords: ACC synthase Ethylene biosynthesis Flower senescence Oncidium Gower Ramsey Gene cloning Expression analysis
Biochemical and Biophysical Research Communications 469 (2016) 20vailable at ScienceDirect
Biochemical and Biophysical Research Communications
图 1 芍药 ACS 基因的核苷酸序列及其编码的氨基酸序列 下载的论文“Molecular cloning and expression analysis of an 1-aminocyclopropane-1-carboxylate synthase gene from Oncidium Gower Ramsey” 为 2016 年发表于 Biochemical and Biophysical Research Communications 的最新英文文章(见下页) 。 (2 分)

生物信息学

生物信息学

多序列比对
• 多序列比对完成
• Dateexport alignment, 导出MEGE format和 Fasta format两份结果, 得到一个*.meg文件 和一个*.fas文件
进化树构建
• 关闭Alignment窗口,回到MEGA软件主窗口, File -> Open A File/Session,打开之前 保存的*.meg文件
• 选择Protein
MEGA 5软件使用
• 在新弹出的窗口中,选择Data->Open>Retrieve Sequences from File,然后导 入刚才保存的fasta文件
多序列比对
• Ctrl+A选择全部序列,Aligment->Align by ClustalW
多序列比对
• 可以修改各补偿值等参数,点OK
• 每个序列的Title仅保留蛋白/基因名称+种 属来源,如:CY1_YEAST
• 序列名称中不含有 ‘=’ 字符
• 氨基酸序列可以分成多行,但内部不要有 空格
MEGA 5软件使用
• 打开MEGA 5,拉开Align菜单,选择 Edit/Build Alignment
MEGA 5软件使用
• Creat a new Alignment
创建Fasta
可直接下载或复制粘贴创建Fasta文件: 以>为开头,后接序列名称,重启一行,输入序列
>CY1_BOVIN MAAAAATLRGAMVGPRG… >CY1_YEAST MFSNLSKRWAQRTLSKS… >CY1_HUMAN MAAAAASLRGVVLGPRG… >…
Fasta文件要求
问题

生物信息学数据库和软件的搜索上机实验

生物信息学数据库和软件的搜索上机实验

实验一生物信息学数据库和软件的搜索【实验目的】熟练掌握上网搜索生物信息学数据库和软件的方法及技能。

【实验内容】1、搜索生物信息学数据库或者软件数据库是生物信息学的主要内容,各种数据库几乎覆盖了生命科学的各个领域。

核酸序列数据库有GenBank, EMBL, DDB等,蛋白质序列数据库有SWISS-PROT, PIR, OWL, NRL3D, TrEMBL等,蛋白质片段数据库有PROSITE, BLOCKS, PRINTS等,三维结构数据库有PDB, NDB, BioMagResBank, CCSD等,与蛋白质结构有关的数据库还有SCOP, CATH, FSSP, 3D-ALI, DSSP等,与基因组有关的数据库还有ESTdb, OMIM, GDB, GSDB等,文献数据库有Medline, Uncover等。

另外一些公司还开发了商业数据库,如MDL等。

生物信息学数据库覆盖面广,分布分散且格式不统一, 因此一些生物计算中心将多个数据库整合在一起提供综合服务,如EBI的SRS(Sequence Retrieval System)包含了核酸序列库、蛋白质序列库,三维结构库等30多个数据库及CLUSTALW、PROSITESEARCH等强有力的搜索工具,用户可以进行多个数据库的多种查询。

2、搜索生物信息学软件生物信息学软件的主要功能有:分析和处理实验数据和公共数据,加快研究进度,缩短科研时间;提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验;寻找、预测新基因及预测其结构、功能;蛋白高级结构预测。

如:核酸序列分析软件BioEdit、DNAClub等;序列相似性搜索BLAST;多重系列比对软件Clustalx;系统进化树的构建软件Phylip、MEGA等;PCR 引物设计软件Primer premier6.0、oligo6.0等;蛋白质二级、三级结构预测及三维分子浏览工具等等。

【作业】1、搜索生物信息学数据库或者软件。

生物信息学课后题及答案

生物信息学课后题及答案

生物信息学课后习题及答案(由10级生技一、二班课代表整理)一、绪论1.你认为,什么是生物信息学?采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。

2.你认为生物信息学有什么用?对你的生活、研究有影响吗?(1)主要用于:在基因组分析方面:生物序列相似性比较及其数据库搜索、基因预测、基因组进化和分子进化、蛋白质结构预测等在医药方面:新药物设计、基因芯片疾病快速诊断、流行病学研究:SARS、人类基因组计划、基因组计划:基因芯片。

(2)指导研究和实验方案,减少操作性实验的量;验证实验结果;为实验结果提供更多的支持数据等材料。

3.人类基因组计划与生物信息学有什么关系?人类基因组计划的实施,促进了测序技术的迅猛发展,从而使实验数据和可利用信息急剧增加,信息的管理和分析成为基因组计划的一项重要的工作。

而这些数据信息的管理、分析、解释和使用促使了生物信息学的产生和迅速发展。

4简述人类基因组研究计划的历程。

通过国际合作,用15年时间(1990-2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其他生物进行类似研究。

1990,人类基因组计划正式启动。

1996,完成人类基因组计划的遗传作图,启动模式生物基因组计划。

1998完成人类基因组计划的物理作图,开始人类基因组的大规模测序。

Celera公司加入,与公共领域竞争启动水稻基因组计划。

1999,第五届国际公共领域人类基因组测序会议,加快测序速度。

2000,Celera公司宣布完成果蝇基因组测序,国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作。

2001,人类基因组“中国卷”的绘制工作宣告完成。

2003,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的.目标全部实现。

2004,人类基因组完成图公布。

2011春生物信息学上机考核题及要求

2011春生物信息学上机考核题及要求

考查题从生物信息数据库中检索近缘物种某一种基因或蛋白质近年来的相关记录,从中选取6条以上序列进行多序列比对,并在此基础上构建系统发育树。

要求:①用A4纸打印;页眉为2.5,页脚为2,左边距为2.5,右边距为2。

②第一页第一行左上角为“生物信息学课程考核”,左对齐,黑体5号字体;第三行为班级、姓名和学号,楷体小4号,右对齐。

③题目“×××基因(或蛋白质)序列系统发育分析”居中,宋体4号字体,加粗。

④简要描述步骤。

如序列获得、序列GenBank登录号、多序列比对、系统发育树构建等。

生物信息学课程考核自噬基因序列系统发育分析学院:生命科学与技术学院班级:08(2)姓名:杨彬学号:08243147 步骤:1、序列获得:①进入NCBI主页,点击“Entrez”按钮进入Entrez查询系统,点击“Nucleotide”按钮选择核酸序列数据库②点击“Limits”按钮,在检索栏中填入“Autophagy”,选择“Title word”,点击“Search”按钮2、序列GenBank登录号:HQ447598.1,HQ447703.1,HQ447996.1,NM121735.4,XM003341563.1,XM003341564.13、多序列比对:①将获取的六条基因序列以纯文本文档保存②点击Clustal x.exe图标进入界面③点击File下拉菜单下的Load sequences按钮,导入纯文本文档④点击Alignment下拉菜单下的Do complete Alignment按钮,弹出对话框,点击ALIGN 按钮,执行多序列比对,保存生成的结果到指定的路径目录下⑤点击Mega2图标进入界面⑥点击File下拉菜单下的Convert To MEGA Format按钮,导入经Clustal X软件比对好的文档,将其转换为MEGA格式文档并保存⑦关闭其他窗口,返回主界面;点击主界面上的Click To activate a data file按钮,打开转换好的MEGA格式文档,选择序列类型⑧点击页眉上的下拉菜单,执行相关分析内容保守位点:变异位点:简约信息位点:(在所有群体中>=2个变异的位点)在所有群体中只有1个群体中发生变异的位点:四种碱基及密码子第1、2、3位在各群体中的使用概率Transitions only:转换的百分率Transvertions only:颠换的百分率、4、系统发育树构建:5、系统发育树可靠性检验:。

《生物信息学》上机作业

《生物信息学》上机作业

《生物信息学》上机作业题目:对人血红蛋白(HBA1)编码基因序列的生物信息分析目录引言 .............................................................................................................................................. - 1 -1 正文......................................................................................................................................... - 2 -1.1 NCBI上对相关核苷酸序列的查找............................................................................ - 2 -1.2 BLAST运行及其结果.................................................................................................. - 2 -1.3 BLASTX运行及其结果................................................................................................ - 6 -2 其他软件的运行及其结果..................................................................................................... - 8 -2.1 Clustal W运行及其结果 ............................................................................................. - 9 -2.2 MEGA4.0运行及其结果............................................................................................. - 10 -结论 ............................................................................................................................................ - 10 -引言血红蛋白又称血色素,是红细胞的主要组成部分,能与氧结合,运输氧和二氧化碳。

生物信息学试题及答案

生物信息学试题及答案

生物信息学试题及答案一、单项选择题(每题2分,共20分)1. 生物信息学的主要研究对象是()。

A. 生物数据B. 生物实验C. 生物模型D. 生物技术答案:A2. 下列哪项不是生物信息学中的常用数据库()。

A. GenBankB. Swiss-ProtC. PubMedD. Google Scholar答案:D3. 蛋白质序列比对的主要目的是()。

A. 确定蛋白质的三维结构B. 预测蛋白质的功能C. 比较蛋白质的氨基酸序列D. 计算蛋白质的分子量答案:B4. 在生物信息学中,以下哪种算法不是用于序列比对的()。

A. BLASTB. FASTAC. Smith-WatermanD. Hidden Markov Model答案:D5. 下列哪种生物信息学工具主要用于基因表达分析()。

A. ClustalWB. Primer3C. R语言D. PDB答案:C6. 以下哪种技术不是用于蛋白质结构预测的()。

A. 同源建模B. 从头预测C. 序列比对D. 折叠识别答案:C7. 以下哪种生物信息学工具主要用于基因组注释()。

A. BLASTC. GATKD. Primer3答案:B8. 在生物信息学中,以下哪种方法不用于基因表达数据的聚类分析()。

A. K-meansB. Hierarchical clusteringC. Principal component analysisD. Multiple sequence alignment答案:D9. 下列哪种生物信息学工具主要用于蛋白质-蛋白质相互作用网络分析()。

A. STRINGB. BLASTD. Primer3答案:A10. 在生物信息学中,以下哪种数据库不包含蛋白质结构信息()。

A. PDBB. UniProtC. RCSBD. GenBank答案:D二、多项选择题(每题3分,共15分)11. 生物信息学中常用的序列比对工具包括()。

A. BLASTB. FASTAC. ClustalWD. Pfam答案:ABC12. 以下哪些是生物信息学中常用的基因表达分析软件()。

《生物信息学》练习题及答案

《生物信息学》练习题及答案

《生物信息学》练习题及答案1、在Genbank中查找以下6个植物蛋白序列:protein1:NP_974673.2;protein2:NP_187969.1;protein3: NP_190855.1;protein4:NP_565618.1;protein5: NP_200511.1;protein6:NP_191407.1(以FASTA格式)。

(1)用EBI上的ClustalW2工具对其进行多序列比对,分析各蛋白序列之间的同源性。

序列比对结果比对结果表明:protein1:NP_974673.2和protein4: NP_565618.1的亲缘关系最近。

(2)利用Phylip软件,选择距离法构建其进化树(要求写出具体的建树步骤)。

1.将蛋白序列保存为FASTA格式,存于txt文档;2.用Clustalx打开txt文本,保存为*.phy文件;3.用seqboot程序打开phy文件,输出结果文件*_seqboot4.用protdist程序打开*_seqboot文件,输出为*_protdist文件5.用neighbor程序打开*_protdist文件,输出为*_neighbor 文件6.用consense程序打开*_neighbor文件,输出为*_consense 文件7.用dratree程序打开*_consense文件得到进化树。

(注:由于seqboot软见无法正常运行,因此进化树无法显示)(3)任意选取其中的一个蛋白进行蛋白质一级序列分析、二级结构预测及三维结构的模拟。

选择protein3:NP_190855.1一级结构网址:/doc/479b86d06edb6f1afe001f6e.html /tools/protparam.htmlNumber of amino acids:456氨基酸数目Molecular weight:51154.5相对分子质量Theoretical pI:8.69理论pI值Amino acid composition氨基酸组成Ala(A)306.6%Arg(R)286.1%Asn(N)153.3%Asp(D)275.9%Cys(C)51.1%Gln(Q)183.9%Glu(E)286.1%Gly(G)378.1%His(H)163.5%Ile(I)163.5%Leu(L)429.2%Lys(K)327.0%Met(M)51.1%Phe(F)173.7%Pro(P)163.5%Ser(S)4610.1%Thr(T)214.6%Trp(W)81.8%Tyr(Y)194.2%Val(V)306.6%Pyl(O)00.0%Sec(U)00.0%(B)00.0%(Z)00.0%(X)00.0%正/负电荷残基数Total number of negatively charged residues(Asp+Glu): 55Total number of positively charged residues(Arg+Lys): 60Atomic composition:原子组成Carbon C2270Hydrogen H3531Nitrogen N645Oxygen O686Sulfur S10Formula:C2270H3531N645O686S10分子式Total number of atoms:7142总原子数Extinction coefficients:消光系数Extinction coefficients are in units of M-1cm-1,at280 nm measured in water.Ext.coefficient72560Abs0.1%(=1g/l)1.418,assuming all pairs of Cys residues form cystines Ext.coefficient72310Abs0.1%(=1g/l) 1.414,assuming all Cys residues are reducedEstimated half-life:半衰期The N-terminal of the sequence considered is M(Met). The estimated half-life is:30hours(mammalian reticulocytes,in vitro).>20hours(yeast,in vivo).>10hours(Escherichia coli,in vivo).Instability index:不稳定系数The instability index(II)is computed to be48.99This classifies the protein as unstable.Aliphatic index:75.26脂肪系数Grand average of hydropathicity(GRAVY):-0.554总平均亲水性蛋白质亲疏水性分析所用氨基酸标度信息Ala:1.800Arg:-4.500Asn:-3.500Asp:-3.500Cys:2.500 Gln:-3.500Glu:-3.500Gly:-0.400His:-3.200Ile:4.500 Leu:3.800Lys:-3.900Met:1.900Phe:2.800Pro:-1.600 Ser:-0.800Thr:-0.700Trp:-0.900Tyr:-1.300Val: 4.200:-3.500:-3.500:-0.490分析所用参数信息Weights for window positions1,..,9,using linear weight variation model:1234567891.001.001.001.001.001.001.001.001.00edge center edge跨膜结构预测结果(没有跨膜结构)信号肽分析:二级结构预测三级结构预测网站/doc/479b86d06edb6f1afe001f6e.html/~phyre2、在拟南芥基因组数据库中(/doc/479b86d06edb6f1afe001f6e.ht ml/)查找编号分别为At4G33050,At3G13600,At3G52870或At2G26190基因,针对所查找的基因进行初步的生物信息学分析(每人任选其中一个基因)。

生物信息技术第三次作业

生物信息技术第三次作业

UniProt 数据库检索及数据条目注释信息1. UniProt 蛋白质序列数据库1) 参阅Swiss-Prot 和TrEMBL 统计报表(Release Statistics ),列表说明这两个子库的总数据量,以及不同蛋白质证据(Protein Existence )的数据条目数。

2) 列表说明Swiss-Prot 和TrEMBL 中数据条目数列前10位的物种,包括中文名、英文名和拉丁文学名。

表1 Swiss-Prot 中数据条目数列前10位的物种Swiss-Prot 中文名 英文名 拉丁文学名1 智人 Human Homo sapiens2 小家鼠 MouseMus musculus3 拟南芥 Mouse-ear cress Arabidopsis thaliana4 大鼠 RatRattus norvegicus5 酿酒酵母 Baker's yeast Saccharomyces cerevisiae6 牛BovineBos taurus7 裂殖酵母 Fission yeast Schizosaccharomyces pombe 8 大肠杆菌 strain K12 Escherichia coli 9 枯草杆菌 strain 168 Bacillus subtilis10 盘基网柄菌Slime mold Dictyostelium discoideum表2 TrEMBL 中数据条目数列前10位的物种3) 列表说明以下已基本完成基因组测序的重要模式生物数据条目数总数N 、已审阅序列条目数Nr 、具有蛋白质证据的序列条目数Np 、在参考序列数据库RefSeq 中具有mRNA 序列的序列条目数Nm 、在蛋白质结构数据库PDB 中具有结构的序列条数据库子库 总数据量 Protein Existence 数据条目数 蛋白水平证据 转录水平证据 同源性推断预测 不确定 Swiss-Prot 542782 82087 62272 380832 15705 1886 TrEMBL5424746822013 93131313573938 39720204 0TrEMBL 中文名英文名 拉丁文学名1 人类免疫缺陷病毒 HIVHuman immunodeficiency virus 1 2 未培养细菌 Uncultured bacteriauncultured bacterium 3 智人 Human Homo sapiens4 小麦 Wheat Triticum aestivum5 粳稻Rice Oryza sativa subsp. japonica 6 丙型肝炎病毒 HCV Hepatitis C virus 7 乙型肝炎病毒 HBV Hepatitis B virus 8 大豆 SoybeanGlycine max9 宏基因组 mine drainage metagenomemine drainage metagenome10 二棱大麦Two-rowed barley Hordeum vulgare var. distichum目数Nb。

2021届成都市电子科技大学实验中学高三生物第三次联考试卷及答案

2021届成都市电子科技大学实验中学高三生物第三次联考试卷及答案

2021届成都市电子科技大学实验中学高三生物第三次联考试卷及答案一、选择题:本题共15小题,每小题2分,共30分。

每小题只有一个选项符合题目要求。

1. 下列对生物膜系统的叙述中正确的是()A. 各种生物膜在结构和化学组成上完全相同B. 线粒体、叶绿体、核糖体等都属于生物膜系统C. 生物膜把细胞质分为多个微小的结构,使多种化学反应同时进行,互不干扰D. 细胞膜是由磷脂分子、蛋白质分子和糖类等物质组成的双层膜结构2. 鸭喙有黑、黄、花三种颜色,受常染色体上A、a和B、b两对等位基因控制,其中A基因控制黑色素的合成,B基因可以使黑色素在整个喙部沉积。

科研人员利用花喙鸭与纯种黄喙鸭(不能合成黑色素)杂交,F1全为黑喙鸭,F1自由交配,F2中黑喙鸭:花喙鸭:黄喙鸭=9:3:4.下列分析错误的是()A.F1全为黑喙鸭说明亲本花喙鸭产生配子的基因型为AbB.F1产生配子时基因A与B随一条染色体传递到某个配子中C.F2中黑喙鸭基因型有4种,其中与F1基因型相同的概率为4/9D.花喙鸭可能因黑色素不能沉积在整个喙部,造成喙部黑黄相间3. 基因型为AaBb(两对基因独立遗传)的某植物个体自交,双显性子代中含隐性基因的个体占A.1/16B.8/9C.9/16D.1/24. 金鱼草的花色由一对等位基因控制,其中AA为红色,Aa为粉色,aa为白色。

红色与白色杂交得到F1代,F1代自交得到F2代,下列叙述错误的是()A.红花个体所占比例为1/4B.白花个体所占比例为1/4C.纯合子所占比例为1/4D.杂合子所占比例为1/25. 自然界中,任何一个生物种群都不是单独存在的,而是与其他种群通过复杂的种间关系紧密地联系在一起形成群落。

下列相关叙述错误的是()A.群落的物种组成是区别不同群落的重要特征B.各种群分别占据不同空间使群落形成一定的空间结构C.“野火烧不尽,春风吹又生”体现了群落的初生演替D.人类活动会影响群落演替的速度和方向6. 利用预防接种来预防疾病的原理是()A.预防接种能消灭体内的细菌B.预防接种能提高人体对各种疾病的抵抗力C.预防接种能加速机体代谢,增强抗病能力D.预防接种能使人在不发病的情况下产生抗体,获得免疫力7. 下列哪种物质通过小肠绒毛的细胞膜时,既不需要载体协助,又不需要消耗能量()A.葡萄糖B.甘油C.氨基酸D.钾离子8. 在自然生态系统中,物质是能量的载体。

2021届成都市电子科技大学实验中学高三生物三模试卷及参考答案

2021届成都市电子科技大学实验中学高三生物三模试卷及参考答案

2021届成都市电子科技大学实验中学高三生物三模试卷及参考答案一、选择题:本题共15小题,每小题2分,共30分。

每小题只有一个选项符合题目要求。

1.研究人员进行了多种植物激素对豌豆植株侧芽生长影响的实验,结果如图所示。

请判断下列说法错误的是()A.比较曲线a、b、c、d可知,顶芽对侧芽的生长有控制作用,其中起作用的主要激素是生长素B.细胞分裂素促进生长素对侧芽生长的抑制作用C.在保留顶芽的情况下,除了c所采用的措施,还可通过喷施赤霉素的化合物促进侧芽生长D.根据图中信息:推测侧芽生长速度不同的原因是侧芽内生长素与赤霉素、细胞分裂素浓度或比例的改变2.某亲本DNA分子双链均以白色表示,以灰色表示第一次复制出的DNA子链,以黑色表示第二次复制出的DNA子链,该亲本双链DNA分子连续复制两次后的产物是A. B.C. D.3.Glu是大鼠神经元的一种神经递质,科研人员分别用Glu受体抑制剂、ATP处理离体培养的大鼠神经元,在突触前神经元上给予一个适宜强度电刺激后,检测突触后膜电位变化,结果如图所示。

下列相关叙述正确的是()A.Glu受体可能为钠离子的通道蛋白B.ATP处理有利于突触兴奋的传递C.a组结果是因为突触前膜未兴奋导致D.c组是Glu受体抑制剂与ATP共同作用的结果4.图中X、Y、Z是细胞中的三种有机化合物,X为小分子物质,且是细胞生命活动所需的主要能源物质,Y、Z为构成细胞膜的成分。

下列有关说法正确的是()A.X被人的红细胞吸收过程中需要载体蛋白,不需要能量B.胆固醇可优先通过细胞膜进入细胞内,与Y有关C.细胞膜会被蛋白酶分解,说明组成细胞膜的物质中有ZD.细胞膜上的Z是可以运动的,而Y是静止的5.下列关于植物激素的叙述,正确的是A. 生长素是由色氨酸脱水缩合形成的蛋白质类物质B. 由赤霉菌产生且能引起水稻患恶苗病的赤霉素属于植物激素C. 顶端优势的产生与植物激素的极性运输有关D. 乙烯利是一种促进果实发育的植物生长调节剂6.细胞核是由核膜、染色质、核仁、核孔组成,下列有关叙述中,不正确的是()A.核膜是双层膜,把核内物质与细胞质分开B.染色质主要是由DNA和蛋白质组成C.核仁与某种RNA的合成以及核糖体的形成有关D.核孔是DNA进出的通道7.下列与遗传物质有关的叙述,正确的是()A.人受精卵中遗传物质一半来自父方,一半来自母方B.T2噬菌体的遗传物质中嘌呤总数不等于嘧啶总数C.赫尔希和蔡斯实验证明了DNA是主要的遗传物质D.DNA分子的双螺旋结构是DNA能准确复制的原因之一8.假基因是指基因组中与正常基因序列相似,但丧失正常功能的DNA序列。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2011092010017生物信息学第三次上机作业
小鼠基因序列:
AA TTTGCTGAGTACAACAGCGACCGTCATCAGTTTTTTGAGTTTCTGTACAACCAGGG AA TTGGAACCAAGTCA TCA TA TATA TACATGTCCTGGGCAGGGCATCTGGAAGCCCAGG GAGAGCTGCAGCA TGCCAGTGCT
.1. 这个基因在小鼠中是哪个基因?budding uninhibited by benzimidazoles 1 homolog (S. cerevisiae).
基因的标识符是什么?Locus tag:RP23-189N15.7
这个基因的在基因组上的定位是怎样的?Chromosome 2
这个基因标码的蛋白质是什么?protein_id="BAE25776.1"
2. 3.
4.
具有什么样的功能?
ATP选择性和非共价相互作用,5’-腺苷三磷酸的一个重要的辅酶和酶活性的调节。

反应的催化A TP +蛋白丝氨酸= ADP +蛋白磷酸丝氨酸,苏氨酸蛋白和A TP + ADP + =蛋白苏氨酸磷酸。

细胞亚定位在何处?
这个基因是一个酶吗,什么酶?
ATP选择性和非共价相互作用,5’-腺苷三磷酸的一个重要的辅酶和酶活性的调节。

具有什么样的功能结构域?
3.编码的蛋白质有3级结构的信息吗?如果有,给出在PDB中的标识符。

检索序列:
搜索蛋白质数据库。

相关文档
最新文档