生物信息学填空题
生物信息学习题
一:名词解释1.生物信息学2.NCBI3.PubMed4.生物芯片5.BLAST6.UniProt7.电子克隆8.EMBL二:填空题1.基因芯片可以分为2. 人类基因组全序列分析分两大步骤即制图和测序,并最终绘制出四张图谱:3. 分子系统发生分析主要分为三个步骤即4. 国际上最主要的三大核酸序列数据库分别是5. 蛋白质得分矩阵有7. 文献是掌握科研进展的最直接方式,目前由NCBI维护的大型文献资源是。
3. 用于核酸序列比对中常见的三种得分矩阵,分别为4. 根据生物芯片探针分子类型的不同,可以将生物芯片哪三种,5. 核酸序列分析所获得的信息主要有(举例说明四个)6. 限制性酶切分析是分子生物学实验中的日常工作之一,这方面最好的限制酶数据库是三:选择题1、如果试图确定一个新蛋白质序列属于哪一个蛋白质家族,或该序列可能包含何种结构域或功能位点,应使用:()A: PROSITE数据库 B: DDBJ数据库C: PIR数据库 D: PDB数据库2、构建序列进化树的一般步骤不包括:()A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树3、BLAST教案所程序中,哪个方法是不存在的?()A:BLASTP B:BLASTN C:BLASTX D:BLASTQ4. 以下常见的几个物种,哪一个目前还没有完成全基因组测序:()A: 茶树 B: 玉米 C: 水稻 D: 小鼠5、向核酸序列数据库(GenBank/EMBL/DDBJ)提交数据,应该使用下面哪个软件:()。
A: Blast B:Sequin C:SRS D:Swiss-Model6、在蛋白质序列数据库中比较查询手头未知的蛋白质序列,应使用Blast中哪个具体的算法:()。
A:BLASTX B:tBLASTN C:BLASTP D:BLASTN7、下列中属于一级蛋白质结构数据库的是:()A:EMBL B:DDBJ C:PDB D:SWISS-PROT8、下面不属于SWISS-PROT蛋白质数据库的注释范畴的是:()A: 与其它蛋白质的相似性 B: 蛋白质的二级结构C: 由于缺乏该蛋白质而引起的疾病 D: 核酸的功能描述9、下列属于蛋白质二级结构预测的软件程序是()A: BLASTX B:SOPMA C:DNAstar D:GO10. 如果做DNA结构分析,应该考虑用下面哪个数据库:()A:GenBank B: PIR C:NDB D:UniProt四:简单题1.简述Entrez的设计概念和使用方法?2. 简述生物大分子PDB存储的生物分子种类和数据结构特点?3.简述生物信息学的研究意义?4 简述蛋白质序列分析的基本内容以及常用的软件?5. 简述Swiss-Prot的数据结构?6、简述序列多重比对的意义?7、简述生物信息学的发展历史?五:论述题1.论述蛋白质相互作用研究的意义,传统的实验方法和计算预测方法的应用?2.论述后基因组时代生物信息学面临的挑战和研究策略?3.论述生物信息学的应用?4. 论述如何利用基因芯片数据做聚类分析。
生物信息学考试试题
生物信息学考试试题生物信息学考试试题:一、选择题1. 以下哪种是常见的生物信息学数据库?A. NCBIB. AmazonC. GoogleD. Instagram2. 下列哪一个不是生物信息学中常见的序列比对软件?A. BLASTB. ClustalWC. PhotoshopD. MUSCLE3. 生物信息学中常用的数据分析工具是?A. Microsoft ExcelB. SPSSC. RD. Adobe Photoshop4. BLAST是用来做什么的?A. 序列比对B. 图像处理C. 文本编辑D. 网页设计5. NCBI是什么机构的缩写?A. National Center for Biotechnology InformationB. National Center for Business IntelligenceC. New York City Bureau of InvestigationD. North Carolina Biological Institute二、填空题1. 生物信息学的研究对象是________。
2. 为了识别蛋白质功能和结构,可以使用________软件进行序列比对。
3. 研究生物信息学常用的数据库之一是________。
4. 生物信息学中的图形工具有助于可视化________。
5. 生物信息学可以帮助人们理解________的基本原理。
三、简答题1. 请解释生物信息学在生物学研究中的重要性。
2. 什么是序列比对?它在生物信息学中有什么作用?3. 请举例说明生物信息学数据库的用途。
四、综合题根据以下序列,请使用BLAST软件进行在线比对,并分析结果:序列1:ATGGCCATAG序列2:ATGCCGATAG序列3:ATGGCTATAG序列4:ATGGTCATAG请写出每个序列与其他序列的比对结果,并解释相似性及差异性。
以上为生物信息学考试试题,希望您认真作答,祝您考试顺利!。
《生物工程与Bioinformatics基础》2020-2021期末试题及答案
《生物工程与Bioinformatics基础》2020-2021期末试题及答案一、选择题 (每题2分,共20分)1. 以下哪项是生物信息学的核心内容?A. 分子生物学B. 计算机科学C. 统计学D. 生物统计学答案:B. 计算机科学2. 以下哪个数据库是存储基因组序列的数据库?A. PubMedB. GenBankC. PDBD. SwissDock答案:B. GenBank3. 生物信息学中的数据分析方法不包括以下哪项?A. 机器学习B. 聚类分析C. 数据挖掘D. 量子化学计算答案:D. 量子化学计算4. 在生物信息学中,以下哪个工具用于序列比对?A. BLASTB. Clustal OmegaC. FASTAD. R答案:A. BLAST5. 以下哪个是生物信息学中的常用编程语言?A. PythonB. RC. MATLABD. C++答案:A. PythonB. R二、填空题 (每题2分,共20分)1. 生物信息学是运用计算机科学与生物学的交叉领域,旨在开发和应用计算机技术来理解生物数据。
2. 基因组学是研究生物体的全部基因及其表达和调控的学科。
3. 蛋白质组学是研究生物体内所有蛋白质的组成、结构、功能和相互作用的科学。
4. BLAST是一种常用的生物信息学工具,用于核酸或蛋白质序列的相似性搜索。
5. bioinformatics是一个跨学科领域,它结合了计算机科学、信息工程、分子生物学和统计学,以理解生物数据。
三、简答题 (每题10分,共30分)1. 请简要解释生物信息学的应用领域。
生物信息学的应用领域包括基因组学、蛋白质组学、系统生物学、药物设计和疾病建模等。
它被广泛应用于医学、生物学、农业和环境科学等领域,以推动科学发现和技术创新。
2. 请简要介绍生物信息学中的序列比对工具。
生物信息学中的序列比对工具用于比较两个或多个生物序列(如DNA、RNA或蛋白质序列)之间的相似性。
常用的序列比对工具包括BLAST(Basic Local Alignment Search Tool)、FASTA (FAST Allignment Search Tool for Proteins and Nucleotides)和Clustal Omega等。
《生物信息学》试卷(A)
武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(A)及答案一、翻译下列名词并解释。
(每题5分,共25分)1. EST2. ORF3. BLAST4. ANN5. HGP二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有和二维核磁共振技术。
2、BLAST对序列格式的要求是常见的格式。
3、系统发育树由一系列和组成,其中每个代表一个分类单元,而代表物种之间的进化关系。
、、等。
6. 目前已经是最广泛使用的系统发育程序。
三、解释说明: 请按要求对下列GenBank文件作解释说明。
(每小题4分,共20分)1、LOCUS行中的第3项mRNA linear表示,这里是。
2、DEFINITION行在GenBank记录中用以3 ACCESSION 是,是从数据库中检索一个记录的主要。
4. FEATURES后面部分是,直接表达了记录的生物背景知识,5 CDS 30…533 表示。
四、问答。
(共35分)1简述国际上有哪几个著名的核酸序列数据库?(10分)2何谓序列比对的相似性和同源性,它们之间有何联系和区别(10分)3试述发现基因的一般过程(15分)《生物信息学》试卷(A)答案一、翻译下列名词并解释。
(每题5分,共25分)1. EST expressed sequence tag 表达序列标签2. ORF Open Reading Frame, 开放阅读框3. BLAST Basic Local Alignment Search T ool 局部相似性基本查询工具4. ANN Artificial Neural Network, 人工神经网络5. HGP Human genome project 人类基因组计划二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有X射线晶体衍射法和二维核磁共振技术。
2、BLAST对序列格式的要求是常见的FASTA格式。
3、系统发育树由一系列节点和分支组成,其中每个节点代表一个分类单元,而节点之间的连线代表物种之间的进化关系。
生物信息技术考试试题
生物信息技术考试试题一、选择题(每题 3 分,共 30 分)1、以下哪个不是生物信息学的主要研究内容?()A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是()A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中,常用的标准化方法是()A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息?()A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的?()A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中,预测蛋白质二级结构的方法不包括()A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中,BLAST 程序主要用于()A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛?()A JavaB PythonC C++D Fortran10、用于分析基因芯片数据的软件包是()A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题(每题 3 分,共 30 分)1、生物信息学中的三大核心数据库是_____、_____、_____。
2、基因序列的相似性搜索常用的工具是_____。
3、蛋白质的一级结构是指_____。
4、常见的基因注释数据库有_____、_____等。
5、系统发育树的构建基于_____的原理。
6、生物信息学中常用的数据格式有_____、_____等。
7、预测蛋白质三级结构的方法主要有_____、_____。
8、基因表达数据的差异分析常用的方法有_____、_____。
9、用于分析高通量测序数据的软件有_____、_____。
生物信息学试题
生物信息学考题(2012版)一、填空题(共10分,每空一分)1、美国政府于1990年10月启动耗资30亿美元的15年研究计划,预期到2005年完成人类基因组大约30亿个碱基的全序列测定,这就是被称为生命科学“登月计划”的人类基因组计划。
2、生物信息学的研究目标:以核酸、蛋白质等生物大分子数据库为主要对象,以数学、信息学、计算机科学为主要手段,以计算机硬件、软件和计算机网络为主要工具,对浩瀚如海的原始数据进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。
3、随着生物信息学的诞生及应用,今后生物学研究项目的起点将是理论的,一位科学家将从理论推测开始,然后转向试验去追踪或检验该假设。
4、生物信息学作为一门交叉学科,已经成为当今生命科学乃至整个自然科学的重大前沿领域之一,也将是21世纪自然科学的核心领域之一。
5、人类基因组计划、“曼哈顿原子计划”和“阿波罗登月计划”并称为20世纪的三大著名计划,中国在1999年承担了1%的研究任务,即对第3号染色体上3000万碱基对的测定。
6、人类基因组的主要任务是:人类基因组以及一些模式生物(细菌、酵母、线虫、果蝇等)基因组作图、测序和基因识别。
二、是非题(共10分,每小题1分)1、生物学就是实验科学,所有的研究结论从实验中来,于实验中得到验证。
(错)2、比较是科学研究中最常见的方法,在生物信息学研究中,比对是最常用和最经典的研究手段。
(对)3、两个蛋白质序列相似性超过30%就是同源蛋白。
(错)4、蛋白质序列相似性指一级序列中氨基酸残基相同。
(错)5、蛋白质序列相似性指氨基酸残基具有相似特性:侧链基团大小电荷性、疏水性等相同。
(对)6、核酸序列相似性指序列中相同碱基所占的比例。
(对)7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。
(错)8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。
(对)9、相似性是指一种很直接的数量关系,无需实验验证。
(完整word版)生物信息学填空题(个人整理)
1、BLAST教案所程序中,哪个方法是不存在的?(D)A:BLASTP B:BLASTN C:BLASTX D:BLASTQ2、下列哪个软件不是常用来观察蛋白质结构视图的?(D)A:AVS B:Chimera C:MICE D:HMM3、下列哪个不是点突变的类型?(A)A:染色体畸变 B:错义突变 C:无义突变 D:移码突变4、基因突变的效应不包括:(C)A:有利突变 B:中性突变 C:移码突变D:遗传多态现象5、人类基因组的结构特点不包括:(A)A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制6、世界上三大数据库不包括:(B)A:NCBI B:BLAST C:UCSC D:Ensembl7、常用序列比对方法错误的是:(C)A:编辑距离 B:点阵描图 C:局部比对 D:记分模式8、下列哪个不是蛋白质结构模型?(D)A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构9、下列哪个选项不是微阵列实验设计的内容?(A)A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则10、构建序列进化树的一般步骤不包括:(A)A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树11、下列中属于一级蛋白质结构数据库的是:(C)A. EMBLB. DDBJC. PDBD.SWISS-PROT12.蛋白质结构预测分为:(B)A.一级和三级结构预测 B. 二级和空间结构预测C. 三级和空间结构预测D. 二级和三级结构预测13.数据挖掘的四个步骤不包括下列哪个:(C)A. 数据选择B. 数据转换C. 数据记录D. 结果分析14.下列哪项不是生物学研究必备的工具:(A)A.数据分析B.数据统计C.因素分析D.多元回归分析15.Linux中rmdir 命令的功能是:(D)A.改变工作目录 B.删除工作目录C. 创建目录D.删除空目录16.BLAST教案所程序中,哪个方法是不存在的?(D)A:BLASTP B:BLASTN C:BLASTX D:BLASTQ17.下列哪个不是蛋白质结构模型?(D)A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构18.人类基因组的结构特点不包括:(A)A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制19、下列哪个选项不是微阵列实验设计的内容?(A)A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则20、构建序列进化树的一般步骤不包括:(A)A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树三、填空题1、数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。
生物信息学习题
1、基序(motif):通过多序列比对,将同源序列收集在一起,以得到保守区域。
这些保守区域称为基序(motifs)2、可读框(ORF):没有终止密码子(TGA,TAA或TAG)打断的阅读框。
3、剪切变体:从同一DNA,转录得到不同mRNA,并最终翻译成不同的蛋白质称为剪接变体4、表达标签序列(EST):是从cDNA文库中生成的一些很短的序列(300—500bp),它们代表在特定组织或发育阶段表达的基因,有时可代表特定的cDNA.5、系统发生学:通过比较五种的特征,认为特征相似的五种在遗传学上相近,研究五种之见的进化关系二、填空题(共20分,每空1分)l、列举至少2种权威的核酸序列数据库Genbank 、EMBL 等。
2、列举至少3种权威的蛋白质序列数据库PIR 、Swiss-prot 、MIPs 等。
3、核酸序列比对使用的得分矩阵类型有等价矩阵、BLAST 、和转换-颠换矩阵等。
4、蛋白质结构分类数据库主要有SCOP 和CAH 和PDBsum 等。
5、构建系统树的主要方法有UPGMA法、邻近归并法、Fitch-Margoliash法、最小进化法(ME)、最大似然法(ML)、等。
6、列举至少4中NCBI的服务功能Pubmed 、Entrez 、BLAST 和OMIM 等。
1、为什么说Swiss-Prot是重要的蛋白质序列数据库?SwissProt数据库中的所有序列条目都经过有经验的分子生物学家和蛋白质化学家通过计算机工具并查阅有关文献资料仔细核实。
SIB和EBI共有70多人的研究队伍,专门从事蛋白质序列数据的搜集、整理、分析、注释、发布,力图提供高质量的蛋白质序列和注释信息。
SwissProt数据库的每个条目都有详细的注释,包括结构域、功能位点、跨膜区域、二硫键位置、翻译后修饰、突变体等。
该数据库中还包括了与核酸序列数据库EMBL/GenBank/DDBJ、蛋白质结构数据库PDB以及Prosite、PRINTTS等十多个二次数据库的交叉引用代码。
《生物信息学》题集
《生物信息学》题集一、选择题(每题3分,共30分)1.生物信息学的主要研究对象是什么?A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术?A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中,进行多序列比对时常用的软件是什么?A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析?A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中,下列哪项不是常用的序列分析技术?A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用?A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测?A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中,下列哪项不是基因注释的内容?A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术?A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用?A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题(每题2分,共20分)1.生物信息学是一门交叉学科,它主要涉及______、计算机科学和数学等领域。
2.在生物信息学中,______技术常用于基因序列的相似性搜索。
3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。
4.在基因表达数据分析中,______是一种常用的数据标准化方法。
5.生物信息学中,______技术常用于蛋白质结构的预测和分析。
6.在生物信息学数据库中,GenBank主要存储的是______数据。
生物信息学考试试题
生物信息学考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种不是常见的生物信息学数据库?()A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中,以下哪个不是用于序列比对的算法?()A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括()A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法?()A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中,用于预测蛋白质功能的方法有()A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中,以下哪个不是测序技术?()A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括()A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言?()A PythonB JavaC C++D Visual Basic9、以下哪个不是生物信息学在医学领域的应用?()A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中,处理大规模数据常用的工具是()A ExcelB R 语言C SPSSD Word二、填空题(每题 2 分,共 20 分)1、生物信息学是一门融合了生物学、计算机科学和()的交叉学科。
2、常见的核酸序列格式有 FASTA 和()。
3、蛋白质的二级结构包括α螺旋、β折叠和()等。
4、基因芯片技术是一种()分析技术。
5、序列比对的目的是寻找两个或多个序列之间的()。
6、人类基因组计划的主要目标是测定人类基因组的()序列。
7、生物信息学中的隐马尔可夫模型主要用于()。
8、系统发生分析中,外群的作用是()。
9、蛋白质相互作用网络分析有助于理解()。
10、生物信息学数据库可以分为一级数据库和()数据库。
《生物信息学》试卷(B)
武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(B)及答案一、翻译下列名词并解释。
(每题5分,共25分)1. HGP2. SRS3. Markov Chain4. ANN5. CDS二、填空(每空2分,共20分)1、生物信息学主要研究的两种信息载体是和。
2、目前国际上主要的核酸数据库是由建立和维护的、由维护的,和日本遗传研究所建立和维护的。
每个机构负责收集来自不同地理分布的数据, 3 个数据库所有信息并向世界开放,3、在进行序列两两比对时,有两方面问题直接影响相似性分值:和。
三、解释说明:请按要求对下列GenBank文件作解释说明。
(每小题4分,共20分)1、LOCUS行中的第3项mRNA linear表示,这里是。
2、DEFINITION行在GenBank记录中用以3 ACCESSION 是,是从数据库中检索一个记录的主要。
4. FEATURES后面部分是,直接表达了记录的生物背景知识,5 CDS 30…533 表示。
四、问答。
(共35分)1、DNA测序有哪些方法?其基本原理是什么?(10分)2、简述蛋白质结构预测的基本思想和方法。
(10分)3、试述人类基因组计划与生物信息学的关系。
(15分)《生物信息学》试卷(B)答案一、翻译下列名词并解释。
(每题5分,共25分)1. HGP Human genome project人类基因组计划2. SRS Sequence Retrieval System 序列检索系统3. 马尔科夫链(Markov Chain),对于生物分子序列分析,马尔科夫链是一个很好的数学统计模型,因为马尔科夫链本身就是相继发生事件的序列,其特征是对于事件序列中的任何一个事件都有一个发生概率,而这个概率依赖于该事件之前的若干个事件。
4. ANN Artificial Neural Network, 人工神经网络5. CDS指的是编码序列,从起始密码子到终止密码子二、填空(每空2分,共20分)1、生物信息学主要研究的两种信息载体是DNA分子和蛋白质分子2、目前国际上主要的核酸数据库是由美国国立生物技术信息中心建立和维护的Genbank库、由欧洲生物信息学研究所(EBI)维护的EMBL-Bank,和日本遗传研究所建立和维护的日本DNA 数据仓库(DDBJ)。
生物信息学复习题已附答案
本卷的答案仅做参考,如有疑问欢迎提出。
后面的补充复习题要靠你们自己整理答案了。
生物信息学复习题一、填空题1、 识别基因主要有两个途径即2、 表达序列标签是从 mRNA 中生成的一些很短的序列( 300-500bp ),它们代表在特定组织或发育阶段表达的基因。
3、 序列比对的基本思想,是找出 检测基因 和 目标序列 的相似性,就是通过在序列中插入 空位的方法使所比较的序列长度达到一致。
比对的数学模型大体分 为两类,分别— 和局部比对 。
4、 2-DE 的基本原理是根据蛋白质 和 分子量 不同,进行两次电泳将之分 离。
第一向是 等电聚焦分离 ,第 —S D S-P AGE 分离 o5、 蛋白质组研究的三大关键核心技术是 质谱鉴定技术 、 计算机图像数据处理与蛋白质数据库二、 判断题1、 生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,是真核生物基因组的特点之一。
(对)2、 CDS 一定就是 ORF 。
(对)3、 两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源 ,就具有共同的祖先。
(错)4、 STS,是一段 200-300bp 的特定 DNA 序列,它的序列已知,并且在基因组中属于 单拷贝。
(对)5、 非编码 DNA 是“垃圾 DNA',不具有任何的分析价值,对于细胞没有多大的作用。
(错)6、 基因树和物种树同属于系统树,它们之间可以等同。
(错)7、 基因的编码序列在 DNA 分子上是被不编码的序列隔开而不连续排列的。
&对任意一个 DNA 序列,在不知道哪一个碱基代表 CDS 的起始时,可用 获得6个潜在的蛋白质序列。
(对)9、 一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。
(对)10、 外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的 外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以 不同。
山东师范大学生科院生物信息学题库
一、单选题(题数:105,共20.0 分)1<p>限制性片段长度多态性标记是()A、RFLPB、SNPC、SSRD、RAPD2从cDNA文库中获得的短序列是A、STSB、UTRC、CDSD、EST3orthologs的意思是()A、并系同源B、旁系同源C、直系同源D、横向同源4LCR的含义是A、编码区B、非编码区C、低复杂度区域D、开放阅读框5HTGS的含义是A、表达序列标签B、序列标签位点C、高通量基因组序列D、人工合成序列6()年美国国会批准正式启动人类基因组计划?()年发表草图?A、<p>1990 2004</p>B、<p>1990 2001</p>C、<p>1988 2004</p>D、<p> 1988 2001</p> 7在使用动态规划进行序列比对时,比对结果是唯一的吗?()A、唯一B、不唯一8Blast结果中HSP的含义是()A、空位B、期望值C、过滤D、高计分配对片段9RGP是()A、在线人类孟德尔遗传数据B、国家核酸数据库C、人类基因组计划D、水稻基因组计划10一种替换在自然界中越容易发生,则这种替换在打分矩阵中对应的数值( )A、越小B、越大11如:我要查找RaoY在Nature 或Science上发表的论文,哪一个检索语言是正确的?A、Rao Y[au] AND Nature OR Science[Journal]B、Rao Y[au] AND (Nature[Journal] OR Science[Journal])C、Rao Y[au] AND Nature[Journal] OR Science[Journal]D、Rao Y[au] AND (Nature OR Science)[Journal]12<p style=";margin-bottom:0"><span style="font-size:14px;font-family:OpenSans;color:#333333">序列比对算法哪年出现()年A、1977B、1988C、1970D、199113微卫星标记是()A、RFLPB、SNPC、SSRD、RAPD14CDS的含义是A、编码区B、非编码区C、低复杂度区域D、非调控区15下列哪一个是基于字母特征的系统发生分析的算法A、Kimura算法B、邻接法C、最大似然法D、PAUP16序列比对算法哪年出现()年A、1977B、1988C、1970D、199117PIR是()A、核酸数据库B、mRNA数据库C、启动子数据库D、蛋白质数据库18下列属于没有同义密码子编码的氨基酸是()A、精氨酸B、亮氨酸C、甲硫氨酸D、丝氨酸19用遗传学算法对蛋白质序列进行比对软件是()A、ProbConsB、SAGAC、ClustalWD、T-CoffeeE、MAFFT20DDBJ的含义是A、美国国家生物信息中心B、欧洲分子生物学实验室C、日本DNA数据库D、中国基因组研究中心21如:我要查找RaoY在Nature 或Science上发表的论文,哪一个检索语言是正确的?A、Rao Y[au] AND Nature OR Science[Journal]B、Rao Y[au] AND (Nature[Journal] OR Science[Journal])C、Rao Y[au] AND Nature[Journal] OR Science[Journal]D、Rao Y[au] AND (Nature OR Science)[Journal]22<p>Proteomics的含义是A、生物信息学B、基因组学C、蛋白质组学D、表观遗传学23目前应用于基因芯片表达数据统计分析的主要方法是()。
生物信息学复习要点
如对您有帮助,欢迎下载支持,谢谢!如对您有帮助,欢迎下载支持,谢谢!一、名词解释(每小题3分,共30分)分)1.1. 生物信息学生物信息学2.2. 数据库技术数据库技术3.3. 数据仓库数据仓库4.4.EST5.5. 概念性翻译概念性翻译6.6. 同源性同源性7.7. 单系类群单系类群8.8. 全局排列全局排列9.9. 基因作图基因作图1010.直系同源体簇.直系同源体簇.直系同源体簇二、填空题(每空1分,共10分)分)1. 生物信息学主要研究的两种信息载体是生物信息学主要研究的两种信息载体是和 。
2. 国际上的三大核苷酸序列数据库分别是 、和 。
3. 数据挖掘的三大技术支柱是数据挖掘的三大技术支柱是、 和 。
4. 相同类型核苷酸的替换称为 ,不同类型核苷酸的替换称为 。
三、单项选择题(每小题1分,共10分)分)1.1. 在对模式生物进行全基因组的测定中,作为真菌模式生物的是在对模式生物进行全基因组的测定中,作为真菌模式生物的是。
A 、大肠杆菌、大肠杆菌B 、青霉菌、青霉菌C 、酵母菌、酵母菌D 、线虫、线虫2.NCBI 成立于成立于。
A 、1988年B 、1989年C 、1990年D 、1992年3.根据数据库管理系统所支持的基本数据模型的不同,可以将数据库分为五类,其中第二代数据库是代数据库是。
A 、层次数据库、层次数据库B 、网状数据库、网状数据库C 、关系数据库、关系数据库D 、分布式数据库、分布式数据库4.在向GenBank 投送序列的工具中,投送序列的工具中, 是标准的序列投送工具。
是标准的序列投送工具。
A 、Cn3DB 、tb12asnC 、BankItD 、Sequin5. 目前最为常用和注释最全的蛋白质序列数据库是目前最为常用和注释最全的蛋白质序列数据库是。
A 、Identify B 、OWLC 、PIRD 、SWISS-PROT6. 下列选项中根据蛋白质三维折叠模式和进化关系划分的结构分类数据库是下列选项中根据蛋白质三维折叠模式和进化关系划分的结构分类数据库是。
生物信息学试题
生物信息学考题(2012版)一、填空题(共10分,每空一分)1、美国政府于1990年10月启动耗资30亿美元的15年研究计划,预期到2005年完成人类基因组大约30亿个碱基的全序列测定,这就是被称为生命科学“登月计划”的人类基因组计划。
2、生物信息学的研究目标:以核酸、蛋白质等生物大分子数据库为主要对象,以数学、信息学、计算机科学为主要手段,以计算机硬件、软件和计算机网络为主要工具,对浩瀚如海的原始数据进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。
3、随着生物信息学的诞生及应用,今后生物学研究项目的起点将是理论的,一位科学家将从理论推测开始,然后转向试验去追踪或检验该假设。
4、生物信息学作为一门交叉学科,已经成为当今生命科学乃至整个自然科学的重大前沿领域之一,也将是21世纪自然科学的核心领域之一。
5、人类基因组计划、“曼哈顿原子计划”和“阿波罗登月计划”并称为20世纪的三大著名计划,中国在1999年承担了1%的研究任务,即对第3号染色体上3000万碱基对的测定。
6、人类基因组的主要任务是:人类基因组以及一些模式生物(细菌、酵母、线虫、果蝇等)基因组作图、测序和基因识别。
二、是非题(共10分,每小题1分)1、生物学就是实验科学,所有的研究结论从实验中来,于实验中得到验证。
(错)2、比较是科学研究中最常见的方法,在生物信息学研究中,比对是最常用和最经典的研究手段。
(对)3、两个蛋白质序列相似性超过30%就是同源蛋白。
(错)4、蛋白质序列相似性指一级序列中氨基酸残基相同。
(错)5、蛋白质序列相似性指氨基酸残基具有相似特性:侧链基团大小电荷性、疏水性等相同。
(对)6、核酸序列相似性指序列中相同碱基所占的比例。
(对)7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。
(错)8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。
(对)9、相似性是指一种很直接的数量关系,无需实验验证。
生物信息学课程复习题(南医大)
⽣物信息学课程复习题(南医⼤)⽣物信息学课程习题第⼀章绪论⼀、填空1、在年,美国国会批准启动⼈类基因组计划,拟⽤年时间测定⼈类全部条染⾊体上共个碱基序列的测定。
2、是遗传信息的携带者。
3、蛋⽩质三维结构测定主要⽅法有和。
4、理想的抗⽣素靶标应为微⽣物细胞所必须,在病原体中⾼度,且在⼈体中或与⼈类基因有。
5、下图例举了⼀个计算机辅助药物设计的实例,从a图中我们得到了配体上R基团附近的受体上有和残基,具有性,因此可以将R基团设计为性基团,如图b中所⽰的基团,使得抑制活性⽐改造前提⾼了近5000倍。
⼆、名词HGP(human genome project),EST(expressed sequence tag), SNP(single nucleotide polymorphism),⽣物信息学(Bioinformatics),药物基因组学(Pharmacogenomics),intron,“Junk DNA”,⽐较基因组学,蛋⽩质组学,分⼦进化树(evolutionary tree),基因组,基因组药物三、简答1、简述⽣物信息学在药物研究开发领域的应⽤可体现在哪些⽅⾯?2、如何利⽤基因组信息寻找新的药物作⽤靶标?3、如何利⽤⼈类基因组信息实现个性化治疗,其基于的原理是什么?4、试叙述基因芯⽚⽤于疾病诊断的原理,并说明其优缺点。
5、最近甲型流感流⾏,请设计甲型流感的分⼦诊断⽅法,说明其原理。
第⼆、三章数据库⼀、单选题1、以下数据库不能⽤于检索核酸序列的是( B )A. GenBankB. PDBC. EMBLD.DDBJ2、蛋⽩质结构数据常保存为下⾯哪⼀种格式为后缀的⽂件()A. PDBB. txtC. SeqD. mdb3、下列格式属于FASTA格式的是()A. >seq1B.C. ATGCCATAD. > ATGCCATAATGCCATA ATGCCATA⼆、填空题1、阅读以下数据格式,写出以下标注的含义:LOCUS是,DEFINITION是,ACCESSION是,VERSION是,SOURCE是在论⽂中使⽤了NCBI数据库中的该序列,应标注该序列的编号,应填。
《生物信息学》练习题及答案
《生物信息学》练习题及答案1、在Genbank中查找以下6个植物蛋白序列:protein1:NP_974673.2;protein2:NP_187969.1;protein3: NP_190855.1;protein4:NP_565618.1;protein5: NP_200511.1;protein6:NP_191407.1(以FASTA格式)。
(1)用EBI上的ClustalW2工具对其进行多序列比对,分析各蛋白序列之间的同源性。
序列比对结果比对结果表明:protein1:NP_974673.2和protein4: NP_565618.1的亲缘关系最近。
(2)利用Phylip软件,选择距离法构建其进化树(要求写出具体的建树步骤)。
1.将蛋白序列保存为FASTA格式,存于txt文档;2.用Clustalx打开txt文本,保存为*.phy文件;3.用seqboot程序打开phy文件,输出结果文件*_seqboot4.用protdist程序打开*_seqboot文件,输出为*_protdist文件5.用neighbor程序打开*_protdist文件,输出为*_neighbor 文件6.用consense程序打开*_neighbor文件,输出为*_consense 文件7.用dratree程序打开*_consense文件得到进化树。
(注:由于seqboot软见无法正常运行,因此进化树无法显示)(3)任意选取其中的一个蛋白进行蛋白质一级序列分析、二级结构预测及三维结构的模拟。
选择protein3:NP_190855.1一级结构网址:/doc/479b86d06edb6f1afe001f6e.html /tools/protparam.htmlNumber of amino acids:456氨基酸数目Molecular weight:51154.5相对分子质量Theoretical pI:8.69理论pI值Amino acid composition氨基酸组成Ala(A)306.6%Arg(R)286.1%Asn(N)153.3%Asp(D)275.9%Cys(C)51.1%Gln(Q)183.9%Glu(E)286.1%Gly(G)378.1%His(H)163.5%Ile(I)163.5%Leu(L)429.2%Lys(K)327.0%Met(M)51.1%Phe(F)173.7%Pro(P)163.5%Ser(S)4610.1%Thr(T)214.6%Trp(W)81.8%Tyr(Y)194.2%Val(V)306.6%Pyl(O)00.0%Sec(U)00.0%(B)00.0%(Z)00.0%(X)00.0%正/负电荷残基数Total number of negatively charged residues(Asp+Glu): 55Total number of positively charged residues(Arg+Lys): 60Atomic composition:原子组成Carbon C2270Hydrogen H3531Nitrogen N645Oxygen O686Sulfur S10Formula:C2270H3531N645O686S10分子式Total number of atoms:7142总原子数Extinction coefficients:消光系数Extinction coefficients are in units of M-1cm-1,at280 nm measured in water.Ext.coefficient72560Abs0.1%(=1g/l)1.418,assuming all pairs of Cys residues form cystines Ext.coefficient72310Abs0.1%(=1g/l) 1.414,assuming all Cys residues are reducedEstimated half-life:半衰期The N-terminal of the sequence considered is M(Met). The estimated half-life is:30hours(mammalian reticulocytes,in vitro).>20hours(yeast,in vivo).>10hours(Escherichia coli,in vivo).Instability index:不稳定系数The instability index(II)is computed to be48.99This classifies the protein as unstable.Aliphatic index:75.26脂肪系数Grand average of hydropathicity(GRAVY):-0.554总平均亲水性蛋白质亲疏水性分析所用氨基酸标度信息Ala:1.800Arg:-4.500Asn:-3.500Asp:-3.500Cys:2.500 Gln:-3.500Glu:-3.500Gly:-0.400His:-3.200Ile:4.500 Leu:3.800Lys:-3.900Met:1.900Phe:2.800Pro:-1.600 Ser:-0.800Thr:-0.700Trp:-0.900Tyr:-1.300Val: 4.200:-3.500:-3.500:-0.490分析所用参数信息Weights for window positions1,..,9,using linear weight variation model:1234567891.001.001.001.001.001.001.001.001.00edge center edge跨膜结构预测结果(没有跨膜结构)信号肽分析:二级结构预测三级结构预测网站/doc/479b86d06edb6f1afe001f6e.html/~phyre2、在拟南芥基因组数据库中(/doc/479b86d06edb6f1afe001f6e.ht ml/)查找编号分别为At4G33050,At3G13600,At3G52870或At2G26190基因,针对所查找的基因进行初步的生物信息学分析(每人任选其中一个基因)。
小学生物生物信息学小测验
- A. GenBank
- B. RefSeq
- C. Ensembl
- D. UniProt
7.生物信息学中,将大量生物数据进行比较分析,以寻找生物学规律的方法称为____。
- A.数据挖掘
- B.统计分析
- C.机器学习
- D.比较基因组学
8.生物信息学中的生物标记物主要应用于____。
- A.疾病诊断
- B.疾病治疗
- C.疾病预防
- D.药物研发
9.生物信息学中的模式识别主要基于____。
- A.机器学习
- B.统计学
- C.计算机视觉
- D.人工智能
10.生物信息学中的数据标准化主要是为了解决____问题。
- A.数据质量
- B.数据重复
- C.数据异构
- D.数据缺失
##二、判断题(每题2分,共10分)
- B.疾病治疗
- C.疾病预防
- D.药物研发
8.生物信息学中的数据标准化主要是为了解决____问题。
- A.数据质量
- B.数据重复
- C.数据异构
- D.数据缺失
9.生物信息学中的同义词消歧主要是为了____。
- A.提高数据一致性
- B.提高数据多样性
- C.降低数据冗余
- D.增加数据噪声
小学生物生物信息学小测验
#小学生物信息学小测验
##一、选择题(每题2分,共20分)
1.生物信息学的定义是利用计算机技术对生物信息进行____。
- A.采集
- B.存储
- C.分析
- D.传播
2.下列哪个不属于生物信息学的研究领域?
生物信息学应用开发考核试卷
14. ABC
15. ABC
16. ABC
17. ABC
18. ABC
19. ABC
20. ABC
三、填空题
1.计算机科学
2.外显子
3. 24
4.芯片杂交
5.同源建模
6.相关性分析
7. RNA干扰
8.基因电路
9.荧光共振能量转移
10.数据整合
四、判断题
1. √
2. ×
3. ×
4. √
5. ×
1.生物信息学的研究领域包括以下哪些?()
A.基因组学
B.蛋白质组学
C.系统生物学
D.物理学
2.以下哪些是生物信息学中常用的数据库类型?()
A.序列数据库
B.结构数据库
C.功能数据库
D.文献数据库
3.以下哪些工具可以用于基因表达数据分析?()
A. R
B. Python
C. microarray analysis software
8.合成生物学中,【】是一种设计合成基因线路的方法,用于控制细胞行为。
9.【】是一种用于研究蛋白质在细胞中定位和迁移的成像技术。
10.在生物信息学中,【】是指利用计算机算法对生物学数据进行整合、解释和可视化的过程。
四、判断题(本题共10小题,每题1分,共10分,正确的请在答题括号中画√,错误的画×)
A. RNASeq
B. STAR
C. DARNED
D. TopHat
17.以下哪个生物信息学方法用于识别miRNA?()
A. miRBase
B. miRanda
C. TargetScan
D. All of the above
生物信息学填空题
填空题:1、蛋白质结构数据来源:①实验测定方法: X-ray 、 NMR 、Cryo-EM ②理论预测:同源建模、折叠识别、从头计算2、一级数据库:①一级核酸数据库:Genbank(美国)、EMBL (欧洲)、DDBJ(日本) NCBI②一级蛋白质序列数据库:SWISS-PORT 、PIR 、 NCBI③一级蛋白质结构数据库:PDB、 pfam 、 prosite大分子序列格式:fasta数据库基本文件格式:genbank蛋白质分类数据库:SCOP、CATH 、 FSSP二次数据库: GDB 、 Prosite、 TRANSFAC3、本地软件: Clustal-x 、 BioEdit 、 Mega、 sequencher、 spdbv、 Discovery-studio4、本课程主要理论依据:相似性、同源性、序列比对(3D结构比对)、数学方法、分子动力、分子力学5、基因鉴定三步骤:①找到序列中的非编码区(低复杂度区)②找基因③鉴定找到的基因6、主要的生物大分子数据:①DNA:基因组序列、基因序列、cDNA、EST、碱基修饰DNA 功能模块 /位点(如启动子、剪接体、表达调控位点等)②蛋白质:氨基酸组成、氨基酸序列、理化性质、原子坐标;二级结构、核体、结构域、功能域 /位点; 3D 结构常见的生物信息数据记录格式:FASTA 、GenBank、EMBL、 PDBFASTA 格式:序列文件的第一行由大于符号>大头的任意文字说明,主要为标记序列用。
从第二行开始是序列本身,标准核苷酸符号或氨基酸单字母符号,通过核苷酸符号大小写均可,而氨基酸一般用大写字母。
文件中和每一行都不要超过80 个字符(通常60 个字符)GenBank格式:序列名称、长度。
日期;序列说明、编号、版本号;物种来源、学名、分类60学位置;相关文献作者、题目、刊物、日期;序列特征表;碱基组成;序列本身(每行个)二 .填空题1.常用的三种序列格式: NBRF/PIR,FASTA 和 GDE2.初级序列数据库: GenBank, EMBL 和 DDBJ3.蛋白质序列数据库: SWISS-PROT 和 TrEMBLPIR (蛋白4. 提供蛋白质功能注释信息的数据库:KEGG (京都基因和基因组百科全书)和质信息资源) 5. 目前由 NCBI 维护的大型文献资源是PubMed6.数据库常用的数据检索工具: Entrez, SRS, DBGET7.常用的序列搜索方法: FASTA 和 BLAST8.高分值局部联配的 BLAST 参数是 HSPs(高分值片段对), E(期望值) 9. 多序列联配的常用软件: Clustal10.蛋白质结构域家族的数据库有:Pfam, SMART11. 系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法12. 系统发育树的构建方法:距离矩阵法,最大简约法和最大似然法13. 常用系统发育分析软件:PHYLIP 14.检测系统发育树可靠性的技术: bootstrapping 和 Jack-knifing 15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的16. 检测原核生物ORF 的程序: NCBI ORF finder17. 测试基因预测程序正确预测基因的能力的项目是GASP(基因预测评估项目)18.二级结构的三种状态:α螺旋,β折叠和β转角19.用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层和输出层20.通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER ( SWISS — MODEL 网站) 21. 蛋白质质谱数据搜索工具:SEQUEST 22. 分子途径最广泛数据库:KEGG23. 聚类分析方法,分为有监督学习方法,无监督学习方法24. 质谱的两个数据库搜索工具:1、 SEQEST 和 Lutkefi 三大数据库:核酸序列数据库、蛋白质序列数据库、结构数据库世界三大核酸序列数据库:GenBank、 EMBL-Bank 、 DDBJ蛋白质序列数据库:Swiss-Prot、 TrEMBL 、UniProt蛋白质结构数据库:PDB 、SCOP、CATH2、 GenBank 文献、提供了提供的服务:提供了EntrezBLAST 序列类似性检索。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
填空题:
1、蛋白质结构数据来源:①实验测定方法: X-ray 、 NMR 、Cryo-EM ②
理论预测:同源建模、折叠识别、从头计算
2、一级数据库:①一级核酸数据库:Genbank(美国)、EMBL (欧洲)、DDBJ(日本) NCBI
②一级蛋白质序列数据库:SWISS-PORT 、PIR 、 NCBI
③一级蛋白质结构数据库:PDB、 pfam 、 prosite
大分子序列格式:fasta
数据库基本文件格式:genbank
蛋白质分类数据库:SCOP、CATH 、 FSSP
二次数据库: GDB 、 Prosite、 TRANSFAC
3、本地软件: Clustal-x 、 BioEdit 、 Mega、 sequencher、 spdbv、 Discovery-studio
4、本课程主要理论依据:相似性、同源性、序列比对(3D结构比对)、数学方法、分子动力、分子力学
5、基因鉴定三步骤:①找到序列中的非编码区(低复杂度区)②找基因③鉴定找到的基因
6、主要的生物大分子数据:①DNA:基因组序列、基因序列、cDNA、EST、碱基修饰
DNA 功能模块 /位点(如启动子、剪接体、表达调控位点等)
②蛋白质:氨基酸组成、氨基酸序列、理化性质、原子坐标;二级结构、核体、结构域、功
能域 /位点; 3D 结构
常见的生物信息数据记录格式:FASTA 、GenBank、EMBL、 PDB
FASTA 格式:序列文件的第一行由大于符号>大头的任意文字说明,主要为标记序列用。
从第二行开始是序列本身,标准核苷酸符号或氨基酸单字母符号,通过核苷酸符号大小写均可,而氨基酸一般用大写字母。
文件中和每一行都不要超过80 个字符(通常60 个字符)GenBank格式:序列名称、长度。
日期;序列说明、编号、版本号;物种来源、学名、分类
60学位置;相关文献作者、题目、刊物、日期;序列特征表;碱基组成;序列本身(每行
个)
二 .填空题
1.常用的三种序列格式: NBRF/PIR,FASTA 和 GDE
2.初级序列数据库: GenBank, EMBL 和 DDBJ
3.蛋白质序列数据库: SWISS-PROT 和 TrEMBL
PIR (蛋白4. 提供蛋白质功能注释信息的数据库:KEGG (京都基因和基因组百科全书)和
质信息资源) 5. 目前由 NCBI 维护的大型文献资源是PubMed
6.数据库常用的数据检索工具: Entrez, SRS, DBGET
7.常用的序列搜索方法: FASTA 和 BLAST
8.高分值局部联配的 BLAST 参数是 HSPs(高分值片段对), E(期望值) 9. 多序列联配的常用软件: Clustal
10.蛋白质结构域家族的数据库有:Pfam, SMART
11. 系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法12. 系统发育树的构建方法:距离矩阵法,最大简约法和最大似然法13. 常用系统发育分析软件:PHYLIP 14.检测系统发育树可靠性的技术: bootstrapping 和 Jack-knifing 15. 原核生物和真核生物基因组
中的注释所涉及的问题是不同的
16. 检测原核生物ORF 的程序: NCBI ORF finder
17. 测试基因预测程序正确预测基因的能力的项目是GASP(基因预测评估项目)
18.二级结构的三种状态:α螺旋,β折叠和β转角
19.用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层
和输出层
20.通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER ( SWISS — MODEL 网
站) 21. 蛋白质质谱数据搜索工具:SEQUEST 22. 分子途径最广泛数据库:KEGG
23. 聚类分析方法,分为有监督学习方法,无监督学习方法24. 质谱的两个数据库搜索工具:
1、 SEQEST 和 Lutkefi 三大数据库:核酸序列数据库、蛋白质序列数据库、结构数据库
世界三大核酸序列数据库:GenBank、 EMBL-Bank 、 DDBJ
蛋白质序列数据库:Swiss-Prot、 TrEMBL 、UniProt蛋白质结构数据库:PDB 、SCOP、CATH
2、 GenBank 文献、提供了提供的服务:提供了Entrez
BLAST 序列类似性检索。
浏览器、提供PubMed服务、免费检索条生物医学
3、进化树的四种构建方法:距离法(包括除权配对法和邻位相连法)独立元素法)包括
简约法和似然法)
4、Blast 的方法及适用范围:核酸blastn(nucleotide BLAST) 、蛋白质 blastp(protein BLAST) blastx(translated BLAST) 、 tblastn(translated BLAST) 、 tblastx (translated BLAST)
、
1、 .生物信息学研究的重点是核酸与蛋白质两方面,包括了___序列 __、___结构 __、__功能___。
以 ___基因组 DNA 序列信息 __为出发点,破译___遗传语言 _,认识 _遗传信息 ___,辩
别_DNA 中的基因 __,掌握基因的 _调控信息 ____,对 __蛋白质空间结构 ___进行模拟和预测,发现 ___蛋白结构和功能 __,揭开生物生命的神秘面纱。
2、生物分子携带的三种信息分别为:___遗传信息,结构信息,进化信息。
3、人类基因组计划完成的 4 张图谱分别是___遗传图谱、物理图谱、序列图谱、转录图谱。
4、多维数据库分析又称数据挖掘是对数据进行_归纳推理和联想,寻找数据之间的关系,
从中发掘有价值的信息。
其基本步骤为:数据选择、数据比较_、数据挖掘和结果分析。
5、
域名由以机构性质命名的域和_以国家地区代码命名的域_两种基本类型组成。
6、双绞线的接法按照10/100 BASE T 的规定有T568A _和
T568B 两种固定的标准,其中T568B 的接线顺序为_橙白、橙、绿白、蓝_、蓝白、绿、
_棕白、棕。
遵循同级交叉异级平行的规律。
7、数据模型:( data model)数据库结构和语义的一抽象描述,由数据结构、数据操作和
完整性约束三部分组成。
8、 NCBI 有四个核心元素_文献出处,DNA 序列,蛋白质序列和三维结构。
另外两个
项目(分类和基因图),以及为序列服务的Entrez.Blast,Cn3D,V AST 软件其同组成一个有机
的数据库系统。
9、常用的分子生物学技术包括限制性酶消化
_、凝胶电脉、_印迹和杂交、DNA 测序、_克隆及聚合酶链式反应。
sh。