生物信息学概论复习题
生物信息学复习题
生物信息学复习题生物信息学是一门结合生物学、计算机科学、信息学和数学的交叉学科,它利用计算机技术来处理和分析生物数据。
以下是一些生物信息学复习题,供同学们参考:1. 生物信息学的定义和应用领域- 生物信息学是如何定义的?- 生物信息学在哪些领域有应用?2. 基因组学基础- 什么是基因组学?- 基因组测序的基本原理是什么?3. 序列比对- 序列比对的目的是什么?- 简述局部比对和全局比对的区别。
4. BLAST算法- BLAST算法的原理是什么?- 如何使用BLAST进行序列相似性搜索?5. 基因表达数据分析- 基因表达数据有哪些类型?- 描述基因表达数据的预处理步骤。
6. 蛋白质结构预测- 蛋白质结构预测的重要性是什么?- 简述几种常见的蛋白质结构预测方法。
7. 系统生物学和网络分析- 系统生物学研究的是什么?- 网络分析在系统生物学中的应用。
8. 生物信息学中的数据库- 列举几个常见的生物信息学数据库。
- 解释数据库在生物信息学研究中的作用。
9. 生物信息学中的编程语言- 哪些编程语言在生物信息学中常用?- 简述Python在生物信息学中的应用。
10. 伦理和隐私问题- 在生物信息学研究中可能遇到哪些伦理问题?- 如何保护生物信息数据的隐私?11. 案例研究- 描述一个生物信息学在医学研究中的应用案例。
- 分析该案例中使用的方法和技术。
12. 未来趋势- 预测生物信息学未来的发展趋势。
- 讨论生物信息学如何影响未来的科学研究和医疗保健。
通过这些问题的复习,同学们可以更全面地了解生物信息学的基础概念、关键技术和应用领域。
希望这些复习题能够帮助同学们更好地准备考试和理解生物信息学的重要性。
生物信息学考试试题
生物信息学考试试题生物信息学考试试题:一、选择题1. 以下哪种是常见的生物信息学数据库?A. NCBIB. AmazonC. GoogleD. Instagram2. 下列哪一个不是生物信息学中常见的序列比对软件?A. BLASTB. ClustalWC. PhotoshopD. MUSCLE3. 生物信息学中常用的数据分析工具是?A. Microsoft ExcelB. SPSSC. RD. Adobe Photoshop4. BLAST是用来做什么的?A. 序列比对B. 图像处理C. 文本编辑D. 网页设计5. NCBI是什么机构的缩写?A. National Center for Biotechnology InformationB. National Center for Business IntelligenceC. New York City Bureau of InvestigationD. North Carolina Biological Institute二、填空题1. 生物信息学的研究对象是________。
2. 为了识别蛋白质功能和结构,可以使用________软件进行序列比对。
3. 研究生物信息学常用的数据库之一是________。
4. 生物信息学中的图形工具有助于可视化________。
5. 生物信息学可以帮助人们理解________的基本原理。
三、简答题1. 请解释生物信息学在生物学研究中的重要性。
2. 什么是序列比对?它在生物信息学中有什么作用?3. 请举例说明生物信息学数据库的用途。
四、综合题根据以下序列,请使用BLAST软件进行在线比对,并分析结果:序列1:ATGGCCATAG序列2:ATGCCGATAG序列3:ATGGCTATAG序列4:ATGGTCATAG请写出每个序列与其他序列的比对结果,并解释相似性及差异性。
以上为生物信息学考试试题,希望您认真作答,祝您考试顺利!。
生物信息学复习题及答案(陶士珩)剖析
生物信息学复习题名词解释1. (同源):来源于共同祖先的序列相似的序列及同源序列。
序列相似序列并不一定是同源序列。
2(直系同源):指由于物种形成的特殊事件来自一个共同祖先的不同物种中的同源序列,它们具有相似的功能。
3(旁系(并系)同源):指同一个物种中具有共同祖先,通过基因复制产生的一组基因,这些基因在功能上的可能发生了改变。
基因复制事件是促进新基因进化的重要推动力。
4(异同源):通过横向转移,来源于共生或病毒侵染而产生的相似的序列,为异同源。
5 : ( ) a . 总是不计入总数中。
6.点矩阵():构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。
7. E值:得分大于等于某个分值S的不同的比对的数目在随机的数据库搜索中发生的可能性。
衡量序列之间相似性是否显著的期望值。
E值大小说明了可以找到与查询序列()相匹配的随机或无关序列的概率,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义,E值越接近零,越不可能找到其他匹配序列。
8值:得分为所要求的分值比对或更好的比对随机发生的概率。
它是将观测得到的比对得分S,与同样长度和组成的随机序列作为查询序列进行数据库搜索进行比较得到的(高分片段对)得分的期望分布联系起来计算的。
通常使用低于0.05来定义统计的显著性。
19.打分矩阵():在相似性检索中对序列两两比对的质量评估方法。
包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如)两类方法,是序列相似性分析的基础,其不同的选择将会出现不同的分析结果。
10.空位():在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。
11:美国国家生物技术信息学中心,属于美国国立医学图书馆的一部分,具有, 等工具,还具有文献数据库。
生物信息学试题
生物信息学试题一、选择题1. 生物信息学主要研究的是:A. 生物实验技术B. 生物统计学C. 生物大数据分析与计算D. 生物体内生化反应2. 在生物信息学中,常用的序列比对工具是:A. BLASTB. PCRC. ELISAD. SDS-PAGE3. 下列哪个数据库主要用于存储核酸序列信息?A. PDBB. GenBankC. UniProtD. KEGG4. 以下哪种方法不是用于蛋白质结构预测的?A. 同源建模B. 折叠识别C. 从头预测D. 实验测定5. 生物信息学中的“基因家族”是指:A. 一组具有相似序列和功能的基因B. 一组来自同一物种的基因C. 一组通过基因复制产生的基因D. 一组控制同一生物过程的基因二、简答题1. 简述生物信息学在现代医学研究中的应用。
2. 描述PCR技术的原理及其在分子生物学中的重要性。
3. 解释什么是基因编辑技术,以及CRISPR-Cas9系统是如何工作的。
三、论述题1. 论述生物信息学在新药发现和开发中的作用。
2. 分析比较RNA测序技术与DNA测序技术的优势和局限性。
四、计算题1. 给定一个DNA序列:“ATGCGATACCTGAGCTG”,计算其碱基组成的比例。
2. 假设某种生物的基因组大小为200 Mb,每个碱基对的平均质量为650 Da,计算该基因组的大致质量。
五、案例分析题1. 根据给定的某种疾病的基因组数据,分析可能的致病基因,并讨论其可能的生物机制。
2. 通过分析某物种的转录组数据,探讨其在特定环境下的适应性变化。
请注意,以上试题仅供参考,具体题目应根据实际教学大纲和考试要求进行调整。
在实际考试中,题目可能会包含更多的细节和复杂性,要求考生具备扎实的生物信息学知识和分析能力。
生物信息学考试复习
——古A.名词解释1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。
狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。
2. 基因芯片:将大量已知或未知序列的DNA 片段点在固相载体上,通过物理吸附达到固定化(cDNA 芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。
再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。
可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。
3. NCBI :National Center for Biotechnology Information. 是隶属于美国国立医学图书馆(NLM )的综合性数据库,提供生物信息学方面的研究和服务。
4. EMBL :European Molecular Biology Laboratory.EBI 为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。
5. 简并引物:PCR 引物的某一碱基位置有多种可能的多种引物的混合体。
6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。
7. BLAST :Basic Local Alignment Search Tool. 是通过比对(alignment) 在数据库中寻找和查询序列(query) 相似度很高的序列的工具。
8. ORF :Open Reading Frame. 由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6 个ORF 。
9. 启动子:是RNA 聚合酶识别、结合并开始转录所必须的一段DNA 序列。
原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35 区( Sextama box ) TTGACA ,-10 区 (Pribnow Box ) TATAAT ,以及+1 区。
生物信息学复习题
⽣物信息学复习题⼀、名词解释1.bioinformatics:⽣物信息学,指从事对基因组研究相关的⽣物信息的获取、加⼯、储存、分配、分析和解释的⼀门科学,是⼀门⽣物学,数学和计算机相互交叉融合⽽产⽣的新兴学科。
2.molecular bioinformatics:指综合应⽤信息科学、数学的理论、⽅法和技术,管理、分析和利⽤⽣物分⼦数据的科学。
3.GenBank:是美国全国卫⽣研究所维护的基因序列数据库,汇集并注释了所有公开的核酸序列,与⽇本的DNA数据库DDBJ以及欧洲分⼦实验室核酸序列数据库EMBL⼀起,都是国际核苷酸序列数据库合作的成员。
4.EMBL:EMBL实验室—欧洲分⼦⽣物学实验室,EMBL数据库—是⾮盈利性学术组织EMBL建⽴的综合性数据库,EMBL核酸数据库是欧洲最重要的核酸序列数据库,它定期地与美国的GenBank、⽇本的DDBJ数据库中的数据进⾏交换,并同步更新。
5.DDBJ:⽇本DNA数据库,主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是⽇本的研究机构,也接受其他国家呈递的序列。
6.BLAST:基本局部⽐对搜索⼯具的缩写,是⼀种序列类似性检索⼯具。
BLAST采⽤统计学⼏分系统,同时采⽤局部⽐对算法, BLAST程序能迅速与公开数据库进⾏相似性序列⽐较。
BLAST结果中的得分是对⼀种对相似性的统计说明。
7.BLASTn:是核酸序列到核酸库中的⼀种查询。
库中存在的每条已知序列都将同所查序列作⼀对⼀地核酸序列⽐对。
8.BLASTp:是蛋⽩序列到蛋⽩库中的⼀种查询。
库中存在的每条已知序列将逐⼀地同每条所查序列作⼀对⼀的序列⽐对。
9.Clustsl X:是CLUSTAL多重序列⽐对程序的Windows版本,是⽤来对核酸与蛋⽩序列进⾏多序列⽐较的程序,也可以对来⾃不同物种的功能或结构相似的序列进⾏⽐对和聚类,通过重建系统发⽣树判断亲缘关系,并对序列在⽣物进化过程中的保守性进⾏估计。
《生物信息学》题集
《生物信息学》题集一、选择题(每题3分,共30分)1.生物信息学的主要研究对象是什么?A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术?A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中,进行多序列比对时常用的软件是什么?A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析?A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中,下列哪项不是常用的序列分析技术?A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用?A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测?A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中,下列哪项不是基因注释的内容?A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术?A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用?A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题(每题2分,共20分)1.生物信息学是一门交叉学科,它主要涉及______、计算机科学和数学等领域。
2.在生物信息学中,______技术常用于基因序列的相似性搜索。
3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。
4.在基因表达数据分析中,______是一种常用的数据标准化方法。
5.生物信息学中,______技术常用于蛋白质结构的预测和分析。
6.在生物信息学数据库中,GenBank主要存储的是______数据。
生物信息学复习题已附答案
本卷的答案仅做参考,如有疑问欢迎提出。
后面的补充复习题要靠你们自己整理答案了。
生物信息学复习题一、填空题1、 识别基因主要有两个途径即2、 表达序列标签是从 mRNA 中生成的一些很短的序列( 300-500bp ),它们代表在特定组织或发育阶段表达的基因。
3、 序列比对的基本思想,是找出 检测基因 和 目标序列 的相似性,就是通过在序列中插入 空位的方法使所比较的序列长度达到一致。
比对的数学模型大体分 为两类,分别— 和局部比对 。
4、 2-DE 的基本原理是根据蛋白质 和 分子量 不同,进行两次电泳将之分 离。
第一向是 等电聚焦分离 ,第 —S D S-P AGE 分离 o5、 蛋白质组研究的三大关键核心技术是 质谱鉴定技术 、 计算机图像数据处理与蛋白质数据库二、 判断题1、 生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,是真核生物基因组的特点之一。
(对)2、 CDS 一定就是 ORF 。
(对)3、 两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源 ,就具有共同的祖先。
(错)4、 STS,是一段 200-300bp 的特定 DNA 序列,它的序列已知,并且在基因组中属于 单拷贝。
(对)5、 非编码 DNA 是“垃圾 DNA',不具有任何的分析价值,对于细胞没有多大的作用。
(错)6、 基因树和物种树同属于系统树,它们之间可以等同。
(错)7、 基因的编码序列在 DNA 分子上是被不编码的序列隔开而不连续排列的。
&对任意一个 DNA 序列,在不知道哪一个碱基代表 CDS 的起始时,可用 获得6个潜在的蛋白质序列。
(对)9、 一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。
(对)10、 外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的 外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以 不同。
生物信息学考试试题
生物信息学考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种不是常见的生物信息学数据库?()A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中,以下哪个不是用于序列比对的算法?()A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括()A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法?()A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中,用于预测蛋白质功能的方法有()A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中,以下哪个不是测序技术?()A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括()A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言?()A PythonB JavaC C++D Visual Basic9、以下哪个不是生物信息学在医学领域的应用?()A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中,处理大规模数据常用的工具是()A ExcelB R 语言C SPSSD Word二、填空题(每题 2 分,共 20 分)1、生物信息学是一门融合了生物学、计算机科学和()的交叉学科。
2、常见的核酸序列格式有 FASTA 和()。
3、蛋白质的二级结构包括α螺旋、β折叠和()等。
4、基因芯片技术是一种()分析技术。
5、序列比对的目的是寻找两个或多个序列之间的()。
6、人类基因组计划的主要目标是测定人类基因组的()序列。
7、生物信息学中的隐马尔可夫模型主要用于()。
8、系统发生分析中,外群的作用是()。
9、蛋白质相互作用网络分析有助于理解()。
10、生物信息学数据库可以分为一级数据库和()数据库。
生物信息学复习要点
一、名词解释(每小题3分,共30分)1.生物信息学2.数据库技术3.数据仓库4.EST5.概念性翻译6.同源性7.单系类群8.全局排列9.基因作图10.直系同源体簇二、填空题(每空1分,共10分)1.生物信息学主要研究的两种信息载体是和。
2.国际上的三大核苷酸序列数据库分别是、和。
3.数据挖掘的三大技术支柱是、和。
4.相同类型核苷酸的替换称为,不同类型核苷酸的替换称为。
三、单项选择题(每小题1分,共10分)1.在对模式生物进行全基因组的测定中,作为真菌模式生物的是。
A、大肠杆菌B、青霉菌C、酵母菌D、线虫2.NCBI成立于。
A、1988年B、1989年C、1990年D、1992年3.根据数据库管理系统所支持的基本数据模型的不同,可以将数据库分为五类,其中第二代数据库是。
A、层次数据库B、网状数据库C、关系数据库D、分布式数据库4.在向GenBank投送序列的工具中,是标准的序列投送工具。
A、Cn3DB、tb12asnC、BankItD、Sequin5. 目前最为常用和注释最全的蛋白质序列数据库是。
A、IdentifyB、OWLC、PIRD、SWISS-PROT6. 下列选项中根据蛋白质三维折叠模式和进化关系划分的结构分类数据库是。
A、PDBsumB、GDBC、SCOPD、CATH7. 构建系统发生树的方法很多,其中耗时最短的是。
A、进化简约法B、最大简约法C、最大似然法D、距离矩阵法8. 下列数据库选项中不属于蛋白质序列二次数据库的是。
A、PROSITEB、PRINTSC、BLOCKSD、PDB9. 在系统发生树的检验中,较为常用的方法是。
A、MP法B、重复取样法C、NJ法D、ML法10. 下列工具中用于发现开放阅读框的软件是。
A、Translate ToolB、ORF FinderC、Gene WiseD、E-PCR四、多项选择题(每小题2分,共20分)1.生物大分子携带的三种信息是。
A、遗传信息B、功能信息C、调控信息D、进化信息2. 为实现3个抽象级别间的数据转换,DBMS提供的两层映射是。
(完整版)生物信息学复习题及答案(陶士珩)
生物信息学复习题一、名词解释生物信息学, 二级数据库, FASTA序列格式, genbank序列格式, Entrez,BLAST,查询序列(query),打分矩阵(scoring matrix),空位(gap),空位罚分,E 值, 低复杂度区域,点矩阵(dot matrix),多序列比对,分子钟,系统发育(phylogeny),进化树的二歧分叉结构,直系同源,旁系同源,外类群,有根树,除权配对算法(UPGMA),邻接法构树,最大简约法构树,最大似然法构树,一致树(consensus tree),bootstrap,开放阅读框(ORF),密码子偏性(codon bias),基因预测的从头分析法,结构域(domain),超家族,模体(motif),序列表谱(profile),PAM矩阵,BLOSUM,PSI-BLAST,RefSeq,PDB数据库,GenPept,折叠子,TrEMBL,MMDB,SCOP,PROSITE,Gene Ontology Consortium,表谱(profile)。
二、问答题1)生物信息学与计算生物学有什么区别与联系?2)试述生物信息学研究的基本方法。
3)试述生物学与生物信息学的相互关系。
4)美国国家生物技术信息中心(NCBI)的主要工作是什么?请列举3个以上NCBI维护的数据库。
5)序列的相似性与同源性有什么区别与联系?6)BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途什么?7)简述BLAST搜索的算法。
8)什么是物种的标记序列?9)什么是多序列比对过程的三个步骤?10)简述构建进化树的步骤。
11)简述除权配对法(UPGMA)的算法思想。
12)简述邻接法(NJ)的算法思想。
13)简述最大简约法(MP)的算法思想。
14)简述最大似然法(ML)的算法思想。
15)UPGMA构树法不精确的原因是什么?16)在MEGA2软件中,提供了多种碱基替换距离模型,试列举其中2种,解释其含义。
生物信息学复习题
生物信息学复习题生物信息学复习题生物信息学是一门研究生物学数据的收集、存储、管理和分析的学科。
它利用计算机科学和统计学的方法来解决生物学中的问题。
在这篇文章中,我将提供一些生物信息学的复习题,帮助大家巩固对这门学科的理解。
1. 什么是基因组学?基因组学是研究生物体基因组的学科。
它涉及到对基因组的序列、结构和功能的研究。
基因组学的发展使得我们能够更好地理解基因组的组成和功能,从而有助于解决生物学中的一些重要问题。
2. 什么是DNA序列?DNA序列是指DNA分子中碱基的顺序。
DNA序列的研究可以帮助我们了解基因组的组成和功能。
通过对DNA序列的分析,我们可以识别基因、预测蛋白质编码区域,并研究基因组的演化等。
3. 什么是蛋白质序列?蛋白质序列是指蛋白质分子中氨基酸的顺序。
蛋白质序列的研究可以帮助我们了解蛋白质的结构和功能。
通过对蛋白质序列的分析,我们可以预测蛋白质的结构、功能和相互作用等。
4. 什么是序列比对?序列比对是指将两个或多个序列进行比较,找出它们之间的相似性和差异性。
序列比对可以通过比较序列中的碱基或氨基酸的顺序来进行。
序列比对的结果可以帮助我们了解序列的进化关系,预测序列的功能以及发现新的序列。
5. 什么是基因表达谱?基因表达谱是指在特定条件下,基因在细胞或组织中的表达水平。
基因表达谱的研究可以帮助我们了解基因的功能以及基因在生物体中的调控机制。
通过对基因表达谱的分析,我们可以发现与特定生理过程或疾病相关的基因。
6. 什么是蛋白质结构预测?蛋白质结构预测是指根据蛋白质的氨基酸序列,预测蛋白质的三维结构。
蛋白质结构预测的研究可以帮助我们了解蛋白质的功能和相互作用。
通过蛋白质结构预测,我们可以预测蛋白质的功能、鉴定药物靶点以及设计新的蛋白质。
7. 什么是基因组注释?基因组注释是指对基因组中的基因和非编码区域进行功能和结构的描述。
基因组注释的研究可以帮助我们了解基因组的组成和功能。
通过基因组注释,我们可以识别基因、预测蛋白质编码区域,并研究基因组的演化等。
(完整版)生物信息学复习题及答案(陶士珩)
生物信息学复习题一、名词解释生物信息学, 二级数据库, FASTA序列格式, genbank序列格式, Entrez,BLAST,查询序列(query),打分矩阵(scoring matrix),空位(gap),空位罚分,E 值, 低复杂度区域,点矩阵(dot matrix),多序列比对,分子钟,系统发育(phylogeny),进化树的二歧分叉结构,直系同源,旁系同源,外类群,有根树,除权配对算法(UPGMA),邻接法构树,最大简约法构树,最大似然法构树,一致树(consensus tree),bootstrap,开放阅读框(ORF),密码子偏性(codon bias),基因预测的从头分析法,结构域(domain),超家族,模体(motif),序列表谱(profile),PAM矩阵,BLOSUM,PSI-BLAST,RefSeq,PDB数据库,GenPept,折叠子,TrEMBL,MMDB,SCOP,PROSITE,Gene Ontology Consortium,表谱(profile)。
二、问答题1)生物信息学与计算生物学有什么区别与联系?2)试述生物信息学研究的基本方法。
3)试述生物学与生物信息学的相互关系。
4)美国国家生物技术信息中心(NCBI)的主要工作是什么?请列举3个以上NCBI维护的数据库。
5)序列的相似性与同源性有什么区别与联系?6)BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途什么?7)简述BLAST搜索的算法。
8)什么是物种的标记序列?9)什么是多序列比对过程的三个步骤?10)简述构建进化树的步骤。
11)简述除权配对法(UPGMA)的算法思想。
12)简述邻接法(NJ)的算法思想。
13)简述最大简约法(MP)的算法思想。
14)简述最大似然法(ML)的算法思想。
15)UPGMA构树法不精确的原因是什么?16)在MEGA2软件中,提供了多种碱基替换距离模型,试列举其中2种,解释其含义。
生物信息学题库--精校+整理
生物信息学题库一、名词解释1.生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础, 应用计算机技术, 研究生物学数据的科学。
2.相似性(similarity):相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA 碱基或氨基酸残基顺序所占比例的高低。
3.同源性(homology):生物进化过程中源于同一祖先的分支之间的关系。
4.BLAST(Basic Local Alignment Search Tool):基本局部比对搜索工具, 用于相似性搜索的工具, 对需要进行检索的序列与数据库中的每个序列做相似性比较。
5.HMM隐马尔可夫模型:是蛋白质结构域家族序列的一种严格的统计模型, 包括序列的匹配, 插入和缺失状态, 并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。
6.一级数据库:一级数据库中的数据直接来源于实验获得的原始数据, 只经过简单的归类整理和注释(投稿文章首先要将核苷酸序列或蛋白质序列提交到相应的数据库中)7、二级数据库:对原始生物分子数据进行整理、分类的结果, 是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。
8、GenBank: 是具有目录和生物学注释的核酸序列综合公共数据库, 由NCBI构建和维护。
9、EMBL: EMBL 实验室: 欧洲分子生物学实验室。
EMBL 数据库: 是非盈利性学术组织 EMBL 建立的综合性数据库, EMBL 核酸数据库是欧洲最重要的核酸序列数据库, 它定期地与美国的GenBank、日本的 DDBJ 数据库中的数据进行交换, 并同步更新。
10、DDBJ: 日本核酸序列数据库, 是亚洲唯一的核酸序列数据库。
11.Entrez:是由 NCBI 主持的一个数据库检索系统, 它包括核酸, 蛋白以及 Medline 文摘数据库, 在这三个数据库中建立了非常完善的联系。
12.SRS(sequence retrieval system):序列查询系统, 是 EBI 提供的多数据库查询工具之一。
生物信息学期末复习题
9)预测基因的一般步骤是什么?答案:⑴获取DNA目标序列⑵查找ORF并将目标序列翻译成蛋白质序列,利用相应工具查找ORF并将DNA序列翻译成蛋白质序列⑶在数据库中进行序列搜索,利用BLAST进行ORF核苷酸序列和ORF翻译的蛋白质序列搜索⑷进行目标序列与搜索得到的相似序列的全局对比⑸查找基因家族进行多序列比对,获得比对区段的基因家族信息⑹查找目标序列中的特定模序,分别在Prosite、BLOCK、Motif数据库中进行profile、模块(block)、模序(motif)检索⑺预测目标序列蛋白质结构,利用PredictProtein(EMBL)、NNPREDICT等预测目标序列的蛋白质二级结构。
15)在基因组序列分析方面,科学家关注哪些信息?答案:就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。其余97%是非编码序列。对于非编码序列,人们了解得比较少,尚不清楚其含义或功能。然而,非编码区域对于生命活动具有重要的意义。这部分序列主要包括内含子、简单重复序列、移动元件(mobile element)及其遗留物、伪基因(pseudo gene)等。
3)简要介绍FASTA序列格式答案:FASTA格式,又叫Pearson格式,是最简单的,使用最多的格式。它的基本形式分为三个部分:⑴第一行:大于号(﹥)表示一个新的序列文件的开始,为标记符。后面可以加上文字说明,gi号,GenBank检索号,LOCUS名称等信息。⑵第二行:序列本身,为DNA的标准符号,通常大小写均可。⑶结束:无特殊标志,但建议多留一个空行,以便将序列和其他内容区分开。
16)为什么要进行序列片段组装?在进行序列片段组装时会遇到哪些问题?答案:大规模基因组测序得到待测序列的一系列序列片段,这些序列片段覆盖待测序列,序列片段之间也存在着相互覆盖或者重叠。遇到的问题:碱基标识错误;不知道片段的方向;存在重复区域;缺少覆盖。
生物信息学课程复习题(南医大)
生物信息学课程习题第一章绪论一、填空1、在年,美国国会批准启动人类基因组计划,拟用年时间测定人类全部条染色体上共个碱基序列的测定。
2、是遗传信息的携带者。
3、蛋白质三维结构测定主要方法有和。
4、理想的抗生素靶标应为微生物细胞所必须,在病原体中高度,且在人体中或与人类基因有。
5、下图例举了一个计算机辅助药物设计的实例,从a图中我们得到了配体上R基团附近的受体上有和残基,具有性,因此可以将R基团设计为性基团,如图b中所示的基团,使得抑制活性比改造前提高了近5000倍。
二、名词HGP(human genome project),EST(expressed sequence tag), SNP(single nucleotide polymorphism),生物信息学(Bioinformatics),药物基因组学(Pharmacogenomics),intron,“Junk DNA”,比较基因组学,蛋白质组学,分子进化树(evolutionary tree),基因组,基因组药物三、简答1、简述生物信息学在药物研究开发领域的应用可体现在哪些方面?2、如何利用基因组信息寻找新的药物作用靶标?3、如何利用人类基因组信息实现个性化治疗,其基于的原理是什么?4、试叙述基因芯片用于疾病诊断的原理,并说明其优缺点。
5、最近甲型流感流行,请设计甲型流感的分子诊断方法,说明其原理。
第二、三章数据库一、单选题1、以下数据库不能用于检索核酸序列的是( B )A. GenBankB. PDBC. EMBLD.DDBJ2、蛋白质结构数据常保存为下面哪一种格式为后缀的文件()A. PDBB. txtC. SeqD. mdb3、下列格式属于FASTA格式的是()A. >seq1B. <seq1C. ATGCCATAD. > ATGCCATAATGCCATA ATGCCATA二、填空题1、阅读以下数据格式,写出以下标注的含义:LOCUS是,DEFINITION是,ACCESSION是,VERSION是,SOURCE是在论文中使用了NCBI数据库中的该序列,应标注该序列的编号,应填。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学概论复习题
一、名词解释:
1.合成生物学
2.蛋白质组学
3.相似性,同一性,同源性
4.直系同源基因,旁系同源基因
5.序列比对
6.生物信息学
7.多序列比对
8.打分矩阵
9.蛋白质同源建模
10.分子钟
11.虚拟细胞
12.蛋白质结构比对
13.EST
14.contig
15.unigene
16.Entrez
17.一级数据库
18.二级数据库
19.系统发育
20.BLAST
21.外类群
22.有根树
23.系统生物学
24.比较蛋白质组学
二、简述题:
1.常用的序列比对软件有哪些?
2.序列比对有哪些用途?
3.蛋白质结构比对?
4.系统生物学与分子生物学的差异和联系?
5.分子进化的中性学说?
6.GO数据库的内容及用途?
7.KEGG数据库的内容及用途?
8.蛋白质组与基因组的差别?
9.蛋白质组的研究内容?
10.列举分离鉴定蛋白质技术有哪些?
11.基因组外显子的组成特征有哪些?
12.NCBI Blast程序有哪些子程序?有何区别?
13.蛋白质数据库有哪些?各自特点是什么?
14.列举可以通过NCBI进行的生物信息学分析。
15.设计引物要遵循哪些原则?
16.知道某蛋白的氨基酸序列后,如何进行各级结构的生物信息学分析?
17.系统发育树的构建步骤是什么?
18.蛋白质有哪些结构层次,如何定义?
19.蛋白质组的特点?
20.双向电泳及其工作原理?
21.构建系统树的主要方法?
22.主要的生物信息数据库有哪些?
三、论述题
1.构建进化树有几种方法?如何选择?
2.第二代测序技术与第一代测序技术相比有什么异同?优势是什么?
3.什么EST序列?得到EST数据后,如何进行生物信息学分析?。