中科院生物信息学题目整理

合集下载

生物信息学复习题

生物信息学复习题

生物信息学复习题生物信息学是一门结合生物学、计算机科学、信息学和数学的交叉学科,它利用计算机技术来处理和分析生物数据。

以下是一些生物信息学复习题,供同学们参考:1. 生物信息学的定义和应用领域- 生物信息学是如何定义的?- 生物信息学在哪些领域有应用?2. 基因组学基础- 什么是基因组学?- 基因组测序的基本原理是什么?3. 序列比对- 序列比对的目的是什么?- 简述局部比对和全局比对的区别。

4. BLAST算法- BLAST算法的原理是什么?- 如何使用BLAST进行序列相似性搜索?5. 基因表达数据分析- 基因表达数据有哪些类型?- 描述基因表达数据的预处理步骤。

6. 蛋白质结构预测- 蛋白质结构预测的重要性是什么?- 简述几种常见的蛋白质结构预测方法。

7. 系统生物学和网络分析- 系统生物学研究的是什么?- 网络分析在系统生物学中的应用。

8. 生物信息学中的数据库- 列举几个常见的生物信息学数据库。

- 解释数据库在生物信息学研究中的作用。

9. 生物信息学中的编程语言- 哪些编程语言在生物信息学中常用?- 简述Python在生物信息学中的应用。

10. 伦理和隐私问题- 在生物信息学研究中可能遇到哪些伦理问题?- 如何保护生物信息数据的隐私?11. 案例研究- 描述一个生物信息学在医学研究中的应用案例。

- 分析该案例中使用的方法和技术。

12. 未来趋势- 预测生物信息学未来的发展趋势。

- 讨论生物信息学如何影响未来的科学研究和医疗保健。

通过这些问题的复习,同学们可以更全面地了解生物信息学的基础概念、关键技术和应用领域。

希望这些复习题能够帮助同学们更好地准备考试和理解生物信息学的重要性。

生物信息考试题及答案

生物信息考试题及答案

生物信息考试题及答案生物信息学是一门结合生物学、计算机科学、信息技术和数学的交叉学科,它利用计算机技术来分析和解释生物数据。

以下是一份生物信息学考试题及答案的示例。

生物信息学考试题一、选择题(每题2分,共20分)1. 生物信息学中,用于存储DNA序列的文件格式是:A. FASTAB. JPEGC. MP3D. DOCX2. 以下哪项不是生物信息学分析的基本步骤?A. 数据收集B. 数据预处理C. 数据解释D. 数据存储3. 在蛋白质序列分析中,BLAST工具用于:A. 序列比对B. 序列组装C. 序列克隆D. 序列合成4. 以下哪个数据库不是用于存储基因表达数据的?A. NCBIB. GEOC. PDBD. ArrayExpress5. 以下哪个算法不是用于基因预测的?A. GeneMarkB. BLASTC. GlimmerD. Fgenesh二、简答题(每题10分,共30分)6. 简述生物信息学在现代生物学研究中的重要性。

7. 解释什么是基因组学,并说明其在医学研究中的应用。

8. 描述序列比对的基本原理及其在生物信息学中的作用。

三、计算题(每题15分,共30分)9. 假设你有一个DNA序列,其组成为:ATCGTA。

请计算其互补序列。

10. 给定两个蛋白质序列,序列A:A-B-C-D-E,序列B:A-C-E-B-D。

请使用Needleman-Wunsch算法计算它们的全局比对得分。

四、论述题(每题20分,共20分)11. 论述生物信息学在新药开发中的作用及其面临的挑战。

答案一、选择题1. A2. C3. A4. C5. B二、简答题6. 生物信息学在现代生物学研究中的重要性体现在它能够处理和分析大量的生物数据,如基因组序列、蛋白质结构等,帮助科学家快速发现生物现象的规律,推动生物学的发展。

7. 基因组学是研究生物基因组的结构、功能和演化的科学。

在医学研究中,基因组学可以帮助我们了解疾病的遗传基础,为个性化医疗提供理论基础。

生物信息学试题

生物信息学试题

生物信息学试题一、选择题1. 生物信息学主要研究的是:A. 生物实验技术B. 生物统计学C. 生物大数据分析与计算D. 生物体内生化反应2. 在生物信息学中,常用的序列比对工具是:A. BLASTB. PCRC. ELISAD. SDS-PAGE3. 下列哪个数据库主要用于存储核酸序列信息?A. PDBB. GenBankC. UniProtD. KEGG4. 以下哪种方法不是用于蛋白质结构预测的?A. 同源建模B. 折叠识别C. 从头预测D. 实验测定5. 生物信息学中的“基因家族”是指:A. 一组具有相似序列和功能的基因B. 一组来自同一物种的基因C. 一组通过基因复制产生的基因D. 一组控制同一生物过程的基因二、简答题1. 简述生物信息学在现代医学研究中的应用。

2. 描述PCR技术的原理及其在分子生物学中的重要性。

3. 解释什么是基因编辑技术,以及CRISPR-Cas9系统是如何工作的。

三、论述题1. 论述生物信息学在新药发现和开发中的作用。

2. 分析比较RNA测序技术与DNA测序技术的优势和局限性。

四、计算题1. 给定一个DNA序列:“ATGCGATACCTGAGCTG”,计算其碱基组成的比例。

2. 假设某种生物的基因组大小为200 Mb,每个碱基对的平均质量为650 Da,计算该基因组的大致质量。

五、案例分析题1. 根据给定的某种疾病的基因组数据,分析可能的致病基因,并讨论其可能的生物机制。

2. 通过分析某物种的转录组数据,探讨其在特定环境下的适应性变化。

请注意,以上试题仅供参考,具体题目应根据实际教学大纲和考试要求进行调整。

在实际考试中,题目可能会包含更多的细节和复杂性,要求考生具备扎实的生物信息学知识和分析能力。

生物信息技术考试试题

生物信息技术考试试题

生物信息技术考试试题一、选择题(每题 3 分,共 30 分)1、以下哪个不是生物信息学的主要研究内容?()A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是()A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中,常用的标准化方法是()A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息?()A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的?()A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中,预测蛋白质二级结构的方法不包括()A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中,BLAST 程序主要用于()A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛?()A JavaB PythonC C++D Fortran10、用于分析基因芯片数据的软件包是()A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题(每题 3 分,共 30 分)1、生物信息学中的三大核心数据库是_____、_____、_____。

2、基因序列的相似性搜索常用的工具是_____。

3、蛋白质的一级结构是指_____。

4、常见的基因注释数据库有_____、_____等。

5、系统发育树的构建基于_____的原理。

6、生物信息学中常用的数据格式有_____、_____等。

7、预测蛋白质三级结构的方法主要有_____、_____。

8、基因表达数据的差异分析常用的方法有_____、_____。

9、用于分析高通量测序数据的软件有_____、_____。

生物信息学基础考试试题

生物信息学基础考试试题

生物信息学基础考试试题生物信息学基础考试试题回答一、选择题(每题5分,共20题)1. 生物信息学的定义是什么?A. 研究生物的基本信息B. 利用计算机科学分析生物学数据C. 研究生物的遗传编码D. 生物学的一个分支学科答案:B2. 以下哪个是常用的生物信息学数据库?A. NCBIB. C++C. DNAD. Photosynthesis答案:A3. 在DNA序列中,碱基A配对的是?A. TB. CC. GD. U答案:A4. 以下哪个是生物信息学中常用的序列比对算法?A. BLASTB. MATLABC. PCRD. ELISA答案:A5. 基因组学是研究什么的科学?A. 蛋白质结构B. DNA修复C. 基因组DNA的组成和功能D. 细胞分裂答案:C6. 哪种技术可用于测定DNA序列?A. 单克隆抗体技术B. RNA干扰技术C. 半制备列序法D. 高效液相色谱法答案:C7. 生物信息学中的序列模拟是指什么?A. 通过计算机模拟生物进化过程B. 利用计算机模拟DNA合成过程C. 模拟生物对某种药物的反应D. 利用计算机模拟细胞分裂过程答案:A8. 以下哪个是生物信息学的一个重要应用领域?A. 化学合成B. 建筑设计C. 新药研发D. 环境保护答案:C9. 哪个工具常用于分析生物信息中的调控网络?A. PhotoshopB. CytoscapeC. ExcelD. SPSS答案:B10. 蛋白质结构预测是生物信息学的一个重要研究方向,以下哪种是蛋白质的一级结构?A. α螺旋B. 葡萄糖C. 多肽链D. 抗原答案:C11. 生物信息学与生物医学工程有什么相似之处?A. 都研究细胞生物学B. 都属于理学院系C. 都涉及到计算机科学D. 都使用相同的实验方法答案:C12. 在基因组测序中,什么是基因组装?A. 利用计算机将碎片序列拼接成连续的基因组B. 测定基因组中的突变位点C. 研究基因间的调控关系D. 将RNA转录为蛋白质的过程答案:A13. 以下哪个不属于生物信息学的软件工具?A. BLASTB. PhotoshopC. RD. Python答案:B14. 哪种常见的DNA测序技术被广泛应用于基因组学研究?A. Sanger测序B. 吉姆斯法则C. CRISPR-Cas9技术D. 免疫印迹法答案:A15. 生物信息学中的反向遗传学用于研究什么?A. DNA复制B. 基因的转录和翻译C. RNA干扰D. 基因组的组装答案:B16. 哪种方法可用于鉴定基因表达谱中的关键基因?A. 蛋白质降解法B. 基因芯片技术C. 聚合酶链式反应D. 免疫组化技术答案:B17. 生物信息学研究中常用的基因表达定量方法是什么?A. Western BlotB. ELISAC. qPCRD. 蛋白质组学答案:C18. 生物信息学中的系统生物学研究的是什么?A. 各个细胞器的功能B. 化学元素与生物体的相互作用C. 生物学过程中的相互关系D. 各个动物种群的遗传特征答案:C19. 下面哪个数据库不是用于蛋白质结构预测的?A. PDBB. UniProtC. Swiss-ProtD. Entrez Gene答案:D20. 生物信息学中常用的序列对比方法是什么?A. 水平基因转移B. Smith-Waterman算法C. 单克隆抗体制备D. RNA干扰技术答案:B二、简答题(每题10分,共5题)1. 编程语言在生物信息学中的作用是什么?编程语言在生物信息学中扮演着重要角色。

《生物信息学》题集

《生物信息学》题集

《生物信息学》题集一、选择题(每题3分,共30分)1.生物信息学的主要研究对象是什么?A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术?A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中,进行多序列比对时常用的软件是什么?A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析?A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中,下列哪项不是常用的序列分析技术?A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用?A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测?A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中,下列哪项不是基因注释的内容?A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术?A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用?A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题(每题2分,共20分)1.生物信息学是一门交叉学科,它主要涉及______、计算机科学和数学等领域。

2.在生物信息学中,______技术常用于基因序列的相似性搜索。

3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。

4.在基因表达数据分析中,______是一种常用的数据标准化方法。

5.生物信息学中,______技术常用于蛋白质结构的预测和分析。

6.在生物信息学数据库中,GenBank主要存储的是______数据。

生物信息学考试试题

生物信息学考试试题

生物信息学考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种不是常见的生物信息学数据库?()A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中,以下哪个不是用于序列比对的算法?()A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括()A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法?()A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中,用于预测蛋白质功能的方法有()A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中,以下哪个不是测序技术?()A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括()A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言?()A PythonB JavaC C++D Visual Basic9、以下哪个不是生物信息学在医学领域的应用?()A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中,处理大规模数据常用的工具是()A ExcelB R 语言C SPSSD Word二、填空题(每题 2 分,共 20 分)1、生物信息学是一门融合了生物学、计算机科学和()的交叉学科。

2、常见的核酸序列格式有 FASTA 和()。

3、蛋白质的二级结构包括α螺旋、β折叠和()等。

4、基因芯片技术是一种()分析技术。

5、序列比对的目的是寻找两个或多个序列之间的()。

6、人类基因组计划的主要目标是测定人类基因组的()序列。

7、生物信息学中的隐马尔可夫模型主要用于()。

8、系统发生分析中,外群的作用是()。

9、蛋白质相互作用网络分析有助于理解()。

10、生物信息学数据库可以分为一级数据库和()数据库。

生物信息学习题

生物信息学习题

GTATCACACG ACTCAGCGCA GCATTTGCCC
GTATCACATA GCTCAGCGCA GCATTTGCCC
6、对于下列距离矩阵,用 UPGMA 构建系统发生树。
ABCDE
A0
B3 0
C6 5 0
D 9 9 10 0
E 12 11 13 9 0 7、对下面距离矩阵,用 UPGMA 法构建系统发生树
1、蛋白质得分矩阵类型有 、
、、

等。
2、对位排列主要有局部比对和 三、运算题 1、画出下面两条序列的简单点阵图。将第一条序列放在 x 坐标轴上,将第二条序列放在 y
坐标轴上。 TGAACTCCCTCAGATATTA CGAACCCTCACATATTAGCG
2、对两个核酸序列 ACACACTA 和 AGCACACA 进行全局比对
第八章 后基因组时代的生物信息学(问题与练习)
1、 比较生物还原论与生物综合论的异同 2、 简述“后基因组生物信息学”的基本研究思路 3、 后基因组生物信息学的主要挑战是什么? 4、 功能基因组系统学的基本特征是什么? 5、 说明后基因组生物信息学对信息流动的最新理解 6、 列举几种预测蛋白质-蛋白质相互作用的理论方法 7、 解释从基因表达水平关联预测蛋白质-蛋白质相互作用的理论方法 8、 解释基因保守近邻法预测蛋白质-蛋白质相互作用的理论方法 9、 解释基因融合法预测蛋白质-蛋白质相互作用的理论方法 10、解释种系轮廓发生法预测蛋白质-蛋白质相互作用的理论方法
正确的树的可能性比前一种情况大还是小?
5、对于下列 5 条序列的比对构造一个距离矩阵,其中序列之间的距离值为比对中失配的碱
基数目,但是颠换的权值为转换的两倍。
GTGCTGCACG GCTCAGTATA GCATTTACCC

生物信息学简答题

生物信息学简答题

1.简述PCR引物设计的基本原则。

你知道哪种PCR设计软件?(1. 引物应用核酸系列保守区内设计并具有特异性。

2.产物不能形成二级结构。

3. 引物长度一般在15~30碱基之间。

4. G+C含量在40%~60%之间。

5. 碱基要随机分布。

6. 引物自身不能有连续4个碱基的互补。

7. 引物之间不能有连续4个碱基的互补。

8. 引物5′端可以修饰。

9. 引物3′端不可修饰。

10. 引物3′端要避开密码子的第3位。

Primo Pro 3.4: PCR Primer Design,AutoPrime)2. 你知道哪些中文文献数据库?(《万方数据库》、《中国期刊网》、《维普中文科技期刊数据库》《国研报告》、《中经专网》、《中国资讯行》、《中宏数据库》)3. 分子生物学数据库有哪些类型?各有何特点?(1.基因组数据库:基因组数据库的主体是模式生物基因组数据库,其中最主要的是由世界各国的人类基因组研究中心、测序中心构建的各种人类基因组数据库。

2.蛋白质数据库:蛋白质数据库(HPDB),建于2004年5月,动态展示生物大分子立体结构,鼠标点击放大分子结构、原子定位、测定原子之间距离,可用于教学或科研。

服务对象是能够熟练使用中文的生命科学、医学、药学、农学、林学等领域的大中专学生、教师及科技工作者。

3.核酸数据库:DNA、RNA序列的资料库,主要包括已知序列名称、DNA或RNA全序列及其特性,如启动区、起始和终止密码的位置、编码区、限制酶切位点以及推导的翻译产物蛋白质序列等。

)4. 列举2个常用的生物信息学软件,并做简单介绍(Primer Premier是一款由由加拿大的Premier公司开发的专业用于PCR或测序引物以及杂交探针的设计,评估的软件,主要功能分四种,即引物设计、限制性内切酶位点分析、DNA 基元(motif)查找和同源性分析功能。

MEGA 的全称是Molecular Evolutionary Genetics Analysis 分子进化遗传分析。

生物信息学课堂测验中科大

生物信息学课堂测验中科大

生物信息学课堂测验1.蛋白质的磷酸化是最重要的一种翻译后修饰,实验学家最近鉴定了某个激酶X的底物,总共20个底物蛋白质,序列平均长度500aa。

在这些蛋白质上,总共鉴定了50个位点。

基于这些实验数据,生物信息学家构建了相关的计算预测工具。

对于给定的两个蛋白质序列A和B,长度分别为500aa和800aa,计算工具预测这两个蛋白质上分别有10和4个潜在的位点。

考虑到计算工具本身具有一定的错误率,对于A和B,预测出来的位点,若全部是随机产生的概率为多少?(泊松分布)2.发现细胞有丝分裂过程中参与重要功能的基因,可以通过基因芯片的方法进行研究。

某实验室开展了一项工作,对细胞有丝分裂期不加nocodazole以及加nocodazole两种条件下,对人的21,000基因做表达谱分析。

其中发现表达量显著升高的基因为1,532个。

进一步做功能分析,发现总共1,236个基因具有某种功能F,而在表达量显著升高的基因中,有32个基因具有该功能F。

问:该功能F在表达量显著升高的基因中是显著出现,显著不出现,还是随机出现?要求:写出相关的计算公式,并填入实际数据,不计算最终结果。

已知超几何分布的公式:(超几何分布)Array3.实验学家从1500个4bp的DNA序列中鉴定了300个某种现概率为0.91,第二位T出现的概率为0.85,第三位A概率为0.51,G出现的概率为0.47和ATAA,两条序列可能是X-box的概率为多少?(贝叶斯公式)4.对于两条蛋白质序列: IDRRPAE和LDRPAW,请分别用(1) Needleman-Wunsch算法;(2)Smith-Waterman算法对两条序列作比对;对于Gap的罚分为8,线性罚分规则;用图示法表明比对过程,并写出比对结果、得分。

打分矩阵采用BLOSUM62矩阵,部分矩阵如下:A R D E I L P WA 4 -1 -2 -1 -1 -1 -1 -3R -1 5 -2 0 -3 -2 -2 -3D -2 -2 6 2 -3 -4 -1 -4E -1 0 2 5 -3 -3 -1 -3I -1 -3 -3 -3 4 2 -3 -3L -1 -2 -4 -3 2 4 -3 -2P -1 -2 -1 -1 -3 -3 7 -4W -3 -3 -4 -3 -3 -2 -4 11(全局比对和局部比对)5.给定一组DNA序列如下:ACTTCCCAAGTTCCCAACTCGGCACCTTCGCA1) 请根据上述DNA序列,写出两种PSSM; 2) 再给一条新的序列AGTCGCA,计算log-odd ratio,该例中,碱基的背景值都为0.25; 3) 请分别计算第一位和第六位所包含的信息量6.请用图示法并辅以必要的文字,描述Gibbs 采样抽取序列motif的过程。

生物信息考试题及答案

生物信息考试题及答案

生物信息考试题及答案一、选择题(每题2分,共20分)1. 基因组学研究的核心是()。

A. 基因克隆B. 基因表达C. 基因组序列D. 基因功能答案:C2. 下列哪项不是生物信息学的主要研究内容?()A. 基因组序列分析B. 蛋白质结构预测C. 植物分类学D. 基因表达分析答案:C3. 转录组学研究的是()。

A. 基因组中的所有基因B. 特定细胞或组织中的所有RNA分子C. 特定细胞或组织中的所有蛋白质分子D. 特定细胞或组织中的所有DNA分子答案:B4. 下列哪个数据库主要用于存储蛋白质序列信息?()A. GenBankB. PDBC. Swiss-ProtD. EMBL答案:C5. 以下哪个不是生物信息学中常用的序列比对工具?()A. BLASTB. FASTAC. ClustalWD. PCR答案:D6. 以下哪个是用于蛋白质三维结构预测的软件?()A. Swiss-ProtB. PDBC. MODELLERD. GenBank答案:C7. 以下哪个是用于基因表达分析的高通量技术?()A. Sanger测序B. 微阵列C. PCRD. 质谱分析答案:B8. 下列哪个是用于基因组关联研究的统计方法?()A. 聚类分析B. 系统发育分析C. 连锁不平衡分析D. 多态性分析答案:C9. 以下哪个是用于蛋白质-蛋白质相互作用网络分析的工具?()A. STRINGB. BLASTC. ClustalWD. GenBank答案:A10. 下列哪个是用于生物信息学数据可视化的工具?()A. R语言B. PythonC. CytoscapeD. Perl答案:C二、填空题(每题2分,共20分)1. 生物信息学是一门结合了__________、__________和__________的交叉学科。

答案:生物学、计算机科学、信息技术2. 基因组学中的“组”指的是__________的集合。

答案:基因3. 转录组学研究的RNA分子包括__________、__________和__________。

生物信息学复习题已附答案

生物信息学复习题已附答案

本卷的答案仅做参考,如有疑问欢迎提出。

后面的补充复习题要靠你们自己整理答案了。

生物信息学复习题一、填空题1、 识别基因主要有两个途径即2、 表达序列标签是从 mRNA 中生成的一些很短的序列( 300-500bp ),它们代表在特定组织或发育阶段表达的基因。

3、 序列比对的基本思想,是找出 检测基因 和 目标序列 的相似性,就是通过在序列中插入 空位的方法使所比较的序列长度达到一致。

比对的数学模型大体分 为两类,分别— 和局部比对 。

4、 2-DE 的基本原理是根据蛋白质 和 分子量 不同,进行两次电泳将之分 离。

第一向是 等电聚焦分离 ,第 —S D S-P AGE 分离 o5、 蛋白质组研究的三大关键核心技术是 质谱鉴定技术 、 计算机图像数据处理与蛋白质数据库二、 判断题1、 生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,是真核生物基因组的特点之一。

(对)2、 CDS 一定就是 ORF 。

(对)3、 两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源 ,就具有共同的祖先。

(错)4、 STS,是一段 200-300bp 的特定 DNA 序列,它的序列已知,并且在基因组中属于 单拷贝。

(对)5、 非编码 DNA 是“垃圾 DNA',不具有任何的分析价值,对于细胞没有多大的作用。

(错)6、 基因树和物种树同属于系统树,它们之间可以等同。

(错)7、 基因的编码序列在 DNA 分子上是被不编码的序列隔开而不连续排列的。

&对任意一个 DNA 序列,在不知道哪一个碱基代表 CDS 的起始时,可用 获得6个潜在的蛋白质序列。

(对)9、 一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。

(对)10、 外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的 外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以 不同。

生物信息学试题集锦

生物信息学试题集锦

一、简答。

(本题满分70分)1、简述生物信息学产生的历史必然性,以及生物信息学的主要研究内容?(本小题满分20分)答:生物信息学的产生,是生物科学与计算机技术的结合。

20世纪后期,生物科学技术迅猛发展,无论从数量上还是从质量上都极大地丰富了生物科学的数据资源。

数据资源的急剧膨胀迫使人们寻求一种强有力的工具去组织这些数据,以利于储存、加工和进一步利用。

而海量的生物学数据中必然蕴含着重要的生物学规律,这些规律将是解释生命之谜的关键,人们同样需要一种强有力的工具来协助人脑完成对这些数据的分析工作。

另一方面,以数据分析、处理为本质的计算机科学技术和网络技术迅猛发展?并日益渗透到生物科学的各个领域。

于是,一门崭新的、拥有巨大发展潜力的新学科——生物信息学——悄然兴起。

生物信息学的诞生及其重要性早在1956年,在美国田纳西州盖特林堡召开的首次“生物学中的信息理论研讨会”上,便产生了生物信息学的概念。

但是,就生物信息学的发展而言,它还是一门相当年轻的学科。

直到20世纪80—90年代,伴随着计算机科学技术的进步,生物信息学才获得突破性进展。

1987年,林华安博士正式把这一学科命名为“生物信息学”(Bioinformatics)。

此后,其内涵随着研究的深入和现实需要的变化而几经更迭。

1995年,在美国人类基因组计划第一个五年总结报告中,给出了一个较为完整的生物信息学定义:生物信息学是一门交叉科学,它包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。

生物信息学不仅是一门新学科,更是一种重要的研究开发工具。

从科学的角度来讲,生物信息学是一门研究生物和生物相关系统中信息内容与信息流向的综合系统科学。

只有通过生物信息学的计算处理,人们才能从众多分散的生物学观测数据中获得对生命运行机制的系统理解。

从工具的角度来讲,生物信息学几乎是今后所有生物(医药)研究开发所必需的工具。

生物信息试题及答案

生物信息试题及答案

生物信息试题及答案一、选择题(每题2分,共20分)1. 生物信息学的主要研究对象是()。

A. 蛋白质结构B. 基因组序列C. 细胞信号传导D. 生物分子相互作用答案:B2. 以下哪项不是生物信息学的主要任务?()A. 基因预测B. 蛋白质功能预测C. 疾病诊断D. 植物分类学研究答案:D3. 人类基因组计划的主要目标是()。

A. 确定人类基因组中的所有基因B. 确定人类基因组中的所有蛋白质C. 确定人类基因组中的所有核苷酸序列D. 确定人类基因组中的所有代谢途径答案:C4. 以下哪种生物信息数据库不是公共数据库?()A. GenBankB. Swiss-ProtC. PDBD. Myriad Genetics答案:D5. 在生物信息学中,BLAST是一种()。

A. 基因克隆技术B. 基因表达分析软件C. 序列比对工具D. 蛋白质结构预测方法答案:C6. 以下哪种序列分析方法不适用于大规模基因组数据?()A. 多重序列比对B. 单序列比对C. 基因预测D. 基因家族分析答案:B7. 以下哪种技术不是用于蛋白质结构预测的?()A. 同源建模B. 从头预测C. 基因克隆D. 蛋白质折叠模拟答案:C8. 以下哪种生物信息学工具主要用于蛋白质功能预测?()A. PfamB. BLASTC. ClustalWD. Swiss-Prot答案:A9. 以下哪种生物信息学数据库专门存储蛋白质结构数据?()A. GenBankB. Swiss-ProtC. PDBD. KEGG答案:C10. 在生物信息学中,以下哪种数据类型不是高通量数据?()A. 基因表达数据B. 蛋白质组数据C. 代谢组数据D. 单个基因序列答案:D二、填空题(每题2分,共20分)1. 生物信息学是应用__________和__________技术,研究生物大分子结构、功能和相互作用的科学。

答案:计算机;信息技术2. 人类基因组计划完成于__________年。

生物信息学考试试题

生物信息学考试试题

生物信息学考试试题1. 选择题1. DNA序列中哪种碱基与腺嘌呤形成碱基对?A. 腺嘌呤B. 胸腺嘧啶C. 钝甲嘧啶D. 尿嘧啶2. 下列哪种不属于生物信息学中常用的序列比对软件?A. BLASTB. ClustalWC. PhotoshopD. MEGA3. 在生物信息学中,什么是基因组装?A. 把基因组序列和蛋白质序列对应起来B. 把已知的DNA序列分析并组装成完整的基因组C. 把DNA序列和RNA序列对比分析D. 把基因组序列转录为RNA序列4. 下列哪个软件主要用于预测DNA序列中的基因结构?A. BLASTB. ClustalWC. FGENESD. MEGA5. 在生物信息学中,什么是密码子?A. DNA序列中的重复单元B. 氨基酸序列C. tRNA分子上的核苷酸组合D. mRNA上的三联体核苷酸序列2. 简答题1. 请简要解释生物信息学在基因组学中的应用。

2. 什么是序列比对?序列比对的意义是什么?3. 解释基因组装和基因注释在生物信息学中的作用。

4. 生物信息学中常用的两种序列分析方法分别是什么?简要描述它们的原理。

5. 请简要介绍生物信息学在进化比较基因组学中的应用。

3. 计算题1. 给定以下两条序列,求它们的相似度:序列1: ATCGTCCGATT序列2: ATCGACCGTTA2. 已知一个DNA序列长度为1000bp,其中AT含量为60%,求该序列中GC含量百分比。

4. 应用题1. 请利用BLAST软件对一组已知DNA序列进行序列比对,并解释结果。

2. 请使用ClustalW对两个已知蛋白质序列进行多序列比对,并分析比对结果。

3. 选取一个基因组装软件,对一个已知基因组序列进行装配,并解释装配结果。

以上是生物信息学考试试题,希望您认真作答,祝您考试顺利!。

生物信息学题库--精校+整理

生物信息学题库--精校+整理

生物信息学题库一、名词解释1.生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础, 应用计算机技术, 研究生物学数据的科学。

2.相似性(similarity):相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA 碱基或氨基酸残基顺序所占比例的高低。

3.同源性(homology):生物进化过程中源于同一祖先的分支之间的关系。

4.BLAST(Basic Local Alignment Search Tool):基本局部比对搜索工具, 用于相似性搜索的工具, 对需要进行检索的序列与数据库中的每个序列做相似性比较。

5.HMM隐马尔可夫模型:是蛋白质结构域家族序列的一种严格的统计模型, 包括序列的匹配, 插入和缺失状态, 并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。

6.一级数据库:一级数据库中的数据直接来源于实验获得的原始数据, 只经过简单的归类整理和注释(投稿文章首先要将核苷酸序列或蛋白质序列提交到相应的数据库中)7、二级数据库:对原始生物分子数据进行整理、分类的结果, 是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。

8、GenBank: 是具有目录和生物学注释的核酸序列综合公共数据库, 由NCBI构建和维护。

9、EMBL: EMBL 实验室: 欧洲分子生物学实验室。

EMBL 数据库: 是非盈利性学术组织 EMBL 建立的综合性数据库, EMBL 核酸数据库是欧洲最重要的核酸序列数据库, 它定期地与美国的GenBank、日本的 DDBJ 数据库中的数据进行交换, 并同步更新。

10、DDBJ: 日本核酸序列数据库, 是亚洲唯一的核酸序列数据库。

11.Entrez:是由 NCBI 主持的一个数据库检索系统, 它包括核酸, 蛋白以及 Medline 文摘数据库, 在这三个数据库中建立了非常完善的联系。

12.SRS(sequence retrieval system):序列查询系统, 是 EBI 提供的多数据库查询工具之一。

生物信息学试题及答案

生物信息学试题及答案

生物信息学试题及答案一、单项选择题(每题2分,共20分)1. 生物信息学的主要研究对象是()。

A. 生物数据B. 生物实验C. 生物模型D. 生物技术答案:A2. 下列哪项不是生物信息学中的常用数据库()。

A. GenBankB. Swiss-ProtC. PubMedD. Google Scholar答案:D3. 蛋白质序列比对的主要目的是()。

A. 确定蛋白质的三维结构B. 预测蛋白质的功能C. 比较蛋白质的氨基酸序列D. 计算蛋白质的分子量答案:B4. 在生物信息学中,以下哪种算法不是用于序列比对的()。

A. BLASTB. FASTAC. Smith-WatermanD. Hidden Markov Model答案:D5. 下列哪种生物信息学工具主要用于基因表达分析()。

A. ClustalWB. Primer3C. R语言D. PDB答案:C6. 以下哪种技术不是用于蛋白质结构预测的()。

A. 同源建模B. 从头预测C. 序列比对D. 折叠识别答案:C7. 以下哪种生物信息学工具主要用于基因组注释()。

A. BLASTC. GATKD. Primer3答案:B8. 在生物信息学中,以下哪种方法不用于基因表达数据的聚类分析()。

A. K-meansB. Hierarchical clusteringC. Principal component analysisD. Multiple sequence alignment答案:D9. 下列哪种生物信息学工具主要用于蛋白质-蛋白质相互作用网络分析()。

A. STRINGB. BLASTD. Primer3答案:A10. 在生物信息学中,以下哪种数据库不包含蛋白质结构信息()。

A. PDBB. UniProtC. RCSBD. GenBank答案:D二、多项选择题(每题3分,共15分)11. 生物信息学中常用的序列比对工具包括()。

A. BLASTB. FASTAC. ClustalWD. Pfam答案:ABC12. 以下哪些是生物信息学中常用的基因表达分析软件()。

中科院生物信息学复习题

中科院生物信息学复习题

1.什么是生物信息学,如何理解其含义?答:生物信息学有三个方面的含义:1)生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。

2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。

3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。

它是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。

怎样理解生物信息学:生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区;同时阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA 序列中的遗传语言规律:在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白谱数据,从而认识代谢、发育、分化、进化的规律。

其还利用基因组中编码区信息进行蛋白空间结构模拟和蛋白功能预测,并将此类信息与生物体和生命过程中的生理生化信息结合,阐明其分子机制,最终进行蛋白、核酸分子设计、药物设计、个体化医疗保健设计。

2.如何利用数据库信息发现新基因,基本原理?答:利用数据库资源发现新基因,根据数据源不同,可分2种不同的查找方式:1)从大规模基因组测序得到的数据出发,经过基因识别发现新基因:利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因对比,从而确定是否为新基因。

可分为:①基于信号,如剪切位点、序列中的启动子与终止子等。

②基于组分,即基因家族、特殊序列间比较,Complexity analysis,Neural Network2)利用EST数据库发现新基因和新SNPs:数据来源于大量的序列小片段,EST较短,故关键在正确拼接。

方法有基因组序列比对、拼接、组装法等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息学题目整理:陈润生:一、什么是生物信息学?你怎么理解它的含义?Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation.1、生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。

2、生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。

3、生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。

它是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。

对生物信息学理解的实例:怎样从新测得的DNA序列中找到编码区?非编码区与编码区的差别是什么?非编码区有什么具体功能?RNAi现象对于细胞来说有着很重要的意义,包括基因表达的调控等等,那么都有哪些具体机制可以诱导正常细胞产生RNAi现象?SARS病毒的比较基因组研究;治疗SARS的RNAi设计;SARS蛋白的结构预测和模拟。

怎么理解:生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA 基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白谱数据,从而认识代谢、发育、分化、进化的规律。

其还利用基因组中编码区信息进行蛋白空间结构模拟和蛋白功能预测,并将此类信息与生物体和生命过程的生理生化信息结合,阐明其分子机理,最终进行蛋白、核酸分子设计、药物设计、个体化医疗保健设计。

二、发现新基因的两种方法是什么?算法的本质是?大部分新基因是靠理论方法预测出来的。

1、利用NCBI中EST( Expression Sequence Tag) 数据库(dbEST) 发现新基因和新SNPs。

国际上现已出现了几个基于EST的基因索引如UniGene, Merck-Gene, GenExpress-index数据来源于大量的序列小片段,EST较短,故关键在正确拼接。

方法有基因组序列比对、拼接、组装法等。

经常采用SiClone策略主要步骤:构建数据库;将序列纯化格式标准化;从种子库中取序列和大库序列比对;延长种子序列,至不能再延长;放入contig库(1)构建若干数据库:总的纯化的EST数据库、种子数据库、载体数据库、杂质、引物数据库、蛋白数据库、cDNA数据库;(2)用所用种子数据库和杂质、引物数据库及载体数据库比对,去除杂质;(3)用种子和纯化的EST数据库比对;(4)用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较,判断是否为已有序列,再利用该大片段与纯化的EST数据库比对。

重复以上步骤,直到序列不能再延伸;(5)判断是否为全长cDNA序列。

2、从大规模基因组测序得到的数据出发,经过基因识别发现新基因:利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因比对,从而确定是否为新基因。

可分为(1)基于信号,如剪切位点、序列中的promoter与terminator(2)基于组分,即基因家族、特殊序列间比较,complexity analysis,neutral network其本质是: : 以一个序列片段为线索, 通过它和整个数据库的比较, 还原出全序列原貌。

当测序获得一条EST序列时,它来自哪一个基因的哪个区域是未知的(随机的),所以属于同一个基因的不同EST序列之间常有交叠的区域。

根据这种“交叠”现象,就能找出属于同一个基因的所有EST序列,进而将它们拼接成和完整基因相对应的全长cDNA序列。

三、研究生物进化的步骤有哪些,当前面临的困难是什么?如何解决?1、构建系统进化树。

主要步骤如下:(1)序列相似性比较。

可以找到和目标序列相似的序列,但无法确定序列间的同源关系。

就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。

完成这一工作只需要使用两两序列比较算法。

常用的程序包有BLAST、FASTA等;(2)序列同源性分析。

是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。

这是理论分析方法中最关键的一步。

完成这一工作必须使用多序列比较算法。

常用的程序包有CLUSTAL等;(3)构建系统进化树。

一般单独一种方法是不够的,通常需要多种方法才能构建反映物种间进化关系的进化树。

根据序列同源性分析的结果,重建反映物种间进化关系的进化树。

为完成这一工作已发展了多种软件包,象PYLIP、MEGA等;(4)分支的确定(稳定性检验)。

只有稳定的分支才有意义,为了检验构建好的进化树的可靠性,通常构建过程要随机成百上千次,大概率(70%以上)出现的分支点才是可靠的,通用的方法使用Bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。

2、当前的主要困难是发现了基因的横向迁移(LGT)现象。

即进化程度不同的物种间存在着遗传信息基因的传递,如果拿迁移的基因做进化分析就会出错。

3、解决方法:(1)纵向思路:是在所有序列中筛选出有垂直进化关系的序列数据集,如COG数据库;(2)横向思路:是用完整的基因组和蛋白质组比较:A.以whole genome为单位,进行基因组水平上的比对B.利用生物体的蛋白质组构建进化树选取特征比对,不用长度的序列字符串进行比对后,对照其genome进行归一化ORF对比,将all predicted ORF采用COG的分类规则进行分类,再构建进化树:进化树方法研究古生物时的问题:样品测序是在几千万年前被固定的,而对比库则是现存的,故两者时间差是无法避免的,所以必须采取方法使两者的时间差尽可能的缩短,可采用的方法有两种:1、建立与样品同时代的database;2、构建模型,使样品序列模拟进化。

四、(1)什么是SNP,为什么研究SNP如此重要?请写出2~3个SNP相关的website。

(2)什么是系统生物学?它对生物功能实现的理解的本质变化是什么?(1)什么叫SNP?为什么SNP研究如此重要?举2-3个SNP相关的website。

SNP(single nucleotide polymorphisms,单核苷酸多态性):不同物种、人种、正常人和病人间在基因组上的差异,而这些差异往往表现为一个核苷酸的差异。

随着研究进展,发现可能是多个核苷酸差异、部分序列缺失插入。

SNP覆盖了上面所有内容,含义扩展。

短小缺失也看作SNP。

总的来说,SNP本意是单核苷酸多态性,泛指基因组上一个碱基的取代,现在有所扩展,也包括一些更广泛的变化,例如2-3个碱基的变化也叫SNP。

重要性:SNP是联系基因型和表现型之间关系的桥梁,是基因组领域理论成果和基础研究走向应用的关键步骤。

1、SNP在基因组中分布相当广泛,使人们有机会发现与各种疾病相关的基因组突变;2、不直接导致疾病基因表达的SNP,与某些疾病基因相邻,成为重要标记,有助于发现疾病基因;3、从实验操作来看,通过SNP发现疾病相关基因突变比通过家系容易;4、基础研究中重要,如对Y染色体SNP分析有重要成果。

SNP相关的一些网站:1、SNP Consortium's database(/index.html)2、NCBI SNP database将这些数据进行整理,去掉冗余,使每个SNP都是唯一的。

此时的SNP 被称为reference SNP或refSNP。

((/SNP/overview.html)3、The Human Genic Bi-Allelic Sequences Database(HGBASE) 这一数据库收录了人基因组中所有已知的序列变化,包括:SNPs、序列的插入和缺失(Indels)、简单重复序列等。

(http://hgbase.cgr.ki.se/)4、The Human Gene Mutation Database(HGMD)(/)5、The Protein Mutant Database(PMD),它不是核酸突变数据库,而是蛋白突变数据库。

库中收录了蛋白质特定位点的氨基酸突变信息,以及这些突变对蛋白质结构功能的影响。

(http://pmd.ddbj.nig.ac.jp/)6、The Allele Frequency Database(ALFRED):它是人类群体等位基因频率数据库,/alfred/index.asp(2)什么叫系统生物学?系统生物学对生物功能实现的本质认识的变化?系统生物学是一门学科,是分析整个基因和蛋白质系统所有信息的学科,有三个内涵:1、整合从不同层次水平上得来的信息,整合以前的基因组研究各层次的知识,把基因组水平,蛋白质水平,蛋白与蛋白相互作用,pathway网络等各个层次整合起来。

2、基于整合的信息构建数学模型以描述生物体结构和功能,建立刻画生命活动的数学物理模型,以刻画一个活的生命最小基本功能单位。

3、用建立的数学模型来预测系统内外部存在环境刺激时系统结构如何变化,预测未来生命活动及外界因素变化对其产生的影响。

本质变化:系统生物学认为真正实现生物学功能的是一组相互作用形成网络的蛋白质集合,不仅有孤立存在的元件,还有元件间的关联和相互作用。

学术概念上的发展:传统是从基因组序列到结构,再到功能,而他从各个层次的相互作用到网络,再到功能,与以往不同的是,一开始就考虑元件之间的相互作用,把整个生命活动作为网络考虑其相互作用对生物功能实现的理解本质变化:不仅全息的了解复杂生命系统中的所有成分以及他们之间的动态联系,还可以预测如果这个系统一旦受到了刺激和外界干扰,系统未来的行为是什么。

他不仅考虑单个分子而且考虑其间相互作用,把整个生命活动作为一个相互作用的网络来研究其功能,基因组只是网络中的一部分,只有通过相互作用的网络才能体现功能。

通过系统的整合生物过程不同阶段的分散数据,如基因组、转录组、蛋白组、代谢组,可以对复杂的生物过程如折叠、信号转导、代谢途径更好的模拟,研究生物过程的动态变化。

五、什么是非编码序列、非编码RNA和非编码基因?请以人类为例,回答以下问题:(1)非编码序列占人类基因组的比例是多少?(98%)(2)有多少非编码序列被转录?(50%?)(3)请举两个例子,说明非编码序列的重要性。

相关文档
最新文档