生物信息学 本科生版 期末考试试题(机考)
大学生生物信息学考试模拟题及解析
大学生生物信息学考试模拟题及解析一、单选题(每题 3 分,共 30 分)1、生物信息学中,用于分析 DNA 序列的常见软件是()A BLASTB ClustalWC Primer PremierD MEGA2、以下哪种数据库主要存储蛋白质结构信息()A GenBankB PDBC UniProtD SWISSPROT3、在基因预测中,开放阅读框(ORF)是指()A 从起始密码子到终止密码子的一段序列B 具有特定功能的一段基因序列C 编码蛋白质的基因序列D 以上都不对4、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是5、以下哪种算法常用于序列比对()A 动态规划算法B 贪心算法C 分治法D 回溯算法6、生物信息学中,用于分析基因表达数据的常用方法是()A 聚类分析B 回归分析C 方差分析D 以上都是7、以下哪个不是常见的生物信息学文件格式()A FASTAB GenBankC PDBD CSV8、在蛋白质序列分析中,用于预测蛋白质二级结构的方法是()A 同源建模B 从头预测C 基于机器学习的方法D 以上都是9、进行基因功能注释时,常用的数据库是()A GOB KEGGC ReactomeD 以上都是10、以下哪种技术可以用于大规模测序()A Sanger 测序B 二代测序C 三代测序D 以上都是答案及解析:1、答案:A解析:BLAST(Basic Local Alignment Search Tool)是用于比较生物序列相似性的工具,常用于分析 DNA 序列。
ClustalW 主要用于多序列比对;Primer Premier 常用于设计引物;MEGA 用于构建进化树。
2、答案:B解析:PDB(Protein Data Bank)是主要存储蛋白质结构信息的数据库。
GenBank 主要存储核酸序列;UniProt 和 SWISSPROT 主要存储蛋白质序列信息。
生物信息考试题及答案
生物信息考试题及答案生物信息学是一门结合生物学、计算机科学、信息技术和数学的交叉学科,它利用计算机技术来分析和解释生物数据。
以下是一份生物信息学考试题及答案的示例。
生物信息学考试题一、选择题(每题2分,共20分)1. 生物信息学中,用于存储DNA序列的文件格式是:A. FASTAB. JPEGC. MP3D. DOCX2. 以下哪项不是生物信息学分析的基本步骤?A. 数据收集B. 数据预处理C. 数据解释D. 数据存储3. 在蛋白质序列分析中,BLAST工具用于:A. 序列比对B. 序列组装C. 序列克隆D. 序列合成4. 以下哪个数据库不是用于存储基因表达数据的?A. NCBIB. GEOC. PDBD. ArrayExpress5. 以下哪个算法不是用于基因预测的?A. GeneMarkB. BLASTC. GlimmerD. Fgenesh二、简答题(每题10分,共30分)6. 简述生物信息学在现代生物学研究中的重要性。
7. 解释什么是基因组学,并说明其在医学研究中的应用。
8. 描述序列比对的基本原理及其在生物信息学中的作用。
三、计算题(每题15分,共30分)9. 假设你有一个DNA序列,其组成为:ATCGTA。
请计算其互补序列。
10. 给定两个蛋白质序列,序列A:A-B-C-D-E,序列B:A-C-E-B-D。
请使用Needleman-Wunsch算法计算它们的全局比对得分。
四、论述题(每题20分,共20分)11. 论述生物信息学在新药开发中的作用及其面临的挑战。
答案一、选择题1. A2. C3. A4. C5. B二、简答题6. 生物信息学在现代生物学研究中的重要性体现在它能够处理和分析大量的生物数据,如基因组序列、蛋白质结构等,帮助科学家快速发现生物现象的规律,推动生物学的发展。
7. 基因组学是研究生物基因组的结构、功能和演化的科学。
在医学研究中,基因组学可以帮助我们了解疾病的遗传基础,为个性化医疗提供理论基础。
《生物工程与Bioinformatics基础》2020-2021期末试题及答案
《生物工程与Bioinformatics基础》2020-2021期末试题及答案一、选择题 (每题2分,共20分)1. 以下哪项是生物信息学的核心内容?A. 分子生物学B. 计算机科学C. 统计学D. 生物统计学答案:B. 计算机科学2. 以下哪个数据库是存储基因组序列的数据库?A. PubMedB. GenBankC. PDBD. SwissDock答案:B. GenBank3. 生物信息学中的数据分析方法不包括以下哪项?A. 机器学习B. 聚类分析C. 数据挖掘D. 量子化学计算答案:D. 量子化学计算4. 在生物信息学中,以下哪个工具用于序列比对?A. BLASTB. Clustal OmegaC. FASTAD. R答案:A. BLAST5. 以下哪个是生物信息学中的常用编程语言?A. PythonB. RC. MATLABD. C++答案:A. PythonB. R二、填空题 (每题2分,共20分)1. 生物信息学是运用计算机科学与生物学的交叉领域,旨在开发和应用计算机技术来理解生物数据。
2. 基因组学是研究生物体的全部基因及其表达和调控的学科。
3. 蛋白质组学是研究生物体内所有蛋白质的组成、结构、功能和相互作用的科学。
4. BLAST是一种常用的生物信息学工具,用于核酸或蛋白质序列的相似性搜索。
5. bioinformatics是一个跨学科领域,它结合了计算机科学、信息工程、分子生物学和统计学,以理解生物数据。
三、简答题 (每题10分,共30分)1. 请简要解释生物信息学的应用领域。
生物信息学的应用领域包括基因组学、蛋白质组学、系统生物学、药物设计和疾病建模等。
它被广泛应用于医学、生物学、农业和环境科学等领域,以推动科学发现和技术创新。
2. 请简要介绍生物信息学中的序列比对工具。
生物信息学中的序列比对工具用于比较两个或多个生物序列(如DNA、RNA或蛋白质序列)之间的相似性。
常用的序列比对工具包括BLAST(Basic Local Alignment Search Tool)、FASTA (FAST Allignment Search Tool for Proteins and Nucleotides)和Clustal Omega等。
生物信息技术考试试题
生物信息技术考试试题一、选择题(每题 3 分,共 30 分)1、以下哪个不是生物信息学的主要研究内容?()A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是()A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中,常用的标准化方法是()A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息?()A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的?()A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中,预测蛋白质二级结构的方法不包括()A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中,BLAST 程序主要用于()A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛?()A JavaB PythonC C++D Fortran10、用于分析基因芯片数据的软件包是()A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题(每题 3 分,共 30 分)1、生物信息学中的三大核心数据库是_____、_____、_____。
2、基因序列的相似性搜索常用的工具是_____。
3、蛋白质的一级结构是指_____。
4、常见的基因注释数据库有_____、_____等。
5、系统发育树的构建基于_____的原理。
6、生物信息学中常用的数据格式有_____、_____等。
7、预测蛋白质三级结构的方法主要有_____、_____。
8、基因表达数据的差异分析常用的方法有_____、_____。
9、用于分析高通量测序数据的软件有_____、_____。
生物大数据期末考试练习题及答案
一、单选题1、Bioinformatics的含义是()A.表观遗传学B.基因组学C.蛋白质组学D.生物信息学正确答案:D2、利用PubMed文献数据查找论文“Transgenic plants of Petunia hybrida harboring the CYP2E1 gene efficiently remove benzene and toluene pollutants and improve resistance to formaldehyde”的第一作者是A.Xiang TB.Zhang DC.Bao LD.Li P正确答案:B3、被誉为“生物信息学之父”的科学家是()A.吴瑞B.SangerC.林华安D.Dulbecco正确答案:C4、Proteomics的含义是()A.基因组学B.生物信息学C.表观遗传学D.蛋白质组学正确答案:D5、生物信息学主要是利用哪种工具实现对生命科学研究中生物信息的存储、检索和分析的?()A.人造卫星B.iPhoneC.手机D.计算机正确答案:D6、HGP是()A.人类基因组计划B.国家核酸数据库C.在线人类孟德尔遗传数据D.水稻基因组计划正确答案:A7、下列哪些方法不能用于遗传育种()A.基因编辑B.化学诱导突变C.自然选择D.辐射诱导突变正确答案:C8、Genbank数据库中,mRNA的获取号可以以()字母开头A.NM_B.NP_C.XM_D.NC_正确答案:A9、下列那个数据库不属于NCBI()A.ArrayExpressB.NCBI GEOC.PubMedD.Genbank正确答案:A10、大数据处理遇到的瓶颈不包括()A.新算法B.熟悉数据处理的专业人士C.新的构架D.数据量正确答案:D11、可以用来做数据库搜索的比对算法是()A.Smith-WatermanB.Needelma-WunschC.Dynamic programmingD.BLAST正确答案:D12、下列哪个方法最可能在基因组组装过程中留下空缺()A.Mate pair建库B.C.Pair end测序C.长读段测序D.鸟枪法建库正确答案:D13、“一旦空位,永远空位”描述的是()A.渐进比对算法B.迭代比对算法C.分而治之比对算法D.动态规划比对算法正确答案:A14、下列不属于分子生物学数据库的特点的是()A.版本不更新B.数据间关系复杂C.数据库种类繁多D.数据存在冗余和偏差正确答案:A15、GenBank中具有唯一性的字段是()A.AccessionanismC.AuthorsD.Source正确答案:A16、哪个基因组序列还完全未被破解()A.菠萝B.恐龙C.猛犸象D.人类正确答案:B17、下面哪个工具可以用来检验原始读段的质量?()A.BWAB.blastnC.FastqcD.Samtools正确答案:C18、基于边合成边测序的测序方法是()A.Illumina/SolexaB.454/RocheC.NanoPoreD.SOLiD/ABI正确答案:A19、比较成熟的三代测序技术是()A.PacBioB.HelicosC.NanoPoreD.Illumina HiSeq正确答案:A20、不采用荧光标记核苷酸的测序技术是()A.Roche 454B.SangerC.ABI SOLiDD.NanoPore正确答案:D21、靶向测序使用的测序文库是()A.AmpliconB.PEC.Mate pairD.Shotgun正确答案:A22、RNA-seq从头组装的常用工具是()A.TrinityB.CufflinksC.ScriptureD.BWA正确答案:A23、RNA-Seq技术用途不包括()A.基因组测序B.基因定量C.基因融合研究D.基因可变剪切研究正确答案:A24、重测序数据分析的最后一步是()A.SNP分析B.比对C.功能注释D.质控正确答案:C25、影响基因组组装效果的因素不包括()A.读段长度B.测序深度C.测序时间D.测序准确度正确答案:C26、组装基因组时,由重复序列导致的错误类型不包括()A.基因融合B.基因剪切C.基因重排D.重复缺失正确答案:A27、重复序列是在基因组中出现次数大于1的DNA片段,不包括()A.旁系同源基因B.调控序列C.微卫星序列D.转坐子正确答案:B28、研究蛋白质与DNA相互作用的是()A.酵母三杂交B.免疫共沉淀C.酵母双杂交D.ChIP-seq正确答案:D29、在线的染色体可视化工具是()A.Genome browserB.DDBJC.EBID.NCBI正确答案:A30、下列属于最不易突变的氨基酸()A.半胱氨酸B.谷氨酸C.丝氨酸D.天冬氨酸正确答案:A二、多选题1、影响基因组组装效果的因素包括A.测序深度B.测序时间C.读段长度D.测序准确度正确答案:A、C、D2、常用的2个全基因组测序策略是A.鸟枪法B.逐步克隆法C.EST测序法D.重要区域优先测序法正确答案:A、B3、20世纪70年代,出现的2种DNA测序方法是A.化学降解测序法B.焦磷酸测序法C.单分子测序法D.链终止测序法正确答案:A、D4、关于C值悖论的描述正确的有哪些A.进化程度低的生物C值反而更高B.物种的C值和它进化的复杂性之间存在严格的对应关系C.亲缘关系相近的物种间C值差异很大D.C值远远超过了遗传信息量的需要正确答案:A、C、D5、基因组重测序技术可被用于哪些检测领域A.食品掺假检测B.中草药的产区检测C.皮草的真伪检测D.宠物疾病检测正确答案:A、B、C、D三、判断题1、配对测序方式可以用来解决重复序列长度超过read长度,无法拼接易形成断点的问题正确答案:√2、配对测序是一种特殊的双端测序方式正确答案:√3、读段文件除了文本格式之外,还可以用图象表示正确答案:×4、测序深度即测序得到的碱基总量(bp)与基因组大小(Genome)的比值,它是评价测序量的指标之一正确答案:√5、二代测序数据文件的后缀是.fa或.fastq正确答案:√6、fastaq文件中,Q值越小,测序质量越高()正确答案:×7、基因组从头组装的本质是寻找重叠区域()正确答案:√8、读段长于重复序列的长度才可能填补空缺()正确答案:√9、Contig越长基因组拼接效果越好()正确答案:√10、N50可以作为评估基因组组装效果的一个指标()正确答案:√11、RNA-seq基因对应的读段数量和基因长度及测序深度有关()正确答案:√12、进行有参考基因组的二代测序数据比对时,只需要基因组序列文件即可()正确答案:×13、FPKM是单端RNA-seq基因表达量的表示方法()正确答案:×14、对于复杂基因组,一般一种测序文库就足够了()正确答案:×15、测序文库构建很大程度决定了测序数据的好坏()正确答案:√16、二代测序的核心技术是循环芯片测序法()正确答案:√17、测序深度越高,测序数据量越大()正确答案:√18、二代测序数据文件的后缀是.fa或.fastq()正确答案:√19、基于焦磷酸合成测序的方法是SOLiD/ABI()正确答案:×20、Sanger测序发现时间早于K.Mullis的PCR()正确答案:√21、DNA测序和蛋白质测序相关技术都获得过诺贝尔奖()正确答案:√22、大规模基因组测序主要有逐步克隆和鸟枪法2种策略()正确答案:√23、传统的生物学研究方法是从表型出发()正确答案:√24、多数遗传性状是由单个基因决定的()正确答案:×25、人类基因组计划是中国人主持的第一个国际项目()正确答案:×26、相同长度序列,蛋白质组的复杂度低于基因的复杂度()正确答案:×27、大数据必然会造福人类正确答案:×28、大数据已经成为我国国家战略正确答案:√29、蛋白质发挥生物学功能依赖于其三维结构正确答案:√30、双端测序与单端测序的区别在于,前者需要在DNA片段的两端分别加上引物和连接子正确答案:√三、填空题1、常见的三大核酸数据库中,位于欧洲的是_________。
生物信息学期末复习题与答案
一、单选题1、总的来说,位于染色体内超过( )个碱基的DNA,构成了人类基因组。
A.30000000000B.3000000000C.300000000D.30000000正确答案:B2、人类镰刀型红细胞贫血症是由于血红蛋白β链N端第6个氨基酸由谷氨酸突变为( )造成的。
A.苏氨酸B.缬氨酸C.赖氨酸D.谷氨酸正确答案:B3、RefSeq数据库是由哪个组织开发和维护的?( )A.NIGB.NCBIC.EMBLD.SIB正确答案:B4、Long non-coding RNA长链非编码RNA是长度大于( )个核苷酸的非编码RNA。
A.150B.250C.300D.200正确答案:D5、tBLASTx分析是用核酸序列检索核酸序列数据库,下列说法正确的是?()A.核酸序列和核酸序列数据库都不需要翻译成蛋白质序列B.只有核酸序列数据库需要翻译成蛋白质序列C.只有核酸序列需要翻译成蛋白质序列D.核酸序列和核酸序列数据库都需要翻译成蛋白质序列正确答案:D6、要搜索编码蛋白质序列的核酸序列,适宜的分析方法是?()A.BLASTxB.BLASTnC.tBLASTnD.BLASTp正确答案:A7、下列对于PCR引物修饰的说法正确的是?()A.PCR引物的5’末端和3’末端均能进行修饰B.PCR引物的5’末端和3’末端均不能进行修饰C.只有PCR引物的5’末端能进行修饰D.只有PCR引物的3’末端能进行修饰正确答案:C8、下列哪个在线分析工具可以预测DNA的外显子-内含子?()A.AugustusB.PLACEC.ORFfinderD.Entrez正确答案:A9、Smith-Waterman动态规划算法矩阵中的每个单元格有几条路径?()A.1B.2C.3D.4正确答案:D10、下列关于Needleman-Wunsch算法和Smith-Waterman算法提出早晚的论述正确的是?()A.Needleman-Wunsch算法提出时间较早B.不确定C.Smith-Waterman算法提出时间较早D.二者提出时间相当正确答案:A11、当分类单元至少为3时,下列对“有根树与无根树的数目”判断正确的是?()A.有根树的数目要少于无根树的数目B.有根树的数目与无根树的数目一样多C.有根树的数目要多于无根树的数目D.二者数目无法判断正确答案:C12、下列哪种算法建树时,选择代价最小或者枝长最短的树?A.最大似然值法B.最大简约法C.邻接法D.UPGMA法正确答案:B二、多选题1、生物信息学是由( )等学科相互交叉而形成的一门新兴学科。
生物信息学考试试题
生物信息学考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种不是常见的生物信息学数据库?()A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中,以下哪个不是用于序列比对的算法?()A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括()A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法?()A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中,用于预测蛋白质功能的方法有()A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中,以下哪个不是测序技术?()A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括()A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言?()A PythonB JavaC C++D Visual Basic9、以下哪个不是生物信息学在医学领域的应用?()A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中,处理大规模数据常用的工具是()A ExcelB R 语言C SPSSD Word二、填空题(每题 2 分,共 20 分)1、生物信息学是一门融合了生物学、计算机科学和()的交叉学科。
2、常见的核酸序列格式有 FASTA 和()。
3、蛋白质的二级结构包括α螺旋、β折叠和()等。
4、基因芯片技术是一种()分析技术。
5、序列比对的目的是寻找两个或多个序列之间的()。
6、人类基因组计划的主要目标是测定人类基因组的()序列。
7、生物信息学中的隐马尔可夫模型主要用于()。
8、系统发生分析中,外群的作用是()。
9、蛋白质相互作用网络分析有助于理解()。
10、生物信息学数据库可以分为一级数据库和()数据库。
生物信息学期末期末复习
■一、选择题:1.以下哪一个是mRNA条目序列号:A.J01536■.NM_15392C.NP_52280D.AAB1345062.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■.UnigeneB.EntrezC.LocusLinkD.PCR3.一个基因可能对应两个Unigene簇吗?■可能B.不可能4.下面哪种数据库源于mRNA信息:■dbESTB.PDBC.OMIMD.HTGS5.下面哪个数据库面向人类疾病构建:A.ESTB.PDB■.OMIMD.HTGS6.Refseq和GenBank有什么区另1J:A.Refseq包括了全世界各个实验室和测序项目提交的DNA序列B.GenBank提供的是非冗余序列■.Refseq源于GenBank,提供非冗余序列信息D.GenBank源于Refseq7.如果你需要查询文献信息,下列哪个数据库是你最佳选择:A.OMIMB.Entrez■PubMedD.PROSITE8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确:A.因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B.搜索结果很可能一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/YB.Q/W/YC.F/W/YD.Q/N/W10.直系同源定义为:■不同物种中具有共同祖先的同源序列B.具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的并且通常是冗余的功能的同源序列11.下列那个氨基酸最不容易突变:A.丙氨酸B.谷氨酰胺C.甲硫氨酸■半胱氨酸12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变:A.1%B.20%■.80%D.250%13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A.全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列B.全局比对允许间隙,而局部比对不允许C.全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列14.假设你有两条远源相关蛋白质序列。
南京工业大学生物信息学期末考试
生工类1301-3《生物信息学》考试说明时间:第17 周周五(6 月17 日)上午3-4 节地点:厚学201题型:(开卷)名词解释5 题20 分,单项选择题10 题20 分,综合分析题4 题60 分。
重点:可参考以下课后题● 2.2 何为一级数据库?有哪些一级数据库?一级数据库属于档案数据库,库中的主要内容是来源于实验室操作所得到的原始数据结果;一级数据库:核酸序列数据库GenBank、EMBL、DDBJ及蛋白质数据库PDB(protein data bank)。
● 2.3 二级数据库、三级数据库等是指什么样的数据库?二级数据库是在一级数据库的信息基础上进行了计算加工处理并增加了许多人为的注释而构成的。
例如,NCBI的RefSeq数据库,其mRNA 序列式综合了GenBank中来源于同一物种相同基因的所有Mrna序列信息的一致性序列;而公共数据库中大多数的蛋白质序列是将核苷酸序列中的编码序列区域进行蛋白质翻译后,通过后续的一些计算分析,主观的人为地为序列加上蛋白质产物名称及功能注释。
三级数据库:参考书本P16页● 2.6 请查阅资料,了解序列信息的标准数据存放格式:FASTA、NBRF/PIR、GDE 和Raw。
书10页到11页● 2.8 GenBank 数据库中的 GenBank 条目包含哪些内容?请结合GenBank 中的一条具体的序列信息加以说明。
书17页到19页● 2.12 蛋白质序列数据库有哪些?书22页● 2.13 Uniprot 数据库分哪几个层次?书22页,分为三个层次。
一是Uniprot Knowledgebase(Uniprot KB)它涵盖大量人工注释的蛋白质信息,包括功能、分类以及数据库的交叉引用等;二是Uniprot Archive(Uniparc)力图收集最完整、最全面的蛋白质序列数据,不过数据没有加以注释整理,只给出了相关序列的来源;三是Uniprot Reference Clusters(UniRef),是将UniParc中的序列数据依据不同的参数条件去除冗余后得到的结果。
生物信息考试题及答案
生物信息考试题及答案一、选择题(每题2分,共20分)1. 基因组学研究的核心是()。
A. 基因克隆B. 基因表达C. 基因组序列D. 基因功能答案:C2. 下列哪项不是生物信息学的主要研究内容?()A. 基因组序列分析B. 蛋白质结构预测C. 植物分类学D. 基因表达分析答案:C3. 转录组学研究的是()。
A. 基因组中的所有基因B. 特定细胞或组织中的所有RNA分子C. 特定细胞或组织中的所有蛋白质分子D. 特定细胞或组织中的所有DNA分子答案:B4. 下列哪个数据库主要用于存储蛋白质序列信息?()A. GenBankB. PDBC. Swiss-ProtD. EMBL答案:C5. 以下哪个不是生物信息学中常用的序列比对工具?()A. BLASTB. FASTAC. ClustalWD. PCR答案:D6. 以下哪个是用于蛋白质三维结构预测的软件?()A. Swiss-ProtB. PDBC. MODELLERD. GenBank答案:C7. 以下哪个是用于基因表达分析的高通量技术?()A. Sanger测序B. 微阵列C. PCRD. 质谱分析答案:B8. 下列哪个是用于基因组关联研究的统计方法?()A. 聚类分析B. 系统发育分析C. 连锁不平衡分析D. 多态性分析答案:C9. 以下哪个是用于蛋白质-蛋白质相互作用网络分析的工具?()A. STRINGB. BLASTC. ClustalWD. GenBank答案:A10. 下列哪个是用于生物信息学数据可视化的工具?()A. R语言B. PythonC. CytoscapeD. Perl答案:C二、填空题(每题2分,共20分)1. 生物信息学是一门结合了__________、__________和__________的交叉学科。
答案:生物学、计算机科学、信息技术2. 基因组学中的“组”指的是__________的集合。
答案:基因3. 转录组学研究的RNA分子包括__________、__________和__________。
生物信息学智慧树知到期末考试章节课后题库2024年温州医科大学
生物信息学智慧树知到期末考试答案章节题库2024年温州医科大学1.生物信息学的发展机遇与挑战并存,大力发展生物信息学学科,培养生物信息学专门人才,使我国逐渐成为生物信息学研究强国,赶超国际先进水平,可能性不大。
()答案:错2.多序列比对特别适合相似程度很小的序列进行比对。
()答案:错3.中国国家基因组科学数据中心(NGDC),与GenBank/EMBL/DDBJ一起被人们并称国际四大核酸数据库。
()答案:对4.Fasta格式的数据比Genbank格式的数据更加详细。
()答案:错5.假基因是指无功能性基因产物的基因。
()答案:对6.AlphaFold预测的蛋白质3D结构可以与冷冻电子显微镜、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。
()答案:对7.Blast算法是一种基于全局序列比对的序列比对算法。
()答案:错8.系统进化树根据是否有外群分为哪些种类()。
答案:有根树###无根树9.下列哪些基因组特性随生物的复杂程度增加而上升?()答案:单个基因的平均大小###基因组大小###基因数量10.通常使用()展示转录组分析结果。
答案:GO和KEGG###韦恩图###热图###火山图11.关于DeepMind公司开发的AlphaFold人工智能系统,以下说法正确的是()。
答案:AlphaFold能够基于氨基酸序列精确地预测许多蛋白质的3D结构###AlphaFold的功能仍在不断提升###AlphaFold系统能够在配体、蛋白质、核酸以及翻译后修饰等方面生成高度精确的结构预测###AlphaFold系统可以帮助科学家识别和设计潜在的药物新分子12.下列哪些调控方式是真核生物基因表达所特有的,而原核生物基因表达不具有的()。
答案:组蛋白修饰13.以下关于PubMed的描述错误的是()。
答案:任何生命科学领域的论文都可以从PubMed下载全文14.答案:己15.在基因组组装中,如何处理测序错误和变异?()答案:使用特定的算法来检测和处理测序错误和变异16.在Linux中,如何复制一个文件?()答案:cp file1 file217.真核生物编码蛋白质的基因核苷酸序列是不连续的,称为()。
生物信息试题及答案
生物信息试题及答案一、选择题(每题2分,共20分)1. 生物信息学的主要研究对象是()。
A. 蛋白质结构B. 基因组序列C. 细胞信号传导D. 生物分子相互作用答案:B2. 以下哪项不是生物信息学的主要任务?()A. 基因预测B. 蛋白质功能预测C. 疾病诊断D. 植物分类学研究答案:D3. 人类基因组计划的主要目标是()。
A. 确定人类基因组中的所有基因B. 确定人类基因组中的所有蛋白质C. 确定人类基因组中的所有核苷酸序列D. 确定人类基因组中的所有代谢途径答案:C4. 以下哪种生物信息数据库不是公共数据库?()A. GenBankB. Swiss-ProtC. PDBD. Myriad Genetics答案:D5. 在生物信息学中,BLAST是一种()。
A. 基因克隆技术B. 基因表达分析软件C. 序列比对工具D. 蛋白质结构预测方法答案:C6. 以下哪种序列分析方法不适用于大规模基因组数据?()A. 多重序列比对B. 单序列比对C. 基因预测D. 基因家族分析答案:B7. 以下哪种技术不是用于蛋白质结构预测的?()A. 同源建模B. 从头预测C. 基因克隆D. 蛋白质折叠模拟答案:C8. 以下哪种生物信息学工具主要用于蛋白质功能预测?()A. PfamB. BLASTC. ClustalWD. Swiss-Prot答案:A9. 以下哪种生物信息学数据库专门存储蛋白质结构数据?()A. GenBankB. Swiss-ProtC. PDBD. KEGG答案:C10. 在生物信息学中,以下哪种数据类型不是高通量数据?()A. 基因表达数据B. 蛋白质组数据C. 代谢组数据D. 单个基因序列答案:D二、填空题(每题2分,共20分)1. 生物信息学是应用__________和__________技术,研究生物大分子结构、功能和相互作用的科学。
答案:计算机;信息技术2. 人类基因组计划完成于__________年。
生物信息学考试试题
生物信息学考试试题1. 选择题1. DNA序列中哪种碱基与腺嘌呤形成碱基对?A. 腺嘌呤B. 胸腺嘧啶C. 钝甲嘧啶D. 尿嘧啶2. 下列哪种不属于生物信息学中常用的序列比对软件?A. BLASTB. ClustalWC. PhotoshopD. MEGA3. 在生物信息学中,什么是基因组装?A. 把基因组序列和蛋白质序列对应起来B. 把已知的DNA序列分析并组装成完整的基因组C. 把DNA序列和RNA序列对比分析D. 把基因组序列转录为RNA序列4. 下列哪个软件主要用于预测DNA序列中的基因结构?A. BLASTB. ClustalWC. FGENESD. MEGA5. 在生物信息学中,什么是密码子?A. DNA序列中的重复单元B. 氨基酸序列C. tRNA分子上的核苷酸组合D. mRNA上的三联体核苷酸序列2. 简答题1. 请简要解释生物信息学在基因组学中的应用。
2. 什么是序列比对?序列比对的意义是什么?3. 解释基因组装和基因注释在生物信息学中的作用。
4. 生物信息学中常用的两种序列分析方法分别是什么?简要描述它们的原理。
5. 请简要介绍生物信息学在进化比较基因组学中的应用。
3. 计算题1. 给定以下两条序列,求它们的相似度:序列1: ATCGTCCGATT序列2: ATCGACCGTTA2. 已知一个DNA序列长度为1000bp,其中AT含量为60%,求该序列中GC含量百分比。
4. 应用题1. 请利用BLAST软件对一组已知DNA序列进行序列比对,并解释结果。
2. 请使用ClustalW对两个已知蛋白质序列进行多序列比对,并分析比对结果。
3. 选取一个基因组装软件,对一个已知基因组序列进行装配,并解释装配结果。
以上是生物信息学考试试题,希望您认真作答,祝您考试顺利!。
生物信息学_华中农业大学2中国大学mooc课后章节答案期末考试题库2023年
生物信息学_华中农业大学2中国大学mooc课后章节答案期末考试题库2023年1.GenBank数据库中斑马鱼(Danio rerio)ptges3a基因和斑猫鲳(Ictaluruspunctatus)ptges3基因,它们编码蛋白质比较一致性是()。
答案:86%2.请查询NCBI数据库中果蝇(Drosophila melanogaster)Cyp6a2基因完整CDS,下列描述错误的是()。
答案:包含3个外显子3.利用PSORT工具分析NCBI数据库中果蝇(Drosophila melanogaster)Cyp6a2基因编码蛋白质亚细胞定位,最大可能定位于()中。
答案:内质网4.查询UniProt数据库中登录号Q60751信息,下列错误的是()。
答案:961-1373区域为胞外区5.下列()不属于三代测序。
答案:Illumina6.UniProt数据库中登录号Q9BRW0蛋白质跨膜区所在位置是()。
答案:216-2347.NCBI数据库中人的CDC25基因(登录号L26584),利用其蛋白质序列在UniProt数据库中用系统默认矩阵检索,可以在Rat中检索到蛋白质()的序列是通过实验获得的。
答案:P288188.GenBank登录号L26584基因,其编码蛋白质用ProtParam工具分析其()氨基酸占比最高。
Leu9.下列()属于GEO数据类型。
答案:SAGEChIP-seqRNA-seqSNP array10.下列关于GenBank登录号AB447483描述正确的是()。
答案:其编码蛋白质可能参与硅转运其CDS包含1425bp2008-JUL-14首次向NCBI提交11.GenBank数据库中斑马鱼(Danio rerio)ptges3a基因,下列描述正确的是()。
该基因位于第23号染色体上该基因曾用名为cPGES-1该基因含有一个STS标记12.查询UniProt数据库中登录号Q60751信息,下列描述正确的是()。
生物信息学(期末)-生技08
齐齐哈尔大学试卷考试科目: 生物信息学适用对象: 生物技术08本使用学期: 2011—2012—1 第七学期课程编码: 05113019 总分80分共 2 页1)考生须知:2)姓名必须写在装订线左侧, 其它位置一律作废。
3)请先检查是否缺页, 如缺页应向监考教师声明, 否则后果由考生负责。
4)答案一律写在答题纸上, 可不抄题, 但要标清题号。
5)用蓝色或黑色的钢笔、圆珠笔答题。
监考须知: 请将两份题签放在上层随答题纸一起装订。
一、名词解释(每小题3分, 共4小题12分)表达序列标签, 外类群, 开放阅读框, 蛋白质组学二、选择题(每小题1分, 共10小题10分)1.下列哪项不属于人类基因组计划的研究内容()A.绘制化学图谱、物理图谱B.获得全部人类基因组的序列C.获得转录图谱D.获得人体内全部的蛋白质序列2.图中哪一项为直系同源()A.HA1和HA2B.HA1和WA2C.HA1和HBD.WA1和WA23.下列软件中哪一个能够用来构建系统发育树的()A CLUSTALB BLASTC AssemblerD Treeview4.核酸序列增长最快是在哪一时期()A 1970-1980年B 1980-1990年C 1990-2000年D 2000-2008年5. 研究一条测序获得的DNA序列时首先需要()A.屏蔽重复序列B.去除序列污染C.查找开放阅读框D.查找密码子偏好性6. 对于序列ATGCCCCGA和序列ATCCGA哪一种是正确的序列对位排列方式()A ATGCCCCGAAT_CC__GAB ATGCCCCGAAT_CCG__AC ATGCCCCGAAT_CC_G_AD ATGCCCCGAAT_C__G_A7.BLAST系列软件与下列哪一项能够在同一网站中检索到()A GeneBank数据库B DDBJ数据库C EMBL数据库D CLUSTAL W8.生物信息学数据以什么形式存储()A.文件系统B.程序软件C.数据库D.手工管理9.下列陈述哪一项是错误的()A PIR-PSD是国际上最大的蛋白质序列数据库B 数据库的检索分为关键词检索和序列检索C STS是基因组作图时常用的一种图标D ACeDB仅储存秀丽新小杆线虫数据10.在使用CLUSTAL软件进行比对时, 多序列的比对结构中几条序列都相同的核苷酸位点用什么标注()A 不同的颜色B “*”C “-”D “_”三、判断题(每小题1分, 共10小题10分, 对的画“√”, 错的画“×”)1.华盛顿大学的Phred软件是用来处理数据冗余的()2.NCBI网站不能用来查询文章()3.CLUSTAL X有汉化版()4.EcoCyc是大肠杆菌的知识体系数据库系统()5. 文昌鱼是人类的五种模式生物之一()6.生物信息学研究物种信息, 不包括序列()7.研究一条测序获得的DNA序列时首先应该去除污染序列()8.双向凝胶电泳技术是蛋白质组研究的关键技术()9.CAP3是EST序列的拼接软件()10.氨基酸的顺序决定蛋白质的构象,即蛋白质的一级结构决定蛋白质的二级结构。
河南农业大学《生物信息学》2020-2021学年第一学期期末试卷
河南农业大学《生物信息学学 2020-2021学年第一学期期末试卷《《《《《《《《《《《生物信息学》院/系——年纪——专业——姓名——学号——《《《一.选择题(每2分,共20分)1.《物信息学学主要关注的是(《)。
A.《物信大分子的合成B.《物信数据的收集、存储、分析和解释C.《物信系统的物态学关系D.《物信分子的信理性质2.《下列哪个不是物信息学学的主要应用领域?A.《基因组学B.《转录组学C.《蛋白质组学D.《分子物信学实验技术3.《在物信息学学中,用于描述物信序列中特定区域的特性的语言称为(《)。
A.《序列分析B.《序列比对C.《序列模式D.《序列注释4.《在进行基因组分析时,通常使用的数据库是(《)。
A.《PubMedB.《GenBankC.《PDBD.《UniProt5.《物信息学学中,BLAST是一种常用的(《)。
A.《序列比对工具B.《结构模拟软件C.《蛋白质功能预测方法D.《基因调控网络分析工具6.物信息学学是(《)。
《A.《研究物信大分子合成和降解的学科《B.《专门研究基因编辑技术的学科《C.《物信学与计算机科学的交叉学科,主要关注物信数据的收集、管理和分析《D.《研究物信进化历史的学科7.在物信息学学中,用于描述DNA序列中基因位置的数据库通常是(《)。
《A.《UniProt《B.《PDB《C.《Ensembl《D.《KEGG8.BLAST是一个常用的(《)。
《A.《蛋白质三维结构模拟软件《B.《基因表达谱分析工具《C.《局部序列比对搜索工具《D.《基因组组装软件9.下列哪个不是物信息学学在基因组学中的主要应用?(《)《A.《基因定位《B.《基因表达分析《C.《蛋白质结构预测《D.《基因编辑实验设计10.物信息学学中,用于预测蛋白质功能的常见方法不包括(《)。
《A.《序列比对《B.《结构域分析《C.《蛋白质-蛋白质相互作用网络《D.《分子物信学实验二、填空题(每题2分,共10分)1.《在物信息学学中,用于存储和检索核酸序列的数据库是___________。
中科院生物信息学期末考试复习题
中科院生物信息学期末考试复习题中科院生物信息学期末考试复习题润生老师部分:1.什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要?答:生物信息学有三个方面的含义:1)生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面,是基因组研究不可分割的部分。
2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。
3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。
它是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。
生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA 基因的编码区;同时阐明基因组量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律:在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白谱数据,从而认识代、发育、分化、进化的规律。
同时在发现了新基因信息之后,其还利用基因组中编码区信息进行蛋白空间结构模拟和蛋白功能预测,并将此类信息与生物体和生命过程中的生理生化信息结合,阐明其分子机制,最终进行蛋白、核酸分子设计、药物设计、个体化医疗保健设计。
2.如何利用数据库信息发现新基因,基本原理?答:利用数据库资源发现新基因,根据数据源不同,可分2种不同的查找方式:1)从大规模基因组测序得到的数据出发,经过基因识别发现新基因:(利用统计,神经网络,分维,复杂度,密码学,HMM,多序列比对等方法识别特殊序列,预测新ORF。
但因为基因组中编码区少,所以关键是“数据识别”问题。
)利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因对比,从而确定是否为新基因。
生物信息学期末复习题
9)预测基因的一般步骤是什么?答案:⑴获取DNA目标序列⑵查找ORF并将目标序列翻译成蛋白质序列,利用相应工具查找ORF并将DNA序列翻译成蛋白质序列⑶在数据库中进行序列搜索,利用BLAST进行ORF核苷酸序列和ORF翻译的蛋白质序列搜索⑷进行目标序列与搜索得到的相似序列的全局对比⑸查找基因家族进行多序列比对,获得比对区段的基因家族信息⑹查找目标序列中的特定模序,分别在Prosite、BLOCK、Motif数据库中进行profile、模块(block)、模序(motif)检索⑺预测目标序列蛋白质结构,利用PredictProtein(EMBL)、NNPREDICT等预测目标序列的蛋白质二级结构。
15)在基因组序列分析方面,科学家关注哪些信息?答案:就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。其余97%是非编码序列。对于非编码序列,人们了解得比较少,尚不清楚其含义或功能。然而,非编码区域对于生命活动具有重要的意义。这部分序列主要包括内含子、简单重复序列、移动元件(mobile element)及其遗留物、伪基因(pseudo gene)等。
3)简要介绍FASTA序列格式答案:FASTA格式,又叫Pearson格式,是最简单的,使用最多的格式。它的基本形式分为三个部分:⑴第一行:大于号(﹥)表示一个新的序列文件的开始,为标记符。后面可以加上文字说明,gi号,GenBank检索号,LOCUS名称等信息。⑵第二行:序列本身,为DNA的标准符号,通常大小写均可。⑶结束:无特殊标志,但建议多留一个空行,以便将序列和其他内容区分开。
16)为什么要进行序列片段组装?在进行序列片段组装时会遇到哪些问题?答案:大规模基因组测序得到待测序列的一系列序列片段,这些序列片段覆盖待测序列,序列片段之间也存在着相互覆盖或者重叠。遇到的问题:碱基标识错误;不知道片段的方向;存在重复区域;缺少覆盖。
生物信息学试题及答案
生物信息学试题及答案一、单项选择题(每题2分,共20分)1. 生物信息学的主要研究对象是()。
A. 生物数据B. 生物实验C. 生物模型D. 生物技术答案:A2. 下列哪项不是生物信息学中的常用数据库()。
A. GenBankB. Swiss-ProtC. PubMedD. Google Scholar答案:D3. 蛋白质序列比对的主要目的是()。
A. 确定蛋白质的三维结构B. 预测蛋白质的功能C. 比较蛋白质的氨基酸序列D. 计算蛋白质的分子量答案:B4. 在生物信息学中,以下哪种算法不是用于序列比对的()。
A. BLASTB. FASTAC. Smith-WatermanD. Hidden Markov Model答案:D5. 下列哪种生物信息学工具主要用于基因表达分析()。
A. ClustalWB. Primer3C. R语言D. PDB答案:C6. 以下哪种技术不是用于蛋白质结构预测的()。
A. 同源建模B. 从头预测C. 序列比对D. 折叠识别答案:C7. 以下哪种生物信息学工具主要用于基因组注释()。
A. BLASTC. GATKD. Primer3答案:B8. 在生物信息学中,以下哪种方法不用于基因表达数据的聚类分析()。
A. K-meansB. Hierarchical clusteringC. Principal component analysisD. Multiple sequence alignment答案:D9. 下列哪种生物信息学工具主要用于蛋白质-蛋白质相互作用网络分析()。
A. STRINGB. BLASTD. Primer3答案:A10. 在生物信息学中,以下哪种数据库不包含蛋白质结构信息()。
A. PDBB. UniProtC. RCSBD. GenBank答案:D二、多项选择题(每题3分,共15分)11. 生物信息学中常用的序列比对工具包括()。
A. BLASTB. FASTAC. ClustalWD. Pfam答案:ABC12. 以下哪些是生物信息学中常用的基因表达分析软件()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
暨南大学考试试卷
注意:
1. 本考试只有相对正确的答案,无论你如何作答,只要写出足够强的论证的理由和过程来
支撑你的观点,并且不违反课程内讲授的基本原理,即算正确。
2. 考试形式为机考,请自备电脑。
回答可直接写在本文件里,要写出过程和明确的结论。
最终答卷以PDF形式现场提交以避免乱码和篡改,文件名请统一命名为“学号-姓名.pdf”,例如2013042213-张三.pdf。
不按此格式命名文件名者将一律没有成绩!
3. 考试完毕,请用U盘将写好的报告PDF文档拷到监考老师的电脑上,或于考试结束后
15分钟内发邮件至zhanggong@,注明主题“期末考试”。
4. 本试卷分为4小题,各题分数分别为20、30、30、20 分,满分100分。
人卵细胞受精到胚胎发育极早期,经历如下阶段:
-卵细胞(oocyte)
-前核(pronuclei)
-受精卵(zygote)
-2-细胞期
-4-细胞期
-8-细胞期
-桑椹胚(morula)
为研究在发育过程中的转录调控,研究者对以上时期的细胞进行了单细胞测序。
测序仪使用Illumina HiSeq-2000,采用双端100nt测序方式。
测序数据的第一端用FANSe2算法云分析平台进行一键式定量分析,得到28个基因表达定量文件(*_SVmerge.txt)。
请通过推理和分析,回答以下问题:
1.真核生物中,同一个基因往往可以通过可变剪切的方式,生成若干个不同的
剪切变体。
请问云平台分析的这批数据,是如何处理同一基因的不同剪切变体的?这种测序方式有没有可能定量不同的剪切变体?为什么?
暨南大学《生物信息学(本科生版)》试卷考生姓名、学号:
2.Oocyte, zygote, pronuclei, morula阶段都做了生物学重复,请问其重复性好不
好?如果不好,有哪些因素会造成重复性不好?会不会影响结论?
3.发育生物学课本上就已经说道,2-细胞期、4-细胞期、8-细胞期的每一个细胞
都不一样。
受精卵已有植物极和动物极之分,在第一次卵裂的2-细胞期中,植物极和动物极被分开;然后继续进行两次纵向卵裂,形成上部4个动物极细胞和下部8个植物极细胞。
将来动物极细胞发育成外胚层,植物极细胞发育成内胚层。
也就是说,一个胚胎的若干个细胞之间就有不同,其转录组应该有不同。
那么,同期的细胞之间差异大,还是不同期之间差异大?这些差异是由发育阶段所致,还是由于单细胞测序的随机性误差所致?
4.哪些基因是“管家基因”(housekeeping gene),哪些基因是只在未受精卵细胞中
有表达的?这两部分基因的mRNA长度分布有没有统计学意义上的差别?
(RefSeq-RNA数据库里面所有的mRNA序列都在Human_hg19_refMrna20150317.fa文件中)。