生物信息学考试复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
——古A.名词解释
1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。
2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。
3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。
4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。
5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。
6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。
7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。
8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。
9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。
10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。
11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。
12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。
13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。
14. 非编码RNA:是指没有编码蛋白质功能的所有RNA,它缺乏ORF,常有编码蛋白质的基因反义转录而来。
15. miroRNA:是含有茎环结构的miRNA前体,经过Dicer加工之后的一类非编码的小RNA分子(21-23 nt)。
16.RNAi:是指在进化过程中高度保守的、由双链RNA(double-stranded RNA,dsRNA)诱发的、同源mRNA高效特异性降解的现象。是一种转录后水平的基因沉默(PTGS)B.简答题
1.生物信息学研究内容。
答:(1)生物信息的收集、存储、管理和提供。(2)基因组序列信息的提取和分析。(3)功能基因组分析。(4)生物分子设计。(5)药物设计。(6)生物信息分析的技术与方法研究。(7)应用与发展研究。(8)系统生物学研究。
2.生物信息学的应用。
答:(1)人类基因组计划。(2)人类蛋白质组计划。(3)新药开发中的应用。(4)基因芯片。(5)医学应用。
3.已测序五个植物物种,属名加种名。
答:(1)Solanum tuberosum 马铃薯(2)Musa acuminata banana 香蕉(3)Solanum lycopersicum 番茄(4)Zea mays 玉米(5)Oryza sativa 水稻(6)Arabidopsis thaliana
拟南芥(7)Vitis vinifera 葡萄(8)Brassica rapa 白菜
4.已测序五个动物物种,属名加种名。
答:(1)Homo sapiens 人(2)Danio rerio 斑马鱼(3)Mus musculus 小鼠
(4)Drosophila melanogaster 黑腹果蝇(5)Caenorhabditis elegans 秀丽隐杆线虫(6)Felis catus 猫(7)Gallus gallus 鸡(8)Apis mellifera 蜜蜂
5.画图阐述原核生物基因结构。
6.画图阐述真核生物基因结构。
7.核酸序列分析的应用。
答:(1)常规分析:A.核酸序列检索B.核酸序列组分分析C.序列变换D.限制性酶切分析E.序列注释(2)比对分析:A.BLAST比对B.双序列比对C.多序列比对(3)基因结构的识别:A.ORF识别及其可靠性验证B.重复序列分析C.非编码区及启动子分析D.其它调控位点分析:a.转录因子结合位点分析b.剪接位点分析。
8.如何做比对分析(BLAST)?
答:(1)进入NCBI主页,点击BLAST进入BLAST主页。(2)选择需要比对的类型BLASTN BLASTP BLASTX tBLASTN tBLASTX (3)在序列框中输入需要比对的序列。(4)选择数据库。(5)开始比对。
9.基因结构识别包括哪些内容?
答:(1)ORF识别及其可靠性验证(2)非编码区及启动子区分析(3)基因组重复序列分析(4)其它调控位点分析:a.转录因子结合位点分析b.剪接位点分析。
10.蛋白质序列的基本性质分析包括哪些内容?
答:(1)理化性质分析(2)亲水性/疏水性分析(3)跨膜区分析(4)信号肽预测(5)Coil 区分析(6)亚细胞定位(7)结构功能域分析
11.蛋白质空间结构怎么预测,二级/三级。
答:(1)二级结构预测:使用SSPro 4.0或PORTER进行分析预测。
(2)三级结构预测:主要方法有同源模建、折叠识别和从头预测。目前主要使用同源模建的方法来预测蛋白质三级结构,但是需要二个蛋白质序列同源性高于35%,低于30%结构不理想。具体步骤为,a.进入SWISS-MODEL主页b.选择Automated Mode进入c.在序列框中输入蛋白质序列d.确认进行预测
12.如何判断一个新的基因?
答:(1)从一个新蛋白质序列开始,通过tBLASTn搜索核酸数据库,找到相应的匹配,如果是和DNA编码的已知蛋白质匹配,则可能不是新的基因;但是如果找到与DNA编码的相关蛋白质的匹配,则有可能是新的基因。
(2)然后进一步通过BLASTx或BLASTp在核酸,蛋白数据库中搜索DNA或蛋白质序列来进一步确定新的基因。
13.进化树构建过程,方法。
答:(1)进行多序列比对,确定序列之间的相似性。(2)选择合适的建树方法。a.序列有很