生物信息学考试复习

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

．名词解释
生物信息学：广义是指从事对基因组研究相关的生物信息的获取，加工，储存，分配，

基因芯片：将大量已知或未知序列的DNA片段点在固相载体上，通过物理吸附达到固
cDNA芯片），也可以在固相表面直接化学合成，得到寡聚核苷酸芯片。再将待研究
经过计算机扫描和数据处理，进行定性定量的分析。可以反映大量基因

：National Center for Biotechnology Information.是隶属于美国国立医学图书
NLM）的综合性数据库，提供生物信息学方面的研究和服务。
：European Molecular Biology Laboratory.EBI为其一部分，是综合性数据库，

简并引物：PCR引物的某一碱基位置有多种可能的多种引物的混合体。
序列比对：为确定两个或多个序列之间的相似性以至于同源性，而将它们按照一定的规

：Basic Local Alignment Search Tool. 是通过比对(alignment)在数据库中寻找
(query)相似度很高的序列的工具。
：Open Reading Frame.由起始密码子开始，到终止密码子结束可以翻译成蛋白质
6个ORF。
启动子：是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动
-35区（Sextama box）TTGACA，
区（Pribnow Box）TATAAT，以及+1区。真核生物启动子包括远上游序列和启动子基
启动子基本元件包括启动子上游元件（GC岛，CAAT盒），核心启动子（TATA
，+1区帽子位点）组成。
motif：模体，基序，是序列中局部的保守区域，或者是一组序列中共有的一小段序列

分子进化树：通过比较生物大分子序列的差异的数值重建的进化树。
相似性：序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残

同源性：两个基因或蛋白质序列具有共同祖先的结论。
非编码RNA：是指没有编码蛋白质功能的所有RNA，它缺乏ORF，常有编码蛋白质的

miroRNA：是含有茎环结构的miRNA前体，经过Dicer加工之后的一类非编码的小
分子（21-23 nt）。
：是指在进化过程中高度保守的、由双链RNA(double-stranded RNA，dsRNA)
mRNA高效特异性降解的现象。是一种转录后水平的基因沉默（PTGS）
．简答题
生物信息学研究内容。
（1）生物信息的收集、存储、管理和提供。（2）基因组序列信息的提取和分析。（3）
（4）生物分子设计。（5）药物设计。（6）生物信息分析的技术与方法研
（7）应用与发展研究。（8）系统生物学研究。
生物信息学的应用。
（1）人类基因组计划。（2）人类蛋白质组计划。（3）新药开发中的应用。（4）基因芯
（5）医学应用。
已测序五个植物物种，属名加种名。
（1）Solanum tuberosum 马铃薯（2）Musa acuminata banana 香蕉（3）Solanum
番茄（4）Zea mays 玉米（5）Oryz

a sativa 水稻（6）Arabidopsis thaliana
7）Vitis vinifera 葡萄（8）Brassica rapa 白菜
已测序五个动物物种，属名加种名。
（1）Homo sapiens 人（2）Danio rerio 斑马鱼（3）Mus musculus 小鼠
4）Drosophila melanogaster 黑腹果蝇（5）Caenorhabditis elegans 秀丽隐杆线虫
6）Felis catus 猫（7）Gallus gallus 鸡（8）Apis mellifera 蜜蜂
画图阐述原核生物基因结构。
画图阐述真核生物基因结构。
核酸序列分析的应用。
（1）常规分析：A.核酸序列检索B.核酸序列组分分析C.序列变换D.限制性酶切分析E.
2）比对分析：A.BLAST比对 B.双序列比对 C.多序列比对（3）基因结构的识
A. ORF识别及其可靠性验证 B.重复序列分析 C.非编码区及启动子分析 D.其它调控位
a.转录因子结合位点分析 b.剪接位点分析。
如何做比对分析（BLAST）？
(1)进入NCBI主页，点击BLAST进入BLAST主页。（2）选择需要比对的类型 BLASTN
（3）在序列框中输入需要比对的序列。（4）选择
（5）开始比对。
基因结构识别包括哪些内容？
（1）ORF识别及其可靠性验证（2）非编码区及启动子区分析（3）基因组重复序列分
4）其它调控位点分析：a.转录因子结合位点分析b.剪接位点分析。
蛋白质序列的基本性质分析包括哪些内容？
（1）理化性质分析（2）亲水性/疏水性分析（3）跨膜区分析（4）信号肽预测（5）Coil
6）亚细胞定位（7）结构功能域分析
蛋白质空间结构怎么预测，二级/三级。
（1）二级结构预测：使用SSPro 4.0或PORTER进行分析预测。
2）三级结构预测：主要方法有同源模建、折叠识别和从头预测。目前主要使用同源模建
35%，低于30%结构
a.进入SWISS-MODEL主页b.选择Automated Mode进入c.在序
d.确认进行预测
如何判断一个新的基因？
（1）从一个新蛋白质序列开始，通过tBLASTn搜索核酸数据库，找到相应的匹配，如
DNA编码的已知蛋白质匹配，则可能不是新的基因；但是如果找到与DNA编码的

2）然后进一步通过BLASTx或BLASTp在核酸，蛋白数据库中搜索DNA或蛋白质序列

进化树构建过程，方法。
（1）进行多序列比对，确定序列之间的相似性。（2）选择合适的建树方法。a.序列有很
选择最大简约法(MP)。b.序列较高的相似性时，选择距离法，包括邻接法(NJ)。
序列相似性很低，选择最大似然法(ML)。（3）使用软件建树。a.选择MP法，使用PAUP、
、或PHYLIP。b.选择NJ法，使用PHYLIP、MEGA、或ClustalX。c.选择ML法，
PHYML或BioEdit。（4）用软件评估进化树。
的原理。
（1）外源进入生物体的双链RNA（dsRNA）被一种核糖核酸酶Dicer所识别并将其切
21~23nt的小干扰RNA（siRNA）。（2）这种siRNA可以被RISC（RNA诱导的沉默
siRNA发生解旋和解链。（3）

然后再siRNA反义链的引导
siRNA具有同源序列的内源靶mRNA。（4）RISC与内源靶mRNA同源区进行
mRNA，导致转录后基因沉默。（5）siRNA不仅能引导RISC切割
mRNA，而且可作为引物与靶mRNA结合并以mRNA为模板，在RdRP（RNA依赖的
聚合酶）作用下合成更多新的dsRNA，新合成的dsRNA再由Dicer切割产生大量次
siRNA，从而使RNAi的作用放大，最终将所有靶mRNA降解，导致基因的完全沉默。
载体构建过程。
高效siRNA设计步骤。
（1）靶基因鉴定（2）建立分析（3）序列过滤（4）序列翻译分析（5）获得序列（6）
7）选取序列（8）合成siRNA。
给定miRNA序列，怎么研究其功能？
（1）上调miRNA在细胞中的含量而获得gain-of-function模型，具体可以将miRNA
RNA的特殊载体中。（2）下调miRNA在细
miRNA的功能获得loss-of-function模型。结合上调和下调结果
miRNA的调控。
．论述题
构建表达载体：①融合表达载体GUS GFP，并说明用途。
A. GUS基因编码β-葡萄糖酸酶，能够催化底物产生荧光物质或者蓝色产物。可以利用
基因与目的基因融合表达来筛选转化子，也可用于外源基因表达产物在转化生物体中
B.GFP基因编码绿色荧光蛋白，在紫外光照射下发出荧光。可以利用GFP基
筛选转化子，也

．构建步骤：(1)对目的基因cDNA和GUS，GFP进行限制性酶切分析，找出目的基因编
GUS基因编码区，GFP编码区中的酶切位点，排除这些酶切位点。
2）选择合适的载体，如pET系列（原核）或者pCAMBIA 系列（植物）等，并找出被
3个酶切位点。
3）设计引物扩增目的基因，GUS基因，GFP基因，如果没有选择的酶切位点，则在引物
融合表达在前的基因终止密码子在设计引物时去掉，二个基因连接区要保
ORF框架即起始密码子前扩增区段要保证为3联体密码。
4）先连接目的基因与GFP或者GUS，再将融合基因与载体连接。
怎么样降低，升高基因的表达。
A.降低基因表达：设计siRNA干涉该基因的表达。
（1）选择欲干涉的靶基因的片段位置，并列出候选siRNA序列。
2）评估候选siRNA序列，如SNP，形式功能，高级结构等。
3）进行BLAST比对，排除与非靶基因互补的候选siRNA序列。
4）从功能特异性角度出发，选择最终siRNA序列。
5）合成siRNA，包括化学合成，体外转录，构建表达载体等。
6）转入生物体内。
7）检测干涉情况。
升高基因表达：将该基因转入含有病毒强启动子的载体中使基因超表达。（以植物为例）
（1）选择超表达载体，即含有病毒强启动子的表达载体。
2）对目的基因进行限制性酶切分析，排除目的基因编码区具有的酶切位点，选择合适载

3）设计引物扩增目的基因，引入酶切位点。
4）将目的基因连

接到超表达载体上。
5）转化，农杆菌转染（植物）。
6）检测表达情况。
引物设计的原则？
（1）引物长度。15~30bp。
2）引物的特异性。引物应在核酸序列保守区内设计。
3）引物的碱基分布。引物4种碱基分布随机，3‘端避免出现3个以上连续的G或C。
4）引物的互补情况。避免引物二聚体和发夹结构的产生。
5）引物的修饰情况。引物5’端加修饰，3‘端不能修饰。
6）产物的二级结构。引物设计避开DNA单链二级结构。
7）引物的GC含量。GC含量40%~60%。
8）引物Tm值。Tm值72℃左右。
9）引物ΔG值。引物3’端ΔG值较低，5‘、中间ΔG值较高。
10）密码子的简并。3‘端不要终止在密码子的第三位。
一个未知基因的DNA序列，设计分析这个序列的流程，以及方法，鉴定其功能，翻译出

（1）使用DNAMAN，BioEdit统计基本指标。（2）使用Transeq，Translate Tool ，
Finder对该序列进行6个框架的翻译。（3）对6个ORF翻译序列或者核苷酸序列在
BLAST）（4）通过多序列比对查找基因家族
未知氨基酸序列，设计分析步骤，鉴定属于哪个家族。
含有5‘-UTR，3‘-UTR，EXON, INTRON的序列，手动设计引物，写出PCR体系，算