基因组学,复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“基因组学”精要
第1章 基因组学概论
基因组学:研究基因组的组成与功能的生物学分支学科
结构基因组学:以全基因组测序为目标的基因结构研究,通过基因组作图、可算序列分析来确定基因组成、基因定位的科学。
功能基因组学:利用结构基因组学提供的信息,以高通量大规模实验方法,及统计与计算机分析为特征,全面系统地分析全部基因功能学科
1、简述基因组学研究的意义?
a)基因组学已经成为现代生命科学的核心领域,催生了许多新兴的生命科学的分支
学科与交叉学科,如功能基因组学、进化基因组学等;
b)基因组结构域功能的解读可为医学、健康、农业、林业、畜牧业与医药工业的发
展和技术创新提供理论依据。
c)基因组学的研究涉及众多领域,尤其是在人类疾病基因的研究,发挥了十分重要
的作用。
d)疾病的遗传学基础;
e)对于致病基因及相关基因的克隆在基因组学研究中占据着核心的位置;
f)对疾病的预防、诊断、治疗都有重要意义。
第2章 遗传图绘制
遗传作图:采用遗传学分析方法,将基因或其他DNA分子标记标定在染色体上构建遗传连锁图的作图方法。
物理作图:采用分子生物学技术,直接将DNA分子标记、基因或克隆标定在基因组的实际位置所构建位置图的作图方法。
1、简述构建遗传图谱的基本原理?
2、为何要绘制遗传图与物理图?
1)基因组太大,必需分散测序,然后将分散的顺序按原来位置组装,需要图谱进行指导。
2)基因组存在大量重复顺序,会干扰排序,因此要高密度基因组图。
3)遗传图和物理图各有优缺点,必须相互整合校正。
3、简述DNA标记的类型及其特点?
①限制性片段长度多态性标记(RFLP):a.处于染色体上的位置相对固定;b.同一亲
本及其子代相同位点上的多态性片段特征不变;c.同一凝胶电泳可显示同一位点的不同多态性片段,具有共显性特点。
②简单序列长度多态性(SSLP):多等位性,每个SSLP都有多个长度不一的变异体。
包括可变串联重复(VNTR)也叫小卫星序列,和简单串联重复序列(SSR)也叫微卫星序列。
③单核苷酸多态性(SNP):a.在同一个体中,常常以纯合状态存在;b.对某一特定的
SNP,同一家系中的成员可能有相同的基因型;c.SNP分子标记分布密集,数量极大。
4、为什么会产生限制性片段长度多态性(RFLP)?
由于同源染色体同一区段DNA序列的差异,当用限制酶处理时,可产生长度不同
的限制性片段。
这些DNA片段经琼脂糖凝胶电泳分离,可直接显示不同个体同一位点DNA组成的差异。
限制酶识别的碱基序列具有专一性,所以用不同的限制酶处理同一DNA样品可产生与之对应的不同限制性片段,可提供大量位点多态性信息。
5、为什么基因组测序需要图谱?如果没有一个基因组图谱,在获得基因组序列过程
中的主要困难是什么?
因为DNA测序每次仅能读取不到1000bp的长度,为了获取全基因组序列,我们要
将测序的到的小片段排列组装。
为了找到各个片段的正确位置,避免出错,所以进行
基因组作图绘制基因组图谱,进而将序列小片段对号入座。
如果没有图谱,难以讲的达到的DNA小片段拼接组装成完整的全基因组序列。
第3章 物理图绘制
作图试剂:STS作图过程中用到的可覆盖待研究的染色体或基因组的DNA片段群。
(STS标记和作图用的染色体区段以及DNA克隆。
)
限制性作图:将限制性酶切位点标定在DNA分子的相对应位置。
基因组物理图:采用分子生物学技术,直接将DNA分子标记、基因或克隆标定在基因组的实际位置,所构建的位置图称为物理图。
1、什么是基因组物理图? 物理图与遗传图有何不同?
采用非基因遗传重组的方法,以DNA碱基序列为图距单位绘制的为染色体上的基因线性排列次序的图谱。
2、什么是酵母人工染色体 YAC?它有什么缺陷?请说明 YAC 载体各组成部件的功能?
酵母人工染色体(YAC):一种能够克隆长达200kb-1700kb DNA片段的载体,含有酵母细胞中必需的端粒、着丝点和复制起始序列,是细胞内具有遗传性质的物体,易被碱性染料染成深色。
缺陷:a.插入子的稳定性问题;b.同一酵母细胞多个YAC引起交换产生嵌合序列;
c.对人类基因组富含GC区的克隆效率比较低。
基本部件:a.着丝粒,在细胞分裂时负责染色体均等分裂;b.端粒,位于染色体端部的特异DNA序列,保持人工染色体的稳定性;c.自主复制序列,在细胞中启动染色体的复制。
3、什么是重叠群? 如何构建重叠群?
相互重叠的DNA片段组成的物理图,称为重叠群。
染色体步移法构建重叠群:a.从基因组文库中挑取一个指定的或随机的克隆,将该起始克隆的末端序列分离纯化作为探针;b.在基因组文库中寻找与之重叠的第二个克隆;c.在第二个克隆的基础上按照同样的操作程序寻找第三个克隆;d.依次延伸,直到完成所需要的重叠群。
4、如何采用DNA指纹绘制重叠群?
通过计算机对酶切片段的扫描识别,可对BAC克隆进行大范围的指纹比对和排列,由此可快速构建指纹重叠群。
第4章 基因组测序与序列组装
1、链终止法测序的原理是什么?
通过合成与单链DNA互补的多核苷酸链来读取待测DNA分子序列,合成的互补单
链可在不同位置随机终止反应。
其反应体系包含单链模板、引物、4种dNTP和DNA聚合酶,分四组进行,每组按
一定比例加入一种2 ’ ,3’双脱氧核苷三磷酸,它能随机掺入合成的DNA链,一旦
掺入合成即终止,于是各种不同大小片段的末端核苷酸必定为该核苷酸,经测序胶电泳,可从自显影图谱上直接读出DNA序列。
2、第二代Solexa测序基本流程是什么?
1)测序文库的构建(Library Construction)
提取DNA并片段化,单端测序片段长度150-200bp,双端测序长度推荐300-500bp, 然后加上接头。
2)锚定桥接(Surface Attachment and Bridge Amplification)
Solexa测序的反应在叫做flow cell(流动槽)的玻璃管中进行,flow cell又
被细分成8个Lane ,每个Lane的内表面有无数的被固定的单链接头。
上述步骤得
到的带接头的DNA 片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以
供后续的预扩增使用。
3)预扩增(Denaturation and Complete Amplification)
添加未标记的dNTP 和DNA聚合酶进行固相桥式PCR 扩增,单链桥型待测片段被
扩增成为双链桥型片段。
通过变性,释放出互补的单链,锚定到附近的固相表面。
通
过不断循环,将会在flow cell 的固相表面上获得上千万甚至上亿条成簇分布的双链
待测片段。
4)单碱基延伸测序(Single Base Extension and Sequencing)
3、什么是物理间隙? 什么是序列间隙? 如何填补这两类间隙?
物理间隙:指构建基因组文库时被丢失的DNA序列他们从已有的克隆群体中永久性的消失。
(填补:a. 利用一个不同的载体重新构建一个基因文库,以间隙两侧重叠群末端序列作为探针筛选第二个文库;b.PCR法,将不同重叠群末端序列作为引物两两配组扩增基因组DNA。
)
序列间隙:指测序时遗漏的序列,这些序列仍然保留在尚未挑选到的克隆中。
(填补:a.收集所有已知间隙两侧的序列;b.根据间隙练歌的序列时设置专一性探针,从基因组文库中筛选阳性克隆;c.根据间隙两侧已知的序列设置专一性PCR引物,随后直接从阳性克隆中扩增,再进行克隆和测序。
)
4、作图法测序组装和全基因组鸟枪法测序序列组装的基本流程,可结合图示解释。
作图法测序组装
全基因组鸟枪法
第5章 基因组序列注释
开放阅读框ORF:由一系列指令氨基酸密码子组成,包括一个起始密码子和一个终止密码子。
测序深度:测序得到的碱基总量与基因组大小的比值,是评价测序量的指标之一。
1、基于同源性搜索的基因功能注释优缺点是什么?有哪些主要注释方法?
优点:基于已有的生物学数据,因此结果更有生物学意义
缺点:受限于已有的生物学数据、数据库可能存在的误差、对于相似度应如何定义。
主要注释方法:a. GO 功能注释:b.KEGG数据库的注释。
2、相对于其他功能元件,蛋白编码基因为什么更容易被鉴定?
3、简述获得siRNA序列的方法有哪些及各自的优缺点?
第6章 基因组解剖
等高线:指基因组中具有较均一的相似比例碱基组成的连续 DNA 序列,它们在基因组中成片相嵌排列。
CpG岛:指基因组中富含双碱基CpG的序列。
(主要在脊椎动物中发现。
)
染色体核型:细胞分裂中期,染色体按照大小与着丝粒的位置依次排列,组成的每种生物特有的染色体图像。
1、真核生物染色体和大肠杆菌染色体之间有什么区别?
2、异染色质与常染色质的差别是什么?
异染色质:仍保持压缩状态不具备转录活性的染色质。
常染色质:极度松弛并处在转录活性状态下的染色质。
3、何谓骨架附着区SAR,何谓基质附着区MAR,其作用如何?
SAR:中期染色体与染色体骨架蛋白结合的DNA顺序。
MAR:细胞间期与细胞核基质蛋白成分结合的染色体DNA序列。
4、什么是DNA转座子? 什么是RNA转座子(或逆转座子)? 这两类转座子的转座方式有何特点?
DNA 转座子:一段可以从原位上单独复制或断裂下来,环化后插入另一位点,并对其后的基因起调控作用的基因序列。
RNA 转座子:指通过RNA为中介,反转录成DNA后进行转座的可动元件。
特点:
5、果蝇P转座子的结构及决定杂交后代育性的规律?
第9章蛋白质组
蛋白质组学:研究蛋白质组结构与功能的领域。
包括从整体的角度分析细胞内动态变
化的蛋白质组成成份、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭
示蛋白质功能与细胞生命活动规律。
蛋白质组:基因组表达的最终结果,活细胞中所有功能蛋白的组合。
1、蛋白质合成后存在哪些加工类型和修饰方式?
①蛋白质剪切加工: a.引导肽或导肽的切除;b.将多肽链可变剪切产生顺序重叠功能
各异蛋白质;c.多聚蛋白质切割;d.切除蛋白质内部顺序, 连接两侧顺序。
②蛋白质的折叠:蛋白质在合成之后必须经历一个正确折叠的加工过程才能成为成熟
的蛋白质,
2、细胞如何控制蛋白质的降解?
通过对蛋白质进行标记(泛素化),在蛋白酶体中进行蛋白质的降解。
泛素化:①需要降解的蛋白质需要贴上一个标签—泛素多肽,这一过程称为蛋白
质的泛素化。
②蛋白质泛素化系统由3个组分构成:a.一个称为泛素激活酶E1,它可
利用水解ATP释放的能量以其胱氨酸残基(Cys)的巯基与泛素C-端的甘氨酸残基(Gly)形成高能硫脂键。
b.连接在E1上的泛素然后被转移到另一个泛素结合蛋白E2上。
c.同时被选中的靶蛋白与第三个组分即靶蛋白泛素连接酶E3结合。
E2将与其连
接的泛素转移到靶蛋白上,并与靶蛋白赖氨酸残基(Lys)ε-NH2基团形成异肽键(isopeptidebond),E2被释放。
选择哪个蛋白质进行泛素化主要取决于E2和E3 。
3、蛋白质降解与基因表达调控有何联系?
蛋白质降解生物基因程序性表达的结果,此过程维护了基因表达调控的正常进行。
第10章 表观遗传学
表观遗传学:研究不涉及DNA顺序的变异但能通过有丝分裂和减数分裂遗传的基因功能的变化。
特征: (1)可遗传;(2) 可逆性;(3) DNA不变
1、何谓基因组印记?它是如何产生的?
基因组印记:是指来自父方和母方的等位基因在通过精子和卵子传递给子代时已发生了修饰,使带有亲代 印记的等位基因具有不同的表达特性,这种修饰常为DNA甲基化修饰,也包括组蛋白乙酰化、甲基化等修饰。
产生:在配子或合子的发生期间,来自亲本的等位基因或染色体在发育过程中产生专一性的加工修饰,导致双亲中某一方的等位基因被沉默,从而使后代体细胞中两个亲本来源的等位基因有不同的表达活性。
2、核小体组蛋白有哪些修饰方式?为什么组蛋白修饰可促使染色质松弛?
3、简述DNA甲基化的功能?
①防御功能:生物体在遭受外源DNA侵袭时,宿主细胞内甲基转移酶能通过对外源 DNA序列进行甲基化,以抑制其对宿主基因组造成伤害;也能通过抑制转座子的活性,减少外源DNA对其的伤害。
②基因调控的方式:DNA甲基化抑制基因转录或使之沉默,从而调控基因的表达。
第12章 基因组进化的分子基础
1、简述引起DNA损伤的化学因素有哪些,并举例说明致突变机制?
直接作用于DNA,引起结构改变导致模板链的错误复制;间接作用于DNA,本身不影响DNA的结构,但可使细胞合成如过氧化物类的化学物质产生突变效应;碱基类似物,作为底物,在新链DNA复制时渗入。
碱基类似物(作为底物在新链DNA复制时渗入):5-溴尿嘧啶(BrU),2-氨基嘌呤(AP或2-AP)
脱氨基试剂、烷化剂
碱基的化学修饰导致的突变:亚硝酸、羟氨(HA)、甲磺酸乙酯(EMS)
嵌入试剂致突变:吖啶橙(AO)、溴化乙锭(EB)
2、简述错配修复系统的组成成分及修复过程?
3、为什么说SOS是倾向差错修复?阐述其修复机制?
第13章 基因组进化的模式
外显子洗牌:由不同基因中编码不同结构域的片段彼此连接形成的全新编码序列。
1、什么是RNA世界假说? RNA世界假说的主要依据何在?
“RNA World”假说:“生命起源之某时期,生命体仅由一种高分子化合物RNA 组成。
遗传信息传递建立于RNA的复制,复制机理与当今DNA复制机理相似,作为生物催化剂的、由基因编码的蛋白质还不存在”。
①1986年, Thomas Cech首次发现具有自我催化的RNA分子, 四膜虫rRNA分子可以自我剪切。
②1989年, Jack Szostak提供实验证据, 表明体外RNA分子可以自我催化复制。
③1992年, Harry Noller证实核糖体RNA具有催化肽键形成的功能。
2、重复基因产生的机制,在自然选择的作用下重复基因的命运?。