基因组学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因组:生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。
基因组学:研究基因组结构和功能的科学。指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。
C值:指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。每个细胞中以皮克(pg,10-12g)水平表示。
C 值矛盾:在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,它们的C值可以相差数10倍乃至上百倍。
序列复杂性:不同序列的DNA总长称为复杂性,复杂性代表了一个物种基因组的基本特征。隔裂基因:指基因内部被一个或更多不翻译的编码顺序即内含子所隔裂。
假基因:来源于功能基因但已失去活性的DNA序列。
微卫星序列:或称简单串联重复,重复单位较短。重复序列只有1-6个核苷酸,分布在整个基因组,10-50个重复单位.
重叠群:通过末端的重叠序列相互连接形成连续的DNA长片段的一组克隆称为重叠群。
指纹:指确定DNA样品所具有的特定DNA片段组成。
STS作图:根据STS序列设计引物,扩增文库当中的克隆,能扩出条带的克隆都含有序列重叠的插入子。
荧光原位杂交:指在染色体上进行DNA杂交,以便识别荧光标记探针在染色体上位置的方法。
辐射杂种群:通过放射杂交产生的融合细胞群称为辐射杂种群。
覆盖面(或深度):每个核苷酸在完成顺序中平均出现的次数,或者说完成顺序的长度与组装顺序长度之比。
支架:一组已锚定在染色体上的重叠群, 内部含间隙或不含间隙.
同源性:基因系指起源于同一祖先但序列已经发生变异的基因成员。
一致性:指同源DNA顺序的同一碱基位置的相同的碱基成员, 或者蛋白质的同一氨基酸位置的相同的氨基酸成员, 可用百分比表示.
相似性:指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。
转座子:一段DNA顺序可以从原位上单独复制或断裂下来,插入另一位点,并对其后的基因起调控作用,此过程称转座,这段序列称跳跃基因或转座子。
基因是DNA分子上具有遗传效应的特定核苷酸序列,是DNA分子中含有特定遗传信息的一段核苷酸序列,是遗传物质的最小功能单位。
基因的化学本质是核酸而不是蛋白质
基因组学以整个基因组为研究对象,而不是以单个基因为单位作为研究对象。包括对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱),核苷酸序列分析,基因定位和基因功能分析。
基因组学包括3个不同的亚领域:结构基因组学、功能基因组学、比较基因组学
结构基因组学:通过基因组作图、核苷酸序列分析,研究基因组结构,确定基因组成、基因定位的科学。
一个生物体基因组的最终图就是它的全部DNA序列。
功能基因组学:完成一个生物体全部基因组测序后即进入后基因组测序阶段——详尽分析序列,描述基因组所有基因的功能,包括研究基因的表达及其调控模式,这就是功能基因组学。比较基因组学:研究不同物种之间在基因组结构和功能方面的亲源关系及其内在联系的学科,以便深入理解每个基因组的功能和进化关系。
低等生物单倍体基因组DNA含量与生物复杂性呈正相关,但高等生物这种关系并不一致。序列复杂性分为:单一顺序、重复顺序
基因组的序列组成:高度重复序列、中度重复序列、单一序列
基因(广泛意义):由不同的DNA片段共同组成的一个完整表达单元,有一个特定的表达产物,表达产物可以是RNA分子,可以为多肽分子。
组成基因的DNA成分包括:
①编码初级转录物的全部顺序②为正确启动转录及进行转录物加工所必需的最低要求的DNA顺序③调节转录速率所必需的DNA顺序.
根据表达的终极产物,可将基因分为两大类:编码RNA的基因、编码蛋白质的基因
⑴编码RNA基因:细胞中大多数RNA分子都与遗传信息传递、前提加工与mRNA翻译,与编码蛋白质基因不同的是,编码RNA基因为多拷贝。(rRNA基因、tRNA基因、scRNA 基因、snRNA基因、snoRNA基因、miRNA)
⑵编码蛋白质基因:生物的多样性与编码蛋白质的基因有关,均由RNA聚合酶II转录;真核生物蛋白编码基因的显著特征是编码序列的非连续性-隔裂基因。
⑶基因家族:1)具有25%以上的氨基酸顺序相似性;2)具有相同的功能域(类似生物学功能)
⑷异常结构基因:重叠基因、基因内基因、反义基因
⑸假基因:重复假基因、加工假基因、残缺基因
假基因有没有功能?有两层含义: ①相对于原来的功能基因而言,假基因已失去正常功能;②假基因可能产生了新的功能.
起源于重复基因的假基因和获得启动子的加工的假基因仍然保持转录的活性
有些假基因产生了新的功能:
1. 产生反义RNA, 抑制靶基因功能.
2. 在RNA水平与正常基因的mRNA竞争, 起调控作用
3. 在DNA水平与正常基因竞争转录因子, 起抑制作用, 如老鼠的Makorin1基因的转录.
真核生物基因组的特征:1)结构松弛2)大量重复顺序3) 由线性DNA与蛋白质组成染色体结构4) 含有细胞器基因组
原核生物基因组的特征:1)结构紧凑2) 大小在5 Mb以下3) 缺少重复顺序4) 很少非编码顺序
为何要绘制遗传图与物理图?
1)基因组太大,必需分散测序,然后将分散的顺序按原来位置组装,需要图谱进行指导。
2)基因组存在大量重复顺序,会干扰排序,因此要高密度基因组图。
3)遗传图和物理图各有优缺点,必须相互整合校正。
测序阶段可以采用以下方法进行:
1. 克隆重叠群法(作图法测序):这种逐步测序的方法花时间多,但精确。
2. 全基因组鸟枪法:全基因组鸟枪法是一种快速获得真核基因组的方法。
鸟枪法:是随机先将整个基因组打碎成小片段进行测序,最终利用计算机根据序列之间的重叠关系进行排序和组装,并确定它们在基因组中的正确位置。