基因组学-总结

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.1.DNA顺序复杂性:不同顺序的DNA总长称为复杂性。复杂性代表了一个物种基因组的基本特征,可通过DNA复性

动力学来表示。

1.2.基因的定义:不同的DNA片段共同组成一个完整的表达单位,有一个特定的表达产物,可以是RNA分子,也可以是

多肽分子

1.3.反义基因:是指与细胞内DNA或RNA序列相互补形成杂交体而阻断或减弱其转录和翻译过程的DNA或RNA片段.反义基因通常包括反义寡核苷酸(ASON)、反义RNA及核酶

1.4.假基因:与有功能的基因在核苷酸顺序的组成上非常相似,却不具正常功能的基因。假基因是相应的正常基因在染色

体的不同位置上的复制品,由于突变积累的结果而丧失活性。假基因都是在真核生物的基因组中发现的,在原核生物中未见报道

2.1.DNA标记的类型:限制性片段长度多态性(RFLP);简单序列长度多态性(SSLP)(小卫星序列和微卫星序列);SNP.

2.2.RFLP(限制性片段长度多态性)的特点: 限制酶识别的碱基具有位点专一性,用不同的限制酶处理同一样品时,可以产生与之对应的不同限制性片段,提供大量位点多态性信息。

2.3. 部分连锁与遗传作图:交换是随机的,两个相近的基因发生交换的概率要比两个相远发生交换的概率要大,因此通

过重组率的确定可以相对确定两个基因的位置。由此可以进行基因的遗传作图。

3.1.分子信标的结构:环含识别序列,一般15 --33个核苷酸;茎在两末端各接上5到8个核苷酸的互补序列,富含GC;

荧光素及猝灭剂

3.2.猝灭剂:荧光染料发射的光能,可被邻近的染料或非染料分子所吸收转成热能而不再发射荧光,也可以发射能量较

低的荧光

3.3.PRET(激光共振能量转移):受激发荧光素的能量转移到邻近的另一荧光素,并不发射荧光而使激发荧光素回复基态

时的现象。

3.4.原位杂交:靶子为完整的染色体,由杂交信号提供作图信号,DNA变性时不破坏染色体自然形态,原位杂交是指将

特定标记的已知顺序核酸为探针与细胞或组织切片中核酸进行杂交,从而对特定核酸顺序进行精确定量定位的过程。

原位杂交可以在细胞标本或组织标本上进行。

3.5. 顺序标签位点或STS(sequence tagged site)为一段长度100-500BP的单一DNA顺序,易于分辨。寻找方法: 表

达序列标签(EST) ;SSLP ;随机基因组测序.

4.1 随机测序与序列组装

随机测序也称”鸟枪法”.

序列组装原理:直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸.

优点:不需预先了解任何基因组的情况.

实例:流感嗜血杆菌基因组的测序及顺序组装

超声波打断纯化的基因组DNA--琼脂糖电泳收集1.6∼2.0Kb的区段、纯化--构建到质粒载体中--随机挑选19687个克隆,进行28643次测序,得到可读顺序为11 631 485 bp--组装成140个覆盖全基因组范围的独立的顺序重叠群

4.2 限制测序:是指将一段染色体区段的DNA 顺序进行组装.

两种策略的比较

鸟枪法策略指导测序策略

不需背景信息构建克隆群

(遗传、物理图谱)

时间短需要几年的时间

需要大型计算机

得到的是草图(Draft) 得到精细图谱

1) BAC末端序列(BAC-end sequenced) :一个BAC克隆插入片段两端的已测序的序列,不包括内部序列。可用于确定BAC 的排列方向以及重叠群(contig)在支架(scaffold)中的排列方向。

2) 重叠群(contig) :一群相互重叠的克隆或DNA序列,可以是草图序列或精确序列, 包括连续的(内部无间隙)或不连续的(内部含间隙)DNA序列。

3) 支架(scaffold):一组已锚定在染色体上的重叠群,内部含间隙或不含间隙。

5.1寻找基因:1)计算机分析寻找与基因有关的序列。(1)根据开放读码框预测基因:a.起始密码子A TG; b. 终止密码子;终止密码子: TAA, TAG,TGA;2)通过对DNA序列进行实验分析,看其能否表达基因产物。(1). Northern 杂交确定DNA片段是表达序列:(2). 由EST或cDNA指认基因;(3)获取基因全长cDNA序列;(4)4.确定DNA顺序中基因的位置

5.2同源基因

查询:通过已存入数据库中的基因序列与待查的基因组序列进行比较,从中查找可与之匹配的碱基序列及其比例,用于界定基因的方法称为同源查询。同源有如下几种情况:A. DNA序列某些片段完全相同;B. 开放读码框排列类似,如有等长外显子;C. 开放读码框翻译成的氨基酸序列的相同;D. 模拟多肽高级结构相似。

原理:主要依据同源性比较,同源性反应出进化关系。

方法:既存数据库的比较分析。分析的基础是:如果一个新测序的基因与另一个原来已测序的基因相似,那么就揭示他们可能有进化上的关系,并且新基因的功能很可能与已知基因的功能相同,或至少是相似。

5.4.同源重组不是唯一的打断基因的方法.另一种方法是用转座子标记技术,通过向基因中插入转座元件或转座子使其失活。

5.5.突变库构建

1) 利用天然的DNA转座子构建表达载体,转化受体细胞, 当转座子活化时可被动转座并随机插入受体细胞基因组引起突

变.

2) 观测突变再生植株的表型变化, 分离与克隆插入突变基因的结构与功能.

5.6. RNAi是一种完全不同的基因失活方法,它并不打断基因本身,而是破坏其mRNA

6.1结构域: 温和条件下提取真核生物中期染色体,除去大部分结合蛋白质后,可在电子显微镜下见到从致密的蛋白质骨架向外延伸的DNA环,间期DNA环的两端附着在细胞核基质上,除去组蛋白后也有DNA环从细胞核向外突出,称结构域

6.2.isochore(等高线):指连续分布的具有相似碱基组成的DNA区域,它们在基因组中成片镶嵌排列。

6.3.密码子偏好性:在不同生物体内,同一氨基酸可能用不同的密码子

6.4.基因内的基因:基因内的一部分基因可能单独编码一个基因

6.5.CpG岛:富含GC碱基的DNA区段,一般长度为1-2KB。大部分位于管家基因和大部分组织专一性表达基因的5侧翼区以及基因的第一个外显子区。双碱基均未甲基化,而整个基因组中约60-80%被甲基化与基因相连,可作为寻找基因的依据.

6.6. 串接重复顺序是通过某一祖先顺序在DNA复制时因测序或重组时的不等交换扩增,因此大都是首尾相连簇集在特定位置.包括卫星序列小卫星序列微卫星序列.

6.7.人类基因组合果蝇基因组比较

•人类蛋白质基因的编码顺序仅占总DNA的1.1%-1.5%,远低于果蝇和线虫的基因密度。

•人类基因的mRNA具有更多的可变剪切方式,单个基因产生的蛋白质数目约为果蝇或线虫的5倍。

•编码顺序为1340BP,外显子一致性高,内含子差别大,人类一般为3300BP,可变剪切占人类基因的22% •同源性比较表明,60%可在其它物种中发现相似的成员

CRISPR-Cas:一种来源是细菌获得性免疫的由RNA指导Cas蛋白对靶向基因进行修饰的技术。结构: CRISPR 是一个特殊的DNA重复序列家族, 广泛分布于细菌和古细菌基因组中。CRISPR 位点通常由短的高度保守的重复序列

(repeats) 组成, 重复序列的长度通常 21~48 bp, 重复序列之间被 26~72 bp 间隔序列(spacer)隔开。

CRISPR就是通过这些间隔序列(space)与靶基因进行识别。

Cas家族: 存在于CRISPR位点附近,是一种双链DNA核酸酶,能在guide RNA引导下对靶位点进行切割。

CRISPR-Cas系统介导基因修饰: 1 dual-RNA:Cas介导编辑模板替换; 2 sg-RNA:Cas介导基因修饰; 3 cr-RNA:Cas 介导双基因修饰

CRISPR-Cas系统前景分析: 只需合成一个sgRNA就能实现对基因的特异性修饰,Cas蛋白不具特异性.编码sgRNA的序列不超过100bp,因此比构建TALENs和ZFNs更简单方便。较短的sgRNA序列也避免了超长、

高度重复的TALENs编码载体带来的并发症。

锌指结构:一种常出现在DNA结合蛋白中的一种结构基元。是由一个含有大约30个氨基酸的环和一个与环上的4个Cys 或2个Cys和2个His配位的Zn2+构成,形成的结构像手指状。锌指结构指的是在很多蛋白中存在的一类具有指状结构的模体,这些具有锌指结构的蛋白大多都是与基因表达的调控有关的功能蛋白。

锌指核糖核酸酶:由一个 DNA 识别域和一个非特异性核酸内切酶构成。DNA 识别域是由一系列 Cys2-His2锌指蛋白串联组成,每个锌指蛋白识别并结合一个特异的三联体碱基。在真核生物中从酵母到人类广泛存在,形成alpha-beta-beta二级结构。其中alpha螺旋的16氨基酸残基决定锌指的DNA结合特异性,骨架结构保守。对决定DNA结合特异性的氨基酸引入序列的改变可以获得新的DNA结合特异性。

相关文档
最新文档