7解读基因组序列-1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18
基因敲除小鼠
19
非同源重组的基因失活
转座子标记(transposon tagging):利用转座元件插入目的基因使其失活
使用重组DNA技术将一种可被半乳糖诱导的启动子序列装入酵母基因组 Tyl元件上游。当半乳糖缺乏时, Tyl元件不被转录而保持沉默。当细胞 被转移到含有半乳糖的培养基上,启动子被激活, Tyl元件被转录以起动 转座过程。
6
• 三项改良 1、密码子偏倚
生物有时更加偏爱地使用一个或者一组密码子的现象。这 是在进化过程中基因复制的差异所产生的结果。如人类基 因中,亮氨酸大多被CUG编码,缬氨酸多由GUG编码。
7
2、外显子-内含子边界
外显子/内含子边界符合的GT-AG规则
3、上游调控序列
8
基因定位的实验技术
• 种属间印记
也存在于果蝇homeless蛋白和人A-激酶锚定蛋白中,除含有
tudor结构域外,这些蛋白并不相似,但每种蛋白活性都与RNA
有关。
15
同源性分析中酵母基因组计划中的应用
可疑的阅读框
已鉴定 的基因
单一孤 儿基因
通过同源性分 析鉴定的基因
孤儿家族未 确定的成员
16
通过实验分析确定基因功能
• 通过基因失活进行功能分析
4
单一ORF扫描对高等真核生物DNA效果不佳 • 真核生物基因之间有较大的间隔区,假
ORF出现的可能性增大。 • 真核生物的基因存在内含子,在基因DNA
序列中没有连续的ORF。将阅读框和内含 子一起连续扫描往往会造成ORF提前终止。
5
内含子使ORF扫描复杂化
图示含一个内含子的短基因的核苷酸序列,紧邻其下的氨基酸序列是正确 的翻译,其中内含子被去除,氨基酸序列被分为两部分。再下面一行是不 考虑内含子而得到的翻译序列,结果氨基酸序列在内含子中出现了终止。
13
同源分析可以提供整个基因或基因片段的功能信息
通常同源性搜索前先将核苷酸序列转换成氨基酸序列。
两个核苷酸序列有76%相同,用星号表示,可以作为序列同源的证据。然 而,当翻译成氨基酸序列时,只有28%相同,说明核苷酸水平的相似性是 偶然的。
14
Tudor结构域
果蝇tudor蛋白的结构含有10个拷贝的tudor结构域。此结构域
表型
基因型
• 同源重组可以灭活特定基因
目的基因的染色体 DNA与载体携带的破 坏基因重组,结果目 的基因失活。
17
缺失框
缺失框包括抗性基因和其前面 在酵母中表达所需的启动子序 列以及两侧的限制性位点。 目的基因的首尾两侧插入限制 性位点中,将载体导入酵母细 胞中。 载体上的基因片段与染色体目 的基因之间重组,使后者失活。 发生基因破坏的细胞可以鉴定, 因为它们表达抗生素抗性基因, 可以在含抗生素的琼脂糖培养 基中生长。
20
RNA干扰(RNA interference)用于目的基因失活
与靶基因同源的双链RNA诱导的特异转录后基因沉默现象。其作用机制是 双链RNA被特异的核酸酶降解,产生干扰小RNA(siRNA),这些siRNA与 同源的靶RNA互补结合,特异性酶降解靶RNA,从而抑制、下调基因表达。
21
基因过表达也可用来研究基因功能
相关生物的同源基因有相 似序列而非编码DNA通 常差异很大。如果一个物 种的DNA片段与相关物 种DNA有同源性,即表 明此段DNA含有一个基 因。
9
滤纸 NC滤膜
凝胶
滤纸
重物 玻璃板 吸水纸 支持物
转移缓冲液
图 虹吸法转膜装置示意图
11
准确定位外显子-内含子边界
外显子捕获
用于确定基因组DNA表达区域的 一项技术。将拟检测基因组序列 克隆在特异性表达载体所含两个 外显子之间的一个内含子中进行 表达。如果该基因组片段中包含 有一个外显子,表达产生的信使 核糖核酸(mRNA)长短会发生变化, 能够被检测出来。
对载体的要求:1、松弛型载体;2、具有高活性启动子
通过基因过表达进行功能分析,目的是确定过表达的基因对转基因小 鼠表型是否有影响。因此将目的基因cDNA插入带有高活性启动子的载 体中,此启动子指导复制目的基因在小鼠肝细胞中表达。
22
基因功能的深入研究
定点诱变可以用来探索基因的具体功能
23
ORF的识别是证明一个新的DNA 序列为特定的蛋白质编码基因的 部分或全部的先决条件。
双链DNA分子有6个阅读框,每条链都按
5’到3’的方向阅读,根据起始核源自文库酸不同,
每条链有3个可读框。
2
• 成功寻找ORF的关键在于终止子在DNA序列中出现 的频率。
• 在随机DNA序列中,每个终止子出现的频率将平均 每43=64bp出现一次。随机排列的DNA不会有许多 长度超过50个密码子的ORF,而实际上,大多数基 因长度大于50个密码子。
解读基因组序列
1
在基因组序列中定位基因
通过序列筛查定位基因
基因并非是核苷酸的随机排列,而是具有明显特征。这些特征决定了一段序列 是否是一个基因,而非编码DNA不具备这样的特征。 开放阅读框[open reading frame,0RF] 是结构基因的正常核苷酸序列,从起 始密码子(ATG)到终止密码子(TAA、TGA或TAG)的阅读框可编码完整的 多肽链,其间不存在使翻译中断的终止密码子。
大肠杆菌基因平均长度:317个密码子 酿酒酵母基因平均长度:483个密码子
人类基因平均长度:450个密码子 • 最简单的ORF扫描方式是将100个密码子作为假定
基因长度的下限,并记录所有大于此值的ORF。
3
ORF扫描是细菌基因组基因定位的有效方法。此序列包含2个真基因—lacZ和 lacY,用直线表示。真基因比假ORF(波浪线)长得多。
12
确定单个基因的功能
利用计算机分析基因的功能 同源性搜索的基础是相关基因有相似的序列,因此可以通过与其他物 种中已知序列的相关基因进行序列相似性比较来发现新基因。 同源性反映了进化关系:同源基因有共同的进化祖先,基因之间序列 相似。 直源基因(orthologous gene):不同种属生物间的同源基因 旁源基因(paralogous gene):存在于同种生物中,常是多基因家族 的成员
相关文档
最新文档