基因组序列诠释

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

tk 胸苷激酶标记基因 ← gangcyclovir neor 新霉素抗性基因→G418
4.2 基因超时表达 通过增加基因的 拷贝数和采用强启 动子促使基因超表 达,致使受体表现出 生长与发育的异常, 来研究基因的功能.
4.3反义RNA
反义RNA是由基因的负链编码,可与正义 RNA (sense RNA)或DNA 编码顺序结合,干 扰mRNA 的转录,加工和转运,调控基因的表 达.
Kozak规则:
若将第一个ATG中的碱基A,T,G分别 标为1,2,3位,则Kozak规则可描述如下:
(1)第4位的偏好碱基为G; (2)ATG的5‟端约15bp范围的侧翼序列内不含碱 基T; (3)在-3,-6和-9位置,G是偏好碱基; (4)除-3,-6和-9位,在整个侧翼序列区,C是偏 好碱基。
A 通过对全长cDNA序列的测序、对比, 以及与基因组DNA的比较,确定基因所 在的区域; B 通过物种已建立遗传图和物理图来确定 基因的位置;
4.实验确认基因功能
4.1 基因剔除(knock-out) 最简便的基因失活的方法. 主要原理: 在一段无关DNA 片段的两测连接与代换 基因两测相同的顺序,将这一构建导入目的细 胞,由于同源片段之间的重组,可使无关片段取 代靶基因,整合到染色体中.为了便于筛选,用 于取代的外源DNA中含有报告基因.
Nco I
反义表达载体
300bp
3 5S pro
Bs t EII
HbR
p3301-HbR(11030bp)

反义RNA 作用机理:
A 干扰翻译的起始与延伸,可与翻译起始顺序及 编码序列结合形成双链RNA,随之被细胞降解。 B 与mRNA 的引导顺序结合,阻止核糖体的附着, 使翻译无法启动。 C 反义RNA与mRNA形成双链分子后,使RNA多 聚酶脱离模板,转录终止。
4.4 RNAi干涉
RNAi干涉是通过双链RNA的介导,特异性 地降解相应序列的mRNA,从而阻断相应基因 表达的转录后水平的基因沉默机制.
RNAi 作用机理
A dsRNA核酸内切酶Dicer被激活,它把dsRNA 加工成21~25 个核苷酸长的RNA链; B 这些小片段RNA(siRNA)作为另一个核糖核酸 复合体RISC(RNA-induce silencing complex,RNA诱导沉默复合体)的指引物,结合 到RISC上,使之识别并降解mRNA,从而导致 与双链RNA同源的基因沉默;
另外个别生物基因组的特有组成也可作为判别依 据,如脊椎动物基因组许多基因的上游都有CpG岛。
I 软件预测 采用NCBI的ORF预测软件 ( ORF finder: http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi )判断ORF的可能范围。
来自百度文库
1.2 同源查询途径
通过已存入数据库中的基因顺序与 待查的基因组序列进行比较,从中查找 可与之匹配的碱基顺序及其比例,用于 界定基因的方法称为同源查询。
第二讲 基因组序列诠释
问题


基因组序列所包含的全部遗传信息是什 么? 基因组作为一个整体如何行使其功能? 用什么方法寻找基因,研究基因地功能 呢?
1. 寻找基因
1.1 根据开放读码框预测基因
A 起始密码子 ATG

第一个ATG的确定(依据Kozak规则);
Kozak规则是基于已知数据的统计结果. 所谓Kozak规则,即第一个ATG侧翼序列 的碱基分布所满足的统计规律.

原理: 其原理涉及转录因子与启动子之间的互作。 正常条件下: 转录因子 (包括两个功能区域)→ 结合功 能域同基因上游的区段结合 → 激活功能域 激活RNA多聚酶 → 将基因转录为mRNA

酵母杂交系统中:
融合表达载体1 DNA结合功能域 +目的片段 表达载体共转化 融合表达载体1 融合表达载体2 融合表达载体2 激活功能域+ 多种未知cDNA
G 外显子-内含子边界
外显子和内含子的边界有一些明显的特征,
如:内含子的5„端或称供体位(donor site) 常见的顺序为 5‟-AG↓GTTAAGT-3‟; 3‟端又称受体位(acceptor site), 多为 5„PyPyPyPyPyPyCAG-3‟(“Py”嘧啶核苷酸,T 或C);
H 上游控制顺序 几乎所有基因(或操纵子)上游都有调控序列, 它们可与DNA结合蛋白作用,控制基因表达。 通过同源性比较来预测mRNA的5‟端,最常用的 与转录起始位点相关的数据库是真核启动子数据库 (The TRADAT Project , Eukaryotic Promoter Database, EPD. http://www.epd.unil.ch/ )。
B 信号肽分析 信号肽分析软件(SignalP http://www.cbs.dtu.dk/services/signalP ) 把预测过程中证实含完整mRNA 5‟端的序 列翻译为蛋白序列; 然后用SignalP软件对前50个氨基酸序列(从 第一个ATG对应的甲硫氨酸Met开始)进行评 估,如果SignalP分析给出正面结果,则测试 序列有可能为信号肽;

RNAi设计方法及应用
A Fraser 合成与开放读码框相对应的双链 RNA或利用细菌克隆表达这些双链 RNA→微量注射和喂食→干扰同源基因 的表达 B Chuang 等设计出嵌合体结构 → 连接强 启动子大量表达双链mRNA→干扰同源基 因的表达
HbF基因的RNAi载体构建
RNAi技术的优缺点
同源有如下几种情况:
A DNA序列某些片段完全相同; B 开放读码框(ORF)排列类似,如有长 外显子; C 开放读码框翻译成氨基酸序列的相似性; D 模拟多肽高级结构相似
1.3 试验分析
Northern 杂交确定DNA片段是表达序列.
注意事项: a 当某一基因的转录产物进行可变剪接时,由 于连接的外显子不同,会产生好几条长度不 一的杂交带; 如果该基因是某一基因家族的成员也会出现 多个信息; b 考虑组织专一性和发育阶段的问题;
E 非编码序列、内含子 高等真核生物多数外显子长度少于 100 个密码子,有的不到50个密码子甚 至更少;
F 密码子偏爱性
编码同一氨基酸的不同密码子称为同义密 码,其差别仅在密码子的第3位碱基不同。 不同种属间使用同义密码的频率有很大差 异,如人类基因中,丙氨酸(Ale)密码子多 为GCA,GCC或GCT,而GCG很少使用。
C 终止密码子 终止密码子: TAA, TAG,TGA
GC% = 50% 终止密码子每 64 bp出现一次; GC% > 50% 终止密码子每100-200 bp 出现一次; 由于多数基因 ORF 均多于50个密码子,因此最可 能的选择应该是 ORF 不少于100 个密码子。
D 3‟端的确认
3‟端的确认主要根据Poly(A)尾序列, 若测试DNA片段不含Poly(A)序列,则 根据加尾信号序列“AATAAA”和 BLAST同源性比较结果共同判断。
C 基因表达产物丰度的问题 如果风度较低,用拟Northern 杂交 和动物杂交(Zoo-blotting)分析。 拟Northern 杂交—— 根据已知的DNA 顺序设计引物,从mRNA群体中扩增基 因产物,再以DNA为探针与之杂交。

动物园杂交—— 根据亲缘关系相似的 物种,其基因的编码区相似性较高,而 非编码区的同源性很低的原理。如果某 一物种的DNA 顺序与来自另一亲缘物种 的DNA片段杂交产生阳性信号,该区段 可能含有1个或多个基因,这种方法又 称为动物园杂交。
2 获取基因全长cDNA序列
A 构建cDNA文库,用目的基因DNA片段 筛选文库。
cDNA文库构建(CLONTECH)
cDNA 文 库 构 建
B 根据已知片段设计引物,RACE 技术得 到基因的全长cDNA序列。
5‟RACE (CLONTECH)
3‟RACE (CLONTECH)
3.确定DNA顺序中基因的位置
RNAi最根本的特点是特异性 RNAi具有特殊的穿越能力,如将双链RNA注 射在线虫性腺里,它也会干扰到体细胞里的基 因表达,而且干扰作用会传给后代; RNAi对一些低水平表达的基因的RNAi现象并 不明显,而且几个有相同或相似序列的基因, RNAi也会同时作用与它们.

4.5 酵母双杂交(yeast two-hybridization)

构建反义RNA 表达载体:
将全目的基因或部分目的基因反向插入表 达载体 → 转化目标生物 →获得转基因个 体或品系 → 分析转基因植株在生理、生 化、形态等方面的变异 → 判别目的基因 的功能
Nco I
35S pro
Spe I Bs t EII
HbF
正义表达载体
300bp
p3301-HbF(11030bp)
同一细胞
形成聚合物,启动 报告基因的表达
4.6 其他方法
构建转座子突变库 噬菌体外显 内含子归槽突变 开放读框顺序标签

本节课主要内容:
如何预测基因 RACE技术 RNAi技术 基因剔除法

下节课
5.基因表达 6.蛋白组学
本节内容结束谢谢!
相关文档
最新文档