基因组学 课件 9.功能基因组学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目前功能基因组研究的主要技术及应用
• 功能基因表达克隆(functional cloning) • 基因芯片(gene chip)或基因微阵列技术(micro array) • 基因表达系统分析(serial analysis of gene expression,SAGE)或表 达序列标签(expressed sequence tag,EST) • 蛋白质组技术(proteomics) • 质谱测序技术 • 生物信息学(bioinformatics) • 转基因(transgenics) • 基因敲除(gene knock out) 这些前沿技术为功能基因组学的研究提供了强有力的技术保障. 在植物功能基因组研究方面,目前应用较多的是EST,基因芯片, 蛋白质组技术,反向、正向遗传学技术及生物信息学技术等等.
• 鉴定和发现表达基因的最快途径
– 随机挑选的cDNA克隆进行一端或二端长为300~ 500pb的测序,这种序列在大多数情况下已足够确 认对应的基因 – 通常从已有的cDNA文库中随机取出几百或几千个 克隆,1次测序产生。 – 只含有基因的外显子,cDNA克隆的测序分析可以 了解基因的表达情况 – EST的数目可以提示它所代表的基因表达的拷贝数。 一个基因在组织中表达的次数越多,其相应的EST 也越多。
估计基因的功能(以小麦基因组为例)
确定基因的功能毫无疑问仍然是小 麦基因组学最大的挑战 ,许多假设的方 法正在被用来推测基因功能。
估计基因的功能(以小麦基因组为例)
第一步,确立小麦EST 或基因组克隆与其 它植物假定的定向进化同源基因的同源性。如 果在其它植物中一个基因的功能已知,那就表 示小麦EST 具有相似的功能。 第二步,在作图群体中EST 与相关表型的 连锁,高密度图谱可以用来提高连锁假设的力 度,然而小麦基因组中重组频率高的区域和重 组频率低的区域呈非随机分布,且小麦单一位 点上存在多基因家族,限制了通过连锁进行候 选基因的分析。
EST应用
• 目前主要被用于寻找新基因和了解基因的表达 概况 • 步骤如下: – 建立某种生物材料或组织的cDNA文库,从文库中 随机取出足够量的cDNA克隆进行自动测序,将所
得的EST数据与dbEST等数据库的数据比较,确定哪 些代表已知基因,哪些代表未知基因,进一步分析 全部EST以获得生物或组织的基因表达概况,并深 入研究未知基因 – 用EST和cDNA序列与己知的DNA序列进行序列相 似性比较,可以确定很多基因的内含子位置 – EST还被用来确定编码区的边界,分析基因组的转 录图谱 – 结合酵母双杂交系统,进行蛋白质互作研究
7. PCR扩增。
8. 用Nla Ⅲ酶切130bp产物释放34bp双链 标签。
9. 连接片断形成串联体。
10. 克隆到pZErO-1+里,并测序。
SAGE实例
蛋白质组(Proteome)
• 蛋白质组定义 广义上是指某种细胞或组织中基因组表达的 所有蛋白质; 狭义上, 可以指不同时期细胞内蛋白质的变化.
SAGE (serials analysis of gene expression) 基因表达系列分析 Velculescu 及其同事于1995年创立
SAGE特点:
• 进行转录物组研究,也就是转录水平的研究;
• 通过快速和详细分析成千上万个EST,寻找出表达丰度不 同的SAGE标签序列,从而接近完整地获得基因组的表达 信息; • SAGE区别于差异显示、消减杂交等其它技术的主要特点 是可用于寻找那些较低丰度的转录物,最大限度地收集基 因组的基因表达信息,这使之成为从总体上全面研究基因 表达、构建基因表达图谱的首选策略;
估计基因的功能(以小麦基因组为例)
高分辨率双向蛋白质电泳和外源表达体 系:提供一种补充小麦功能基因组学研 究的蛋白质组学方法 改进的微阵列方法和蛋白质组学研究方 法:确定可能影响到小麦淀粉A 颗粒和B 颗粒的特异起始和合成的新基因。
基因功能的确定(以小麦基因组为例)
功能互补实验 引起植物表型变异的特异性突变体的研究 大多数用于基因发现的精密体系,像 模式植物中的增强子、启动子和基因陷阱, 都要依靠高度有效的转化体系。
HIV蛋白质组示图
蛋白质组
蛋白质组研究技术路线
证实并克隆差异表达基因
大致可分为以下4类:
• 以DDPCR(differential display)为代表,包括以随机 引物PCR为基础的mRNA指纹法(arbitrarilyrimed PCR finger- printing of RNA) • 差减克隆(subtractive cloning )和正性选择 (positive sele- ction) • 将差异显示及差减结合起来的方法 充分利用人类及模式生物基因组已有信息的方法 基因表达的系列分析(serial analysis of gene expressing,SAGE) cDNA微点阵法(cDNA microarrays) • 综合性基因鉴定程序(integrawk.baidu.comed procedure for gene identification,IPGI)
B 鉴定翻译后修饰的蛋白质 质谱可通过特征离子监测的方法很快确定磷 酸化肽,通过串联质谱确定磷酸化位点; 质谱可与蛋白酶解和糖苷酶酶解结合,寻找糖 肽,鉴定糖基化位点; 质谱还参与糖链组成、结构甚至分支情况等的 分析。
C 质谱技术的其他作用 质谱可对蛋白质二硫键进行定量和定位, 分析蛋白质与蛋白质的相互作用,蛋白质 与其他分子的相互作用,以及蛋白质的二 级结构等。
基因功能的确定(以小麦基因组为例)
随着植物功能基因组学研究的不断 深入,新的研究技术和方法,如蛋白质 组学、DNA 微阵列和生物信息学等也将 会应用到小麦功能基因组研究中。
基因功能分析
比较不同组织和不同发育阶段基因表达模式的 差异 比较正常状态和疾病状况下基因表达模式的差 异
系统了解不同组织在发育过程中、在不同环境条件 下,mRNA的表达水平 根据基因的时空表达类型对基因进行分类 通过比较同类基因的调控序列发现新的调控因子 根据基因表达的变化,结合已知调控基因突变体的 表达情况研究表达网络。
基因的识别
EST 策略:一种快速有效地在一个基因 组中抽样获取有效基因序列的方法。 特点:可以用一个未知功能的cDNA, 确 定一个短的DNA序列如300~400bp,而后,这 些短的序列可以用作标签去检索已知的数据 库确定一个特异的基因。
表达序列标签(expressed sequence tag,EST)
功能基因组学
中英联合实验室
功能基因组学
• 功能基因组学,后基因组学(Post genomics):
– 利用结构基因组学提供的信息和产物 – 通过在基因组或系统水平上全面分析基因的功能 – 生物学研究从对单一基因或蛋白质的研究转向对多 个基因或蛋白质同时进行系统的研究。
• 功能基因组学的目的
– 基因功能发现 – 基因表达分析及突变检测 – 从基因组整体水平上对基因的活动规律进行阐述。 采用一些新的技术(SAGE、DNA芯片),对成千上 万的基因表达进行分析和比较
双 向 电 泳 图
• 质谱技术的基本原理: 样品分子离子化后,根据不同离子间质核 比(m/z)的差异来分离并确定分子量。 • 质谱仪组成: 进样装置、离子化源、质量分析器、离子 检测器和数据分析系统组成。
• 质谱技术在蛋白组研究中的应用: A 肽质谱和肽序列分析 蛋白质经双向电泳后,分离到的蛋白 质被切割下来,进行胶内酶解,或转移到 PVDF膜上,进行膜上膜解,然后上样进 行测序。 但目前质谱法还不能够取代Edman降 解法测序,可是其测定速度较快。
基因产物———蛋白质功能的研究
• 蛋白质组学(proteomics) 在后基因组时代研究重心将从揭示生命的所有遗 传信息转移到整体水平上对功能的研究。 核心内容包括2个部分: 1. 蛋白质组研究体系的建立、完善 蛋白质组技术体系和蛋白质组信息学技术体 系包括:蛋白质样品制备和鉴定蛋白质相互作用 网络的研究技术等 2. 与重要的生物学问题有关的功能蛋白质组研究
蛋白质组数据库的建立和生物信息学
数据库的建立是蛋白质组研究的最重要的一 个方面。 蛋白质的数据库包括: 蛋白质序列数据库 质谱数据库 双向电泳图谱数据库 有关蛋白质结构的数据库
蛋白质组学的应用
蛋白质组学(Proteomics)是蛋白质的遗传学. 除 了发生突变, 基因组结构保持不变, 但是蛋白却 由于细胞种类及环境的不同,动态表达为不同 结构. 虽然只有部分DNA遗传信息通过mRNA 被转录到蛋白质合成过程中, 但事实上细胞活 动是在蛋白水平上进行的. 所以蛋白质组学与 基因组学同等重要, 甚至更为重要. 尽管重要, 与DNA能够识别互补序列而形成双螺旋链并通 过PCR技术扩增相比, 蛋白质不能由序列选择性 合成和被周围环境修正, 蛋白质组学刚刚起步. 最终目标将是代谢物组(matabolome)或生理组 (physiolome)的靶物, 用以研究蛋白质的真正意 义, 但是现在研究还仅停留在观测蛋白质是否 被表达的阶段.
• 蛋白质组学定义 研究蛋白质组结构和功能的领域称为蛋白质 组学.
• 蛋白质组学的研究内容: 分析全部蛋白质组所有成分以及它们的数量; 确定各种组分所在的空间位置、修饰方法、 互作机制、生物活性和特定功能等
蛋白质组分析复杂性
• 蛋白质有许多加工方式,如磷酸化、糖基化、乙酰化、 泛素化等; • mRNA 的可变剪接、程序性移码和可控突变,1个 基因可编码许多不同的蛋白质,常常表现为组织特 异性; • 蛋白质之间存在大量的相互作用,如形成同源或异 源二聚体、三聚体或多聚体,不同的结合状态有不 同的活性; • 1种蛋白质可参与多种反应,或多种蛋白质参与1种 反应。
基因功能的确定(以小麦基因组为例)
高效转化体系的获得是存在于小麦基因功能证实阶 段的一个主要障碍。 目前小麦转化效率的平均值范围在0.1%~5% 之间, 太低的转化率不能用于发展一种建立在转化基础上的基 因标签体系。 在把玉米的Ac/Ds转座单元转入小麦愈伤组织方面 作了一些尝试。玉米的Ac/Ds因子在转基因小麦愈伤组 织中的激活和解离已经得到证实,与在其它植物中的观 察结果相同。 Ac/Ds转座酶的高水平转录导致了切除频 率的下降,因此随着小麦转化和再生效率的提高,根据 异源转座子标签来发现基因是可行的。
• 估计基因的功能
• 基因功能的确定
基因的识别
预测基因组的全部编码区或称开放阅读框 架,目前基因组功能注释的一个主要方面。 一是评估未知DNA 片段编码可能性的概 率型方法,另一类是通过同源性比较搜寻蛋白 质库 / dbEST 库找寻编码区。 研究表明:鉴定和发现表达基因最快的途 径是确定cDNA 的部分序列,即EST ,这种序 列在大多数情况下已足够用于确认对应的基因。
功能基因组学简介
基因组DNA测序: 人类对自身基因组认识的第一步。 • 功能基因组学: 从基因组信息与外界环境相互作用的高度,阐 明基因组的功能。 • 功能基因组学的研究内容: –人类基因组 DNA 序列变异性研究 –基因组调控的研究 –模式生物体表达的研究 –生物信息学
功能基因组学的研究内容
• 基因的识别
蛋白质组研究技术
蛋白质组主要研究技术: 双向电泳 生物质谱技术 蛋白质芯片 酵母双杂交
双向凝胶电泳 样品制备(包括蛋白质的溶解、变性 及还原,从而去除非蛋白质杂质等)→ 第一向等电聚焦(根据蛋白质电荷差异 进行分离)→ 第二向SDS-PAGE(以蛋白 质分子量差异为基础)→蛋白质的检测 (用考马斯亮蓝、银染、铜染等方法) →图谱数字化分析(图象扫描、确定每 个蛋白质点的等电点和分子量,寻找差 异蛋白)
• SAGE可用于在不同环境、不同生理状态及不同生长阶段 的细胞和组织表达图谱构建,对不同状态下基因表达水平 的定量或定性比较,特别是对疾病组织与正常组织的比较 发展迅速;
SAGE 技术的主要理论依据:
• 来自转录物内特定位置的一小段寡核苷酸序列 (9~11bp)含有鉴定一个转录物特异性的足够信 息,可作为区别转录物的标签(tag); • 通过简单的方法将这些标签串联在一起,形成大 量多联体(concatemer),对每个克隆到载体的多 联体进行测序,并应用SAGE软件分析,可确定表 达的基因种类,并可根据标签出现的频率确定基 因的表达丰度(abundance)。
SAGE 步骤
1. 将5μg含有oligo dT(引物)的磁珠与 RNA混合。 2. 合成双链cDNA。 3. 用NlaⅢ酶消化形成一条链末端有标签 的产物。
4. 将样品分成两份,连接成含有识别序 列的产物,以备用BsmF1消化。 5. 用Mme I切割每一个样品形成约60bp 的标签。
6. 延伸5秒,连接成约130bp的双链标 签。