S.pyogenesCas9蛋白的表达纯化及其活性抑制剂筛选的研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

硕士学位论文
S.pyogenes Cas9蛋白的表达纯化及其活性抑
制剂筛选的研究
RESEARCH ON THE EXPRESSION AND
PURIFICATION OF S.PYOGENES CAS9AND SCREENING OF ITS INHIBITIONS
王思涵
哈尔滨工业大学
2018年6月
国内图书分类号:Q71学校代码:10213
国际图书分类号:577.21密级:公开
理学硕士学位论文
S.pyogenes Cas9的表达纯化及其活性抑制剂
筛选的研究
硕士研究生:王思涵
导师:黄志伟教授
申请学位:理学硕士
学科:生物学
所在单位:生命科学与技术学院
答辩日期:2018年6月
授予学位单位:哈尔滨工业大学
Classified Index:Q71
U.D.C:577.21
Dissertation for the Master Degree in Science
RESEARCH ON THE EXPRESSION AND
PURIFICATION OF S.PYOGENES CAS9AND SCREENING OF ITS INHIBITIONS
Candidate:Sihan Wang Supervisor:Prof.Zhiwei Huang Academic Degree Applied for:Master of Science Speciality:Biology
Affiliation:School of Life Science and
Technology
Date of Defence:June,2018
Degree-Conferring-Institution:Harbin Institute of Technology
摘要
CRISPR/Cas9系统是由细菌与古生菌编码的适应性免疫系统,S.pyogenes Cas9属于Type II-A型CRISPR/Cas系统,包括CRISPR RNA(crRNA),反式激活CRISPR RNA(tracrRNA)和Cas9蛋白。

短的外源DNA片段插入到CRISPR基因座中,然后转录并加工成crRNA,crRNA和tracrRNA形成与目的DNA互补的双链RNA 结构并介导Cas9对标靶DNA的切割。

为了使CRISPR/Cas9更好的应用于基因组工程,将crRNA和tracrRNA融合形成single-giude RNA来介导Cas9对双链DNA 进行定点编辑。

目前CRISPR/Cas9已经成为基因组编辑和基因调节中的最常见并且最有力的工具。

但是S.pyogenes Cas9的活性一旦开启就无法关闭。

那么如何减少S.pyogenes Cas9过度激活或者长时间活性带来的基因编辑脱靶效应,以及如何对S.pyogenes Cas9的活性精确控制,是目前具有挑战性的科学问题。

本研究首先利用原核表达系统表达并纯化出S.pyogenes Cas9-的野生型和活性位点突变型蛋白,接着通过体外组装和纯化获得S.pyogenes Cas9-sgRNA以及S. pyogenes Cas9-sgRNA-dsDNA复合物。

在此基础上,本研究从3000多种化合物中筛选得到12种能够抑制S.pyogenes Cas9活性的小分子抑制剂。

并进行了抑制剂抑制机制的研究,通过GST-Pulldown,EMSA实验发现其中包括CAS编号为107316-88-1、25535-16-4、34157-83-0、545-47-1、519-23-3和1617-53-4的6种小分子抑制剂通过抑制S.pyogenes Cas9蛋白与DNA的结合发挥作用,而另外6种包括CAS编号为518058-84-9、48208-26-0、6902-91-6、2610-5-1、1001645-58-4和137-66-6的小分子则通过不同的机制实现对S.pyogenes Cas9蛋白活性的抑制作用。

本研究提供能够抑制S.pyogenes Cas9的核酸酶活性的小分子抑制剂,有助于CRISPR/Cas9抑制剂的开发,并且对CRISPR/Cas9技术进一步推广有着重要意义。

关键词:S.pyogenes Cas9;CRISPR/Cas9系统;蛋白纯化;药物筛选
Abstract
CRISPR/Cas systems are adaptive immune systems evolved by bacteria and archaea,The well-characterized S.pyogenes Cas9system,which belongs to type II-A CRISPR subtype include CRISPR RNA(crRNA),transactivating CRISPR RNA (tracrRNA)and Cas9protein.The small invading nucleic acids insert in CRISPR locus, then CRISPR locus transcript and process into mature crRNA.Cas9proteins use crRNA and tracrRNA dsRNA to mediate cleavage of phage nucleic DNA or plasmids which have complementary sequence to the crRNA.To make CRISPR/Cas9more suitable for gene engineering,crRNA and tracrRNA are fused to form single-giude RNA to mediate the site-directed editing of double-stranded DNA by Cas9.S.pyogenes Cas9which combines with a synthetic single-guide RNA(sgRNA)has been harnessed as the most common and powerful tool for gene editing and gene regulation in various organisms. However,the activity of S.pyogenes Cas9cannot be turned off so long as it is turned on. Now,one of the most challenging scientific problem is how to off-target genome edits caused by excessive or prolonged S.pyogenes Cas9activity,and how to control the activity of S.pyogenes Cas9precisely.
In this project,the wild-type and active site-mutated proteins of S.pyogenes Cas9 were first expressed using a prokaryotic expression systend and purified.Then S.pyogenes Cas9-sgRNA and S.pyogenes Cas9-sgRNA-dsDNA complexes are assembled and purificated in vitro.On this basis,this study expounds12kinds of small molecule inhibitors from more than3000compounds which are capable of inhibiting the activity of S.pyogenes Cas9.Through GST-Pulldown and EMSA experiments the inhibition mechanism of inhibitors was expounded.There are six kinds of small molecules inhibiting the binding of S.pyogenes Cas9protein to DNA(CAS numbers include107316-88-1,25535-16-4,34157-83-0,545-47-1,519-23-3and1617-53-4), while there are the other six inhibitors inhibiting the activity of S.pyogenes Cas9 protein through different mechanisms(CAS numbers include518058-84-9, 48208-26-0,6902-91-6,2610-5-1,1001645-58-4,and137-66-6).
This study provides small-molecule inhibitors that can inhibit the nuclease activity of S.pyogenes Cas9.It is meaningful for the resesrch of CRISPR/Cas9inhibitors and great significant for the further promotion of CRISPR/Cas9technology. Keywords:S.pyogenes Cas9,CRISPR/Cas9system,protein purification,drug screening
目录
摘要 (I)
Abstract (II)
第1章绪论 (1)
1.1课题研究的背景及意义 (1)
1.2CRISPR/Cas系统 (1)
1.2.1CRISPR/Cas系统的结构与组成 (1)
1.2.2CRISPR/Cas系统的作用机制 (2)
1.2.3CRISPR/Cas系统的分类 (4)
1.2.4CRISPR/Cas系统的应用 (5)
1.3CRISPR/Cas9 (6)
1.3.1CRISPR/Cas9的研究背景 (6)
1.3.2S.pyogenes Cas9及其核酸复合物的结构分析 (6)
1.3.3CRISPR/Cas9与ZFN和TALEN的比较 (9)
1.4CRISPR/Cas系统与噬菌体的共进化 (11)
1.4.1细菌对抗噬菌体的防御系统 (11)
1.4.2噬菌体抵抗细菌的防御系统 (12)
1.5CRISPR/Cas9的脱靶效应 (13)
1.5.1CRISPR/Cas9系统存在脱靶效应的原因 (13)
1.5.2CRISPR/Cas9系统中脱靶效应的机制研究 (14)
1.5.3脱靶检测方法 (14)
1.6小分子作用于CRISPR/Cas9系统的研究 (15)
1.6.1小分子促进CRISPR/Cas9系统的研究 (15)
1.6.2小分子抑制CRISPR/Cas9系统的研究 (16)
1.6.3小分子降低CRISPR/Cas9系统脱靶效应的研究 (16)
1.7本文的主要研究内容 (16)
第2章实验材料试剂与方法 (18)
2.1实验材料 (18)
2.1.1蛋白质的原核表达系统 (18)
2.1.2小分子药物 (18)
2.2实验试剂 (18)
2.2.1克隆阶段所用试剂 (18)
2.2.2RNA纯化所用试剂 (19)
2.2.3蛋白纯化所用试剂 (19)
2.2.4其他试剂 (19)
2.3主要实验仪器 (19)
2.4实验方法 (20)
2.4.1构建表达载体 (20)
2.4.2S.pyogenes Cas9蛋白的表达方法 (23)
2.4.3S.pyogenes Cas9蛋白的纯化方法 (24)
2.4.4S.pyogenes Cas9蛋白位点突变及表达与纯化 (24)
2.4.5sgRNA的体外纯化方法 (25)
2.4.6S.pyogenes Cas9-sgRNA复合物的纯化 (30)
2.4.7小分子药物的筛选 (30)
2.4.8GST-Pulldown实验 (31)
2.4.9EMSA实验 (32)
2.4.10蛋白结晶 (33)
第3章S.pyogenes Cas9蛋白的表达与纯化 (34)
3.1引言 (34)
3.2野生型S.pyogenes Cas9蛋白的表达与纯化 (34)
3.2.1重组质粒的构建 (34)
3.2.2野生型S.pyogenes Cas9蛋白的表达 (34)
3.2.3野生型S.pyogenes Cas9蛋白的纯化 (35)
3.3突变型S.pyogenes Cas9蛋白的表达与纯化 (37)
3.4sgRNA的体外纯化 (39)
3.5S.pyogenes Cas9-sgRNA和S.pyogenes Cas9-sgRNA-DNA的纯化 (40)
3.6讨论 (40)
3.7本章小结 (42)
第4章抑制剂的筛选及其作用原理 (43)
4.1引言 (43)
4.2前期小分子化合物的筛选 (43)
4.3小分子化合物抑制原理的探究 (45)
4.3.1GST-Pulldown探究小分子化合物抑制原理 (45)
4.3.2EMSA探究小分子化合物抑制原理 (46)
4.3.3S.pyogenes Cas9与小分子化合物晶体的获得 (47)
4.4讨论 (48)
4.5本章小结 (49)
结论 (50)
参考文献 (51)
哈尔滨工业大学学位论文原创性声明和使用权限 (57)
致谢 (58)
第1章绪论
1.1课题研究的背景及意义
CRISPR/Cas9系统是由约90%古细菌和50%细菌编码的适应性免疫系统,以防止噬菌体侵入[1]。

在打靶过程中,CRISPR/Cas9系统通过sgRNA-Cas9体系使间区序列邻近基序(Protospacer Adjacent Motif,PAM)3’端与sgRNA互补的目标DNA 产生双链断裂(Double-Strand Breaks,DSB),之后细胞通过非同源末端连接(Non-Homologous End Joining,NHEJ)或者同源介导的双链DNA修复(Homology-Directed Repair,HDR)对DNA进行修复,以实现对基因组的改造[2-4]。

基于对Cas蛋白的研究,CRISPR/Cas系统可分成I至VI6种类型以及19种亚型。

目前已得到充分表征的S.pyogenes Cas9系统属于II型CRISPR系统,其通过PI 结构域识别PAM区段而招募靶标双链DNA(dsDNA)[5]。

S.pyogenes Cas9与sgRNA 的组合,已成为基因组编辑和基因调节中的最常见和有力的工具。

在实际的应用当中,S.pyogenes Cas9表现出很强的基因编辑优势,但是Cas9的活性一旦开启就无法关闭,Cas9在细胞内停留时间越长,脱靶编辑的可能性越大,那么如何减少Cas9过度激活或者长时间活性带来的基因编辑脱靶效应,如何精确控制Cas9的活性是一个具有挑战性的科学问题之一。

然而目前仍然缺乏控制Cas9活性、由此降低由过度Cas9活性导致的编辑脱靶的工具。

之前的一些报道已发现一些Anti-CRISPR蛋白可以抑制Cas9的核酸酶活性[6],但是与Anti-CRISPR 蛋白相比,小分子药物具有很多优势,比如小分子更容易进入细胞,易生产,便于储存等,具有抑制CRISPR/Cas9系统的小分子药物仍有待阐释与开发。

所以本课题想要筛选抑制S.pyogenes Cas9活性的小分子药物,寻找CRISPR/Cas9的制动开关,并初步探究其抑制原理。

1.2CRISPR/Cas系统
1.2.1CRISPR/Cas系统的结构与组成
CRISPR基因座包含短的部分回文DNA重复序列,它们以规则的间隔形式形成交替重复元件(CRISPR重复序列)和可变序列(CRISPR间隔序列)的基因座。

这些特有的基因座在1987年首次被观察到,后来发现这些基因座通常伴随CRISPR 相关(Cas)基因侧翼如图1-1所示。

通常,CRISPR-Cas系统及其元件是高变异的,并且在基因组中出现时其基因,序列,数量和大小方面差别很大。

它由一系列高度保守的短DNA重复序列(R)组成(通常长度为21-48bp),并且被称为间隔
区(S)的一段可变序列间隔开(通常在26-72bp之间),事实上CRISPR重复序列(R)可以广泛地在23-55nt变化,并且由于它们的部分回文序列的性质使得它们可以形成发夹结构[2]。

在数量上,已经报道了包含高达588个重复序列的阵列,但是在大多数情况下它们少于50个单位。

同样,尽管在甲硫球菌属中报道了多达19个不同的基因座,并且在甲硝基鹅肝菌属中发现了25个假定的CRISPR基因座,但是实际上每种生物体通常只包含一至两个CRISPR基因座。

Cas基因种类丰富,在不同的CRISPR/Cas系统中具有不同的Cas蛋白。

一些报道表明,Cas位点可能参与编码核酸酶,解旋酶,聚合酶和各种RNA结合蛋白。

Cas基因在CRISPR/Cas系统系统中可以编码Cas核酸酶,具有识别以及切割目的DNA的作用,例如Cas9基因编码Cas9核酸酶[2-4,7]。

图1-1CRISPR/Cas基因座[2]
1.2.2.CRISPR/Cas系统的作用机制
噬菌体入侵细菌之后大量复制并且杀死宿主细胞,因此从细菌的角度来说,噬菌体对细菌构成了致命的危害[4],细菌已经发展出了多种抵抗噬菌体机制,例如,细菌突变受体从而干扰病毒附着到细胞表面,当病毒DNA进入细胞时使用限制性酶破坏病毒DNA,甚至实施自杀方式以防止细菌群体中的产生的病毒繁殖[8-10]。

一般而言,这些抗噬菌体防御屏障通常保护细菌免受其他侵入性DNA分子如质粒和其他整合成分,另外,细菌已经进化出天然的自适应性免疫系统—CRISPR/Cas 系统[7],CRISPR/Cas系统具有入侵的特异性,适应性和遗传性。

CRISPR/Cas机制被分为三个主要阶段:(1)适应或间隔物的获取阶段,(2)crRNA表达与处理阶段,(3)干扰和沉默阶段,如图1-2所示。

1.2.2.1适应阶段
这一阶段中,入侵DNA短片段整合到CRISPR基因座,在整个CRISPR/Cas 系统中基本一致,包括Cas1和Cas2蛋白,以及Cas4以及Cas9(II型系统)的参与。

Cas1是一种采用独特的α螺旋折叠的整合酶,它通过切割重复片段中的特定位点来介导新的间隔区插入CRISPR阵列。

Cas2是许多抗毒素系统中的mRNA干扰
素的同系物,但其作用尚不清楚。

已显示Cas2在大肠杆菌I型CRISPR/Cas系统中与Cas1形成复合物,并且是适应性期所必须的[11],但是尽管Cas2具有RNase 和DNase的活性,但其催化残基对于适应性阶段并不是必须的,这表明这些活动并不直接参与这个过程。

来自侵入DNA的间隔物前体(原间隔子)的选择是通过识别原-间隔物-邻近基序(PAM)来确定,PAM通常只有几个核苷酸长,并且在CRISPR/Cas系统的变体之间不同[12]。

图1-2CRISPR/Cas系统的作用机制[13]
1.2.2.2crRNA合成阶段
CRISPR/Cas介导的免疫的第二阶段是crRNA表达。

在此期间CRISPR基因座的长初级转录(pre-crRNA)产生并加工成短的成熟的crRNA[14]。

在表达阶段,pre-crRNA与crRNA多亚基效应复合物或者II型系统中与Cas9结合,并在RNA 核酸内切酶(在I型和III型系统中通常为Cas6)的催化下完成,在Type II类型中(链球菌Streptococcus pyo基因中发现)中反式编码的小RNA(tracrRNA)充当前crRNA处理的指导,对于这种类型的CRISPR系统,核糖核酸酶III和反式激活CRISPR RNA(tracrRNA)共同促进crRNA的成熟[12]。

1.2.2.3干扰阶段
在I型和III型系统中的crRNA效应复合物或在II型系统中的Cas9将核酸酶活性与特异的RNA结合结构域相结合,靶标DNA的结合依赖于与crRNA的间隔区域形成互补的碱基对[12,14]。

对于目标的切割,在I型系统中的是通过HD家族核酸酶(Cas3或Cas3中的结构域)催化,在III型系统中通过Cas7和Cas10蛋白的组合作用催化,而在II系统中通过Cas9催[4]。

在I型系统中,HD核酸酶结构域既与超家族2解旋酶Cas3融合又被单独的基因Cas3编码,而在III型系统中,独
特的HD核酸酶结构域与Cas10融合在干扰期间切割单链DNA。

在II型系统中,Cas9的RuvC样核酸酶结构域和HNH核酸酶结构域分别切割靶DNA的一条链。

对于II型系统中基于CRISPR的免疫(适应,表达和干扰)的所有三个功能步骤,都需要大的多结构域Cas9蛋白(约1368个氨基酸),因此CRISPR/Cas9系统的大部分功能都集中在这一个蛋白质上,其功能及其重要,crRNA中的种子序列和靶标中的保守原型间隔子邻接基序(PAM)序列对于Cas9介导的切割也是至关重要的[12-15]。

1.2.3.CRISPR/Cas系统的分类
CRISPR/Cas系统的分类理想地代表CRISPR/Cas基因座之间的进化关系。

但是CRISPR是一个复杂的进化关系网络,这个关系网络很难分成少数几个不同的分组,所以研究人员首先确定每个CRISPR/Cas基因座中的所有Cas基因,然后确定可以将这些基因座分配到不同类型和亚型的特征基因和独特的基因结构[16-18]。

1.2.3.1Class1系统
Class1类CRISPR/Cas系统分类的依据是多基因crRNA效应复合物的存在。

该类别包括I型和III型CRISPR-Cas系统,以及新型IV型。

I型CRISPR-Cas系统:所有I型CRISPR-Cas都含有特征性基因Cas3[18]。

HD家族内切酶结构域参与靶DNA的切割,而解旋酶结构域与其融合。

HD结构域通常位于Cas3蛋白的氨基末端或由单独的基因编码(Cas3)[19]。

I型系统目前分为7个亚型,I-A至I-F和I-U[20-21]。

III型CRISPR/Cas系统:所有III型系统都具有标志性基因Cas10,其编码一个多结构域蛋白质,并且Cas10是III型crRNA效应复合物的最大亚基。

Cas10蛋白在不同的III型CRISPR/Cas系统中是不同的[15]。

III型基因座也编码小亚基蛋白质,例如一个Cas5蛋白质和典型的几个旁系同源Cas7蛋白质。

与I型相比,Cas10的结构域其包含保守基序的环状排列[20]。

III型系统又分为4个亚型,III-A 至III–D。

III-A(Csm单元)和III-B(Cmr单元)可以通过编码小亚基Csm2和Cmr5被区分[17]。

III-D和III-C分别是来自III-A和III-B的变体。

亚型III-C(以前称为MTH326-like33)的显着特征是Cas10的环化酶样结构域的明显失活,伴随着该蛋白序列的极端分化。

亚型III-D基因座通常编码Cas10蛋白,但是此类CRISPR/Cas系统却缺少了HD结构域。

它们还含有独特的Cas5样基因,称为Csx10。

新型IV型:IV型系统是由几种细菌基因组含有推定的,功能上未表征。

IV 型系统编码预测的最小多基因crRNA-效应复合物,其由部分降解的大亚基Csf1,Cas5和Cas7组成,并且在一些情况下包含推定的小亚基[8]。

1.2.3.1Class2系统
第2类CRISPR/Cas系统由含有单个亚基crRNA效应因子来定义。

该类别包括II型和V型CRISPR/Cas系统。

II型CRISPR/Cas系统:II型CRISPR/Cas系统与I型和III型有着显着的区别,并且在基因数目方面是迄今为止最简单的。

II型的标志性基因是Cas9,它编码一个多结构域蛋白,具有crRNA效应复合物和切割标靶DNA的功能,在适应阶段也存在着作用[8-10,21]。

除Cas9之外,所有鉴定的II 型CRISPR/Cas基因座都含有Cas1和Cas2,大多数II型基因座也编码tracrRNA,其部分与相应CRISPR阵列内的重复序列互补。

II型CRISPR/Cas系统目前被分为三种亚型,亚型II-A系统包括额外的基因Csn2,其被认为是该亚型的标志基因,如化脓性链球菌Streptococcus pyogenes Cas9。

亚型II-B缺少Csn2,但包括Cas4。

此外,亚型II-B Cas1和Cas2与I型同系物的关系比II-A亚型更密切,这也说明了II-B亚型的一种重组来源[22]。

亚型II-C基因座仅有三个蛋白编码基因(Cas1、Cas2和Cas9),并且是细菌中最常见的II型CRISPR/Cas系统。

如脑膜炎奈瑟球菌Nme Cas9。

在Cas9系统发育中,II-A和II-B亚型是单系性的,而II-C亚型是II-A的同系系统[23]。

V型CRISPR/Cas系统:Cpf1的基因存在于几个细菌基因组和一个古细菌基因组中,与Cas1,Cas2和CRISPR阵列相邻,其也是第五种类型的CRISPR/Cas 系统的标志性蛋白,即V型,Cpf1是一种大蛋白质(大约1300个氨基酸),其含有与Cas9的相应结构域同源的RuvC样核酸酶结构域,IS605家族转座子的TnpB 蛋白,Cas9的特征富含Arg的区域的假定的对应物,以及TnpB的锌指结构。

然而,Cpf1缺乏存在于Cas9蛋白中的HNH核酸酶结构域[20]。

鉴于存在预测的单亚基crRNA效应复合物,推定的V型系统被分配至2类CRISPR/Cas。

某些假定的V 型基因座也编码Cas4,因此类似于亚型II-B基因座,而另一些基因座缺乏Cas4,并且在架构上与II-C亚型更为相似[22,24]。

1.2.4CRISPR/Cas系统的应用
CRISPR/Cas系统的应用非常广泛,在医疗领域许多应用CRISPR/Cas9技术被报道。

例如,据报道CRISPR/Cas9具有编辑成年动物的基因组并且修正人类遗传疾病的能力[11,16-18,20]。

另外,导致白内障的Crygc基因中的显性突变的小鼠可以通过共注射Cas9mRNA的合子和靶向突变等位基因的单引导RNA(sgRNA)的方法获得救治,并且通过基因编辑以后的后代也得到改善,因此表明了使用CRISPR/Cas9系统可以纠正遗传疾病[25]。

除此之外,研究者使用CRISPR/Cas9系统在精原细胞(SCCs)中将突变EGFP基因或内源Crygc基因移植到不育小鼠睾丸的生精小管后,突变的SSC出现了精子发生并产生圆形精子细胞,在注射到成
熟卵母细胞后,显示出现相应突变表型的杂合子代,通过SSC实验表明遗传修饰引入可以利用CRISPR/Cas9引入[26]。

研究者以单一和多重配置使用Cas9/guide RNA(gRNA)系统有效地编辑了HIV-1LTR U3区域内高度特异性的靶点。

此外表达Cas9的细胞内gRNA的存在阻止了HIV-1感染,表明Cas9/gRNA可以被设计成提供针对艾滋病的特异性,并且有效的预防和治疗方法[27]。

在动物科学领域,CRISPR/Cas9技术成功地编辑了小鼠(Mus musculus),大鼠(Rattus norvegicus)和秀丽隐杆线虫(Caenorhabditis elegans)的基因组[27-30].
在微生物领域的CRISPR/Cas系统的应用也有了很大的突破。

比如研究者在酿酒酵母中使用II型细菌CRISPR/Cas系统进行基因组工程,其结果显示CRISPR/Cas 靶向双链断裂可以将单链和双链寡核苷酸供体的同源重组率分别提高5倍和130倍[31-36]。

1.3.CRISPR/Cas9
1.3.1CRISPR/Cas9的研究背景
基因编辑技术(genome editing or genome editing with engineered nucleases)被广泛应用于细胞、医学、遗传、等多种领域[32]。

现在最普遍的一种基因编辑工具是由CRISPR/Cas9Type II型系统改造而成的,其中产脓链球菌(Streptococcus pyogenes SF370)的系统尤其被广泛应用。

I型和III型系统具有一些相似的特征:pre-crRNA通过专门的Cas核酸内切酶加工,成熟为crRNA,接着与Cas蛋白共同组成Cas蛋白复合物,其具有识别和切割DNA的作用[18]。

TracrRNA、RNase III 和Cas9介导前体pre-RNA成熟并且形成核糖核蛋白复合物介导外源遗传物质切割。

Cas9被认为是负责crRNA引导的外源DNA沉默的唯一蛋白[37,38]。

在CRISPR/Cas9基因编辑工具的改造中,Martin等做出了巨大的贡献,他们的研究表明Cas9内切酶具有两个结构域可以用单个RNA分子进行编程以切割特定的DNA位点,靶DNA中与crRNA互补的和非互补的两条链分别被结合了tracrRNA:crRNA的Cas9蛋白中HNH和RuvC结构域切割[36]。

tracrRNA对于识别靶位点也是必须的,tracrRNA的5'端与crRNA3'端可以根据碱基互补配对原则形成大约13bp的茎环结构。

Cas9的目标识别需要crRNA中的种子序列和与DNA靶标中的crRNA结合区域相邻的含GG二核苷酸的PAM序列。

研究人员将tracrRNA和crRNA结合形成一种嵌合的RNA(sigle guide RNA,sgRNA)其功能与tracrRNA:crRNA的功能一样。

1.3.2S.pyogenes Cas9及其核酸复合物的结构分析
Cas9蛋白在细菌界非常丰富,在序列和大小上都有很大差异。

所有已知的Cas9
酶都含有HNH结构域以及RuvC核酸酶结构域,HNH切断与crRNA互补的DNA 链,RuvC断裂非互补链,其结果可以产生双链DNA断裂(DSBs)。

此外,Cas9核酸酶含有一个高度保守的精氨酸富集区域(富含Arg),该区域以前被认为可以介导核酸结合。

根据分类,II型CRISPR/Cas9系统又分为为三个亚家族:II-A,II-B 和II-C。

在II-A和II-C亚家族中发现的Cas9蛋白通常分别含有大约1100-1400个氨基酸[39,40]。

1.3.
2.1S.pyogenes Cas9的结构
S.pyogenes Cas9(化脓链球菌Cas9,Streptococcus pyogenes Cas9)蛋白质共1368个氨基酸,如图1-3所示。

是由保守的RuvC和HNH结构域组成的典型的II-A 型Cas9蛋白,其结构与已知的蛋白结构没有明显的相似性[41]。

基于Cas9的生物化学特征,目前S.pyogenes Cas9被改造成最常用的CRISPR的基因工程工具。

S. pyogenes Cas9是近似尺寸为100Å×100Å×50Å的新月形分子。

该核酸酶采用独特的双叶结构,识别(REC)裂片和核酸酶(NUC)裂片,如图1-4所示[42]。

REC 叶可分为三个区域,称为桥螺旋BH(残基60-93),REC1结构域(残基94-179和308-713)和REC2结构域(残基180-307)。

NUC叶由RuvC(残基1-59,718-769和909-1098),HNH(残基775-908)和PAM-相互作用(PI)(残基1099-1368)结构域组成。

RuvC结构域形成核酸酶叶片的结构核心,由四个α螺旋环绕成β片层结构组成,所有三个保守基序都为活性位点充当催化残基。

HNH和RuvC结构域并列在S.pyogenes Cas9结构中,它们的活性位点相距约25Å。

HNH结构域的活性位点在S.pyogenes Cas9蛋白晶体中排列并不稳定,表明活性位点可能在核酸结合后发生构象排序。

S.pyogenes Cas9的C末端区域含有β-β-α-β希腊关键结构域,其与拓扑异构酶II中发现的结构域具有结构相似性。

混合的α/β区域(C末端结构域,S.pyogenes Cas9残基1201-1363)在核酸酶结构域叶上形成突起。

S.pyogenes Cas9的两半结构通过两个连接区段连接,一个由富含Arg的区域(S.pyogenes Cas9残基59-76)形成,另一个由包含S.pyogenes Cas9残基714-717的无序连接物连接,埋在S.pyogenes Cas9中两个结构叶片之间的总表面积为1034Å。

对于单独的S. pyogenes Cas9结构总体呈现一种开放的状态,当有sgRNA存在时可以方便结合在S.pyogenes Cas9蛋白的凹槽中。

图1-3S.pyogenes Cas9结构域组织示意图[47]
图1-4S.pyogenes Cas9结构图[41]
1.3.
2.2S.pyogenes Cas9-sgRNA结构
crRNA通过碱基配对与tracRNA结合形成tracRNA-crRNA复合物,此复合物引导核酸酶Cas9蛋白在与crRNA配对的序列靶位点剪切双链DNA。

而通过人工设计这两种RNA,融合形成有引导作用的sgRNA,其长度一般80-100nt。

S.pyogenes Cas9-sgRNA二元复合物的总体结构显示出核酸酶的预靶向结合状态,有些类似于结合靶标DNA状态时的双叶结构,sgRNA位于核酸酶和螺旋识别裂片之间的中央通道中,如图1-5。

这种结构中结合有sgRNA的突变型S.pyogenes Cas9复合物(D10A/H840A,被称为dCas9)被广泛使用。

在sgRNA结合后与靶DNA识别前的这段时间里S.pyogenes Cas9的构象十分灵活性sgRNA的结合驱动了S.pyogenes Cas9蛋白质内的主要构象变化,如图1-5:螺旋识别叶在sgRNA结合之后和DNA结合之前经历重大的重排,尤其是在螺旋结构域3中,向HNH结构域移动了约65Å。

将S.pyogenes Cas9-sgRNA预靶向结合复合物叠加到靶DNA 结合结构上显示出进一步的构象变化。

sgRNA的结合触发S.pyogenes Cas9中PAM 识别区域的排序。

在没有sgRNA的情况下,S.pyogenes Cas9中与PAM相互作用的C-末端结构域(CTD)在很大程度上是无序的,但是,在S.pyogenes Cas9-sgRNA 预靶向结合复合物和靶DNA结合结构中,PAM相互作用CTD结构域被构建为容纳PAM双链体。

参与5'-NGG-3'PAM识别的两个关键精氨酸残基(Arg1333和Arg 1335)预定位于Cas9-sgRNA结构中以识别非靶DNA链上的GG二核苷酸[38]。

S. pyogenes Cas9-sgRNA的这种结构是存在与S.pyogenes Cas9蛋白与S.pyogenes Cas9-sgRNA-DNA复合物结构之间的一种中间态。

图1-5S.pyogenes Cas9-sgRNA复合物结构[41]
1.3.
2.3S.pyogenes Cas9-sgRNA-DNA的结构
结合了sgRNA的S.pyogenes Cas9可以靶向特定的基因组基因座[42]。

研究者报道了分辨率为2.5Å的S.pyogenes Cas9-sgRNA-DNA的晶体结构,结构如图1-6。

从该结构中能够看出由目标识别裂片和核酸酶裂片组成了的双叶结构,DNA结合在复合物的凹槽中,结合sgRNA和DNA的作用是利用识别叶结构域的,核酸酶叶负责断裂DNA双链。

核酸酶叶还含有负责与原型间隔子相邻基序(PAM)相互作用的羧基末端结构域。

总体看S.pyogenes Cas9-sgRNA-DNA的结构呈现一种开放的状态。

图1-6S.pyogenes Cas9-sgRNA-dsDNA复合物结构[38]
1.3.3CRISPR/Cas9与ZFN和TALEN的比较
目前主要用于基因编辑的人工内切酶包括,第一代人工核酸内切酶----锌指核酸内切酶(zinc finger endonuclease,ZFN),第二代人工核酸内切酶----类转录激活
因子效应物核酸酶(transcription activator-like effector nuclease,TALEN)以及CRISPR-associated(Cas9)系统被改造为第三代人工核酸内切酶[44]。

1.3.3.1锌指核酸内切酶
锌指是一种DNA结合基序,在真核生物中非常常见,它的的结构很保守,每个锌指基序可以识别3bp的碱基序列,锌指核酸内切酶是由几个Cys2His2类型的锌指串联并与核酸内切酶-Fox I结合从而形成的核酸内切酶,可以特异性的识别DNA序列并形成双链切口。

到目前为止,果蝇、大鼠、小鼠、人类iPS细胞和斑马鱼等领域都实现了锌指核酸内切酶的基因编辑。

但是,锌指核酸内切酶也有着很多的缺点,比如特异性低,成本昂贵,并且制备复杂等[43]。

1.3.3.2类转录激活因子效应物
序列特异性DNA结合结构域和非特异性DNA切割模块嵌合形成TALEN,并且成为第二代人工核酸内切酶[50]。

最初描述于黄单胞菌属植物病原体中的转录激活物样效应物(TALE)蛋白可作为新的DNA结合结构域[43-45]。

TALE包含一个中央区域,该区域拥有33-35个氨基酸重复模块阵列。

除了第12和13位的两个相邻氨基酸以外,每个重复的氨基酸序列几乎相同。

DNA结合特异性分别由具有由NI (Asn Ile),HD(His Asp),NN(Asn Asn/NK(Asn Lys)和NG(Asn Gly)识别的A、C、G、T的RVD确定[51]。

以二聚体发挥作用的Fok I与DNA结合结构域组合在一起可以断裂DNA并且产生DSB。

两个TALE结合位点之间有大概12-20 bp的间隔序列用来确定DNA靶位点的位置。

理论上,TALENs可以识别任何序列的DNA结合结构域。

由于它们的密码子较简单,TALEN具有比以前的核酸酶ZFN 更高的靶向灵活性和效率,并且脱靶效应也降低,与ZFN类似TALEN也是利用特异性DNA识别蛋白与核酸内切酶结合而成。

1.3.3.3CRISPR/Cas9
细菌的适应性免疫系统被成功改造成比锌指核酸内切酶和类转录激活因子效应物更加简单的CRISPR/Cas9技术,为了对不同的DNA序列进行基因编辑只需要变化guide RNA就可以实现。

II型CRISPR涉及CRISPR RNA(crRNA),反式激活tracrRNA和Cas9蛋白。

短的外源DNA片段被捕获到CRISPR基因组基因座,然后转录并加工成crRNA,其在确定靶向DNA序列中起关键作用。

在来自化脓链球菌的II型CRISPR/Cas系统中,PAM序列是NGG。

Cas9是一种双链DNA内切酶,通过引导crRNA和tracrRNA切割特定位点以产生DSB。

由于CRISPR/Cas9被应用于基因组工程,因此已经简化其结构。

嵌合RNA由crRNA和tracrRNA衍生的序列组成,被设计并命名为引导RNA(gRNA)[41]。

受其工作机制的启发,可重新设计crRNA或gRNA以识别任何DNA序列并使Cas9指导序列特异性DSB。

更重要的是,研究者设计出一个类似的相对简单的CRISPR干涉(CRISPRi)平台。

相关文档
最新文档