魔鬼在于细节—CRISPR发展简史(此文很长,笔者多年拜读文献有感)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
魔鬼在于细节—CRISPR发展简史(此文很长,笔者多年拜读文献有感)
订阅号APExBIO
美国时间2018年9月10日,美国联邦巡回上诉法院(CAFC)发布了一项重磅裁定,维持美国专利审判与上诉委员会(PTAB)的判决,将CRISPR基因组编辑专利授予隶属于哈佛大学与麻省理工学院的Broad 研究所。
美国专利及商标局宣布Broad研究所继续保有2014年获批的CRISPR-Cas9应用专利。
2017年2月15日,PTAB曾作出关键裁决,将CRISPR-Cas9基因编辑专利判定给张锋及Broad 研究所。
这意味着这项革命性的基因编辑工具的专利之争基本上尘埃落定。
自2012年CRISPR基因编辑技术横空出世以来,各路科研“豪杰”争相应用和发展该技术。
随着CRISPR系统趋于成熟,这一技术不再是简单的学术共享,谁拥有革命性基因编辑技术专利权的战争也出现了。
打官司的两方是美国加州大学伯克利分校生物学家Jennifer Doudna团队和美国哈佛大学-麻省理工学院Broad 研究所张锋团队。
CRISPR诞生将近6年,其中的发展过程曲曲折折。
虽然这项判决再次将Jennifer Doudna团队打入寒冬,但我们心里都清楚CRISPR基因编辑系统发展到今时今日所带来的影响,绝非是一个团队的功劳。
每个团队的表现都不可否认,都值得我们尊敬!让我们回顾一下长达6年的CRISPR发展简史!
CRISPR演义
自从CRISPR第一次被证明可以编辑细胞Genomic DNA以来一晃已经快6年了,笔者有幸在这个技术刚出来时就开始追踪和利用,受益匪浅,尤其是得益于张锋实验室的无私贡献,他们把各种最新的质粒几乎是第一时间免费放到Addgene供学术界使用。
2013到2015这两年,笔者几乎每一篇CRISPR文章都拜读了,随着时间的流逝,很多细节都不记得了,于是决定重新精读这批经典老文章。
随着时间的沉淀,返回去重读时,总是有很多事后诸葛亮的意见。
于是兴之所至,决定把自己的心得体会记下来,以免时间长了又遗忘了。
西方有句谚语:魔鬼在于细节,对于生物学研究尤其如此。
因此我的随笔都是纠结于细节,希望从细枝末节中看出一些端倪,加上自己的合理想象,猜测那些文章作者背后的想法。
事先声明,笔者不认识任何一个做CRISPR的大牛,不知道他们的任何八卦,所以这些想法都是猜测,算不得数,正所谓演义而已。
万一不幸被我猜中,也不担负任何泄密之责。
笔者不打算讲CRISPR在细菌里是怎么被发现的,以及一些牛人们是怎么根据DNA序列的相似性而猜出其作用机制的。
只从2012年8月Doudna和Charpentier的Science 文章开始谈起(这篇文章其实当年6月份就上线了)。
Science. 2012 Aug 17. PMID: 22745249.
西方科学的精髓就是还原法,对于我们不了解的东西,对它们敲敲打打,拆下一个零件看看
发生了什么;再多加一个零件,看看又发生了什么。
然后以此来想象一下它们是怎么工作的。
这就是生物学里的著名的”Loss of Function”和”Gain of Function”。
在这里,笔者就不再扯
那些遗传学里的东西了,比如什么筛选突变基因之类的。
只是想说由于CRISPR的出现,
使得Loss of function和Gain of Function在哺乳动物里的研究变成非常容易的东西。
书归正传。
在介绍这篇文章之前,先介绍几个名词。
crRNA, tracrRNA , sgRNA 和PAM。
还别说,前面这俩词,我这个记性不好的人以前是经常忘掉都指的是什么东西。
CRISPR RNA (crRNA):指的是一个含有42个碱基的小RNA,它的5’是20个可以和目标DNA配对的碱基,所以是可变的;它的3’是22个不变的碱基,术语叫”repeat”。
之所以叫”repeat”,大概是因为它在细菌DNA里重复很多次的原因。
trans-activating crRNA (tracrRNA):指的是一个大概含有87个碱基的小RNA,它的5’可以和crRNA的3’ “repeat”配对,术语叫做”anti-repeat”,除此之外,其它部分可以形成hairpin样的二级结构。
这俩RNA结合在一起后可以与Cas9结合,然后通过那20个可变的RNA识别含有PAM的genomic DNA。
因为现在最常用的是Cas9,而CRISPR有很多不同的亚类,所以为了不混淆,通常都是写为CRISPR-Cas9。
Single guide RNA (sgRNA):就是通过4个RNA碱基把crRNA和tracrRNA连接起来成为一个RNA。
Doudna和Charpentier率先创造,在in vitro证明可以工作,然后George Church组把它发扬光大,张锋组也笑纳之,并且开发出了另一个可以做CRISPR activation的牛逼东西。
此乃后话,暂且不表。
Protospacer Adjacent Motif (PAM):所谓的protospacer就是指那20个可以被识别的DNA序列,它的后面必须带几个比较特别的碱基,这几个碱基就是PAM。
对于Cas9来说就是NGG。
Cas9上有一个domain可以识别这个PAM,因为不同的Cas protein识别的PAM不同,所以这个domain在不同的Cas里不保守。
这篇Science文章如何牛逼咱就不提了,因为它会拿炸药奖的。
在这里我只讲那些细枝末节和事后诸葛亮的东西。
因为这篇文章发表之后半年多,张锋实验室和George Church实验室就率先在哺乳动物细胞里实现了基因编辑,发了两篇Science。
而Doudna晚了一小步,做的结果又不是特别漂亮,发了ELife。
还有一个陪跑的, MGH的Keith Joung在斑马鱼里实现了基因编辑。
那么Doudna有没有可能率先发表哺乳动物细胞编辑的文章呢?完全可以。
她们其实已经手握所有的东西,可惜要么是没有想到,要么是想偏了,竟然放着自己的特长不用,而用质粒来做。
这个呆会儿再说。
现在先说说张锋和George Church的两篇文章。
很明显,George Church组是在Doudna 和Charpentier的文章的启发下做的,为此他们用了两个牛人一起做,共同贡献第一作者;张锋组也是俩共同贡献第一作者,而Doudna组只有Jinek一个第一作者,加上其他打酱油的(这下明白Doudna组为什么被scoop了吧,我还怀疑她们发了Science后有些懈怠,度假去了)。
George Church组的开篇介绍就是他们看到了Doudna和Charpentier的文章,所以他们要做哺乳动物细胞编辑。
而且采用了Doudna和Charpentier率先使用的chimeric gRNA (就是把crRNA and tracrRNA通过4个碱基连接成一个,现在叫sgRNA),幸运的是Church 组用了original tracrRNA sequence,而没有采用Doudna和Charpentier试验过的短一点
的tracrRNA。
很不幸,Doudna组试验了自己在in vitro测试过可以工作的短的tracrRNA,当然她们也试了长的,估计因为是用的guide RNA 的效率不好,没有看到显著差别,都很差。
就因为这个,Doudna在她们后来发表的Cas9 structure的Science 文章里,连着两次单独引用Church组的文章,而没有包括张锋组的。
张锋组的文章的引用是和另外两篇文章一起引用的。
其中原因,耐人寻味。
当然这只是我的个人猜测,通过现象看到的,说不定是人家忘了呢,犯了个小错误呢。
张锋组的文章风格明显不一样,这或许是因为人家本来就已经在用CRISPR-CAS9做这个哺乳动物细胞基因编辑了。
一开始他们试了很多条件,要加nuclear localization signal让Cas9在细胞核里表达,为此还专门有一个图显示这个。
(话说当年报道韩春雨时,他也特意提到自己看到NgAgo在细胞核里表达时自己有多开心,不知道是不是受张锋启发,以为定位到细胞核里就肯定可以编辑了,然后编出了这么一篇折腾大牛们的故事。
扯远了。
)还试验了细菌CRISPR里需要的RNAaseIII等等,这些在Church组的文章里就没有。
这些都成为了张锋组独立开始做哺乳动物细胞基因编辑的有利证据。
当然张锋组也借鉴了Doudna 和Charpentier的文章,比如用了那个sgRNA的设计,也发现了短的不好用,长的才好用。
Sometimes, size does matter.
那么Doudna组到底有没有可能在2个月的时间做完哺乳动物细胞编辑,从而scoop其他人呢?完全有可能。
当然这些都是事后诸葛亮。
现在做基因编辑的载体工具数不胜数,有lentiviral vector, Adenoviral vector, AAV, cas9 mRNA plus crRNA:tracrRNA, cas9 RNP。
就是这个Cas9 RNP,全称是Cas9 ribonucleoprotein。
当时Doudna组已经有了所有的材料,只需要在Cas9上再加一个Nuclear Localization Signal,然后在细菌里面表达
纯化蛋白,这都是她们的拿手好戏。
把新的Cas9 蛋白和她们手里的crRNA:tracrRNA在体外混合一下,然后转染到293FT细胞里面,就可以了。
她们已经测试了好几个GFP的gRNA,也完全可以建一个293FT GFP reporter细胞系,然后做RNP转染。
不出俩月,肯定可以做完。
只可惜不知道当时她们为什么没有想到这个,而是舍近求远的用质粒来做转染,而且还只选了一个CLTA的gRNA,效果不好。
不禁让人惋惜。
另外一个让人费解的是Doudna 当时为什么不多放几个人上去,而只让一个人做。
估计是当时没有意识到竞争这么激烈。
也可能是某人不愿意其他人做自己的课题,这又涉及到科研里面的合作共赢的处理了,不是每个人都能够做到合作共赢的,大部分人都是想吃独食的。
可在这个世界上,这样做的结果往往就是双输。
当然竞争的好处就是我们这些吃瓜群众可以早点用上这么好的东西。
想当初,张锋他们组可是开了一个Google Groups,张锋亲自上去答疑。
而且更新换代是如此频繁,往往是旧的技术刚用上没有几个月,新的就出来了。
还记得同实验室的一个哥们率先使用,还是用Church组的方法,用GFP reporter 来测试gRNA好不好用。
很快张锋组就发了一个NBT文章,建立了可以预测gRNA off-target 的网站。
还用double nickase的方法来进一步降低off-target,并且做出了pX450之类的质粒。
这些还只能挑单克隆,紧跟着他们就发了用lenticrispr的方法做screening。
当时笔者都没有意识到lenticrispr knockout的效果竟然那么好,根本就不需要挑单克隆了。
他们又嫌lenticrispr (xpr001)的titer太低,特意做了一个二代,用CMV来促进lentivirus RNA的产生,这就是现在最流行的lenticrispr v2。
这还不算完,他们又做了一个Cas9 conditional transgenic mouse strain,可以很轻松的在老鼠上做很多以前不敢想的实验了。
现在我还记得这篇文章刚出来我把它发给老板后,他看到这篇文章的兴奋。
在这同时,陪跑的Keith Joung也不甘寂寞,发现了17-18nt gRNA 也可以工作,而且竟然可以提高特异性。
Stanley Qi也把不能切割只能结合DNA的dCas9玩到极致,又是做单分子跟踪,又是做CRISPRi 和CRISPRa。
话说CRISPRi刚出来时没有优化,那效果烂的一蹋糊涂,不忍直视。
幸好他们在dCas9上加了一个KRAB,可以把周围的DNA甲基化,才可以抑制的更好。
CRISPRa也是,至少有四种不同的方法,前几种刚出来时都不很好,那是因为dCas9上可以连接的transcriptional activators不够多。
于是Stanley Qi 和张锋用两种不同的策略改变了这个。
因为Cas9 RNP既有protein又有RNA,这两个都可以修饰。
Stanley Qi用修饰Cas9的方法,创造了Sun-tag;而张锋因为做出了Cas9-sgRNA structure,看到了sgRNA上的两个loop不和Cas9结合,创造性的接上了俩RNA aptamer,这样就可以把能够结合这个aptamer的蛋白和其他的transcriptional activator 融合,提高转录活性,这就是有名的SAM。
在这个竞争里,张锋落后了几年,但是他们的系统却是最好的之一,就是因为他们对细节知道的足够多,知识面足够广,才创造性的提出了解决方法。
同时,陪跑者们也做了很多东西,比如David Root做了一个可以预测Cas9切割on-target site 效率的网站。
其他一些大牛也加入了CRISPR library screening 的竞争。
这里就不多说了。
除了这些,David Liu还发明了单碱基编辑的方法,并且改造了spCas9的PAM识别,创造了xCas9,让它受到的限制进一步缩小。
张锋和其他人也开发了新的Cas9 ortholog。
比如saCas9,Cpf1,等等,它们有的小一些,可以克隆到package size 小的AAV里,有的特异性更好一些。
再说一下CRISPR screening。
这有两种,一种叫做pooled screening, 一种叫做arrayed screening。
对于pooled screening,就是利用lentivirus vector 来做,因为lentivirus vector 可以整合到细胞基因组里,而每个gRNA的序列不同,正好可以做barcode。
这样就可以把整个基因组的gRNA或者是感兴趣的一些基因(比如druggable genes)的gRNA lentivirus vectors混合在一起感染细胞,只要MOI足够低(通常是0.3),就可以保证一个细胞里只有一个gRNA copy。
然后你就可以对细胞做任何你想做的事情了。
对于arrayed screening,这又要回到crRNA:tracrRNA了,这时候不能把它们合体了,那样合成RNA的话太贵。
分开合成的话就便宜多了,这就类似于arrayed siRNA screening 了。
最后说一下CRISPR off-target的问题。
这个问题对于RNAi是太严重了,这么说吧,所有那些发现RNAi后细胞生长受抑制的实验,如果没有做rescue experiment,大部分可以怀疑是off-target导致的毒性。
当CRISPR刚出来时,因为也是RNA介导的识别,让惊弓之鸟的笔者非常担心off-target问题。
后来的一些改进,比如18nt gRNA,double nickase,espCas9等可以大幅度减少off-target。
再加上可以预测off-target的program,所以对于普通的应用,可以不用太担心了。
然而,最近的一篇文章又掀起了波澜,原来我们可以不用担心普通的off-target了,可是由于我们不知道的或许是细胞内DNA repair的原因,CRISPR可以在离on-target cleavage地方几千个碱基的地方造成一些突变,这就给利用CRISPR来做gene therapy留下了阴影。