T7-RNA聚合酶突变体及其应用[发明专利]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202110044261.3
(22)申请日 2021.01.13
(71)申请人 华中科技大学
地址 430000 湖北省武汉市洪山区珞喻路
1037号
(72)发明人 朱斌 吴慧
(74)专利代理机构 南京纵横知识产权代理有限
公司 32224
代理人 徐瑛
(51)Int.Cl.
C12N 9/12(2006.01)
C12P 19/34(2006.01)
C12Q 1/686(2018.01)
(54)发明名称
T7-RNA聚合酶突变体及其应用
(57)摘要
本发明公开一种T7‑RNA聚合酶突变体,这种
突变体是将野生型T7‑RNA聚合酶的氨基酸序列
的从N端开始第43位的丝氨酸被A类氨基酸或B类
氨基酸替代后得到的。
A类氨基酸为酪氨酸、苯丙
氨酸、亮氨酸、赖氨酸或天冬氨酸,B氨基酸为色
氨酸、异亮氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷
氨酸或脯氨酸。
上述这种T7‑RNA聚合酶突变体适
合内部含有终止信号的RNA以及末端形成发夹结
构的RNA的合成,在体外转录、RNA合成、基因编
辑、RNA药物合成、体内蛋白质表达或无细胞蛋白
表达体外翻译系统、转录终止子研究、RNA依赖的
RNA聚合酶活性研究、生物学转录调控元件合成
等方面均能具有广泛应用。
权利要求书1页 说明书6页序列表11页 附图3页CN 112831484 A 2021.05.25
C N 112831484
A
1.T7‑RNA聚合酶突变体,其特征在于,从SEQ ID NO.1所示的野生型T7‑RNA聚合酶的氨基酸序列的N端开始第43位的丝氨酸被酪氨酸、苯丙氨酸、亮氨酸、赖氨酸或天冬氨酸替代的突变体。
2.权利要求1所述T7‑RNA聚合酶突变体在体外转录中的应用。
3.权利要求1所述T7‑RNA聚合酶突变体在非编码RNA合成中的应用。
4.权利要求3所述的应用,其特征在于,所述非编码RNA为sgRNA、tRNA、mRNA、siRNA、snoRNA或寡核苷酸。
5.权利要求1所述T7‑RNA聚合酶突变体在基因编辑中的应用。
6.权利要求1所述T7‑RNA聚合酶突变体在RNA药物合成中的应用。
7.权利要求1所述T7‑RNA聚合酶突变体在体内蛋白质表达或无细胞蛋白表达体外翻译系统中的应用。
8.权利要求1所述T7‑RNA聚合酶突变体在转录终止子研究,或在RNA依赖的RNA聚合酶活性研究中的应用。
9.权利要求1所述T7‑RNA聚合酶突变体在生物学转录调控元件合成中的应用。
权 利 要 求 书1/1页CN 112831484 A
T7‑RNA聚合酶突变体及其应用
技术领域
[0001]本发明属于核酸工具酶与核酸生物领域,特别是噬箘体T7‑RNA聚合酶突变体及其应用。
背景技术
[0002]RNA(核糖核酸)作为遗传信息传递的一类生物大分子,在真核生物、原核生物、部分病毒及类病毒中广泛存在,并具有许多不同的种类及功能。
除最初鉴定的三大类RNA:mRNA、rRNA以及tRNA外,后续发现的几类新颖的RNA如microRNA(miRNA)(Cheng et al., 2005)、long non‑coding RNA(lncRNA)(Dey et al.,2014)、Circular RNAs(circRNA) (Memczak et al.,2013)等也成为近年来RNA研究中的热门领域。
此外,RNA相关研究的逐渐深入揭示出RNA在疾病治疗方面有着非常重要的应用价值。
体外合成的siRNA和mRNA可以成为RNA靶向治疗的重要药物(Sahin et al.,2014;Wittrup et al.,2015),大型制药公司如Merck、Shire等都致力于开发RNA药物用于疾病治疗。
此外,体外合成的mRNA由于具有在体内蛋白瞬时表达等优点当前已被作为一类全新的疫苗——mRNA疫苗被推广应用(Pardi et al.,2018)。
[0003]随着RNA相关研究和应用的大量开展,对RNA合成提出了很高的挑战。
RNA体外合成包括化学合成和酶法合成两种方法。
化学合成法仅适用于合成几十个核苷酸长度的RNA,由于长度的增加,生产成本会急剧上升。
当核苷酸达到一百个以上时,化学合成法已不再适用,而编码蛋白质的mRNA通常含有几千个核苷酸,因而酶法合成是当前制备长链RNA的唯一方法。
来自短尾噬菌体编码的单亚基RNA聚合酶由于具有结构简单、转录高效等优点,被广泛用于体外转录合成RNA,这是RNA相关研究的一类重要工具酶,其中以来源于大肠杆菌噬菌体T7的单亚基RNA聚合酶应用最为广泛。
T7‑RNA聚合酶于上世纪70年代被鉴定,在首次克隆后就广泛用于RNA的体外合成、体内蛋白表达(细菌高表达系统)等(Davanloo et al., 1984),此外近年来T7‑RNA聚合酶转录系统在合成生物学中也呈现出重要作用(Wang et al.,2018)。
但是T7‑RNA聚合酶除了转录高效、延伸能力强等优点外,其作为体外RNA合成工具也存在一些不可忽略的缺点。
它在合成RNA的过程中可能会产生许多的副产物,包括转录起始过程中产生的寡核苷酸、终止信号造成的中断RNA产物、RdRp活性造成的3’末端延伸产物等(Katalin et al.,2011)。
研究发现存在两类终止信号造成T7‑RNA聚合酶转录终止,一类终止子是由于编码的RNA形成明显的茎环结构而造成终止,二类终止子则是编码的RNA含有共同序列(HAUCUGUU)而造成的一类特殊的序列特异性终止(Macdonald et al.,1994)。
而T7‑RNA聚合酶的RdRp活性造成的末端延伸产物则是发生在转录的RNA产物的3’末端具有明显二级结构情况下(Nacheva and Berzal‑Herranz,2010)。
体外合成的RNA产物的不均一性会导致RNA药物在递送入脊椎动物体内后先天性免疫的激活,这也是当前RNA靶向疗法需解决的关键问题。
虽然存在一些纯化方法比如高效液相色谱(HPLC)能够去除这种由于RNA 产物不均一造成的免疫激活,但在大规模的生产合成中造成了生产成本的大量增加,纯化流程的增多也不利于RNA药物的稳定性。
因而当前开发新的RNA合成工具酶使其维持高效转
录并同时降低RNA产物不均一性具有非常重要的应用价值。
[0004]现有技术中,中国授权专利CN102177236B提供了功能改善的RNA聚合酶突变体,通过将构成野生型T7RNA聚合酶的氨基酸序列中的786位的谷氨酰胺、179位的赖氨酸以及685位的缬氨酸中的至少1个位置的氨基酸残基被其它氨基酸取代,提高了这种T7RNA聚合酶突变体的热稳定性和/或比活性。
又例如中国专利申请CN107460177A提供了可利用化学修饰核苷酸的RNA聚合酶突变体,通过将构成野生型T7RNA聚合酶的氨基酸序列中的632位的精氨酸被半胱氨酸取代的突变体,转录活力提高,并可以2’修饰三磷酸核苷。
然而这些现有技术同样不能使其维持高效转录的同时降低RNA产物不均一性。
发明内容
[0005]针对以上现有技术的不足,提供了T7‑RNA聚合酶的突变体,可用于体外RNA的合成,与现有的T7‑RNA聚合酶存在显著差异,为RNA研究与应用提供一种有效的候选酶工具,具体通过以下技术实现。
[0006]T7‑RNA聚合酶突变体,从SEQ ID NO.1所示的野生型T7‑RNA聚合酶的氨基酸序列的N端开始第43位的丝氨酸被酪氨酸、苯丙氨酸、亮氨酸、赖氨酸或天冬氨酸替代的突变体。
[0007]申请人通过噬菌体辅助的定向进化(PACE)系统对T7‑RNA聚合酶转录跨过T7的一类终止子T7 TΦ的能力进行了筛选(Esvelt et al.,2010),含有终止能力降低的突变体的噬菌体将使gⅢ蛋白在大肠杆菌中表达从而获得正常的侵染和增殖的能力,最终在筛选系统中留存下来。
通过对进化后得到的突变体进行测序以及通过分子克隆的方法,将突变体基因插入到原核表达载体pQE82L中,在大肠杆菌中进行蛋白表达及纯化。
[0008]之后申请人通过体外转录的方法检测了进化得到的突变体在体外的终止效果,发现终止效率明显降低的突变体都含有S43位点氨基酸的改变,因此申请人推断该位点很可能是影响终止的关键位点,并随后构建了该位点的单一氨基酸分别替换成丙氨酸、亮氨酸、赖氨酸、天冬氨酸、酪氨酸、苯丙氨酸的6个突变体S43A、S43L、S43K、S43D、S43Y、S43F,同样在体外进行了蛋白质表达及纯化并检测了转录终止效率,发现除了S43A外,突变体S43L、S43K、S43D、S43Y、S43F都能使终止效率发生不同程度的降低。
其中,突变体S43Y对终止效率的影响最大,使得RNA聚合酶对终止子T7 TΦ的终止效率降低约25%。
通过对这一结果的分析发现,该位点的分子大小与对终止的减弱效果呈现正相关关系。
而后申请人在对突变体S43Y的进一步研究中发现,该突变体的对其它所有检测的Ⅰ类终止子以及Ⅱ类终止子都具有终止能力明显减弱的效果,说明S43Y能够同时减弱两类终止信号的终止效率。
[0009]此外,申请人还意外发现该突变体的RdRp活性显著低于野生型,在转录具有3’末端高级结构的RNA,例如sgRNA时可以获得纯度更高、产量更优的RNA。
在Cas9 mRNA的转录中发现,S43Y突变体可以显著去除野生型转录时产生的中断RNA产物,且能够维持野生型高效转录的优点。
[0010]上述T7‑RNA聚合酶突变体在体外转录中的应用。
[0011]上述T7‑RNA聚合酶突变体在非编码RNA合成中的应用。
[0012]优选地,所述非编码RNA为sgRNA、tRNA、mRNA、siRNA、snoRNA或寡核苷酸。
[0013]上述T7‑RNA聚合酶突变体在基因编辑中的应用。
[0014]上述T7‑RNA聚合酶突变体在RNA药物合成中的应用。
[0015]上述T7‑RNA聚合酶突变体在体内蛋白质表达或无细胞蛋白表达体外翻译系统中的应用。
[0016]上述T7‑RNA聚合酶突变体在转录终止子研究,或在RNA依赖的RNA聚合酶活性研究中的应用。
[0017]上述T7‑RNA聚合酶突变体在生物学转录调控元件合成中的应用。
[0018]与现有技术相比,本发明的有益之处在于:发现并鉴定了同时影响T7‑RNA聚合酶两类终止的关键氨基酸位点及影响T7‑RNA聚合酶RdRp活性的关键位点,开发出在产量和纯度上更适合用于合成sgRNA等具有3’末端高级结构RNA的工具酶(即本发明的T7‑RNA聚合酶突变体),并且该酶也更适合含有终止信号的RNA的合成。
附图说明
[0019]图1为实施例1制备的6种T7‑RNA聚合酶突变体对I类终止子T7 TΦ的终止效果;[0020]图2为T7‑RNA聚合酶突变体S43Y与野生型对Ⅰ类终止子T3 TΦ、thr attenuator、rrnBT1 terminator和rrnC terminator的终止效率对比;
[0021]图3为T7‑RNA聚合酶突变体S43Y与野生型对PTH、VSV、Adeno5和CJ位点Ⅱ类终止信号的终止效率对比;
[0022]图4为T7‑RNA聚合酶突变体S43Y转录不同基因的sgRNA与野生型的转录效果比较;[0023]图5为T7 RNA聚合酶突变体S43Y和野生型分别转录Cas9 mRNA的效果对比。
具体实施方式
[0024]下面将对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动条件下所获得的所有其它实施例,都属于本发明保护的范围。
[0025]实施例1:利用T7‑‑RNA聚合酶突变体进行体外终止效率检测
[0026](1)T7‑RNA聚合酶突变体表达及纯化
[0027]通过分子克隆的方法分别构建了T7‑RNA聚合酶突变体S43A、S43L、S43K、S43D、S43Y和S43F,然后将含有这些突变体的原核表达载体pQE82L转化E.coli BL21表达菌株,挑菌扩大培养,将菌置于含有100μg/ml氨苄的LB培养基中于37℃摇床培养至OD600值接近1.2,然后加入终浓度为0.5mM的异丙基‑β‑D‑硫代吡喃半乳糖苷(IPTG)于30℃摇床诱导表达4h,随后于4℃、5000rpm离心20min收集菌体沉淀,再将菌体充分重悬于含有300mM NaCl、20mM Tris‑HCl(pH值=7.5)、0.5mg/ml溶菌酶、0.5mM DTT的裂解液中,冻于‑80℃,半小时后取出置于冰上融化1h再置于‑80℃反复冻融两次。
[0028]将经过三次冻融的蛋白裂解液置于高速冷冻离心机中于4℃条件18000rpm离心1h,随后分离上清并对其过滤以去除杂质,过滤后的上清可暂时于冰上保存以待进行后续的镍柱纯化。
[0029]蛋白过镍柱前需用10倍体积的洗脱缓冲液(20mM Tris‑HCl(PH7.5)、300mM NaCl、0.5mM DTT)平衡镍柱,随后将之前过滤的蛋白液加入镍柱中,待所有的蛋白液全部通过镍柱填料后,用不同梯度的咪唑溶液(20mM‑50mM‑100mM)去洗脱,并用若干试管按流出先后顺序编号后收集流出液。
上述所有操作均需在冰上或4℃条件下进行。
[0030]最后通过SDS‑PAGE电泳及考马斯亮蓝染色检测所有洗脱下来的蛋白流出液,综合选择浓度更高、纯度更优的蛋白加入透析袋中密封后于1L透析液中进行透析,6‑8h后更换新鲜干净透析液。
经过三轮透析后收集蛋白并于‑20℃保存。
所述透析液含有100mM NaCl、50mM Tris–HCl pH值=7.5、1mM DTT、0.1mM EDTA、50%glycerol和0.1%Triton X‑100。
[0031](2)转录反应模板的获取及终止效率检测
[0032]设计通用引物,引物序列为:
[0033]pETsnrs‑F:5’‑ATCAGGCGCCATTCGCCATTCAGG‑3’
[0034]pETsnrs‑1R:5’‑TCGGTGAGTTTTCTCCTTCATTAC‑3’
[0035]利用上述通用引物扩增实验室已有质粒pETsnrs‑1(见序列表SEQ ID NO.2)中含有T7启动子以及T7的经典I类终止子T7 TΦ的DNA片段,用纯化试剂盒DNA Clean& Concentrator TM‑5(ZYMO RESEARCH)对PCR产物进行纯化。
[0036]体外转录反应成分包含40mM Tris‑HCl(PH8.0),16mM MgCl
,2mM亚精胺,5mM
2
DTT,4mM ATP、GTP、CTP、UTP,0.3μL RNA酶抑制剂,0.2μL焦磷酸酶,50nM RNA聚合酶和14nM PCR模板,补DEPC水至10μL。
将反应体系置于37℃孵育1h,用DNaseⅠ去除模板随后用RNA纯化试剂盒(ZYMO RESEARCH)纯化RNA产物。
对RNA产物进行浓度测定后每个反应取400ng RNA加入3x RNA上样缓冲液混合后于80℃加热2min后置于冰上,随后利用1.5%的琼脂糖凝胶于100V电泳45min,并进行EB染色。
[0037]使用ImageJ软件统计条带灰度值及根据RNA产物大小计算得到每个泳道反应的终止效率。
独立重复试验3次后利用Prism软件进行统计分析,结果如图1所示。
图1中,template代表转录模板DNA,run off代表全长转录的RNA产物,terminated代表中断的RNA 产物,M代表GeneRuler DNA Ladder(Thermo Scientific),WT代表T7 RNA聚合酶野生型。
图1(右)为三次独立重复试验检测的终止效率的柱状统计图。
从图1中可以看到,突变体S43Y 对终止效率的影响最大,使终止效率降低约25%。
突变体S43L、S43K、S43D和S43F分别使终止效率降低约10%、12%、5%和17%,突变体S43A对终止效率没有显著影响。
[0038]实施例2:T7‑RNA聚合酶突变体S43Y和野生型对不同来源I类终止效率对比[0039](1)转录反应模板的获取
[0040]通过分子克隆的方法将T7已报道的存在于T3噬菌体和大肠杆菌中的几种Ⅰ类终止子T3 TΦ、thr attenuator、rrnBT1 terminator和rrnC terminator的序列(分别见序列表SEQ ID NO.3‑6)替换载体pETsnrs‑1中Ⅰ类终止子T7 TΦ的颈环结构序列(见序列表SEQ ID NO.7)。
载体构建成功后用实施例1的通用引物进行PCR扩增,然后利用DNA纯化试剂盒Clean&Concentrator TM‑5对PCR产物进行纯化及浓度测定。
[0041](2)体外转录终止效率检测
[0042]体外转录反应(10μL)在含有40mM Tris‑HCl(pH值=8.0),16mM MgCl
,2mM亚精
2
胺,5mM DTT,4mM ATP、GTP、CTP、UTP,0.3μL RNA酶抑制剂,0.2μL焦磷酸酶,50nM RNA聚合酶,14nM PCR模板的条件下于37℃孵育1h,而后用DNaseⅠ消化模板并用RNA纯化试剂盒纯化RNA产物,测定RNA浓度,随后每个反应取400ng RNA与3x RNA上样缓冲液混合后于80℃加热2min后置于冰上,随后利用1.5%的琼脂糖凝胶于100V电泳45min,并进行EB染色。
根据已描述方法计算得到每个泳道反应的终止效率,检测结果及终止效率如图2所示。
图2中,run off代表全长转录的RNA产物,terminated代表中断的RNA产物,M代表Low Range ssRNA
Ladder(New England Biolabs)。
通过与野生型T7 RNAP进行比较,突变体S43Y能够明显降低所有已检测的Ⅰ类终止子的终止效率。
[0043]实施例3:T7‑RNA聚合酶突变体S43Y和野生型对不同来源II类终止效率对比[0044](1)转录反应模板的获取及纯化
[0045]通过分子克隆的方法将T7已报道的存在于自然界不同物种中PTH、VSV、Adeno5和CJ位点Ⅱ类终止信号序列(分别见序列表SEQ ID NO.8‑11)替换载体pETsnrs‑1中已有终止序列。
同样将构建好的载体用实施例1所述的通用引物进行PCR扩增,然后利用DNA纯化试剂盒对PCR产物进行纯化及浓度测定。
[0046](2)体外转录终止效率检测
[0047]体外转录反应成分包含40mM Tris‑HCl(pH值=8.0),16mM MgCl
,2mM亚精胺,5mM
2
DTT,4mM ATP、GTP、CTP、UTP,0.3μL RNA酶抑制剂,0.2μL焦磷酸酶,50nM RNA聚合酶,14nM PCR模板,补DEPC水至10μL。
转录反应条件为37℃孵育1h,随后DNaseⅠ去除模板并用RNA纯化试剂盒纯化RNA产物。
对RNA产物进行浓度测定,然后取400ng RNA加入3x RNA上样缓冲液,混合后于80℃加热2min后置于冰上,利用1.5%的琼脂糖凝胶于100V电泳45min,并进行EB 检测和终止效率计算。
结果如图3所示,图3中run off代表全长转录的RNA产物,terminated 代表中断的RNA产物,M代表Low Range ssRNA Ladder。
通过与野生型T7 RNAP进行比较,突变体S43Y能够明显降低所有检测的II类终止子的终止效率。
[0048]实施例4:T7‑RNA聚合酶S43Y和野生型对不同sgRNA的转录效果比较
[0049](1)转录反应模板的获取及纯化
[0050]通过分子克隆将T7启动子及eGFP等不同基因的sgRNA序列插入载体pUC19中,不同基因的sgRNA序列的前20nt因基因种类存在序列差别,后面序列为gRNA骨架保持不变。
如序列表SEQ ID NO.12‑19所示为靶向不同基因(PLK1、BMPR1B、TBCE、eGFP、Nod、Lsd、mCherry、MosDT1)的序列信息。
使用PCR方法扩增构建好的质粒,同样用纯化的PCR产物作为后续转录反应的模板。
[0051](2)体外转录终止效率检测
[0052]体外转录反应成分包含40mM Tris‑HCl(pH值=8.0),16mM MgCl
,2mM亚精胺,5mM
2
DTT,4mM ATP、GTP、CTP、UTP,0.3μL RNA酶抑制剂,0.2μL焦磷酸酶,150nM RNA聚合酶和70nM PCR模板,补DEPC水至10μL。
将反应体系置于37℃孵育1h后直接取1μL转录后产物与RNA上样缓冲液混合后于80℃加热2min后置于冰上,随后利用12%TBE PAGE在100V电泳1h,进行EB 检测。
如图4所示,图4中M代表Low Range ssRNA Ladder,对比T7 RNAP野生型,突变体S43Y 转录的sgRNA在产量和纯度上明显优于野生型。
[0053]实施例5:比较T7‑RNA聚合酶S43Y和野生型对Cas9 mRNA的转录
[0054]通过PCR方法扩增实验室已有载体中含有T7启动子和Cas9 mRNA编码序列(见序列表SEQ ID NO.20),将纯化后的PCR产物作为转录模板,体外转录反应在含有40mM Tris‑HCL
,2mM亚精胺,5mM DTT,4mM ATP、GTP、CTP、UTP,0.3μL RNA酶抑制(pH值=8.0),16mM MgCl
2
剂,0.2μL焦磷酸酶,150nM RNA聚合酶,20ng/μL PCR模板的10μL体系中进行,37℃孵育1h后直接取1μL转录后产物与RNA上样缓冲液混合后于80℃加热2min后置于冰上,随后利用1.5%琼脂糖凝胶100V电泳45min,进行EB检测。
结果如图5所示,图5中run off代表全长转录的RNA产物,terminated代表中断的RNA产物;当利用T7 RNAP野生型转录时,出现提前中
断的RNA产物,而利用突变体S43Y转录时,该中断RNA产物在胶图中几乎可忽略不计。
这一结果同时也反映了突变体S43Y与野生型一样都能进行高效率的转录。
序列表
<110> 华中科技大学
<120> T7‑RNA聚合酶突变体及其应用
<141> 2021‑01‑13
<160> 20
<170> SIPOSequenceListing 1.0
<210> 1
<211> 883
<212> PRT
<213> 噬菌体T7RNA聚合酶(phage RNA)
<400> 1
Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu 1 5 10 15
Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu
20 25 30
Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu
35 40 45
Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val
50 55 60
Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys 65 70 75 80 Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg
85 90 95
Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu 100 105 110
Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser 115 120 125
Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala 130 135 140
Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys 145 150 155 160 His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His
165 170 175
Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser 180 185 190
Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp 195 200 205
Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr
210 215 220
Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp 225 230 235 240 Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr
245 250 255
Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val 260 265 270
Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala 275 280 285
Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala 290 295 300
Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile 305 310 315 320 Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala
325 330 335
Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile 340 345 350
Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp 355 360 365
Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val 370 375 380
Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe 385 390 395 400 Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe
405 410 415
Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe 420 425 430
Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys 435 440 445
Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly 450 455 460
Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys 465 470 475 480 Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro
485 490 495
Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu 500 505 510
Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr 515 520 525
Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln 530 535 540
His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn 545 550 555 560 Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys
565 570 575
Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn 580 585 590
Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys 595 600 605
Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly 610 615 620
Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly 625 630 635 640 Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln
645 650 655
Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln 660 665 670
Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr 675 680 685
Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys 690 695 700
Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg 705 710 715 720 Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp
725 730 735
Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu 740 745 750
Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu 755 760 765
Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His 770 775 780
Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu 785 790 795 800 Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr
805 810 815
Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met 820 825 830
Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln
835 840 845
Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu 850 855 860
Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe
865 870 875 880
Ala Phe Ala
<210> 2
<211> 5732
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gatctcgatc ccgcgaaatt aatacgactc actatagggg aattgtgagc ggataacaat 60 tcccctctag aaataatttt gtttaacttt aagaaggaga tataccatgg gcagcagcca 120 tcatcatcat catcacagca gcggcctggt gccgcgcggc agccatatgg ctagcatgat 180 tatggaaata cctgcaatca aggcgctttc cagatacgcc caatgggtta tttggaaaaa 240 agagagagat acgaaaatcc catataatcc aaacaacggc aaaaaagcct cttccacaga 300 ccctctcgca tggggtgata tagacgaagc gcaggccgga cttgttaggt atggcgcaaa 360 cggacttgga ttcgtgctca ccaaatccga tccgtttgtt tttatagacc ttgatcatgt 420 gctagatgaa aacaaacgag tcaagtgcga atgggcgagg cagctgctta aagagataaa 480 gagctacaca gaaatctctc caagcggtga cgggctgcat gtcgtcgtaa gcggaaaact 540 tccagactat atcaaacata aaacaaaatt tgatgacggc agtgcgcttg aagtcgggat 600 ccgaattcga gctccaccac caccaccact gagatccggc tgctaacaaa gcccgaaagg 660 aagctgagtt ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta 720 aacgggtctt gaggggtttt ttgctgaaag gaggaactat atccggattg gcgaatggga 780 cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc 840 tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac 900 gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag 960 tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc 1020 atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg 1080 actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata 1140 agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa 1200 cgcgaatttt aacaaaatat taacgtttac aatttcaggt ggcacttttc ggggaaatgt 1260 gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgaa 1320 ttaattctta gaaaaactca tcgagcatca aatgaaactg caatttattc atatcaggat 1380 tatcaatacc atatttttga aaaagccgtt tctgtaatga aggagaaaac tcaccgaggc 1440 agttccatag gatggcaaga tcctggtatc ggtctgcgat tccgactcgt ccaacatcaa 1500 tacaacctat taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa tcaccatgag 1560 tgacgactga atccggtgag aatggcaaaa gtttatgcat ttctttccag acttgttcaa 1620 caggccagcc attacgctcg tcatcaaaat cactcgcatc aaccaaaccg ttattcattc 1680
gtgattgcgc ctgagcgaga cgaaatacgc gatcgctgtt aaaaggacaa ttacaaacag 1740 gaatcgaatg caaccggcgc aggaacactg ccagcgcatc aacaatattt tcacctgaat 1800 caggatattc ttctaatacc tggaatgctg ttttcccggg gatcgcagtg gtgagtaacc 1860 atgcatcatc aggagtacgg ataaaatgct tgatggtcgg aagaggcata aattccgtca 1920 gccagtttag tctgaccatc tcatctgtaa catcattggc aacgctacct ttgccatgtt 1980 tcagaaacaa ctctggcgca tcgggcttcc catacaatcg atagattgtc gcacctgatt 2040 gcccgacatt atcgcgagcc catttatacc catataaatc agcatccatg ttggaattta 2100 atcgcggcct agagcaagac gtttcccgtt gaatatggct cataacaccc cttgtattac 2160 tgtttatgta agcagacagt tttattgttc atgaccaaaa tcccttaacg tgagttttcg 2220 ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 2280 ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 2340 ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 2400 ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 2460 ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 2520 tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 2580 tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2640 tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2700 tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2760 gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2820 tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2880 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 2940 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 3000 gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt 3060 acgcatctgt gcggtatttc acaccgcata tatggtgcac tctcagtaca atctgctctg 3120 atgccgcata gttaagccag tatacactcc gctatcgcta cgtgactggg tcatggctgc 3180 gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc 3240 cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc 3300 atcaccgaaa cgcgcgaggc agctgcggta aagctcatca gcgtggtcgt gaagcgattc 3360 acagatgtct gcctgttcat ccgcgtccag ctcgttgagt ttctccagaa gcgttaatgt 3420 ctggcttctg ataaagcggg ccatgttaag ggcggttttt tcctgtttgg tcactgatgc 3480 ctccgtgtaa gggggatttc tgttcatggg ggtaatgata ccgatgaaac gagagaggat 3540 gctcacgata cgggttactg atgatgaaca tgcccggtta ctggaacgtt gtgagggtaa 3600 acaactggcg gtatggatgc ggcgggacca gagaaaaatc actcagggtc aatgccagcg 3660 cttcgttaat acagatgtag gtgttccaca gggtagccag cagcatcctg cgatgcagat 3720 ccggaacata atggtgcagg gcgctgactt ccgcgtttcc agactttacg aaacacggaa 3780 accgaagacc attcatgttg ttgctcaggt cgcagacgtt ttgcagcagc agtcgcttca 3840 cgttcgctcg cgtatcggtg attcattctg ctaaccagta aggcaacccc gccagcctag 3900 ccgggtcctc aacgacagga gcacgatcat gcgcacccgt ggggccgcca tgccggcgat 3960 aatggcctgc ttctcgccga aacgtttggt ggcgggacca gtgacgaagg cttgagcgag 4020
ggcgtgcaag attccgaata ccgcaagcga caggccgatc atcgtcgcgc tccagcgaaa 4080 gcggtcctcg ccgaaaatga cccagagcgc tgccggcacc tgtcctacga gttgcatgat 4140 aaagaagaca gtcataagtg cggcgacgat agtcatgccc cgcgcccacc ggaaggagct 4200 gactgggttg aaggctctca agggcatcgg tcgagatccc ggtgcctaat gagtgagcta 4260 acttacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 4320 gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg 4380 tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc gcctggccct 4440 gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa tcctgtttga 4500 tggtggttaa cggcgggata taacatgagc tgtcttcggt atcgtcgtat cccactaccg 4560 agatatccgc accaacgcgc agcccggact cggtaatggc gcgcattgcg cccagcgcca 4620 tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg 4680 tttgttgaaa accggacatg gcactccagt cgccttcccg ttccgctatc ggctgaattt 4740 gattgcgagt gagatattta tgccagccag ccagacgcag acgcgccgag acagaactta 4800 atgggcccgc taacagcgcg atttgctggt gacccaatgc gaccagatgc tccacgccca 4860 gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat gggtgtctgg tcagagacat 4920 caagaaataa cgccggaaca ttagtgcagg cagcttccac agcaatggca tcctggtcat 4980 ccagcggata gttaatgatc agcccactga cgcgttgcgc gagaagattg tgcaccgccg 5040 ctttacaggc ttcgacgccg cttcgttcta ccatcgacac caccacgctg gcacccagtt 5100 gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg 5160 aggtggcaac gccaatcagc aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg 5220 gaatgtaatt cagctccgcc atcgccgctt ccactttttc ccgcgttttc gcagaaacgt 5280 ggctggcctg gttcaccacg cgggaaacgg tctgataaga gacaccggca tactctgcga 5340 catcgtataa cgttactggt ttcacattca ccaccctgaa ttgactctct tccgggcgct 5400 atcatgccat accgcgaaag gttttgcgcc attcgatggt gtccgggatc tcgacgctct 5460 cccttatgcg actcctgcat taggaagcag cccagtagta ggttgaggcc gttgagcacc 5520 gccgccgcaa ggaatggtgc atgcaaggag atggcgccca acagtccccc ggccacgggg 5580 cctgccacca tacccacgcc gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct 5640 tccccatcgg tgatgtcggc gatataggcg ccagcaaccg cacctgtggc gccggtgatg 5700 ccggccacga tgcgtccggc gtagaggatc ga 5732
<210> 3
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cctagcataa accccttggg ttccctcttt aggagtctga ggggtttttt gctgaaaga 59
<210> 4
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
cacagaaaaa agcccgcacc tgacagtgcg ggcttttttt ttcgactc 48
<210> 5
<211> 65
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 60 gctgc 65
<210> 6
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
tctccgcccc tgccagaaat catccttagc gaaagctaag gatttttttt atctgaaat 59 <210> 7
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttg 47
<210> 8
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tgtgtcccta tctgttacag tctcct 26
<210> 9
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atgcttgcca tctgttttct tgcaag 26
<210> 10
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atccatgata tctgttagtt tttttc 26
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence) <400> 11
tagttttgta tctgttttgc agcagc 26
<210> 12
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence) <400> 12
gccaagcaca atttgccgt 19
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence) <400> 13
ggagacagaa atatatcaga 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence) <400> 14
ggaacccagg cactggtatt 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence) <400> 15
gggcacgggc agcttgccgg 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence) <400> 16
ggaaagtgtg gaactccaag 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ggtggtataa cccttgacgg 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ggagccgtac atgaactgag 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gtcaagcact tgatcgacgg 20
<210> 20
<211> 4258
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 20
gggagagccg ccaccaugga uaaaaaguau ucuauugguu uagacaucgg cacuaauucc 60 guuggauggg cugucauaac cgaugaauac aaaguaccuu caaagaaauu uaagguguug 120 gggaacacag accgucauuc gauuaaaaag aaucuuaucg gugcccuccu auucgauagu 180 ggcgaaacgg cagaggcgac ucgccugaaa cgaaccgcuc ggagaaggua uacacgucgc 240 aagaaccgaa uauguuacuu acaagaaauu uuuagcaaug agauggccaa aguugacgau 300 ucuuucuuuc accguuugga agaguccuuc cuugucgaag aggacaagaa acaugaacgg 360 caccccaucu uuggaaacau aguagaugag guggcauauc augaaaagua cccaacgauu 420 uaucaccuca gaaaaaagcu aguugacuca acugauaaag cggaccugag guuaaucuac 480 uuggcucuug cccauaugau aaaguuccgu gggcacuuuc ucauugaggg ugaucuaaau 540 ccggacaacu cggaugucga caaacuguuc auccaguuag uacaaaccua uaaucaguug 600 uuugaagaga acccuauaaa ugcaaguggc guggaugcga aggcuauucu uagcgcccgc 660 cucucuaaau cccgacggcu agaaaaccug aucgcacaau uacccggaga gaagaaaaau 720 ggguuguucg guaaccuuau agcgcucuca cuaggccuga caccaaauuu uaagucgaac 780 uucgacuuag cugaagaugc caaauugcag cuuaguaagg acacguacga ugacgaucuc 840 gacaaucuac uggcacaaau uggagaucag uaugcggacu uauuuuuggc ugccaaaaac 900 cuuagcgaug caauccuccu aucugacaua cugagaguua auacugagau uaccaaggcg 960 ccguuauccg cuucaaugau caaaagguac gaugaacauc accaagacuu gacacuucuc 1020 aaggcccuag uccgucagca acugccugag aaauauaagg aaauauucuu ugaucagucg 1080 aaaaacgggu acgcagguua uauugacggc ggagcgaguc aagaggaauu cuacaaguuu 1140。