您的当前位置:首页突变型Tn5转座酶及其使用方法[发明专利]

突变型Tn5转座酶及其使用方法[发明专利]

2023-11-18 来源:爱问旅游网
[19]中华人民共和国国家知识产权局

[12]发明专利申请公开说明书

[21]申请号00811220.7

[51]Int.CI7

C12N 15/90C12N 15/10C12N 9/22

[43]公开日2002年9月4日

[22]申请日2000.08.02[21]申请号00811220.7[30]优先权

[32]1999.08.02 [33]US [31]60/146,686[86]国际申请PCT/US00/21052 2000.08.02[87]国际公布WO01/09363 EN 2001.02.08[85]进入国家阶段日期

2002.02.01

[11]公开号CN 1367840A

[74]专利代理机构上海专利商标事务所

代理人徐迅

[71]申请人威斯康星校友研究基金会

地址美国威斯康星州[72]发明人W·S·列兹尼科夫 T·A·瑙曼

权利要求书 2 页 说明书 22 页 附图 7 页

[54]发明名称

突变型Tn5转座酶及其使用方法

[57]摘要

本文公开了修饰过的Tn5转座酶蛋白质,与外末端相比,其更偏爱转座子Tn5的内末端,而且在体内或体外的末端特异性指导的转座方法中可将其和与外末端相比更偏好内末端的转座酶联用。

00811220.7

权 利 要 求 书

第1/2页

1.一种相对于野生型Tn5转座酶蛋白质修饰的突变型Tn5转座酶蛋白质,其

特征在于,所述的突变型转座酶与野生型蛋白质的差异在于选自以下的位点:氨基

酸58和氨基酸372位,其中与Tn5外末端相比,该突变型Tn5转座酶蛋白质更偏

爱Tn5的内末端。

2.如权利要求1所述的突变型Tn5转座酶,其特征在于,所述的转座酶在氨

基酸58位含有缬氨酸。

3.如权利要求1所述的突变型Tn5转座酶,其特征在于,所述的转座酶在氨

基酸372位含有突变。

4.如权利要求1所述的突变型Tn5转座酶,其特征在于,所述的转座酶在氨

基酸372位含有谷氨酰胺。

5.如权利要求1所述的突变型Tn5转座酶,其特征在于,所述的突变型转座

酶与野生型蛋白质的差异在于氨基酸58位和372位。

6.如权利要求1所述的突变型Tn5转座酶,其特征在于,所述的转座酶在氨

基酸58位含有缬氨酸且在氨基酸372位含有谷氨酰胺。

7.如权利要求1所述的突变型Tn5转座酶,其特征在于,所述的突变型转座

酶与野生型Tn5转座酶的差异在于选自以下位点的差异:氨基酸8位和氨基酸344

位。

8.如权利要求7所述的突变型Tn5转座酶,其特征在于,所述的转座酶在氨

基酸8位为半胱氨酸。

9.如权利要求7所述的突变型Tn5转座酶,其特征在于,所述的转座酶在氨

基酸344位为赖氨酸。

10.如权利要求7所述的突变型Tn5转座酶,其特征在于,所述的突变型Tn5

转座酶与野生型Tn5转座酶的差异在于氨基酸8位和氨基酸344位。

11.如权利要求1所述的突变型Tn5转座酶,其特征在于,所述的转座酶在

氨基酸8位含有半胱氨酸和在氨基酸344位含有赖氨酸。

12.如权利要求1所述的突变型Tn5转座酶,其特征在于,所述的转座酶在

氨基酸8位含有半胱氨酸、在氨基酸58位含有缬氨酸、在氨基酸344位含有赖氨

2

00811220.7

酸和在氨基酸372位含有谷氨酰胺。

13.一种编码权利要求1所述的转座酶的多核苷酸。 14.一种编码权利要求12所述转座酶的多核苷酸。

15.一种用于体外转座可转座DNA序列的系统,其特征在于,所述的系统包括:

如权利要求1所述的相对于野生型Tn5转座酶修饰的突变型Tn5转座酶; 供体DNA分子,其包含可转座DNA序列、该序列在5’和3’端侧翼连接有野生型IE序列;和

可转座元件可转座入内的靶DNA分子。

16.如权利要求15所述的系统,其特征在于,所述的IE序列是甲基化的。 17.一种体外转座的方法,其特征在于,所述的方法包括如下步骤:

权 利 要 求 书 第2/2页

在低于生理温度的温度下在合适的反应缓冲液中,将靶DNA分子和 1所述的突变型Tn5转座酶与供体DNA分子混合,该供体DNA分子含有感兴趣的可转座DNA序列、而该感兴趣的DNA序列在其5’和3’端侧翼连接有野生型Tn5IE序列,进行反应直到修饰的转座酶结合于此IE序列;和

将温度升高至生理温度一段时间,足以让此酶催化体外转座。

3

00811220.7

说 明 书

突变型TN5转座酶及其使用方法

第1/22页

与相关申请的相互参照:

本申请要求享有1999年8月2日递交的美国临时专利申请No.60/146,686的优先权,本文将其全部纳入作为参考。 关于联邦政府赞助的研究或开发的声明

本发明的完成使用了联邦政府的资金NIH,Grant No.GM 50692。因此联邦政府享有本发明的某些权利。 发明背景

通过维持低的移动水平,细菌转座子如Tn5在细胞内进化。当需要该转座子来存活时,这种低的移动水平就阻碍了研究者对分子转座过程的详尽了解和对转座过程用途(如开发新型诊断和治疗的药源)的开发。Tn5是IS4家族的保守性“剪贴”转座子(Rezsohazy,R.,Hallet,B.,Delcour,J.,和Mahillon,J,“插入序列的IS4家族:保守性转座酶基序的证据”,Mol Microbiol.9:1283-1295(1993)),其编码负责它移动的一种53kD转座酶蛋白质(Tnp)。野生型Tn5转座酶的氨基酸和核酸的序列是已知的。Ahmed,A.和Podemski,L.“T5的修正序列”Gene

154(1),129-130(1995),本文将其全部纳入作为参考。本文附有编码野生型Tn5转座酶的核酸序列,即SEQ ID NO:1。还附有SEQ ID NO:1编码的相应于野生型Tn5转座酶的多肽序列,即SEQ ID NO:2。

Tnp蛋白质促进了该整个元件的移动是通过先与两个19bp特异性结合序

列(称为外末端)(OE;SEQ ID NO:3)之一结合,然后形成核蛋白结构(称为突触),各端平头切割,与靶DNA相连,以及随后的链转移(Reznikoff,W.S.,Bhasin,A.,Davies,D.R.,Goryshin,I.Y.,Mahnke,L.A.,Naumann,T.,Rayment,I.,Steiniger-White,M,和Twining,S.S.,“Tn5:转座的分子窗口”,Biochem.Biophys.Res.Commun.266:729-34(1999))。Tn5转座酶通过联用OE和内末端(IE;SEQ ID NO:4)序列,还可以促进单个插入序列的移动。IE的长度也是19bp,与OE在19个位置中

4

00811220.7说 明 书 第2/22页

有12个相同(图1)。体内,Tn5转座酶表现出对大肠杆菌的OE明显偏爱。通过存在2个dam甲基化位点(GATC回文序列),即在每个内末端序列加入4个甲基(IE

ME

;也如SEQ ID NO:4所示,未显示甲基化),抑制了大肠杆菌内转座酶

的识别和与IE的结合(Yin,J.C.P.Krebs,M.P.,和Reznikoff,W.S.,“dam甲基化对Tn5转座的影响”,J.Mol.Biol.,199:35-45(1988),本文将其全部纳入作为参考)。这种甲基化通过减少蛋白质-DAN最初的识别,降低了转座(Jilk,R.A.,York,D.,和Reznikoff,W.S.,“转座酶Tn5外末端的组成”,J.Bacteriol.178:1671-1679(1996))。 要了解Tn5如何转座的主要障碍是纯化的野生型Tnp在体外没有可检测得到的活性。最近,开发了一种转座酶的双突变高活性形式(“Tnp EK/LP”),其能促进体外转座反应的所有步骤。Tnp EK/LP蛋白质与野生型Tn5 Tnp的不同之处在于54位(Glu突变为Lys)和372位(Leu突变为Pro),另外在56位的非本

质但有益的变化防止了所谓抑制蛋白的产生。这种修饰的高活性Tnp蛋白质保留了对野生型Tn5转座酶OE端(或类OE)的明显偏爱。Tnp EK/LP澄清了先前体内未充分探究的Tn5转座的许多方面问题。

体外,多核苷酸转座是一种将随机突变或靶突变引入基因组的强有效工具。美国专利No.5,925,545和国际出版物No.WO 00/17343公开了有用的基于Tn5转座的体外转座系统,本文将这两者全部纳入作为参考。

需要具有能识别IE和OE的能力且偏爱结合IE的Tnp蛋白质,使我们能够指导核酸的转座,和有助于更复杂的(与用对OE单一特异性的Tnp相比)转座和基因工程策略(上述专利和应用中所述的)。也需要对IE偏爱性提高的Tnp,因为在普通dam+细菌宿主中DNA的甲基化抑制已有Tn5转座酶的结合并降低已有转座酶促进IE限定转座子移动的能力。 发明概述

本发明可以概括为本文所公开的相对于野生型Tn5 Tnp,一种修饰的转座酶蛋白质,相对于外末端(OE)其更偏爱促进侧翼连接有野生型Tn5转座酶内末端(IE)靶序列的转座,无论该IE序列是否被甲基化。

在一相关的方面,本发明还可概括为本文所公开的相对于野生型Tn5 Tnp,一种修饰的转座酶,相对于OE其更偏爱IE且就转座频率而言其为超高活性。

5

ME

00811220.7说 明 书 第3/22页

另一方面,本发明还可以概括为本文所公开的相对于野生型Tn5 Tnp,一种修饰的转座酶,相对于OE其更偏爱IE而且即使当IE序列被甲基化时仍能

以很高的水平催化转座。相反,野生型Tn5转座酶不能有效地识别甲基化的IE序列。

在另一相关方面,本发明可以概括为本发明的含有相对于野生型Tn5转座酶有突变的转座酶,其(1)能改变此转座酶与DNA末端的结合或(2)提高转座或(3)具有这两种功能。这种突变可以是末端-序列-特异性的(如改变DNA结合的实施例中所示)或非特异性的(如提高转座的实施例中所示)。

在另一方面,本发明可以概括为本发明的转座酶(1)对IE的偏爱比对OE的强和(2)与野生型Tnp至少在以下一个氨基酸不同:氨基酸58,氨基酸334和氨基酸372位。

另一方面,本发明可以概括为本发明的转座酶与野生型Tnp的差异在于,其含有至少一个以下突变:氨基酸58位谷氨酸突变为缬氨酸、氨基酸334位谷氨酸突变为赖氨酸和氨基酸372位亮氨酸突变为谷氨酸。

本发明的另一方面可以概括为通过降低对OE的偏爱,本发明的转座酶还表现出对IE更强的偏爱。对野生型转座酶氨基酸8位的突变可减低该转座酶对OE的偏爱,从而提高了对IE的明显偏爱。将精氨酸突变为半胱氨酸可完成这一修饰。

本发明的转座酶蛋白比野生型Tn5转座酶在体外或体内可以促进更多侧接IE的靶序列的转座。本文和美国专利No.5,925,545(本文将其全部纳入作为参考)公开了体外测定转座酶活性的合适方法。本文公开了适用于体内测定转座酶活性的方法。

本发明修饰的Tn5 Tnp与野生型Tn5 Tnp的差异在于至少一个氨基酸位置上的一个变化,这种变化选自:(1)氨基酸58位的变化,其降低或消除Tnp与甲基化的DNA残基间的负相互作用和(2)氨基酸334位的变化,其改变了DNA的结合。除本文所述的改变外,本发明的修饰过的Tnp还包含56位的变化(如

自Met改变成Ala),这防止了干扰转座的被称为抑制蛋白的产生。另外,突变体Tn5转座酶蛋白还可含有除以上所述之外的突变。以下公开了相对于野生型Tn5 Tnp的其它突变。本文以下公开了各突变的作用,可以明白本发明的申请

6

00811220.7说 明 书 第4/22页

人已鉴定了对功能有直接影响的该蛋白质的氨基酸残基,而且与所述的对蛋白质内末端的嗜性偏爱相比,相同位置上的其它修饰可能具有相当的、更强或较弱的影响。序列表中列出了野生型Tn5转座酶的氨基酸序列。本申请列出了相对于野生型转座酶的示范性改变。

本发明还可以概括为本发明公开的酶有助于简单的体外系统和方法,任一可转座元件DNA二侧连接有彼此之间反向的IE末端时,此系统和方法能将供体DNA的该可转座元件引入靶DNA。还预想了对供体DNA或靶DNA的一些

其它要求。认为Tn5如果有的话也非常少(对插入位点有偏爱),因此可以用该系统将所需的序列随机引入靶DNA中。因此,认为使用本文所述修饰的转座酶和简单供体DNA,该系统和方法可广泛地应用于在任何靶DNA中引入变化

而无需考虑其核苷酸序列。因此可以用它来解决许多令分子生物领域技术人员感兴趣的问题。

最后,本文所述的变化是以蛋白质水平的变化公开的,但修饰编码Tn5转座酶蛋白质的多核苷酸来编码本发明的修饰的蛋白质是在本领域技术人员能

力范围之内的。本领域技术人员还懂得遗传密码的简并性,并懂得多个密码可以指导一个氨基酸残基的产生。

在考虑了以下详细描述和附图后,将更全面的理解本发明。 附图简述

图1显示了Tn5转座酶的结构和Tn5外末端(OE)、内末端(IE)、甲基化的内末端(IE)和修饰的IE(IE12A)的核苷酸序列。 图2是乳头化试验观察体内转座的分子基础的图示。

图3A显示了在诱变/重组的4个连续循环(A、B、C、D)中所观察到的突变的位置。图3B显示了图3A各突变的体内转座曲线图。

图4显示了用大肠杆菌dam-菌株进行OE和IE的诱变/重组连续循环中得到的突变转座酶的相对偏爱性。

图5A显示了适用于体外转座方法的质粒。图5B显示了用本发明的突变转座酶催化体外转座得到的转座产物。图5C是对图5B的泳道2产物的进一步定性。

7

ME

00811220.7说 明 书 第5/22页

优选实施例的详述

对Tnp基因进行的随机突变研究已表明可以分离出蛋白质中能增加转座率的突变(Krebs和Reznikoff,1988;DeLong,A.,和Syvanen,M.,“Tn5转座酶突变的反式作用”,P.N.A.S.U.S.A.88:6072-6(1991);Wiegand,T.W.和Reznikoff,W.S.,“两种高转座Tn5突变的特性”,J.Bacteriol.174:1229-1239(1992);Weinreich,M.D.Gasch,A.,& Reznikoff,W.S.,“非生产性多聚化作用导致Tn5转座酶顺式偏爱的证据”Genes.Dev.8:2363-2374(1994);Zhou,M和Reznikoff,W.S.,“改变DNA结合特异性的Tn5突变体”J.Mol.Biol.271:362-73,(1997)本文将它们全部纳入作为参考)。这使得转座酶与大部分表现出体内最大活性的酶促蛋白质相比具有独特性。这很可能是因为转座的高速率对转座子的存活有害,因此转座酶所显示的‘最佳’水平比它可以达到的最大水平低许多。

申请人已分离了一系列与野生型Tn5转座酶不同的相关突变体转座酶蛋白质,这些突变体蛋白质显示出在转座系统中对内末端(IE)的偏爱,有时是对甲基化的内末端(IE

ME

)偏爱比对外末端(OE)的高,外末端因缺少甲基化位点而未

被甲基化。突变转座酶末端偏爱的特征可以是以下之一,(1)当其用于靶多核苷酸侧连接有OE或IE

MEME

末端的系统时所观察到的体内转座频率,或(2)当其用于

靶核苷酸侧接有OE和IE末端的一对系统时所观察到的体内转座频率。虽然申请人已例举了许多与野生型Tn5在1个、4个、5个和7个突变上不同的转座酶蛋白质,但可以通过对它们的分析合理地预测各具体突变的作用。 实施例 综述

可以用许多相关的方法获得本文所公开的突变体家族。在第一种方法中,申请人得到了一些突变体,其能将体内的转座活性回复到一种突变的野生型转座酶不能识别其为底物的末端结合序列。在第二种方法中,申请人将导向的突变引入第一种方法的产物中来确定本发明突变转座酶的优选结构。

在第一种方法中,突变IE末端结合序列在12位含有替代胸腺嘧啶的腺嘌呤(“IE12A”;SEQ ID NO:5)。IE12A中的胸腺嘧啶到-腺嘌呤的变化破坏了野生型IE的两个甲基化位点中的一个。申请人采用sPCR(一种组合性随机定点诱

8

00811220.7说 明 书 第6/22页

变方法)获得了修饰的转座酶蛋白质,其能将转座活性回复到侧接有IE12A的

多核苷酸。Stemmer,W.P.,“通过DNA穿梭使蛋白质体外快速进化”,Nature370:389-391(1994)和Stemmer,W.P.,“通过随机断裂和重装配的DNA穿梭:用于分子进化的体外重组”,Proc.Natl.Acad.Sci.U.S.A.91:10747-10751(1994)(本文将这两者都全部纳入作为参考)开发和描述了sPCR。简单地说,在sPCR方法

中体外操作DNA,来引入点突变并让其在突变序列群体中随机重组。可将突变的基因克隆入质粒(可选择体内活性增加的质粒)。然后将具有理想表型的克隆用作随后诱变/重组循环的底物并选择进一步改善的表型。

可将筛选(替代选择)(每轮分析适当的菌落数(~10)与sPCR方法联用

(Crameri,A.,Whitehorn,E.A.,和Stemmer,W.P.,“用DNA穿梭通过分子进化改善的绿色荧光蛋白质”,Nat.Biotechnol.14:315-319(1996)和Zhang,J.H.,Dawes,G.,和Stemmer,W.P.,“通过DNA穿梭和筛选直接从半乳糖苷酶进化的岩藻糖苷

酶”,Proc.Natl.Acad.Sci.U.S.A.94,4505-4509(1997),本文将这两者全部纳入作为参考。用以下实施例中所述的乳头化(papillation)试验作为转座酶突变体(能将转座酶活性回复到侧接有IE12A的多核苷酸)的筛选方法。乳头化试验是

Krebs,M.P.,和Reznikoff,W.S.,所述的试验的改进,“能产生lacZ翻译性融合得到转座突变体的Tn5衍生物的用途”,Gene 63:277-85(1998),本文将其全部纳入作为参考。在乳头化试验中,读框内生产性转座入一活跃表达的基因,导致形成β-Gal融合蛋白。这些细胞变成蓝色(因为存在X-gal),并在菌落中以增加的速率生长(乳糖利用)。可将这些乳头状突起形成的速率与突变蛋白质促进的转座速率相比。

申请人确定了这些突变转座酶(用第一种方法鉴定的)在dam-菌株中体内催化一侧连接有野生型OE或野生型IE(即未甲基化的核酸)的多核苷酸转座的能力。在用该方法鉴定的突变体中,申请人鉴定到一株保留了与侧接OE的多核

苷酸的反应性接近-野生型的突变体转座酶(“Tnp sC7”),但其具有很高的与侧接IE的多核苷酸的反应性,且当在dam+菌株(即核苷酸被甲基化的,以后称为“IE

ME

4

”)中测试时与侧接IE的多核苷酸的反应性更高。Tnp sC7含有7个相

对于野生型转座酶的突变。

在第二种方法中,随后测定到一种含有Tnp sC7的7个突变中4个的相关

9

00811220.7说 明 书 第7/22页

ME

突变转座酶(“Tnp sC7v2.0”),依旧表现出较高的IE:OE反应性比率。Tnp sC7

和Tnp sC7v2.0都含有能抑制OE相关活性的突变(R8C)、两个能特异性增加IE相关活性的突变(E58V、E344K)、和一个能增加侧接有IE或OE的多核苷酸转座的突变(L372Q)。 获得突变体Tnp

图2显示了用于筛选生产性转座的修饰的乳头化试验。在所用的第一个质粒(“pRZ9904(IE12A/IE12A)”)中,一对反向的IE12A末端侧翼连接含有lacZ基因的多核苷酸,但其缺少启动子和翻译起始位点。该试验使用的第二个质粒(“pRZ9905”)编码能移动含有lacZ的多核苷酸的转座酶。本领域技术人员不难构建具有这些特性的质粒。以下详细列出了材料和方法。

5个能抑制末端序列突变而且在首轮诱变/重组循环后产生乳头状突起的随机突变体。然后将等量的编码这些转座酶之一的质粒用作第二轮诱变/重组的初始底物。第二轮后,将突变的转座酶基因克隆入载体DNA中,并第二次通

过乳头化筛选与IE12A-限定的多核苷酸的转座反应性。从该第二轮,分离得到总共6个活性突变体。然后进行第三轮诱变/重组,并筛选与突变体末端序列的反应性。这一轮几百个菌落都是乳头化阳性。其中,有7个活性比其它明显更高,将他们分离用作第四轮的模板。在第四轮筛选中,筛选过程目测观察到几百个转座菌落。而其中没有一个具有与第三轮诱变/重组分离得到的最高活性突变体(Tnp sC6)相同的活性。

将各轮的最高活性分离物测序,并用定量的乳头化试验测试其与IE12A限定的转座子的转座反应性(见图3A和3B)。图3A显示了相对于野生型Tnp的

突变:Tnp sA5(第一轮的最佳乳头状突起)、sB2(第二轮的最佳乳头状突起)、sC6(第三轮的最佳乳头状突起)和sD5(第四轮的最佳乳头状突起)。图3B显示了4种分离物在体内乳头化试验中的转座活性。也测试了Tnp WT,但其不能促进一种的可检测的转座。突变Q81H是唯一的能将最高活性的突变体sC6(第三轮

分离的)与活性明显较低的突变体sB2(第二轮分离的)区分开的突变。第三轮中的另一个突变Tnp sC7与第四轮的分离物sD5类似,除前者还具有其它两个突变(D217A和E344K)外。Tnp sC7与IE12A限定的转座子的反应性和第四轮的

10

ME

ME

00811220.7说 明 书 第8/22页

分离物sD5类似(没有显示数据)。

突变体Tnp能够促进OE和IE-限定的转座子的转座

上述突变体Tnp是首先令人感兴趣的,因为他们能将转座活性回复到侧翼连接有IE12A末端的转座子(在野生型Tnp中是没有活性的)。虽然这些转座酶突变体对这些转座子的功能有所增加,但转座率没有达到体外所需的活性水平。事实上,Tnp sC6与IE12A末端的体内反应性仅回复到Tnp WT与OE限定的转座子反应相类似水平(没有显示数据)。

然而令人感兴趣的是,大部分分离的突变体对由至少一个天然末端序列(IE或OE)限定的转座子有高度反应性。通过Goryshin,I.Y.Kil,Y.V.,和Reznikoff,W.S.,“DNA的长度和对IS50转座的扭转约束”,Proc Natl Acad Sci U S

A91:10834-10838(1994)(本文将其全部纳入作为参考)的交配试验,用dam-(DNA未甲基化的)菌株测定了这些转座的偏爱性。

图4显示了在dam-菌株的交配试验中,25个突变体Tnp与IE和OE限定

的转座子的体内转座反应性,归一化到野生型Tnp的反应性(6.5×101)。在dam环境的该试验中,无论底物多核苷酸是否侧翼连接有IE还是OE,

Tnp WT都表现出大致相当的活性水平。另一方面,许多突变体表现出与IE反应比与OE反应性更高。这并不奇怪,因为这些突变体是用与IE仅有1个核苷酸差异的IE12A筛选得到的。相反,OE与IE12A相差6个核苷酸。尤其是一

个突变体Tnp sC7表现出非常令人感兴趣的表型。它与IE转座子有明显高的反应性,而显示OE转座子移动的频率几乎无变化。辨别IE和OE的能力非常重要,因为它有益于分开使用IE和OE末端的多部分转座,可以通过提供对IE或OE偏爱的转座酶指导一种或另一种方式的反应。对IE的偏爱比对OE高约5倍也许是适合的,当然对IE的偏爱高10倍更适合。高20倍的偏爱最佳。图

4显示本领域技术人员可以用本文所述的方法获得这种突变转座酶。具体说,突变体sB1、sC6、sC7、sD1和sD3是这些突变体的例子。

但更明显地,Tnp sC7的转座活性不仅不受甲基化IE的抑制(其减少了约102的Tnp WT水平),而且还偏爱侧接IE的IE转座子,如表1中交配试验的结果所示,表明在dam+菌株中Tnp sC7和Tnp WT二者对OE的转座频率

11

ME

-5

归一化到

00811220.7说 明 书 第9/22页

减低了。由于Tnp与OE的结合不受dam甲基化的影响,这种差异仅反映了dam+菌株和dam菌株之间转座反应性的差异。除了这种降低外,Tnp sC7促进的

IE限定的转座速率甚至比dam+菌株中的高,因为在二末端存在甲基化。相反,末端序列的甲基化抑制了野生型转座酶的识别。根据其对IE和OE的区别能力和其对IE甲基化的不敏感性,将以下的注意力指向Tnp sC7。 表1 Tnp WT和Tnp sC的体内转座速率

            JCM101(dam-)                                              RZ212(dam+)

            IE频率              OE频率               IE/OE            IE频率                OE频率                 IE/OE

Tnp WT          6.5×10          6.5×10           1.0              1.0×10               3.1×10             3.2×10

-3

-6

-3

-5

-3

-5

-5

-8

ME

ME

Tnp sC7         1.8×10          3.7×10           50               2.6×10               3.3×10             794

Tnp sc7各个突变在转座活性中的作用

为了了解各个突变是如何影响该蛋白质的活性并为了将该蛋白质的活性和其区别IE和OE的能力最大化,申请人用从sC7得到的信息策略地制备了

更多的变异转座酶,如上所述它们含有7个相对于野生型转座酶的突变。由于这7个突变的所有可能组合的综合试验太繁重费力(128种可能的组合),将这7种突变分成2类进行基因工程化。在第一类的各个突变中,将来自sC7的一个

独特突变进行基因工程加工,以回复至该位的野生型。这一组称为“减去一个”的突变转座酶包括含有7个突变中6个的所有可能的突变体。在第二类各个突变体中,将野生型转座酶进行基因工程加工,以确切含有来自sC7的7个突变中的一个。这一组称为“加上一个”的突变转座酶包括只含有7个突变中1个的所有可能的突变体。通过交配试验分析了所有这些突变蛋白质与IE和OE的体内转座反应性。表2列出了该分析的结果。 表2‘减去一个/加上一个’分析的结果

         ‘减去一IE归         ‘减去一OE归一         ‘加上一IE归        ‘加上一OE归一           个’频率   一化          个’频率    化        个’频率   一化        个’频率   化野生型                                                       1.0×10 1.0         3.1×10 1.0sC7           2.6×10 1.0           3.3×10 1.0

RC8C          3.1×10 1.2           6.0×10 1.8          ----      ----       4.0×10 0.1

12

-3

-6

-7

-3

-5

-8

-6

ME

ME

ME

ME

-6

00811220.7

-6

-4

-6

说 明 书 第10/22页

-4

4

E58V         1.8×10   6.9×10       1.1×10     0.3       4.0×10      4×10         1.4×10     0.5

A157T        3.1×10   1.2              4×10       1.2       ----            ----            6.6×10     0.2

T171S        2.8×10   1.1              2.6×10     0.8       5.6×10      0.6             1.8×10     0.6

D217A        3.7×10   1.3              4.5×10     1.4       ----            ----            -3

-6

-6

-3

-6

-9

-7

-3

-6

-6

3.4×10-6

     1.1

E344K        5.5×10-4

   0.2              1.7×10-5

     5.2       4.3×10-8

      4.3            8×10-7

     0.2

L372Q        2.6×10-4

   0.1              2.8×10-7

     0.1       8.9×10-8

      8.9            1×10-5

     3.5

a.‘减去一个’含有除所指出的位点外Tnp sC7中存在的所有突变。例如R8C‘减去一个’在8位含有野生型的精氨酸。

b.‘加上一个’是Tnp WT,除所注明的氨基酸突变成Tnp sC7中的残基。如R8C‘加上一个’在氨基酸8位含有半胱氨酸。

序列-特异性突变。在所有突变中突变E58V对Tnp sC7的活性有最深的影响。在野生型背景(E58V‘加上一个’)中的该突变增加了IE

ME

相关的转座40,

000倍,而从Tnp sC7除去该突变(E58V‘减去一个’)时,总活性下降超过1,000倍。该突变对OE相关活性的影响相对极小。

突变E344K展现出对活性的这种类似的(虽然弱许多)的序列特异性影响。当其从Tnp sC7除去时(E344K‘减去一个’),IEME

的相关活性减少5倍而OE

相关活性则受激约5倍。在‘加上一个’数据中镜向表现了这种结果,如同E344K在野生型背景中刺激IEME

相关活性4倍并减少OE相关活性约5倍一样。

非-序列-特异性-突变。突变L372Q强烈地刺激Tnp sC7与IEME

的反应性。

当其从sC7除去时,IEME

和OE的相关活性都降低相同的程度。当其加入到野生型转座酶时,其‘加上一个’表型刺激这两种底物的活性。

其它突变。在剩下的4种突变中R8C突变是最令人感兴趣的。当将此突变加入到野生型转座酶时,OE相关转座减少了近10倍。当从sC7 OE除去该突变时,相关活性增加了约2倍。在甲基化宿主中,从sC7除去它对IEME

的相关活性影响极少,而其本身将IE

ME

的相关活性降低至可探测的水平之下。当剩下

的三种(A157T、T171S、D217A)突变从sC7除去时,对IEME

或OE相关活性没有多少影响。为了确定这些突变的任何组合是否导致总IE

ME

相关活性的增加而

13

6.1.  00811220.7说 明 书 第11/22页

ME

牺牲其对IE的特异性高于OE,申请人用基因工程方法改造了这些位置sC7

的成对回复和三重回复突变体。含有所有这三种回复突变的构建物具有第二最高IE相关活性和最高的区别IE和OE的能力(表3)。将这种含四个突变的构建物Tnp(R8C、E58V、E344K、L372Q)重新命名为Tnp sC7 v2.0。

表3含有所指明的回复成野生型的突变的Tnp sC7的体内频率。括号内是数字表明转变成野生型的位点。

                            IE                        OE                             IE/OE                             频率             归一化      频率              归一化Tnp sC7                         2.6×10       1.0         3.3×10        1.0          794Tnp sC7(157,171)               6.5×10       2.5         7.0×10        2.1          933Tnp sC7(157,217)               8.4×10       3.3         2.25×10       6.8          373Tnp sC7(171,217)               5.8×10       2.3         1.18×10       3.6          502Tnp sC7(157,171,217)α                  7.4×10       2.8         7.1×10        2.1          1042

α重新命名为sC7v2.0 缩写:OE=外末端       IE=内末端

      IE=dam甲基化的内末端

Tnp sC7比其各个突变之和少。Tnp E58V(E58V‘加上一个’)突变体的活性比单独Tnp WT高4×10。E58V已除去(E58V‘减去一个’)的复合突变体的活性比Tnp WT高1.8×10。然后可以预测Tnp sC7的活性将增加:                     (4×10)(1.8×10)=7.2×10

5

4

2

6

24

ME

-3

-6

-3

-5

-3

-5

-3

-6

-3

-6

ME

ME

ME

ME

然而实际上该复合突变的刺激低许多(2×10)。换言之,将E58V加入到其它6个突变得到的增加是1.1×10

3

倍,而将E58V加到野生型背景中则未见到4×10

4

倍的刺激。这可能是因为E58V和E334K二者刺激同一步骤(最初的DNA结合),且当混合时比加成少。

体外Tnp sC7v2.0能有效地转座IE限定的转座子

在开发用于OE限定转座子移动的同样条件下(用Tnp EK/LP),测试了体外Tnp sC7v2.0促进IE

ME

ME

限定转座子转座的能力(Goryshin,I.Y.,和Reznikoff,W.S.,

14

00811220.7说 明 书 第12/22页

“Tn5的体外转座”,J.Biol.Chem.273:7367-7374(1998),本文将其全部纳入作为参考)。将底物质粒pGT4(一种高拷贝数的pUC19-基载体,其中反向的IM

ME

末端序列侧接有卡那霉素抗性基因)纯化成超螺旋单体(见材料和方法)。将该质粒构建成能用PvuII限制性内切酶消化使得从供体主链DNA释放出此转座子

(见图5A)。通过将此核苷酸序列克隆入一表达载体,在宿主细胞中表达该蛋白质并从宿主细胞的提取物中分离出该蛋白质(都使用本领域技术人员已知的标准方法),产生和纯化Tnp sC7v2.0。

与Tnp sC7v2.0培养3小时后,导致66%超螺旋的质粒转变成转座产物和中间体。在图5B中,泳道1是未反应的底物pGT4。泳道2显示了由Tnp sC7v2.0促进的对IE转座子的转座活性,泳道3是用PvuII限制性内切酶消化pGT4的结果。

虽然以这种方式进行的转座反应可产生许多不同的DNA产物,但通过分

析Goryshin和Reznikoff(1998)(同上)已确定的某些诊断性片断来解释该反应。图5C是图5B泳道2的再现。条带1是切割下的转座子。它是该质粒经双末端

断裂但未进行链转移的一种中间体。条带2是该转座子双末端切除释放出的供体主链DNA。如图5B的泳道3所示,作为PvuII消化产物的这些条带具有相

同的分子量。条带3代表在转座子一端经历切割的底物质粒。它迁移到与线性化的质粒相同的位置(没有显示数据)。条带4和5是两种不同类型的链转移产

物。条带4是一转座子分子内插入到未反应的质粒中的结果。这导致松弛的环形DNA比初始底物质粒长,多出插入的转座子的长度。以5表示的条带是分

子内反向活动的结果。这些转座产物的大小为转座子的尺寸但是环形的。这些环化的转座产物可以含有不同数量的节,因此凝胶上迁移到不同位置。 结构/功能分析

超活性的Tn5转座酶突变体Tnp sC7v2.0(增加侧接IE转座子的转座7.4×10

5

ME

ME

倍)包含氨基酸8、58、344和372位上的突变。对Tnp sC7的分析表明

由E58V和E344K赋予的超过活性取决于转座子的末端序列。存在E58V这种表型并不令人感到惊讶,如先前用侧接OE的转座子进行的随机诱变筛选,分离到在氨基酸47或在氨基酸54位突变的蛋白质具有序列特异性活性(Zhou和

15

00811220.7说 明 书 第13/22页

Reznikoff,1977;Zhou,M.,Bhasin,A.,和Reznikoff,W.S.,“转座酶-末端DNA序列识别的分子遗传分析:三个相邻碱基对在与突变型Tn5转座酶的特异性相互作用中的协同性”J.Mol.Biol.276:913-925(1997))。然而氨基酸344位突变的序列特异性活性表明此残基也与转座子末端DNA相互作用,这确实很出乎意料。 最近,破解了代表与预切除的(非供体主链)OE DNA形成复合物的TnpEK/LP的蛋白质-DNA共晶体。在该复合物中,氨基酸58显示能特异性地与10位的OE相互作用。这使该突变残基临近12位,即最初被选择表达的核苷酸突变。IE和OE之间的10、11和12位都不同,而且临近两个含有被dam甲基酶修饰的主沟槽区域中的一个(上链的11位和下链的12位)。

该结构还表明氨基酸344与DNA在OE的7位相互作用。当7位不是区分IE和OE的7种中的一个时,其位于4位和核苷酸10、11和12的区域(区别这两者)之间。因此Tnp E344K对IE和OE的活性差异可能是因为这两个区域前后序列的影响。因此我们提出E58V和E344K两突变均能与末端序列DNA相互作用,并在最初的序列识别水平上改变转座酶的功能。

在所有测序的突变体(sA5、sB2、sC6、sC7和sD5)中存在着亮氨酸到谷氨酰胺的突变(L372Q)这是熟悉和令人惊讶的。说其熟悉是因为先前已分离到该位置的一个超活性突变。说其令人惊讶是因为先前分离到突变导致该位点亮氨酸到脯氨酸(L372P)的置换(Weinreich等人,1994)。这种L372P突变导致在一个α螺旋中有2个连续的脯氨酸残基。在共结晶中它使氨基酸372-390不稳定。有人提出这种突变改变了此催化结构域与C末端二聚化结构域相关的构象。这种改变通过增加N和C末端的距离能改善活性。认为在Tnp WT中这些末端的紧密接近减少了Tnp WT的转座率(Reznikoff等人,1999)。在早期部分Tnp结

构中可见的野生型亮氨酸残基(Davies,D.R.,Braam,L.M.,Rezikoff,W.S.,和Rayment,I.,“确定到2.9A分辨度的Tn5转座酶相关蛋白质的三维结构”,J BiolChem.274:11904-11913(1999))埋藏在疏水袋中,可能由于谷氨酰胺的替代使这种疏水袋不稳定。鉴于用PCR随机诱变方法(仅产生该密码子中的一个核苷酸

改变),且可能在残基(甲硫氨酸、缬氨酸、精氨酸、脯氨酸或谷氨酰胺)上只产生了5种不同的氨基酸置换)已分离得到了2种不同的超活性突变,因此有可能用更直接的突变方法如密码子随机化能揭示其它令人感兴趣的突变体。

16

00811220.7说 明 书 第14/22页

在野生型背景(R8C‘加上一个’)中能将OE相关转座降低几乎10倍而且当从sC7背景(R8C‘减少一个’)除去时增加约2倍的突变R8C,较不容易解释。在共结晶结构中,精氨酸残基不在DNA接触的区域内。然而这种结构仅代表切割后此复合物的静置图像,且该区域可能与最初突触中的DNA接触。 IE甲基化

Tn5转座子的内末端含有2个GATC信号序列,它将4个甲基加到各末端的主沟槽中。在该研究中,我们能够分离到一个突变E58V,其不仅克服了这

种结合抑制而且表现出对其中存在甲基的转座子的偏爱作用(推测是因为结合亲和力的增加)。另外,与预切割的DNA形成复合物的Tnp EK/LP的共结晶结构显示,谷氨酸58直接与主沟槽中OE的10位相互作用。该区域在IE非转

移链的腺嘌呤上的甲基附近。这种单个氨基酸的变化能导致表型巨变的事实使我们提出,就是该甲基负责对转座酶与IE结合的抑制。Tnp WT与IE结合

的抑制很可能是由于该甲基与谷氨酸58的带负电侧链之间相互作用所导致的。用缬氨酸替换该残基不仅消除了这种不良的相互作用而且还由于在缬氨酸残基侧链和该甲基之间的疏水袋而增加了结合亲和力。 通用材料和方法 培养基和试剂

如Zhou M.,& Reznikoff,W.S.,(同上)所述,用补充有氨苄青霉素、氯霉素、5-溴-4-氯-3-吲哚-β-D-半乳糖苷和苯基-β-D-半乳糖苷的葡萄糖基本Miller培养基(Miller,J.,分子遗传学实验,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY.(1992))(Trp-XG-PG平板)进行乳头化试验。在定点诱变过程中的转化后,按变位流程(Promega)在SOC培养基中培养细胞。所有其它细菌的培养

都是在Luria肉汤(Sambrook,J.,Fritsch,E.F.&Maniatis,T.(1989)分子克隆:实验室手册,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY.)中进行的。需要时,加入如下浓度的抗菌素(Sigma):氨苄青霉素100μg/ml;氯霉素20μg/ml;萘啶酸20μg/ml;庆大霉素5μg/ml;四环素15μg/ml。Taq DNA聚合酶、T4聚合酶、T4连接酶、dNTP和变位突变试剂盒中的所有成分都是从Promega购得的。

17

ME

MEME

00811220.7说 明 书 第15/22页

从Promega或New England Biolabs购得限制酶。在定位诱变、sPCR和测序中

所用的寡核苷酸是从Research Genetic购得的。测序中使用的放射性核苷酸是Amersham的。 质粒的构建

将质粒pGT4构建成含有侧翼连接了两个内末端的卡那霉素抗性基因的高拷贝数质粒。如此设计,从而可用PvuII消化从其pUC载体主链中释放出转座子。

通过交换pRZ9905和pRZ9905之间的限制片断构建了14种pRZ9905(sC7)衍生物和pRZ9905(sC7版本2.0)。 细菌菌株

在JM109(Promega)中进行质粒的克隆和定向进化过程。用菌株

ES1301(Promega)和JM109进行定点诱变程序。在交配试验中,将转座酶质粒转化入菌株RZ212中[Δ(lac-proA,B)、ara、str、recA56、srl、thi/pOX38-Gen],然后偶联入14R525[F-nalr]。 定向进化过程

基本上按Stemmer(1994)所述,用sPCR进行了Tn5转座酶的定向进化。

在含有100mM Tris-HCl(ph=7.0)、5nM MgCl和90ng DNase I的50μl溶液中部分消化40微升(~4μg)的pRZ9905质粒的小量制备物。室温培养7分钟后,加入EDTA至10mM终止反应。加入上样染料后(Sambrook等人,1989),在2%NuSieve凝胶(FMC BioProducts)中对消化的DNA进行电泳,紧靠pGEM DNA

标记(Promega)。从该凝胶上切下含有大小为200-600bp DNA片断的凝胶片和含有600-1000bp大小的DNA片断的另一凝胶片。分别用苯酚氯仿提取法纯化这两片中的DNA(Sambrook,等人,1998)。在乙醇沉淀后,干燥DNA沉淀,直接在50μl装配反应混合液中重悬浮。该装配混合液含有0.2mM dNTP、2.0mM

MgCl、50mM KCl、10mM Tris-HCl(25℃pH 9.0)和0.1%Triton X-100。加入0.5单位Taq DNA聚合酶后,按以下热循环流程重装配此DNA:94℃ 30秒;50

18

00811220.7说 明 书 第16/22页

轮,94℃ 20秒;65℃1分钟;和72℃2分钟;冷却至4℃。每份样品(200-600bp和600-1000bp),用5μl装配反应产物作为DNA模板进行标准PCR扩增

反应,来扩增此转座酶基因。用AflII和BglII消化编码转座酶的片断,并连接入纯化的用AflII/BglII消化得到的pRZ9905载体DNA中。

将连接产物转化入含有质粒pRZ9904的电感受态(electrocompetent)JM109细胞中。培养后,将细胞置于含有氯霉素和氨苄青霉素选择的Trp-XG-PG平板上。32℃培养此平板14天。此时,从所有表现出至少一个乳头状突起的菌落分离得到pRZ9905质粒DNA,再重新转化入乳头化试验来验证它们的乳头状突起加表型。总共有5个pRZ9905衍生物(在最初筛选的20,000个菌落中)证明为乳头状突起+。然后将相同量的所有这5种质粒作为第二轮诱变和筛选的底物。该过程总共重复进行4轮筛选(~20,000菌落/轮)。 定量乳头化试验

用定量乳头化试验比较了Tnp WT、Tnp sA5、Tnp sB2、Tnp sC6和Tnp sD5的IE12A体内转座活性。用适当的编码转座酶的pRZ9905转化携带质粒

pRZ9904(IE12A/IE12A)的菌株JM109的感受态细胞。长出后,将转化的细胞置于含有氯霉素和氨苄青霉素的Tnp-XG-PG平板上。将平板在32℃培养直到出

现菌落(~18小时)。然后用无菌针挑出各菌落,并以4×4的栅格模式点样在新鲜的平板上,均匀分布所有菌落。每个含有16个菌落的平板点样一种蛋白质。将平板在32℃培养,以24小时间隔观察出现的乳头状突起来定量转座。数据以每个菌落的乳头状突起平均数表示。 交配试验

如先前(Yin等人,1988;Goryshin等人,1994)所述进行交配试验。用适当的编码转座酶的质粒pRZ9905转化带有含质粒pFMA52-187(有两个OE或两个IE)和F因子pox-Gen的转座子的细菌细胞。文库筛选所用的供体是菌株

JCM101[ΔlacZX74,raps,dam-3]。用大肠杆菌RZ212[Δ(lac-proA,B),ara,str,recA56,srl,thi]进行所有其它交配。转座酶和末端序列的每个组合进行3次分析。以这三次数据的平均值表示该值。

19

00811220.7说 明 书 第17/22页

体外转座试验

用Qiafilter plasmid mega试剂盒(Qiagen)从DH5α细胞分离得到底物质粒PGT4。用Qiaquick凝胶纯化试剂盒(Qiagen)从1%琼脂糖凝胶分离得到超螺旋单体质粒。37℃在Reznikoff和Goryshin(1998)确定的条件下进行反应。pGT4的浓度为35.5nM。加入Tnp sC7v2.0至280nM浓度。

以上所述并非是对本发明范围的限制。应理解本发明将所有各种变化和改进包括在本发明权利要求范围之内。

20

00811220.7说 明 书 第18/22页

                        序列表<110>W.S.列兹尼科夫(Reznikoff,William S)  T.A.瑙曼(Naumann,Todd A)<120>转座酶及其使用方法<130>960296.96471<140><141>

<150>US 60/146686<151>1999-08-02<160>5

<170>PatentIn Ver.2.1版本<210>1<211>1431<212>DNA<213>转座子Tn5<220><221>CDS

<222>(1)..(1428)<400>1

atg ata act tct gct ctt cat cgt gcg gcc gac tgg gct aaa tct gtgMet Ile Thr Ser Ala Leu His Arg Ala Ala Asp Trp Ala Lys Ser Val  1               5                  10                  15

ttc tct tcg gcg gcg ctg ggt gat cct cgc cgt act gcc cgc ttg gttPhe Ser Ser Ala Ala Leu Gly Asp Pro Arg Arg Thr Ala Arg Leu Val          20                  25                  30

aac gtc gcc gcc caa ttg gca aaa tat tct ggt aaa tca ata acc atc Asn Val Ala Ala Gln Leu Ala Lys Tyr Ser Gly Lys Ser Ile Thr Ile      35                  40                  45

tca tca gag ggt agt gaa gcc atg cag gaa ggc gct tac cga ttt atc Ser Ser Glu Gly Ser Glu Ala Met Gln Glu Gly Ala Tyr Arg Phe Ile  50                  55                  60

cgc aat ccc aac gtt tct gcc gag gcg atc aga aag gct ggc gcc atg Arg Asn Pro Asn Val Ser Ala Glu Ala Ile Arg Lys Ala Gly Ala Met 65                  70                  75                  80

caa aca gtc aag ttg gct cag gag ttt ccc gaa ctg ctg gcc att gag Gln Thr Val Lys Leu Ala Gln Glu Phe Pro Glu Leu Leu Ala Ile Glu              85                  90                  95

gac acc acc tct ttg agt tat cgc cac cag gtc gcc gaa gag ctt ggc Asp Thr Thr Ser Leu Ser Tyr Arg His Gln Val Ala Glu Glu Leu Gly

21

 48 96144192240288336              00811220.7说 明 书 第19/22页

        100                 105                 110

aag ctg ggc tct att cag gat aaa tcc cgc gga tgg tgg gtt cac tcc   384Lys Leu Gly Ser Ile Gln Asp Lys Ser Arg Gly Trp Trp Val His Ser     115                 120                 125

gtt ctc ttg ctc gag gcc acc aca ttc cgc acc gta gga tta ctg cat   432Val Leu Leu Leu Glu Ala Thr Thr Phe Arg Thr Val Gly Leu Leu His 130                 135                 140

cag gag tgg tgg atg cgc ccg gat gac cct gcc gat gcg gat gaa aag   480Gln Glu Trp Trp Met Arg Pro Asp Asp Pro Ala Asp Ala Asp Glu Lys145                 150                 155                 160

gag agt ggc aaa tgg ctg gca gcg gcc gca act agc cgg tta cgc atgGlu Ser Gly Lys Trp Leu Ala Ala Ala Ala Thr Ser Arg Leu Arg Met             165                 170                 175

ggc agc atg atg agc aac gtg att gcg gtc tgt gac cgc gaa gcc gatGly Ser Met Met Ser Asn Val Ile Ala Val Cys Asp Arg Glu Ala Asp         180                 185                 190

att cat gct tat ctg cag gac aaa ctg gcg cat aac gag cgc ttc gtgIle His Ala Tyr Leu Gln Asp Lys Leu Ala His Asn Glu Arg Phe Val     195                 200                 205

gtg cgc tcc aag cac cca cgc aag gac gta gag tct ggg ttg tat ctgVal Arg Ser Lys His Pro Arg Lys Asp Val Glu Ser Gly Leu Tyr Leu 210                 215                 220

tac gac cat ctg aag aac caa ccg gag ttg ggt ggc tat cag atc agcTyr Asp His Leu Lys Asn Gln Pro Glu Leu Gly Gly Tyr Gln Ile Ser225                 230                 235                 240

att ccg caa aag ggc gtg gtg gat aaa cgc ggt aaa cgt aaa aat cgaIle Pro Gln Lys Gly Val Val Asp Lys Arg Gly Lys Arg Lys Asn Arg             245                 250                 255

cca gcc cgc aag gcg agc ttg agc ctg cgc agt ggg cgc atc acg ctaPro Ala Arg Lys Ala Ser Leu Ser Leu Arg Ser Gly Arg Ile Thr Leu         260                 265                 270

aaa cag ggg aat atc acg ctc aac gcg gtg ctg gcc gag gag att aacLys Gln Gly Asn Ile Thr Leu Asn Ala Val Leu Ala Glu Glu Ile Asn     275                 280                 285

ccg ccc aag ggt gag acc ccg ttg aaa tgg ttg ttg ctg acc agc gaaPro Pro Lys Gly Glu Thr Pro Leu Lys Trp Leu Leu Leu Thr Ser Glu 290                 295                 300

ccg gtc gag tcg cta gcc caa gcc ttg cgc gtc atc gac att tat accPro Val Glu Ser Leu Ala Gln Ala Leu Arg Val Ile Asp Ile Tyr Thr305                 310                 315                 320

cat cgc tgg cgg atc gag gag ttc cat aag gca tgg aaa acc gga gca 22

 528 576 624 672 720 768 816 864 912 9601008

                      00811220.7说 明 书 第20/22页

His Arg Trp Arg Ile Glu Glu Phe His Lys Ala Trp Lys Thr Gly Ala             325                 330                 335

gga gcc gag agg caa cgc atg gag gag ccg gat aat ctg gag cgg atg   1056Gly Ala Glu Arg Gln Arg Met Glu Glu Pro Asp Asn Leu Glu Arg Met         340                 345                 350

gtc tcg atc ctc tcg ttt gtt gcg gtc agg ctg tta cag ctc aga gaa   1104Val Ser Ile Leu Ser Phe Val Ala Val Arg Leu Leu Gln Leu Arg Glu     355                 360                 365

agc ttc acg ctg ccg caa gca ctc agg gcg caa ggg ctg cta aag gaa   1152Ser Phe Thr Leu Pro Gln Ala Leu Arg Ala Gln Gly Leu Leu Lys Glu 370                 375                 380

gcg gaa cac gta gaa agc cag tcc gca gaa acg gtg ctg acc ccg gat  Ala Glu His Val Glu Ser Gln Ser Ala Glu Thr Val Leu Thr Pro Asp385                 390                 395                 400

gaa tgt cag cta ctg ggc tat ctg gac aag gga aaa cgc aag cgc aaa  Glu Cys Gln Leu Leu Gly Tyr Leu Asp Lys Gly Lys Arg Lys Arg Lys             405                 410                 415

gag aaa gca ggt agc ttg cag tgg gct tac atg gcg ata gct aga ctg  Glu Lys Ala Gly Ser Leu Gln Trp Ala Tyr Met Ala Ile Ala Arg Leu         420                 425                 430

ggc ggt ttt atg gac agc aag cga acc gga att gcc agc tgg ggc gcc  Gly Gly Phe Met Asp Ser Lys Arg Thr Gly Ile Ala Ser Trp Gly Ala     435                 440                 445

ctc tgg gaa ggt tgg gaa gcc ctg caa agt aaa ctg gat ggc ttt ctt  Leu Trp Glu Gly Trp Glu Ala Leu Gln Ser Lys Leu Asp Gly Phe Leu 450                 455                 460

gcc gcc aag gat ctg atg gcg cag ggg atc aag atc tga              Ala Ala Lys Asp Leu Met Ala Gln Gly Ile Lys Ile465                 470                 475<210>2<211>476<212>PRT<213>转座子Tn5<400>2

Met Ile Thr Ser Ala Leu His Arg Ala Ala Asp Trp Ala Lys Ser Val  1               5                  10                  15Phe Ser Ser Ala Ala Leu Gly Asp Pro Arg Arg Thr Ala Arg Leu Val          20                  25                  30

Asn Val Ala Ala Gln Leu Ala Lys Tyr Ser Gly Lys Ser Ile Thr Ile      35                  40                  45

23

120012481296134413921431      00811220.7说 明 书 第21/22页

Ser Ser Glu Gly Ser Glu Ala Met Gln Glu Gly Ala Tyr Arg Phe Ile  50                  55                  60

Arg Asn Pro Asn Val Ser Ala Glu Ala Ile Arg Lys Ala Gly Ala Met 65                  70                  75                  80Gln Thr Val Lys Leu Ala Gln Glu Phe Pro Glu Leu Leu Ala Ile Glu              85                  90                  95Asp Thr Thr Ser Leu Ser Tyr Arg His Gln Val Ala Glu Glu Leu Gly         100                 105                 110

Lys Leu Gly Ser Ile Gln Asp Lys Ser Arg Gly Trp Trp Val His Ser     115                 120                 125

Val Leu Leu Leu Glu Ala Thr Thr Phe Arg Thr Val Gly Leu Leu His 130                 135                 140

Gln Glu Trp Trp Met Arg Pro Asp Asp Pro Ala Asp Ala Asp Glu Lys145                 150                 155                 160Glu Ser Gly Lys Trp Leu Ala Ala Ala Ala Thr Ser Arg Leu Arg Met             165                 170                 175Gly Ser Met Met Ser Asn Val Ile Ala Val Cys Asp Arg Glu Ala Asp         180                 185                 190

Ile His Ala Tyr Leu Gln Asp Lys Leu Ala His Asn Glu Arg Phe Val     195                 200                 205

Val Arg Ser Lys His Pro Arg Lys Asp Val Glu Ser Gly Leu Tyr Leu 210                 215                 220

Tyr Asp His Leu Lys Asn Gln Pro Glu Leu Gly Gly Tyr Gln Ile Ser225                 230                 235                 240Ile Pro Gln Lys Gly Val Val Asp Lys Arg Gly Lys Arg Lys Asn Arg             245                 250                 255Pro Ala Arg Lys Ala Ser Leu Ser Leu Arg Ser Gly Arg Ile Thr Leu         260                 265                 270

Lys Gln Gly Asn Ile Thr Leu Asn Ala Val Leu Ala Glu Glu Ile Asn     275                 280                 285

Pro Pro Lys Gly Glu Thr Pro Leu Lys Trp Leu Leu Leu Thr Ser Glu 290                 295                 300

Pro Val Glu Ser Leu Ala Gln Ala Leu Arg Val Ile Asp Ile Tyr Thr305                 310                 315                 320His Arg Trp Arg Ile Glu Glu Phe His Lys Ala Trp Lys Thr Gly Ala             325                 330                 335Gly Ala Glu Arg Gln Arg Met Glu Glu Pro Asp Asn Leu Glu Arg Met

24

00811220.7         340                 345                 350

Val Ser Ile Leu Ser Phe Val Ala Val Arg Leu Leu Gln Leu Arg Glu     355                 360                 365

Ser Phe Thr Leu Pro Gln Ala Leu Arg Ala Gln Gly Leu Leu Lys Glu 370                 375                 380

Ala Glu His Val Glu Ser Gln Ser Ala Glu Thr Val Leu Thr Pro Asp385                 390                 395                 400Glu Cys Gln Leu Leu Gly Tyr Leu Asp Lys Gly Lys Arg Lys Arg Lys             405                 410                 415Glu Lys Ala Gly Ser Leu Gln Trp Ala Tyr Met Ala Ile Ala Arg Leu         420                 425                 430

Gly Gly Phe Met Asp Ser Lys Arg Thr Gly Ile Ala Ser Trp Gly Ala     435                 440                 445

Leu Trp Glu Gly Trp Glu Ala Leu Gln Ser Lys Leu Asp Gly Phe Leu 450                 455                 460Ala Ala Lys Asp Leu Met Ala Gln Gly Ile Lys Ile465                 470                 475<210>3<211>19<212>DNA<213>转座子Tn5<400>3

ctgactctta tacacaagt                            <210>4<211>19<212>DNA<213>转座子Tn5<400>4

ctgtctcttg atcagatct                            <210>5<211>19<212>DNA<213>转座子Tn5<400>5

ctgtctcttg aacagatct                            25

说 明 书 第22/22页

          19          19          19

                   00811220.7

说 明 书 附 图

第1/7页

图1

26

00811220.7说 明 书 附 图 第2/7页

图2

27

00811220.728

说 明 书 附 图 第3/7页

图3A

00811220.7说 明 书 附 图 第4/7页

图3B

29

00811220.7说 明 书 附 图 第5/7页

图4

图5A

30

00811220.7说 明 书 附 图 第6/7页

图5B

31

00811220.7说 明 书 附 图 第7/7页

图5C

32

因篇幅问题不能全部显示,请点此查看更多更全内容