首页  >  热点  >  新闻特写  >  文章正文
shRNA表达克隆

20年的困扰–HIV整合酶研究

Mar 18, 2010 No Comments

在今年一月份的《自然》(Nature)杂志上,Stephen Hare等人发表了一篇名为《Retroviral intasome assembly and inhibition of DNA strand transfer》的文章。研究人员培育出PFV病毒的整合酶晶体。他们通过对晶体的X射线衍射,得到其三维构型。这篇文章的意义在于PFV病毒的整合酶与HIV病毒整合酶结构十分类似,这相当于我们得到了非常近似于HIV整合酶的完整三维构型,而这一难题困扰了科学家20多年。通过对该整合酶结构的研究,科学家有望设计出安全有效的HIV整合酶抑制剂,改善治疗AIDS的方法与效果。

对于HIV及其它逆转录病毒来说,病毒DNA整合到宿主DNA的过程是它们复制周期中关键性的一步。一个有感染性的逆转录病毒会将一个大的核蛋白复合物带入宿主细胞的胞质中。这个由病毒核心出来的复合物由两个拷贝的病毒RNA和一些病毒蛋白(包括逆转录酶和整合酶)组成。病毒RNA在这个复合物内逆转录成一个双链DNA形式的拷贝,以用于随后的整合过程。此时病毒DNA同时与病毒和细胞蛋白相联系,组成称为前整合复合体(PIC)的核蛋白复合物。这个复合体中的一个成份就是病毒整合酶,它是病毒DNA整合进宿主基因组步骤的关键因素。复合体中的其它组分随着病毒DNA及整合酶一起进入细胞核中,不过它们所起的作用至今还没有一个肯定的结论。病毒整合中的关键步骤:DNA切割与连接,都是由整合酶完成的,因此对于病毒整合酶的研究一直都受到科学家的高度关注。

一、HIV-1整合酶的功能
HIV-1的逆转录基因组RNA在宿主细胞的胞质中被病毒自身的逆转录酶逆转录成DNA拷贝形式,而整合酶的作用就是将病毒DNA插入到宿主基因组中。将新合成的病毒DNA整合进宿主染色体是一个多步骤的过程。首先,作为病毒前整合复合体(PIC)的一部分,HIV整合酶识别在胞质中新合成的病毒DNA末端的特异四碱基序列CAGT,接着在病毒与细胞基因组DNA上催化一连串酯基转移反应(图1)。第一步叫做3’端加工,整合酶与胞质中的病毒双链DNA结合,切除3’末端的两个碱基,露出高度保守的CA末端,使病毒DNA 3’末端的羟基暴露出来用于结合细胞DNA;第二步叫DNA链转移,上一步形成的病毒DNA蛋白复合物入核,整合酶在宿主DNA上切出间隔5个碱基的交错切口,病毒DNA的3’端与宿主DNA的5’端共价连接起来;第三步是修复阶段,首先是将病毒DNA 5’端多出的两个未配对的碱基去除,再将缺口连接上,这一步骤由宿主细胞的酶完成。病毒DNA的整合位点不具特异性,可以是宿主DNA的任意位置。整合后的病毒DNA随宿主DNA一同转录成RNA,再被翻译成病毒蛋白,加工、包装成新的子代病毒,形成一个完整的病毒感染周期。HIV感染的细胞反应多种多样:有细胞快速死亡,也有细胞被潜伏感染,成为病毒库。产生这些不同表象的一个原因就是病毒整合位点的不同。整合发生在人类基因组的各处,并且倾向于表达活跃的基因位点,这样就有可能导致不同的细胞中病毒的整合位点与拷贝数都不相同,从而产生不同的细胞感染反应。

纯化的重组HIV整合酶与包含顺式活性DNA序列的寡核苷酸,能在体外进行末端加工与链转移。不过重组的HIV整合酶自身不足以催化体外双末端的整合,这与在体内观察到的情况不符。造成这种差异的原因可能是缺少病毒前整合复合体中的其它蛋白成分,而目前还不能确认PIC中的所有的蛋白组分和它们所行使的功能。

 

图1

图1 HIV整合酶在病毒与细胞基因组DNA上催化一连串酯基转移反应。A→B 病毒DNA 3’端加工; B→C DNA链转移;D和E 链转移过程中宿主DNA的结构变化。

 

二、HIV-1整合酶的结构
(一)整合酶的氨基酸序列与结构域结构
HIV-1整合酶的多肽单链包含288个氨基酸残基,并能明显区分成三种结构域和跨结构域接头。如图2所示,1-46残基是氨基端结构域(NTD),47-55残基是接头。催化中心结构域(CCD)位于56-202残基,接着是203-219残基的接头,最后是羧基端结构域(CTD),位于220-288残基。对于PFV病毒整合酶来说,在NTD之前还有大约50个残基的一个结构域。各单独的结构域的结构见图3。到目前为止,还没有关于单独的NTD或CTD结晶的报导。最先结晶的是HIV-1整合酶的CCD,并且还是在引入了F185K突变之后才能被结晶。其它的HIV-1整合酶结晶还有:NTD-CCD结晶,引入了三处突变用于加强蛋白的溶解性,分别是F185K、W131D和F139D;CCD-CTD结晶,引入了同样的三处突变。

图片2

图2 HIV-1整合酶的多肽单链结构。

 

图片3 

图3 HIV-1整合酶各单独的结构域的结构。A:NTD结构域,包含一个HHCC基序(球棒装);B:CCD结构域,其活性中心的三个氨基酸残基(D,D(35)E)显示为球棒状,与Mg2+离子(灰色球状)协同作用;C:CTD结构域。

 

1. 整合酶的催化中心结构域
整合酶的CCD包含了完整的催化元件,并且在缺少其它结构域的情况下仍能表现出一定的活性。由于CCD在整合酶中起的重要作用,并且还没有完整的整合酶结晶,所以CCD是第一个被结晶并分析的目标。

 
CCD中的Asp64、Asp116和Glu152为整合酶的活性中心,形成DD(35)E基序,结合一个或两个二价金属阳离子(Mg2+或Mn2+)。现已证明Asp64和Asp116为结合Mg2+的位点。CCD的结构由5个β片层和6个α螺旋组成,活性位点的三个氨基酸残基Asp64位于β1片层中间,Asp116位于β4片层α2螺旋之间的环状区域内,Glu152位于β5片层与α4螺旋之间的区域内。保守的Asp或Glu被突变后,整合酶会失去它的活性。在二聚化的整合酶中,两个CCD的活性中心相差标准B-DNA的5-6bp距离,这意味着宿主DNA只有在整合时解螺旋才能保证两个CCD的活性中心同时起作用(图4)。

 

图片4

图4 二聚体形式的CCD。

 

2. 整合酶的氨基端结构域
NTD由于含有HX3-7HX23-32CX2C锌指样结构,又被称为HHCC区,此结构有促进整合酶四聚化及增强催化活力的功能,在酶与病毒形成稳定复合物方面起着关键的作用。23-50位氨基酸残基的缺失突变及His或Cys的转换突变可使整合酶的3’加工及链转移催化活性完全消失;作用于该区表位的单克隆抗体也可部分或完全阻断整合酶的催化反应。因此,NTD为3’加工及链转移功能所必须,这可能与该结构域在整合酶单体的聚合和多聚体形成中所起的作用有关。

3. 整合酶的羧基端结构域
CTD是整合酶中氨基酸序列最多变的区域。该区域具有不依赖金属离子的非特异性DNA结合活性,也与整合酶的多聚体形成有关。257-288位氨基酸残基的缺失突变及262、263和264位氨基酸残基的转换突变可导致3’加工及链转移活性完全丧失。通过NMR光谱已弄清220-270位氨基酸残基的结构,该肽段在溶液中以二聚体形式存在,含有类似在信号转导蛋白中发现的SH3样折叠,意义不明。2、3和4β片层形成二聚体的交界面呈高度疏水性。1和2β片层形成一马鞍型缝隙,缝隙表面存在很多碱性基团,使之能与DNA非特异性结合。

(二)整合酶抑制剂的研究
如今共有18种核酸与非核酸形式的RT(逆转录酶)抑制剂,10种PR(蛋白酶)抑制剂被FDA认可用于AIDS治疗,而对于IN(整合酶)抑制剂,由于其结构方面的知识所知甚少,开发出的抑制剂比较少,目前只有一种叫做raltegravir的抑制剂被FDA批准为治疗AIDS药物。众所周知,目前的许多抗HIV药物有着严重的副作用,如肌肉病、肝脂肪炎和脂肪代谢障碍等。原因在于这些药物在抗病毒时也阻断了人体内的一些重要蛋白功能。而抗IN药物在这方面有着很明显的优势,因为病毒整合酶在人体内没有直接的同源蛋白。

目前对HIV-1整合酶的抑制集中在四个方面:
1. 干扰整合酶的多聚化
在体内,蛋白质所发挥的功能作用被许多相关的平衡反应制约着,其中一个最主要的平衡存在于活性构象和非活性构象之间。作为功能大分子,蛋白质的功能不仅取决于其氨基酸序列,更决定于其空间结构。这为研发整合酶抑制剂开辟了一条新的途径。已有研究发现,来源于宿主细胞的晶状体上皮生长因子p75(LEDGFp75)对整合过程具有影响作用,这主要是通过其对整合酶多聚化的作用的影响而实现的(图5)。

 

图片5

图5 LEDGFp75调节整合酶多聚化的机制。

 

2. 抑制整合酶-DNA之间的结合
抑制整合酶与DNA分子的结合可以通过扰乱DNA的结构及破坏整合酶的DNA结合位点实现。这类抑制剂包括DNA嵌入剂和拓扑异构酶II抑制剂。

3. 干扰整合酶的核定位
整合酶在胞质内与病毒DNA及病毒蛋白形成前整合复合体,由核定位信号肽介导进入宿主细胞核。如能将整合酶与病毒DNA分离,或将前整合复合体局限于胞质内,不使其进入细胞核发挥作用,势必能影响HIV的复制。但目前罕见此类研究报道。

4. 抑制整合酶的3’切割和链转移反应
抑制这两个反应,均可有效抑制整合反应。药物的特异性十分重要,应不抑制正常细胞的其它酶类。目前,已有很多能够抑制3’切割和链转移的整合酶抑制剂被发现。主要有肽类抑制剂、核苷类和多羟基化芳香族化合物类等几大类。

值得一提的是,作为二酮类(DKA)化合物的衍生物,5CITEP体现了较强的整合酶抑制活性,而且在HIV整合酶与其众多抑制剂形成的复合物中,只有与5CITEP形成复合物的晶体结构被解析出来。其作用部位主要在整合酶的CCD,包括其活性中心的三个氨基酸残基Asp64、Asp116和Glu152。另外,通过定点突变实验发现,另外一些整合酶的活性位点,如Lys156、Lys159和Gln148等,也都是5CITEP的作用位点。

结语
在1994-2001年间,关于整合酶研究的文章呈井喷的态势,期间我们得到了许多逆转录病毒整合酶的晶体与NMR结构数据。随后近10年,只有少部分新的关于整合酶结构的文章发表。还有许有疑问,特别是关于整合酶整体结构的解析、前整合体组分分析等需要我们去解答。关于整合酶的研究仍将是今后一段时期内的热点。

 

 
附文:
Stephen Hare等人在《Retroviral intasome assembly and inhibition of DNA strand transfer》一文中的工作简介。

通过多次结晶尝试,研究人员发现了一种全长野生型PFV整合酶(IN)晶体结构(图6),它是包含了一个 19bp供体DNA的复合体,其X衍射分辨率达到2.9 Å,足够用于三维结构的分析。在一个不对称单元中包含一个IN二聚体和一个紧密结合的病毒DNA分子,一对镜像对称的IN二聚体形成一个椭圆形四聚体。IN二聚体的交界处由分子间的NTD-CCD相互作用来稳定。(NTD,氨基端结构域;CCD,催化中心结构域;CTD,羧基端结构域)

 

图片6

图6 PFV整合酶晶体结构。a:PFV整合酶晶体结构的正面(左图)与侧面(右图)。内部亚基与结合的病毒DNA分别用蓝色与绿色表示;外部亚基为黄色。转移链与非转移链分别是品红色与橙色。三个活性氨基酸残基(Asp128、Asp185和Glu221)的侧链显示为红色棒状,灰色圆球是Zn原子;b:内部亚基的结构域图。

 

1. PFV整合体的总体结构
四聚体内部的亚基负责IN亚基四聚化及病毒DNA结合过程中的所有接触反应,外部亚基的CCD似乎是起着支撑作用,它们的NTD与CTD没有包含在电子密度图内。在PFV整合体内,CCD-CTD接头的大部分呈现一种伸展的状态,并且与同亚基内的NTD-CCD接头平行。这些跨结构域的接头将整合体内的两个二聚体束缚在一起,这种结构还被一对CTD与CCD的相互作用所加强。这与以往的IN四聚体模型不同,该模型认为两个二聚体之间的交界处是高度灵活可变的,而这一次的整合体构型分析显示出整合体结构是高度稳定的。同源建模显示,在HIV-1 IN中,明显偏短的跨结构域接头也能足够地伸展,达到类似的构型。一个更小的结构域存在于PFV IN的NTD之前,被称为NED(NTD延伸结构域),根据氨基酸序列比较与二级结构预测,研究者认为NED存在于其它泡沫病毒以及可能还有γ逆转录病毒的IN中。

2. PFV整合体中的IN-DNA相互作用
蛋白与DNA的相互作用包含IN内部亚基的各个结构域的氨基酸残基,结构域之间的接头以及病毒DNA末端的 17个核苷酸。最紧密的蛋白-DNA相互作用位于病毒DNA末端的6个核苷酸,这一块的DNA构型严重偏离原本的B型。各催化亚基的NED和NTD与病毒DNA分子结合的位置正对着CCD的活性位点,NED与病毒DNA分子的磷酸二酯骨架相互作用,其它元件(NTD、CTD、CCD、NTD-CCD与CCD-CTD接头)进一步加强这种结合。这些序列特异性结合包括亚基上218位的Gly的羧基基团,它可以与非转移链上第4位的鸟嘌呤形成氢键。蛋白-DNA的相互作用一直延伸到CCD的嵌合在病毒DNA双螺旋小沟内的α4螺旋开头。

3. 整合体的活性位点(图7)
具有反应活性的供体DNA分子3’末端固定在Asp128、Asp185与Glu221活性羧基端附近。研究者在结晶时添加了MnCl2。通过晶体衍射数据分析,发现在IN内部亚基的活性区域内有两处金属离子的结合位点,这一结果证实了原来对于逆转录病毒IN的双金属结合模型假设,同时揭示了作为辅助因子的金属离子的确切作用位置。详细来说,金属原子B与Asp128和Glu221的羧基端协同作用,激活前加工病毒DNA 3’端的羟基用于链转移,而与Asp128和Asp185结合的金属A则促使目标DNA上脆弱的磷酸二酯键变得不稳定。这些金属离子的位置与鸟类肉瘤病毒IN的CCD中Cd2+和Zn2+的位置相似,并且研究人员还发现结晶时无论添加MgCl2还是MnCl2,都不会改变整合体活性区域的结构,这说明病毒DNA 3’端的定位不依赖于整合体所结合的二价金属离子。

 

图片8

图7 PFV 整合酶的活性位点。上图是卡通图形表示,下图是溶剂可及表面表示。

 

4. DNA结合模型
与病毒DNA作用的IN内部亚基的活性区域在两个二聚体交界处的深处,在这个前提下与宿主染色体DNA(目标DNA)结合而又无需显著改变整合体的构象或使病毒DNA产生严重弯曲,唯一合理的结合模型就是沿着IN两个二聚体之间的缝隙结合。图8在这个缝隙内的B型病毒DNA的活性位点近乎完美的排列开,并正对着被分开4bp的目标DNA磷酸二脂键,这是PFV病毒整合时的标准空间大小。从模式图上可见CCD的α2螺旋非常重要,它的突变会阻止目标DNA的结合。研究人员还推断IN外部亚基的NTD和/或者CTD起着捕获目标DNA的作用,不过这需要进一步的实验证实。

 

图片8

图8 预测的目标DNA结合方向。活性位点的侧链用红棒表示,在目标DNA结合中起作用的α2螺旋标注为蓝绿色。

 

5. 链转移抑制剂作用原理(图9)
以往的研究证实PFV的IN对HIV-1的链转移抑制剂(InSTI)敏感,这些化合物被认为与IN活性区域的金属离子起作用。研究人员用两种临床InSTI作为研究对象,分别是MK0581(也称为raltegravir)与GS9137(elvitegravir),发现InSTI能抑制Mg2+与Mn2+依赖的PFV整合体活性。从结构上看,两种InSTI有着非常相似的结合与反应模式。它们的金属螯合氧原子面向活性区域的金属辅助因子,而它们的环状苯甲基团安置在由于3’鸟嘌呤(A17)移位产生的口袋状空间内。在这里面,InSTI与不变的CA双核苷酸、非转移链的第4位鸟嘌呤以及保守的Pro214和Gln215之间产生紧密的范德华相互作用。这种药物结合模式的结果就是病毒DNA活性3’端从活性区域移位,从而导致整合体的失活。由于在HIV-1病毒中,核心接触区域的关键核苷酸与氨基酸残基都是保守的,所以InSTI与HIV-1病毒整合体的结合与反应模式应该与PFV病毒的差不多。在这一次研究的整合体结构内,病毒DNA与整合体有着广泛的接触,这可以解释为什么InSTI偏向于结合并抑制有DNA结合的HIV-1整合酶。

 

图片9

图9 与抑制剂结合时的PFV整合酶活性位点。上图是卡通图形表示,下图是溶剂可及表面表示。左图是结合MK0581,有图是结合GS9137。

 

这篇文章中的研究发现将是新的可靠的HIV-1整合酶与InSTI药效基团模型的基础,这对于开发下一代的链转移抑制剂有着重大意义,新药的靶位点将着重于研究中发现的IN活性区域中的保守元素,如不变的CA双核苷酸、金属辅助因子的定位以及主链蛋白的原子等。

 

参考文献:
1 Hare,S et al. Retroviral intasome assembly and inhibition of DNA strand transfer. Nature. (2010)
2 Craigie,R. HIV integrase, a brief overview from chemistry to therapeutics. J. Biol. Chem. (2001)
3 Anthony,N J. HIV-1 integrase: a target for new AIDS chemotherapeutics. Curr. Top. Med. Chem. (2004)
4 Jaskolski,M et al. Piecing together the structure of retroviral integrase, an important target in AIDS theraoy. FEBS J. (2009)
5 郭志敏. HIV-1整合酶:艾滋病治疗的新靶点. 国外医学病毒学分册. (2001)
6 张健慧. HIV整合酶研究进展. 国外医学病毒学分册. (1998)
7 王珍燕. HIV整合酶研究进展. 国际内科学杂志. (2007)
8 吴可祝,李爱秀. I型人类免疫缺陷病毒整合酶及其抑制剂研究进展. 沈阳药科大学学报. (2009)

 
 特约编辑:Gracetey,男,在读博士,研究方向:医学病毒

新闻特写, 热点
No Responses to “20年的困扰–HIV整合酶研究”

Leave a Reply


+ 7 = ten