植物源UDP-糖基转移酶及其分子改造-文献精读75

植物源UDP-糖基转移酶及其分子改造

摘要

糖基化能够增加化合物的结构多样性,有效改善水溶性、药理活性和生物利用度,对植物天然产物的药物开发至关重要。UDP-糖基转移酶(UGTs)能够催化糖基从活化的核苷酸糖供体转移到受体形成糖苷键,植物中天然产物的糖基化修饰主要通过UGTs实现。但是大多数天然UGTs的催化活性、稳定性和底物特异性较低,难以满足工业用酶的要求,限制了它们的工业化应用。近年来,通过分子改造技术改进天然UGTs的催化特性取得了突破性的研究进展。为此,概述了植物源UGTs的挖掘与表征、三维结构和催化机制,归纳了UGTs分子改造的思路和方法,包括理性设计和定向进化,重点介绍了结构域替换、序列保守分析和结构分析与定点突变的结合,总结了定向进化中的高通量筛选方法,为植物天然产物酶法糖基化的工业应用提供了参考和借鉴。

天然产物(natural products, NPs)通常指次级代谢产物,是生物天然产生的小分子,部分是民间药物的活性成分并具有高价值的药理特性,在新药开发中具有广阔的应用前景[1]。复杂且结构高度多样化的NPs主要来源于植物,部分归因于植物针对非生物胁迫的抗性以及针对草食动物和病原体的防御[2,3]。植物NPs主要包括酚酸、萜烯、黄酮和生物碱[4],多数以糖苷形式存在[5,6]。植物体内的糖基化主要由尿苷二磷酸-糖基转移酶(uridine diphosphate-glycosyltransferases, UGTs)催化,在防御、激素调节、异源生物修饰和污染物排毒、次级代谢物的生物合成以及植物与微生物的相互作用等方面有重要作用[7]。天然产物的糖基化修饰是改善其生物活性或溶解度的重要技术手段之一,亲水基团的加入使化合物更容易被吸收,从而增强药理特性[8]。多数具有药理活性的植物NPs糖苷在自然界中含量稀少,往往需要通过人工合成来满足日益增长的需求量。但是大多数天然UGTs的催化活性、稳定性和底物特异性较低,难以满足工业用酶的要求,限制了酶法糖基化的工业应用。

挖掘高效的UGTs并结合蛋白质工程的分子改造是解决上述问题的重要方法,近几年该领域取得了突破性的进展。通过定向进化和理性设计等方法对现有UGTs进行分子改造,以改进其各方面特性,使其更适合工业化应用。为此,本文概述了天然产物合成中植物UGTs的挖掘与表征,介绍了UGTs的三维结构和催化机制,总结了UGTs分子改造的最新研究进展。

1 植物源UDP-糖基转移酶的挖掘与表征

1.1 UDP-糖基转移酶的介绍

糖基转移酶(glycosyltransferases, GTs)在生物体内催化单糖基团多从活化的核苷酸供体转移到不同的受体,与受体分子的氧、氮、硫或碳原子形成糖苷键。根据氨基酸序列相似性和催化机制将来源于细菌、植物、动物和病毒的GTs分为114个家族(截至2021年6月),归类于碳水化合物活性酶数据库(CAZy: http://www.cazy.org)中[9]。糖基转移酶1家族(GT-1)的成员有统一的保守序列,多使用NDP-戊糖和NDP-己糖作为供体底物,其中催化UDP-糖的糖基转移酶被称为UDP-糖基转移酶(UGTs),本文主要关注GT-1家族的植物源UGTs。UGTs的C端附近44个氨基酸高度保守,是植物次生产物糖基转移酶(plant secondary product glycosyltransferase, PSPG)保守区,如来源于罗汉果(Siraitia grosvenorii)的三萜糖基转移酶SgUGT74AC1中的Trp330~Gln373,决定了UDP糖供体的识别和结合[10]。植物源的UGTs能够可溶性表达,这一点与膜锚定的哺乳动物源UGTs不同。细菌来源的UGTs似乎比植物源和动物源的UGTs底物杂泛性更高,通常能够催化生物碱类、黄酮类、大环内酯类、聚酮化合物、萜烯和糖脂肽的糖基化反应;而植物源的UGTs多催化小分子量的天然产物,如黄酮类和萜烯[11]。UGTs的糖供体主要有UDP-葡萄糖(UDP-Glc)、UDP-葡萄糖醛酸(UDP-GlcA)、UDP-半乳糖(UDP-Gal)、UDP-木糖(UDP-Xyl)、UDP-阿拉伯糖(UDP-Ara)和UDP-鼠李糖(UDP-Rha)等,其中UDP-Glc应用最广。

尽管大多数植物源UGTs对受体分子的糖基化具有高度选择性,但其中一部分仍显示出糖供体或受体底物的杂泛性,这有利于增加糖基化产物的种类和数量,但是,在天然产物的生物合成中也会产生很多难以控制的不良反应[12]。例如,来源于杧果(Mangifera indica)的新型二苯甲酮C-糖基转移酶MiCGT对35种结构多样的化合物具有较强C-糖基化能力,还形成了O-和N-葡糖苷[13];药用植物金莲花(Trollius chinensis)中的C-糖基转移酶TcCGT1催化36种黄酮的8-C-糖基化,还可以催化多种酚类化合物的O-糖基化,是第一个可以催化C-、O-、N-和S-糖基化反应的糖基转移酶[14];来源于甘草(Glycyrrhiza uralensis)的糖基转移酶UGT73C33和UGT73F24能够催化UDP-Glc、UDP-Rha、UDP-Gal、UDP-Ara和UDP-Xyl对甘草次酸进行糖基化修饰,用UDP-Glc作为糖供体的催化活性最高[15];来源于大豆(Glycine max)的糖基转移酶GmSGT2催化UDP-Gal、UDP-Glc、UDP-Ara和UDP-Xyl产生三萜皂苷,用UDP-Gal作为糖供体的催化活性最高[16]。

1.2 植物源UDP-糖基转移酶的挖掘与表征

植物基因组和转录组数据的快速增长[17,18]为挖掘新的UGTs提供了前所未有的机会,扩展了可用于增加NPs结构多样化的糖基化工具包。例如,根据保守的PSPG序列,利用BLASTP算法从陆地棉(Gossypium hirsutum L.)的基因组中共鉴定出274个UGTs基因,系统发育分析将其分为10个亚组,H亚科的许多基因可能与棉纤维的产量和品质性状有关[19];在桃子(Prunus persica L. Batsch)的基因组数据库中鉴定了168个UGTs基因,系统发育分析将其分为16个组(A~P),两个与花青素代谢有关的UGTs聚集在F组中[20];使用BLAST搜索针对NCBI非冗余蛋白(https://www.ncbi.nlm.nih.gov)、UniProt蛋白(https://www.uniprot.org)、拟南芥信息资源(https://www.arabidopsis.org)、番茄基因组(https://www.solgenomics.net)和PlantCyc(https://plantcyc.org)公共数据库,分别注释来自叶,根和花的所有单基因,通过对三七(Panax notoginseng)的叶、根和花的转录组分析,推定有342个单基因编码UGTs[21]。通过对蛋白质数据库的相似性搜索对人参(Panax ginseng)单基因组的转录本进行了功能注释,从PROSITE(https://prosite.expasy.org)收集了包含PSPG保守区的共有UGT序列,并使用BLASTX搜索NCBI非冗余蛋白集,鉴定出184个UGTs[22]。NCBI数据库中收录的拟南芥(Arabidopsis thaliana)、大豆(Glycine max)和苜蓿(Medicago sativa)的糖基转移酶数量分别是162个、178个和285个。

截至2021年6月,在CAZy中有超过830 000个具有已证实或推定的GTs基因序列。其中研究最多的GT-1成员超过28 000个,但其中只有413个UGTs得到了功能表征。目前尚不清楚许多推定的UGTs序列的确切生化功能,阐明这些UGTs的供体/受体特异性仍然是糖生物学的主要挑战。具有生化功能注释的UGTs序列与供体/受体特异性之间没有呈现明显的相关性,因此,在单个CAZy家族中,供体和受体的特异性差别很大,这非常不利于CAZy中相关UGTs基因的直接功能注释。例如,来自葡萄(Vitis vinifera)的黄酮3-O-葡糖醛酸转移酶VvGT5和黄酮醇3-O-葡糖转移酶VvGT6的基因具有高达91%的序列相似性,但VvGT6是双功能UDP-Glc/UDP-Gal糖基转移酶,VvGT5仅能够催化UDP-GlcA[23]。近些年的大量研究表明,基于系统发育分析[24]、底物类别、蛋白质结构、立体化学偏向和金属依赖性[25]等将CAZy家族划分为亚家族可以提高序列与底物特异性之间的关联度。

研究者目前主要用三种方法表征UGTs的催化功能:方法一是突变体分离克隆。例如,功能获得和丧失的突变体分析表明,UGT71B6及其2个密切相关的同源物UGT71B7和UGT71B8在植物激素脱落酸稳态和适应各种非生物胁迫中起关键作用[26]。方法二是直接基因克隆并表征酶学特性。例如,基于保守的PSPG序列设计了3'-RACE的简并PCR引物,使用来自杧果的总RNA作为模板,获得了23种不同的UGT cDNA的3'端,结合5'-RACE,成功克隆了15种杧果C-糖基转移酶候选基因并在大肠杆菌中异源表达,在体外探索这种新型C-糖基转移酶的合成效用[13]。方法三是用异源探针筛选cDNA文库获得目标基因。例如,利用定量化学蛋白质组学策略,以甜菊糖苷类化合物的母核甜菊醇为骨架设计交联有光亲和基团的分子探针,在不产生该类化合物的拟南芥的活性蛋白质组中快速共价标记能与探针相互作用的蛋白质,从中筛选出具有特定催化活性的UGTs[27]。

2 UDP-糖基转移酶的三维结构与催化机制

2.1 UDP-糖基转移酶的三维结构

UGTs的三维结构对许多生物学实验的理性设计非常重要,如定点突变或基于结构的抑制剂设计筛选。蛋白质的三维结构可以通过多种方法研究,如X射线衍射、冷冻电子显微镜和核磁共振技术,UGTs的结构解析通常采用X射线衍射技术。但是,与已知UGTs的序列数量相比,由于难以获得良好衍射的晶体,UGTs的晶体结构数量很少:截至2021年6月,共有51种UGTs的结构已经解析,其中21种来自细菌、25种来自植物(表1)、2种来自酵母、2种来自智人(Homo sapiens)、1种来自二斑叶螨(Tetranychus urticae)。

表1 结构已经解析的植物源UGTs

Table 1 Plant-derived UGTs with structural analysis

名称	来源	特性	参考文献
UGT72B1	Arabidopsis thaliana	UDP-Glc: phenol β-glucosyltransferase	[28]
UGT74F2		UDP-Glc: salicylic acid / anthranilate / BA-β-glucosyltransferase	[29]
UGT89C1		UDP-β-L-Rha: flavonol α-7-O-L-rhamnosyltransferase	[30]
UGT78K6	Clitoria ternatea	UDP-Glc: anthocyanidin 3-O-glucosyltransferase	[31]
UGT708C1	Fagopyrum esculentum	UDP-Glc: 2-hydroxyflavanone C-glucosyltransferase	[32]
GgCGT	Glycyrrhiza glabra	di-C-glycosyltransferase	[33]
LpCGTa	Landoltia punctata	flavone-C-glucosytransferase	[34]
LpCGTb		flavone-C-glucosytransferase	[34]
UGT71G1	Medicago truncatula	UDP-Glc: flavonoid β-glucosyltransferase	[35]
UGT85H2		multifunctional UDP-Glc: (iso)flavonoid β-glucosyltransferase	[36]
UGT78G1		UDP-Glc: (iso)flavonoid β-glucosyltransferase	[37]
Os79	Oryza sativa Japonica Group	UDP-Glc: deoxynivalenol β-glucosyltransferase	[38]
PtigS	Persicaria tinctoria	indican synthase	[39]
PaGT2	Phytolacca americana	6-hydroxyflavone β-glucosyltransferase	[40]
PaGT3		UDP-Glc: 6- and 7-hydroxyflavone β-glucosyltransferase	[41]
SbCGTa	Scutellaria baicalensis	flavone-C-glucosytransferase	[34]
SbCGTb		flavone-C-glucosytransferase	[34]
UGT74AC2	Siraitia grosvenorii	flavonoids-O-glycosyltransferase	[42]
SgUGT74AC1	Siraitia grosvenorii	UDP-glucosyltransferase	[10]
UGT76G1	Stevia rebaudiana	UDP-Glc: stevioside β-glucosyltransferase	[43]
UGT202A2	Tetranychus urticae	UDP-glycosyltransferase	-
TcCGT1	Trollius chinensis	C-glycosyltransferase	[44]
VvGT1	Vitis vinifera	UDP-Glc: phenol β-glucosyltransferase	[45]
ZmCGTa	Zea mays B73	flavone-C-glucosytransferase	[34]
UGT73P12	Glycyrrhiza uralensis	UDP-GlcA: glycyrrhetinic acid 3-O-monoglucuronide	-

GTs主要由5种不同的蛋白质折叠形式,分别称为GT-A、GT-B、GT-C、GT-D和GT-E[25],UGTs的成员多数呈现GT-B折叠。UGTs的GT-B拓扑结构包含2个具有类似Rossmann(β/α/β)样折叠的N和C端结构域(图1),中间的空腔成为糖供体和受体底物结合的区域。UDP糖供体主要与UGTs的C端结构域相互作用,受体底物主要与N端结构域结合[12]。不同UGTs的C端结构域之间的相似性高于N端结构域,这可能是因为C端结构域识别相同或相似的糖基供体,而N端结构域则需要识别完全不同的受体底物[46]。Zhang等[33]通过X射线衍射解析了来源于药用植物甘草的C-糖基转移酶GgCGT与UDP-Glc、UDP-Gal、UDP/phloretin和UDP/nothofagin复合的晶体结构,得到了完整的UDP糖和底物的清晰电子密度,不同复合物中GgCGT的结构略有变化,表明与不同配体的组合可能会影响蛋白质的结构。来源于药用植物金莲花的TcCGT1具有典型的GT-B折叠结构,可能是因为其内在地结合了UDP,或者在结晶过程中UDP-Glc自发地水解,尽管晶体结构很好地定义了所有蛋白质残基的电子密度,但并未看到葡萄糖部分[14]。这是UGTs晶体结构解析经常遇到的问题,不利于糖供体特异性的催化机制研究。

图1 采用GT-B折叠的UGTs的三维结构

尽管UGTs的序列保守性低,但其显示出高度保守的二级和三级结构[12]。因此,可以根据已知的UGTs的三维结构通过计算机模拟获得未知UGTs的高级结构。建立三维结构模型需要专业软件以及序列和结构信息,包括以下4个步骤:识别模板结构,目标序列和模板序列的比对,模型构建和模型质量评估[47]。MODELLER[48]、I-TASSER[49]和SWISS-MODEL[50]是三款常用的建立蛋白质三维结构模型的软件,在已发表的有关UGTs结构模拟的文章中得到了广泛应用。例如,研究者用Modeller软件对葡萄中UGT88F12、UGT72B27和UGT92G6的三级结构建模并进行能量优化,能量最小的模型进一步用于对接研究和相互作用分析,三种UGTs之间的结构比较表明,糖供体和底物在UGT72B27中相对更容易进入,其次是UGT88F12和UGT92G6[51]。Louveau等[52]使用结合了UDP-Glc的苜蓿糖基转移酶UGT71G1 的晶体结构作为模板,用I-TASSER生成了来源于燕麦(Avena strigosa)的糖基转移酶UGT99D1的结构模型,将UDP-Ara对接至UGT99D1的糖供体结合位点,找到了与糖供体特异性相关的His404和Pro154。真菌来源的糖基转移酶UGT58A1的同源性建模是以苜蓿来源的UGT85H2为模板,与底物厚朴酚分子对接的结果揭示了底物与相关氨基酸残基之间的相互作用,将受体和供体结合口袋突变为Ala时,所有突变体都丧失了活性[53]。目前可用于同源建模的UGTs晶体结构的数量仍然有限,随着越来越多UGTs晶体结构的报道,基于计算机模拟的UGTs结构预测也将获得快速发展。

2.2 UDP-糖基转移酶的催化机制

糖基的转移过程中,异头碳的构型得以保留或翻转,据此可以将糖基化反应的机制分为翻转型(如NDP-α-糖→β-糖苷)或保留型(如NDP-α-糖→α-糖苷)[54]。UGTs表现出翻转型催化机制,通常发生双分子亲核取代反应(SN2)(图2),该反应通过单个置换步骤形成氧碳鎓离子样过渡态,异头碳的构型发生翻转,磷酸基团离去并产生糖苷键[55]。通常情况下,位于活性位点的催化残基作为广义碱,去质子化增加受体原子的亲核性,二价金属离子稳定带负电荷的磷酸基团。保留型的催化机制一直是一个备受争议的话题。对于那些在活性位点包含亲核残基的酶而言,可能通过SN2机制进行两次置换,首先形成糖基酶中间体,然后活化的受体底物攻击糖基酶中间体[56]。大多数保留的GTs都没有位于活性位点的亲核残基,也许遵循SNi型机制,在糖苷的同一面上以协同但异步的方式发生离去基团离开和亲核攻击,并且涉及短暂的氧碳鎓离子样中间体或氧碳鎓离子样过渡态[57]。

图2 UDP-糖基转移酶的反应机制

近些年,对O-、N-、C-和S-糖基转移酶催化机制的研究有了一定的成果。由组氨酸残基激活的羟基去质子化是启动UGTs介导的糖基化的关键步骤,来源于光果甘草(Glycyrrhiza glabra)的C-糖基转移酶GgCGT中的His27[33]和来源于蝶豆(Clitoria ternatea)的UGT78K6中的His17[58]均是关键催化氨基酸残基。活性位点高度保守的催化二聚体(His-Asp)对于植物氧糖基转移酶的糖基化活性至关重要[37]。例如,Li等[10]将His18和Asp111突变为丙氨酸,使来源于罗汉果的三萜糖基转移酶SgUGT74AC1完全丧失了对罗汉果醇的催化活性。O-糖基化中的羟基需要去质子化以避免形成高度不稳定的带正电荷的氧鎓离子,而N-糖基化中的胺可以很容易地形成带正电荷的中间体,无须进行去质子化[28]。来源于药用植物金莲花的TcCGT1催化糖基化反应的过程中,底物类黄酮自发去质子化,氨基酸残基His24和Glu396在稳定和定向底物中起重要作用[14]。C-或O-糖基化可能具有共同的催化机制,之间的选择性取决于口袋中底物的结合构象[14]。来自拟南芥的UGT74B1是少数能够在体内产生硫糖苷键的特征化糖基转移酶之一,具有His22-Asp113形成的催化二元组,其催化的糖基化反应速率与受体原子的酸度相关,而与亲核原子(氧或硫)的性质无关[55]。

3 UDP-糖基转移酶的分子改造

3.1 理性设计

3.1.1 结构域替换结合定点突变

UGTs的三维结构高度保守,包含识别受体底物的N端结构域和识别UDP糖供体的C端结构域,但其糖供体和受体底物的选择性又有很大差异,这意味着不同UGTs之间的结构域替换可以产生功能不同的新酶。UGTs二级和三级结构的稳定主要通过二硫键、盐键、疏水键和氢键形成的结构域内和结构域间的相互作用,这就要求嵌合的糖基转移酶之间具有高度的结构保守性和序列同源性,保留必要的相互作用,才能获得具有催化活性的嵌合重组酶。因此,UGTs结构域替换策略大多适用于序列相似度高或者同家族的酶之间。

一段时期内,糖基转移酶的结构域替换有较多关注与研究,相关研究成果已经被总结在相关综述文章中[12, 46, 59]。结构域替换结合定点突变是一种更高效确定关键氨基酸的方法。来源于拟南芥的UGT72B1是双功能O-葡糖基转移酶和N-葡糖基转移酶,通过与只有O-糖基转移酶活性的直系同源酶BnUGT进行结构域替换,Brazier-Hicks等[28]确定了只有包含UGT72B1的259~370位残基的杂合酶能够糖基化苯胺,进一步的突变获得了BnUGT的D314N-F317Y双突变体,该突变体能够以与UGT72B1相似的速率对苯胺进行糖基化,而UGT72B1-N312D-Y315F双突变体中的N-葡糖基转移酶活性可忽略不计。该思路也被用于探索拟南芥的两个糖基转移酶UGT74F1和UGT74F2的区域特异性的决定因素,Cartwright等[60]通过嵌合PCR并引入三个独特的限制性酶切位点来构建UGT74F1/UGT74F2嵌合体,域交换策略确定了一个40个氨基酸的区域(UGT74F1中的残基112~153),该区域能够增加对槲皮素4'-OH的催化选择性;通过单个氨基酸定向突变,Cartwright等[60]确定了位于活性位点远端的Asn142对槲皮素4'-OH的区域特异性的重要影响。CY-007和CY-049蝶啶糖基转移酶(PGT)在糖供体特异性上不同,分别催化葡萄糖或木糖转移到四氢生物蝶呤,通过结构域交换或单氨基酸和双氨基酸取代, Lu等[61]评估了两个PGT之间C端结构域及其残基218(Glu/Ala)和258(Gln/Glu)对催化活性以及糖供体特异性的重要性,通过Q258E和E218A/Q258E取代,CY-007 PGT对UDP-葡萄糖的比活性分别增加了1.9倍和1.6倍,CY-007 PGT的所有突变体均对UDP木糖具有催化活性。

3.1.2 基于序列保守分析的定点突变

活性口袋内或活性口袋附近的关键氨基酸通常决定或直接影响酶的催化活性和底物特异性。例如,来自人参的糖基转移酶UGTPg71A29可以催化Rh1的C20-OH糖基化或将葡萄糖部分转移至Rd,分别产生人参皂苷Rg1和Rb1,其中关键的催化氨基酸Gln283可能有助于Rd转化为Rb1,并且在Rh1转化为Rg1时也是重要的催化残基[62]。Arg残基的胍基阳离子部分在特异性识别UDP-GlcA的羧酸盐阴离子中起关键作用,R350W的突变导致糖供体特异性从UDP-GlcA转变为UDP-Glc,但是,UGT88A7-T139S W367R和UGT88E3-T150S W371R突变体没有显示F7GAT活性[63,64],推测有其他氨基酸协同作用决定了UGTs不同糖供体的催化特异性。大多数鉴定出的植物半乳糖基转移酶将His保留为最终的PSPG序列残基,同样具有半乳糖基转移酶活性的MdUGT75B1、VvGT6和MtUGT78G1是Gln为最终PSPG序列残基[65]。

通过多重序列比对,用共有序列取代非共有氨基酸残基的策略(图3)被称为基于活性的序列保守分析(ASCA),这一方法通常可提高酶的底物特异性和催化活性。基于活性的序列保守分析方法受限于突变氨基酸的数量,活性口袋附近进行多个突变通常会产生不可预测的上位作用,即当前突变对活性的影响取决于先前是否获得了其他突变,在极端情况下,两个突变是有害的,合并后增强活性,反之亦然[66]。通常突变涉及1~4个氨基酸,对催化活性的改善也局限于10倍以内。研究者收集了12个能够催化罗汉果醇或其糖苷的植物UGT序列(7个来自罗汉果,5个来自拟南芥),并使用多序列比对与罗汉果三萜糖基转移酶UGT74AC1进行了比对,找到10个在各个位置具有最高频率的残基并进行了突变,产生了4个阳性突变,组合突变体的催化活性增加了96倍[10]。来源于拟南芥的糖基转移酶UGT88A1能够催化槲皮素合成槲皮素-4'-O-葡糖苷,对比UniProtKB的多个氨基酸序列,UGT88A1中His16周围的氨基酸残基除Val18外相对保守,剩余的氨基酸残基可分为两类:非极性氨基酸(Val)和碱性氨基酸(Arg),通过定点突变获得的突变体V18R是对底物槲皮素有更高的亲和力,催化活性是野生型的2倍[67]。

图3 UDP-糖基转移酶的理性设计

3.1.3 基于结构分析的定点突变

为了充分发挥酶的潜力,通常需要针对给定的应用对其进行重新设计,该方法需要对酶活性位点的结构特征及其对功能的影响有深入的了解。基于结构功能关系的详细研究,理性设计已成为蛋白质分子改造的强大手段,但UGTs的结构-功能关系比较复杂,一定程度上限制了理性设计的应用。来源于光果甘草的C-糖基转移酶GgCGT显示出的糖供体偏好可以通过糖羟基与关键氨基酸残基的氢键相互作用来确定,尤其是糖部分的4-OH与Asp390侧链羧基的相互作用,Gly389附近宽敞的底物结合通道对于GgCGT的二C-糖基化活性和广泛的底物混杂至关重要[33]。Joshi等[51]通过结构指导的计算机辅助突变,促进活性位点残基与黄酮醇苷的相互作用,从而改善葡萄糖基转移酶UGT88F12、UGT72B27和UGT92G6底物特异性和活性,提高其形成二糖苷的催化活性。来源于南非醉茄(Withania somnifera)的糖基转移酶UGT73A16催化黄芩素生成黄芩苷,Singh等[68]通过三维结构模拟和蛋白质-配体相互作用分析找到关键催化氨基酸,突变体A337C和Q339A的催化效率分别比野生型高2~3倍和6~7倍,并且糖供体特异性从UDP-Glc转移到UDP-GlcA。Zhang等[15]通过同源建模和分子对接分析,研究了乌拉尔甘草来源的UGT73F24对甘草次酸和UDP-Glc的底物识别机制,基于识别机制,选择了位于甘草次酸C3-OH和UDP-Glc中葡萄糖附近的氨基酸和底物催化口袋通道的氨基酸作为定向突变的候选位点,确定了两个关键残基I23和L84,组合突变体I23G/L84N使活性增加了4.1倍。通过分析甜叶菊(Stevia rebaudiana)UDP-糖基转移酶UGT76G1与UDP-Glc的氢键作用力,Chen等[69]找到关键保守氨基酸His17和Asp359,选择靠近底物通道的Asn358作为饱和突变的靶位点,在N358F突变体建立的多酶反应系统中,莱鲍迪苷D的产量增长了60%。

3.2 定向进化

定向进化是指通过模拟自然界生物进化的机制,应用易错PCR或半理性的饱和突变等技术对基因进行体外突变处理,筛选获得性能优化的酶突变体。定向进化已经成为了酶分子改造的重要技术[70,71],用来提高酶的催化活性、稳定性以及扩大其底物范围[72,73]。定向进化不需要对酶的空间结构和催化机制的深入了解,是一种非理性改造方法,通常涉及三个关键步骤:目标蛋白的表达与功能验证;基因突变产生氨基酸随机突变库,并对突变多次迭代;使用高通量筛选的方法快速锁定有效的突变体[74]。定向进化的关键是开发合适的高通量筛选技术,通常,评判高通量筛选方法的指标有可重复性、操作简便性、测定灵敏度和一般适用性。普通进化实验可能包括十几轮基因突变和对改良突变体的选择,大多数突变是发生在催化口袋之外的无用突变。为了减少筛选工作量,缩短整个进化周期,近些年,有学者开发了基于活性的序列保守分析或结构指导的定向进化,通过7轮进化,改造后的UGTs的催化效率提高了上万倍[10],这是其他方法难以达到的效果。

3.2.1 高通量筛选

GTs的高通量筛选通常针对糖基化产物或核苷酸产物的形成,Wagner等[75]综述了基于抗体、放射性同位素、色谱、pH传感器、质谱和荧光传感器的GTs分析方法,这些分析方法具有用于糖基转移酶高通量筛选的潜力。但是,放射性同位素的方法程序繁琐,成本高,还会产生不可避免的放射性化学废物。荧光共振能量转移(FRET)、酶联免疫吸附测定和酶联方法,在标记底物上均需要进行巨大的努力。基于质谱的分析在速度和准确性方面都非常强大,但是由于需要特殊的精密仪器而没有得到广泛使用。荧光反应的高灵敏度、快速和实时检测的优势适用于高通量分析,而且无须对底物进行任何特殊修饰即可广泛应用于各种糖基转移酶,但是很难找到一种特异性强的荧光探针。

利用添加到糖基转移酶反应中的特定磷酸酶,研究者从糖基转移酶反应的离去基团定量释放无机磷酸,然后使用比色孔雀石绿试剂检测释放的磷酸盐基团,理论上该方法可以应用于所有NDP-糖依赖型糖基转移酶[76]。通过将糖基转移酶反应与酿酒酵母膜结合性腺苷三磷酸双磷酸酶rYND1催化的UTP/UDP降解反应偶联,糖基转移酶反应结束后添加纯化的rYND1,rYND1将NDP水解为磷酸核苷和磷酸盐,使用磷钼蓝发色反应进行对磷酸盐测定,同样达到筛选目标糖基转移酶突变体的目标[77]。Ryu等[78]开发了基于荧光ATP传感器的通用糖基转移酶测定系统,Ant-Zn的荧光被邻苯二酚紫猝灭,而NDP替代猝灭剂可恢复荧光,该系统显示出亚微摩尔的灵敏度,并适用于纯化后的酶和全细胞两种反应体系。荧光激活细胞分选(FACS)也被应用于糖基转移酶的高通量筛选[79,80,81],依赖位于细胞膜中的乳糖通透酶(LacY)严格的底物特异性,荧光底物通过乳糖通透酶转运后可以被细胞内的糖基转移酶催化增加糖基化修饰,但糖的特定跨膜转运体不能转运糖基化产物,因此糖基化产物会积聚在细胞中。经过三轮定向进化,Tan等[82]发现幽门螺杆菌(Helicobacter pylori)α-1,3-FucT突变体的Lewis x和3'-fucosyllactose的合成效率分别提高了6倍和14倍。研究者还建立了通用的糖基转移酶高通量检测方法,将固定化受体阵列上的反应序列与质谱分析相结合来筛选糖基转移酶[83]。表2总结了现有糖基转移酶的高通量筛选方法。

表2 糖基转移酶的高通量筛选方法汇总

Table 2 Summary of high-throughput screening methods for glycosyltransferases

筛选目标	方法简述	筛选形式	应用范围	参考文献
糖供体	将荧光物质2-氯-4-硝基苯与葡萄糖相连,偶联OleD	荧光	所有UGTs	[84]
糖基化产物	荧光激活细胞分选(FACS)	荧光	特定GTs	[82]
糖基化产物	将固定化受体阵列上的反应阵列与质谱分析相结合	质谱	所有GTs	[83]
糖基化产物	微阵列扫描仪检测供体糖芯片上的荧光	荧光	所有GTs	[85]
糖基化产物	放射性标记糖供体,受体被固定	放射性	所有GTs	[86]
NDP	Ant-Zn的荧光被邻苯二酚紫猝灭,NDP恢复荧光	荧光	NDP-糖依赖型GTs	[78]
NDP	基于perylene-Zn的UDP探针结合UDP	荧光	UGTs	[87]
NDP	基于双核锌配合物的荧光探针	荧光	NDP-糖依赖型GTs	[88]
NDP	具有远红TR-FRET读数的UDP竞争性免疫测定方法	荧光	NDP-糖依赖型GTs	[89]
NDP	一步添加将UDP转换为ATP,并检测发光	荧光	UGTs	[89]
Pi	特定磷酸酶定量释放无机磷酸,比色孔雀石绿试剂	光密度	NDP-糖依赖型GTs	[76]
Pi	特定磷酸酶定量释放无机磷酸,磷钼蓝发色反应	光密度	NDP-糖依赖型GTs	[77]
质子	糖苷键形成过程中质子释放,pH指示剂的吸光度变化	光密度	所有GTs	[90]

3.2.2 结构指导的定向进化

结构指导的定向进化方法,如迭代饱和突变(ISM)和组合活性位点饱和度测试(CAST),通过将最有可能影响酶性质的关键氨基酸残基随机突变,将合理设计的预测元素与定向进化的经验策略相结合,达到事半功倍的效果。这种方法既能够很大程度上减少进化中的突变体筛选工作量,缩短迭代时间,同时能在一定程度上改善多位点突变的上位作用。由于糖苷键形成过程中的质子释放,可以根据96孔板的颜色和pH指示剂的吸光度变化确定阳性突变体。例如,研究者使用结构指导的计算分析结合随后的迭代饱和突变,通过两次迭代,筛选到了来源于幽门螺杆菌的岩藻糖基转移酶的三重突变体(A128N/H129E/S46F)和四重突变体(A128N/H129E/Y132I/S46F),相比于野生型,两个突变体的比酶活分别提高了14.5倍和15.5倍[90]。将荧光物质2-氯-4-硝基苯与葡萄糖相连作为糖供体,偶联糖基转移酶OleD,当OleD催化葡萄糖部分与UDP结合时,释放出的2-氯-4-硝基苯产生荧光,可以根据荧光强度筛选目标突变体。研究者分析了来自酿酒酵母的UDP-葡萄糖:固醇葡糖基转移酶UGT51的晶体结构,选择18个氨基酸残基通过9轮迭代突变,通过偶联糖基转移酶OleD筛选2 800个突变体后,获得了最佳的突变体M7-1,其催化活性比野生型高610倍[84]。同样偶联OleD,Li等[10]成功设计了罗汉果三萜糖基转移酶SgUGT74AC1的突变体M4(T79Y/L48M/R28H/L109I),其具有比野生型高379倍的高催化效率,结合基于活性的序列保守分析方法获得的突变体M7与野生型相比催化效率提高了4.17×104倍。

4 总结与展望

来源于植物的天然UGTs通常具有严格的底物特异性,限制了酶法合成天然产物糖苷的结构多样性;而一些底物杂泛的UGTs在细胞合成天然产物的过程中又面临不良反应的难题;催化活性差的UGTs也不适合用于药物开发中的大规模合成。目前,许多具有新催化特性的UGTs是通过应用蛋白质工程学获得的。研究者对天然UGTs做多种类型的分子改造,包括理性设计和定向进化,以期获得不同功能的工具酶或者提高其稳定性和催化活性。先进的计算技术促进理性设计的发展,将底物对接到UGTs的模拟底物结合位点中,预测的活性位点中关键催化或结合残基成为突变的重要线索。除了建立高效通用的高通量筛选方法,创建小型高质量突变体文库对于促进定向进化同样至关重要,合理设计和定向进化的融合似乎是目前UGTs分子改造最成功的方法。研究者已经将Rosetta Design的设计和筛选技术以及机器学习纳入定向进化的工作流程,以减少与蛋白质定向进化相关的实验工作并探索同时突变多个位点的可能。计算蛋白质设计的最新进展使得设计新的蛋白质折叠和结合相互作用成为可能,进一步可设计用于任何化学反应的酶催化剂,既可以为蛋白质的工作原理提供基础知识,又可以解决社会面临的许多重要挑战。不久的将来,这些技术成功应用于UGTs的分子改造,必将加速天然产物糖苷酶法合成的工业化进程。