Functional and structural dissection of glycosyltransferases underlying the glycodiversity of wolfberry-derived bioactive ingredients lycibarbarspermidines
功能和结构分析导致枸杞来源的生物活性成分(如lycibarbarspermidines类化合物)糖基多样性的糖基转移酶
摘要
lycibarbarspermidines类化合物是一类特殊的苯酰胺类糖苷,其特征是具有多个糖基取代的二咖啡酰亚胺核心,并作为枸杞中的主要生物活性成分。迄今为止,对于包括二咖啡酰亚胺在内的苯酰胺类化合物糖基化的酶基础知之甚少。在此,我们鉴定出五种lycibarbarspermidines类化合物的糖基转移酶,LbUGT1-5,它们是首个苯酰胺型糖基转移酶,并催化二咖啡酰亚胺的区域选择性糖基化,以形成结构多样的lycibarbarspermidines类化合物。值得注意的是,LbUGT3 作为一种独特的酶,催化串联糖转移到咖啡酰基上的邻二羟基组分,形成特殊的邻二葡萄糖基化产物,而 LbUGT1 则准确区分咖啡酰基和二氢咖啡酰基,催化位点选择性糖转移。结合 UDP 的 LbUGT1 和 LbUGT3 复合物的晶体结构分析和分子动力学模拟,揭示了 LbUGT1 和 LbUGT3 之间糖基化选择性差异的结构基础。定点突变表明在 PSPG 盒中的保守酪氨酸残基(LbUGT1 中为 Y389,LbUGT3 中为 Y390)在调控 LbUGT1 和 LbUGT3 的区域选择性方面起关键作用。因此,我们的研究揭示了lycibarbarspermidines类化合物化学多样性的酶学基础,并扩展了自然界中糖基转移酶的种类。
简介
枸杞,又称枸杞子,作为一种著名的传统中药,在中国和其他亚洲国家已经使用了超过2000年【1】。由于其增强健康和抗衰老的特性,它也越来越多地作为一种著名的食用植物在全球范围内得到利用【2】。枸杞含有大量的多糖【3,4,5】、类胡萝卜素【6,7,8】、多酚【9,10,11】和二咖啡酰亚胺【12,13,14】,这些是枸杞中的主要生物活性成分。其中,以亚胺核心夹着两个类似咖啡酰基的二咖啡酰亚胺类化合物已在多种植物中发现,如拟南芥【15】、刺茄【16】和山莨菪【17】,并具有广泛的生物功能【18,19】。然而,直到我们最近揭示出一组二咖啡酰亚胺糖苷(命名为lycibarbarspermidines类化合物)作为枸杞中的主要成分(补充图1),它们才被鉴定出来,占干重的0.2%以上,并被认为具有强大的抗阿尔茨海默病(AD)和抗氧化活性【12,13】。
糖基化是天然产物中最常见的化学修饰之一,可以显著降低苷元相关的毒性,同时增强亲水性和药代动力学参数,从而提高活性分子的生物利用度【20,21】。抗癌药物依托泊苷的糖基化显著降低了其毒性【22】,而葛根素的糖基化则使其水溶性增加了100倍,并增强了抗骨质疏松活性【23】。此外,糖基化还可以直接增加天然产物的生物活性【20,21】。地高辛的单糖基化使其对钠/钾-ATP酶的结合亲和力增加了6倍【24】,而甘草酸的葡萄糖醛酸基化导致了一个治疗慢性肝炎的临床有用药物,甘草酸的形成【25】。作为枸杞的主要成分,二咖啡酰亚胺糖苷可能具有巨大的潜力,用于多种生物功能。
植物中的糖基化通常由依赖尿苷二磷酸(UDP)的糖基转移酶(UGTs)介导,这些酶催化活化的UDP-糖向苷元的立体和区域选择性转移,从而形成结构多样的糖苷【26】。迄今为止,已经从植物中鉴定出了大量的UGTs,它们催化各种分子的糖基化,包括萜类(UGT85C2)【27】、黄酮类(F7GAT)【28】、甾体类(UGT74AN1)【29】和生物碱类(甜菜碱5-GT)【30】(图1A)。然而,负责苯酰胺糖基化的植物UGTs,例如二咖啡酰亚胺,尚未被鉴定出来。这些苯酰胺由通过酰胺键共价连接到芳香性单胺或脂肪族多胺的酚类基团产生【19】。因此,发现和阐明lycibarbarspermidines类化合物糖基多样性背后的UGTs对于弥补这一重要的库存和知识空白至关重要。
A 植物糖基转移酶负责催化萜类、黄酮类、甾体类和生物碱类化合物的糖基化。 B 代表性的苯酰胺糖基化产物lycibarbarspermidines类化合物及其脱糖基化模式的示意图。
从枸杞中鉴定出的lycibarbarspermidines类化合物表现出多样的糖基化模式,特别是包括3',3"-糖基化、3',4'-糖基化、3',4"-糖基化和4',4"-糖基化等各种二糖基化模式(图1B,补充图1)【12,13,14】。尽管存在众多糖基化模式,lycibarbarspermidines类化合物仅由四种苷元组成:N1-咖啡酰-N10-二氢咖啡酰亚胺、N1,N10-双咖啡酰亚胺、N1-二氢咖啡酰-N10-咖啡酰亚胺和N1,N10-双二氢咖啡酰亚胺【12】。因此,观察到的lycibarbarspermidines类化合物的多样糖基化可能受到中间亚胺核心的非对称性质、咖啡酰基的饱和度变化以及酚羟基位置变化的影响。因此,研究这些因素如何影响lycibarbarspermidines糖基转移酶的糖基化选择性,以及探讨这些二糖苷是由两个特定的糖基转移酶协调形成还是由单一的多功能糖基转移酶形成的,将是非常有趣的。尤其是,lycibarbarspermidines类化合物中在咖啡酰基的邻二羟基上的一种不寻常的二糖基化,由于空间位阻,化学上难以完成,暗示枸杞基因组中存在一种前所未有的糖基转移酶。
在本研究中,我们从枸杞(Lycium barbarum)中鉴定出五种lycibarbarspermidines糖基转移酶(LbUGT1-5),它们是首个具有独特区域选择性的苯酰胺型糖基转移酶。结合分子动力学模拟和定点突变的晶体结构分析揭示了LbUGTs区域选择性活性的结构基础。因此,我们的研究揭示了lycibarbarspermidines类化合物糖基多样性的酶学基础,并扩展了糖基化的酶工具。
结果
lycibarbarspermidines类化合物糖基多样性的分子基础
lycibarbarspermidines类化合物的化学多样性主要归因于二咖啡酰亚胺苷元的多样糖基化。为了鉴定负责lycibarbarspermidines类化合物糖基化的糖基转移酶,我们系统地分析了枸杞中的UGTs。由于UGT71C131、UGT72E232和TOGT133被报道可以糖基化咖啡酸类似物,我们用它们作为查询序列,从枸杞的转录组中筛选潜在的UGT基因。结果,筛选出151个LbUGTs,并与已知植物UGTs进行系统发育分析(补充图2)。因此,发现20个LbUGTs接近咖啡酸糖基转移酶的进化枝。这些候选LbUGTs从枸杞cDNA中克隆到pGEX-2TK载体,并在大肠杆菌Rosetta(DE3)菌株中表达,以通过体外酶活性测定进行功能表征。
由于N1-咖啡酰-N10-二氢咖啡酰亚胺(1)是最丰富的lycibarbarspermidines类化合物苷元,且含有咖啡酰和二氢咖啡酰基,我们首先利用1作为受体底物,UDP-D-葡萄糖(UDP-Glc)作为供体底物,通过与20个LbUGTs表达菌株的粗提物孵育进行初步筛选。结果,五个LbUGTs在酶促反应中生成了产物(补充图3)。进一步的液相色谱-质谱(LC-MS)分析表明,新生成的化合物比1的分子量大162或324道尔顿,表明五个LbUGTs可以将1转化为单糖或二糖苷,因此分别命名为LbUGT1-5。
为了阐明LbUGT1-5的催化特性和区域选择性,纯化的重组LbUGT1-5蛋白与不同的苷元一起孵育。结果如图2所示,LbUGT1将1转化为主要产物4以及两个次要产物5和6,通过与真实标准品比较,分别鉴定为单糖苷LS-A(4)、LS-B(5)和二糖苷LS-E(6)(补充图4)。这些结果表明,LbUGT1可以催化在二氢咖啡酰基的4''-OH和咖啡酰基的3'-OH位置的糖基化。为了弄清LbUGT1的区域选择性是由咖啡酰基的饱和状态还是中间亚胺核心的非对称特性(N1或N10的取代)决定的,我们使用了另外两个受体底物:N,N10-双咖啡酰亚胺(2)和N1,N10-双二氢咖啡酰亚胺(3)。观察到2转化为主要化合物9以及两个次要化合物(7,8)。这些化合物通过大规模反应纯化,并通过严格的NMR分析鉴定为二咖啡酰亚胺3',3''-二-O-β-D-葡萄糖苷(9)和单糖苷7和8(补充表4-6)【34】。同样,3被LbUGT1转化为4',4''-二-O-β-D-葡萄糖苷LS-L(12)及其生物合成中间体4'-单-O-葡萄糖苷LS-H(11)和4''-单-O-葡萄糖苷LS-I(10),通过与真实标准品比较(补充图4)。这些结果清楚地表明,LbUGT1的区域选择性主要受咖啡酰基饱和状态的影响,并且特别催化在二氢咖啡酰基的4-OH和咖啡酰基的3-OH位置的糖基化,无论(氢化)咖啡酰基是连接在亚胺的N1还是N10上。
A. LbUGT1在体外测定中使用1、2和3作为底物的HPLC图谱。 B-D. LbUGT1分别以1、2和3为底物的糖基化反应。
有趣的是,LbUGT2和LbUGT4在使用1作为底物时,均在咖啡酰基的4′-OH位置催化生成了单一的单糖苷LS-D(13),尽管它们仅有30%的序列同一性(图3;补充图4;补充表2)。我们一致观察到,LbUGT2和LbUGT4将2转化为二糖苷14,但无法催化3的转化(图3)。尽管带星号的产物未被鉴定,但根据m/z值为632 Da(图3),推测它们是14的单糖苷中间体。这些结果表明,LbUGT2和LbUGT4特异性催化在咖啡酰基4-OH位置的糖基化。
A. LbUGT2/4在体外测定中使用1和2作为底物的HPLC图谱。带星号标记的峰为推测的单糖苷中间体。
B, C. LbUGT2/4分别以1和2作为底物的糖基化反应。
LbUGT3从1中生成了单糖苷5和不寻常的二糖苷15(图4)。化合物5通过与标准品比较鉴定为3'-O-葡萄糖苷LS-B(5),而15通过大规模反应分离,并根据HMBC相关性C-3'/H-1'''(δC 147.2/δH 4.85)和C-4'/H-1''''(δC 148.4/δH 4.87),以及ROESY相关性H-2'/H-1'''(δH 7.38/δH 4.85)和H-5'/H-1''''(δH 7.16/δH 4.87)(图4;补充图4;补充表7)结构确定为在3'-OH和4'-OH位置的新型二糖苷。为了验证15的生物合成中间体,使用3'-O-葡萄糖苷LS-B(5)和4'-O-葡萄糖苷LS-D(13)作为底物进行了LbUGT3的酶促反应(补充图5)。结果显示,LbUGT3将5和13都转化为15,但更偏好5而非13,这表明LbUGT3主要催化3'-OH位置的糖基化生成5,而4'-O-糖基化是其二糖基化的速率限制步骤。此外,与LbUGT1和LbUGT3具有约40%序列同一性的LbUGT5(补充表2)也对1的3'-OH具有选择性,催化生成少量的LS-B(5)(图4)。像LbUGT1一样,LbUGT3也将2转化为单糖苷7和8,以及二糖苷3',3''-二-O-β-D-葡萄糖苷9,但其主要产物是不寻常的邻二糖基化产物二咖啡酰亚胺3',4'-二-O-β-D-葡萄糖苷(17)和3'',4''-二-O-β-D-葡萄糖苷(16)(图4)。化合物16和17通过大规模酶促反应制备,并通过二维NMR光谱分析确定其结构(补充表8, 9)。尽管LbUGT5也像LbUGT3一样从2生成7和8(图4),但LbUGT3和LbUGT5都不催化3的糖基化。这些结果清楚地表明,LbUGT3催化咖啡酰基邻二羟基的不寻常串联糖基化,而LbUGT5特异性催化咖啡酰基3-OH的糖基化。据我们所知,LbUGT3是第一个能够在苯环的邻二羟基上进行二糖基化的酶。
A. LbUGT3/5在体外测定中使用1和2作为底物的HPLC图谱。
B, C. LbUGT3/5分别以1和2作为底物的糖基化反应。
以上结果清楚地表明,来自枸杞的LbUGT1-5显示出对咖啡酰基或二氢咖啡酰基羟基的高区域选择性,并不受亚精胺骨架的不对称性影响。进一步研究了LbUGT1-5的催化特性。重组的LbUGT1-4蛋白在以UDP-Glc为糖供体和1为底物时,显示出在30°C时的最大活性,而LbUGT5对1的活性较差,选择将底物2作为底物,并在37°C时表现出最大的催化效率(补充图6)。此外,所有五种LbUGT均为二价金属离子依赖的糖基转移酶,在Mg2+存在下表现出最大的催化活性(补充图7)。由于底物在Tris-HCl和磷酸盐缓冲溶液中的不稳定性,我们无法获得最佳的pH值,所有实验均在10 mM HEPES缓冲液(pH 7.0)中进行。根据Michaelis-Menten方程计算了LbUGT1-5的酶动力学参数,Km、kcat和kcat/Km值列于表1中(补充图8)。还研究了LbUGT1-5对不同糖供体的特异性,如补充图9所示。LbUGT1/2/5可以类似于UDP-Glc利用UDP-Gal,但不接受UDP-GlcA、UDP-Xyl和UDP-GlcNAc作为底物。另一方面,LbUGT3/4特异地利用UDP-Glc作为糖供体。这些发现突显了LbUGT对特定糖供体的强选择性。
UGT names | Substrate | Km·(μM) | kcat·(s–1) | kcat·/Km·(s–1·M–1) | |
---|---|---|---|---|---|
LbUGT1 | UGT71AT6 | 1 | 259.4 | 5.7 ×10−3 | 22.1 |
LbUGT2 | UGT73A52 | 1 | 761.6 | 13.4 ×10−3 | 17.6 |
LbUGT3 | UGT71BG1 | 1 | 325.0 | 4.5 ×10−3 | 13.9 |
LbUGT4 | UGT72B75 | 1 | 900.9 | 4.2 ×10−3 | 4.6 |
LbUGT5 | UGT71AJ4 | 2 | 542.0 | 5.0 ×10−4 | 0.9 |
由于LbUGT1和LbUGT2特异地催化二氢咖啡酰基和咖啡酰基羟基的4-OH位置的糖基化,我们推测这两种酶应该负责合成N1-咖啡酰-N10-二氢咖啡酰基亚精胺 4′,4′′-二-O-β-D-葡萄糖苷类咖玛斯亚胺 C (18),这是枸杞中最丰富的利西巴巴胺12,14,35。为了探索这一点,我们首先用LbUGT2孵育化合物4,并观察到4转化为18(补充图4, 10)。类似地,LbUGT1也观察到13转化为18(补充图4, 10)。这些结果表明,LbUGT1和LbUGT2的酶级联可能用于生成主要的利西巴巴胺18。
LbUGT1和LbUGT3的整体结晶结构
为了探索LbUGT的区域选择性的结构基础,我们尝试获得与UDP-Glc和不同底物的三元复合物结构。经过包括共结晶和浸泡实验在内的多次尝试后,我们分别获得了LbUGT1/UDP和LbUGT3/UDP的复合晶体结构,分辨率分别为2.57 Å(PDB ID: 8WP5;图5B)和2.43 Å(PDB ID: 8W53;图5C)。在这两种结构中,UDP的电子密度被明确地分配给定(补充图11)。LbUGT1和LbUGT3是首个具有结晶结构的酚胺型糖基转移酶,都展示出包括N和C端在内的两个Rossmann样折叠(β/α/β)结构域的经典GT-B折叠36,37。N端结构域(LbUGT1中的1–242和467–485残基,LbUGT3中的1–246和464–482残基)主要参与糖受体的结合,而C端结构域(LbUGT1中的243–466残基,LbUGT3中的247–463残基)负责糖供体的结合(图5B, C)。考虑到LbUGT1和LbUGT3超过50%的氨基酸序列同一性,它们的结构高度相似,Cα原子的均方根偏差(rmsd)为1.04 Å。然而,在N端糖受体结合区域,特别是在推测的底物进入通道(LbUGT1中的43–59, 68–86残基和LbUGT3中的45–62, 71–89残基)中,可以观察到明显的差异(图5D)。这表明,LbUGT1和LbUGT3可能形成不同的底物进入/退出通道,使它们能够容纳不同的糖转移底物。通过Dali服务器进行的结构比对显示,LbUGT1和LbUGT3与红三叶中的黄酮/三萜 OGT UGT71G1(PDB ID: 2acw)38和罗汉果中的黄酮 OGT UGT74AC2(PDB ID: 7bv3)39具有高度结构相似性。它们都含有在活性位点中具有催化重要性的His残基(LbUGT1中的H17和LbUGT3中的H19),以及高度保守的C端糖供体结合域,特别是用于UDP结合的植物次生产物糖基转移酶(PSPG)motif。这些结构使我们能够正确地将UDP-Glc的葡萄糖基建模到LbUGT1和LbUGT3中,以进行进一步的机制研究(补充图12)。
A. LbUGT1和LbUGT3的双糖基化催化机制提议
B, C. LbUGT1/UDP和LbUGT3/UDP的晶体结构 图中显示了LbUGT1/UDP和LbUGT3/UDP的晶体结构,其中N-糖受体结合域为绿色和灰蓝色,C-糖供体结合域为柠檬黄色和灰色。UDP显示为黄色棒状分子。
D. LbUGT1/UDP和LbUGT3/UDP的叠加 图中展示了LbUGT1/UDP和LbUGT3/UDP的叠加结构,残基的颜色编码与B相同。但是,入口区域的差异分别用红色和蓝色标示。
E, F. LbUGT1和LbUGT3的活性位口袋 展示了LbUGT1和LbUGT3的活性位口袋,共同底物2显示为青色,UDP-Glc显示为黄色。活性位口袋以静电表面表示(负电荷区域显示为红色,正电荷区域显示为蓝色,疏水区域显示为白色),位于圆圈区域内的残基显示为绿色棒状,His残基用红色星星表示。
G. LbUGT3-2和LbUGT3-8的叠加 图中展示了LbUGT3-2(残基和UDP-Glc为灰色,2为鲑色)和LbUGT3-8(残基和UDP-Glc为绿色,8为青色)的叠加结构。氢键用紫色虚线表示。
H. LbUGT3的活性位口袋与8 显示了LbUGT3的活性位口袋,残基为绿色,UDP-Glc为黄色,8为青色,氢键为灰色虚线。
I. LbUGT1/3突变体的体外测定使用2作为底物 数据表示平均值±标准差(n = 3)。图5I的源数据包含在源数据文件中。
LbUGT1和LbUGT3的区位选择性的结构基础
尽管LbUGT1和LbUGT3都首先催化咖啡酰基的3’-OH糖基化,LbUGT3可以进一步催化同一侧的4’-OH糖基化,形成非常规的邻位双糖基化产物,而LbUGT1需要将单糖基化产物旋转到相反侧的3’’-OH进行糖转移(图5A)。为了阐明LbUGT1和LbUGT3区域选择性差异的结构基础,基于供体底物羟基H原子与催化组氮原子(d1)之间和受体底物羟基O原子与UDP-Glc C1原子(d2)之间的两个关键距离(图5A),我们将底物2对接到LbUGT1和LbUGT3中。通过分子动力学(MD)模拟,我们发现了50 ns模拟期间2在LbUGT1和LbUGT3中的反应性结合构型,验证了其小的d1和d2值(补充图13,补充数据1)。在这两个模型中,LbUGT1的H17和LbUGT3的H19作为关键的催化残基37,40,通过H17A和H19A变异体的实验证明。有趣的是,比较LbUGT1和LbUGT3中2的结合模式揭示了催化区域的显著差异。2的咖啡酰基在LbUGT3中位于一个亲水腔,其中3’-OH侧被R321、S285和C14环绕,可能有助于进一步糖基化相邻的4’-OH(图5E, F)。相反,LbUGT1通过大块的非极性F124、F86、L44和P13创建了环绕咖啡酰环3’-OH侧的疏水残基口袋,从而阻碍了单糖基化产物的结合,并仅允许糖分子附着到底物的一端(图5E, F)。因此,LbUGT3中的亲水口袋的存在对于促进过量的糖结合并通过亲水相互作用增强它们的适应性,以克服相邻双糖基化引起的位阻是至关重要的。
为了进一步解释LbUGT3的区域选择性机制,还对3’-O-单葡萄糖基化产物8进行了蛋白质结构对接,并进行了MD模拟以获得稳定的结合构型(补充图13,补充数据1)。通过比较LbUGT3中底物2和单葡萄糖基化产物8的两种结合模式,显然葡萄糖基位于亲水区域。值得注意的是,柔性的R321显示了显著的构象变化,可能通过适应性位移促进糖结合口袋的扩展(图5G)。此外,当R321被较小的丙氨酸替代时,二糖基化产物16和17的产量显著增加(图5I),表明调节亲水口袋大小影响LbUGT3的邻位双糖基化功能的可能性。为了证实这一假设,我们选择了具有最显著位置上最短侧链的G16。将G16替换为大块非极性亮氨酸后,相邻双糖基化产物16和17的产量显著减少(图5I)。这些结果表明,改变亲水口袋的大小对LbUGT3的邻位双糖基化产生重要影响。
还值得注意的是,围绕8糖连接的亲水口袋填充了由附近的骨干酰胺和羰基氧分子(如P15、P47、P316、E317)固定的一簇有序水分子。这些水分子与3’-O-葡萄糖形成氢键,并帮助将4’-OH基团带到催化残基附近进行第二次糖基化(图5H)。此外,特定的残基Y390可以参与与底物芳环的π-π相互作用,并通过水介导的氢键与8的糖基和UDP的磷酸基团形成作用,可能在确定底物结合构型中发挥关键作用(图5H)。一致地,尽管整体活性有所降低,但将Y390替换为缺乏酚羟基的相似侧链的F,完全消除了二糖基化活性(图5I),突显了Y390羟基的关键作用。有趣的是,尽管替换Y390为A,但仍保留了双糖基化活性,这可能归因于通道尺寸的增加。
LbUGT1是唯一能识别二氢咖啡酰基和咖啡酰基的UGT,选择性地催化糖转移至咖啡酰基的3’-OH和二氢咖啡酰基的4’’-OH。这表明,当进入LbUGT1活性位点时,二氢咖啡酰基和咖啡酰基可能采用不同的结合模式(图6A)。为了阐明分子机制,将受体底物1对接到LbUGT1结构中,MD模拟显示了两种活性结合模式,对应于4’’-O-糖基化(模式1)和3’-O-糖基化(模式2),在50 ns模拟期间的小d1和d2值验证了模拟的可靠性(图6B, C, 补充数据1)。此外,两种结合模式都显示了几个靠近底物1的正电荷残基,即天门冬氨酸和谷氨酸(E83、D197、D416、E418),在生理环境中附近的N5形成稳定的氢键或盐桥相互作用,这些残基可能在识别底物的精胺单元中发挥关键作用(图6B, C)。将这些残基与A替换后,活性大大降低,甚至完全失活,验证了以上推测(图6F)。此外,LbUGT1不能糖基化咖啡酸或二氢咖啡酸的原因可能是其特异性识别利西巴胺中的精胺单元(补充图14)。
A 提议的LbUGT1 4”/3’-O-糖基化的催化机制;B, C LbUGT1与配体1的结合模式1和结合模式2,1显示为青色,UDP-Glc显示为黄色,氢键用紫色虚线表示;D, E 在50 ns分子动力学模拟中,野生型LbUGT1和突变体Y389A在结合模式B和C中,底物的羟基H原子与催化组氮原子之间的两个关键距离(d1)以及底物的羟基O原子与UDP-Glc的乙缩醛C原子之间的距离(d2)的时间演变;F 探索LbUGT1-5变体的催化特异性。数据表示均值±标准差 (n=3)。Fig. 6F的数据来源详见源数据文件。
对比两种结合模式显示,除了Y389之外,其他残基的相互作用基本相同。在结合模式1中,Y389与受体底物的3"-OH形成氢键,但在结合模式2中没有这种氢键,这表明Y389在稳定结合模式1以进行二氢咖啡酰基的4"-OH糖基化中可能起重要作用。Y389类似于LbUGT3中的关键残基Y390,位于PSPG盒内,通常被认为负责结合糖供体。然而,最近的研究表明,PSPG中的几个残基对于结合受体分子和改变UGTs的区域选择性至关重要。为了确定Y389的潜在作用,我们对Y389和与UDP-糖供体形成氢键的几个PSPG残基进行了突变。大多数这些突变体失去了活性,与它们在稳定糖基和糖基化反应中的重要作用一致。相反,突变体Y389A显著改变了其区域选择性,消除了对4"-OH的活性,但增强了对3'-OH的活性。这与我们通过MD模拟获得的两种结合模式高度一致。此外,Y389突变为F也显示出增加的3'-O糖基化活性和受损的4"-O糖基化活性(图6F),进一步表明Y389羟基在4"-O糖基化活性中的重要作用。
为了进一步确认这些结果,我们对突变体Y389A在两种结合模式下进行了MD模拟,并测量了两个关键距离d1和d2。如图6D、E所示,在野生型LbUGT1的模式1和模式2中,d1和d2在50 ns内保持稳定(图6D、E,左)。然而,Y389突变为A在模式1中破坏了与底物的氢键,30 ns后d1和d2显著增加。相比之下,在模式2中未观察到Y389A的影响(图6D、E,右)。以上结果进一步确认了Y389在4"-O糖基化活性中的重要性。
与LbUGT1和LbUGT3相比,LbUGT2和LbUGT4催化选择性地对咖啡酰基的4-OH进行糖基化。为了探讨它们的结构基础,我们使用AlphaFold2对LbUGT2和LbUGT4进行了建模,因为它们的晶体结构目前不可用。根据LbUGT1和LbUGT3的方法,将UDP-Glc和底物2对接到蛋白质结构中,并进行MD模拟以获得稳定的结合构象(补充图15,补充数据1)。我们的研究表明,在LbUGT2和LbUGT4结构中,2的4'-OH与催化组氨酸(H16和H21)形成稳定的氢键,并与UDP-Glc的乙缩醛C原子紧密接近,与它们对咖啡酰基4-OH的糖基化活性一致。值得注意的是,LbUGT2中的F382和LbUGT4中的Y388,它们分别对应于LbUGT1中的Y389和LbUGT3中的Y390,分别与2进行疏水作用和氢键作用。随后,我们选择了LbUGT2中的F382,LbUGT4中的Y388和相应的LbUGT5中的Y384进行丙氨酸扫描突变。这些突变显著降低或甚至消除了它们的催化活性,表明这些保守的酪氨酸残基在LbUGT酶的功能中起着关键作用(图6F)。考虑到LbUGT2对咖啡酰基4-OH的高特异性,LbUGT4对3-OH和LbUGT5的糖基化,这些突变并不会产生替代产物。
讨论
lycibarbarspermidines是枸杞的主要生物活性成分之一,其化学多样性主要归因于糖基化。在这里,我们鉴定了五种糖基转移酶(LbUGT1-5),揭示了它们在lycibarbarspermidines糖多样性中的分子基础。来自枸杞的LbUGT1-5是首个能够催化二咖啡酰亚胺选择性糖基化的苯酰胺型糖基转移酶,形成结构多样的lycibarbarspermidines。尽管已有报道显示许多植物UGT能够催化广泛的天然产物如多酚、萜类化合物和生物碱,但尚未有报道UGT能够催化糖转移至苯酰胺。LbUGT1不能催化游离的咖啡酸或二氢咖啡酸,表明与亚精胺部分的相互作用对其活性至关重要(补充图14)。一致地,LbUGT1与非糖部分的模型显示,亚精胺单元与几个带负电的残基(E83、D197、D416、E418)形成广泛的相互作用。这些残基的突变显著损害或消除了其活性(图6F)。另一方面,LbUGT不能准确识别亚精胺的对称性质,催化与N1或N10连接的咖啡酰基的糖基化。LbUGT对脂肪族多胺部分的广泛适应可能被用于其他苯酰胺的糖基化,如地骨皮乙素,一种有前景的2型糖尿病治疗剂。正如预期的那样,LbUGT1高效催化地骨皮乙素,生成分子量增加162 Da的单糖苷(补充图16)。
LbUGT1-5的选择性显著受到咖啡酰基饱和状态的影响。LbUGT1选择性地糖基化咖啡酰基的3-OH和二氢咖啡酰基的4-OH,而LbUGT2-5专一地糖基化咖啡酰基。咖啡酰基饱和度的严格调控相对少见,因为大多数糖基转移酶受底物骨架和受体基团空间位置的影响。例如,三种源自朝鲜淫羊藿的糖基转移酶能催化山奈酚和二氢山奈酚的3-OH糖基化。CsUGT75L12来自茶树,能催化芹菜素和柠檬素的7-OH糖基化。我们的研究表明,即使咖啡酰基饱和状态的细微变化也能有效调节糖基转移酶的识别模式和选择性,突显出LbUGT的精确和巧妙。
LbUGT1-4具有催化二咖啡酰亚精胺连续双糖基化的能力。在多功能糖基转移酶中,连续双糖基化经常观察到。例如,UGTPg101连续催化原人参二醇在6-OH和20-OH的糖基化,形成原人参二醇Rg1,这两个糖基化位点相距甚远。类似的策略也被UGT74F1采用,后者同时糖基化槲皮素的7-OH和4'-OH。另一方面,AmGT8作为糖链延伸酶,连续催化环阿斯塔金醇的3-OH和环阿斯塔金醇-3-O-糖苷的2'-OH的糖基化,生成阿斯塔金苷III,CaUGT3促进槲皮素3-O-龙胆二糖苷的3-OH和6'-OH的连续糖基化。然而,与上述情况不同的是,LbUGT3能够催化苯环邻位羟基的双糖基化,由于苯酚基的共面取向,邻位羟基糖基化具有更高的空间位阻。因此,在苯环上具有邻位糖基化的天然产物非常罕见,目前仅有一个案例报道。
对LbUGT1和LbUGT3的活性口袋分析确定了关键的保守残基Y389(Y390),其对区域特异性至关重要。LbUGT1中的Y389或LbUGT3中的Y390是PSPG盒C末端的第四个残基。最近的研究报道,第三个残基在AmGT8中对区域选择性至关重要,AmGT8是一种负责在药用植物膜荚黄芪中三萜糖基化的糖基转移酶。因此,我们构建了LbUGT1的A390F和A390D突变体,对应AmGT8的突变。然而,所得突变体均失去了原有活性,并未影响区域选择性,表明LbUGT1和LbUGT3采用了不同的底物识别机制。除了LbUGT1和LbUGT3外,Y389或Y390在其他LbUGTs中高度保守。这些糖基转移酶中的突变导致失活,表明保守酪氨酸残基在糖基化反应中的关键作用。此外,Y389或Y390在其他植物糖基转移酶中也高度保守,表明这一残基在LbUGTs之外的UGTs中也具有重要作用。
总之,我们功能性地鉴定并结构表征了五种苯酰胺型糖基转移酶(LbUGT1-5),它们解释了lycibarbarspermidines的糖多样性,这些lycibarbarspermidines作为枸杞中的主要生物活性成分。LbUGT3能够克服强大的空间位阻,催化咖啡酰苯环上的非常规邻位双糖基化,而LbUGT1则准确区分咖啡酰基和二氢咖啡酰基,催化位点选择性糖转移。LbUGT3和LbUGT1的晶体结构对比揭示了LbUGT3中更亲水的催化口袋在促进邻位双糖基化中起着关键作用。定点突变确定了一个保守的酪氨酸残基对LbUGT1区分双键和单键至关重要。我们的研究揭示了枸杞中lycibarbarspermidines区域选择性糖基化的分子基础,并扩展了对生物重要天然产物糖基化的酶工具。
方法
一般材料和实验程序
甲醇(MeOH)由禹王工业有限公司(中国禹城)提供。分析纯乙酸乙酯(EtOAc)由天津市精细化工有限公司提供。甲酸和三氟乙酸由天津科密欧化学试剂有限公司提供。引物合成和DNA测序由上海生工生物工程股份有限公司进行。质粒提取试剂盒和DNA纯化试剂盒购自上海生工生物工程股份有限公司。PCR使用的是KOD OneTM PCR master Mix(日本Toyobo)。克隆载体构建使用的是ClonExpress® Multis One Step Cloning Kit(中国Vazyme)和In-Fusion® HD Cloning Kit(日本Takara)。DNA限制酶和其他DNA修饰试剂购自赛默飞世尔科技(中国深圳)。咖啡酸、二氢咖啡酸和地骨皮乙素由上海源叶生物科技有限公司提供。化合物1-6, 10-14和18来自本实验室的化合物库。
HPLC-MS分析使用Dionex UltiMate 3000 HPLC系统(美国Thermo Scientific),配备Gemini® 5 μm C18 110 Å柱(250×4.6 mm,美国Phenomenex)和amaZon SL离子阱质谱仪(美国Bruker)连接电喷雾电离源进行。中压液相色谱(MPLC)使用上海立遂仪器科技有限公司(中国)的双泵梯度系统,配备ODS树脂(50 μm,日本YMC)。半制备型HPLC使用Dionex UltiMate 3000 HPLC系统,配备YMC-Pack ODS-A柱(10.0 mm i.d.×250 mm,5 μm;日本YMC)。高分辨率质谱(HRESIMS)由Waters Synapt G2 TOF质谱仪(美国Waters Corporation)获得。1D和2D NMR光谱在Bruker AV 400/600光谱仪(美国Bruker)上记录,以溶剂信号(DMSO-d6:δH 2.50/δC 39.5)作为内标。
植物材料
枸杞(Lycium barbarum)于2019年8月从中国宁夏回族自治区中宁县采集。不同组织被收集后立即冷冻在液氮中,并保存于−80°C以备进一步研究。一份标本(LYBA-NX-ZN)存放在中国广州暨南大学药学院中药与天然产物研究所。
全长异构体测序
全长异构体测序(Iso-seq)的总RNA提取和文库构建由北京安诺优达科技有限公司完成。为了获得更可靠的转录组数据,将来自枸杞果实、根和叶的混合RNA通过SMARTer PCR cDNA合成试剂盒(Clontech,CA,USA)逆转录为全长cDNA。KAPA HiFi PCR试剂盒用于扩增cDNA以进行尺寸选择。然后通过SMRTbell模板准备试剂盒(Pacific Biosciences,CA,USA)合并SMRTbell文库。使用PacBio Sequel系统(安诺优达科技有限公司)对聚合酶结合模板进行测序。最后,高质量的异构体进行标准注释。
质粒和菌株
E. coli DH5α(赛默飞世尔科技,中国)用于克隆,而Rosetta(DE3)用于表达。这些菌株在添加适当抗生素的Luria-Bertani(LB)培养基中生长。pGEX-2TK和pET-28b质粒购自上海生工生物工程股份有限公司。
UGT基因的克隆、序列比对和系统发育分析
枸杞的总RNA由北京安诺优达科技有限公司提取,并通过TransScript® One-Step gDNA Removal和cDNA合成SuperMix(中国Transten)逆转录为cDNA,按照标准协议进行。基因通过KOD One DNA聚合酶(日本TOYOBO)与补充表10中列出的引物扩增,并通过In-Fusion® HD Cloning Kit连接到pGEX-2TK载体中。
所有相关酶的全长蛋白质序列从GenBank和JGI数据库中收集(补充表1),并使用ClustalW进行比对。使用MEGA 6.0软件通过泊松模型生成根最大似然树,并进行1000次重复的引导分析。
重组蛋白的表达和纯化
为了表达用于体外反应和动力学分析的重组蛋白,将pGEX-2TK-LbUGT质粒转化到E. coli Rosetta(DE3)中。每个转化体在添加相应抗生素的LB培养基中,在37°C、200rpm下培养16小时。当OD600达到0.6时,添加0.4mM异丙基β-D-硫代半乳糖苷(IPTG)诱导蛋白表达,随后在16°C、160rpm下继续孵育20小时。通过离心(3分钟,8000×g)收获细胞,并将LbUGT转化体重悬于10mM HEPES缓冲液(pH 7.0)中。冰浴超声破碎并离心(30分钟,12000×g)后,通过GST标签蛋白纯化试剂盒(Beyotime,中国)纯化上清液,按照制造商的说明操作。通过SDS-PAGE确认蛋白纯度,并使用Bradford蛋白测定法(Bio-Rad)计算蛋白浓度。
为了表达和纯化用于蛋白质结晶的LbUGT,将编码LbUGT1和LbUGT3的基因分别克隆到含有8×His标签和N端TEV蛋白酶切割位点的pET-28b衍生载体pET-28b1和pGEX-2TK衍生载体pGEX-2TK1中。这些构建的质粒转化到E. coli Rosetta(DE3)中进行过表达。当OD600达到1.0时,添加0.4mM IPTG诱导表达,随后在16°C、160rpm下孵育20小时。然后收获细胞,重悬并在缓冲液A(25mM Tris,pH 8.0,500mM NaCl和5mM β-巯基乙醇)中裂解。离心(30分钟,12000×g)后,通过Ni-NTA层析纯化上清液,TEV切除MBP-His标签和GST-His标签。使用缓冲液B(25mM Tris,pH 8.0,100mM NaCl和2mM DTT),通过排阻层析(Superdex 200 16/600,GE Healthcare)进一步纯化目标蛋白。蛋白浓缩至约15 mg mL−1以进行蛋白结晶。
酶活性测定
糖基转移酶活性反应混合物含有2.5 mM UDP-Glc、1.0 mM MgCl2、0.5 mM底物、50 μg纯化的LbUGTs和10 mM HEPES(pH 7.0),总体积为100 μL。反应在30°C下进行12小时,通过添加200 μL甲醇终止反应。随后,反应产物离心12,000×g 30分钟,收集上清液,通过LC-MS分析。
酶促反应放大
放大的酶促反应在30°C下进行12小时,使用10mM HEPES缓冲液(pH 7.0),含有2.5mM UDP-Glc、1.0mM MgCl2、0.5mM底物和30mL粗提的LbUGTs蛋白。通过添加3倍体积的甲醇终止反应,离心后,溶剂在减压下蒸发,残渣溶解在甲醇中进行纯化。
HPLC分析和代谢物分离
分析HPLC使用线性梯度进行:[MeOH(A)和含0.1%甲酸的水(B);1 mL/min;10%A(0 分钟) -10%A(10 分钟) -55%A(25 分钟) -100%A(26 分钟) -100%A(36 分钟)]。
为了分离酶促产物,通过向酶催化系统中添加三倍体积的甲醇终止放大的酶促反应,离心12,000×g 30分钟后,收集上清液并在减压下干燥。
然后将粗产物通过ODS柱层析进行中压液相色谱(MPLC),使用MeOH-H2O梯度洗脱,并通过制备型HPLC在20-25%MeOH-H2O(0.1%三氟乙酸)下进一步纯化以获得主要代谢物。纯化的糖基化产物溶解在DMSO-d6中,通过2D NMR光谱分析进行鉴定。
LbUGT1-5的生化性质
使用N1-咖啡酰-N10-二氢咖啡酰亚精胺(1)或N1, N10-双咖啡酰亚精胺(2)作为糖受体,UDP-Glc作为糖供体,研究LbUGT1-5的生化性质。为了测试LbUGT1-5活性的最佳反应温度,在不同温度下(4 °C, 16 °C, 30 °C, 37 °C, 50 °C和70 °C)孵育催化测定(补充图6)。为了研究二价金属离子对LbUGT1-5活性的必要性,分别使用EDTA、MgCl2、CaCl2、MnCl2、CoCl2和FeCl2,终浓度为1 mM(补充图7)。每种条件下进行三次平行反应。通过添加100 μL甲醇终止反应,离心12,000×g 30分钟后,收集上清液进行LC-MS分析。
为了确定重组LbUGT1-4对化合物1和LbUGT5对化合物2的酶动力学参数,酶促测定在100 μL反应混合物中进行,含有10 mM HEPES缓冲液(pH 7.0)、50 μg纯化的重组LbUGTs、2.5 mM UDP-Glc、1.0 mM MgCl2和各种浓度的底物(0.05, 0.1, 0.2, 0.5, 1, 2和3 mM)。酶促反应在30 °C孵育1小时,根据转换率选择反应时间,通过添加100 μL甲醇终止反应。离心12,000×g 30分钟后,收集上清液进行LC-MS分析。所有反应均以三次重复进行。使用Graphpad Prism 8根据Michaelis-Menten方程确定动力学参数Km、kcat和kcat/Km(补充图8)。
蛋白质结晶和结构测定
通过坐滴蒸汽扩散法在19 °C下进行LbUGT1和LbUGT3的晶体筛选。将蛋白与1 mM UDP或UDP-Glc和10 mM底物(1、2或8)混合,并在冰上孵育1小时以形成复合物。LbUGT1的晶体在含有0.2 M (NH4)2SO4、0.1 M HEPES(pH 7.5)、20%(w/v)PEG8000和10%(v/v)2-丙醇的溶液中获得。LbUGT3的晶体在含有0.1 M双三异丙基(pH 6.5)、0.2 M NaF、20% PEG3350和4%(v/v)2,5-己二醇的溶液中生长。所有晶体使用含有10%-20%(v/v)甘油的储液作为冷冻保护剂,在液氮中快速冷冻。数据在上海同步辐射装置(SSRF)的BL19U1光束线上收集,并由xia2处理。使用AlphaFold2预测的搜索模型,通过分子置换法解决LbUGT1和LbUGT3的结构。通过PHENIX和COOT进行模型重建和优化的迭代循环。数据收集和优化统计数据见补充表3。
分子对接、分子动力学和定点突变
使用Autodock 4.0研究LbUGT1-4与1、2、8和UDP-Glc的分子对接。根据结合能量和构象分析和筛选模型。所有MD模拟均使用AMBER22进行,蛋白使用AMBER ff14SB力场,溶剂水分子使用TIP3P模型。UDP-Glc和底物1、2或8的力场参数由AMBER GAFF力场生成。UDP-Glc和底物1、2或8的部分原子电荷基于HF/6-31 G*计算,通过Gaussian 09包获得的约束静电势(RESP)电荷获得。初始坐标和拓扑文件由tleap程序生成,包括中和和溶剂化。所有模型均使用相同的MD协议,采用周期性边界条件和立方模型。首先进行三个步骤的最小化以放松溶剂和优化系统。然后在NVT系综下逐步从0加热至300 K,进行50 ps,再在300 K和目标压力为1.0 atm的NPT系综下进行另一个100 ps的MD模拟。在NPT系综中,系统温度由Langevin恒温器方法控制。随后,每个模型在NVT系综下进行50 ns的MD模拟。在MD模拟过程中,所有含氢键的键均使用SHAKE算法约束,所有模拟使用的时间步长为2 fs。范德华和静电相互作用的截断设置为12 Å。最后,所有轨迹由CPPTRAJ程序分析。
使用pGEX-2TK-LbUGT1-5作为模板,通过PCR进行LbUGT1-5的定点突变,使用补充表10中列出的引物。PCR产物纯化后,DpnІ消化,并转化到E. coli DH5α中。通过DNA测序确认后,将突变质粒转化到E. coli Rosetta(DE3)中进行异源蛋白表达。
新化合物的结构表征
化合物7:绿色油状物;[α]25D − 22.3(c 0.50,MeOH);紫外(MeOH)λmax(log ε)205(1.67),287(1.26)nm;红外(KBr)vmax 3369, 2945, 2873, 1685, 1518, 1439, 1281, 1203, 1139, 1076, 805, 722 cm−1;HRESIMS(正离子模式)m/z 632.2804 [M + H]+(计算值为C31H42N3O11, 632.2819),见补充图19A;1H和13C NMR数据见补充表4。
化合物9:绿色油状物;[α]25D − 29.1(c 0.50,MeOH);紫外(MeOH)λmax(log ε)204(1.69),292(1.63),314(1.70)nm;红外(KBr)vmax 3397, 2946, 2879, 1654, 1517, 1439, 1283, 1203, 1139, 1076, 827, 637 cm−1;HRESIMS(正离子模式)m/z 794.3350 [M + H]+(计算值为C37H52N3O16, 794.3348),见补充图20A;1H和13C NMR数据见补充表6。
化合物15:绿色油状物;[α]25D − 16.8(c 0.50,MeOH);紫外(MeOH)λmax(log ε)205(1.68),292(1.50),316(1.53)nm;红外(KBr)vmax 3306, 2933, 2879, 1603, 1512, 1439, 1382, 1263, 1070, 816 cm−1;HRESIMS(正离子模式)m/z 796.3510 [M + H]+(计算值为C37H54N3O16, 796.3504),见补充图21A;1H和13C NMR数据见补充表7。
化合物16:绿色油状物;[α]25D − 25.5(c 0.50,MeOH);紫外(MeOH)λmax(log ε)205(1.87),287(1.34)nm;红外(KBr)vmax 3417, 2955, 2882, 1682, 1433, 1388, 1203, 1139, 1170, 802, 722 cm−1;HRESIMS(正离子模式)m/z 794.3353 [M + H]+(计算值为C37H52N3O16, 794.3348),见补充图22A;1H和13C NMR数据见补充表8。
化合物17:绿色油状物;[α]25D − 27.3(c 0.50,MeOH);紫外(MeOH)λmax(log ε)205(1.87),288(1.41)nm;红外(KBr)vmax 3409, 2942, 2882, 1682, 1509, 1436, 1266, 1206, 1135, 805, 722 cm−1;HRESIMS(正离子模式)m/z 794.3347 [M + H]+(计算值为C37H52N3O16, 794.3348),见补充图23A;1H和13C NMR数据见补充表9。