菘蓝中松脂醇-落叶松脂素还原酶编码基因IiPLR2的克隆与功能分析
摘要
松脂醇-落叶松脂素还原酶(pinoresinol-lariciresinol reductase, PLR)是植物中木脂素生物合成的关键酶,能连续催化两步反应分别生成落叶松脂素和开环异落叶松脂素。落叶松脂素等木脂素类成分是中药板蓝根发挥抗病毒活性的有效成分。为了研究板蓝根基原植物菘蓝中落叶松脂素生物合成关键酶PLR的功能,从菘蓝(Isatis indigotica)中克隆得到IiPLR2基因序列,全长954 bp,编码317个氨基酸;多序列比对分析显示IiPLR2具有保守的还原型烟酰胺腺嘌呤二核苷酸磷酸(reduced nicotinamide adenine dinucleotide phosphate, NADPH)结合基序;进化树分析显示IiPLR2与来自拟南芥的AtPrR1聚在同一分支;构建原核表达载体pET32a-IiPLR2,转化至大肠杆菌BL21(DE3)中进行蛋白诱导表达纯化;体外酶活实验检测发现IiPLR2能够催化松脂醇生成落叶松脂素,并能进一步催化落叶松脂素生成开环异落叶松脂素。IiPLR2编码基因的克隆、序列分析及催化功能研究丰富了菘蓝中该类功能蛋白的认识,完善了菘蓝木脂素生物合成途径,为开展木脂素类成分的代谢调控和合成生物学研究提供了功能元件,也为深入研究该类蛋白的空间结构与催化功能的关系等奠定了基础。
菘蓝是十字花科(Brassicaceae)菘蓝属植物,其根入药为板蓝根,叶入药为大青叶,具有清热解毒、凉血消斑、泻火定惊的功效[1],临床上多用于治疗流行性感冒、流行性腮腺炎、流行性乙型脑炎、急慢性肝炎、带状疱疹,骨髓炎等[2-4]。当下全球流感病毒肆虐,抗病毒成分的相关研究备受关注。研究表明,菘蓝中落叶松脂素及其衍生物(开环异落叶松脂素、罗汉松树脂和开环异落叶松脂素二葡萄糖苷等)均属于木脂素类化合物,具有较强的抗病毒活性[5-8],是中药板蓝根发挥抗病毒功效的重要物质基础[1]。
目前,菘蓝木脂素类成分的生物合成途径已经非常清楚,该合成途径中的关键酶包括聚合蛋白酶(dirigent protein, DIR)[9]、松脂醇-落叶松脂素还原酶(pinoresinol-lariciresinol reductase, PLR)[10]、开环异落叶松脂素脱氢酶(secoiso-lariciresinol dehydrogenase, SIRD)[11]和糖基转移酶(uridine diphosphate dependent glycosyltransferase, UGT)[6, 12]。其中PLR被认为是木脂素生物合成途径最关键的催化酶之一,能够催化松脂醇生成落叶松脂素,并能进一步催化落叶松脂素生成开环异落叶松脂素,该还原步骤为呋喃、二苄基丁烷、二苄基丁内酯和芳基四氢萘等不同结构类型木脂素生物合成的关键节点[13-14]。本课题组前期研究发现菘蓝中可能存在3个PLR编码基因(IiPLR1、IiPLR2和IiPLR3),并对IiPLR1进行了系统的功能研究[10],且精细解析了其蛋白晶体结构[15],为研究该催化酶家族其他成员奠定了基础。
本研究通过分子克隆技术获得了IiPLR2基因序列,对其进行了多序列比对、进化树构建、蛋白结构等生物信息学分析,并通过原核蛋白表达纯化进行了催化功能的评价,为后续开展基于此的菘蓝木脂素类成分生物合成与代谢调控研究提供了支持。
1 材料与方法
1.1 材料
1.1.1 植物材料
菘蓝(Isatis indigotica)采集于海军军医大学药学院的植物园并由生药教研室张汉明教授鉴定。将菘蓝种子播撒在1:1:3的泥炭土、珍珠岩和蛭石中培养发芽,移至相同比例的土中培养,幼苗在30 ℃光照16 h、18 ℃暗环境8 h的培养箱中继续生长,绿肥水浇灌,收集生长1个月的菘蓝叶片。
1.1.2 试剂
TransZol Up Plus RNA Kit (ER501)、大肠杆菌DH5α感受态细胞和质粒小提试剂盒均购于北京全式金生物技术有限公司;限制性内切酶(Not I和PspX I)购于New England Biolabs公司;大肠杆菌BL21(DE3)感受态购于上海唯地生物技术有限公司;KOD-FX聚合酶购于东洋纺(上海)生物科技有限公司;反转录试剂盒PrimeScriptTM Ⅱ 1st Strand cDNA Synthesis Kit与非连接酶依赖型的单片段一步法克隆试剂盒ClonExpress® Ⅱ One Step Cloning Kit购于TaKaRa Bio公司;松脂素、落叶松脂素及开环异落叶松脂素标准品(HPLC纯度≥95%)均购于默克公司;引物合成由生工生物工程(上海)股份有限公司完成。
1.2 方法
1.2.1 菘蓝叶片总RNA提取及cDNA的合成
取新鲜的菘蓝叶片,用在液氮中冻过的剪刀剪下菘蓝叶片,放入含有钢珠的RNase-free离心管后迅速放入液氮中,用球磨机磨碎。菘蓝叶片的总RNA通过RNA提取试剂盒提取获得并测定浓度和纯度,再将所提取的总RNA反转录成cDNA,测定浓度,−80 ℃冻存备用。
1.2.2 菘蓝IiPLR2基因的扩增及重组质粒构建
设计特异性引物(IiPLR2-F: 5′-TCCGTCGACAAGCTTGCGGCCGCATGGGAGAGAGCAAA-3′; IiPLR2-R: 5′-GTGGTGGTGGTGGTGCTCGAGTGATGAACGTTTTTAA-3′,下划线为酶切位点)。扩增体系:ddH2O 6.5 μL,dNTPs 2.5 μL,cDNA模板1 μL,上下游引物各1 μL (工作浓度10 μmol/L),2×缓冲液12.5 μL,KOD-FX 0.5 μL;PCR扩增程序:94 ℃预变性2 min;98 ℃高温变性10 s,55 ℃低温退火30 s,68 ℃延伸1.5 min,35个循环;68 ℃延伸10 min;最后4 ℃保存。将获得的PCR产物进行1%琼脂糖凝胶电泳,判断目的基因条带大小。将条带大小正确的目的片段(带有酶切位点:Not I和PspX I作为酶切位点)连接至pET32a表达载体,转化至大肠杆菌BL21(DE3)感受态细胞,挑取单克隆进行鉴定,重组质粒送生工生物工程(上海)股份有限公司测序。
1.2.3 IiPLR2基因的生物信息学分析
使用IiPLR2基因的核苷酸序列进行开放阅读框(open reading frame, ORF) finder寻找ORF;利用ExPASy[16]、NPS [NPS@: SOPMA secondary structure prediction (ibcp.fr)][17]、TMHMM和SignalP 5.0等在线工具预测基因编码蛋白的相对分子质量、氨基酸序列和等电点等,同时对跨膜结构域、信号肽和亚细胞定位等性质进行预测分析;利用SWISS-MODEL在线工具[18][SWISS-MODEL (expasy.org)]结合PyMOL软件预测得到IiPLR2-NADP+三维蛋白结构并将其与IiPLR1-NADP+ (PDB: 7CS3)结构进行比较;同时运用CLUSTALW [Multiple Sequence Alignment-CLUSTALW (genome.jp)][19]结合ENDscript/ ESPript在线网站[ESPript 3.x/ENDscript 2.x (ibcp.fr)][20]将氨基酸序列与不同来源的PLR氨基酸序列和二级结构进行比对;在NCBI数据库中选择了来源于不同植物的PLR氨基酸序列,利用MEGA 7.0软件[21],使用Maximum Likelihood方法,bootstrap重复次数设置为1 000次,构建系统进化树。
1.2.4 IiPLR2基因的原核表达与蛋白纯化
将测序正确的菌株转接至含终浓度为50 mg/mL氨苄西林(ampicillin, Amp+)的LB液体培养基中,220 r/min、37 ℃振荡至OD600=0.6;加入异丙基-β-d-硫代半乳糖苷(isopropyl β-d-thiogalactoside,IPTG,终浓度为0.5 mmol/L)后在80 r/min、18 ℃条件下过夜。将过夜菌液在8 000 r/min离心30 min,收集菌体;使用Tris-HCl缓冲液(pH 8.0, 20 mmol/L Tris-HCl, 100 mmol/L NaCl)重悬菌体,再用超高压连续流细胞破碎仪破碎蛋白后离心(4 ℃, 20 000 r/min, 45 min);将上清液(0.22 μm滤膜过滤)转移至新离心管中,使用Ni-NTA柱进行纯化,利用Bradford法[22]测定蛋白浓度。同时分别取10 μL未经IPTG诱导的蛋白、IPTG诱导但未纯化和纯化过的蛋白提取液进行SDS-PAGE以检测蛋白表达情况,剩余蛋白于−80 ℃保存备用。
1.2.5 IiPLR2的体外酶活测定
反应体系(1 mL)由TG缓冲液[pH 7.0,50 mmol/L Tris-HCl,10% (质量分数)甘油]、150 μmol/L NADPH、100 μmol/L松脂醇或100 μmol/L落叶松脂素以及5 μg的IiPLR2纯蛋白组成。使用不添加IiPLR2纯蛋白的体系作为对照。首先将纯蛋白、缓冲液和底物在30 ℃下预孵育5 min,然后添加NADPH开始反应,30 min后加入300 μL乙酸乙酯终止反应。使用乙酸乙酯(总计3×300 μL)对反应产物进行萃取,浓缩后使用甲醇(200 μL)复溶,用于三重四极杆质谱仪(Agilent公司)检测松脂醇、落叶松脂素和开环异落叶松脂素的含量。色谱条件:色谱柱为Thermo® C18 (150 mm×2.1 mm, 3.5 μm),柱温为35 ℃,流速为0.3 mL/min,流动相为乙腈(A)-5 mmol/L乙酸铵水溶液(B),梯度洗脱(0–4 min, 15%A; 4.0–4.5 min, 50%A; 4.5–8.5 min, 85%A);质谱条件:选择电喷雾电离(electrospray ionization, ESI)离子源,其温度为350 ℃,MS1和MS2的温度为105 ℃;质谱喷雾针电压为4 000 V,干燥气体与雾化气选用氮气,碰撞池气体为高纯氮气,压强为0.1 MPa,雾化气压力设置为40 psi,气体流速设置为10 L/min;监测模式和扫描方式分别为负离子和多反应监测(multiple reaction monitoring, MRM)模式。其他质谱参数如表 1所示。
Table 1 Mass spectrometry parameters of pinoresinol, lariciresinol and secoisolariciresinol
Compounds | Precursor ion (m/z) | Product ion (m/z) | Fragmentor (V) | Collision energy (V) |
Pinoresinol | 357.1 | 151.1 | 135.0 | 30.0 |
Lariciresinol | 359.2 | 329.0 | 100.0 | 3.0 |
Secoisolariciresinol | 361.1 | 164.9 | 135.0 | 20.0 |
2 结果与分析
2.1 IiPLR2编码基因的克隆与蛋白核苷酸序列分析
以菘蓝cDNA为模板,测试扩增得到的片段电泳条带大小与理论目的基因长度(954 bp)相符合(图 1A)。利用ORF finder对基因的cDNA序列进行分析,IiPLR2基因的全长为954 bp,编码317个氨基酸(图 1B),序列上传至NCBI获得基因序列号(GenBank登录号:PP061232)。
A:IiPLR2的核酸电泳图. M:DNA marker;1:IiPLR2基因的PCR产物检测. B:IiPLR2的核苷酸序列(黑色)和氨基酸序列(蓝色)
2.2 IiPLR2蛋白理化性质分析
使用在线软件ExPASy对IiPLR2进行理化性质分析,结果显示IiPLR2理论等电点是5.86,相对分子质量是35.54 kDa;它的脂肪指数、蛋白不稳定指数和亲水性总平均值分别是90.41、43.06和−0.215,其氨基酸残基中带正电荷(Arg+Lys)残基总数是36,负电荷(Asp+Glu)残基总数是44,疏水氨基酸多于亲水氨基酸的数量,初步推断为不稳定的疏水蛋白(图 2A)。利用TMHMM在线预测蛋白跨膜结构,结果显示,IiPLR2没有显著的跨膜区,位于细胞膜内机率几乎为0,位于膜外几率大于1.2,提示IiPLR2可能位于膜外(图 2B);根据SignalP 5.0在线预测信号肽,结果表明IiPLR2含有信号肽的可能性为0.020 8%,推测其不存在信号肽,为非分泌蛋白,且该蛋白合成后不发生转运(图 2C)。植物亚细胞定位在线工具Plant-mPLoc预测结果表明,IiPLR2可能定位于细胞质上,在细胞质内发挥功能。
图 2 IiPLR2氨基酸序列的亲水/疏水性质(A)、跨膜结构域(B)以及信号肽预测(C)
2.3 IiPLR2蛋白二级和三级结构分析
利用在线工具NPS分析IiPLR2二级结构,结果显示:IiPLR2蛋白的二级结构元件中α-螺旋所占的比例最高,有126个氨基酸,占39.75%;无规卷曲包含114个氨基酸,占35.96%;延伸链包含56个氨基酸,为17.67%;β折叠所占比例最低,包含21个氨基酸,占6.62% (图 3A)。SWISS-MODEL在线分析获得以AtPrR1-NADP+ (PDB: 7CSA)作为同源模板的IiPLR2-NADP+蛋白三维空间模型,氨基酸相似性为90.97%,全球性模型质量评分为0.9。IiPLR2的结构与AtPrR1[15]同为2个头尾相接的二聚体构象,每个单体均包含2个结构域,即N端NADPH结合结构域(NBD: N-terminal NADPH binding domain)和C端底物结合结构域(SBD: C-terminal substrate binding domain);2个结构域中间有个大凹槽(图 3B);结构上还包含NADPH特异性结合基序GXXGXXG (图 3C)。
图 3 IiPLR2的二级结构(A)和三级结构(B、C)
A:蓝色为α-螺旋;绿色为β-折叠;黄色为无规则卷曲;红色为延伸链. B、C为绿色为N端NADPH结合结构域;粉红色为C端底物结合结构域;洋红色为NADPH结合基序;青色为NADPH
2.4 IiPLR2氨基酸的序列同源比对和系统进化树构建
使用ESpript 3.0在线进行序列同源比对,结果显示:IiPLR2氨基酸序列与来源于拟南芥(Arabidopsis thaliana)的AtPrR1 (NP_174490.1)和AtPrR2 (NP_001319922.1)的同源性分别为90.85%和81.07%;与来源于菘蓝(Isatis indigotica)的IiPLR1 (AEA42007.1)的同源性为82.65%;与来源于桃儿七(Sinopodophyllum hexandrum)的ShPLR (ABY75535.2)的同源性为60.77%,与来源于白亚麻(Linum album)的LaPLR (AJ849358.1)的同源性为58.67%,与来源于亚麻(Linum usitatissimum)的LuPLR1 (AJ849359.1)的同源性为62.82%;与其他植物中的PLR一样,IiPLR2具有保守的NADPH结合结构域(图 4A)。对不同物种的PLR/PrR进行系统进化树分析显示:该进化树由多分支组成,来源于菘蓝的IiPLR1和IiPLR2与来源于拟南芥的AtPrR1和AtPrR2分布在同一支上,均来源于十字花科植物,其中IiPLR2和AtPrR1属于同一分支,提示IiPLR2可能具有和AtPrR1相似的功能(图 4B)。
图 4 不同植物来源的PLR氨基酸序列比对(A)和系统进化树(B)
绿色:NADPH结合基序;蓝色:第46位氨基酸位点;紫色:第98位氨基酸位点
2.5 IiPLR2与IiPLR1的三级蛋白结构比较
IiPLR2和IiPLR1蛋白中β4环的氨基酸序列非常相似(图 4A),但IiPLR2中β4环C末端对应Asn98的残基在IiPLR1中被替换为Ser98。如图 5所示,IiPLR2N98到NADPH之间的距离是4.7 Å;而IiPLR1S98到NADPH之间的距离是2.1 Å,推测IiPLR2的氨基酸位点N98与辅因子NADPH之间距离过远不利于反应的发生;此外,丝氨酸侧链足够短,能够保留在NADPH的鸟嘌呤基团下方,而天冬酰胺侧链由于空间位阻而不能如此。综上,我们推测与IiPLR1相比,IiPLR2的N98氨基酸位点有可能影响其催化活性。
图 5 IiPLR2-NADP+(青绿色)与IiPLR1-NADP+ (PDB: 7CS3) (浅灰色)的结构差异
黄色:NADP+;橙色:IiPLR2-NADP+的β4环;洋红色:IiPLR2N98;蓝色:IiPLR1S98;黄色虚线:氢键
2.6 IiPLR2的蛋白纯化及体外酶活
IiPLR2重组蛋白诱导表达后收集菌体,破碎蛋白,离心后取上清液和纯化蛋白液进行SDS-PAGE,结果显示:上清液和纯化蛋白液中均出现明显的目的蛋白条带,与预测的IiPLR2分子量大小一致,表明该蛋白表达纯化成功,且为可溶性蛋白(图 6A)。
图 6 IiPLR2蛋白的表达纯化与酶活性检测
A:IiPLR2蛋白表达纯化图. M:蛋白marker;1:未诱导的蛋白;2:IPTG诱导的蛋白;3:纯化后的蛋白;B:IiPLR2催化木脂素生物合成途径中的两步连续还原步骤;C和D:分别以松脂醇和落叶松脂素为底物时,IiPLR2酶促反应产物的LC-MS检测结果(绿色:松脂素;黄色:落叶松脂素;蓝色:开环异落叶松脂素;黑色:阴性对照;红色:IiPLR2反应)
分别以松脂醇和落叶松脂素为底物,通过体外酶活实验检测IiPLR2的催化活性(图 6B)。结果显示,当以松脂醇为底物时,与对照相比,反应液中检测到了和落叶松脂素对照品保留时间一致的产物,且产物的碎片离子与对照品一致,但未检测到与开环异落叶松脂素对照品保留时间一致的产物,说明IiPLR2能催化松脂醇生成落叶松脂素,但未能进一步生成开环异落叶松脂素(图 6C);当以落叶松脂素为底物时,与对照相比,反应液中检测到了和开环异落叶松脂素对照品保留时间一致的产物,且产物的碎片离子与对照品一致,但产生的量较少,说明IiPLR2能催化落叶松脂素生成开环异落叶松脂素,但催化活性与第一步反应相比较弱(图 6D),这与AtPLR1的催化活性[15]相似。
3 讨论与结论
PLR是在两分子木脂素单体初始二聚后参与木脂素生物合成的第一个酶,催化两个连续的还原步骤,催化松脂醇(双并四氢呋喃型)形成落叶松脂素(呋喃型),进而催化落叶松脂素(呋喃型)形成开环异落叶松脂素(二芳基丁烷型),是不同骨架类型木脂素形成的驱动力,是木脂素生物合成的关键酶[13]。
研究表明,植物中往往同时存在多个PLR家族成员,并具有不同的催化特征[14]。例如,拟南芥松脂醇还原酶AtPrR对松脂醇具有较强的底物偏好,而对落叶松脂素几乎没有催化作用,其中AtPrR1对落叶松脂素仅有较弱的活性,AtPrR2对落叶松脂素完全无活性23];来源于亚麻的LuPLR1和LuPLR2均能够连续催化两步反应,但LuPLR1对松脂醇的催化效率高于落叶松脂素,而LuPLR2对落叶松脂素的催化效率高于松脂醇[24-25];在北美乔柏中发现了4个TpPLR,TpPLR1能够连续催化两步反应,而TpPLR2无法将落叶松脂素还原为开环异落叶松脂素[26]。
本实验室前期研究发现菘蓝中可能存在3个PLR编码基因(IiPLR1、IiPLR2和IiPLR3),通过“转录组-代谢组”关联分析评价IiPLR1、IiPLR2和IiPLR3对菘蓝中抗病毒活性成分落叶松脂素生物合成的作用,结合基因敲除实验证明了IiPLR1在菘蓝落叶松脂素生物合成过程中起决定性作用:抑制IiPLR1的表达显著降低了菘蓝毛状根中落叶松脂素的含量,但抑制IiPLR2和IiPLR3的表达对落叶松脂素的含量积累无显著影响[10]。随后,我们对IiPLR1进行了系统的功能研究:体外酶活检测发现IiPLR1能够连续催化两步反应;通过蛋白晶体结构解析阐明了IiPLR1与AtPrR2底物选择性差异的结构基础。进一步进行蛋白突变和催化活性检测发现,与野生型IiPLR1相比,突变体IiPLR1S98N催化落叶松脂素转化为开环异落叶松脂素的效率降低,证明氨基酸残基98通过控制β4环的摆动,影响了底物结合和产物释放,在催化落叶松脂素生成开环异落叶松脂素的过程中发挥重要作用[10]。同时,为了进一步探明IiPLR2和IiPLR3的功能,通过菘蓝基因组注释获得了IiPLR2的全长序列和IiPLR3的部分片段(有待进一步研究)。
本研究成功克隆了菘蓝IiPLR2基因,其编码蛋白IiPLR2属于疏水蛋白,不具跨膜区域,不存在信号肽序列,可能定位于细胞质中,进化树分析发现菘蓝IiPLR2蛋白与拟南芥AtPrR1亲缘关系最近。体外酶活实验发现IiPLR2能够催化松脂醇(pinoresinol, Pin)生成落叶松脂素(lariciresinol, Lar),并能微弱催化落叶松脂素生成开环异落叶松脂素(secoisolariciresinol, Sec)。蛋白结构分析推测IiPLR2与IiPLR1催化活性的差异与98位氨基酸的差异密切相关。
综上所述,本研究对IiPLR2的序列、结构及催化功能等进行了较系统的研究,体外催化活性评价证明其功能与来自拟南芥的AtPrR1类似,对松脂醇具有较强的底物偏好性,能催化松脂醇生成落叶松脂素,但对落叶松脂素的催化作用较弱(图 6)。本研究不仅补充完善了菘蓝木脂素生物合成途径,也为深入揭示IiPLR2的功能、阐明其蛋白结构与功能的关系、开展基于此的次生代谢调控及合成生物学研究等奠定了坚实的基础。