2023年12月13日,北京玻色量子科技有限公司(以下简称“玻色量子”)联合上海交通大学在中科院分区1区、计算化学领域Top刊物JCTC(Journal of Chemical Theory and Computation)内刊的封面上发表了以“Encoding Molecular Docking for Quantum Computers”(基于量子计算机实现的分子对接程序)为题的学术论文。
玻色量子创始人&CEO文凯博士,上海交通大学特聘教授、药物化学与生物信息学中心主任张健为论文的通讯作者,这是玻色量子在“量子计算+生物制药”领域取得的首要研究突破,也建立了量子计算在生物制药领域实用化的重要里程碑。
论文链接:https://pubs.acs.org/doi/10.1021/acs.jctc.3c00943
分子对接是基于配体受体识别的锁钥模型提出的技术方法,通过计算配体受体之间的空间互补以及能量匹配来寻找其复合物模式,其在药物设计领域应用广泛,可分为刚性对接,半柔性对接以及柔性对接。传统的药物筛选是一个十分昂贵且需要消耗大量资源,一般需要花费数十亿美元,而成功率仅有10%。
近年来,随着功能强大的分子建模工具的发展以及蛋白质小分子复合物解析结构的数目的增长,基于结构的药物设计成为新药开发中广泛使用的路线之一。但传统模型的筛选方式耗时长,并且很难求得最优解,因此在先导化合物筛选中假阳性率较高,增加了药物研发成本。
以下为本篇论文的主要内容:
分子对接被广泛应用于虚拟筛选、先导化合物优化以及分子机制研究中,它通过空间采样来确定配体分子与受体蛋白间的结合姿态以及集合自由能(ΔGbind)。分子对接是药物发现的重要技术手段,分子对接过程的采样步骤是一个经典的NP-Hard 问题,其巨大的搜索空间和计算要求对于传统计算机充满了挑战。
在该研究中,联合研究团队提出了网格点匹配(Grid Point Matching,GPM)和原子特征匹配(Feature Atom Matching,FAM)算法模型,以便可以通过相干光量子计算机求解,从而将分子对接中的采样问题问题编码为QUBO(二次无约束二值优化)模型来加速采样过程。在CASF-2016数据集上测试显示GPM方法已经具备和经典的分子对接方法Glide SP相当的采样能力,在之前的研究中证实,相干光量子计算机的求解速度比传统计算机快1000倍,因此,该研究提出的算法模型可显著提升未来药物虚拟筛选效率和准确率。
图片2:(A)网格点匹配(GPM)和原子特征匹配(FAM)的工作流程。(B)该研究主要构建GPM和FAM方法加速分子对接中的采样过程。
图3:FAM和GPM 模型表现和计算成本(A)三种采样方法Glide SP、GPM、FAM在测试集中的最小RMSD(minimum RMSD, mRMSD)分布。灰色虚线表示好的采样RMSD阈值。GPM代表“网格点匹配”,而FAM代表“原子特征匹配”。(B)FAM与GPM 方法采样得到的pose(红色表示) 与晶体结构中的pose (蓝色表示)比较。
图4:mRMSD与分子质量(A)、量子比特数(B)和离散误差(C)之间的相关性,左上角表示相关性系数(R2)。右下角展示了离散误差定义,它表示所匹配的空间点和晶体结构中的配体坐标的空间距离平均值,GPM代表“网格点匹配”,FAM代表“原子特征匹配”。
图5:基于相干光量子计算机求解的计算成本。(A)FAM 和GPM 方法得到的问题比特数规模比较。当前最大的相干光量子计算机求解规模(~100,000量子比特数)用红色虚线表示。GPM代表“网格点匹配”,FAM代表“原子特征匹配”。(B)配体原子数目和最后求解问题规模比特数的相关性。红色和蓝色数据点分别表示GPM和FAM方法。
具体来讲,该研究提出的两个算法FAM和GPM 将分子对接过程的采样问题转化为配体原子和受体结合口袋的空间格点匹配问题,通过构建QUBO模型并在量子计算机上求得最优解,最后将求得的解转换为空间位置获得pose信息。通过在测试集上的大量验证表明,GPM 方法具有与经典采样方法Glide SP相当的采样能力。团队下一阶段将对FAM与GPM方法进行部署整合,补充打分步骤得到标准化的分子对接流程,并将其应用于类似ZINC的十亿级化合物数据库中执行虚拟筛选过程。
相干光量子计算机的技术特点使其可以构建全连接图,而其他量子计算机只能支持局部图的连接,这大大限制了其应用于实际场景过程。分子对接的取样过程是一个经典的NP-Hard问题,而近期研究表明相干光量子计算机对于求解该类问题具有巨大优势,该研究通过构建FAM和GPM方法并在相干光量子计算机上进行精确求解来解决分子对接中的采样问题。目前相干光量子计算机的最大求解规模远远超过了该算法模型在CASF数据集上应用所需的比特数,同时相干光量子计算机上的采样的运行时间仅以毫秒为单位,相较于经典计算机至少有3个数量级的提升,因此该研究提出的算法模型具有巨大的实际应用价值。
未来,玻色量子将携手更多合作伙伴持续进行“量子计算+生物制药”领域的深入研究技术突破和真机测试场景验证,共同研究量子计算在药物研发领域中的应用,涵盖虚拟筛选、蛋白质结构设计、分子动力学模拟等场景。
关于JCTC
化学理论与计算杂志(Journal Of Chemical Theory And Computation,简写JCTC)创刊于2005年,是一本由AMER CHEMICAL SOC出版的一本化学-物理:原子、分子和化学物理学术刊物,该刊发文范围涵盖物理原子、分子和化学物理等领域,旨在及时、准确、全面地报道国内外物理原子、分子和化学物理工作者在该领域的科学研究等工作中取得的经验、科研成果、技术革新、学术动态等。该刊已入选科学引文索引(SCI)来源期刊,属于国际该领域著名期刊。