AIDD-人工智能药物设计-人工智能破解酶稳定性定向进化中的多个突变位点高效重组问题

mLife | 人工智能破解酶稳定性定向进化中的多个突变位点高效重组问题

优化酶的热稳定性对于蛋白质科学和工业应用至关重要。目前,通过(半)理性设计和随机诱变方法可以较为准确地设计多个增强酶热稳定性的单点突变。但当组合多个突变时,常常会出现复杂的上位效应,导致组合突变体完全失活。因此,优化酶通常需要进行多轮设计,从而逐步引入单个突变位点,整个过程非常耗时。

Image

近日,上海交通大学生命科学技术学院杨广宇研究员团队的文章“Optimizing enzyme thermostability by combining multiple mutations using protein language model”在mLife 正式上线,上海交通大学自然科学研究院洪亮教授为共通讯。该研究团队提出了一种人工智能辅助的酶热稳定性工程策略,可以高效地组合多个有益单点突变。在肌酸酶的进化实例中,仅经过两轮设计,获得了50个具有卓越热稳定性的组合突变体,设计成功率达100%。经少量实验数据微调后的模型可以从数据集中有效捕捉组合突变体中的上位效应。

主要内容

在该项研究中,作者利用一种AI辅助的酶热稳定性工程策略,通过少量实验数据微调Pro-PRIME模型来预测组合突变体的稳定性和活性。其中,Pro-PRIME模型是基于9600万个宿主细菌菌株的最佳生长温度数据进行训练的蛋白质语言模型,在设计和优化高温酶方面表现优异。微调所使用的初始数据集包括来自肌酸酶的73个低阶突变体的序列-热稳定性和活性数据。然后使用微调后的模型来预测来自18个单点突变体的所有可能突变体的热稳定性和活性。主要目标是在保持至少60%的相对活性(相对于野生型),同时增强热稳定性的突变体(图1)。

Image

图1.基于蛋白质语言模型组合突变的策略。整个过程包括四个步骤:(1) 收集数据,(2) 蛋白质语言模型的微调,(3) 在组合序列空间中预测所有突变体,以及 (4) 验证所选突变体。红色虚线是第二轮模型微调。

为了进一步提高预测精度,研究人员将第一轮预测的实验表征结果整合到数据集中,并进行了第二轮微调、预测和选择。两轮微调和预测过程仅用了两周时间,共设计50个组合突变体,实现了100%的热稳定性设计成功率(图2)。

Image

图2.组合突变体的热稳定性和相对活性数据。黄色圆圈是指相对活性数据。条形图是指突变体的热稳定性数据,其中蓝色、青色和橙色分别指初始数据集、第一轮和第二轮预测的数据集

其中,最佳突变体13M4包含13个突变位点,与野生型相比,它的活性基本保持不变,在Tm上提高了10.19°C,在58°C下的半衰期增加了约655倍。

在回顾数据时发现,即使某些突变在空间上相距甚远,也存在复杂的高阶上位性效应。例如K351E单点突变表现为阴性突变,但其在高阶突变体中却表现为阳性突变。此外,单点突变D17V和I149V存在明显的协同作用。结果表明,使用高质量的实验数据微调模型的参数,可以帮助模型准确捕获数据集中的已存在的上位效应,并用于后续高阶组合突变体的适应度预测。

动态相关矩阵分析的结果表明,影响稳定性的突变不仅影响其局部环境的动力学,在某些情况下,还影响远端结构区域的动力学(图3)。该项技术可以作为未来研究或设计上位效应的一个有效工具。

Image

图3.突变之间的上位效应分析。K351E (A) 和 D17V/I149V (B) 在 Tm 值上的上位效应。蓝色表示负效应,橙色表示正效应。© 肌酸酶野生型和对应突变体的动态互相关矩阵图。相关系数 (Cij) 用不同颜色表示。突变位点用红色箭头标出,突变周围显著的动力学相关区域用红色框突出显示。(D) 突变体结构与野生型结构比较的的标准化 RMSF变化。

主要亮点

  • 本研究提出的人工智能辅助的酶热稳定性工程策略,可以高效地组合多个有益单点突变。仅通过两轮设计,共表征50个组合突变体,稳定性设计成功率达到100%。与野生型相比,最佳突变体13M4的Tm提升了10.19℃,58℃半衰期增加655倍,同时催化活性保持不变。
  • 通过利用少量但高质量的实验数据微调蛋白质语言模型参数,微调后的模型可以准确捕捉初始数据集中的上位效应,包括符号和协同上位效应。这表面,实验数据对于提升模型对高阶组合突变体的预测性能至关重要。
  • 利用动态相关矩阵分析,该研究揭示了长程上位效应的机制,显示了远距离突变之间在动力学上的相关性,从而共同影响突变体的稳定性。
  • 通过采用这种策略,研究团队仅通过两轮设计,全面探索了组合序列空间中超26万种可能的突变体,最佳突变体包含13个突变,大大缩短了传统方法中所需要的进化轮次,提升了蛋白质工程的效率。5.研究强调了将来自蛋白质工程的数据与先进的人工智能模型相结合,可以进一步提升模型的预测性能,从而提升蛋白质工程效率。该策略可以推广应用至多种关键酶分子的进化任务中。

参考资料

Bian, Jiahao, Pan Tan, Ting Nie, Liang Hong, and Guang‐Yu Yang. “Optimizing enzyme thermostability by combining multiple mutations using protein language model.” mLife (2024).

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/66692.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt仿音乐播放器:媒体类

一、铺垫 我暂时只会音频系列的操作&#xff0c;我只能演示音频部分&#xff1b;但是QMediaPlayer是一个可以播放视频、音频的类&#xff1b;请同学们细读官方文档&#xff1b; 二、头文件 #include<QMediaPlayer> 头文件 #include<QMediaPlaylist> 三、演…

java随机数Random类

在 Java 中&#xff0c;Random 类用于生成随机数。它是 java.util 包的一部分&#xff0c;可以生成不同类型的随机数&#xff0c;例如整数、浮点数、布尔值等。Random 类的实例可以用来产生各种随机数据&#xff0c;广泛应用于游戏、测试、加密、数据模拟等场景。 1. 创建 Ran…

解决cursor50次使用限制问题并恢复账号次数

视频内容&#xff1a; 在这个视频教程中&#xff0c;我们将演示如何解决科sir软件50次使用限制的问题&#xff0c;具体步骤包括删除和注销账号、重新登录并刷新次数。教程详细展示了如何使用官网操作将账号的剩余次数恢复到250次&#xff0c;并进行软件功能测试。通过简单的操…

js监测页面可见性

监测切换页面 检测页面的可见性状态document.visibilityState:document.hiddenvisibilitychange 事件 js 检测页面切换至别的应用 检测页面的可见性状态 在JavaScript中&#xff0c;你可以使用Page Visibility API来检测页面的可见性状态。这个API提供了一组接口&#xff0c;允…

微信小程序开发设置支持scss文件

在微信小程序开发中&#xff0c;默认是不支持scss文件的&#xff0c;创建文件的时候&#xff0c;css文件默认创建的是wxss后缀结尾的&#xff0c;但是用习惯了scss的怎么办呢&#xff1f; 首先找到project.config.json文件&#xff0c;打开文件在setting下设置useCompilerPlug…

Matlab Steger提取条纹中心(非极大值抑制)

文章目录 一、简介二、实现代码三、实现效果一、简介 由于在确定条纹的ROI区域之后,会计算出多个条纹中心坐标,因此这里就需要对其进行则优选择,毕竟条纹只有一条,这最简单的方式就是使用非极大值抑制,即选择每一行/列最好的条纹中心。 二、实现代码 Hessian2D.m function…

Apache Hadoop YARN框架概述

一、YARN产生和发展简史 1.1背景 数据、程序、运算资源&#xff08;内存、CPU&#xff09;三者组在一起&#xff0c;才能完成数据的计算处理过程。在单机环境下&#xff0c;三者之间协调配合不是太大问题。为了应对海量数据的处理场景&#xff0c;Hadoop软件出现并提供了分布…

计网C1C2C3答案自用

Chapter 1 Computer Network and the Internet Review Questions Solution R1. What is the difference between a host and end system? List several different types of end system. Is a Web server an end system? There is no difference between a host and an end …

江科大STM32入门——UART通信笔记总结

wx&#xff1a;嵌入式工程师成长日记 1、简介 简单双向串口通信有两根通信线(发送端TX和接收端RX)TX与RX要交叉连接当只需单向的数据传输时&#xff0c;可以只接一根通信线当电平标准不一致时&#xff0c;需要加电平转换芯片 传输模式&#xff1a;全双工&#xff1b;时钟&…

KG-CoT:基于知识图谱的大语言模型问答的思维链提示

一些符号定义 知识图谱实体数量&#xff1a; n n n 知识图谱中关系类型数量&#xff1a; m m m 三元组矩阵&#xff1a; M ∈ { 0 , 1 } n n m \textbf{M} \in \{0, 1\}^{n \times n \times m} M∈{0,1}nnm&#xff0c; M i j k 1 M_{ij}^k 1 Mijk​1则说明实体 i i i和实…

面试加分项:Android Framework PMS 全面概述和知识要点

在Android面试时,懂得越多越深android framework的知识,越为自己加分。 目录 第一章:PMS 基础知识 1.1 PMS 定义与工作原理 1.2 PMS 的主要任务 1.3 PMS 与相关组件的交互 第二章:PMS 的核心功能 2.1 应用安装与卸载机制 2.2 应用更新与版本管理 2.3 组件管理 第…

【简单了解一下深度学习】

深度学习是机器学习的一个子领域&#xff0c;它主要利用多层神经网络来学习数据的高层特征和抽象表示。以下是关于深度学习的一些基础知识和概念&#xff1a; 基本概念 神经网络&#xff1a;深度学习的核心是神经网络&#xff0c;它由多个层次的神经元组成。每个神经元接收输…

超完整Docker学习记录,Docker常用命令详解

前言 关于国内拉取不到docker镜像的问题&#xff0c;可以利用Github Action将需要的镜像转存到阿里云私有仓库&#xff0c;然后再通过阿里云私有仓库去拉取就可以了。 参考项目地址&#xff1a;使用Github Action将国外的Docker镜像转存到阿里云私有仓库 一、Docker简介 Do…

AIGC 新浪潮|Story CN meetups 将于 1 月 10-14 日举办!

随着 Web3 行业发展进入全新阶段&#xff0c;与生成式人工智能&#xff08;AIGC&#xff09;技术融合正在创造潜力新星项目。也是目前的互联网生态下&#xff0c;任何普通民众都有权利创作高质量的音乐、艺术、散文和视频内容&#xff0c;带来了用户生成内容&#xff08;UGC&am…

Python基于YOLOv8和OpenCV实现车道线和车辆检测

使用YOLOv8&#xff08;You Only Look Once&#xff09;和OpenCV实现车道线和车辆检测&#xff0c;目标是创建一个可以检测道路上的车道并识别车辆的系统&#xff0c;并估计它们与摄像头的距离。该项目结合了计算机视觉技术和深度学习物体检测。 1、系统主要功能 车道检测&am…

设计模式学习笔记——结构型模式

文章目录 适配器模式 Adapter适用场景UML 桥接模式 Bridge适用场景UML 组合模式 Composite装饰模式 Decorator外观模式 Facade享元模式 Flyweight代理模式 Proxy 适配器模式 Adapter 适用场景 希望使用某个类&#xff0c; 但是其接口与其他代码不兼容时&#xff0c; 可以使用…

rust如何在类中保存一个闭包,它可以捕获类自己?

首先这个为什么在 Rust 中这么难实现&#xff1f; 我们得承认一个残酷的现实&#xff1a;Rust 不是 C。在 C 中&#xff0c;可以随心所欲地使用引用&#xff0c;编译器不会过多干涉。但在 Rust 中&#xff0c;编译器会像严厉的监管者一样盯着我们的每一个动作&#xff0c;生怕…

黑马跟学.苍穹外卖.Day04

黑马跟学.苍穹外卖.Day04 苍穹外卖-day04课程内容1. Redis入门1.1 Redis简介1.2 Redis下载与安装1.2.1 Redis下载1.2.2 Redis安装 1.3 Redis服务启动与停止1.3.1 服务启动命令1.3.2 客户端连接命令1.3.3 修改Redis配置文件1.3.4 Redis客户端图形工具 2. Redis数据类型2.1 五种常…

SOLID原则学习,开闭原则

文章目录 1. 定义2. 开闭原则的详细解释3. 实现开闭原则的方法4. 总结 1. 定义 开闭原则&#xff08;Open-Closed Principle&#xff0c;OCP&#xff09;是面向对象设计中的五大原则&#xff08;SOLID&#xff09;之一&#xff0c;由Bertrand Meyer提出。开闭原则的核心思想是…

filebeat、kafka

elk的架构 es数据库&#xff1a;非关系型数据库&#xff0c;json格式 logstash&#xff1a;收集日志 kibana&#xff1a;图形化的工具 ↓ 以上三种结合起来即为日志收集系统 filebeat 作用&#xff1a;filebeat是一款轻量级的日志收集工具&#xff0c;不依赖java环境&…