欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://spike.blog.csdn.net/article/details/135974780
论文:Predicting heteropolymer interactions: demixing and hypermixing of disordered protein sequences
- 预测异聚物相互作用:无序蛋白质序列的分离和混合
本文构建了一个 有效的异聚合物相互作用的理论,通过,将其拟合到对人类蛋白质无序区域序列的 200 多个样本进行的分子动力学模拟结果。两个异聚合物之间的氨基酸对相互作用之和,可以定性地很好地 预测 Boyle 温度,这可以通过二聚体对近似得到定量的改进,其中包含了序列中相邻氨基酸的效应改进的理论,结合了一个捕捉不同序列之间有效相互作用强度的度量的发现,使得能够在多组分模拟中选择最多三个无序区域序列,彼此分离,以及生成与给定序列分离的人工序列。理论指出了一个通用的 序列设计策略,可以实现分离或超混合,这要归功于确定的相互作用空间的低维性质。由于相互作用空间中的几何论证,本文发现,能够彼此分离的不同序列的数量是强烈受限的,无论选择的粗粒化模型如何。总之,本文构建了一种估计异聚合物之间有效相互作用的方法的理论基础,这可以用于预测相分离性质以及无序蛋白质的定位和功能的分配规则。
本文提出的度量方法 (Effective Virial Coefficient) 是基于两个异质聚合物序列之间的有效相互作用强度,用一个标量来表示。
- 这个标量可以通过计算两个序列的所有氨基酸对之间的相互作用之和,然后减去序列内部的相互作用之和,再除以序列的长度得到。
- 这个标量越大,表示两个序列之间的相互作用越强,越倾向于混合;反之,越小,表示两个序列之间的相互作用越弱,越倾向于分离。
本文还提出了一种基于梯度下降的优化算法,可以根据给定的分离或混合目标,选择或生成具有期望相互作用强度的序列。
预测 波义尔(Boyle) 温度:
Boyle 温度是指一种温度,当气体达到这个温度时,它的第二维里系数为零,也就是说,气体分子之间的吸引力和排斥力达到平衡。在这个温度下,气体更接近理想气体的状态,不受压力的影响。Boyle 温度是由气体的性质决定的,不同的气体有不同的 Boyle 温度。
预测临界温度 (Critical Temperature):
Critical Temperature 是指一种温度,当物质达到这个温度时,它的液态和气态之间没有明显的界限,也就是说,物质处于超临界流体的状态。在这个温度以上,物质无法被压缩成液态,无论施加多大的压力。Critical Temperature 是由物质的性质决定的,不同的物质有不同的 Critical Temperature。
两组件(two-component) 无序区域聚合物的 超混合(hypermixing) 和 分离(demixing) 的预测:
B-RDP:是一种有效异组分维里系数,是由两个不同的无序区域聚合物(IDR)组成的混合物的维里系数。可以用来判断两个 IDR 是否会发生相分离,即是否会在一定的温度和浓度下形成不同的相域。如果 B-RDP 为负,那么两个 IDR 会发生相分离,如果为正,那么两个 IDR 会发生超混合,即会比随机混合更均匀地分布。
HPS-Tesei、HPS-Dignon、Mpipi 是3种用于研究生物分子相分离的粗粒化模型,都考虑了蛋白质序列的影响,特点和区别如下:
- HPS-Tesei 是由 Tesei 等人在 2021 年提出的一种基于物理的粗粒化模型,使用不同的氨基酸水合力表(HPS),并且引入了一个可调节的参数 α \alpha α 来描述不同氨基酸之间的相互作用强度。该模型可以很好地预测蛋白质的半径回转和临界温度,以及不同序列之间的相分离行为。
- HPS-Dignon 是由 Dignon 等人在 2018 年提出的一种基于数据的粗粒化模型,使用不同的氨基酸水合力表(HPS),并且利用了生物信息学数据来确定不同氨基酸之间的相互作用强度。该模型可以较好地预测蛋白质的半径回转,但是对于临界温度和相分离行为的预测有一定的偏差。
- Mpipi 是由 Joseph 等人在 2021 年提出的一种多尺度粗粒化模型,使用不同的氨基酸水合力表(M3),并且结合了原子模拟和生物信息学数据来考虑 π − π \pi-\pi π−π 和杂化阳离子- π / π − π \pi/\pi-\pi π/π−π 相互作用,以及精氨酸和赖氨酸之间的差异。该模型可以几乎定量地描述蛋白质临界温度随氨基酸序列的变化,以及蛋白质-RNA 相互作用和多相行为。
GitHub:https://github.com/adachi24/virialcoeff/blob/main/example.ipynb
We provide calculation examples of the second virial coefficient, Boyle and critical temperatures, etc., using the monomer pair (or rescaled dimer pair) approximation.
我们使用单体对(或重新缩放的二聚体对)近似,给出了第二节流系数、波义尔温度和临界温度等的计算示例。
- Choose the model of interactions between amino acid residues.
- 选择氨基酸残基之间的相互作用模型,支持 HPS-Tesei、HPS-Dignon、Mpipi 等3个模型。
- Calculate the second virial coefficient for sample sequence and temperature.
- 计算样本序列和温度的第二节流系数,即序列与序列之间的值。
- Calculate the Boyle temperature for a sample sequence.
- 计算样本序列的波义尔温度,即单序列的值
- Calculate the critical temperature for a sample sequence.
- 计算样本序列的临界温度,即单序列的值
- Calculate the effective virial coefficient for sample sequence pair and temperature.
- 计算样本序列对和温度的有效节流系数,即序列与序列之间的值。
- Calculate and plot the virial coefficient matrix for amino acid monomers (or dimers).
- 计算并绘制氨基酸单体(或二聚体)的节流系数矩阵