推广

ICLR 2022 | 能量启发的分子构象优化

iseeyu2年前 (2024-11-30)推广106

本文介绍了关嘉麒&Wesley Wei Qian团队发表在ICLR 2022的文章《ENERGY-INSPIRED MOLECULAR CONFORMATION OPTIMIZATION》。作者研究如何预测分子的空间原子排列或分子构象,提出了一个神经能量最小化的概念。他将预测问题归结为一个展开的优化过程,并将神经网络参数化来学习隐式构象能量场的梯度空间。假设底层势能有不同的函数表达式,作者可以重新解释并统一许多现有的模型,还可以有原则地推导出SE(3)-equivariant神经网络的新变体。




1.介绍

3D分子构象是决定分子很多物理化学和生物特征的最重要的特征之一。在考虑化学反应和相互作用的空间约束或电子效应时,分子的3D电荷分布和物理形状至关重要。因此,分子构象被广泛应用在定量结构活性关系(QSAR)评估和药物发现中。随着对虚拟药物筛选和de novo 药物设计的关注度日益提高,目前更需要快速准确地预测分子构象以得到其3D 几何特征。


最近,深度学习技术被引入来解决并且取得了理想的结果。例如,生成模型被提出首先生成原子对的配对距离,然后从这类矩阵中推导出构象体。因为3D结构是间接生成的,所以第二步中对于估计距离的误差很敏感,可能需要额外的模型来编码冗余量。与此同时,出现了许多SE(3)-equivariant网络来处理3D旋转对称的输入,使其能够直接三维笛卡尔坐标。最近这类模型最成功的应用是用于蛋白质结构预测的AlphaFold系统。尽管有许多好处,然而现有的SE(3)-equivariant网络要么来自需要昂贵系数计算的复杂数学理论,要么是基于消息传递直觉的启发式计算。


作者提出了一种全新的方法,将分子构象预测展开为固定数量的优化步骤,其中神经网络被参数化来学习隐式构象能量场的梯度空间。在此方法中,该模型可以将一个给定的构象体向更稳定和能量优先的状态去优化。作者不仅可以重新解释现有模型,而且可以从构象能量函数的假设中推导出SE(3)-equivariant模型的新变体,使得模型的结构与其物理假设保持一致。通过实验发现,这些新变体与其它SE(3)等模型相比,在构象体优化方面的性能表现更好。此外,作者提出的优化方法也适用于构象体的生成,可以生成多样且准确的构象体。


此论文的主要贡献包括:

  • 将构象体预测问题转化成一个多步骤展开的优化过程,其中学习了隐式构象能量场的梯度空间。
  • 提出了一个全新的框架,明确地将底层能量函数与SE(3)-equivariant神经网络联系起来,这样就可以推导出与物理假设一致的新模型,或者从能量的角度解释一些现有的模型。
  • 展现了在优化和生成任务里,分子构象预测的具有竞争性经验性的表现。

2.方法




分子构象代表了原子的3D排列,与构象能量联系紧密。因为分子构象的每个平衡点都可以被视为势能表面的局部最小值。因此可以通过梯度下降找到这些稳定结构,因为这是一个能量最小化的过程。具体地,给定一个特定的能量函数E,可以通过梯度下降更新3D直角坐标来优化构象体X,使得E最小化:



其中γ是学习率,我们可以观察到



为一个稳定结构。因此,如果能量函数E(X|)是完全表征的且对X可微,我们可以通过迭代应用梯度下降来更新,很容易地从初始构象体中找到一个稳定的分子构象。不幸的是,情况通常不是这样。


作者利用神经网络的计算能力,让它直接从中学习梯度场,而不是手工设计能量函数及其梯度。一旦网络被训练,就可以用该模型展开优化,并执行上述优化的神经版本,其中公式1中的梯度项E不是来自显式能量函数,而是由神经网络估计的。





对于所有∈X,∈和∈,其中φ是估计各自梯度场的神经网络,神经网络的精确参数将取决于能量函数。在这项工作中,为了简单起见,作者将视为一个常数表示,因此它在作者的模型中没有更新。


3.结果

3.1分子构象优化




如表1所示,所有的优化模型都可以改进由RDKit+MMFF估计的初始构象。从新框架中得到的新变体也明显优于两个最先进的SE(3)-equivariant模型。



如图2所示,作者的模型可以产生既实际而且能量稳定的结构体。在没有刻意设计的情况下,作者的模型预测的构象体也能很好地捕捉到基本成分的结构(例如,苯在同一平面上形成一个环)。对于初始构象体(RDKit+MMFF)没有以最稳定方式折叠/旋转的大分子,作者的模型也可以将构象体优化到稳定状态后来作为参考构象体。






如图3所示,可以发现由作者的模型预测的构象计算出的HOMO-LUMO间隙与参考构象吻合良好,而参考构象与力场优化构象之间的相关性却要低得多。在第二项研究中,作者针对QM9基准,用参考或预测的构象训练了一个标准的神经网络模型SchNet。如表2所示,用作者预测的构象体训练的模型优于其它预测构象体训练的模型。


3.2分子构象生成





如表3所示,作者的模型在所有的指标上的表现都很有竞争力,特别是在更具挑战性的GEOM-QM9药物数据集上,本模型超过了所有的机器学习方法。这些结果表明,作者的优化公式可以很容易地到多样化且准确的构象集合的生成设置中。


4.总结和讨论

本文提出了一种新的分子构象预测公式,通过参数化一个SE(3)-equivariant网络来模拟构象能量景观的梯度场。通过将SE(3)-equivariant模型与潜在的能量函数联系起来,作者还发现了一个新的视角,主要推导出SE(3)-equivariant模型的新变体,该模型与物理系统的一组明确的基本假设相一致。通过大量的实验,作者证明了所提出的方法能够优化一个给定的构象到其最能量稳定的状态,并有效地生成一个不同的和准确的构象的集合。这种受能量启发的视角也为思考SE(3)-equivariant模型提供了一个新的方向,并期望社区通过更适合其应用的能量假设得出更有趣的变体。


对于未来的工作,作者的兴趣也超出了小分子的构象,因为作者可以进一步扩大系统规模来模拟更大的生物分子系统,如蛋白质-配体复合物。此外,探索像DEQ这样对平衡状态直接建模的模型也是很有趣的。由于作者的训练目标对手性是盲目的,系统将需要在模型生成后推断手性,而作者能否构建内置手性的系统仍然是一个有趣的问题。最后,由于具有快速生成高质量分子构象集成的能力,作者也对使用构象集成的分子机器学习很感兴趣。

参考资料

Guan, J., Qian, W.W., Ma, W.Y., Ma, J. and Peng, J., 2021, September. Neural Energy Minimization for Molecular Conformation Optimization. In International Conference on Learning Representations.

代码

https://github.com/guanjq/confopt_official

扫描二维码推送至手机访问。

版权声明:本文由西安泽虎代运营发布,如需转载请注明出处。

转载请注明出处https://www.0291.com.cn/post/136091.html

相关文章

从网站排名到最终订单,需要这三次转化。

从网站排名到最终订单,需要这三次转化。

一、排名带来流量 首先我们要清楚我们的网站的作用到底在哪里? 展示型网站或者营销型网站 展示类网站:只是作为展示,后期没有任何投入,基本也没用询盘和排名,只有你发给你的客户,有可能会打开看一下,不期待带来任何效益。 营销类网站:不仅仅是展示作用,还需要让潜在的客户找到你,在搜索引|擎上获...

安卓应用市场春节放假安排,CP们注意了!

安卓应用市场春节放假安排,CP们注意了!

  不少开发者关心各 渠道春节期间的放假安排,青瓜传媒小编询问了各大市场联系人,获取了 应用宝、 阿里、百度等12家 应用市场春节放假安排的第一手资料,分享给大家。 俗话说“过了腊八就是年”眼见年关将至,小编这里先给大家拜个早年。祝大家新年快乐。 &n...

404。

404。

404不是基础也是一个共同的问题。我相信互联网用户已经遇到了这种情况。当我们打开一个网页时,会有一个提示:404没有找到,看到这个网页很糟糕。它是引导读者继续浏览网站的其他页面或什么也不做。这是一个观察网站体验的好方法。用户体验最终关系到我们网站的优化,所以站长有必要掌握404相关知识。 首先了解...

拼多多观看视频赚钱:轻轻松松赚取零花钱的新方法

拼多多观看视频赚钱:轻轻松松赚取零花钱的新方法

随着互联网的发展,各种赚钱方式层出不穷。而拼多多观看视频赚钱,已经成为了很多人轻轻松松赚取零花钱的新方法。那么,这个方法究竟如何操作?让我们一起来揭秘吧! 我们要明白,拼多多观看视频赚钱,并不是说你只要看视频就能赚钱,而是需要你完成一定的任务,比如观看时长、完成互动等,才能获得相应的...

新浪微博刷粉分享。

新浪微博刷粉分享。

随着博客使用率的下降,微博渐渐的取代了博客的地位,现在几乎每个明星或者名人都有自己都新浪微博,可见新浪微博越来越受大家欢迎。那么作为企业推广,如何利用新浪微博刷粉呢。 1. 签名档的使用 新浪微博的工具栏里面为用户提供了签名档的代码,这个一定要好好利用,这是一个一劳永逸的方法(微博首页的右上角有...

搜索引擎优化之如何选词。

搜索引擎优化之如何选词。

经常能看到一些网站出现奇葩的关键词,甚至你会去想这是怎么做到的?选择关键词主要有以下5点需要注意: 1、不要选择生活常用词和形容词 曾经一个网站的关键词是“爱生活、爱时尚”,这两关键词是一个状态,并不能说明一个具体的事物。比如“SEO”是说明一个具体的事物所以我们能通过搜索SEO查找相...

现在,非常期待与您的又一次邂逅

我们努力让每一部企业宣传片和抖音短视频成为商业大片