前沿｜新药分子发现提速1200倍！MIT的最新AI模型是如何做到的？

在介绍今天的主角之前，想先问大家一个问题：宇宙中存在着数不清的分子，其中有多少具有潜在的类药物特征，可用于药物开发？

答案是：10^60，与之相比，银河系中存在的恒星数量只有10^11颗。

如此庞大的潜在药物分子数量使得研究人员们在开发新药分子时需要更长的时间，因为它远远超出了现有药物设计模型所能计算的范围，这也一直是新药研发中的痛点之一。那么，是否有方法可以改善这个现状呢？

还真有！近期，在一篇即将发表在国际机器学习会议（ICML）杂志上的论文中提到，MIT的研究人员开发了一种被称为“EQUIBIND”的几何深度学习模型，可以极大程度提升发现潜在新药分子的速度，从而降低药物试验失败的概率，并减少新药研发的成本。

在药物开发的最早期，研究人员首先要做的是针对目标蛋白找到那些能够恰当地与其靶点区域结合或“对接”的潜在配体，这些配体可以通过阻止蛋白质发挥功能而实现药用作用。

目前，找到这些候选类药分子的计算过程是这样的：最先进的计算模型依赖于大量候选采样、结合评分、排序和微调等方法来找到配体和蛋白质之间的最佳“匹配模式”。以一个形象的例子来说明，典型的配体与蛋白质结合的方法就像“将一把钥匙插入有许多钥匙孔的锁”，现有的典型计算模型需要将钥匙插入每一个锁孔并对其匹配度逐一进行评分和排序，从而才能选出最佳模型，这将花费大量的时间。

而EQUIBIND内置了能够帮助模型学习分子的基本物理信息的几何推理算法，在遇到此前没有见过的新数据时能够成功地进行归纳，作出更好的预测。也就是说，EQUIBIND无需事先了解锁有哪些锁孔，在一个步骤中就可以直接预测到精确的锁孔位置，这被称为”盲对接”。正是这种方法使EQUIBIND在成功将配体与蛋白质结合方面比现存最快的计算分子对接模型“QUICKVINA2-W”还要快1200倍。

那么EQUIBIND在实际应用中的效果是否如研究者所描述的那般神奇呢？RELAY THERAPEUTICS的首席数据官PAT WALTERS先生对EQUIBIND产生了极大的兴趣，并建议其团队用这一模型模拟一种已经用于治疗肺癌、白血病和胃肠道肿瘤的药物与靶点蛋白的结合。结果是，当大多数传统的对接算法没有成功预测出这一配体/蛋白的相互结合时，EQUIBIND却做到了。

WALTERS先生表示：“EQUIBIND为对接问题（包括姿势预测和结合位点识别）提供了一种独特的解决方案。这种借助数千种公开可用的晶体结构信息的方法将通过全新的方式在计算分子对接模型领域开拓自己的一片天地。”

该论文主要作者麻省理工学院电气工程和计算机科学系的研究生HANNES ST RK先生也表示，已从行业专业人士中收到了大量对EQUIBIND的反馈，将继续改进模型，更好地发挥该计算模型的实际应用。

免责声明：药明康德内容团队专注介绍全球生物医药健康研究进展。本文仅作信息交流之目的，文中观点不代表药明康德立场，亦不代表药明康德支持或反对文中观点。本文也不是治疗方案推荐。如需获得治疗方案指导，请前往正规医院就诊。

版权说明：本文来自药明康德内容团队，欢迎个人转发至朋友圈，谢绝媒体或机构未经授权以任何形式转载至其他平台。转载授权请在「药明康德」微信公众号回复“转载”，获取转载须知。

前沿｜新药分子发现提速1200倍！MIT的最新AI模型是如何做到的？

相关推荐

友情链接