Nat. Mach. Intell. | 拓扑实现的蛋白-配体相互作用预测transformer

  • A+
分享一篇nature machine intelligence上的文章Multiscale topology-enabled structure-to-sequence transformer for protein–ligand interaction predictions,本文通讯作者是来自密歇根州立大学的Guo-Wei Wei教授与来自重庆理工大学的刘健教授。Guo-Wei Wei教授的研究方向为生命科学的数学基础等。


1
传统的计算辅助药物设计,如分子对接等通常准确性较低,在大尺度筛选上耗费计算量大,可能会遗漏掉非常规的位点。深度学习有潜力用于药物设计,但需要大量的标记数据。例如ChatGPT的自监督学习模型则可以一定程度解决药物发现中标记数据少的问题。但这些自然语言处理的模型无法利用结构化学的信息。作者开发了TopoFormer这个模型,可以将3D的蛋白-配体复合物转化为一维的拓扑序列,进而传递给transformer进行学习与预测。
8
TopoFormer先提取配体周围一定距离内的蛋白质原子,接着将3D分子结构转化为拓扑序列,并形成包含物理、化学、生物相互作用的向量序列。TopoFomer首先使用自监督学习用未标记的蛋白-配体复合物进行预训练,使用encoder-decoder结构重新构建拓扑序列。之后使用有标签的复合物数据进行微调以完成打分、排序、对接等任务。作者在多个数据集上进行了测试,TopoFormer在打分、排序、对接、筛选任务上均有很好的表现。
本文作者:JGG
责任编辑:ZF
文章链接:https://www.nature.com/articles/s42256-024-00855-1
文章引用:10.1038/s42256-024-00855-1




weinxin
我的微信
关注我了解更多内容

发表评论

目前评论: