Nat. Biotechnol. | 基于RoseTTAFold在序列层面的diffusion设计蛋白

  • A+

分享一篇nature biotechnology上的文章Multistate and functional protein design using RoseTTAFold sequence space diffusion,本文通讯作者是来自华盛顿大学的David Baker教授。其研究方向为蛋白质设计等。

1

蛋白质功能由序列与结构特征决定,设计新的蛋白需要同时决定序列与结构。现在的蛋白质设计方法通常为先生成蛋白骨架再反向设计生成序列。作者认为在序列层面进行设计也同样重要,本文中开发的方法能在序列进行蛋白质设计

2

作者基于RoseTTAFold开发的ProteinGenerator(PG)利用diffusion的策略,将蛋白质序列映射到长度×20的矩阵中,并可固定一些motif不进行设计,随后逐步添加高斯噪音,再训练模型从噪音信号中恢复出最初的序列,另外二级结构限定条件也会传入模型。训练后发现PG产生的蛋白序列经过AlphaFold2预测结构与预期十分相符。在模型每次去噪时引入需要的蛋白质的特征,例如需要的氨基酸,即可设计出特殊的蛋白。例如作者设计了具有较多稀有氨基酸(色氨酸、半胱氨酸、缬氨酸、组氨酸、甲硫氨酸)的蛋白,经过表达与结构验证发现多数蛋白与设计时预期的结构及性质相符。设计特定物理性质(电荷组成、疏水性等)的蛋白也获得了成功。

5

作者也利用了PG设计具有生理活性的蛋白。例如固定酶切割序列与生物活性序列部分,再使用PG设计剩余的部分,可设计不同二级结构以得到较难或较容易被酶切割释放活性肽段的蛋白。另外作者也设计了具有不同状态的蛋白,例如整体有alpha-beta的结构,但酶切后释放的两部分蛋白都是alpha螺旋结构的蛋白。

本文作者:JGG

责任编辑:ZF

文章链接:https://doi.org/10.1038/s41587-024-02395-w

文章引用:10.1038/s41587-024-02395-w



weinxin
我的微信
关注我了解更多内容

发表评论

目前评论: