- A+
分享一篇发表在Nature Methods上的文章,标题为“Predicting glycan structure from tandem mass spectrometry via deep learning”,文章的通讯作者是来自哥德堡大学的Daniel Bojar教授,其课题组致力于聚糖方面的研究。
聚糖修饰是最为丰富的翻译后修饰,然而确定聚糖的结构却充满挑战性。同一分子质量可能对应不同拓扑结构的聚糖。因此在传统的鉴定流程下,研究人员通常需要分离结构异构体,随后使用MS将其碎裂成更小的亚结构加以鉴定。这种流程费时费力,难以大规模进行。本文,作者利用大规模的串联谱图数据集,基于深度学习算法建立了CandyCrunch模型,并实现了90%的聚糖结构预测准确性。
作者从超过2000个糖组学实验中收集得到近50万张带有聚糖注释的LC-MS/MS谱图,聚糖类型涵盖了主要的真核生物聚糖修饰类型。作者引入卷积神经网络以学习MS/MS中的碎裂模式和强度比。它以MS/MS谱图、保留时间、母离子m/z和一些其它实验参数作为输入,以聚糖的预测排名作为输出(包含聚糖的质量和拓扑结构)。为方便使用,作者建立了工作管道以支持原始文件作为输入(如.mzML文件)。
在评估过程中,CandyCrunch能够达到超过90%的拓扑结构预测准确性,并在各种聚糖类型中表现相当。聚类结果表明,模型对聚糖对的预测表示暗示了它们之间的结构相似性。需要指出的是,CandyCrunch本身是一个多分类模型,因此对应零样本预测(预测训练数据集中不存在的聚糖结构)是不可行的。最后,作者借助CandyCrunch开发得到CandyCrumbs用以指认不同离子峰对应的聚糖亚结构。
本文作者:ZF
责任编辑:FTY
文章链接:https://doi.org/10.1038/s41592-024-02314-6
原文引用:DOI: 10.1038/s41592-024-02314-6
目前评论: