借助深度学习方法从串联质谱数据预测聚糖结构

A+

分享一篇发表在Nature Methods上的文章，标题为“Predicting glycan structure from tandem mass spectrometry via deep learning”，文章的通讯作者是来自哥德堡大学的Daniel Bojar教授，其课题组致力于聚糖方面的研究。

聚糖修饰是最为丰富的翻译后修饰，然而确定聚糖的结构却充满挑战性。同一分子质量可能对应不同拓扑结构的聚糖。因此在传统的鉴定流程下，研究人员通常需要分离结构异构体，随后使用MS将其碎裂成更小的亚结构加以鉴定。这种流程费时费力，难以大规模进行。本文，作者利用大规模的串联谱图数据集，基于深度学习算法建立了CandyCrunch模型，并实现了90%的聚糖结构预测准确性。

作者从超过2000个糖组学实验中收集得到近50万张带有聚糖注释的LC-MS/MS谱图，聚糖类型涵盖了主要的真核生物聚糖修饰类型。作者引入卷积神经网络以学习MS/MS中的碎裂模式和强度比。它以MS/MS谱图、保留时间、母离子m/z和一些其它实验参数作为输入，以聚糖的预测排名作为输出（包含聚糖的质量和拓扑结构）。为方便使用，作者建立了工作管道以支持原始文件作为输入（如.mzML文件）。

在评估过程中，CandyCrunch能够达到超过90%的拓扑结构预测准确性，并在各种聚糖类型中表现相当。聚类结果表明，模型对聚糖对的预测表示暗示了它们之间的结构相似性。需要指出的是，CandyCrunch本身是一个多分类模型，因此对应零样本预测（预测训练数据集中不存在的聚糖结构）是不可行的。最后，作者借助CandyCrunch开发得到CandyCrumbs用以指认不同离子峰对应的聚糖亚结构。

本文作者：ZF

责任编辑：FTY

文章链接：https://doi.org/10.1038/s41592-024-02314-6

原文引用：DOI: 10.1038/s41592-024-02314-6

我的微信

关注我了解更多内容

生物素标记服务网

Nat. Methods | 借助深度学习方法从串联质谱数据预测聚糖结构

发表评论取消回复

目前评论：

微信

发表评论 取消回复

目前评论：

微信

发表评论取消回复