Nat. Methods | quantms:蛋白质组学数据的云分析管道

  • A+
分享一篇发表在Nature Methods上的文章quantms: a cloud-based pipeline for quantitative proteomics enables the reanalysis of public proteomics data,通讯作者是来自EMBL-EBI的Yasset Perez-Riverol研究员,他致力于开发并维护蛋白质组学数据分析和共享平台。


1
近年来,蛋白质组学领域的公开数据集出现了前所未有的增长,PRIDE数据库中存储的公共数据集已经超过25000份。使用新型的分析工具重新处理旧数据可能产生额外的生物学见解。本文作者介绍了基于云的开源计算管道quantms,用于蛋白质组学数据的大规模并行再分析。
2
quantms支持三种主要类型的实验数据:DDA-LFQ、TMT标签(DDA-plex)和DIA-LFQ。计算管道从标准质谱数据格式mzML和蛋白质序列数据库开始,利用样本和数据关系格式(SDRF)作为工作流,并使用nextflow工作流引擎自动分配到多台计算机上并行分析。在分析过程中,quantms使用多种开源工具,包括OpenMS、MSstats、SAGE、DIA-NN等,并使用pickedFDR估计蛋白质的错误发现率。最后,所有子工作流都将结果输出为mzTab标准格式,以便于将结果提交到ProteomeXchange
7
作者在DDA-LFQ上将quantms与MaxQuant进行了广泛的基准测试,发现quantms可以定量到更多数量的蛋白质。当分析样品数量增加时,quantms的执行速度比MaxQuant快40倍。quantms还定量到了479种此前从未在ProteomicsDB或PaxDB中定量的蛋白质,例如Q86SP6。
作者将quantms用于公共的基于强度的绝对定量(IBAQ)数据集,重新分析了所有结果并进行了差异表达分析,结果整理在https://quantms.org/baseline,可供在线快速检索。
总之,作者描述了quantms计算管道,用于自动分析公共蛋白质组学数据库,并可包含和扩展到新的工作流程中,用于蛋白质组学数据处理。
本文作者:WFZ
责任编辑:ZF
原文链接:https://www.nature.com/articles/s41592-024-02343-1
文章引用:DOI:10.1038/s41592-024-02343-1




weinxin
我的微信
关注我了解更多内容

发表评论

目前评论: