生物素标记 > 行业应用 > Nat. Methods | quantms:蛋白质组学数据的云分析管道
分享一篇发表在 Nature Methods 上的文章quantms: a cloud-based pipeline for quantitative proteomics enables the reanalysis of public proteomics data,通讯作者是来自EMBL-EBI的Yasset Perez-Riverol研究员,他致力于开发并维护蛋白质组学数据分析和共享平台。
近年来,蛋白质组学领域的公开数据集出现了前所未有的增长,PRIDE数据库中存储的公共数据集已经超过25000份。使用新型的分析工具重新处理旧数据可能产生额外的生物学见解。本文作者介绍了基于云的开源计算管道quantms,用于蛋白质组学数据的大规模并行再分析。 quantms支持三种主要类型的实验数据:DDA-LFQ、TMT标签(DDA-plex)和DIA-LFQ。计算管道从标准质谱数据格式mzML和 蛋白质序列数据库 开始,利用样本和数据关系格式(SDRF)作为工作流,并使用nextflow 工作流引擎 自动分配到多台计算机上并行分析。在分析过程中,quantms使用多种 开源工具 ,包括OpenMS、MSstats、SAGE、DIA-NN等,并使用pickedFDR估计蛋白质的错误发现率。最后,所有子工作流都将结果输出为mzTab标准格式,以便于将结果提交到 ProteomeXchange 。 作者在DDA-LFQ上将quantms与MaxQuant进行了广泛的基准测试,发现quantms可以定量到更多数量的蛋白质。当分析样品数量增加时,quantms的执行速度比MaxQuant快40倍。quantms还定量到了479种此前从未在ProteomicsDB或PaxDB中定量的蛋白质,例如Q86SP6。 作者将quantms用于公共的基于强度的绝对定量(IBAQ)数据集,重新分析了所有结果并进行了差异表达分析,结果整理在https://quantms.org/baseline,可供在线快速检索。 总之,作者描述了quantms计算管道,用于自动分析公共蛋白质组学数据库,并可包含和扩展到新的工作流程中,用于蛋白质组学数据处理。 原文链接:https://www.nature.com/articles/s41592-024-02343-1 文章引用:DOI:10.1038/s41592-024-02343-1
我的微信
关注我了解更多内容
上一篇 【JACS】探索氰菁染料的热截断现象:从理论到实验的全面剖析
下一篇 【ACIE】4'-硫核苷的生物催化核酸酶多样化及衍生的5-乙炔基-4'-硫脲在RNA合成检测中的应用
文章导航
{list_comment type="article" format="Y-m-d H:i:s"}
no cache
Processed in 0.681284 Second.
目前评论: