分享一篇发表在Nature Communications上的文章,文章的题目是“Identification of modified peptodes using localization-aware open search”,文章的通讯作者是来自密歇根大学的 Alexey I. Nesvizhskii教授。Alexey团队开发的以高速搜索引擎MSfragger为核心的FragPipe软件,在蛋白质组学的数据分析中具有强大的应用。在这篇工作中,作者改进了MSFragger中的“open search”方法,使得未知修饰可以被定位到具体的氨基酸,同时提高了检出效率。对多肽上存在的翻译后修饰进行质谱鉴定是一项关键但具有挑战性的工作,作者在之前的工作中通过改进片段离子索引方法和超快的数据库搜索引擎MSFragger,使高效的“开放式”搜索策略成为可能(即可以允许匹配肽与母离子存在较大质量差异)。然而该方法的缺点是并没有考虑未知质量影响的离子质量,使得无法定位未知修饰,也影响了鉴定的灵敏度。本文中作者进一步改进了索引方法,作者引入了移位离子(Shifted ion)的概念来描述具有未知修饰的碎片离子,并将不含未知修饰的碎片离子称为正常片段离子(Regular ion)。谱图中的相应的峰分别称为移位峰和规则峰。将不带移位离子指数的 MSFragger 称为 MSFragger 常规操作系统,并将具有移位离子指数的 MSFragger 称为 MSFragger LOS。他们发现计算未修饰肽质量与正常片段离子的质量差,与修饰肽质量和对应带修饰质量片段离子(Shifted ion)质量差相等,通过对这一质量进行索引(Shifted ion index),并与传统的Regular ion index一起进行谱图匹配,就可以指认所有(带修饰与不带修饰)的谱峰,并用于打分,在计算量没有显著增加的情况下大大提高鉴定灵敏度。图1a是以b离子为例产生和使用移位离子指数,从计算的肽质量数中减去理论谱图(橙色)中的每个片段峰,以产生偏移的离子指数。实验光谱(蓝色)中的每个片段峰同样从观察到的前体质量中减去,产生减法处理的光谱。然后将减法处理的光谱与移位的离子指数进行比较,并匹配包含修饰(星形)的片段(中间虚线)。由于峰匹配的质量高度依赖于母离子和片段质量数的精度,因此作者引入了快速的质量校准和参数优化来改善峰匹配。对于每种PSM(peptide- spectrum matches),作者通过比较观察到的质量数与理论质量数来计算相对母离子质量偏差。图2a显示了母离子质量数与八种馏分之一在m/z和保留时间内的偏差。其他七个部分也有类似的结果。在每个图中,平滑的移动平均线(深灰色)显示了母离子质量数在m/z和保留时间上的偏差趋势。左列中的图显示未经质量校准的原始数据,其中观察到的质量与理论值明显偏差。在右列中,显示数据是在通过MSFragger校准后显示的。对几种不同矫正方法进行测试,作者发现MaxQuant,mzRefiner,MetaMorpheus和 MSFragger都可以减小母离子的质量差,但MSFragger和MaxQuant表现最好且误差在全时间段都分布均匀。作者还通过比较每个匹配片段峰的观测值和计算质量数来计算相对片段质量数偏差。如图2b所示,原始数据(左列)显示观察到的片段质量存在较大偏差,并且相对于m / z呈非线性趋势。通过MSFragger(右列)校准后,质量误差得到纠正,大部分非线性被消除。此外,作者还使用了三个Orbitrap数据库和一个Bruker timsTOF PASEF数据集来测试参数优化性能,将片段匹配允许的误差和Top N的组合进行单独的搜索,并将结果与启用了参数优化的搜索进行比较。图2c黑框显示,自动参数优化程序在所有情况下都能成功找到导致高灵敏度的设置。平均而言,质量校准与参数优化相结合的相对增益(即差除以基准值)为10%。进一步作者展示新的策略在翻译后修饰的鉴定上准确性和灵敏度都大大提高。如图3a所示,为了研究每种工具正确识别磷酸化肽的能力,作者将每种谱图鉴定的序列与高置信度列表进行了比较,将每种谱图分为三种类型:(1)鉴定出相同或相似的序列(绿色);(2)鉴定出不同的肽段,但在高置信度列表中的另一次扫描中发现(黄色);(3)鉴定出不同的肽段,并在高置信度PSMs列表中没有发现该序列(红色)。MSFragger LOS 识别的 PSM 比常规操作系统多 ~19%,因此在所有工具中识别的 PSM 数量最多。在与其它优秀的方案(pFind3,MetaMorpheus,TagGraph)进行比较时,MSFragger LOS(localization-aware open search)整体表现与其它软件一样出色(有时略好),而速度明显具有优势(图3b)。作者使用了来自HEK293细胞裂解物的数据库证明可定位开放搜索可以找到更多的PTM。与MSFragger相比,MSFragger LOS从几乎所有的Δm中发现了更多的PSM。具有氧化、甲基化、甲酰化、脱水和氨乙基苯磺酰化的PSM增加了50%以上,而磷酸化PSM的增幅较小,可能与其不稳定的性质有关(因此含有修饰的片段很少)。由于搜索空间大、计算分析时间长和错误匹配率增加,在 MS/MS 谱图中搜索修饰肽一直具有挑战性。在本文中作者进一步改进了搜索策略,引入了移位离子指数和可定位的开放搜索策略,从而显著增加了鉴定的修饰肽的数量。此外,作者还对 MSFragger 软件进行了其他改进,例如质量校准和快速参数优化。总之,MSFragger LOS策略为蛋白质组学水平的肽段修饰鉴定提供了一个可行的方案。原文链接:https://www.nature.com/articles/s41467-020-17921-y原文引用:https://doi.org/10.1038/s41467-020-17921-y
目前评论: