J. Am. Soc. Mass Spec.|使用DEPC标记质谱以考虑相邻残基的疏水性可改进 Rosetta 对蛋白结构的预测

  • 142
  • A+
介绍的是一篇发表在Journal of the American Society for Mass Spectrometry上的文章,Accounting for Neighboring Residue Hydrophobicity in Diethylpyrocarbonate Labeling Mass Spectrometry Improves Rosetta Protein Structure Prediction 1,文章通讯作者是来自俄亥俄州立大学的Steffen Lindert教授。

共价标记质谱通过共价修饰和识别暴露残基以阐明蛋白质结构,其中焦碳酸二乙酯(DEPC)是一种常用的共价标记试剂,可标记赖氨酸、组氨酸、丝氨酸、苏氨酸和酪氨酸残基。Rosetta是用于蛋白质结构的计算建模和分析预测的一套算法。在这篇文献中,作者团队结合DEPC标记所得到的二进制数据来改进Rosetta算法预测蛋白质结构的能力。本次用于测试的基准蛋白质(benchmark protein)有七种,结合DEPC标记所得的质谱数据,改进后的Rosetta评分项能够成功鉴定出其中五种蛋白质的最佳模型,其均方根偏差值(RMSD)小于

一、HNCSASA以及DEPC_hydrophobicity等参数的计算

作者之前的研究中,将对疏水微环境的SerThrTyr(STY)残基的标记敏感性以及HisLysHK)残基的溶剂可及表面积(SASA)纳入了DEPC指导的Rosetta评分项,结果表明相邻的疏水性残基增加了DEPC局部浓度从而促进标记。但是早期工作并未考虑到相邻残基的疏水性程度不同,在此基础上本次研究将微环境中相邻残基的疏水性程度纳入研究范围。

本次用于测试的七种基准蛋白质均具备DEPC标记数据,包括肌红蛋白(Myoglobin)、人类生长激素(HGH)、β2-微球蛋白(β2m)、泛素(Ubiquitin)、碳酸酐酶(Carbonic Anhydrase)、超折叠绿色荧光蛋白(sfGFP)和溶菌酶(Lysozyme)。

疏水相邻系数(Hydrophobic Neighbor Count, HNC值)用于计算基准蛋白质晶体结构中标记和未标记的STY残基,由自定义的 Python 脚本使用先前发布的归一化疏水性值计算得出。HNC 使用渐进贡献法计算(见图1),通过将与 STY 残基相关的所有疏水邻域贡献相加来计算总贡献。STY 残基和疏水邻居之间的距离的减小,HNC值随之增加。

1

1.  疏水残基 ( j ) β-碳与STY 残基 ( i ) 的羟基氧之间的距离 (dist ij )被确定并计入 HNC。特定疏水邻域的贡献乘以因子 1. XX,其中XX代表残基的归一化疏水性。例如Phe  2.00Ile  1.99Trp  Leu  1.97Tyr  1.63Ala  1.41。基于 DEPC 分子尺寸,采用 HNC 中点值 (8 Å) 和陡度 (2.0) 来最大化6 Å 内疏水残基的 HNC


使用 Rosetta RelSASA 应用程序执行相对溶剂可及表面积Relative Solvent Accessible Surface Area, RelSASA)计算。相对 SASA 定义为确定的残基侧链 SASA 除以来自 Gly-X-Gly 三肽的残基侧链 SASA

采用新的评分项depc_hydrophobicity 进行评分,分数项基于与标记数据的一致性得到模型,因此模型与数据的一致性更强,所得评分更准确。DEPC 指导的评分项depc_hydrophobicity是根据标记的 STY 残基、未标记的 STY 残基和标记的 HK 残基的贡献计算的,如图2所示。

2

2DEPC指导的评分项depc_hydrophobicity的计算


二、标记的 STY 残基HNC值高于未标记的 STY 残基

具有较高疏水性的残基其 DEPC 标记程度更深。由Eq.1计算七种基准蛋白所有标记和未标记的 STY 残基的 HNC值,结果显示标记的 STY 残基比未标记的 STY 残基表现出更高的 HNC3)。标记的 STY 的平均 HNC  5.29,而未标记的 STY 的平均 HNC  3.81,这意味着与未标记的 STY 残基相比,每个标记的 STY 残基平均有 1.5 个额外的疏水相邻残基。

3

3 标记和未标记的 SerThrTyr 残基在低到中度暴露下的HNC值的相对频率对比图。图中显示了均值、最小和最大值。

三、标记的 HK残基SASA值高于未标记的 HK残基

4展示了标记和未标记的 HK 残基之间的相对 SASA 值的比较。在基准蛋白中有58  HK 残基的SASA值是50-100%,其中44 个残基被标记,只有 14 个未标记。标记的 HK 残基的平均 SASA  73%,高于未标记的平均 SASA (66%)。说明被标记 HK 残基具有更高 SASA 值,即较多暴露在溶剂中的残基更有可能暴露在标记试剂中而被标记。

4

4 大于50%的标记和未标记的HisLys残基相对SASA值的频率对比图。图中显示了均值、最小和最大值。

四、结合DEPC标记数据能提高最佳得分模型的准确性

作者对其中三种基准蛋白(泛素、β2m、肌红蛋白)生成abinitio(从头算)模型,对剩余四种基准蛋白采用同源建模。对abinitio和同源建模所建的蛋白质模型均采用Rosetta和新的depc_hydrophobicity体系进行打分。

abinitio建模组的三种蛋白质中(5),比较结合DEPC数据前后Rosetta计算的最佳得分模型的RMSD值。泛素的最佳得分模型单独使用Rosetta所得的RMSD值为2.24Å,而DEPC引导的Rosetta评分则提高至1.58Å;结合RosettaDEPC标记数据后,β2m2.43提升到1.66Å;肌红蛋白变化更加显著,从7.11Å提高到1.78Å

8

5.   (a)泛素、β2m和肌红蛋白的10000个从头算模型的 Rosetta 评分与 RMSD 图。最佳得分模型用星号 (★) 表示。(b) 最佳得分Rosetta 模型对应的晶体结构。RMSD值列在下方。(c) 基准蛋白质模型集合的 Rosetta  DEPC 数据结合评分与 RMSD 图。最佳得分模型用星号 (★) 表示。(d) 最佳得分 Rosetta  DEPC 模型对应的晶体结构。RMSD 列在下方。

在同源建模组中(6),HGH的最佳得分模型RMSD4.35变为3.82Å;碳酸酐酶从1.101.01ÅsfGFP3.79Å提高到3.57Å;溶菌酶从0.73提高到0.59Å

9
6.  (a)碳酸酐酶、HGH、溶菌酶合sfGFP的同源建模模型的 Rosetta评分与 RMSD 图。最佳得分模型用星号 (★) 表示。(b) 最佳得分Rosetta 模型对应的晶体结构。RMSD值列在下方。(c) 基准蛋白质模型集合的 Rosetta  DEPC 数据结合评分与 RMSD 图。最佳得分模型用星号 (★) 表示。(d) 最佳得分 Rosetta  DEPC 模型对应的晶体结构。RMSD 列在下方。

总体而言,使用depc_hydrophobicity体系进行评分提高了最佳得分模型RMSD,所预测的最佳得分模型更加接近基准蛋白质的真实结构。

 

总结:本文的工作将DEPC共价标记的质谱数据与计算机建模相结合。在计算指标中考虑了丝氨酸、苏氨酸和酪氨酸残基的相邻残基在微环境中的疏水性程度,以得出更加准确的疏水相邻系数(HNC);同时结合组氨酸、赖氨酸的溶剂暴露程度,进而改进所建的蛋白质模型。本次研究体现了DEPC共价标记-质谱技术在蛋白质建模中的重要应用,作者团队致力于在未来将DEPC标记用于未知蛋白质复合物的结构预测。



 

撰稿:王雅文,苏梓玲

编辑:李惠琳

文章引用:Accounting for Neighboring Residue Hydrophobicity in Diethylpyrocarbonate Labeling Mass Spectrometry Improves Rosetta Protein Structure Prediction. Sarah E. Biehn, Danielle M. Picarello, Xiao Pan, Richard W. Vachet, and Steffen Lindert. Journal of the American Society for Mass Spectrometry Article ASAP

DOI: 10.1021/jasms.1c00373


weinxin
我的微信
关注我了解更多内容

发表评论

目前评论: