FragPipe是一个综合性的计算平台,用于分析基于质谱的蛋白质组学数据。FragPipe提供了易于使用的Java图形用户界面(GUI),同时也可以在Windows、Linux或云环境中以命令行模式运行。它由超快速蛋白质组学搜索引擎MSFragger驱动,适用于常规和"开放"(宽前体质量容差)肽段鉴定。FragPipe包含Percolator和Philosopher工具包,用于MSFragger搜索结果的下游后处理(PeptideProphet、iProphet、ProteinProphet)、FDR过滤、基于标记的定量以及多实验汇总报告生成。FragPipe包含MSBooster模块,用于基于深度学习的肽段鉴定重新评分。Crystal-C和PTM-Shepherd被包含以辅助解释开放搜索结果。FragPipe二进制文件还包括用于TMT/iTRAQ同位素标记定量的TMT-Integrator,用于具有FDR控制的跨运行匹配(MBR)功能的无标记定量的IonQuant,使用EasyPQP构建光谱库,以及用于直接("无库")分析数据独立采集(DIA)数据的MSFragger-DIA、DIA-Umpire SE和diaTracer模块。FragPipe还包括DIA-NN,用于从DIA数据中提取定量信息。
下载
Docker镜像
FragPipe教程
- 使用FragPipe(涵盖所有FragPipe模块的通用教程)
- 在命令行界面运行FragPipe
- 使用Docker拉取和运行FragPipe
- PTM发现
- TMT/iTRAQ定量
- 无标记定量
- SILAC(或其他MS1标记)数据
- DIA分析
- 使用两遍搜索检测新颖/变异肽段
- 新颖/变异肽段分析的分组FDR估计
- 使用Koina的肽段预测模型进行MSBooster特征生成
资源
将FragPipe与其他工具结合使用
支持的仪器和文件格式
下表显示了FragPipe工作流组件与不同光谱文件格式的兼容性。
Bruker .d表示timsTOF的ddaPASEF文件,其他Bruker .d文件应转换为.mzML。请注意,timsTOF数据在Windows上需要Visual C++ Redistributable for Visual Studio 2017。如果您看到无法找到Bruker原生库的错误,请尝试安装Visual C++可再发行组件。
工作流步骤 | .mzML | Thermo (.raw) | Bruker (.d) | .mgf |
---|---|---|---|---|
DIA-Umpire 伪 MS/MS 生成 | ✔ | ✔ | ||
diaTracer 伪 MS/MS 生成 | ✔ | |||
MSFragger 搜索 | ✔ | ✔ | ✔ | ✔ |
MSFragger-DIA | ✔ | ✔ | ||
Crystal-C 伪影去除 | ✔ | ✔ | ||
PTMProphet 定位 | ✔ | ✔ | ✔ | |
PTM-Shepherd 汇总 | ✔ | ✔ | ✔ | |
无标记定量 | ✔ | ✔ | ✔ | |
SILAC/二甲基标记定量 | ✔ | ✔ | ✔ | |
TMT/iTRAQ 定量 | ✔ | ✔ | ||
光谱库生成 | ✔ | ✔ | ✔ | ✔ |
DIA-NN 定量 | ✔ | ✔* | ✔ |
使用重叠/交错窗口采集的 DIA 数据必须通过解复用转换为 mzML。 使用 DIA-NN 对 Thermo .raw 文件进行定量需要安装 Thermo MS File Reader,详见 DIA-NN 文档。
请注意,从 Thermo .raw 文件进行 TMT/iTRAQ 定量会比从 .mzML 文件耗时更长。
附加文档
完整的 MSFragger 文档可在 MSFragger wiki 上找到。 有关 Philosopher 工具包的文档,请参阅 Philosopher wiki。
问题和技术支持
在 FragPipe 问题追踪器 查看以往的问题/错误报告。也请在此处发布任何有关 FragPipe 本身的新问题/错误报告。 对于 FragPipe 各个组件的具体问题,您还可以使用 MSFragger 问题追踪器、Philosopher 问题追踪器 和 IonQuant 问题追踪器。 查看 MSFragger 的 wiki 和 常见问题。
有关 Nesvizhskii 实验室开发的其他工具,请访问我们的网站 nesvilab.org
如何运行
- Windows:
- 双击
bin
文件夹中的FragPipe.exe
或FragPipe.bat
- 或执行命令:
java -jar FragPipe-x.x.jar
- 双击
- Linux:
- 运行
fragpipe
shell 脚本(可双击运行) - 或执行命令:
java -jar FragPipe-x.x.jar
- 运行
- Mac OS(仅命令行界面):
集成
FragPipe 是开源的,其输出目前被以下软件项目支持:
- Skyline
- AlphaPeptDeep
- AlphaPeptStats
- AlphaMap
- directLFQ
- DIA-NN
- MSstats
- picked_group_fdr
- FragPipe-Analyst
主要参考文献
数据库搜索
- Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., & Nesvizhskii, A. I. (2017). MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry–based proteomics. Nature Methods, 14(5), 513-520.
- Yu, F., Teo, G. C., Kong, A. T., Haynes, S. E., Avtonomov, D. M., Geiszler, D. J., & Nesvizhskii, A. I. (2020). Identification of modified peptides using localization-aware open search. Nature Communications, 11(1), 1-9.
- Yu, F., Haynes, S. E., Teo, G. C., Avtonomov, D. M., Polasky, D. A., & Nesvizhskii, A. I. (2020). Fast quantitative analysis of timsTOF PASEF data with MSFragger and IonQuant. Molecular & Cellular Proteomics, 10(9), 1575-1585.
- Teo, G. C., Polasky, D. A., Yu, F., Nesvizhskii, A. I. (2020). A fast deisotoping algorithm and its implementation in the MSFragger search engine. Journal of Proteome Research, 20(1), 498-505.
Glyco/Labile搜索
- Polasky, D. A., Yu, F., Teo, G. C., & Nesvizhskii, A. I. (2020). 使用MSFragger-Glyco进行快速全面的N-糖基化和O-糖基化蛋白质组学分析。自然方法,17,1125-1132。
- Polasky, D. A., Geiszler, D. J., Yu, F., & Nesvizhskii, A. I. (2022). 糖蛋白质组学的多属性糖基鉴定和FDR控制。分子与细胞蛋白质组学,21(3),100205。
- Polasky, D. A., Geiszler, D. J., Yu, F., Kai, Li., Teo, G. C., & Nesvizhskii, A. I. (2023). MSFragger-Labile:一种改善蛋白质组学中不稳定PTM分析的灵活方法。分子与细胞蛋白质组学,22(5),100538。
PTM
- Chang, H. Y., Kong, A. T., da Veiga Leprevost, F., Avtonomov, D. M., Haynes, S. E., & Nesvizhskii, A. I. (2020). Crystal-C:一种用于优化开放搜索结果的计算工具。蛋白质组学研究杂志,19(6),2511-2515。
- Geiszler, D. J., Kong, A. T., Avtonomov, D. M., Yu, F., da Veiga Leprevost, F., & Nesvizhskii, A. I. (2020). PTM-Shepherd:开放搜索结果中翻译后修饰和化学修饰的分析和总结。分子与细胞蛋白质组学,20,100018。
- Geiszler, D. J., Polasky, D. A., Yu, F., & Nesvizhskii, A. I. (2023). 检测翻译后修饰肽段的MS/MS光谱中的诊断特征。自然通讯,14,4132。
DIA
- Tsou, C. C., Avtonomov, D., Larsen, B., Tucholska, M., Choi, H., Gingras, A. C., & Nesvizhskii, A. I. (2015). DIA-Umpire:数据独立获取蛋白质组学的全面计算框架。自然方法,12(3),258-264。
- Yu, F, Teo, G. C., Kong, A. T., Fröhlich, K., Li, G. X. , Demichev, V, Nesvizhskii, A..I. (2023). 使用MSFragger-DIA和FragPipe计算平台分析DIA蛋白质组学数据。自然通讯 14:4154。
DDA定量
- Yu, F., Haynes, S. E., & Nesvizhskii, A. I. (2021). IonQuant实现了准确敏感的无标记定量,并具有FDR控制的跨运行匹配功能。分子与细胞蛋白质组学,20,100077。
其他
- da Veiga Leprevost, F., Haynes, S. E., Avtonomov, D. M., Chang, H. Y., Shanmugam, A. K., Mellacheruvu, D., Kong, A. T., & Nesvizhskii, A. I. (2020). Philosopher:一个用于鸟枪法蛋白质组学数据分析的多功能工具包。自然方法,17(9),869-870。
- Yang, K. L., Yu, F., Teo, G. C., Kai, L., Demichev, V., Ralser, M., & Nesvizhskii, A. I. (2023). MSBooster:使用深度学习特征改善肽段鉴定率。自然通讯,14,4539。
从头构建
-
更新构建版本: 构建版本存储在3个不同的位置:
- 文件:
MSFragger-GUI/src/umich/msfragger/gui/Bundle.properties
属性:msfragger.gui.version
- 文件:
MSFragger-GUI/build.gradle
属性:version
- 文件:
MSFragger-GUI/src/umich/msfragger/gui/Bundle.properties
属性:msfragger.gui.version
- 文件:
-
构建: 你不需要安装Gradle,将使用此存储库中包含的Gradle包装器。从存储库的根目录执行以下命令:
cd ./MSFragger-GUI ./gradlew makeReleaseZipNoJre
或使用此版本构建包含Java运行时的版本(仅适用于Windows):
cd ./MSFragger-GUI ./gradlew makeReleaseZipWithJre
-
.zip输出文件将位于
MSFragger-GUI/build/github-release
目录中。