基于质谱的大规模蛋白质鉴定中,在线液相色谱分离发挥了重要作用。色谱保留时间(retention time,RT)是肽段鉴定和定量的重要信息。由于整个色谱分析运行时间中,流动相中的有机相采用了非线性浓度曲线以及样品中肽段之间的相互影响等因素...基于质谱的大规模蛋白质鉴定中,在线液相色谱分离发挥了重要作用。色谱保留时间(retention time,RT)是肽段鉴定和定量的重要信息。由于整个色谱分析运行时间中,流动相中的有机相采用了非线性浓度曲线以及样品中肽段之间的相互影响等因素,基于肽段序列的RT预测还存在精度不高、模型推广性能差等问题。本文提出了一种基于串并联支持向量机(serial and parallel support vector machine,SP-SVM)的RT预测方法,能够表征洗脱过程中有机相浓度的非线性变化和肽段之间的相互影响,显著提高了肽段保留时间预测的精度。利用复杂样本数据集验证结果表明,预测RT和实验RT之间的决定系数达到了0.95,超过95%的鉴定肽段的RT预测误差范围小于总运行时间的20%,超过70%的鉴定肽段的RT预测误差范围小于总运行时间的10%。本文提出的模型的性能达到了目前已知的最好水平。展开更多
文摘基于质谱的大规模蛋白质鉴定中,在线液相色谱分离发挥了重要作用。色谱保留时间(retention time,RT)是肽段鉴定和定量的重要信息。由于整个色谱分析运行时间中,流动相中的有机相采用了非线性浓度曲线以及样品中肽段之间的相互影响等因素,基于肽段序列的RT预测还存在精度不高、模型推广性能差等问题。本文提出了一种基于串并联支持向量机(serial and parallel support vector machine,SP-SVM)的RT预测方法,能够表征洗脱过程中有机相浓度的非线性变化和肽段之间的相互影响,显著提高了肽段保留时间预测的精度。利用复杂样本数据集验证结果表明,预测RT和实验RT之间的决定系数达到了0.95,超过95%的鉴定肽段的RT预测误差范围小于总运行时间的20%,超过70%的鉴定肽段的RT预测误差范围小于总运行时间的10%。本文提出的模型的性能达到了目前已知的最好水平。