蛋白质组学质谱数据预处理技术综述被引量：9

Progress in the Preprocessing of Mass Spectrometry Proteomics Data

下载PDF

导出

摘要基于质谱技术的蛋白质组学数据分析,是识别新型生物标记物模式的有效手段。质谱仪检测的数据含有大量潜在信息,但数据很容易被系统误差和噪声污染。蛋白质组学质谱数据预处理的目的在于抑制噪声、数据简约和增加谱可比性等,是增强生物学相关信息的至关重要步骤。只依赖质谱仪中的软件进行数据预处理存在一定局限,需要额外工具辅助。从数据简约、谱线平滑、基线校正、标准化、谱峰提取与量化、谱峰联配等方面介绍典型的预处理技术,对预处理方法存在的问题进行讨论,并就发展趋势进行展望。 Mass Spectrometry based proteomies analysis is a powerful approach for identifying novel biomarkers patterns in biological samples. Though data produced by mass spectrometers contains potentially huge amount of information, they are often interferred by errors and noises due to sample preparation and instrument approximation. Preprocessing is crucial for mass spectrometry data in removing noises, reducing the amount of data, making spectra comparable, and allowing us to focus on the biologically relevant information. However, data preprocessing using the software of mass spectrometer is not enough, and needs some extra tools to assist. This paper introduced different classical techniques for spectra preprocessing, including data reduction, smoothing, baseline correction, normalization, peak detection and quantification and peak alignment as well. Finally, future works and some key problems about mass spectrum preprocessing were discussed.

作者孟辉洪文学

机构地区燕山大学生物医学工程系

出处《中国生物医学工程学报》 CAS CSCD 北大核心 2009年第3期469-475,共7页 Chinese Journal of Biomedical Engineering

基金国家自然科学基金资助项目(60671025) 河北省自然科学基金(F2008000895)

关键词蛋白质组学质谱数据预处理数据质量 proteomic mass spectrometry data preprocessing data quality

分类号 R318 [医药卫生—生物医学工程]

引文网络
相关文献

参考文献39

1Petricoin EF, Ardekani AM, Hitt BA, et al. Use of proteomie patterns in serum to identify ovarian cancer [J]. The Lancet, 2002, 359: 572- 577.
2曹志成.蛋白质芯片SELDI-TOFMS技术的研究进展及其在临床中的应用[J].生物工程学报,2006,22(6):871-876. 被引量：15
3Laure FM, Matthew AR, Laurent BF. Matrix-assisted laser desorption/ionization time-of-flight mass spectrometry in clinical chemistry [J]. Clinica Chimica Acta, 2003, 337(1-2):11- 21.
4Baggerly KA, Morris JS, Coombes KR. Reproducibility of SELDITOF protein patterns in serum: comparing datasets from different experiments [J]. Biolnformatics, 2004,20(5) : 777 - 785.
5Malyarenko DI, Cooke WE, Adam BL, et al. Enhancement of sensitivity and resolution of surface-enhanced laser desorption/ ionization time-of-flight mass spectrometric records for serum peptides using time-series analysis techniques []]. Clin Chem, 2005, 51:65 - 74.
6Morris JS, Coombes KR, Koomen J, et al. Feature extraction and quantification for mass spectrometry in biomedical applications using the mean spectrum [J]. Bioinformatics, 2005, 21(9): 1764- 1775.
7Hong Huixiao, Dragan Y, Epstein J, et al. Quality control and quality assessment of data from surface-enhanced laser desorption/ ionization (SELDI) time-of flight (TOF) mass spectrometry (MS) [J]. BMC Bioinformatics, 2005, 6(Suppl 2):S5.
8Dijkstra M, Vonk RJ, Jansen RC. SELDI-TOF mass spectra: A view on sources of variation [ J 1. Journal of Chromatography B, 2007, 847:12 - 23.
9Yasui Y, Pepe M, Thompson ML, et al. A data-analytic strategy for protein biomarker discovery: profiling of high-dimensional proteomic data for cancer detection [J]. Biostatistics, 2003, 4(3) : 449 - 463.
10Ressom HW, Varghese RS, Drake SK, et al. Peak selection from MALDI-TOF mass spectra using ant colony optimization [ J ]. Bioinformaties, 2007, 23(5) : 619 - 626.

二级参考文献4

1Jie-KaiYu,Yi-DingChen,ShuZheng.An integrated approach to the detection of colorectal cancer utilizing proteomics and bioinformatics[J].World Journal of Gastroenterology,2004,10(21):3127-3131. 被引量：30
2曹志成,余坚文,梁荣能.蛋白质组学——引领后基因组时代[J].中国生物工程杂志,2005,25(1):33-38. 被引量：17
3YANGShuan-ying,XIAOXue-yuan,ZHANGWang-gang,SUNXiu-zhen,ZHANGLi-juan,ZHANGWei,ZHOUBin,CHENGuo-an,HEDa-cheng.Application of serum surface-enhanced laser desorption/ionization proteomic patterns in distinguishing lung cancer patients from healthy people[J].Chinese Medical Journal,2005(12):1036-1039. 被引量：48
4李睿,李蓉,王亚文.血清细胞角蛋白19片段检测对肺癌的临床意义[J].中华结核和呼吸杂志,1998,21(1):26-29. 被引量：31

共引文献14

1曹志成.颅内肿瘤综合治疗及其分子治疗研究进展[J].南方医科大学学报,2007,27(7):1047-1051. 被引量：12
2William C.S. Cho.Proteomics Technologies and Challenges[J].Genomics, Proteomics & Bioinformatics,2007,5(2):77-85. 被引量：18
3区兆基,曹志成,叶大同,罗振基.蛋白质芯片筛选香港非吸烟女性肺腺癌组织的肿瘤标志物[J].癌症,2008,27(3):264-271. 被引量：3
4刘博,肖雪媛,董家鸿,何大澄,黄志强.肝内胆管癌细胞系ICC-9810与肝细胞系L02蛋白质组学的差异分析[J].世界华人消化杂志,2008,16(7):759-762. 被引量：5
5王晓娜,许丽娜,彭金咏,刘克辛.现代生物质谱技术在生物大分子分析研究中的应用[J].中国现代应用药学,2008,25(2):105-109. 被引量：3
6赵海豹,林汝仙,王升启.蛋白质组学研究相关技术及进展[J].生物技术通讯,2008,19(6):903-906. 被引量：7
7莫侨,隋军,李晓江,高伟.SELDI—TOF—MS技术与头颈部肿瘤的诊断[J].国际耳鼻咽喉头颈外科杂志,2009,33(2):112-114.
8王剑,刘殿武,王立新.飞行时间质谱技术在乙肝及相关疾病研究中的应用[J].河北北方学院学报（医学版）,2009,26(2):69-71.
9于仁涛,高培基,韩黎,黄留玉.宏蛋白质组学研究策略及应用[J].生物工程学报,2009,25(7):961-967. 被引量：9
10陆晔,刘杰,项翠琴,林成招,王吉耀.SELDI技术对肝硬化相关血浆差异蛋白的鉴定[J].中国实验诊断学,2009,13(10):1311-1314.

同被引文献80

1陈昌良,韩文念,汪曣.基于Zynq的三重四极杆质谱仪数据采集系统研究[J].真空科学与技术学报,2020,40(2):142-147. 被引量：2
2律祥俊,林少凡,张金碚,张法义.一种有机质谱谱图的库检索新算法[J].高等学校化学学报,1994,15(5):678-680. 被引量：8
3李伟红,龚卫国,陈伟民,梁毅雄,尹克重.基于SVM RFE的人脸特征选择方法[J].光电工程,2006,33(5):113-117. 被引量：4
4扈庆,田地,方向.有机质谱谱图的库结构改进及检索新算法[J].分析化学,2006,34(7):1049-1049. 被引量：1
5邓家刚,秦华珍,秦海洸.中药药性效应及物质基础的文献研究[J].河南中医,2007,27(5):82-84. 被引量：18
6顾英,冯怡,李玉敏.指纹图谱在中药物质基础研究中的应用[J].中成药,2007,29(7):1048-1051. 被引量：30
7Wong J W H, Cagney G, Cartwright H M. SpecAlign - processing and alignment of mass spectra datasets [ J ]. Bioinformatics, 2005, 21 (9) :2088-2090.
8Wong J W H, Durante C, Cartwright H M. Application of fast Fourier transform cross-correlation for the align- merit of large chromatographic and spectral datasets [ J ]. Anal Chem,2005, 77(17) :5655-5661.
9Wold S, Sjostrom M, Eriksson L, et al. PLS-regres- sion: a basic tool of chemometrics [ J ]. Chemometr In- tell Lab,2001, 58(2) :109-130.
10Alberto M, Angelo N, Fulvia F, et al. Phenotype fore- casting with SNPs data through gene-based Bayesian Networks[ J]. Bioinformatics, 2009, 10( Suppl 2) :S7.

引证文献9

1齐方,容蓉,薛付忠.贝叶斯网络模型在中药整体药性特征分析中的应用[J].山东大学学报（医学版）,2011,49(5):147-152. 被引量：9
2邹修明,罗楠,孙怀江.基于T检验与支持向量机的蛋白质质谱数据分析[J].淮阴师范学院学报（自然科学版）,2011,10(5):409-413. 被引量：1
3齐方,蓉蓉,薛付忠.中药药性特征标记的PLS统计模式识别模型[J].中国卫生统计,2011,28(6):628-631. 被引量：8
4王晓燕,李峰.20种中药多糖水解成分HPLC指纹图谱与寒热药性关系的SVM分析研究[J].山东中医药大学学报,2012,36(5):439-442. 被引量：7
5杨合龙,祝磊,韩斌,厉力华,郑智国,孟旭莉.运用近邻传播聚类分析进行SELDI-TOF蛋白质谱特征选择[J].中国生物医学工程学报,2013,32(1):14-20. 被引量：5
6王晓燕.基于主成分-线性判别分析的植物药多糖HPLC图谱与寒热药性关系研究[J].山东中医药大学学报,2013,37(2):156-159. 被引量：4
7王晓燕,李峰.中药药性特征标记模式识别建模研究[J].辽宁中医杂志,2013,40(8):1665-1667. 被引量：1
8田霖,韩文念,王康,苏伟童,赵珍阳,张勇,田中朝,汪曣,朱险峰.基于现场可编程门阵列的质谱信号滤波器的设计与应用[J].分析科学学报,2023,39(1):98-105.
9吴丽萍,向诚,张海强,李勇.基于质谱熵的小分子化合物相似性计算方法研究[J].北京化工大学学报（自然科学版）,2024,51(4):115-124.

二级引证文献29

1董丽雪,韩冰冰,王加锋,吕胜男,刘春蕾,刘珊,滕佳林.吴茱萸萃取物对虚寒证模型大鼠T3、T4、TSH、TRH含量的影响[J].辽宁中医杂志,2012,39(8):1608-1609. 被引量：3
2冯帅,刘杨,王晓燕,李峰.多糖水解成分GC-MS指纹图谱与寒热药性的多元统计分析[J].中国实验方剂学杂志,2013,19(9):143-146. 被引量：7
3王晓燕.中药药性物质基础研究中数学建模思路探讨[J].中国实验方剂学杂志,2013,19(15):337-339. 被引量：7
4李智慧,陆涛,杨中林,黄园,陶禹希,言方荣.基于Copula函数的中药有效成分群谱效分析[J].中国卫生统计,2013,30(5):650-653. 被引量：7
5王鹏,周洪雷,薛付忠,王振国.基于高效毛细管电泳指纹数据的60种植物类中药寒热药性模式识别评价研究[J].中药材,2013,36(9):1419-1424. 被引量：7
6王鹏,周洪雷,薛付忠,王振国.60种植物类中药提取物的红外光谱分析及其与寒热药性相关性的模式识别评价研究[J].光谱学与光谱分析,2014,34(1):58-63. 被引量：19
7周扬,戴曙光,葛丁飞.近红外光谱稀疏分量分析检测柴油品质参数[J].光学精密工程,2014,22(2):296-303. 被引量：5
8赵志梅.基于代理模型和人工免疫系统的特征选择算法[J].计算机工程与设计,2014,35(6):2174-2178. 被引量：2
9李玉洁,张为佳,Mayuree Tantisira,陈颖,金莉,王娅杰,Aree Wanasuntronwong,杨庆,翁小刚,朱晓新,周冰冰,郭琰,刘栩岑.“苦寒”方药性效解[J].中医杂志,2014,55(19):1630-1634. 被引量：22
10刘娜,李军,李宝国.多元统计分析在中药质量控制中的应用和思考[J].中国中药杂志,2014,39(21):4268-4271. 被引量：24

1汤凤庆.生物材料测定的预处理技术[J].职业医学,1995,22(1):39-40.
2白海青,王竫华,王大博.视网膜神经节细胞的体外培养方法[J].中华眼底病杂志,2002,18(1):82-84. 被引量：2
3范立南,王晶,王银玲.多模态医学图像融合技术综述[J].沈阳大学学报,2009,21(3):96-100. 被引量：6
4何颖,王军,郭政,王慕杰,李霞,李晶,张瑞敏.影响血压的主效应因素的混合分布分析[J].数理医药学杂志,1994,7(4):335-337.
5杨立才,李佰敏,李光林,贾磊.脑-机接口技术综述[J].电子学报,2005,33(7):1234-1241. 被引量：68
6梁冰苑,昂清,王卫东.质谱分析的生物信息学方法及其对比分析[J].中国医疗器械杂志,2012,36(5):357-361.
7罗林英,陈金雄.数据挖掘技术在单病种住院费用中的应用[J].医学信息,2008,21(12):2136-2139. 被引量：1
8王长本,刘兴晖,王伟灵,周新.基因表达数据的聚类分析[J].国外医学（临床生物化学与检验学分册）,2004,25(4):359-362. 被引量：3
9胡文丰,张正国.生物医学数据挖掘[J].国外医学（生物医学工程分册）,2003,26(1):11-15. 被引量：18
10王晓韡,石立臣,吕宝粮.干电极脑电采集技术综述[J].中国生物医学工程学报,2010,29(5):777-784. 被引量：23

中国生物医学工程学报

2009年第3期

浏览历史

内容加载中请稍等...

蛋白质组学质谱数据预处理技术综述被引量：9

参考文献39

二级参考文献4

共引文献14

同被引文献80

引证文献9

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

蛋白质组学质谱数据预处理技术综述 被引量：9

参考文献39

二级参考文献4

共引文献14

同被引文献80

引证文献9

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

蛋白质组学质谱数据预处理技术综述被引量：9