整合序列与蛋白相互作用特征的亚细胞定位预测被引量：6

Prediction of Protein Subcellular Localization by Incorporating Sequence and Protein-Protein Interaction Features

下载PDF

导出

摘要提出了一种基于序列和PPI特征的距离公式,可综合序列氨基酸组成和PPI对象、强弱等信息对两个蛋白质的相似性进行表征,并在此基础上提出了一种用于蛋白质亚细胞定位预测的K近邻算法。利用留一法对性能进行了评估,结果显示,在序列基础上加入PPI特征,可明显有助于亚细胞定位的预测;同时基于上述距离的K近邻算法也优于使用相同特征的SVM算法,表明该算法可以对蛋白质的亚细胞定位信息进行准确有效的预测。 Information of protein subcellular localization is indispensable to study protein function, as a protein can perform its function only after it is correctly transported to a specific subcellular compartment. Thus it is very important to provide accurate prediction of protein subcellular localization in biological studies. In contrast to sequence features （e.g. amino acids composition） that are widely used in subcellular localization prediction, features extracting protein-protein interaction （PPI） are largely ignored, although they reflect the co-localization information of different proteins. In this study, we propose a novel distance formula based on both protein sequence and PPI features, which precisely measures the similarity of proteins by incorporating protein information including amino acid composition, PPI and the corresponding interaction scores. Based on this distance formula, we further introduce a k-nearest neighbor （KNN） algorithm for predicting subcellular localization. The results of leave-one-out test on a benchmark dataset show that PPI features significantly improve the performance of protein subcellular localization. Meanwhile, this KNN algorithm also outperformes SVM algorithm adopting the same features, suggesting the efficiency of the proposed algorithm for predicting protein subcellular localization.

作者王明会龚艺王强冯焕清李骜

机构地区中国科学与技术大学信息科学技术学院

出处《电子科技大学学报》 EI CAS CSCD 北大核心 2015年第3期467-470,共4页 Journal of University of Electronic Science and Technology of China

基金国家自然科学基金(61101061 31100955) 中央高校基本科研业务费专项资金(WK2100230011) 高等学校博士学科点专项科研基金(20113402120028)

关键词生物信息学 K近邻算法蛋白质相互作用亚细胞定位 bioinformatics K-nearest neighbor algorithm protein-protein interaction subcellular localization

分类号 TP391 [自动化与计算机技术—计算机应用技术] Q71 [生物学—分子生物学]

引文网络
相关文献

参考文献12

1KENICHIRO I, KENTA N. Prediction of subcellular locations of proteins: Where to proceed?[J]. Proteomics, 2010(10): 3970-3983.
2CHOU Kuo-chen, WU Zhi-cheng, XIAO Xuan. iLoc-Hum: Using the accumulation-label scale to predict subcellular locations of human proteins with both single and multiple sites[J]. Mol BioSyst, 2012(8): 629-641.
3DU Pu-feng, YU Yuan. SubMito-PSPCP: Predicting protein submitochondrial locations by hybridizing positional specific physicochemical properties with pseudoamino acid compositions[J]. Biomed Res lnt, 2013: 263829.
4PIERLEONI A, MARTELLI P L, CASADIO R. MemLoci- Predicting subcellular localization of membrane proteins in eukaryotes[J]. Bioinformatics, 2011, 27(9): 1224-1230.
5XIE Dan, LI Ao, WANG Ming-hui, et al. LOCSVMPSI: a web server for subcellular localization of eukaryotic proteins using SVM and profile of PSI-BLAST[J]. Nucleic Acids Research, 2005, 33(suppl 2): 105-110.
6LI Li-qi, ZHANG Yuan, ZOU Ling-yun, et al. An ensemble classifier for eukaryotic protein subcellular location prediction using gene ontology categories and amino acid hydrophobicity[J]. PLoS ONE, 2012, 7( 1): e31057.
7MARC1N M, MARC1N P, JANUSZ B M. MetaLocGramN: a recta-predictor of protein subcellular localization for Gram-negative bacteria[J]. Biochimica et Biophysica Acta (BBA)-Proteins and Proteomics, 2012, 1824(12): 1425-1433.
8CHOU Kuo-chen, SHEN Hong-bin. A new method for predicting the subcellular localization of eukaryotic proteins with both single and multiple sites: Euk-mPLoc 2.0[J]. PLoS ONE, 2010, 5(4): e9931.
9LIU Han-qing, BECK T N, GOLEMIS E A, et al. Integrating in silico resources to map a signaling network[M]. Methods Mol Biol, 2014, 1101: 197-245.
10LI Bi-qing, YOU Jin, CHEN Lei, et al. Identification of lung-cancer-related genes with the shortest path approach in a protein-protein interaction network[J]. BioMed Research International, 2013: 267375.

同被引文献52

1王福生,余洪,胡洲,管德龙,张盼,朱世平,赵晓春.柑橘属SAUR基因家族的全基因组鉴定及表达分析[J].园艺学报,2020,47(1):23-40. 被引量：13
2张国华,张艳洁,丛日晨,赵琦,董克奇,古润泽.赤霉素作用机制研究进展[J].西北植物学报,2009,29(2):412-419. 被引量：74
3梁文裕,陈伟,宋瑞峰,张凤.龙眼胚胎发育研究进展(综述)[J].亚热带植物科学,2004,33(4):65-68. 被引量：7
4程超华,王学德,姚艳玲.IAA和GA_3对棉花短纤维突变体纤维长度的离体诱导作用[J].作物学报,2005,31(2):229-233. 被引量：21
5张松,黄波,夏学峰,孙之荣.蛋白质亚细胞定位的生物信息学研究[J].生物化学与生物物理进展,2007,34(6):573-579. 被引量：39
6赖钟雄,潘良镇,陈振光.龙眼胚性细胞系的建立与保持[J].福建农业大学学报,1997,26(2):160-167. 被引量：106
7赖钟雄,陈振光.龙眼胚性愈伤组织的高频率体细胞胚胎发生[J].福建农业大学学报,1997,26(3):271-276. 被引量：65
8陈玉芹,王喆之.植物翻译控制肿瘤蛋白的分子结构特征与功能预测分析[J].生物技术通报,2008,24(2):105-112. 被引量：8
9古小玲,李玉萍,梁伟红,刘燕群,董定超.中国龙眼产业发展概况[J].中国农学通报,2008,24(9):470-474. 被引量：32
10叶炜,尚伟,夏潮水.文心兰育种研究进展[J].三明农业科技,2008(3):17-19. 被引量：5

引证文献6

1李蓉,吴晓佩,王雪晶,陈裕坤,郭容芳,林玉玲,赖钟雄,徐涵.文心兰RFNR的克隆、亚细胞定位及其与LFNR不同的胁迫响应机制研究[J].园艺学报,2018,45(11):2164-2176. 被引量：4
2高玉莹,白玉,时欢,陈晓慧,郝向阳,林玉玲,叶开温,赖钟雄.文心兰‘南茜’谷氧还蛋白基因克隆定位及表达[J].应用与环境生物学报,2018,24(3):533-540. 被引量：1
3王艺皓,丁洪伟,李波,保利勇,张颖婕.基于聚类与特征融合的蛋白质亚细胞定位预测[J].计算机科学,2021,48(3):206-213. 被引量：4
4李晓斐,张舒婷,蒋梦琦,申序,霍雯,林玉玲,赖钟雄.龙眼组蛋白去乙酰化酶基因DlHDT1的克隆与特性分析[J].西北植物学报,2021,41(4):549-557. 被引量：1
5傅卓然,李卓蕴,陈燕,张舒婷,赖钟雄,林玉玲.龙眼体胚发生早期SAUR 63/64基因克隆及表达分析[J].西北植物学报,2022,42(12):1991-2002. 被引量：3
6申序,牟东岭,周金忠,郭萍,陶平,黄会,张春渝,林玉玲,赖钟雄.龙眼DlSWC5基因克隆、亚细胞定位及表达特性分析[J].南方农业学报,2024,55(7):2137-2147.

二级引证文献13

1冯保云,李蓉,赖钟雄,林玉玲.文心兰HSP70基因的克隆及表达分析[J].热带作物学报,2020,41(4):745-754. 被引量：6
2吕煜梦,张舒婷,王雪晶,张梓浩,程春振,王天池,赖钟雄.多花黄精几丁质诱导赤霉素应答基因(CIGR)克隆及其功能[J].应用与环境生物学报,2020,26(2):255-263. 被引量：5
3王雪晶,李蓉,王姗姗,张婧,林玉玲,陈裕坤,林争春,陈青青,叶开温,赖钟雄,徐涵.文心兰类原球茎形态建成及电子传递蛋白和凯氏带蛋白基因的极性表达模式分析[J].热带作物学报,2020,41(12):2387-2399. 被引量：1
4马尔合巴·艾司拜尔,成新琪,卢亚杰,李艳军,刘峰,秦江鸿,孙杰.陆地棉类谷氧还蛋(GhGRL)基因家族生物信息学分析[J].生物信息学,2021,19(2):105-114.
5王鲜芳,卢凡,刘依锋,李启萌.基于FF和VIM的嗜热蛋白质预测[J].河南工学院学报,2021,29(4):28-34.
6牛富生,郭延哺,李维华,刘文洋.基于序列特征融合的蛋白质可溶性预测[J].计算机科学,2022,49(1):285-291.
7吴晓佩,徐小萍,叶炜,赖瑞联,赖钟雄.文心兰OnFNR基因的克隆及抗软腐病功能鉴定[J].西北植物学报,2022,42(1):1-12.
8徐芳,刘丽君,李鹏,姚彦林,孙万仓,武军艳.白菜型冬油菜HDACs基因家族的鉴定及表达分析[J].西北植物学报,2022,42(5):721-735. 被引量：4
9王丽,句荣辉,杨洋,陈璟瑶,朱丽洁,邓志峰.马铃薯品质特性的相关性及主成分分析[J].食品工业,2023,44(12):307-312. 被引量：4
10刘永昌,马晓梅,吴忠新,孙玉进,陈纳.陆地棉SAURX克隆及表达模式分析[J].西北植物学报,2024,44(5):751-759.

1戴亚.一些球蛋白可解离基的相互作用特征[J].生物化学与生物物理进展,1993,20(5):388-390.
2乔善平,闫宝强.基于三层集成多标记学习的蛋白质多亚细胞定位预测[J].计算机应用,2016,36(8):2150-2156. 被引量：1
3马军伟,高新中,张杰.蛋白质亚细胞定位预测中的序列编码技术研究[J].计算机科学,2012,39(S3):283-287. 被引量：1
4倪青山,王正志,黎刚果,孟祥林.基于K近邻的蛋白质功能的预测方法[J].生物医学工程研究,2009,28(2):87-90. 被引量：2
5刘冰静,郭红.以位置特异性得分矩阵和基因本体为特征的蛋白质亚细胞定位预测[J].福州大学学报（自然科学版）,2017,45(1):16-24. 被引量：1
6乔善平,闫宝强.蛋白质亚细胞定位预测研究综述[J].计算机应用研究,2014,31(2):321-327. 被引量：5
7吴泽月,陈月辉.蛋白质亚细胞定位预测研究进展[J].山东师范大学学报（自然科学版）,2012,27(4):33-37. 被引量：6
8王小飞,石卓兴,谭淑敏,李杰,张耀洲,于威,陈剑清,舒特俊.家蚕蛋白亚细胞定位预测模型的构建及其初步应用[J].浙江理工大学学报（自然科学版）,2015,33(2):238-243.
9郑光宇.真核生物表达系统研究进展[J].喀什师范学院学报,2004,25(6):33-36. 被引量：7
10李爱明,魏蓉.基于集成分类器的凋谢蛋白亚细胞定位预测方法[J].计算机与应用化学,2010,27(5):645-648.

电子科技大学学报

2015年第3期

浏览历史

内容加载中请稍等...

整合序列与蛋白相互作用特征的亚细胞定位预测被引量：6

参考文献12

同被引文献52

引证文献6

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

整合序列与蛋白相互作用特征的亚细胞定位预测 被引量：6

参考文献12

同被引文献52

引证文献6

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

整合序列与蛋白相互作用特征的亚细胞定位预测被引量：6