摘要
确定蛋白质的亚细胞位置对了解胞内蛋白质功能以及药物设计具有重要作用。利用机器学习手段进行蛋白质亚细胞定位预测可以有效弥补传统实验手段耗时费力的不足。有些蛋白质同时存在于多个亚细胞位置中,或者游走于不同亚细胞之间,以实现其生物学功能,因此,蛋白质亚细胞定位预测实际上是一种多标记学习问题。本文主要从蛋白质序列的特征提取方法和多标记学习算法两方面归纳和阐述,最后从蛋白质序列特征提取,非平衡数据集和标记相关性三个方面提出进一步研究方向。
作者
余静
张靖
YU Jing;ZHANG Jing
出处
《信息技术与信息化》
2021年第3期112-114,共3页
Information Technology and Informatization