摘要
近年来,甲状腺癌发病率呈指数增长,在社会关注度与日俱增的同时,针对人类甲状腺组织的蛋白质亚细胞位置信息的注释已经成为生物信息学领域的研究热点。近年来,随着成像技术的突飞猛进,更加容易的获得高分辨率显微图片。传统的基于氨基酸序列的蛋白质亚细胞预测研究的成本昂贵、耗时长,工作量大,因此建立一种自动分析亚细胞模式预测系统来对蛋白质进行研究势在必行。基于这一点,本文着眼于人类甲状腺组织蛋白质图像,从人类蛋白质图谱库中整理出165个蛋白质中的761幅蛋白质图像的基准数据集进行实验。首先,对蛋白质图像中的蛋白质通道与DNA通道信号分离;然后,将分离出的蛋白质图像信号进行特征提取和特征选择,最后,训练基于支持向量机的分类器模型实现模式分类。实验结果表明,分类模型的识别精度高于现有文献报道的模型,预测准度为58.53%;另一方面,基于图像信号的蛋白质亚细胞定位预测可以很好地以辅助或代替人工注释工作,并具有辅助临床判断、缩短新型药物开发周期以及保障全民健康的宏观意义。