基于CSPPNet与集成学习的人类蛋白质图像分类方法被引量：3

Classification Method for Human Protein Images Based on CSPPNet and Ensemble Learning

下载PDF

导出

摘要人类蛋白图像分类的目的是识别蛋白质细胞器中的细胞核浆、核膜等定位标签。针对蛋白质分类数据集大、多标签类别不平衡以及类间差异小等问题,结合CSPPNet与集成学习,提出一种人类蛋白质图像分类方法。该方法构建了粗细结合的CSPPNet模型,且将该模型前几层卷积生成的特征图加入空间金字塔池化层,并与模型后期卷积生成的特征图相结合,同时利用图片的整体特征和局部特征自动检测图片差异,以提高细粒度图像分类问题的精度,再通过集成学习的方法来进一步提升准确率。实验结果表明,相比经典卷积神经网络(CNN),该模型的精度与F1值均有所提升。 The purpose of classification of human protein images is to identify the localization labels such as nucleus plasma and nuclear membrane in protein organelles.To address the large scale of protein classification data sets,imbalance of multi-label categories and small differences between classes,combining CSPPNet and ensemble learning,this paper proposes a classification method for human protein images.This method constructs a CSPPNet model that combines coarse-grained identification and fine-grained identification.The feature maps generated by the first few layers of the model are added to the spatial pyramid pooling layer,and combined with the feature map generated by the later convolution of the model.The overall features and local features are used to automatically detect differences in pictures to improve the precision of fine-grained image classification,and then ensemble learning is used to further improve accuracy.The experimental results show that the accuracy and F1 value of the model are improved compared with the classic convolutional neural network(CNN).

作者李培媛黄迟 LI Peiyuan;HUANG Chi(College of Mathematics,Taiyuan University of Technology,Taiyuan 030024,China;School of Information and Engineering,Southwestern University of Finance and Economics,Chengdu 611130,China)

机构地区太原理工大学数学学院西南财经大学信息与工程学院

出处《计算机工程》 CAS CSCD 北大核心 2020年第8期235-242,共8页 Computer Engineering

基金国家自然科学基金(61603268)。

关键词蛋白质亚细胞定位图像分类空间金字塔池化细粒度识别集成学习 protein subcellular localization image classification Spatial Pyramid Pooling(SPP) fine-grained identification ensemble learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1时增林,叶阳东,吴云鹏,娄铮铮.基于序的空间金字塔池化网络的人群计数方法[J].自动化学报,2016,42(6):866-874. 被引量：38
2杨志豪,洪莉,林鸿飞,李彦鹏.基于支持向量机的生物医学文献蛋白质关系抽取[J].智能系统学报,2008,3(4):361-369. 被引量：20
3王宇伟,牛耘,魏欧.基于相似性混合模型的蛋白质交互识别[J].计算机工程,2015,41(7):25-30. 被引量：2
4夏胡云,叶学义,罗宵晗,王鹏.多尺度空间金字塔池化PCANet的行人检测[J].计算机工程,2019,45(2):270-277. 被引量：9
5李富,孙子文.手势识别身份认证的连续隐马尔可夫模型[J].小型微型计算机系统,2018,39(3):474-477. 被引量：5

二级参考文献60

1王煜,白石,王正欧.用于Web文本分类的快速KNN算法[J].情报学报,2007,26(1):60-64. 被引量：33
2[1]PUSTEJOVSKY J,CASTANO,ZHANG J.Robust relational parsing over biomedical literature:extracting inhibit relations[C]// Proceedings of the Seventh Pacific Symposium on Bio-Computing.[S.l.],2002:362-373.
3[2]LEROY G,CHEN H,MARTINEZ J D.A shallow parser based on closed-class words to capture relations in biomedical text[J].Journal of Biomedical Informatics,2003,36(3):145-158.
4[3]PARK J C,KIM H S,KIM J J.Bidirectional incremental parsing for automatic pathway identification with combinatory categorical grammar[C]// Proceedings of the Pacific Symposium on Bio-Computing.Hawaii,USA,2001:396-407.
5[4]TEMKIN J M,GILDER M R.Extraction of protein interaction information from unstructured text using a context-free grammar[J].Bioinformatics,2003,19:2046-2053.
6[5]AHMED S T,CHINDAMBARAM D,DAVULCU H,et al.IntEx:a syntactic role driven protein-protein interaction extractor for bio-medical text[C]// Proceeding of the ACL-ISMB Workshop on Linking Biological Literature,Ontologies and Databases:Mining Biological Semantics.Detroit,Michigan,USA,2005:54-61.
7[6]ONO T,HISHIGAKI H,TANIGAMIi A,et al.Automatic extraction of information on protein-protein interactions from the biological literature[J].Bioinformatics,2001,17 (2):155-161.
8[7]HUANG M L,ZHU X Y,HAO Y,et al.Discovering patterns to extract protein-protein interactions from full texts[J].Bioinformatics,2004,20 (18):3604-3612.
9[8]DAVID C,BEMARD B,WILLIAM L,et al.BioRAT:extracting biological information from full-length papers[J].Bioinformatics,2004,20(17):3206-3213.
10[9]ANDRADE M A,VALENICA A.Automatic extraction of keywords from scientific text:application to the knowledge domain of protein families[J].Bioinformatic,1998,14(7):600-607.

共引文献69

1谭建奇,廖贤平,黄孝庭,陈振洲.SVM在临床医学中的应用[J].海南医学,2009,20(9):134-137. 被引量：2
2张克菊,韩毅.关系抽取技术的发展与应用——以生物信息学为例[J].情报科学,2010,28(1):102-106. 被引量：1
3吴明智,崔雷.生物医学实体关系抽取的研究[J].中华医学图书情报杂志,2010,19(5):5-10. 被引量：5
4王秀艳,崔雷.应用关键动词抽取生物医学实体间语义关系研究综述[J].现代图书情报技术,2011(9):21-27. 被引量：1
5王宇伟,牛耘.基于关系相似性的蛋白质交互作用识别[J].计算机技术与发展,2015,25(2):42-46. 被引量：3
6王宇伟,牛耘,魏欧.基于相似性混合模型的蛋白质交互识别[J].计算机工程,2015,41(7):25-30. 被引量：2
7吴红梅,牛耘.基于特征加权的蛋白质交互识别[J].计算机技术与发展,2016,26(2):114-117. 被引量：3
8张景,吴红梅,牛耘.基于Minimum Cuts的蛋白质交互识别[J].计算机技术与发展,2017,27(6):17-21. 被引量：1
9刘曼,彭月平,姜源.基于可变矩形框的人群密度数值估计算法研究[J].科学技术与工程,2017,17(17):266-271. 被引量：5
10刘曼,彭月平,姜源.基于小波包分解和分形法的人群密度等级分类算法研究[J].中国科技论文,2017,12(17):1981-1987. 被引量：2

同被引文献16

1周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1726
2刘文涛,李世华,覃驭楚.基于全卷积神经网络的建筑物屋顶自动提取[J].地球信息科学学报,2018,20(11):1562-1570. 被引量：29
3田萱,王亮,丁琪.基于深度学习的图像语义分割方法综述[J].软件学报,2019,30(2):440-468. 被引量：225
4李敏,李红娇,陈杰.差分隐私保护下的Adam优化算法研究[J].计算机应用与软件,2020,37(6):253-258. 被引量：18
5蔡兴泉,魏岳超,孙海燕.基于风格解耦和自适应层实例归一化的图像翻译方法[J].科学技术与工程,2021,21(17):7249-7257. 被引量：2
6刘清岗.基于AR的线上线下混合式教学App的设计与实现[J].微型电脑应用,2021,37(7):90-93. 被引量：5
7王瑜琳,卢文,宋涛,徐晓灵,洪政,钱欣丽.基于改进的YOLOv3行人检测方法[J].河南科技,2021,40(33):11-14. 被引量：2
8Xiaofang HU,Wenqiang SHI,Yue ZHOU,Hongan TANG,Shukai DUAN.Quantized and adaptive memristor based CNN(QA-mCNN)for image processing[J].Science China(Information Sciences),2022,65(1):269-271. 被引量：4
9王一,马钲东,董光林.基于改进Faster RCNN的零件识别方法研究[J].应用光学,2022,43(1):67-73. 被引量：12
10朱文博,夏林聪,陈龙,吴晨睿,陈红光.基于改进YOLOv5的O型密封圈缺陷检测方法[J].上海理工大学学报,2022,44(5):440-448. 被引量：4

引证文献3

1唐浩漾,张小媛,钱萌,王燕.压缩激励卷积神经网络的蛋白质亚细胞定位[J].计算机仿真,2022,39(7):461-465.
2罗红郊,张永敏,马晓琴.基于改进自注意力机制的电力场景目标检测技术[J].微型电脑应用,2024,40(1):5-8. 被引量：1
3刘达,朱兆优,叶海鹏,黄熙,王海洋.基于改进YOLOv5的酒瓶缺陷检测方法研究[J].机电工程技术,2024,53(3):211-215.

二级引证文献1

1张国梁,杜泽旭,张屹,王博,陈江琦,张希.面向电网设备缺陷识别的多模态感知模型的构建与优化[J].人工智能科学与工程,2024(3):36-41.

1钟航,梁明荣,张昌莲,黄晓凤,刘作兰,张克山,薛佳佳,李琴,龙吉华,郑龙光.四川白鹅蛋氨基酸的测定和分析[J].畜禽业,2019,30(12):6-7. 被引量：3
2倪涛,刘海强,王林林,邹少元,张红彦,黄玲涛.基于双向长短期记忆模型的起重机智能操控方法[J].吉林大学学报（工学版）,2020,50(2):445-453. 被引量：4
3杨海龙,田莹,王澧冰.目标检测模型的优化训练方法研究[J].辽宁科技大学学报,2020,43(2):129-134.
4杜章锦,龚勋,罗俊,章哲敏,杨菲.乳腺超声图像中易混淆困难样本的分类方法[J].中国图象图形学报,2020,25(7):1490-1500. 被引量：4
5李君伟,刘光帅,刘望华,陈晓文.多模式共生的彩色纹理图像分类方法[J].计算机应用研究,2020,37(7):2185-2188. 被引量：3
6胡莹,赵晓宇,杨海波,戴隆耀,贾蕾.认知相关基因的生化通路与蛋白质互作网络分析[J].航天医学与医学工程,2020,33(2):166-174. 被引量：2
7邓方舟,何南.一种基于特征融合的车辆图像分类方法[J].桂林师范高等专科学校学报,2020,34(3):132-135.
8徐景日.物联网平安医护系统设计与思考[J].福建电脑,2020,36(5):108-109.
9郑启文,车前子,陈思,马雨佳,周泽宸,武轶群,吴涛,胡永华,陈大方.基于系统生物学方法的2型糖尿病遗传易感标志物的挖掘[J].中国慢性病预防与控制,2020,28(2):101-105. 被引量：3
10张秋颖,金雪松.基于卷积神经网络和迁移学习的花卉图像分类[J].哈尔滨商业大学学报（自然科学版）,2020,36(3):323-327. 被引量：3

计算机工程

2020年第8期

浏览历史

内容加载中请稍等...

基于CSPPNet与集成学习的人类蛋白质图像分类方法被引量：3

参考文献5

二级参考文献60

共引文献69

同被引文献16

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于CSPPNet与集成学习的人类蛋白质图像分类方法 被引量：3

参考文献5

二级参考文献60

共引文献69

同被引文献16

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于CSPPNet与集成学习的人类蛋白质图像分类方法被引量：3