一种用于在架图书书脊语义分割的山字形网络被引量：1

A Mountain-Shaped Network for Semantic Segmentation of Book Spines on-Shelves

下载PDF

导出

摘要在图像中识别在架书脊信息有助于实现更便捷的图书盘点,也可能实现即拿即走等更流畅的读者借阅体验,而书脊区域精确分割是重要前提。区别于普通目标分割,该分割问题的难点在于书脊的密集性及重复性。本文提出一种山字形深层神经网络结构,包含一个编码器及两个解码器。其中一个解码器为书脊分割主通道,另一个则结合书脊边界信息以融入更多的书脊边缘细节。另外,本文建立了一个书脊图像样本集,包含661张图像及15,454个手工标注的书脊实例。实验结果表明,提出的网络模型对书籍一类密集目标图像语义分割具有较高精度,在建立的样本集中具有约90%的均值交并比以及约95%的平均像素精度,性能优于经典的分割模型,验证了提出模型的有效性。 Identifying book spine on-shelves in the image can achieve a more convenient book inventory and is possible to realize a better reader experience, such as take-and-go. Segmentation of the spine region is their important prerequisite. Different from ordinary target segmentation, the difficulty of this segmentation problem lies in that the spines are densely-packed and repeating. In this paper, a mountain-shaped deep neural network structure is proposed, which consists of one encoder and two decoders. One of the decoders is the main segmenting channel for the spine, and the other combines the spine interval information to incorporate more spine edge details. In addition, this research establishes a spine image sample dataset, including 661 images with 15,454 manually labeled polygons. The experimental results show that the proposed network model has high accuracy for semantic segmentation of dense target like book spine images, and has an average intersection ratio of 90% and an average pixel accuracy of 95% in the established dataset. The performance is better than the classical segmentation models, which verifies the effectiveness of the proposed model.

作者曾文雯杨阳钟小品

机构地区深圳大学图书馆深圳大学机电与控制工程学院

出处《图像与信号处理》 2020年第4期218-225,共8页 Journal of Image and Signal Processing

关键词智慧图书馆图书书脊语义分割深度神经网络 Smart Library Book Spine Semantic Segmentation Deep Neural Network

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献1

1田萱,王亮,丁琪.基于深度学习的图像语义分割方法综述[J].软件学报,2019,30(2):440-468. 被引量：236

二级参考文献4

1刘建伟,黎海恩,罗雄麟.概率图模型学习技术研究进展[J].自动化学报,2014,40(6):1025-1044. 被引量：23
2宋熙煜,周利莉,李中国,陈健,曾磊,闫镔.图像分割中的超像素方法研究综述[J].中国图象图形学报,2015,20(5):599-608. 被引量：98
3魏云超,赵耀.基于DCNN的图像语义分割综述[J].北京交通大学学报,2016,40(4):82-91. 被引量：44
4姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄.基于内容的图像分割方法综述[J].软件学报,2017,28(1):160-183. 被引量：133

共引文献235

1潘泽民,覃亚丽,郑欢,王荣芳,任宏亮.基于深度神经网络的块压缩感知图像重构[J].计算机科学,2022,49(S02):510-518. 被引量：5
2李欣,杨懿,王宁,顾海燕,丁少鹏,李海涛.遥感影像样本自动生成与智能迭代分类方法[J].测绘科学,2022,47(8):197-203. 被引量：3
3赵敬伟,林珊玲,梅婷,林志贤,郭太良.基于YOLACT与Transformer相结合的实例分割算法研究[J].半导体光电,2023,44(1):134-140. 被引量：2
4项岱军,张天健,薛朝辉.基于改进DeepLabV3+的超高分辨率遥感光伏板识别与分割研究[J].现代测绘,2022,45(S01):37-45.
5杨明先.搞好配套服务,促进农村奶牛的发展[J].四川奶牛,2000(1):2-3.
6于凤军.x^3振荡器及其周期[J].工科物理,2000,10(4):20-21.
7刘桂雄,何彬媛,吴俊芳,林镇秋.面向视觉检测的深度学习图像分类网络及在零部件质量检测中应用[J].中国测试,2019,45(7):1-10. 被引量：17
8邝辉宇,吴俊君.基于深度学习的图像语义分割技术研究综述[J].计算机工程与应用,2019,55(19):12-21. 被引量：50
9于宁,宋海玉,孙东洋,王鹏杰,姚金鑫.基于深度学习中间层卷积特征的图像标注[J].图学学报,2019,40(5):872-877. 被引量：7
10赵霞,白雨,倪颖婷,陈萌,郭松,杨明川,陈凤.基于深度学习的语义分割算法综述[J].上海航天,2019,36(5):71-82. 被引量：7

同被引文献3

1康洪雷,牛连强,冯庸,秦月,鄂雪娇,刘宇航.基于视觉的错序在架图书检测系统[J].软件工程,2018,21(4):18-22. 被引量：3
2崔晨,任明武.一种基于文本检测的书脊定位方法[J].计算机与数字工程,2020,48(1):178-182. 被引量：1
3曾文雯,杨阳,钟小品.基于改进Mask R-CNN的在架图书书脊图像实例分割方法[J].计算机应用研究,2021,38(11):3456-3459. 被引量：4

引证文献1

1姬晓飞,张可心,唐李荣.改进DeepLabv3+网络的图书书脊分割算法[J].计算机应用,2023,43(12):3927-3932. 被引量：2

二级引证文献2

1王宇,潘景浩,巫朝明,陈宗岩,王雅宁,谢跃.基于手势识别的DeepLabV3+算法研究[J].现代信息科技,2024,8(18):39-42.
2梁嘉韵,温喜廉,杨智诚,陈广浩,杨永民.基于语义分割的建筑工地区域自动识别研究[J].建筑施工,2024,46(12):1946-1950.

1郭琳,林伟.移动支付在公共图书馆中的应用——以福建省图书馆为例[J].福建图书馆学刊,2020,3(3):16-19.
2崔晨,任明武.一种基于文本检测的书脊定位方法[J].计算机与数字工程,2020,48(1):178-182. 被引量：1
3李煌,王晓莉,项欣光.基于文本三区域分割的场景文本检测方法[J].计算机科学,2020,47(11):142-147. 被引量：8
4魏小娜,邢嘉祺,王振宇,王颖珊,石洁,赵地,汪红志.基于改进U-Net的关节滑膜磁共振图像的分割[J].计算机应用,2020,40(11):3340-3345. 被引量：7
5李鼎,艾伦.高中数字化实验实施影响因素研究[J].课程．教材．教法,2020,40(11):116-122. 被引量：5
6刘柯,李旭健.水下和微光图像的去雾及增强方法[J].光学学报,2020,40(19):67-79. 被引量：22
7陈恒.华东能源监管局与安徽电力联合抗洪[J].中国电业,2020(9):75-75.
8张夏豪,张宁.基于MSER结合投影法的路牌信息分割方法[J].长春理工大学学报（自然科学版）,2020,43(5):23-27.
9武尧,刘振宇,谷亚宁.基于机器视觉的多目标sar图像阈值分割仿真[J].计算机仿真,2020,37(10):441-444. 被引量：3
10曹国强,郗崇智,王琳霖.改进非下采样剪切波在缺陷图像中的边缘处理[J].计算机仿真,2020,37(10):168-172. 被引量：2

图像与信号处理

2020年第4期

浏览历史

内容加载中请稍等...

一种用于在架图书书脊语义分割的山字形网络被引量：1

参考文献1

二级参考文献4

共引文献235

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种用于在架图书书脊语义分割的山字形网络 被引量：1

参考文献1

二级参考文献4

共引文献235

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种用于在架图书书脊语义分割的山字形网络被引量：1