残差增强的图像描述符被引量：3

Residual Enhanced Image Descriptor

下载PDF

导出

摘要针对增大视觉码书在提高图像全局描述符——局部特征聚合描述符(VLAD)精度的同时会增加VLAD存储开销的问题,提出一种基于2层结构层次视觉码书生成残差增强的图像全局描述符EVLAD.离线码书生成阶段,首先通过K-means算法生成第1层视觉码书,然后基于量化残差最小化原则非均匀地生成第2层各视觉子码书.在线EVLAD生成阶段,图像局部特征首先面向细粒度的第2层视觉子码书生成量化残差;然后面向第1层视觉码书进行聚集生成各子向量,EVLAD即为各子向量的串联结果,为了抑制特征空间爆发现象,各子向量和串联结果分别进行了L2归一化.实验结果表明,EVLAD精度优于VLAD和其他各种改进方法. For VLAD, higher search accuracy will be obtained by increasing the size of visual codebook, but more memory usage is entailed. To solve the contradiction between search quality and memory usage, a global image descriptor called EVLAD, aggregating finer residual by use of hierarchical visual codebook with two-layer structure, is proposed. In the offline preprocessing stage, firstly, the first layer visual codebook is learned with K-means in the local descriptor space, and then each visual sub-codebook of the second layer is generated non-uniformly based on the quantization residual minimization criterion. In the online generation stage, the idea of EVLAD is associating the residual generation and accumulation process to different layer visual words, i.e., for a local descriptor, the residual, which is generated by subtracting the second layer nearest visual word from the local descriptor, is summed to a vector corresponding to one of the first layer visual word, and then EVLAD is the concatenation of all vector. In order to suppress the burst phenomena in feature space, L2 -normalization is employed for each subsector and the final concatenation vector. The experimental result shows our EVLAD outperforms VLAD and other modified strategies.

作者魏本昌郑丽管涛 Wei Benchang;Zheng Li;Guan Tao(School of Electrical and Information Engineering,Hubei University of Automotive Technology,Shiyan 442002;School of Computer Science & Technology,Huazhong University of Science and Technology,Wuhan 430074)

机构地区湖北汽车工业学院电气与信息工程学院华中科技大学计算机科学与技术学院

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第6期1039-1045,共7页 Journal of Computer-Aided Design & Computer Graphics

基金国家自然科学基金(61272202) 湖北汽车工业学院博士基金(BK201603)

关键词图像描述符层次视觉码书 L2归一化积量化 image descriptor hierarchical visual codebook L2-normalization production quantization

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1庄连生,费驰,钟航世,俞能海.D-SIFT:一种面向DCT域的扩展SIFT特征[J].计算机辅助设计与图形学学报,2015,27(10):1859-1864. 被引量：2
2袁红亮,吴付坤,郑昌文.用SURE引导自适应采样与采样颜色直方图重构[J].计算机辅助设计与图形学学报,2016,28(4):533-539. 被引量：1
3胡大盟,黄伟国,杨剑宇,朱忠奎.改进离散曲线演化的形状匹配算法[J].计算机辅助设计与图形学学报,2015,27(10):1865-1873. 被引量：13

二级参考文献57

1Datta R, Joshi D, Li J, et al. Image retrieval: ideas, influences,and trends of the new age[J]. ACM Computing Surveys, 2008,40(2): Article No.5.
2Chen D M, Girod B. Memory-efficient image databases formobile visual search[J]. IEEE MultiMedia Magazine, 2014,21(1) : 14-23.
3Lowe D G. Distinctive image features from scale-invariantkeypoints[J]. International Journal of Computer Vision, 2004,60(2) : 91-110.
4Chandrasekhar V, Takacs G, Chen D M, et al. Compressed histogramof gradients: a low-bitrate descriptor[J]. InternationalJournal of Computer Vision, 2012, 96(3) : 384-399.
5Bay H, Ess A, Tuytelaars T, van Gool L, et al. SURF: speededup robust features[M] //Lecture Notes in Computer Science.Heidelberg: Springer, 2006, 3951: 404-417.
6Ke Y, Sukthankar R. PCA-SIFT: a more distinctive representationfor local image descriptors[C] //Proceedings of the IEEEInternational Conference on Computer Vision and PatternRecognition. Los Alamitos: IEEE Computer Society Press,2004 : 506-513.
7Morel J M, Yu G S. ASIFT: a new framework for fully affineinvariant image comparison[J]. SIAM Journal on Imaging Sciences,2009, 2(2) : 438-469.
8Zhuang L S, Zhao R, Yu N H, et al. SVD based linear filteringin DCT domain[C] //Proceedings of the 17th IEEE InternationalConference on Image Processing. Los Alamitos: IEEEComputer Society Press, 2010 : 2769-2772.
9Jiang J M, Feng G C. The spatial relationship of DCT coefficientsbetween a block and its sub-blocks[J]. IEEE Transactionson Signal Processing, 2002, 50(5) : 1160-1169.
10Kresch R, Merhav N. Fast DCT domain filtering using the DCTand the DST[J]. IEEE Transactions on Image Processing, 1999,8(6) : 821-833.

共引文献13

1杨滨,陈先意,胡伟峰.基于阴影检测模型的图像拼接盲取证[J].应用科学学报,2016,34(5):564-574. 被引量：1
2孙国栋,张杨,李萍,梅术正,赵大兴.用于快速形状匹配的精确型高度函数特征描述[J].光学精密工程,2017,25(1):224-235. 被引量：5
3黄汝田,董明利,骆飞,孙鹏.基于消失点列的形状识别方法[J].计算机工程与设计,2018,39(5):1433-1438. 被引量：1
4崔羽帆,贺赛先.基于CPDH和三角形面积的形状匹配算法[J].激光杂志,2018,39(11):71-78.
5陶易之,贺赛先.以多尺度三角形为特征的快速形状匹配[J].计算机辅助设计与图形学学报,2017,29(3):469-478. 被引量：3
6王江辉,吴小俊.基于协同传递机制的形状匹配算法[J].计算机应用与软件,2018,35(4):215-219.
7王江辉,吴小俊.基于形状轮廓特征的金字塔匹配算法[J].计算机工程与应用,2019,55(1):191-195. 被引量：17
8吴帆,邓作杰.一种基于RMSHF形状描述符的服装图像匹配算法[J].湖南工程学院学报（自然科学版）,2019,29(3):44-47.
9宋建辉,樊思萌,于洋,刘砚菊.一种改进的图像轮廓离散曲线演化算法研究[J].沈阳理工大学学报,2019,38(2):15-19.
10王世洋,陈旺,武豪放.基于DenseNet的人脸脸型分类研究[J].软件导刊,2020,19(9):210-214. 被引量：5

同被引文献11

1叶南,王薇,于福翔,雷金周.立体视觉和坐标网格法测量应力应变曲线的技术研究[J].机械科学与技术,2018,37(1):100-107. 被引量：3
2石磊,朱洪海,于雨,崔晓,惠力,初士博,杨立,杨书凯,周扬.基于双目立体视觉的波浪参数遥测方法研究[J].电子测量与仪器学报,2019,31(3):99-104. 被引量：15
3朱世昕,杨泽民.基于半直接方法的序列影像直线特征跟踪匹配算法[J].计算机科学,2019,46(B06):270-273. 被引量：8
4贾迪,李玉秀,赵明远,朱宁丹.面向像对直线特征匹配的线特征矫正与提纯方法[J].中国图象图形学报,2019,24(7):1176-1187. 被引量：5
5唐祎玲,江顺亮,徐少平,刘婷云,李崇禧.基于眼优势的非对称失真立体图像质量评价[J].自动化学报,2019,45(11):2092-2106. 被引量：7
6杨伟姣,杨先海.结合Harris算子和极线约束改进的SIFT立体匹配算法[J].高技术通讯,2019,29(11):1082-1086. 被引量：5
7吴泽斌,于俊清,何云峰,管涛.一种用于图像检索的多层语义二值描述符[J].计算机学报,2020,43(9):1641-1655. 被引量：5
8孙明思,赵宏伟,赵浩宇,王也然.利用空间分布熵的改进VLAD图像检索[J].光学精密工程,2021,29(1):152-159. 被引量：2
9孙日明,李江道,林婷婷,李荣华,季霖.空间失稳目标线阵成像畸变校正方法[J].红外与激光工程,2019,48(9):280-289. 被引量：6
10韩伟佳,王国伟,孙亚东,李超然.基于立体视觉的光谱聚类算法在目标识别中的研究[J].激光杂志,2019,40(5):23-26. 被引量：1

引证文献3

1余海燕.基于多目立体视觉的体育舞蹈错误动作校正方法[J].赤峰学院学报（自然科学版）,2020,36(7):100-104. 被引量：2
2艾列富,陶勇,蒋常玉.基于全局注意力的正交融合图像描述符[J].图学学报,2024,45(3):472-481.
3陶勇,艾列富.图像检索中融合扩展码字软分配的图像描述符[J].安庆师范大学学报（自然科学版）,2024,30(2):69-76.

二级引证文献2

1许诚,金庆红.基于多特征融合的复杂舞蹈动作识别[J].安徽工程大学学报,2022,37(3):64-69. 被引量：1
2黄攀,张宇.基于动作捕捉传感器的民族舞蹈动作自动识别系统[J].自动化与仪器仪表,2022(8):267-271. 被引量：4

1DAI Yi-min,NIU Lan-li,ZOU Jia-qi,LIU Dan-yang,LIU Hui.Estimation of thermal decomposition temperatures of organic peroxides by means of novel local and global descriptors[J].Journal of Central South University,2018,25(7):1535-1544.
2荣智慧.外星人,有吗?[J].南风窗,2019,0(3):94-96.
3任翔宇,董晨,何林鸿,马杰涛,蒋泽宇.基于用户-标签-项目的特征聚合推荐算法研究[J].信息记录材料,2019,20(4):145-147.
4崔雪红,刘云,王传旭,李辉.高显著性的时空金字塔精简描述符算法研究[J].计算机工程与应用,2018,54(1):210-216. 被引量：1
5贺思源,王胜意.甲烷水合物在冰粉和铁粉混合物中的生成过程[J].广东化工,2019,46(1):68-70.
6侯美玲.爆发[J].青年博览,2019,0(2):35-35.
7郑义,董朝晖,董丽娟,孙利华.我国上市医药企业技术创新效率及影响因素研究[J].现代商贸工业,2019,40(18):12-16. 被引量：5
8于夕媛,陈润泽.大数据“杀熟”的法律规制[J].经济师,2019(5):56-57. 被引量：6
9王聪,韩大洋.太空时代新天气预报——空间天气[J].知识就是力量,2019(3):35-37.
10邓时滔,干阳琳,赵乾.关键词抽取在协同管理中的应用[J].科技创新导报,2019,16(4):200-201.

计算机辅助设计与图形学学报

2019年第6期

浏览历史

内容加载中请稍等...

残差增强的图像描述符被引量：3

参考文献3

二级参考文献57

共引文献13

同被引文献11

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

残差增强的图像描述符 被引量：3

参考文献3

二级参考文献57

共引文献13

同被引文献11

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

残差增强的图像描述符被引量：3