摘要
图像的局部聚合描述符向量(Vector of Locally Aggregated Descriptor, VLAD)在图像检索和识别任务中被证明是一种高效的方法。随着码书的增大,描述符的精度会提高,但随之而来的是训练成本和描述符存储成本的显著增加。在确保描述符大小不变的前提下,文章提出一种通过聚合近似最近邻向量残差的图像描述符,以提升描述符的表征能力。在码书的训练阶段,使用K-means聚类算法对图像局部特征进行训练,以形成视觉词典。在描述符的生成阶段,基于图像局部视觉单词与多个近邻码字的距离进行分配,聚合局部特征向量和近邻码字的残差。最后,通过串联累加码书各码字的残差向量,形成近似最近邻向量残差描述符。在两个国际公开数据集上的图像检索实验中,与其他描述符进行比较,结果显示聚合近似最近邻残差向量描述符在平均检索精度上具有一定的优势。
出处
《电脑知识与技术》
2024年第25期36-39,共4页
Computer Knowledge and Technology
基金
安徽省高校质量工程项目“课程思政视域下基于OBE的地方应用型软件工程人才培养模式创新与实践”(编号:2022jyxm494)
安徽省高校优秀拔尖人才培育项目“应用型本科软件工程专业新工科建设研究”(编号:gxbjZD2022087)。