摘要
现今主流的图像检索技术需人工添加数据集标签后,方可对深度学习网络进行训练。但人为添加标签会花费大量时间及精力,并且对图片标签的描述有一定的条件性和规则性,因此添加的标签不能够很好地代表大众的视觉习惯,不利于神经网络的深度训练,得到的结果准确率不尽如人意。为解决这些问题,文中提出了一种基于提取标签显著性区域的深度学习图像检索方法。首先,对图片集进行网络标签粗过滤,去除与图片无关的噪声标签;其次,提取已知图像的显著性区域,对显著性区域标签进行向量化;将确定显著性区域图像的三元组作为VGG16网络的输入,通过三元组目标函数对图像进行学习;通过汉明距离的判断,得到检索的相似图片。实验对比表明,现有方法的准确率相比原有方法准确性提高了3%。
出处
《物联网技术》
2020年第9期54-57,共4页
Internet of things technologies
基金
西北大学大学生创新创业训练计划项目(2020387)。