基于点击数据的图像识别

Image recognition based on click data

下载PDF

导出

摘要随着细粒度图像分类研究的不断深入,用户点击数据逐渐被人们当成可靠的语义特征。由于用户点击数据集规模巨大且存在大量冗余,直接使用点击特征进行识别也存在诸多挑战。该文提出利用文本聚类降低文本空间并优化原始点击特征,从而建立精简的文本空间来表征图像,该方法能更好地合并语义相近的文本。在微软发布的Clickture-Dog大数据集上进行的大量实验表明,点击向量特征优于传统图像的视觉特征,图像识别任务中的准确率也更高;基于视觉相似度的传播算法能帮助提高点击特征的表征能力;在大规模文本聚类中,基于稀疏编码的聚类方式识别率达到了58.24%。 For fine⁃grained image classification and recognition,users’click information are proved to be useful for construct image semantic features.With user⁃click data each image is represented as query⁃click⁃frequency vector.Compared with traditional visual features.However,due to the redundancy and huge size of the text set,there are also many challenges in using the click feature directly for classification and recognition.This paper proposes to use text clustering to reduce the text space and optimize the original click feature,so as to establish compact and effective text space to represent the image.This method can better merge semantically similar text.Extensive experiments have been carried out on Clickture⁃Dog dataset.Experimental results show that in image representation,click vector feature is superior to traditional image visual feature,and the accuracy of image recognition task is higher;The propagation algorithm based on visual similarity can help improve the representations of click features;In the large text clustering,the accuracy of clustering method based on sparse coding has reached 58.24%.

作者吴炜晨许衍 WU Weichen;XU Yan(The 36th Institute of CETC(China Electronics Technology Group Corporation),Jiaxing 314000,China)

机构地区中国电子科技集团公司第三十六研究所

出处《电子设计工程》 2023年第8期101-104,109,共5页 Electronic Design Engineering

关键词细粒度图像分类点击特征语义特征文本空间图像识别 fine⁃grainedimageclassification clickfeature semanticfeatures textspace imagerecognition

分类号 TN919.82 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1方振东,汪峰坤.一种支持权重的改进K-means聚类算法[J].新乡学院学报,2018,35(3):26-28. 被引量：2
2马钰,莫路锋.通过密度思想和聚类有效性指标改进的K-means算法[J].现代电子技术,2021,44(17):120-123. 被引量：9
3王伟,谭松荣.面向大数据分析的在线学习算法研究[J].计算机产品与流通,2019,0(2):224-224. 被引量：3
4汪云,曾平,谢小义.基于大数据分析的在线学习算法理论探究[J].科学咨询,2020(32):112-113. 被引量：2
5周本金,陶以政,纪斌,谢永辉.最小化误差平方和k-means初始聚类中心优化方法[J].计算机工程与应用,2018,54(15):48-52. 被引量：35
6孟广仕.图像识别技术在人工智能中的应用[J].信息与电脑,2018,30(12):152-153. 被引量：18
7亓晓振,王庆.一种基于稀疏编码的多核学习图像分类方法[J].电子学报,2012,40(4):773-779. 被引量：31

二级参考文献61

1王惠文.变量多重相关性对主成分分析的危害[J].北京航空航天大学学报,1996,22(1):65-70. 被引量：17
2任江涛,施潇潇,孙婧昊,黄焕宇,印鉴.一种改进的基于特征赋权的K均值聚类算法[J].计算机科学,2006,33(7):186-187. 被引量：10
3D Nister, et al. Sealable recognition with a vocabulary tree [ A]. Proceeding of IEEE Conference on Computer Vision and Pattern Recognition [ C ]. USA: IEEE Press, 2006. 2161 - 2168.
4S Lazebnik, C Schmid, J Ponce. Beyond bag of features: spatial pyramid matching for recognizing natural scene categories [ A]. Proceeding of IEEE Conference on Computer Vision and Pattern Recognition [ C]. USA: IEEE Press,2006.2169 - 2178.
5M Varma, D Ray. I.gaming the discriminative power- invari- ance trade-off[ A ]. Proceeding of International Conference on Computer Vision [ C]. USA: IEEE Press,2007.1 - 8. object categories [ OL ]. http://www, vision, caltech, edu/feifeili/ Data sets. han,2003.9.
6H Lee,A Battle,R Raina,A Y Ng. Efficient sparse coding al- gorithms [ A ]. Proceeding of Advances in Neural Information Processing System[C]. Canada:NIPS Press,2007. 801 - 808.
7J Yang, K Yu, Y Gong, T Huang. Linear spatial pyramid matching using sparse coding for image classification [ A ]. Proceeding of IEEE Conference on Computer Vision and Pat- tern Recognition [ C]. USA: IEEE Press,2009. 1794 - 1801.
8F-F Li,A Oliva. Fifteen scene categories [OL]. http://www- ew. ai. uiuc. edu/ponce_ grp/data/,2006.10.
9J F Bonnans, A Shapiro. Perturbation Analysis of Optimization Problems [M] .Springer,2000.
10O ChapeUe, V Vapnik, O Bousquet, S Mukherjee. Choosing multiple parameters for support vector machines [ J ]. Machine Learning,2002,46(1-3) : 131 - 159.

共引文献92

1黄鹤,李潇磊,王珺,王会峰,茹锋.基于随机跳跃蝠鲼算法优化的电影信息数据聚类[J].南京大学学报（自然科学版）,2022,58(5):856-867.
2宋相法,焦李成.基于稀疏编码和集成学习的多示例多标记图像分类方法[J].电子与信息学报,2013,35(3):622-626. 被引量：14
3胡正平,李静.基于低秩子空间恢复的联合稀疏表示人脸识别算法[J].电子学报,2013,41(5):987-991. 被引量：44
4姜明新,王洪玉,王洁,王彪.基于ML和L2范数的视频目标跟踪算法[J].电子学报,2013,41(11):2307-2313. 被引量：10
5季海峰,高隽,郑鹏,王婧.多尺度空间判别性概率潜在语义分析的场景分类[J].中国图象图形学报,2014,19(1):109-118. 被引量：2
6罗会兰,郭敏杰,孔繁胜.集成多特征与稀疏编码的图像分类方法[J].模式识别与人工智能,2014,27(4):345-355. 被引量：7
7甘玲,谷伟庆.组合金字塔和多核学习的图像分类方法[J].小型微型计算机系统,2014,35(7):1642-1646. 被引量：2
8张佳宇,彭力.基于联合动态稀疏表示方法的多图像人脸识别算法[J].江南大学学报（自然科学版）,2014,13(3):287-291. 被引量：1
9杨赛,赵春霞.基于空间概率乘积核函数的图像分类算法[J].南京理工大学学报,2014,38(3):325-331. 被引量：5
10李利正,黄煜栋,陈平生.正则化双阶线性稀疏编码在人脸识别中的应用[J].计算机应用与软件,2014,31(11):222-224.

1缪青,袁君煊.空间视角下杨廉诗歌刍议[J].甘肃开放大学学报,2023,33(1):41-46.
2魏冲冲.第三空间的开放与流动——以《路边野餐》为例[J].美与时代（美学）（下）,2023(3):122-125. 被引量：1
3夏丽华.巧用小人书培养大班幼儿表征能力[J].动漫界（幼教365）,2023(12):92-93.
4蒋海燕.户外建构游戏中大班幼儿表征能力培养[J].天津教育,2023(8):180-182.
5汪希平.《沉没之鱼》空间叙事琐谈[J].绥化学院学报,2022,42(11):56-58. 被引量：1
6李小奇.李白诗文园林文化空间的建构与续构[J].新疆大学学报（哲学社会科学版）,2023,51(1):122-129. 被引量：2
7武锐,贾振红.基于多通道融合和组稀疏编码的视频去雪算法[J].新疆大学学报（自然科学版）（中英文）,2023,40(1):69-78. 被引量：1
8林莉.学前儿童理解和使用空间表征的特点与教育建议[J].学前教育,2023(7):8-11.
9刘继承,吴昊,王文伟,胡静波.结合深度神经网络的特征选择算法研究[J].武汉理工大学学报（信息与管理工程版）,2023,45(1):49-53. 被引量：4
10张锦,张建忠,汪飞,郭芊.海量公交数据的人群画像算法[J].国防科技大学学报,2023,45(2):55-64. 被引量：2

电子设计工程

2023年第8期

浏览历史

内容加载中请稍等...

基于点击数据的图像识别

参考文献7

二级参考文献61

共引文献92

相关作者

相关机构

相关主题

浏览历史