传统的视觉词典模型(Bag of Visual Words Model,Bo VWM)中广泛存在视觉单词同义性和歧义性问题.且视觉词典中的一些噪声单词—"视觉停用词",也会降低视觉词典的语义分辨能力.针对这些问题,本文提出了基于近义词自适应软分配...传统的视觉词典模型(Bag of Visual Words Model,Bo VWM)中广泛存在视觉单词同义性和歧义性问题.且视觉词典中的一些噪声单词—"视觉停用词",也会降低视觉词典的语义分辨能力.针对这些问题,本文提出了基于近义词自适应软分配和卡方模型的图像目标分类方法.首先,该方法利用概率潜在语义分析模型(Probabilistic Latent Semantic Analysis,PLSA)分析图像中视觉单词的语义共生概率,挖掘图像隐藏的语义主题,进而得到语义主题在某一视觉单词上的概率分布;其次,引入K-L散度度量视觉单词间的语义相关性,获取语义相关的近义词;然后,结合自适应软分配策略实现SIFT特征点与若干语义相关的近义词之间的软映射;最后,利用卡方模型滤除"视觉停用词",重构视觉词汇分布直方图,并采用SVM分类器完成目标分类.实验结果表明,新方法能够有效克服视觉单词同义性和歧义性问题带来的不利影响,增强视觉词典的语义分辨能力,较好地改善了目标分类性能.展开更多
文摘传统的视觉词典模型(Bag of Visual Words Model,Bo VWM)中广泛存在视觉单词同义性和歧义性问题.且视觉词典中的一些噪声单词—"视觉停用词",也会降低视觉词典的语义分辨能力.针对这些问题,本文提出了基于近义词自适应软分配和卡方模型的图像目标分类方法.首先,该方法利用概率潜在语义分析模型(Probabilistic Latent Semantic Analysis,PLSA)分析图像中视觉单词的语义共生概率,挖掘图像隐藏的语义主题,进而得到语义主题在某一视觉单词上的概率分布;其次,引入K-L散度度量视觉单词间的语义相关性,获取语义相关的近义词;然后,结合自适应软分配策略实现SIFT特征点与若干语义相关的近义词之间的软映射;最后,利用卡方模型滤除"视觉停用词",重构视觉词汇分布直方图,并采用SVM分类器完成目标分类.实验结果表明,新方法能够有效克服视觉单词同义性和歧义性问题带来的不利影响,增强视觉词典的语义分辨能力,较好地改善了目标分类性能.