期刊文献+

面向检索的词袋聚类算法

原文传递
导出
摘要 从特征项的类条件概率密度分布的角度出发,提出一种在词袋模型下基于类条件概率分布的词项合并和聚类算法,该算法以样本相似度的损失函数作为评价准则模型并通过线性搜索寻找最优的新词簇集。实验表明,对于维数较高的数据集,该算法能够取得比较好的降维效果,而且相比较原始特征集的检索精度能达到较大幅度的提升。
作者 汤渊
出处 《信息与电脑(理论版)》 2015年第12期32-34,共3页 China Computer & Communication
  • 相关文献

参考文献4

  • 1陈小莉.基于信息增益的中文特征提取算法研究[D].重庆大学2008
  • 2Li Feifei,Perona P.A bayesian hierarchical model for learningnatural scene categories. IEEE Computer Society Conferenceon Computer Vision and Pattern Recognition . 2005
  • 3Kai-Bo Duan,Rajapakse, J.C.,Haiying Wang,Azuaje, F.Multiple SVM-RFE for gene selection in cancer classification with expression data. NanoBioscience, IEEE Transactions on . 2005
  • 4Pabitra Mitra,C. A. Murthy,Sankar K. Pal.Unsupervised Feature Selection Using Feature Similarity. IEEE Transactions on Pattern Analysis and Machine Intelligence . 2002

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部