期刊文献+

基于知网语义相似度计算的特征降维方法研究 被引量:16

The Research on Reduced Feature Dimension Based on Hownet Similarity Computing
下载PDF
导出
摘要 针对文本分类处理中的高维度问题,结合知网语义词典,提出了一种新的特征降维处理方法。通过计算特征词汇之间的语义相似度,将原有特征集分成若干特征词集;同一词集内的特征词语义彼此间相似;而不同词集的特征词彼此间相似度比较小。将同一特征词集内的词汇权重相加,从而突出同义词以及近义词对文本分类的贡献,并可以大大降低文本比较的特征维数。实验结果表明,利用该方法在文本分类中得到了较好的分类准确率和分类性能。 (1. College of Computer & Comm, Hunan University , changsha 410082 ; 2.Changsha Aeronautical Vocational & TeChnical College, Changsha 410007 ;3. Longgang Technology & Information Bureau , Shenzhen 518000;4.Chuangzhi Information Technology Co, Ltd, Shenzhen 518057)
出处 《科学技术与工程》 2006年第21期3442-3446,共5页 Science Technology and Engineering
基金 湖南省科技计划项目(05JT1035) 广东省关键领域重点突破项目(2005A10207003) 湖南大学05年校基金资助
关键词 特征降维 文本分类 知网 reduced feature dimension ,Text classification, Hownetz
  • 相关文献

参考文献5

  • 1庞剑锋,卜东波,白硕.基于向量空间模型的文本自动分类系统的研究与实现[J].计算机应用研究,2001,18(9):23-26. 被引量:293
  • 2陈涛,谢阳群.文本分类中的特征降维方法综述[J].情报学报,2005,24(6):690-695. 被引量:79
  • 3[4]Calvo R A.,Partridge M.A comparative study of principal component analysis techniques.In:Proc Ninth Australian Conf On Neural Networks,Brisbane,QLD,1998
  • 4[5]Deerwester S,Dumais S T,Furnas G W,et al.Indexing by latent semantic analysis.Journal of the american Society for Information Science,1990 ;41 (6):391-407
  • 5[7]Yang Y,Liu X.Are-examination of text categorization methods.Proc of theACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR'99),Berkeley,1999:42-49

二级参考文献33

  • 1黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 2鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 4黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页
  • 5鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页
  • 6卜东波,博士学位论文,2000年
  • 7Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页
  • 8Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页
  • 9Apte C, Damerau F J, and Weiss S M. Automated learning of decision rules for text categorization. ACM Transactions on Information Systems, 1994, 12:233- 251.
  • 10Yang Yiming, and Pedersen J O. A comparative study on feature selection in text categorization. In- Proceedings of the 14^th International Conference on Machine Learning (ICML-97), 1997. 412 - 420.

共引文献367

同被引文献151

引证文献16

二级引证文献95

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部