期刊文献+

基于高频词扩展的短文本分类方法研究

Research on Short Text Classification Based on Extension with High Frequency Word
下载PDF
导出
摘要 由于短文本自身长度较短,具有特征稀疏和描述概念信号弱等特点,直接利用传统的长文本分类方法进行短文本分类很难取得较好效果。针对该问题,提出一种基于高频词扩展的短文本分类方法,该方法首先抽取每个类别的高频词来组成向量空间,然后从特征空间中抽取与文本中特征具有高共现性的特征加入到文本进行扩充,结果表明,该方法可有效丰富短文本的语义表征能力并提高短文本分类的效果。
出处 《宿州学院学报》 2018年第7期90-92,96,共4页 Journal of Suzhou University
基金 安徽省高校自然科学研究重点项目"高阶动态系统最优控制方法研究"(KJ2014A103)
  • 相关文献

参考文献3

二级参考文献27

  • 1王细薇,樊兴华,赵军.一种基于特征扩展的中文短文本分类方法[J].计算机应用,2009,29(3):843-845. 被引量:36
  • 2徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量:56
  • 3王永恒,贾焰,杨树强.大规模文本数据库中的短文分类方法[J].计算机工程与应用,2006,42(22):5-7. 被引量:4
  • 4Y Yang and 10.Pedersen.A comparative study on feature selection in text categorization.In Proceedings of ICML-97,14th International Conference on Machine Learning,pages 412-20,Nashville,US,1997
  • 5Dunja Mladenic,Marko Grobelink.Feature selection on hierarchy of web documents.Decision Support Systems,2003,35:45287.51
  • 6D.D.Lewis.Naive (Bayes) at forty:The Independence Assumption in Informationc Retrieval.In Proceedings of the 10th European Conference on Machine Learning,New York,1998,4~15
  • 7S.Eyheramendy,D.D.Lewis and and D.Madigan.On the Naive bayes model fortext categorization.Artificial Intelligence&Statistics 2003
  • 8Y Yang.An evaluation of statistical approaches to text categorization.Information Retrieval,1999,1(1):76~88
  • 9W.Cohen and Y Singer.Context-sensitive learning methods for text categorization.In Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,1996:307~315
  • 10Y Yang and C.G.Chute.A linear least squares fit mapping method for information retrieval from natural language texts.In Proceedings of the 14th Conference on Computational Linguistics (COLING92),1992

共引文献27

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部