摘要
由于短文本自身长度较短,具有特征稀疏和描述概念信号弱等特点,直接利用传统的长文本分类方法进行短文本分类很难取得较好效果。针对该问题,提出一种基于高频词扩展的短文本分类方法,该方法首先抽取每个类别的高频词来组成向量空间,然后从特征空间中抽取与文本中特征具有高共现性的特征加入到文本进行扩充,结果表明,该方法可有效丰富短文本的语义表征能力并提高短文本分类的效果。
出处
《宿州学院学报》
2018年第7期90-92,96,共4页
Journal of Suzhou University
基金
安徽省高校自然科学研究重点项目"高阶动态系统最优控制方法研究"(KJ2014A103)