期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词矢量相似度的短文本分类 被引量:6
1
作者 马成龙 姜亚松 +2 位作者 李艳玲 张艳 颜永红 《山东大学学报(理学版)》 CAS CSCD 北大核心 2014年第12期18-22,35,共6页
互联网中出现的短文本内容短小,相互共享的词汇较少,因此在分类过程中容易出现大量的集外词,导致分类性能降低。鉴于此,提出了一种基于词矢量相似度的分类方法,首先利用无监督的方法对无标注数据进行训练得到词矢量,然后通过词矢... 互联网中出现的短文本内容短小,相互共享的词汇较少,因此在分类过程中容易出现大量的集外词,导致分类性能降低。鉴于此,提出了一种基于词矢量相似度的分类方法,首先利用无监督的方法对无标注数据进行训练得到词矢量,然后通过词矢量之间的相似度对测试集中出现的集外词进行扩展。通过与基线系统的对比表明,该方法的分类正确率均优于基线系统1%-2%,尤其是在训练数据较少的情况下,所提出的方法的正确率相对提高10%以上。 展开更多
关键词 短文本分类 词矢量相似度 集外
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部