期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进RI方法的文本聚类 被引量:1
1
作者 熊玮 白越 +2 位作者 刘爱国 吴洁洁 肖建 《南昌大学学报(理科版)》 CAS 北大核心 2016年第5期426-430,共5页
旨在通过考虑特征词汇的潜在语义和自身的重要性来提高文本聚类效果,研究基于RI方法的文本向量表示方法。首先,对基于RI方法构建的特征词汇随机索引向量中+1和-1向量元素出现位置进行约束,以避免在构建特征词汇上下文向量时可能造成该... 旨在通过考虑特征词汇的潜在语义和自身的重要性来提高文本聚类效果,研究基于RI方法的文本向量表示方法。首先,对基于RI方法构建的特征词汇随机索引向量中+1和-1向量元素出现位置进行约束,以避免在构建特征词汇上下文向量时可能造成该特征词汇潜在语义丢失现象;其次,在生成文本向量时考虑特征词汇自身重要性来改进权值的计算;最后,在测试数据上对基于RI方法的文本向量表示进行聚类效果测试与对比分析,结果表明采用基于RI方法能提高文本聚类效果。 展开更多
关键词 文本聚类 RI方法 特征词汇随机索引向量 特征词汇上下文向量 文本向量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部