期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
结合LSA的中文谱聚类算法研究 被引量:3
1
作者 熊忠阳 暴自强 +1 位作者 李智星 张玉芳 《计算机应用研究》 CSCD 北大核心 2010年第3期917-918,共2页
传统的文本谱聚类需要的文本相似矩阵依赖于向量空间模型,忽略了词与词之间的语义关系,存在词频维数过高、计算代价高等问题。针对这些问题,提出了一种基于潜在语义分析(latent semantic analysis,LSA)的文本相似矩阵构造方法,利用奇异... 传统的文本谱聚类需要的文本相似矩阵依赖于向量空间模型,忽略了词与词之间的语义关系,存在词频维数过高、计算代价高等问题。针对这些问题,提出了一种基于潜在语义分析(latent semantic analysis,LSA)的文本相似矩阵构造方法,利用奇异值分解(singular value decomposition,SVD)降维,在低维的语义空间表示文本,以此来提高同类文本间的语义相似度,并进行了相关对比实验。在该实验中,改进方法的聚类效果要好于传统的方法,从而验证了改进方法的有效性和可行性。 展开更多
关键词 文本聚类 潜在语义分析 奇异值分解 谱聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部