摘要
本文针对潜在语义空间模型下文本检索存在的问题进行了研究;对LSI/SVD方法的理论及问题进行探讨,对文本—特征项矩阵加权方式进行了改进,对文本的聚类提出了k-means截尾算法,对原始向量空间降秩后的语义空间维数的确定提出了解决方法。
In this paper, we discuss several text retrieval problems under LSI/SVD Model. We sum up the theory and method and then put forward an improved model in the weighting of paper- term matrix. We put up a new arithmetic in the paper clustering, and sum up a new method in fixxing on the semantic space dimension.
出处
《情报科学》
CSSCI
北大核心
2007年第5期748-753,共6页
Information Science