期刊文献+

基于潜在语义空间的文本检索问题研究 被引量:9

Research on Text-Retrieval Problems Based on Latent Semantic Space
下载PDF
导出
摘要 本文针对潜在语义空间模型下文本检索存在的问题进行了研究;对LSI/SVD方法的理论及问题进行探讨,对文本—特征项矩阵加权方式进行了改进,对文本的聚类提出了k-means截尾算法,对原始向量空间降秩后的语义空间维数的确定提出了解决方法。 In this paper, we discuss several text retrieval problems under LSI/SVD Model. We sum up the theory and method and then put forward an improved model in the weighting of paper- term matrix. We put up a new arithmetic in the paper clustering, and sum up a new method in fixxing on the semantic space dimension.
出处 《情报科学》 CSSCI 北大核心 2007年第5期748-753,共6页 Information Science
关键词 潜在语义索引/奇异值分解 聚类 位置加权 k—means截尾算法 LSI/SVD clustering position weighting k - means truncation arithmetic
  • 相关文献

参考文献5

二级参考文献15

  • 1薛鹏军.基于知识库的中文网络检索工具--经济信息智搜索引擎研究.南京农业大学硕士论文[M].,2001..
  • 2Deerwester S, et al. Indexing by Latent Semantic Analysis. Journal of the American Society for Information Science, 1990 (41) : 391-407.
  • 3Berry M W, et al. Using Linear Algebra for Intelligent Information Retrieval. Society for Industrial and Applied Mathematics, 1995 (37):573 - 595.
  • 4Jones W P, Fumas G W. Pictures of Relevance: A Geometric Analysis of Similarity Measures. Journal of the American Society for Information Science, 1987 (38) : 420 - 442.
  • 5Young P,学位论文,1994年
  • 6Jain AK,Dubes RC.Algorithms for Clustering Data[]..1988
  • 7Kaufman L,Rousseeuw PJ.Finding groups in data:an introduction to cluster analysis[]..1990
  • 8Rijsbergen G J V.Information Retrieval (Second Edition)[]..1989
  • 9Kowalski G.Information Retrieval Systems - Theory and Implementation[]..1997
  • 10Fasulo D.An Analysis of Recent Work on Clustering Algorithms[]..1999

共引文献125

同被引文献76

引证文献9

二级引证文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部