基于潜在语义空间的文本检索问题研究被引量：9

Research on Text-Retrieval Problems Based on Latent Semantic Space

下载PDF

导出

摘要本文针对潜在语义空间模型下文本检索存在的问题进行了研究;对LSI/SVD方法的理论及问题进行探讨,对文本—特征项矩阵加权方式进行了改进,对文本的聚类提出了k-means截尾算法,对原始向量空间降秩后的语义空间维数的确定提出了解决方法。 In this paper, we discuss several text retrieval problems under LSI/SVD Model. We sum up the theory and method and then put forward an improved model in the weighting of paper- term matrix. We put up a new arithmetic in the paper clustering, and sum up a new method in fixxing on the semantic space dimension.

作者刘海峰王元元张学仁

机构地区解放军理工大学理学院解放军理工大学指挥自动化学院

出处《情报科学》 CSSCI 北大核心 2007年第5期748-753,共6页 Information Science

关键词潜在语义索引/奇异值分解聚类位置加权 k—means截尾算法 LSI/SVD clustering position weighting k - means truncation arithmetic

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1丁璇,侯汉清,章成志.中文网页标引源主题表达能力的调查统计[J].大学图书馆学报,2002,20(6):70-72. 被引量：29
2万小军,杨建武,陈晓鸥.文档聚类中k-means算法的一种改进算法[J].计算机工程,2003,29(2):102-103. 被引量：29
3陶蕾.一种智能型的信息检索方法:隐含语义索引法[J].情报理论与实践,2004,27(3):308-309. 被引量：6
4盖杰,王怡,武港山.基于潜在语义分析的信息检索[J].计算机工程,2004,30(2):58-60. 被引量：29
5周水庚,关佶红,胡运发.隐含语义索引及其在中文文本处理中的应用研究[J].小型微型计算机系统,2001,22(2):239-243. 被引量：41

二级参考文献15

1薛鹏军.基于知识库的中文网络检索工具－－经济信息智搜索引擎研究.南京农业大学硕士论文[M].,2001..
2Deerwester S, et al. Indexing by Latent Semantic Analysis. Journal of the American Society for Information Science, 1990 (41) : 391-407.
3Berry M W, et al. Using Linear Algebra for Intelligent Information Retrieval. Society for Industrial and Applied Mathematics, 1995 (37):573 - 595.
4Jones W P, Fumas G W. Pictures of Relevance: A Geometric Analysis of Similarity Measures. Journal of the American Society for Information Science, 1987 (38) : 420 - 442.
5Young P，学位论文，1994年
6Jain AK,Dubes RC.Algorithms for Clustering Data[]..1988
7Kaufman L,Rousseeuw PJ.Finding groups in data:an introduction to cluster analysis[]..1990
8Rijsbergen G J V.Information Retrieval (Second Edition)[]..1989
9Kowalski G.Information Retrieval Systems - Theory and Implementation[]..1997
10Fasulo D.An Analysis of Recent Work on Clustering Algorithms[]..1999

共引文献125

1赵大伟,肖周芳.一种改进的基于密度和样本数量的K-means算法[J].科技信息,2008(28):170-172. 被引量：1
2刘海峰,姚泽清,汪泽焱,张学仁.基于位置的文本特征加权方法研究[J].微电子学与计算机,2009,26(2):188-192. 被引量：9
3熊化宇.谈搜索引擎中Web页面标引关键词的确定[J].图书情报工作,2004,48(9):80-82. 被引量：2
4雷景生,伍庆清,王平.一种基于混合神经网络的Web文档聚类算法[J].计算机工程,2005,31(1):12-13. 被引量：1
5雷景生,林冬雪,符浅浅.基于改进向量空间模型的Web信息检索技术研究[J].计算机工程,2005,31(1):14-16. 被引量：21
6钱晓东,王正欧.基于改进KNN的文本分类方法[J].情报科学,2005,23(4):550-554. 被引量：19
7钱晓东,王正欧.文本处理中基于随机映射的加速LSI方法[J].天津大学学报（自然科学与工程技术版）,2005,38(4):372-376. 被引量：1
8陈涛,宋妍,谢阳群.基于IIG和LSI组合特征提取方法的文本聚类研究[J].情报学报,2005,24(2):203-209. 被引量：14
9马国俊,贠卫国.基于潜在语义索引的中文文本聚类的研究[J].现代电子技术,2005,28(10):58-59. 被引量：4
10彭寿清.人才埋没的文化根源——浅析儒家文化对人才成长的负效应[J].衡阳师范学院学报,2005,26(2):97-100. 被引量：1

同被引文献76

1李莹,张晓辉,王华勇,常桂然.一种应用向量聚合技术的KNN中文文本分类方法[J].小型微型计算机系统,2004,25(6):993-996. 被引量：13
2杨思洛.搜索引擎的排序技术研究[J].现代图书情报技术,2005(1):43-47. 被引量：23
3田俊华.基于自然语言提问的自动答疑系统设计[J].现代远程教育研究,2005,17(1):48-51. 被引量：10
4包剑,冀常鹏,李义杰.基于矢量空间模型的文本自动分类系统研究[J].计算机系统应用,2005,14(3):47-49. 被引量：6
5王文胜,陈伏兵,杨静宇.一种基于奇异值分解的特征抽取方法[J].电子与信息学报,2005,27(2):294-297. 被引量：10
6唐发明,王仲东,陈绵云.一种新的二叉树多类支持向量机算法[J].计算机工程与应用,2005,41(7):24-26. 被引量：50
7孙斌.一种义项矩阵模型SMM[J].中文信息学报,2005,19(2):28-35. 被引量：3
8陈伏兵,张生亮,高秀梅,杨静宇.小样本情况下Fisher线性鉴别分析的理论及其验证[J].中国图象图形学报,2005,10(8):984-991. 被引量：17
9张志佳,黄莎白,史泽林,王东署.基于线性投影的代数空间降维分析[J].计算机工程,2005,31(21):25-27. 被引量：6
10宋枫溪,高秀梅,刘树海,杨静宇.统计模式识别中的维数削减与低损降维[J].计算机学报,2005,28(11):1915-1922. 被引量：44

引证文献9

1刘海峰,王元元,姚泽清,王倩.一种基于特征聚类的文本分类模型研究[J].情报学报,2008,27(2):224-228. 被引量：2
2刘海峰,王元元,张学仁,刘守生.文本分类中一种基于正交变换的特征降维方法[J].计算机科学,2008,35(5):125-126. 被引量：3
3刘建强.“机设基础”精品课程智能答疑系统研究与设计[J].西安航空技术高等专科学校学报,2008,26(3):77-80. 被引量：1
4赵亚慧.大容量文本检索算法[J].延边大学学报（自然科学版）,2009,35(1):60-63.
5龙军,王易,刘高嵩.基于二叉树多类支持向量机的文本分类研究[J].计算机系统应用,2009,18(5):65-68. 被引量：4
6史长琼,黄辉,王大卫,姜腊林,扶宗文.融合LSI和支持向量聚类的网页文本分类算法[J].计算机应用研究,2009,26(12):4523-4525. 被引量：1
7甄志龙,曾晓勤,韩立新.文本分类中基于图模型的特征提取方法[J].情报科学,2011,29(8):1248-1251.
8郭伟玲,戴艳清.论古籍数字化的检索问题[J].图书馆理论与实践,2011(10):13-16. 被引量：9
9肖瑜,赵俊忠.一个新的个性化搜索引擎排序算法[J].太原科技大学学报,2013,34(3):175-180. 被引量：1

二级引证文献21

1刘海峰,刘守生,汪泽焱.一种基于类别信息的改进文本特征选择[J].计算机应用与软件,2010,27(6):8-10. 被引量：1
2刘海峰,姚泽清,刘守生.一种基于核的正交化最大散度差文本特征抽取[J].情报学报,2010,29(5):847-852.
3曾立梅.基于文本数据挖掘的硕士论文分类技术[J].重庆邮电大学学报（自然科学版）,2010,22(5):669-672. 被引量：10
4刘海峰,刘守生,张学仁.聚类模式下一种优化的K-means文本特征选择[J].计算机科学,2011,38(1):195-197. 被引量：12
5孟海东,刘小荣.基于聚类分析的图模型文档分类[J].计算机应用与软件,2012,29(1):171-174. 被引量：1
6朱开忠.安徽省馆藏古籍数字化工作探析[J].合肥工业大学学报（社会科学版）,2012,26(3):145-148. 被引量：4
7袁玉虎.基于线性规划的无监督文本分类[J].软件导刊,2012,11(7):23-25.
8贾思宇,马玲,常玮.基于语义网分析的在线学习智能答疑方法研究[J].情报杂志,2012,31(9):104-108. 被引量：2
9黄永毅.基于流形学习降维技术的研究概述[J].中国科技信息,2013(14):51-51.
10顾磊,赵阳.古籍全文文本化中存在的若干问题[J].图书馆学研究,2013(20):31-36. 被引量：5

1王芬芬,陈华华.动态场景下的基于SIFT和CBWH的目标跟踪[J].杭州电子科技大学学报（自然科学版）,2015,35(4):46-49.
2金春霞,周海岩.位置加权文本聚类算法[J].计算机工程与科学,2011,33(6):154-158. 被引量：6
3郑波,楼旭阳,崔宝同.基于位置加权粒子群算法的WSNs能量优化[J].江南大学学报（自然科学版）,2014,13(5):568-571. 被引量：3
4刘海峰,王元元,张学仁,姚泽清.文本分类中基于位置和类别信息的一种特征降维方法[J].计算机应用研究,2008,25(8):2292-2294. 被引量：9
5黄应清,梁新彬,谢志宏,文军.基于特征显著值归一化与位置加权的FT算法[J].兵器装备工程学报,2016,37(6):124-128. 被引量：4
6郭天石.一类变结构控制系统滑动模态的特征值条件[J].南京航空航天大学学报,1997,29(4):385-390. 被引量：1
7金宏,张洪钺.鲁棒故障诊断中特征结构配置的有关问题[J].北京航空航天大学学报,1997,23(6):778-782.
8龙军,彭毅.基于LSI/SVD的文本分类方法研究[J].微计算机信息,2009,25(30):10-12. 被引量：1
9张脂平,林世平.Web文本挖掘中特征提取算法的分析及改进[J].福州大学学报（自然科学版）,2004,32(z1):63-66. 被引量：1
10王飞,林家骏.一种改进的基于奇异值分解的水印算法[J].中国科技信息,2007(1):116-117.

情报科学

2007年第5期

浏览历史

内容加载中请稍等...

基于潜在语义空间的文本检索问题研究被引量：9

参考文献5

二级参考文献15

共引文献125

同被引文献76

引证文献9

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于潜在语义空间的文本检索问题研究 被引量：9

参考文献5

二级参考文献15

共引文献125

同被引文献76

引证文献9

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于潜在语义空间的文本检索问题研究被引量：9