摘要
由于对文档进行分类有时并不能有效地满足信息检索的需要,文本提出了一种在文本分类的基础上的关键词分类算法,用于优化基于多关键词组合的搜索系统。
出处
《福建电脑》
2005年第8期46-47,共2页
Journal of Fujian Computer
参考文献4
-
1谷波,张永奎.文本聚类算法的分析与比较[J].电脑开发与应用,2003,16(11):4-6. 被引量:11
-
2卜东波,白硕,李国杰.文本聚类中权重计算的对偶性策略[J].软件学报,2002,13(11):2083-2089. 被引量:20
-
3张焕炯,李玉鉴,钟义信.文本相似度计算的一种新方法[J].计算机科学,2002,29(7):92-93. 被引量:6
-
4陶跃华,赵波,杨秀国.搜索引擎的文档预处理技术研究[J].计算机科学,2002,29(7):111-112. 被引量:2
二级参考文献16
-
1Berry M W,Browne M. Understanding Search Engines Mathematical Modeling and Text Retrieval . Phlladephla : Society for industrical and Applied Mathematics(www . siam . org),1999
-
2William B Frakes Ricardo Baeza-Yates . Information Retrieval.USA:Prentice Hall PTR, 1992
-
3Salton G. Automatic text processing: the transformation analysis and retrieval of information by computer. Reading, Pennsylvania:Aoldison-wesley, 1989
-
4Sheridan P, Ballerini J P. Experiments in multilingual information retrieval using the SPIDER system. In: Proc the 8th Annual ACM SIGIR Intl. Conf. on Research and Development in Information Reterieval ,Zurich, 1996.58~ 65
-
5Salton, G. Automatic Text Processing. Addison-Wesley Publishing Company, 1988.
-
6Hartigan, J.A. Clustering Algorithms, Yale University, John Wiley&Sons, New York, London, 1975.
-
7Kleinberg, J. Authoritative sources in a hyperlinked environment, In: Proceedings of the ACM-SIAM Symposium on Discrete Algorithms. 1998. http://www.cs.cornell.edu/home/kleinber/.
-
8Dumais, S.T. LSI meets TREC: a status report. In: Harman, D., ed. Proceedings of the 1st Text Retrieval Conference (TREC1). National Institute of Standards and Technology, 1993. 137~152.
-
9Dumais, S.T. Latent semantic indexing (LSI) and TREC-2. In: Harman, D., ed. Proceedings of the 2nd Text Retrieval Conference (TREC2). National Institute of Standards and Technology, 1994. 105~116.
-
10潘谦红,王炬,史忠植.基于属性论的文本相似度计算[J].计算机学报,1999,22(6):651-655. 被引量:63
共引文献35
-
1原福永,杨治秋,王海霞.一种基于向量空间模型的文档聚类算法研究[J].信号处理,2005,21(z1):606-608.
-
2蒋宗礼,李宪雷,徐学可.基于主题Hub值的元搜索[J].北京工业大学学报,2009,35(3):397-402. 被引量:1
-
3刘海峰,王元元,张学仁.基于VSM的模糊标引文本检索若干问题研究[J].图书情报工作,2006,50(S2):127-130.
-
4王映,常毅,谭建龙,白硕.基于N元汉字串模型的文本表示和实时分类的研究与实现[J].计算机工程与应用,2005,41(5):88-91. 被引量:5
-
5马国俊,贠卫国.基于潜在语义索引的中文文本聚类的研究[J].现代电子技术,2005,28(10):58-59. 被引量:4
-
6郏宣耀,滕少华.一种基于聚类的彩色图像分色算法[J].计算技术与自动化,2006,25(1):110-113. 被引量:3
-
7刘海涛,老松杨,韩智广.自动文摘系统中的段落自适应聚类研究[J].微计算机信息,2006,22(06X):288-291. 被引量:6
-
8常浩,陈莉.基于摘要的web内容挖掘研究[J].微计算机信息,2006,22(08X):302-304. 被引量:1
-
9白曦,吕晓枫,孙吉贵.融合模拟退火的遗传算法在文档聚类中的应用[J].计算机工程与应用,2006,42(23):144-148. 被引量:2
-
10陈晓云,王平,何春霞,冷明伟.基于三角不等式原理的TTSAS聚类加速算法[J].计算机工程,2006,32(17):97-99. 被引量:1
同被引文献3
-
1杨鹏,叶少珍.基于关键词和语义融合的WEB检索[J].福建电脑,2005,21(8):105-107. 被引量:1
-
2李雄飞,李军.数据挖掘与知识发现[M]高等教育出版社,2003.
-
3赵小龙,刘士俊.信息资源检索与利用[M]中国工商出版社,2003.
-
1赵红宇.基于关键词组合向量模型的文本自动分类研究[J].商场现代化,2008(26):20-21.
-
2周丽杰,于伟海,郭成.基于词项语义组合的文本相似度计算方法研究[J].计算机工程与应用,2016,52(19):90-93. 被引量:4
-
3何鑫乐,骆虹希,林梦琳,戴丹.基于淘宝的搜索引擎优化策略研究——以品牌运动鞋类目为主的网店为例[J].电子商务,2014,15(12):49-49. 被引量:1
-
4檀佳.基于变电站自动化信息的远程数据挖掘系统研究[J].机电信息,2014(24):141-141.
-
5吕传宇,李华,耿虎.一种适合于专题式元搜索引擎的信息检索策略[J].重庆大学学报(自然科学版),2004,27(7):90-93. 被引量:1
-
6同鸣,王硕,丁力伟,王纲.HCRF和网络文本的精彩事件自动检测定位[J].西安电子科技大学学报,2015,42(4):81-87.
-
7赵慧,李春明.一种受限领域中自然语言提问的处理方法[J].计算机与信息技术,2005(12):74-76.
-
8李忠,张向娟.网上商店交易分析软件设计与应用[J].电子世界,2013(5):11-12.
-
9张孝飞,黄河燕,陈肇雄,代六玲.跨语言信息检索中查询语句翻译转换算法[J].计算机工程,2007,33(11):166-167. 被引量:1
-
10严敏芬,李健雪.《英语中的构式演变:语素变体、构词和句法的发展》评介[J].外语教学与研究,2016,48(1):155-158. 被引量:1