期刊文献+

基于Carrot2聚类的垂直搜索引擎的研究与实现 被引量:5

Research and implementation of vertical search engine based on Carrot2 clustering
下载PDF
导出
摘要 给出了一个基于Nutch的垂直搜索引擎系统的实现,主要探讨了基于Lucene和Carrot2的信息检索与聚类的实现,并对分词、垂直信息采集等的实现进行了说明。 This paper presents the implementation of vertical search engine based on Nutch, mainly the implementation of the Lucene and the Carrot2 for information retrieval and clustering. Moreover, the paper also introduces in some details the Chi- nese word segmentation and data collection.
出处 《河北工业科技》 CAS 2012年第3期155-157,共3页 Hebei Journal of Industrial Science and Technology
基金 河北省科技支撑计划项目(12213516D)
关键词 搜索引擎 LUCENE NUTCH 分词 聚类 search engine Lucene Nutch Chinese word segmentation clustering
  • 相关文献

参考文献8

  • 1宋光慧,聂琰,郭建康.基于Nutch的校园网信息检索系统的研究与实现[J].中国教育信息化(高教职教),2010(8):65-66. 被引量:5
  • 2GAO Kai. Presenting implicit relevance feedback in education- al search engine[J]. Computer Applications in Engineering Education, 2011, 19(2): 294-304:.
  • 3GAO Kai, LI Y J. Modelling on Chinese subject-term extrac- ting algorithm[J]. International Journal on Modelling, Identifi- cation and Control, 2011, 13(3) 8 202-208.
  • 4高凯.搜索引擎中信息动态采集策略的研究[J].电子学报,2007,35(10):1984-1988. 被引量:7
  • 5GAO Kai, ZONG B Q. Web information processing and ex- tracting[A]. Proceedings of the 9th International Conference on Machine Learning and Cybernetics[C]. [S. 1. ]:[s. n.], 2010. 2 350-2 355.
  • 6高凯,许云峰,郭立炜.网络信息检索与搜索引擎技术[M].北京;科学出版社,2010.
  • 7LUCENE. Nutch 官网 Nuteh 技术介绍[EB/OL]. http,//wi- ki. apache, org/nuteh/2012-04-06.
  • 8贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量:222

二级参考文献49

  • 1李粤,安捷,李星.排序融合算法在校园网搜索引擎中的应用[J].大连理工大学学报,2005,45(z1):257-260. 被引量:2
  • 2蔡建超,郭一平,王亮.基于Lucene.Net校园网搜索引擎的设计与实现[J].计算机技术与发展,2006,16(11):73-75. 被引量:14
  • 3Otis Gospodneti,Erik Hatcher.Lucene in Action中文版[M].北京:电子工业出版社,2007.
  • 4邱哲,符滔滔.发自己的搜索引擎[M].北京:人民邮电出版社,2007.
  • 5Guha S,Rastogi R,Shim K.CURE:An Efficient Clustering Algorithm for Large Databases[C].Seattle:Proceedings of the ACM SIGMOD Conference,1998.73-84.
  • 6Guha S,Rastogi R,Shim K.ROCK:A Robust Clustering Algorithm for Categorical Attributes[C].Sydney:Proceedings of the 15th ICDE,1999.512-521.
  • 7Karypis G,Han E-H,Kumar V.CHAMELEON:A Hierarchical Clustering Algorithm Using Dynamic Modeling[J].IEEE Computer,1999,32(8):68-75.
  • 8Ester M,Kriegel H-P,Sander J,et al.A Density-based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C].Portland:Proceedings of the 2nd ACM SIGKDD,1996.226-231.
  • 9Hinneburg A,Keim D.An Efficient Approach to Clustering Large Multimedia Databases with Noise[C].New York:Proceedings of the 4th ACM SIGKDD,1998.58-65.
  • 10Wang W,Yang J,Muntz R.STING:A Statistical Information Grid Approach to Spatial Data Mining[C].Athens:Proceedings of the 23rd Conference on VLDB,1997.186-195.

共引文献231

同被引文献83

引证文献5

二级引证文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部