期刊文献+

垂直搜索引擎中的分词算法研究

Research on segmentation algorithm in the vertical search engine
原文传递
导出
摘要 垂直搜索引擎是用户利用网络资源不可或缺的工具,而其中的索引引擎和查询引擎都使用到了分词算法。前者依据分词算法分析文本建立倒排索引表,后者依据分词算法将查询语句切分成关键词。为了提高垂直搜索引擎的检索效率,有必要研究一下垂直搜索引擎中的分词技术。在本文中,首先介绍了现有的中文分词算法并分析了其缺点,在此基础上构建了一种改进的分词算法。最后,本文通过实验证明了该改进算法的有效性。 The vertical search engine is an indispensable tool for users to use the network resource, both the indexing engine and the query engine in it have used the word segmentation algorithm.The indexing engine uses the segmentation algorithm to analyze the texts and then estabhsh the index table, and the query engine uses the word segmentation algorithm to cut the query sentances into keywords.In order to improve the retrieval efficiency of the vertical search engine, it is necessary to study the word segmentation technology in the vertical search engine.In this paper, I analyze the existing Chinese algorithms firstly and its disadvantages are analyzed, then I build an improved segmentation algorithm.Finally, this paper proves that the algorithm is effective by the experiment.
出处 《网络安全技术与应用》 2014年第4期15-16,18,共3页 Network Security Technology & Application
关键词 垂直搜索引擎 分词算法 检索效率 vertical search engine word segmentation algorithm retrieval efficiency
  • 相关文献

参考文献3

  • 1缪丹,李天瑞.面向商品比价应用的垂直搜索引擎系统设计与实现.西南交通大学研究生学位论文.2012,5.
  • 2赵立磊,潘东华.基于网页去重的垂直搜索引擎设计与实现.大连理工大学研究生学位论文.2012,6.
  • 3Paolo Boldi, Bruno Codenotti, Massimo Santini and Sebastiano Vigna.Ubicrawler: A scalable fully distributed web crawler.Software: Practice &Experience.2004, 8.

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部