期刊文献+

基于语义分析的垂直搜索网络蜘蛛 被引量:8

Search spider of vertical search engine based on semantic analysis
下载PDF
导出
摘要 通用搜索引擎数据量庞大,但查询结果不够准确。分类目录正好相反。为了综合两者优势,对垂直搜索引擎进行了研究和分析。着重研究了垂直搜索引擎的核心模块——智能网络搜索蜘蛛。提出了搜索分析的新概念——规则。研究了蜘蛛中定义支持同义词的语义词典的方法,给出了按照规则分析和检索的实现方法和流程。程序需要定义多种规则,让蜘蛛依照规则进行网页爬行和信息采集。最后给出一个项目实例,证明了上述方法的可行性。 General search engine has large volume of data, but its search results are not accurate enough. Directories classification is on the contrary. In order to integrate advantages of the two, vertical search engine is studied and analyzed. The core module--intelligent search spider is mainly focused on. A new concept about searching and analyzing is brought forward: Rules. The method is researched that defining semantic dictionary which supports synonyms. The algorithm and flow that realize searching and analyzing according rules are afforded. Kinds of rules must be defined in search spider program, depending on which the function web pages crawling and information data extracting work. At last a project example is presented to prove the feasibility of these methods.
作者 罗立宏 陈志
出处 《计算机工程与设计》 CSCD 北大核心 2008年第18期4662-4665,4812,共5页 Computer Engineering and Design
基金 国家自然科学基金项目(90412015)
关键词 计算机应用 互联网 搜索引擎 垂直搜索 网络蜘蛛 语义分析 computer applications interact search engine vertical search web spider semantic analysis
  • 相关文献

参考文献8

二级参考文献19

共引文献29

同被引文献57

引证文献8

二级引证文献16

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部