期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
利用Nutch设计实现生物医学信息垂直搜索引擎
1
作者 王小磊 李立 赵东升 《北京生物医学工程》 2010年第6期638-640,644,共4页
在网络的海量信息搜索过程中,医学情报研究和信息服务机构,经常需要构建面向专题的垂直搜索系统以满足特定人群的需求。本文利用Nutch和Lucene等开源软件设计了一个面向生物医学信息的垂直搜索引擎系统,并对网页信息抓取、格式处理、内... 在网络的海量信息搜索过程中,医学情报研究和信息服务机构,经常需要构建面向专题的垂直搜索系统以满足特定人群的需求。本文利用Nutch和Lucene等开源软件设计了一个面向生物医学信息的垂直搜索引擎系统,并对网页信息抓取、格式处理、内容索引和检索等关键技术进行了说明。在此搜索引擎中,通过加入中文分词和增量抓取等模块,提高了中文关键字的识别率,缩短了信息的更新周期。目前该系统已经上线测试,能够获得较为精确和及时的搜索结果。 展开更多
关键词 NUTCH 网络信息抓取 LUCENE 中文分词 增量抓取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部