期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
基于Lucene.net网络爬虫的设计与实现 被引量:8
1
作者 刘磊安 符志强 《电脑知识与技术(过刊)》 2010年第3X期1870-1871,1878,共3页
网络爬虫采集互联网信息并提供搜索服务。该设计基于Lucene.NET平台开发网络爬虫,可以对特定的网页进行抓取和分析,提取网页中有用信息,并对抓取的数据进行索引,存储到服务器硬盘,同时过滤掉无用信息。系统界面友好,准确高效。
关键词 网络爬虫 lucene.NET 搜索引擎
下载PDF
基于Lucene的石墨烯中文文献搜索引擎设计与实现 被引量:1
2
作者 肖显东 王勤生 +1 位作者 杨永强 章国宝 《计算机科学与应用》 2019年第1期96-105,共10页
近年来,材料领域对于石墨烯的探索越来越深入,与此同时,大量的专业文献被发表在各类期刊、会议中。在大量文献中查找所需要的文献也变得越来越困难。传统数据库搜索效率低下且搜索结果并不尽如人意。因此,本文设计了一种基于Lucene工具... 近年来,材料领域对于石墨烯的探索越来越深入,与此同时,大量的专业文献被发表在各类期刊、会议中。在大量文献中查找所需要的文献也变得越来越困难。传统数据库搜索效率低下且搜索结果并不尽如人意。因此,本文设计了一种基于Lucene工具包,Python爬虫技术等开发的一套本地全文检索系统。首先利用爬虫技术获取互联网上相关文献资料,接着保存到MySQL数据库中,通过自定义开发Lucene创建索引和搜索服务,从而完成一整套搜索引擎系统服务。经大量测试表明,该系统搜索结果准确率接近数据库搜索,搜索速度也远快于传统的数据库查询。因此,该系统可以用于进行石墨烯中文文献的搜索查询,从而提高科研人员查阅文献的效率。 展开更多
关键词 lucene工具包爬虫 搜索引擎 MySQL石墨烯
下载PDF
基于Lucene的搜索引擎的研究与应用 被引量:12
3
作者 张俊 李鲁群 周熔 《计算机技术与发展》 2013年第6期230-232,共3页
互联网搜索的精确性一直是衡量搜索引擎性能的重要标志。针对普通搜索引擎的固有缺陷,文中提出了一种应用于新闻检索的搜索引擎。该引擎是利用开源的网络爬虫工具将互联网信息抓取到本地,并利用Lucene开放的API,对特定的信息进行索引和... 互联网搜索的精确性一直是衡量搜索引擎性能的重要标志。针对普通搜索引擎的固有缺陷,文中提出了一种应用于新闻检索的搜索引擎。该引擎是利用开源的网络爬虫工具将互联网信息抓取到本地,并利用Lucene开放的API,对特定的信息进行索引和搜索。Lucene是基于Java开发的源代码开放的全文检索工具包,具有高性能、可扩展等特性,是实现搜索引擎的核心组件。通过对Lucene的API进行分析,并在此基础上,构建了索引和搜索的模块,并对网上新闻内容进行实时地搜索。通过与普通搜索引擎对比,该新闻搜索引擎提高了搜索的精确性。 展开更多
关键词 lucene 网络爬虫 索引 搜索 新闻搜索引擎
下载PDF
基于Lucene的校园网智能搜索引擎的设计与实现 被引量:4
4
作者 董李鹏 高东怀 +2 位作者 张迎 靳豪杰 孟颖翔 《现代电子技术》 2013年第6期83-86,共4页
为了设计与开发校园网智能搜索引擎,研究和分析搜索引擎的工作原理、Lucene的运行机制以及智能搜索引擎功能需求。结合本校的校园网建设,分别从爬虫系统、索引系统、引擎管理平台、检索系统4个子系统出发实现了一套基于Lucene的校园网... 为了设计与开发校园网智能搜索引擎,研究和分析搜索引擎的工作原理、Lucene的运行机制以及智能搜索引擎功能需求。结合本校的校园网建设,分别从爬虫系统、索引系统、引擎管理平台、检索系统4个子系统出发实现了一套基于Lucene的校园网智能搜索引擎,搜索引擎在搜索功能、信息监管、系统安全、智能交互方面都有所提升。搜索引擎可为校内用户提供决策性的搜索帮助,且搜索结果的期望值较高。 展开更多
关键词 网络爬虫 lucene 校园网 智能搜索引擎 索引系统
下载PDF
基于Lucene的企业信息门户搜索引擎设计 被引量:6
5
作者 周祥 王丽芳 +1 位作者 蒋泽军 张羽 《微处理机》 2009年第4期62-64,68,共4页
分析了通用搜索引擎不适于企业信息门户检索的原因,简要介绍了Lucene全文检索工具包和门户技术。在Lucene工具包的基础上,提出了企业信息门户搜索引擎的设计方案,并进行实现。最后对该搜索引擎的实际应用进行了性能分析。
关键词 企业信息门户 lucene工具包 搜索引擎
下载PDF
基于Lucene全文检索引擎的应用研究 被引量:5
6
作者 栾静 李军锋 《计算机与数字工程》 2010年第12期184-186,195,共4页
Lucene是一个用Java编写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。文章首先介绍了全文检索系统与全文检索引擎Lucene,以及Lucene的系统结构和实现机制,最后结合实际应用背景给出了全文检索系统的主要实现... Lucene是一个用Java编写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。文章首先介绍了全文检索系统与全文检索引擎Lucene,以及Lucene的系统结构和实现机制,最后结合实际应用背景给出了全文检索系统的主要实现步骤。 展开更多
关键词 lucene 全文检索引擎 应用研究 Based Search Engine TEXT Application 全文检索系统 全文搜索引擎 多用户访问 系统结构 索引速度 实现机制 实现步骤 实际应用 Java编写 跨平台 工具包 文章
下载PDF
基于Lucene小型搜索引擎的研究与实现 被引量:1
7
作者 陶荣 陈燕 《大众科技》 2010年第2期19-21,共3页
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基... 随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。 展开更多
关键词 搜索引擎 网络爬虫 lucene HERITRIX
下载PDF
基于Lucene的校园网搜索引擎的设计与实现 被引量:1
8
作者 吴建 《湖南工程学院学报(自然科学版)》 2012年第2期48-52,共5页
利用基于校园网的搜索引擎来搜索学校局域网内的信息已成为人们关注的热点,一方面是因为校园网内信息量不断增加,利用搜索引擎可以提高搜索效率;另一方面是因为由于网络设计的限制,百度等搜索引擎搜索不到局域网内的很多信息.在研究搜... 利用基于校园网的搜索引擎来搜索学校局域网内的信息已成为人们关注的热点,一方面是因为校园网内信息量不断增加,利用搜索引擎可以提高搜索效率;另一方面是因为由于网络设计的限制,百度等搜索引擎搜索不到局域网内的很多信息.在研究搜索引擎基本原理和技术的基础上,设计了基于Lucene的校园网搜索引擎.测试表明,本系统能很好地完成用户的搜索要求. 展开更多
关键词 搜索引擎 网络爬虫 局域网 lucene
下载PDF
基于Heritrix与Lucene的垂直搜索引擎研究
9
作者 张雷 《黑龙江科技信息》 2011年第29期102-102,共1页
垂直搜索是针对某一个行业的专业搜索引擎;Lucene是Java编写的全文索引引擎工具包,可以跨平台使用;Heritrix是一个功能强大的开源Web网络爬虫。本文主要探讨Lucene和Heritrix在构建垂直搜索引擎中的应用。
关键词 垂直搜索引擎 HERITRIX lucene 网络爬虫
下载PDF
Lucene评分机制验证分析
10
作者 刘妍 《电脑编程技巧与维护》 2014年第13期16-17,63,共3页
Lucene 4.7的评分机制复杂但高效,解析了其评分公式,阐释了构成公式的每项因子的含义及计算方法,设计了一个案例,并得出最终评分,编写了一个测试程序以验证手工计算过程的正确性,对修改或扩展Lucene 4.7的评分机制有着积极的意义。
关键词 lucene工具包 评分 机制
下载PDF
基于Lucene的搜索引擎技术在综合查询系统中的应用
11
作者 王子光 王子明 《软件导刊》 2017年第1期126-128,共3页
搜索引擎技术应用广泛。Lucene作为一个优秀的搜索引擎开源工具包,可方便实现相关搜索引擎功能。介绍了Lucene搜索引擎工具包,在此基础上,利用Lucene开发工具包,设计并实现了综合查询系统中搜索引擎功能。阐述了网络爬虫子系统、索引子... 搜索引擎技术应用广泛。Lucene作为一个优秀的搜索引擎开源工具包,可方便实现相关搜索引擎功能。介绍了Lucene搜索引擎工具包,在此基础上,利用Lucene开发工具包,设计并实现了综合查询系统中搜索引擎功能。阐述了网络爬虫子系统、索引子系统和查询子系统3个模块功能。 展开更多
关键词 搜索引擎 网络爬虫 lucene技术 Suggestion提示
下载PDF
基于Lucene2.0和Heritrix搜索引擎的应用研究
12
作者 周少波 《电脑编程技巧与维护》 2014年第20期41-41,47,共2页
基于Lucene2.0和Heritrix的搜索引擎是以广东技术师范学院天河学院为对象构建的,着重开发一个简单的网络垂直搜索引擎,实现一个简单的搜索引擎所具备的基本功能,为今后搭建一个标准的、实用的、商业化的搜索引擎打下坚实的基础。
关键词 搜索引擎 网络爬虫 lucene软件 Heritrix程序 JAVA语言
下载PDF
基于Lucene的农业类搜索引擎关键技术研究
13
作者 石曼银 《信息系统工程》 2013年第9期39-41,46,共4页
随着互联网技术的飞速发展,农业类信息迅速充斥在互联网的各大网站,涉及到农林牧渔等各个领域的农业网站已近2万多个,然而对急需农业信息的部门、企业以及个人来说,农业信息的获取还是比较困难。信息的海量化与检索的困难化成为一对日... 随着互联网技术的飞速发展,农业类信息迅速充斥在互联网的各大网站,涉及到农林牧渔等各个领域的农业网站已近2万多个,然而对急需农业信息的部门、企业以及个人来说,农业信息的获取还是比较困难。信息的海量化与检索的困难化成为一对日益突出的矛盾,本文围绕这一对矛盾,对农业类搜索引擎包含的关键技术进行了研究。 展开更多
关键词 垂直搜索引擎 主题爬虫 中文分词 lucene 搜索结果个性化
下载PDF
基于Lucene的新闻垂直搜索引擎设计与实现 被引量:2
14
作者 许翰林 王瑞 +3 位作者 王佳丽 吴宸阳 李浩 陈阳 《电脑编程技巧与维护》 2018年第2期50-52,共3页
为了提高搜索引擎对新闻检索的准确度,在研究垂直搜索引擎的设计思想和相关技术的基础上,利用Lucene搜索框架设计了新闻垂直搜索引擎。对网络爬虫进行了抓取规则的订制,使其只会抓取新闻相关的网页。采用卡方统计量进行文本特征提取,利... 为了提高搜索引擎对新闻检索的准确度,在研究垂直搜索引擎的设计思想和相关技术的基础上,利用Lucene搜索框架设计了新闻垂直搜索引擎。对网络爬虫进行了抓取规则的订制,使其只会抓取新闻相关的网页。采用卡方统计量进行文本特征提取,利用TF*IDF算法进行特征权值计算,利用支持向量机分类算法对新闻数据进行分类。实验结果表明,该新闻垂直搜索引擎可以精准地按类别搜索出新闻信息。 展开更多
关键词 垂直搜索引擎 卡方统计量 网络爬虫 文本分类 lucene框架
下载PDF
基于lucene的校园网搜索引擎
15
作者 张娟 马力 梁俊杰 《合作经济与科技》 2012年第16期100-101,共2页
现代网络信息化水平日益提高,网页信息量急剧增加,搜索引擎已经成为人们获取所需知识的必要工具之一。本文结合校园网搜索引擎的具体需求,介绍校园网搜索引擎的整体框架。其中,l ucene作为开源的检索框架,具有很好的应用性。
关键词 搜索引擎 lucene 网络爬虫 站内搜索
下载PDF
基于Lucene的烟草个性化搜索引擎的研究与实现
16
作者 赵双双 林红 李仁旺 《工业控制计算机》 2015年第1期114-117,共4页
研究了Lucene搜索引擎框架在烟草行业的信息获取和搜索方面的系统应用。如何在异构的海量数据中获取与烟草行业相关的数据是实现烟草行业信息化管理技术的一个重要分支。通过对不同文件格式的数据处理、烟草行业相关站点的数据抓取、搜... 研究了Lucene搜索引擎框架在烟草行业的信息获取和搜索方面的系统应用。如何在异构的海量数据中获取与烟草行业相关的数据是实现烟草行业信息化管理技术的一个重要分支。通过对不同文件格式的数据处理、烟草行业相关站点的数据抓取、搜索引擎创建和数据检索四个模块框架来实现系统。Web页面基于Heritrix烟草信息数据抓取,其中的非结构化数据或者半结构化数据和不同的文件格式通过Tika工具统一转为为文本,通过Lucene对结构化和非结构化数据创建索引以实现数据检索,由此实现烟草信息搜索引擎系统的实现。 展开更多
关键词 全文检索 lucene 垂直搜索引擎 烟草 个性化搜索 用户兴趣 海量数据 网络爬虫
下载PDF
基于Lucene和Heritrix的全文搜索引擎的设计与实现 被引量:1
17
作者 张宣 刘晓飞 《现代计算机》 2013年第22期74-77,80,共5页
分析全文搜索引擎的基本结构及原理,并使用开源工具Heritrix作为搜索引擎的爬虫负责下载Web页面、HTMLParser抽取Web页面的内容、Lucene提供索引和搜索服务,采用B/S模式实现一个全文搜索引擎。
关键词 全文搜索引擎 lucene HERITRIX HTMLPARSER 网络爬虫
下载PDF
基于Lucene2.0和Heritrix搜索引擎的应用研究 被引量:1
18
作者 周少波 《电脑编程技巧与维护》 2013年第16期13-14,共2页
基于Lucene2.0和Heritrix的搜索引擎是以广东技术师范学院天河学院为对象构建的,着重开发一个简单的网络垂直搜索引擎,实现一个简单的搜索引擎所具备的基本功能,为今后搭建一个标准的、实用的、商业化的搜索引擎打下坚实的基础。
关键词 搜索引擎 网络爬虫 lucene搜索 Heritrix程序 JAVA语言
下载PDF
基于Scrapy框架的网络爬虫分析与抓取实现 被引量:10
19
作者 张小秋 《电脑编程技巧与维护》 2022年第2期18-19,44,共3页
基于Scrapy框架设计网络爬虫程序,爬取某市二手房数据,并将分析结果通过统计图呈现出来。通过分析网站数据结构及Scrapy框架网络爬虫设计思路,详细展示了基于Scrapy框架进行数据爬取、数据分析的实现方法,并对网络爬虫存在的安全问题、... 基于Scrapy框架设计网络爬虫程序,爬取某市二手房数据,并将分析结果通过统计图呈现出来。通过分析网站数据结构及Scrapy框架网络爬虫设计思路,详细展示了基于Scrapy框架进行数据爬取、数据分析的实现方法,并对网络爬虫存在的安全问题、法律问题进行了说明。 展开更多
关键词 Scrapy框架 网络爬虫 贝壳网 Matplotlib工具包
下载PDF
面向主题的垂直搜索引擎系统的研究与实现 被引量:10
20
作者 施佺 王恒山 +1 位作者 肖仰华 丁卫平 《微电子学与计算机》 CSCD 北大核心 2011年第7期1-4,8,共5页
针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,给出了面向主题的垂直搜索引擎的体系结构,设计了垂直搜索引擎系统的爬行策略,对系统核心信息采集模块运用了多线程技术及基于VSM的主题相关度判断算法进行主题网页爬行,并通过... 针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,给出了面向主题的垂直搜索引擎的体系结构,设计了垂直搜索引擎系统的爬行策略,对系统核心信息采集模块运用了多线程技术及基于VSM的主题相关度判断算法进行主题网页爬行,并通过Lucene.Net的索引与检索技术建立系统的检索算法,实现了一个面向特定主题的垂直搜索引擎应用系统.实验测试结果表明,该系统具有较高的提取效率,其检索的准确率、召回率均大大高于通用搜索引擎,具有较好的实用价值和商业应用前景. 展开更多
关键词 垂直搜索 网络爬虫 lucene .Net 正则表达式
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部