期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于Lucene的站内搜索设计与实现 被引量:12
1
作者 朱学昊 王儒敬 +1 位作者 余锋林 唐昱 《计算机应用与软件》 CSCD 北大核心 2008年第10期6-8,共3页
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者... 简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者的需要。 展开更多
关键词 全文检索 lucene 中文分词 信息抽取
下载PDF
基于Lucene的中文字典分词模块的设计与实现 被引量:27
2
作者 向晖 郭一平 王亮 《现代图书情报技术》 CSSCI 北大核心 2006年第8期46-50,共5页
在分析Lucene语言分析器结构的基础上,采用基于中文字典的正向最大匹配分词算法,设计实现能够在基于Lucene的搜索引擎中处理中文信息的中文分词模块。
关键词 搜索引擎 lucene 中文分词 正向最大匹配算法
下载PDF
基于XML的网络课件环境中搜索引擎的实现 被引量:4
3
作者 李毅 杨善林 +1 位作者 刘业政 顾铁军 《武汉理工大学学报(信息与管理工程版)》 CAS 2003年第3期105-108,共4页
在网络课件中加入信息搜索功能有利于方便学习者快速定位欲学习内容。首先介绍了基于Java的英文全文索引引擎Lucene,然后分析了现有的中文切分技术,最后给出了针对课件文件特点改进的中英文搜索引擎的实现方法。
关键词 网络课件环境 搜索引擎 lucene 中文切分 xml JAVA
下载PDF
一种基于Lucene的影片搜索引擎的研究和应用 被引量:3
4
作者 匡振国 倪宏 +1 位作者 嵇智辉 刘磊 《计算机工程与应用》 CSCD 北大核心 2008年第29期8-10,30,共4页
Lucene是一个优秀的开源搜索引擎框架,已经广泛应用于信息搜索领域。分析点播门户中现有的搜索引擎存在的不足,设计一种基于双字哈希算法支持中文的分词器,并利用该分词器和Lucene工具包,设计并实现了一个视频点播影片快速搜索引擎,它... Lucene是一个优秀的开源搜索引擎框架,已经广泛应用于信息搜索领域。分析点播门户中现有的搜索引擎存在的不足,设计一种基于双字哈希算法支持中文的分词器,并利用该分词器和Lucene工具包,设计并实现了一个视频点播影片快速搜索引擎,它不仅支持中文检索,还具有搜索速度快、易于扩展等优点。仿真实验证明提出的基于Lucene的影片搜索引擎具有良好的性能。 展开更多
关键词 lucene 搜索引擎 双字哈希 中文分词 倒排索引
下载PDF
基于Lucene的站内搜索引擎研究 被引量:7
5
作者 马志强 刘利民 +1 位作者 苏依拉 马瑞明 《内蒙古工业大学学报(自然科学版)》 2009年第1期52-57,共6页
网站提供的站内查询系统存在着系统不能自动采集网络信息,以及模糊查询结果准确率低等缺点.因此,应用搜索引擎的工作原理,设计了一种基于Lucene的站内搜索引擎系统,实现了站内信息的增量采集、自动分词和建立倒排索引功能.该系统的建立... 网站提供的站内查询系统存在着系统不能自动采集网络信息,以及模糊查询结果准确率低等缺点.因此,应用搜索引擎的工作原理,设计了一种基于Lucene的站内搜索引擎系统,实现了站内信息的增量采集、自动分词和建立倒排索引功能.该系统的建立,提高了用户站内搜索的准确率和查全率,使站内信息资源能得到充分利用. 展开更多
关键词 搜索引擎 lucene 中文分词
下载PDF
基于Lucene引擎的电子商务网站站内搜索系统
6
作者 丁剑 《电脑知识与技术》 2010年第10期7913-7914,共2页
通过对搜索引擎工具包Lucene的分析器、索引包、文档等结构分析,对数据库、Web页面、PDF文件等将要检索的数据源,进行统一接口设计,将这些数据统一转换为XML文件,实现门户网站快速高效及可灵活定制的站内全文搜索。
关键词 lucene 检索 搜索引擎xml 分词
下载PDF
基于Lucene搜索引擎的涉恐信息检索模块设计与实现 被引量:3
7
作者 彭世亮 周欣 +2 位作者 卿粼波 熊淑华 何小海 《信息技术与网络安全》 2019年第11期23-28,共6页
互联网中存在大量涉恐信息,加强对这些信息的组织与利用,在防恐、反恐中起着重要的作用。针对网络涉恐信息零散情况,通过网络爬虫技术收集互联网上的涉恐信息,构建涉恐信息数据库;在此基础上,引入中文分词器进行合理粒度分词,使用Lucen... 互联网中存在大量涉恐信息,加强对这些信息的组织与利用,在防恐、反恐中起着重要的作用。针对网络涉恐信息零散情况,通过网络爬虫技术收集互联网上的涉恐信息,构建涉恐信息数据库;在此基础上,引入中文分词器进行合理粒度分词,使用Lucene构建全文搜索引擎以提升检索效率。同时,在建立索引时根据文档包含涉恐信息特征词汇的数量改变权重,查询时包含多特征词汇的涉恐信息排序更靠前。系统采用Python进行信息采集和数据结构化,使用MySQL构建涉恐信息数据库,通过Lucene构建全文检索引擎,测试表明,该引擎能够快速、准确地完成信息检索。 展开更多
关键词 lucene 搜索引擎 分词 涉恐
下载PDF
一种基于Lucene的中文分词的设计与测试 被引量:6
8
作者 王志嘉 薛质 《信息技术》 2010年第12期50-54,共5页
设计实现了一个基于Lucene的中文分词模块,提出了一种更为有效的中文词处理方法,提高全文检索系统的中文处理能力。整个模块基于当前使用较为广泛的全文检索引擎工具包Lucene,结合正向最大匹配算法以及经过优化的中文分词词典,以实现更... 设计实现了一个基于Lucene的中文分词模块,提出了一种更为有效的中文词处理方法,提高全文检索系统的中文处理能力。整个模块基于当前使用较为广泛的全文检索引擎工具包Lucene,结合正向最大匹配算法以及经过优化的中文分词词典,以实现更高效率和准确度的中文分词功能。在系统评测方面,通过实验仿真比较了该模块与StandardAnalyzer和CJKAnalyzer在功能和效率上的差异。对于如何构建一个高效的中文检索系统,提出了一种实现方案。 展开更多
关键词 中文分词 搜索引擎 lucene 正向最大匹配算法
下载PDF
基于Lucene与Socket通信的中文搜索引擎的设计与实现 被引量:2
9
作者 曹书林 吕青松 +2 位作者 王一帆 尹乾 郑新 《电子测试》 2017年第4期74-75,共2页
Lucene是一个用Java写的全文检索引擎工具包,面向对象多层封装,提供了一个低耦合、与平台无关的、可进行二次开发的全文检索引擎架构,是这几年最受欢迎的信息检索程序库;基于流式Socket的网络编程是设计网络通信程序的一种有效方法。本... Lucene是一个用Java写的全文检索引擎工具包,面向对象多层封装,提供了一个低耦合、与平台无关的、可进行二次开发的全文检索引擎架构,是这几年最受欢迎的信息检索程序库;基于流式Socket的网络编程是设计网络通信程序的一种有效方法。本文基于Lucene,采用中文分词技术,设计并实现了中文搜索引擎,同时应用Java和PHP的Socket网络编程技术,实现了外网通过PHP网页使用Lucene服务的功能。 展开更多
关键词 中文搜索引擎 lucene SOCKET 中文分词 java PHP
下载PDF
基于Lucene的知识搜索引擎的设计与实现 被引量:1
10
作者 孙建 秦琪 袁方 《安徽电气工程职业技术学院学报》 2011年第1期105-108,共4页
电力企业有着大量的自有资源,而且越来越成为企业运营的重要支撑。本文通过对Lucene开放源码全文搜索工具包的研究,实现了覆盖全企业资源的知识搜索引擎,为企业建立知识管理支持平台提供了可行的技术解决方案,为企业更有效地利用知识资... 电力企业有着大量的自有资源,而且越来越成为企业运营的重要支撑。本文通过对Lucene开放源码全文搜索工具包的研究,实现了覆盖全企业资源的知识搜索引擎,为企业建立知识管理支持平台提供了可行的技术解决方案,为企业更有效地利用知识资源提供了有效途径。 展开更多
关键词 lucene 知识搜索 搜索引擎 索引 分词
下载PDF
基于Lucene的企业搜索引擎研究及应用 被引量:1
11
作者 李海丰 《电脑知识与技术》 2009年第2期926-929,共4页
分析了企业级搜索引擎应具有的功能和总体架构,研究了Lucene的系统结构及检索原理,提出了统一处理html、pdf、word等多种常用文档的思路。针对中文特点设计搜索引擎的构建技术,包括从源数据采集、文档解析与分词、索引器、信息检索... 分析了企业级搜索引擎应具有的功能和总体架构,研究了Lucene的系统结构及检索原理,提出了统一处理html、pdf、word等多种常用文档的思路。针对中文特点设计搜索引擎的构建技术,包括从源数据采集、文档解析与分词、索引器、信息检索、结果排序的全过程,基于Lucene软件包实现了一个原型系统,取得了较好的搜索效果。 展开更多
关键词 lucene 企业搜索引擎 中文分词 非结构化文档
下载PDF
基于Lucene的校园网垂直搜索引擎的设计与实现
12
作者 蓝永健 《广东教育学院学报》 2009年第3期98-103,共6页
垂直搜索引擎是针对某一个特定行业的专业搜索引擎,是搜索引擎的细分和延伸,可以反馈给用户更准确和更专业的查询结果.在高校的校园网信息检索应用领域,实现了基于Lucene技术的中文校园网垂直搜索引擎,其可以为用户提供专业的信息检索服务.
关键词 lucene 垂直搜索引擎 中文分词
下载PDF
基于垂直搜索引擎的Lucene蒙文分词技术研究
13
作者 卢凤 《内蒙古科技大学学报》 CAS 2018年第3期264-269,共6页
机器翻译中的分词部分对于语料预处理过程有着至关重要的作用.而在蒙文分词中传统方法对于特征提取、构型特点的计算分析能力有限,基于Lucene的蒙文分词技术结合垂直搜索引擎技术,面向专业领域构建个性化专业词典,采用逐字二分的分词词... 机器翻译中的分词部分对于语料预处理过程有着至关重要的作用.而在蒙文分词中传统方法对于特征提取、构型特点的计算分析能力有限,基于Lucene的蒙文分词技术结合垂直搜索引擎技术,面向专业领域构建个性化专业词典,采用逐字二分的分词词典机制,并在此基础上采用正向最大匹配分词算法来改进Lucene的蒙文分词模块.文章提出了根据领域知识、领域概念、领域术语,在分词预处理前降低搜索噪音、信息过载、信息冗余等现象,从而改进了词典机制.文章的另一个工作是在现有Lucene蒙文分词技术上结合垂直搜索引擎技术提高Lucene在蒙文应用程序开发上的应用广泛度.基于开放的蒙汉语料的实验结果表明,改进的Lucene分词技术能有效地改善对齐效果,相比原始的分词模型,译文质量有了显著的提高. 展开更多
关键词 机器翻译 分词 lucene 垂直搜索引擎
下载PDF
基于Carrot2聚类的垂直搜索引擎的研究与实现 被引量:5
14
作者 高凯 阳春辉 +2 位作者 陶秋红 张洋 杨军伟 《河北工业科技》 CAS 2012年第3期155-157,共3页
给出了一个基于Nutch的垂直搜索引擎系统的实现,主要探讨了基于Lucene和Carrot2的信息检索与聚类的实现,并对分词、垂直信息采集等的实现进行了说明。
关键词 搜索引擎 lucene NUTCH 分词 聚类
下载PDF
基于Lucene的Ftp搜索引擎的设计 被引量:3
15
作者 郭一平 向晖 王亮 《图书情报工作》 CSSCI 北大核心 2006年第4期122-125,共4页
针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文... 针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文档,而且采用基于字典的前向最大匹配中文分词法在Lucene中动态更新全文索引。该设计还能够对检索关键字进行中英文混合分析和检索。 展开更多
关键词 ftp搜索引擎 lucene xml 分词
原文传递
搜索引擎用户接口设计 被引量:2
16
作者 何友全 徐小乐 +2 位作者 徐澄 栾红玉 唐华姣 《重庆理工大学学报(自然科学)》 CAS 2010年第9期63-68,共6页
介绍了搜索引擎中用户界面的实现技术,包括抓取网页、索引和检索。在此基础上,应用Ajax技术实现用户接口的设计,利用Lucene技术,在建立好的索引库中检索出用户感兴趣的网页,并给出设计过程中部分关键代码。
关键词 搜索引擎 中文分词技术 lucene 用户界面 AJAX技术
下载PDF
主题搜索引擎的研究 被引量:2
17
作者 李瑞芳 杨娜 《微型机与应用》 2009年第19期1-3,6,共4页
介绍了将开源的全文检索工具包Lucene嵌入到自己的搜索引擎中来满足开发主题搜索引擎的需求。并基于Lucene中文分词的不足设计了一个比较完善的中文分词器,然后将其引入具体应用中,并且与传统搜索引擎在性能上进行了比较。
关键词 lucene 全文检索技术 主题搜索引擎 索引 中文分词
下载PDF
基于Lucene的中文分词方法设计与实现 被引量:13
18
作者 李颖 李志蜀 邓欢 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第5期1095-1099,共5页
本文设计实现了一个中文分词模块,其主要研究目的在于寻找更为有效的中文词汇处理方法,提高全文检索系统的中文处理能力.整个模块基于当前最流行的搜索引擎架构Lucene,实现了带有歧义消除功能的正向最大匹配算法.在系统评测方面,比较了... 本文设计实现了一个中文分词模块,其主要研究目的在于寻找更为有效的中文词汇处理方法,提高全文检索系统的中文处理能力.整个模块基于当前最流行的搜索引擎架构Lucene,实现了带有歧义消除功能的正向最大匹配算法.在系统评测方面,比较了该方法与现有方法的区别,对于如何构建一个高效的中文检索系统,提出了一种实现. 展开更多
关键词 中文分词 搜索引擎 lucene 正向最大匹配算法
原文传递
基于Lucene的中文分词模块的设计和实现 被引量:3
19
作者 罗宁 徐俊刚 郭洪韬 《电子技术(上海)》 2012年第9期54-56,共3页
基于当前最流行的全文检索引擎架构Lucene,文章设计并实现了一个中文分词模块。分词模块中的核心算法是基于字符串匹配与统计相结合的中文分词算法,其主要研究目的在于寻找更为有效的中文词汇处理方法,提高全文检索系统的中文处理能力... 基于当前最流行的全文检索引擎架构Lucene,文章设计并实现了一个中文分词模块。分词模块中的核心算法是基于字符串匹配与统计相结合的中文分词算法,其主要研究目的在于寻找更为有效的中文词汇处理方法,提高全文检索系统的中文处理能力。通过实验发现,该模块的分词准确率较高,分词速度有进一步的提升空间。下一步我们将通过多种改进措施,来完善该分词模块,最终构建出一个高效的中文全文检索系统。 展开更多
关键词 搜索引擎 中文分词 lucene 哈希索引
原文传递
统一智能搜索处理技术的研究与应用 被引量:2
20
作者 许宇华 黄倩云 《自动化与仪器仪表》 2017年第5期144-146,共3页
随着新的科学技术层出不穷,供电服务的远程渠道也趋向多元化。本文将探索统一智能搜索处理技术在供电企业远程服务渠道上的应用方式,为完成精益化管理供电企业远程服务渠道奠定坚实的技术根底。远程服务渠道统一智能搜索处理技术除能提... 随着新的科学技术层出不穷,供电服务的远程渠道也趋向多元化。本文将探索统一智能搜索处理技术在供电企业远程服务渠道上的应用方式,为完成精益化管理供电企业远程服务渠道奠定坚实的技术根底。远程服务渠道统一智能搜索处理技术除能提供快速检索、相关度排序之外,还结合自然语言的智能处理,快速地检索出对用户而言最有价值最感兴趣的信息。通过对四大技术要点,即信息辅助抽取、词语相似度计算、分词及关键词维护以及基于Lucene搜索引擎来说明统一智能搜索处理技术在远程服务渠道统一运营管理平台上的应用。 展开更多
关键词 统一智能搜索 信息辅助抽取 词语相似度计算 分词及关键词维护 基于lucene搜索引擎
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部