期刊文献+
共找到162篇文章
< 1 2 9 >
每页显示 20 50 100
A Full Text Retrieval System in a Digital Library Environment 被引量:1
1
作者 Kehinde Daniel Aruleba Dipo Theophilus Akomolafe Babajide Afeni 《Intelligent Information Management》 2016年第1期1-8,共8页
The volume of information being created, generated and stored is huge. Without adequate knowledge of Information Retrieval (IR) methods, the retrieval process for information would be cumbersome and frustrating. Studi... The volume of information being created, generated and stored is huge. Without adequate knowledge of Information Retrieval (IR) methods, the retrieval process for information would be cumbersome and frustrating. Studies have further revealed that IR methods are essential in information centres (for example, Digital Library environment) for storage and retrieval of information. Therefore, with more than one billion people accessing the Internet, and millions of queries being issued on a daily basis, modern Web search engines are facing a problem of daunting scale. The main problem associated with the existing search engines is how to avoid irrelevant information retrieval and to retrieve the relevant ones. In this study, the existing system of library retrieval was studied. Problems associated with them were analyzed in order to address this problem. The concept of existing information retrieval models was studied, and the knowledge gained was used to design a digital library information retrieval system. It was successfully implemented using a real life data. The need for a continuous evaluation of the IR methods for effective and efficient full text retrieval system was recommended. 展开更多
关键词 full text Information Retrieval LIBRARY Digital Library QUERIES indexING CATALOGUE
下载PDF
一种新型高效全文检索引擎的设计
2
作者 董宗然 闻柏智 朱毅 《软件工程》 2024年第2期44-48,共5页
为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中... 为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中主键形成的映射查询数据,然后通过相关度算法对这些数据进行排序,并以字典树作为搜索提示,实现高效的全文检索。实验结果表明:与ElasticSearch使用相同词集时,随着测试数据量的变化,所设计的全文检索引擎的查询效率是ElasticSearch效率的80~1200倍,其效率优势随着数据量增加呈现反比例关系变化,并且在17919条文档数据下,其内存占用不超过2.5 GB,适合用于海量文档数据检索。 展开更多
关键词 倒排索引 全文检索 检索引擎 模糊查询 字典树
下载PDF
全文检索技术在图书检索中的应用
3
作者 高霞 《中原工学院学报》 CAS 2024年第2期85-89,共5页
现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的... 现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的所有词组和关键词进行索引,支持快速检索到文本中任何一个单词和关键词。若将全文检索技术应用于图书检索中,可使用户根据任意关键词检索图书,可根据检索量和用户习惯推荐热门图书。文章介绍了如何在图书检索过程中应用全文检索技术,分析了全文检索引擎选择、图书文本解析、图书文本分词、图书索引设计、图书文档提交等主要过程,并给出了全文检索技术的最终实现效果,以期对提升图书检索系统的易用性提供一定借鉴。 展开更多
关键词 图书检索系统 全文检索 分词器 索引结构 推荐算法 检索命中率
下载PDF
轻量级缓存策略的关系型数据库全文搜索加强与扩展 被引量:3
4
作者 杨婷 莫若玉 +1 位作者 张秀娟 朱洲森 《计算机应用》 CSCD 北大核心 2023年第8期2431-2438,共8页
针对关系型数据库(RDB)现有的全文搜索方案存在的效率低下、资源占用高的问题,提出一种具有增强式辅助缓存的轻量级关系型数据库全文搜索模型。首先,该模型构建基于Redis的倒排索引,并利用缓存索引缩小搜索范围,从而用内存高效的数据处... 针对关系型数据库(RDB)现有的全文搜索方案存在的效率低下、资源占用高的问题,提出一种具有增强式辅助缓存的轻量级关系型数据库全文搜索模型。首先,该模型构建基于Redis的倒排索引,并利用缓存索引缩小搜索范围,从而用内存高效的数据处理能力解决关系型数据库I/O瓶颈,并提升系统整体性能;其次,为保证搜索结果的准确性和时效性,进一步提出索引同步策略,而且设计并实现了增量索引组件来隐藏索引处理细节,从而提高模型的易用性和通用性;最后,对于热点数据提供一种基于访问热度的索引更新机制,以降低倒排索引的内存占用。实验结果表明,所提模型在保证关系型数据库全文搜索响应速度和准确度的前提下,空间资源消耗比MySQL全文索引降低了48.8%~60.9%,比Elasticsearch降低了85.2%~96.2%,证明所提模型在实际应用中可行且有效。 展开更多
关键词 MYSQL REDIS 全文搜索 倒排索引 一致性
下载PDF
一种全新的全文索引模型——后继数组模型 被引量:11
5
作者 刘学文 陶晓鹏 +1 位作者 于玉 胡运发 《软件学报》 EI CSCD 北大核心 2002年第1期150-158,共9页
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词 全文索引模型 后继数组模型 文本数据库 数据模型
下载PDF
一种全文检索系统的设计与实现 被引量:13
6
作者 涂新辉 何婷婷 罗景 《计算机工程》 EI CAS CSCD 北大核心 2005年第17期55-57,共3页
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统... 在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统核心接口层。最后给出了该系统的一种分布式部署方案。 展开更多
关键词 全文检索 全文索引 倒排文件 分布式
下载PDF
基于邻接矩阵的全文索引模型(英文) 被引量:10
7
作者 周水庚 胡运发 关佶红 《软件学报》 EI CSCD 北大核心 2002年第10期1933-1942,共10页
文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不... 文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不同的方式实现文本串邻接矩阵,导出了两种基于邻接矩阵的新型全文索引模型,即基于邻接矩阵的倒排文件和基于邻接矩阵的PAT数组.给出了基于新模型的文本查询算法;分析了新模型的存储空间和查询时间的开销,并分别与两种传统索引模型进行了比较.对实际文本库进行了测试以证实新模型的效能.新模型能够以相对于原文较小的空间代价获得较大幅度的查询效率的提高,因此适合于在大规模文本检索系统中应用. 展开更多
关键词 邻接矩阵 全文索引模型 倒排文 PAT数组 信息检索系统
下载PDF
全文数据库建库原理与应用技术 被引量:28
8
作者 王兰成 蒋丹 刘庆辉 《情报学报》 CSSCI 北大核心 1999年第4期321-328,共8页
全文数据库是处理文献信息中知识与数据的有力工具,近年来得到迅猛发展。本文首先详细分析了全文数据库的特点,提出了建立全文数据库的各种数据结构,系统介绍全文数据库的开发步骤。然后论述全文数据库的标引和检索技术,提出一些新... 全文数据库是处理文献信息中知识与数据的有力工具,近年来得到迅猛发展。本文首先详细分析了全文数据库的特点,提出了建立全文数据库的各种数据结构,系统介绍全文数据库的开发步骤。然后论述全文数据库的标引和检索技术,提出一些新的处理技术。最后就全文数据库实际应用中的一些问题,提供了解决方案。 展开更多
关键词 全文数据库 软件开发 文献标引 全文检索
下载PDF
基于Lucene.Net的分布式全文检索系统 被引量:11
9
作者 谭文堂 贺明科 李阜 《计算机应用与软件》 CSCD 2009年第9期142-145,共4页
随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率。针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NET Remoting实... 随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率。针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NET Remoting实现分布式的全文索引与全文检索,具有较好的扩展性和很快的索引与检索速度,并成功地将该技术应用于军队某部信息管理系统,取得了很好的效果。 展开更多
关键词 Lucene.Net.NET REMOTING 分布式 全文检索 全文索引
下载PDF
全文索引技术在办公自动化系统中的应用研究 被引量:7
10
作者 陈慧萍 于国政 王建东 《计算机应用研究》 CSCD 北大核心 2007年第2期222-224,共3页
基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文... 基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文搜索的实现中,全文检索用户界面层采用ASP.NET开发,应用业务层采用C#语言。 展开更多
关键词 全文索引 全文检索 办公自动化 B/S结构
下载PDF
整合数据持久化与全文检索的新方法 被引量:4
11
作者 王彬 张计龙 徐迎晓 《计算机工程》 CAS CSCD 北大核心 2009年第3期42-44,共3页
在基于J2EE架构的信息管理系统开发中,针对难以实现数据持久化与全文索引的同步与结构匹配问题,提出基于Hibernate Search的实施模型。该模型包含了对组件的扩展和优化,同时将其应用于知识库案例中,实现了高效灵活的知识库全文检索。实... 在基于J2EE架构的信息管理系统开发中,针对难以实现数据持久化与全文索引的同步与结构匹配问题,提出基于Hibernate Search的实施模型。该模型包含了对组件的扩展和优化,同时将其应用于知识库案例中,实现了高效灵活的知识库全文检索。实验结果表明,该模型能有效整合数据库与全文检索中的数据信息,提高全文检索效率。 展开更多
关键词 数据持久化 全文检索 知识库 HIBERNATE Search组件
下载PDF
云环境下基于可搜索加密技术的密文全文检索研究 被引量:4
12
作者 张克君 张国亮 +1 位作者 姜琛 杨云松 《计算机应用与软件》 2017年第4期35-41,共7页
为了解决云存储技术带来的数据安全和高效检索问题,在深入研究可搜索加密技术基础上,提出一种基于云存储的密文全文检索模型,给出基于可搜索加密技术的密文全文索引构建和检索策略,并对方案的安全性进行分析。实验表明,云存储环境下基... 为了解决云存储技术带来的数据安全和高效检索问题,在深入研究可搜索加密技术基础上,提出一种基于云存储的密文全文检索模型,给出基于可搜索加密技术的密文全文索引构建和检索策略,并对方案的安全性进行分析。实验表明,云存储环境下基于可搜索加密技术的密文全文检索方案既保证了数据的安全性,又具有很好的检索效率,可适用于海量数据的加密存储与高效安全检索。 展开更多
关键词 云存储 可搜索加密 全文检索 密文全文索引
下载PDF
全文检索字索引技术的研究与实现 被引量:26
13
作者 曹元大 贺海军 +1 位作者 涂哲明 王琴 《计算机工程》 CAS CSCD 北大核心 2002年第6期260-262,共3页
针对中文全文检索字表法检索索引的创建,提出了快速的建立方法,并根据中文文本的特点,提出了有效的索引压缩方法。实验表明,使用虚拟内存技术可以大大节省索引的建立时间;采用字节对齐的索引压缩技术,不但可以有效地减少索引占用的磁盘... 针对中文全文检索字表法检索索引的创建,提出了快速的建立方法,并根据中文文本的特点,提出了有效的索引压缩方法。实验表明,使用虚拟内存技术可以大大节省索引的建立时间;采用字节对齐的索引压缩技术,不但可以有效地减少索引占用的磁盘空间,而且可以加快检索时间,索引的空间和时间效率都得以提高。 展开更多
关键词 全文检索 字索引 虚拟内存 互联网
下载PDF
PostgreSQL中文全文索引技术研究与实现 被引量:3
14
作者 战疆 冯月利 王珊 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第z1期213-216,共4页
开放源码关系数据库PostgreSQL目前还不支持对中文的全文索引.文章研究和分析了PostgreSQL的全文索引技术(TSearch2),通过对其核心函数的重写和配置文件的修改,将中文分词技术引入到了Post-greSQL的全文索引技术中,并加入了去除中文无... 开放源码关系数据库PostgreSQL目前还不支持对中文的全文索引.文章研究和分析了PostgreSQL的全文索引技术(TSearch2),通过对其核心函数的重写和配置文件的修改,将中文分词技术引入到了Post-greSQL的全文索引技术中,并加入了去除中文无用词的功能,从而首先实现了PostgreSQL的中文全文索引. 展开更多
关键词 中文全文索引 中文分词 POSTGRESQL TSearch2
下载PDF
基于Lucene的全文检索系统的研究与实现 被引量:10
15
作者 周锦程 王丹 +1 位作者 余泉 张维 《计算机技术与发展》 2011年第3期67-71,共5页
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,... Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,介绍了全文检索系统的概念并分析了Lucene的系统结构和实现机制,最后结合实际应用背景从系统设计、文挡抽取、索引的建立及执行检索等方面介绍了全文检索系统的实现过程。实践证明,该系统的查准率、查询速度等均达到了设计要求。 展开更多
关键词 全文检索 索引 信息检索
下载PDF
基于Lucene的全文检索引擎研究与应用 被引量:19
16
作者 林碧英 赵锐 陈良臣 《计算机技术与发展》 2007年第5期184-186,190,共4页
快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。文中研究了Lucene系统结构和数据流,分析了Lucene的索引文件格式,实... 快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。文中研究了Lucene系统结构和数据流,分析了Lucene的索引文件格式,实现了一个基于Lucene文档检索的应用实例。 展开更多
关键词 全文检索 索引 应用研究/Lucene
下载PDF
国内脂肪酶研究状况分析 被引量:11
17
作者 高贵 韩四平 +5 位作者 王智 马吉胜 翁良 冯雁 曹淑桂 冯艳 《生物技术通讯》 CAS 2003年第6期543-545,共3页
基于中国期刊全文数据库(CJFD)1995~2001年中脂肪酶检索数据,从基础研究和应用研究两个方面对其进行了统计分析,客观地概述和评价了国内该领域的研究状况。着重分析了国内脂肪酶研究的现状、发展趋势。结果表明,中国脂肪酶研究多集中... 基于中国期刊全文数据库(CJFD)1995~2001年中脂肪酶检索数据,从基础研究和应用研究两个方面对其进行了统计分析,客观地概述和评价了国内该领域的研究状况。着重分析了国内脂肪酶研究的现状、发展趋势。结果表明,中国脂肪酶研究多集中在基础研究领域,基础研究各方面发展不平衡,国内9个城市是脂肪酶研究的核心区域,高等学校是脂肪酶研究的主要机构。 展开更多
关键词 脂肪酶 中国期刊全文数据库 检索 研究分析
下载PDF
压缩的全文自索引算法研究 被引量:2
18
作者 路炜 刘燕兵 +2 位作者 王春露 刘庆云 郭莉 《计算机应用与软件》 CSCD 北大核心 2014年第3期11-15,35,共6页
针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空... 针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空间。综述现有的十几种典型的压缩的全文自索引算法的基本思想及其实现,并在多种数据集上对这些算法进行综合的测试评估。实验结果表明,压缩的全文自索引技术有效地节省了空间开销,实用价值较高。 展开更多
关键词 全文索引 数据压缩 自索引 后缀数组 BWT变换
下载PDF
Pat数组创建算法的研究 被引量:2
19
作者 陶晓鹏 胡运发 张锦 《计算机研究与发展》 EI CSCD 北大核心 2000年第7期783-788,共6页
Pat数组是目前比较新的全文索引结构 ,有广阔、良好的应用前景 .详细研究了 Pat数组的创建算法 ,提出了新算法——双边二分比较法 .首先从理论上分析了算法的高效性 ,然后用实验结果证实了分析 ,初步的研究表明 ,Pat数组用于中文文本的... Pat数组是目前比较新的全文索引结构 ,有广阔、良好的应用前景 .详细研究了 Pat数组的创建算法 ,提出了新算法——双边二分比较法 .首先从理论上分析了算法的高效性 ,然后用实验结果证实了分析 ,初步的研究表明 ,Pat数组用于中文文本的全文索引是可行的 . 展开更多
关键词 全文索引 Pat数组 全文检索 双边二分比较算法
下载PDF
Mimir:一种基于密文的全文检索服务系统 被引量:7
20
作者 宋伟 彭智勇 +3 位作者 王骞 李瑞轩 程芳权 崔一辉 《计算机学报》 EI CSCD 北大核心 2014年第5期1170-1183,共14页
针对海量涉密隐私数据高效安全检索的需求,提出了一种基于密文的全文检索系统——Mimir.Mimir基于B+树构建了一种安全密文全文索引结构,Mimir检索过程完全在密文环境下进行,保证了系统的安全性和存储信息的私密性.与传统的全文检索系统... 针对海量涉密隐私数据高效安全检索的需求,提出了一种基于密文的全文检索系统——Mimir.Mimir基于B+树构建了一种安全密文全文索引结构,Mimir检索过程完全在密文环境下进行,保证了系统的安全性和存储信息的私密性.与传统的全文检索系统相比,Mimir密文索引中没有存储索引词的位置信息和词频信息,可以有效地抵御已知明文攻击、选择明文攻击和词频统计攻击.对Mimir密文全文检索系统进行了性能测试,实验结果数据表明,Mimir密文全文检索系统在确保高安全性的同时,也具有很好的检索时间和存储空间性能. 展开更多
关键词 密文全文检索 密文索引 Mimir 中文分词 B+树 信息安全 网络安全
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部